curso de verão 2012 - instituto de matemática e ... · curso de verão 2012 biologia sistêmica...

56
Universidade Estadual do Norte Fluminense Curso de verão 2012 Biologia sistêmica evolutiva Thiago Motta Venancio, M.Sc., PhD

Upload: leque

Post on 14-Dec-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Universidade Estadual do Norte Fluminense

Curso de verão 2012

Biologia sistêmica evolutiva

Thiago Motta Venancio, M.Sc., PhD

Histórico

* Graduação – Ciências Biológicas (Mar 1998 – Dez 2001)

→ Universidade Estadual do Norte Fluminense - Dr. J. Xavier-Filho

* Mestrado – Biociências e Biotecnologia (Mar 2002 – Jan 2004)

→ Universidade Estadual do Norte Fluminense - Dr. J. Xavier-Filho

* Doutorado – Bioinformática (Mar 2004 – Fev 2008)

→ Universidade de São Paulo – Dr. S. Verjovski-Almeida e JC Setúbal

* Pós-Doutorado – Biologia computacional (Mar 2008 – Out 2010)

→ NCBI – NIH – Dr. L Aravind

* Professor Associado – Universidade Estadual do Norte Fluminense (UENF)

(Out 2010 - )

Tópicos abordados:

-Introdução

- Genômica

- Redes biológicas sob uma perspectiva evolutiva

-Integração de dados:

- Redes de modifcação de proteínas por peptídeos tipo ubiquitina (Ub/Ubl)

- Redes de resposta a estresse químico

- Genômica comparativa e biologia sistêmica

- Expectativas

'Nothing in biology makes sense except in the light of evolution'- Dobzhansky

Modern synthesis

Genetics

Biochemistry

Dev. Biology

Morphology

Ecology

Botany

Taxonomy

"The structure was too pretty not to be true." -- JAMES D. WATSON

DNA structureThe beginnings of molecular biology and the study of genes and genomes

History of genomics1980First complete genome sequenced – F. Sanger

• FX174 - 5,386 bp, 9 proteins.

1995→ First cellular genome

→ Haemophilus influenzea (bacteria, 1.8 Mb)

1996→ Saccharomyces cerevisiae (baker's yeast, 12.1 Mb)

1997→ E. coli (4.7 Mbp)

2000-2001Pseudomonas aeruginosa (6.3 Mbp) A. thaliana (100 Mbp) D. melanogaster (180Mbp)Homo sapiens (3Gbp)

Primórdios da biologia sistêmica...

Jabob e Monod

Plant Physiology

Human genome

Computational powerdoubles every 18 months

Redes em biologia - Introdução

Interações

A

B

Rede

Proteínas

Interação física

Proteína-Proteína

A

B

Interações ptn-ptn

Metabólitos

Conversãoenzimática

Proteína-metabólito

A

B

Metabólica

Fatores de transcriçãoGenes alvo

Interaçãotranscricional

Proteína-DNA

A

B

Transcricional

Nós

Arestas

Aravind L, Anantharaman V, Venancio TM.Birth Defects Res C, 2009

Direcionada, não direcionada, cliques e hubs

Redes de modificação de proteínas por peptídeos tipo ubiquitina

# E1s < # E2s < # E3s

Hochstrasser, Nature (2009)

Activation enzymeActivation enzyme

Conjugation enzyme

Conjugation enzyme

Ligases(RING and HECT)

Ligases(RING and HECT)

Basic ubiquitin conjugation pathway

Effects of Ub/Ubl modification

Ciechanover; Nat Rev Mol Cell Biol 2005

Destabilizing roles Non-destabilizing roles

Network construction

DatabasesBioGridIntactMint

Other studies5 ubiquitylation5 sumoylation

2 Rpn10 (Proteasome)1 Rsp5 (E3)

Ub pathway componentsExtensive literature and sequence

search

Spatio-temporal dynamicsFOP

Protein localization, abundance and half-lifeTranscriptional network

Chromatin proteinsCell cycle

Topological structureAttack/failure simulations

Detection of functional modulesIdentification of high-confidence interactions

Overall structure of the U-net

Protein-protein interactions Genetic interactions

Biochemical nature of the Ub network interactions

Venancio, Balaji, Iyer, Aravind; Genome Biology 2009

Nodes: 3,954Edges: 14,487

E3 > E2 > E1

Degree distribution

UbiquitinSUMOUbc7Rad6Rsp5

Venancio, Balaji, Iyer, Aravind; Genome Biology 2009

Rank plot – comparação da importância de genes em duas redes diferentes

Venancio et al; Genome Biology 2009

1

1113 12

1410

24

7

3

6

9 8

5

14

95 8

12

117

13

10

12

3 4

6

A B

5 6

129

A

B

Venancio, Balaji, Iyer, Aravind; Genome Biology 2009

Core proteasome subunits

Proteasome receptors

Inte

raçõ

es e

ntre

mem

bros

da

via

Ub

Interações totais dos membros da via Ub

F-box proteins

Venancio, Balaji, Iyer, Aravind; Genome Biology 2009

Plant Physiology, 4th

Taiz and ZeigerAdapted

Substrate

RING finger

Modular structure - Finding maximal cliques

http://scienceblogs.com/goodmath/upload/2007/07/maximal-cliques.jpg

Problemas:

Grande quantidade

Redundância

Incompletos

Tirar vantagem da reduncância dos cliques

Genes funcionalmente relacionados participam juntos de vários cliques

Usamos então a point-wise mutual information para avaliar a co-ocorrência de genes em cliques.

Probability of finding two genes together in a clique

Product of the probability of finding the genes independently

A significância das associações foi calculada usando redes randomizadaspreservando o grau de cada gene (número de links)

Proteasome

Peroxisome

SCP

ER / ERAD

Splicing

APC

Sumoylation

Golgi/vesicles

Venancio, Balaji, Iyer, Aravind; Genome Biology 2009

15 F-box

Novel UBL

Ub, SUMO and cellular compartments

Venancio, Balaji, Iyer, Aravind; Genome Biology 2009

Enrichment of Ub targets in non-nuclear compartments and of SUMO targets in nuclear-related components

(p < 10-9)

ESCRT

ERAD

Sorting

DNA repair and chromatin structure

Bud formation

Bud formation

Nucleolus structure

Ub and SUMO in the nucleus

Chromatin proteins are enriched in sumoylation targets, as opposed to TFs (p < 10-16). This is true even using only nuclear proteins as background.

Modification of TFs represents a potentially major impact in the proteome, considering that such TFsregulate 2,899 proteins (almost half of the proteome).

TF ORF U-net nU-net p-valRPN4 YDL020C 37 97 2.20E-16REB1 YBR049C 21 174 0.000196AFT1 YGL071W 25 302 0.007463SIP4 YJL089W 5 23 0.008167YAP3 YHL009C 4 17 0.01413

TFs regulating the Ub pathwayUb pathway genes receiving more

connections from TFs

F-boxSUMOReg. Rsp5POZUBLE3F-box

Venancio, Balaji, Iyer, Aravind; Genome Biology 2009

Ub, SUMO and cell cycle

Genes do ciclo celular tendem a ser modificados por Ub.

Genes regulados pelas ciclinas Cln3 e Clb2 são preferencialmente regulados por Ub

SUMO aparenta ser especialmente importante para a regulação de genes expressos na fase G1 do ciclo celular.

Biochemical data from:Spellman et al; Mol Biol Cell 1998

Chemical genetics (quimiogenética)

Adaptado de Wuster and Madan Babu, 2008. Trends in Biotechnology

34 artigos

-Nomenclatura

-Formato

-Redundância

-“Essencialidade”

5233 genes (90% do genoma)

425 compostos químicos

Multidrug resistance

Diferenças entre parálogos: Ypt31/32

Transportadores, tráfego vesicular e receptores de membrana

SCPnet

Genes envolvidos em processos similares

Conectividade (graus) nas duas redes

Acetilases, oxidases e outras atividades enzimáticas

Qual a natureza das interações na SCPnet ?

MDRs e SCP-hubs possuem naturezas distintas

Robustez X evolvabilidade – MDRs e SCP-hubsAssortatividade X dissortatividade

Interações relevantes usando apenas dados de quimiogenéticaPeroxissomo

HOG

Transportadores

Interações relevantes usando apenas dados de quimiogenéticaVia HOG

Motifs mais frequentes:

Ssk2-Pbs2

Ssk2-Hog1

Pbs2-Hog1

Bck1-Slt2

Estabilidade da parede celular e resistência a estresse

Integração de dados, evolução e o domínio CYSTM presente em alguns SCP-hubs !

Novo domínio presente em todas as linhagens eucarióticas.Proteínas ancoradas na membrana

Construção de uma rede de complexosprotéicos e compostos químicos

1: Conectar genes a compostos com base em 34 estudos de genética-química(quimiogenética, chemical genetics) e formar uma rede chamada chemical-phenotype network (CPnet)

2: Comparar a lista de genes (proteínas) contectados a um composto Ci na CPnet a listaparceiros de uma dada proteína Pj na rede de interação proteína-proteína (PPInet)

3: Se a sobreposição é estatísticamente significante (p<10^-3), conectar P a C.

4: Caso o grupo de proteínas conectado a cada composto C represente algum complexoprotéico conhecido, conecta o complexo ao composto C. Constrói a rede composto-complexos protéicos.

Estratégia geral

Interações quimiogenéticas

Interações proteína-proteína

CPCnet

Rede bimodal:83 compostos químicos51 complexos protéicos182 arestas

Cobre 12.5% dos complexosprotéicos conhecidos em levedura

Interações físicas

Compostos similares ligam-se aosmesmos complexos

Em alguns casos, uma outra via podeconverter o composto em outro.

Hayes and Wolf, 1997

Substâncias não relacionadasligando o mesmo complexo

Neomycin e verrucarin estão ligadas a 16 e 15 proteínas, respectivamente, sendo 12

delas comuns aos dois compostos

Williamson, 2000. Nature

Compostos com mecanismos de ação distintosse ligam ao complexo

Interações indiretas

As duas categorias de complexos protéicos maisrepresentadas estãao envolvidas com

transporte vesicular e cromatina

Transporte vesicular

Toxicity via the vesicular system

Membrane-pore forming

Dano ao DNA

Transporte vesicular

Cromatina

Inibidor daHMG-Coa

dehydrogenase

Despolimerização de actina

A grande maioria das conexões entre compostos químicos e complexos

protéicos são provavelmente indiretas

Cromatina TFIID e SAGA – regulação da transcrição por POL II

López-Maury et al., 2008, Nature Reviews Genetics

Genes reguladospor SAGA

10 compostos

Genes reguladospor TFIID

1 composto

Resposta ao estresse no citoesqueleto

Alguns compostos que promovem a despolimerização do citoesqueleto estãoconectados a chaperonas (ex: prefoldin).

Remontagem do citoesqueleto

Understanding the secrets of life through genomics

PERSPECTIVAS

Principais dados para geração de redes biológicas

- Interações genéticas

- Interações ptn-ptn

- Regulação por fatores de transcrição

- Conversões enzimáticas

- Co-expressão gênica (menos informativa)

Baixo custo de sequenciamento e implicações na biologia sistêmica.

Variabilidade entre indivíduos e epistasia.

Pergunta de 1 bilhão de dólares: como, olhando para o genoma, podemos

identificar genes que integram processos biológicos comuns e como tais

interações se relacionam a doenças humanas?

Referências e agradecimentos

Venancio TM, Balaji S, Geetha S, Aravind L. Robustness and evolvability in natural chemical resistance: identification of novel systems properties, biochemical mechanisms and regulatory interactions. Mol Biosyst. 2010.

Venancio TM, Balaji S, Aravind L. High-confidence mapping of chemical compounds and protein complexes reveals novel aspects of chemical stress response in yeast. Mol Biosyst. 2010.

Venancio TM, Aravind L. CYSTM, a novel cysteine-rich transmembrane module with a role in stress tolerance across eukaryotes. Bioinformatics. 2010

Venancio TM, Balaji S, Iyer LM, Aravind L. Reconstructing the ubiquitin network: cross-talk with other systems and identification of novel functions. Genome Biol. 2009

Aravind L, Anantharaman V, Venancio TM. Apprehending multicellularity: regulatory networks, genomics, and evolution. Birth Defects Res C Embryo Today. 2009

Venancio, Aravind. Reconstructing prokaryotic transcriptional regulatory networks: lessons from actinobacteria. J Biol. 2009

Intramural ResearchProgram

Lakshminarayan IyerL. AravindVivek AnantharamanDapeng ZhangAbhiman SaraswatiRobson de SouzaS. Balaji (Harvard) Dra. Elenir Amancio Oliveira

Daniel Bellieny-Rabelo (M.Sc. student)Isabela Alves Manhães (undergrad)

Vagas disponí[email protected]