nada em biologia faz sentido senão à luz da evolução. · cactaceae transferência ... história...

Post on 17-Dec-2018

215 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

7/9/2013

1

Marcos T. Geraldo

ADAPTABILIDADE

Nada em Biologia faz sentido senão à luz da evolução.

Theodosius Dobzhansky (1973)

7/9/2013

2

Reconstrução das relações evolutivas

entre genes e espécies

Investigação das forças e mecanismos do

processo evolutivo

Processo de evolução

em moléculas de DNA,

RNA e proteínas

7/9/2013

3

Homologia

Similaridade por origem comum

CONCEITO QUALITATIVO (NÃO QUANTITATIVO)

70% de homologia X 70% de similaridade

7/9/2013

4

Mas....

Estruturas podem aparecer de forma independente

(convergência evolutiva)

Pode haver transferência genética horizontal

- de função (várias evidências)

- de sequência (ainda polêmico)

7/9/2013

5

Homologia x Analogia

Resultado de evolução convergente

Aves

Mamíferos

Endotermia

7/9/2013

6

Euphorbia ingens

Euphorbiaceae - caule suculento

- folhas modificadas em espinhos

Pachycereus pringlei

Cactaceae

Transferência genética horizontal

• originária de processos antigos de recombinação

ex: cloroplastos, mitocôndrias

• originária de processos mais recentes ex: infecção por retrovírus

7/9/2013

7

História evolutiva de um grupo de genes ou organismos

Principal objetivo

Descrever as relações evolutivas em termos de uma relação de ancestralidade comum

7/9/2013

8

http://www.pitt.edu/~mtraksel/index.html

http://tolweb.org/tree/

7/9/2013

9

http://itol.embl.de/

7/9/2013

10

O que gera a grande diversidade de

genes e espécies?

Um dos principais agentes é o evento de duplicação gênica

(backup)

Pressão seletiva diminui

Permite que uma (ou ambas) as cópias

sofram alterações sem redução do fitness

Duplicação Gênica

A grande diversidade morfológica e de espécies em eucariotos

Duplicação de genes, cromossomos ou genomas

Susumo Ohno (1970): livro Evolution by gene duplication

Principal fonte para surgimento de novos genes

7/9/2013

11

Crossing-over desigual

A partir de 3 processos principais:

Retrotransposição

Não-disjunção durante a meiose

Duplicação Gênica

Perda da cópia duplicada

Neofuncionalização

Destino das cópias duplicadas

7/9/2013

12

Subfuncionalização

Duplicação-Degeneração-Complementação (DDC)

Destino das cópias duplicadas

7/9/2013

13

7/9/2013

14

Importância evolutiva da duplicação em larga-escala:

significativo do material genético

chance de que novos genes surjam e adquiram novas funções

cordados vertebrados

gnatostomados teleósteos

surgimento

Duplicação Gênica

EVOLUÇÃO DE FAMÍLIAS DE GENES E

PROTEÍNAS

especiação cópias ortólogas

duplicação gênica

acúmulo independente

de alterações

cópias parálogas

acúmulo independente

de alterações

7/9/2013

15

Cópias

ortólogas

Cópias

parálogas

7/9/2013

16

Dados de sequências

Alinhamento das sequências

Método de análise filogenética

Cálculo da melhor árvore

Teste de confiabilidade

Bancos de dados

7/9/2013

17

DNA

Proteína

Apresenta algumas dificuldades:

Mais fácil e simples de visualizar

• Saturação da terceira base

• Fornece evidência de seleção ou neutralismo

Mais informativo em termos evolutivos:

• Localização de introns e exons

Mais informativo em termos de função:

• Cada aminoácido apresenta propriedades como

carga, tamanho...

Basic Local Alignment Search Tool

O que é? = é um algoritmo para acessar um

banco de dados e buscar sequências de

aminoácidos ou nucleotídeos que sejam

similares a uma sequência-alvo específica

Qual o objetivo do BLAST? = comparar

informações de sequências biológicas

primárias

www.ncbi.nlm.nih.gov/BLAST/

7/9/2013

18

Tipos de BLAST Query

(sequência-alvo)

Hits

(sequências

retornadas)

blastn Nucleotídeos Nucleotídeos

blastp Aminoácidos Aminoácidos

blastx Nucleotídeos

(6 matrizes de leitura) Aminoácidos

tblastn Aminoácidos Nucleotídeos

(6 matrizes de leitura)

tblastx Nucleotídeos

(6 matrizes de leitura) Nucleotídeos

(6 matrizes de leitura)

chance da similaridade

ser ao acaso

Valor de E

A similaridade entre as sequências se deve a processos biológicos -

evolutivos

7/9/2013

19

O que é? = um alinhamento de

sequências é uma forma de organizar

sequências primárias de DNA, RNA ou

proteínas

Por que alinhar? = identificar regiões

similares que possam ser consequência de

relações evolutivas/funcionais entre elas

Valor

Qualitativo Valor

Quantitativo

Homólogo Não-homólogo

Inferência

7/9/2013

20

2 sequências de um alinhamento

Compartilham ancestral comum

Discordâncias entre as sequências (mismatches)

Mutações pontuais

Espaços (gaps)

Inserções ou deleções (indels)

SE,

Métodos de alinhamento

• Clustal • Muscle • Probcons • MAFFT • T-Coffee • Etc…

7/9/2013

21

Formatos de arquivos...

...de sequências ...de árvores filogenéticas

FASTA (*.fasta)

PHYLIP (*.phy)

NEXUS (*.nex ou *.nxs)

CLUSTAL (*.aln)

NEXUS (*.nex ou *.nxs)

NEWICK (*.nwk)

7/9/2013

22

AAGCTTCATA

GAGCTTCACA

GTGCTTCACG

GTGCCTCACG

Out

A

B

C

Sítios invariáveis

Não informativos

Outgroup

Espécie A

Espécie B

Espécie C

AG

Out

A

B

C

TC

AAGCTTCATA

GAGCTTCACA

GTGCTTCACG GTGCCTCACG

Outgroup

Espécie A

Espécie B

Espécie C

7/9/2013

23

Out

A

B

C AT AG

AG TC

AAGCTTCATA

GAGCTTCACA

GTGCTTCACG

GTGCCTCACG

Outgroup

Espécie A

Espécie B

Espécie C

Out

A

B

C TC

AG TC

AT AG

AAGCTTCATA

GAGCTTCACA

GTGCTTCACG GTGCCTCACG

Outgroup

Espécie A

Espécie B

Espécie C

7/9/2013

24

Isto é ruim?

NÃO!

Genes/proteínas conservadas são utilizadas

para resolver relações filogenéticas antigas

Genes/proteínas com média ou alta variação

são utilizadas para resolver relações

filogenéticas recentes

Métodos de inferência filogenética

7/9/2013

25

Máxima Verossimilhança

• Uso de um modelo de evolução específico

• Cálculo da árvore que se encaixa no conjunto de dados

• Análise mais explícita das suposições feitas sobre a evolução das sequências

• Mais exigente computacionalmente

Métodos de inferência filogenética

Inferência Bayesiana

• Outro método de verossimilhança

• Uso de pressupostos (priors)

• Algoritmo MCMC (Markov Chain Monte Carlo) cálculos da distribuição de verossimilhança e da probabilidade posterior

• Alto tempo computacional

geração de um conjunto extenso de árvores

Métodos de inferência filogenética

7/9/2013

26

Exemplos:

7/9/2013

27

Máxima Verossimilhança e

Inferência Bayesiana

Necessitam de um modelo de

evolução/substituição

ModelTest ProtTest

modelos para nucleotídeos

modelos para aminoácidos

https://code.google.com/p/jmodeltest2/

7/9/2013

28

https://code.google.com/p/prottest3/

Testes de confiabilidade

Bootstrap

aLRT (aproximate likelihood ratio test)

Probabilidade posterior

tempo precisão

tempo precisão

INFERÊNCIA BAYESIANA

MÁXIMA VEROSSIMILHANÇA

7/9/2013

29

7/9/2013

30

Beauti & Beast

Inferência Bayesiana Gera arquivo (*.xml)

7/9/2013

31

7/9/2013

32

7/9/2013

33

http://www.phylo.org/portal2/login!input.action

7/9/2013

34

7/9/2013

35

Figtree http://tree.bio.ed.ac.uk/software/figtree/

http://mesquiteproject.org

7/9/2013

36

Variabilidade

pode ser

desvantajosa: pode ser eliminada (seleção negativa ou purificadora)

neutra: pode ou não se fixar

(deriva genética)

vantajosa: tem grande chance

de se fixar (seleção positiva)

Cálculo de

dN = número de mutações não-sinônimas

dS = número de mutações sinônimas

>1

=1

<1 Seleção negativa ou purificadora

Seleção neutra

Seleção positiva

dN dS

7/9/2013

37

Por exemplo:

dN/dS = 1,1 Seleção positiva???

Seleção neutra???

É preciso de algum teste estatístico

http://www.datamonkey.org/

7/9/2013

38

Como uma análise global pode ajudar?

Entender a evolução de uma família de genes e proteínas

Reunir um conjunto maior de dados para que as

inferências filogenéticas sejam mais robustas

Fazer uso de informações genômicas para suportar

inferências filogenéticas

7/9/2013

39

Banco de dados de família de proteínas

http://pfam.sanger.ac.uk/

7/9/2013

40

http://www.uniprot.org/

7/9/2013

42

ANÁLISE DE SINTENIA

Análise de genes vizinhos a um gene em estudo

Blocos sintênicos se mantêm relativamente preservados

Gene X ? ? ? ? ? ?

7/9/2013

43

http://circos.ca/

7/9/2013

44

http://www.ensembl.org/index.html

7/9/2013

45

7/9/2013

46

7/9/2013

48

7/9/2013

49

Estudo de caso:

7/9/2013

50

7/9/2013

51

7/9/2013

52

Marcos T. Geraldo

mtgeraldo@gmail.com

top related