evolução molecular metodologias de análise ricardo lehtonen rodrigues de souza laboratório de...
TRANSCRIPT
Evolução Molecular Evolução Molecular Metodologias de AnáliseMetodologias de Análise
Ricardo Lehtonen Rodrigues de Souza
Laboratório de Polimorfismos e Ligação
Depto de Genética – UFPR
DadosDadosMolecularesMoleculares x x MorfológicosMorfológicos
► HereditáriosHereditários► Descrição não Descrição não
ambígua ambígua ► Mais fácil Mais fácil
estabelecer estabelecer homologiahomologia
► Permite Permite comparações de comparações de espécies distantesespécies distantes
► Abundantes Abundantes
►Fatores Fatores ambientaisambientais
►Diferenças de Diferenças de classificaçãoclassificação
Evolução MolecularEvolução Molecular
As mutações genéticas são a As mutações genéticas são a matéria prima do processo matéria prima do processo evolutivo. evolutivo.
A taxa de mudança gênica pode A taxa de mudança gênica pode ser usada para medir a ser usada para medir a evolução.evolução.
Evolução MolecularEvolução Molecular
►Seqüências de DNA mudam Seqüências de DNA mudam lentamentelentamente
►Não é possível observar diretamente a Não é possível observar diretamente a evoluçãoevolução
►Comparação de 2 ou mais seqüências Comparação de 2 ou mais seqüências homólogas (descendem de um homólogas (descendem de um ancestral comum)ancestral comum)
Modelo de um parâmetroModelo de um parâmetro (Jukes e Cantor)(Jukes e Cantor)
► A taxa de A taxa de substituição em substituição em cada direção é cada direção é
► A taxa de A taxa de substituição para substituição para qualquer nt é qualquer nt é 3 3
► A probabilidade A probabilidade que um nt não que um nt não mude é mude é 1 - 3 1 - 3
Modelo de 2 parâmetrosModelo de 2 parâmetros (Kimura)(Kimura)
► A taxa de A taxa de transiçãotransição é é
► A taxa de A taxa de transversãotransversão é é
► Considera Considera ee , , pois pois transiçõestransições são mais são mais freqüentes que freqüentes que transversõestransversões
Tipos de substituições Tipos de substituições entre 2 seqüênciasentre 2 seqüências
► Substituição únicaSubstituição única► Substituições Substituições
seqüenciaisseqüenciais► Substituições Substituições
coincidentescoincidentes► Substituições Substituições
paralelasparalelas► Substituições Substituições
convergentesconvergentes► Retro substituiçãoRetro substituição
tempo
Nu
mer
o d
e d
ifer
ença
sEsperado
Observado
Regiões CodificadorasRegiões Codificadoras
►Distinguir entre:Distinguir entre: Substituição Substituição sinônimasinônima Substituição Substituição não sinônimanão sinônima
►Para estimar as proporções de Para estimar as proporções de substituições sinônimas e não substituições sinônimas e não sinônimas é preciso saber, sinônimas é preciso saber, respectivamente, o número total respectivamente, o número total possível de:possível de: Sítios sinônimosSítios sinônimos Sítios não sinônimosSítios não sinônimos
Regiões CodificadorasRegiões Codificadoras Cálculo do número de sítios Cálculo do número de sítios sinônimos e não sinônimossinônimos e não sinônimos
►SeSe ii é o número de mudanças é o número de mudanças sinônimas em um sítio, esse sítio é sinônimas em um sítio, esse sítio é contado separadamente como: contado separadamente como: i/3 sinônimo i/3 sinônimo (Ns = (Ns = i/3) i/3) (3-i)/3 não sinônimo (3-i)/3 não sinônimo [Na = [Na = (3-i/3)] (3-i/3)]
Regiões codificadorasRegiões codificadoras
Ks = - 3/4 ln (1 - 4Ms/3Ns)Ks = - 3/4 ln (1 - 4Ms/3Ns)Ka = - 3/4 ln (1 - 4Ma/3Na)Ka = - 3/4 ln (1 - 4Ma/3Na)
Ks e Ka : proporção de diferenças Ks e Ka : proporção de diferenças sinônimas e não sinônimas por sítio sinônimas e não sinônimas por sítio sinônimo e não sinônimo, sinônimo e não sinônimo, respectivamente.respectivamente.
Ms e Ma : número respectivo de Ms e Ma : número respectivo de diferenças sinônimas e não sinônimas diferenças sinônimas e não sinônimas observadas,.observadas,.
Ns e Na : número respectivo de sítios Ns e Na : número respectivo de sítios sinônimos e não sinônimos esperados.sinônimos e não sinônimos esperados.
Mudanças EvolutivasMudanças Evolutivas
►Substituição de Substituição de aminoácidosaminoácidos
Substituição de Substituição de AminoácidosAminoácidos
►A proporção (A proporção (pp) de diferentes ) de diferentes aminoácidos entre duas aminoácidos entre duas seqüências:seqüências:
p = n/Lp = n/L nn: número de aminoácidos diferentes: número de aminoácidos diferentes LL: comprimento da seqüência: comprimento da seqüência
►O número de substituições de O número de substituições de aminoácidos por sítio (aminoácidos por sítio (dd):):
d = - ln (1-p)d = - ln (1-p)
Algumas substituições de Algumas substituições de aminoácidos requerem mais aminoácidos requerem mais substituições de nt substituições de nt
► Ile Ile Thr Thr : uma mudança : uma mudança►AUU AUU A ACCUU►AUC AUC A ACCCC►AUA AUA A ACCAA
► Ile Ile Cys Cys: duas mudanças: duas mudanças►AUU (Ile) AUU (Ile) A AGGU (Ser) U (Ser) UUGU (Cys)GU (Cys)►AUU (Ile) AUU (Ile) UUUU (Phe) UU (Phe) U UGGU (Cys)U (Cys)
Substituição de Substituição de NucleotídeosNucleotídeos
Taxas e PadrõesTaxas e Padrões
Taxa de substituição de Taxa de substituição de nucleotídeosnucleotídeos
► Divergência de 2 Divergência de 2 seqüências seqüências homólogas a partir do homólogas a partir do ancestral comumancestral comum
► r = K/2Tr = K/2T► rr = n = noo de de
substituições por substituições por sítio/anosítio/ano
► KK = n = noo médio de médio de substituiçõessubstituições
► TT = tempo desde a = tempo desde a divergênciadivergência
►Normalmente consideramos o tempo Normalmente consideramos o tempo de de divergência das seqüênciasdivergência das seqüências como como igual ao tempo de igual ao tempo de divergência das 2 divergência das 2 espéciesespécies
►Mas, em espécies próximas, podemos Mas, em espécies próximas, podemos estar vendo estar vendo diferenças que já estavam diferenças que já estavam presentes no ancestral comumpresentes no ancestral comum
►A A duplicação das seqüênciasduplicação das seqüências pode pode ocorrer ocorrer independente da especiaçãoindependente da especiação
Espécie Ancestral
Homem Gorila
especiação
Seqüência comum ancestralT
emp
o
►As seqüências As seqüências divergiram há divergiram há mais tempomais tempo que as espécies que as espécies
►Se for usado o tempo de Se for usado o tempo de divergência das espécies, divergência das espécies, a a taxa de substituição será taxa de substituição será superestimadasuperestimada
Taxas de substituições sinônimas (S) e não sinônimas (NS) em genes de proteínas em mamíferos.
Médias:
NS: 0,74
S: 3,51
Regiões Codificadoras
Regiões codificadoras e não Regiões codificadoras e não codificadoras: comparando codificadoras: comparando seqüências e descobrindo seqüências e descobrindo
genesgenes
Padrões de substituiçãoPadrões de substituiçãoDiferenças nas pressões seletivasDiferenças nas pressões seletivas
► Alguns poucos aminoácidos em um Alguns poucos aminoácidos em um
ponto críticoponto crítico Região do grupo Heme na Região do grupo Heme na
HemoglobinaHemoglobina O restante só precisa ser hidrofílicoO restante só precisa ser hidrofílico
► Toda a proteínaToda a proteína Histona 4Histona 4 A proteína toda está em contato com A proteína toda está em contato com
o DNA ou proteínaso DNA ou proteínas Quanto mais importante a função, mais Quanto mais importante a função, mais
lenta a taxa de evoluçãolenta a taxa de evolução
Padrões de substituiçãoPadrões de substituição
►Padrões de substituição podem dar Padrões de substituição podem dar informações sobre a função da proteínainformações sobre a função da proteína
►Genes diferentes evoluem a taxas Genes diferentes evoluem a taxas diferentesdiferentes
►Aminoácidos conservados são críticos Aminoácidos conservados são críticos para a função da proteínapara a função da proteína
Distâncias físico-químicas Distâncias físico-químicas entre os aminoácidosentre os aminoácidos
Distâncias físico-químicas Distâncias físico-químicas entre pares de aminoácidosentre pares de aminoácidos
Cerca de 60-90% das trocas Cerca de 60-90% das trocas de aa envolvem o 1de aa envolvem o 1oo ou 2 ou 2oo
vizinhos do anelvizinhos do anel
Relógio MolecularRelógio Molecular
►Número de mudanças é proporcional Número de mudanças é proporcional ao tempoao tempo
►Então, usando o número de mudanças Então, usando o número de mudanças é possível é possível estimar o tempo de estimar o tempo de divergênciadivergência entre espécies ou entre entre espécies ou entre genesgenes
►Pré-requisito: Pré-requisito: taxa de evolução taxa de evolução constanteconstante
Obtenção das seqüênciasObtenção das seqüências
► SeqüenciamentoSeqüenciamento
► Bancos de dadosBancos de dados
Bancos de dadosBancos de dados
►EntrezEntrez►http://www.ncbi.nlm.nih.gov/Entrez/http://www.ncbi.nlm.nih.gov/Entrez/
►GenBank: 85.759.586.764 bases (fev GenBank: 85.759.586.764 bases (fev 08)08)
EntrezEntrez
Busca de seqüênciasBusca de seqüências
Busca de seqüênciasBusca de seqüências
Alinhamento de seqüênciasAlinhamento de seqüências
►ClustalWClustalW http://www.ebi.ac.uk/Tools/clustalw2/index.htmlhttp://www.ebi.ac.uk/Tools/clustalw2/index.html
►BioEditBioEdit http://www.mbio.ncsu.edu/bioedit/bioedit.htmlhttp://www.mbio.ncsu.edu/bioedit/bioedit.html
►MegaMega http://www.megasoftware.net/http://www.megasoftware.net/
BioEditBioEdit
Métodos de construção de Métodos de construção de árvores filogenéticasárvores filogenéticas
Métodos baseados em distânciaMétodos baseados em distância► UPGMAUPGMA – considera a árvore como aditiva e – considera a árvore como aditiva e
que todos os táxons estão igualmente que todos os táxons estão igualmente distantes da raiz.distantes da raiz.
► Evolução mínimaEvolução mínima – estima-se para cada – estima-se para cada árvore alternativa o comprimento de cada árvore alternativa o comprimento de cada braço a partir das distâncias entre os braço a partir das distâncias entre os táxons. A árvore escolhida é a que tem táxons. A árvore escolhida é a que tem menor somatória do comprimento de menor somatória do comprimento de braços.braços.
Métodos de construção de Métodos de construção de árvores filogenéticasárvores filogenéticas
►Agrupamento de vizinhos (Neighbor Agrupamento de vizinhos (Neighbor Joining):Joining): Baseado no método de Baseado no método de evolução mínima – não examina todas evolução mínima – não examina todas as topologias possíveis, mas procura as topologias possíveis, mas procura encontrar vizinhos que minimizem o encontrar vizinhos que minimizem o comprimento total da árvore.comprimento total da árvore.
Métodos de construção de Métodos de construção de árvores filogenéticasárvores filogenéticas
Métodos baseados em caráterMétodos baseados em caráter►Máxima Parcimônia:Máxima Parcimônia: o método assume o método assume
o critério da parcimônia, minimizando o critério da parcimônia, minimizando o número de passos evolutivos aceitos o número de passos evolutivos aceitos na árvorena árvore
►Máxima verossimilhança:Máxima verossimilhança: considera considera todos os sítios indistintamentetodos os sítios indistintamente
►Análise Bayesiana:Análise Bayesiana: probabilidades a probabilidades a posterioriposteriori
Métodos de construção de Métodos de construção de árvores filogenéticasárvores filogenéticas
►Vários desses métodos estão Vários desses métodos estão implementados no programa implementados no programa MegaMega
►Também no pacote de programas Também no pacote de programas PhylipPhylip: : http://evolution.genetics.washington.edu/phylip.htmhttp://evolution.genetics.washington.edu/phylip.htmll
ExemplosExemplos► Neighbor-Joining Neighbor-Joining
PON2 Homosapiens
PON2 Pan troglodytes
PON2 Macaca mulata
PON2 Mus musculus
PON3 Mus musculus
PON3 Macaca mulata
PON3 Homo sapiens
PON3 Pan troglodytes
PON2 Galus gallus
PON1 Mus musculus
PON1 Macaca mulata
PON1 Homo Sapiens
PON1 Pan Troglodytes
PON2 Xenopus tropicalis
PON1 Xenopus laevis
MRNA Danio rerio
100
95
100
100
95
100
100
95
64
64
100
100
94
0.05
ExemplosExemplos► Minimum Evolution Minimum Evolution
PON2 Homosapiens
PON2 Pan troglodytes
PON2 Macaca mulata
PON2 Mus musculus
PON3 Mus musculus
PON3 Macaca mulata
PON3 Homo sapiens
PON3 Pan troglodytes
PON1 Mus musculus
PON1 Macaca mulata
PON1 Homo Sapiens
PON1 Pan Troglodytes
PON2 Galus gallus
PON2 Xenopus tropicalis
PON1 Xenopus laevis
MRNA Danio rerio
100
96
100
100
94
100
100
51
98
71
100
100
90
0.05
ExemplosExemplos► Maximum Parsimony Maximum Parsimony
PON2 Homosapiens
PON2 Pan troglodytes
PON2 Macaca mulata
PON2 Mus musculus
PON3 Mus musculus
PON3 Macaca mulata
PON3 Homo sapiens
PON3 Pan troglodytes
PON2 Galus gallus
PON1 Mus musculus
PON1 Macaca mulata
PON1 Homo Sapiens
PON1 Pan Troglodytes
MRNA Danio rerio
PON2 Xenopus tropicalis
PON1 Xenopus laevis
100
100
100
99
100
100
99
100
100
33
52
91
100
ExemplosExemplos► UPGMAUPGMA
PON2 Homosapiens
PON2 Pan troglodytes
PON2 Macaca mulata
PON2 Mus musculus
PON2 Galus gallus
PON3 Mus musculus
PON3 Macaca mulata
PON3 Homo sapiens
PON3 Pan troglodytes
PON1 Mus musculus
PON1 Macaca mulata
PON1 Homo Sapiens
PON1 Pan Troglodytes
PON2 Xenopus tropicalis
PON1 Xenopus laevis
MRNA Danio rerio
99
100
99
100
100
100
100
100
100
100
90
67
97
0.000.050.100.15
Leitura recomendadaLeitura recomendada
►Schneider, Horacio. Métodos de Schneider, Horacio. Métodos de análise filogenética: um guia prático. análise filogenética: um guia prático. 33aa edição. Ed. Holos e SBG, 2007. edição. Ed. Holos e SBG, 2007.
►www.sbg.org.brwww.sbg.org.br