trabalhos do lbem -...
TRANSCRIPT
1
Reconstruções
Filogenéticas
Taxonomia
ØEstudo dos relacionamentos entregrupos de organismos – é umantigo ramo da biologia clássica.
Ø Estabelecida por CarolusLinnaeus (1707-1778).
Taxonomia e Classificação Hierárquica
O sistema taxonômico usado hoje foi desenvolvidopor Linnaeus no século XVIII. Este tinha 2características principais: o assinalamento de umnome duplo (binômio) a cada espécie e umsistema de agrupamento destas espécies.
Um binômio (nome Latino de 2 partes) é designadounicamente para cada espécie, onde o primeiro é o nomegenérico, e os dois nomes são ditos específicos.
Homo sapiensArabdopsis thalianaEscherichia coliChromobacterium violaceumCanis lupus
O sistema de agrupamento das espécies numa hierarquiade crescentes categorias formaliza o agrupamento deorganismos.
A nomenclatura Binomial é a primeira etapa no agrupamento:espécies similares são agrupadas no mesmo gênero.
O sistema então progride paracategorias mais amplas:
• Gêneros similares são agrupados namesma família.
• Famílias são agrupadas em Ordens.• Ordens são agrupadas em Classes.• Classes são agrupadas em Filos.• Filos são agrupados em Reinos.
A sistemática conecta a diversidade biológica à filogenia
Filogenia = A história evolutiva de uma espécie ou grupo deespécies relacionadas.
Filogenia é geralmente representada como árvoresfilogenéticas que traçam relacionamentos evolutivosinferidos.
Sistemática = O estudo da diversidade biológica em umcontexto evolutivo.
Diversidade Biológica reflete episódios passados deespeciação e macroevolução.
Compreende a taxonomia na sua procura porrelacionamentos evolutivos.
Taxonomia = Identificação e classificação de espécies; é umcomponente da sistemática.
2
Baseado nassimilaridades ediferenças, osprincipais gruposde organismospodem sercolocados em umdiagrama queilustra seusrelacionamentosevolutivos.Usando dadosfósseis emoleculares,podemos estimaros pontos dedivergência nasárvoresfilogenéticas.
Que são árvores?
Charles Darwin. Anotações 1836-1844
OTU 1
OTU 2
OTU 3
OTU 4
OTU 5
OTU 6
Árvore Filogenética
15 4 3 2678No de diferenças
tempoantiga recente
n1
n2
n3
n4
n5
n
OTU unidade taxonômica operacional - populações, espécies ou grupos
nó interno - ~ ancestral comum - extinto
raiz
Árvores Equivalentes
Por quê árvores?Por quê representamos evolução como árvore e
não outro tipo de gráfico?
CA DBA B C D
Ciclo, reticulação
A
BC
D
• Evolução é divergência – espécies se modificam
com o tempo - Transformacionismo
Darwin: “Descendência com modificação”
• Por várias razões, reticulação torna-se difícil com o
tempo – provavelmente no pré-cambriano as
reticulações devido a transferências gênicas
horizontais, fusões de células, etc, eram comuns.
• Reticulações são difíceis de se representar
3
Sang et al., 1997
Árvores reticuladas
Ex: espécies híbridas de Paeonia sp.
japonensis
americana
grus
nigrocollis
monachus
canadensis
bugeranus
virgo
paradisea
leucogeranus
antigone
rubicanda
vipio
Filogenia do grou
japonensis
americana
grus
nigrocollis
monachus
canadensis
bugeranus
virgo
paradisea
leucogeranus
antigone
rubicanda
vipio
Cladograma Árvore UPGMACyt. b (Mooers et al., 1999)
Árvore sem raiz
leucogeranus antigonerubicanda
vipio
japonensis
americana
grusnigricollis
monachuscanadensis
Bugeranus
virgo
paradisea
japonensis
americana
grus
nigrocollis
monachus
canadensis
bugeranus
virgo
paradisea
leucogeranus
antigone
rubicanda
vipio
Árvore UPGMA
Árvorefilogenéticapara ostentilhões deGalápagos.Estas 13espécieshabitam as IlhasGalápagos. Aárvore ébaseada emestudoscomparativos deestruturas docorpo,especialmenteforma e tamanhodos bicos, e nosestudos decampo sobreisolamentoreprodutivo ecomportamentoalimentar.
Conexão entre classificação e filogeniaA natureza da ramificação de uma árvore evolutiva reflete oarranjo hierárquico de táxons (taxa).Esta árvore sugere as possíveis afinidades genealógicas dentretáxons subordinados à ordem Carnivora.
4
Árvores filogenéticas baseadas em sistemáticaDois métodos, comparação de proteínas do sangue e hibridização DNA-DNA,foram usados para construir esta árvore de espécies de ursos e guaximins. Uma revisão moderna sobre focas,
leões marinhos e morsas
Dados molecularesrecentes indicam que defato as famílias dosPinípedes (morsas, otáriase leões marinhos, e focas),são monofiléticas.
Qual relação entre procariotos e eucariotos?
De onde vêm as mitocôndrias e cloroplastos?
Árvores filogenéticas podem nosdar informações sobre o
passado remoto
A classificação dos 5 reinos
Atualmente a sistemática filogenética favorece os 3-domínos
5
Riq
uét
sias
Mitocô
ndrias
outras bactérias
ArchaeaEucariotos
Nature, 1998
Árvores filogenéticas eepidemiologia
Dentista com HIV
Freeman and Herron, 1998
pac
iente
B-x
pac
iente
B-y
pac
iente
A-x
pac
iente
E-y
pac
iente
E-x
pac
iente
C-x
pac
iente
C-y
Den
tist
a-y
pac
iente
A-y
pac
iente
G-x
pac
iente
G-y
Den
tist
a X
LC02-x
LC03-x
LC02-y
LC09
LC35
pac
iente
D-x
pac
iente
D-y
LC03-y
pac
iente
F-x
pac
iente
F-y
HIV
LI
Biodiversidade eConservação
Ø Filogenética pode ser extremamente útil paraestudos de biodiversidade (inventariamento eclassificação) e estabelecimento de prioridadesconservacionistas.
Ø Medidas de diversidade utilizando-se desequências de DNA estão agora sendo usadaspara implementar planos de conservação derecursos genéticos.
Ø Aplicações: determinar ESUs (unidadesevolutivamente significantes), agrupamentos deespécies, espécies, subesp., populações isoladas ediferenciadas, etc...
Termos filogenéticos• Homologia
• Analogia
• Convergência, Reversão
• Plesiomorfia – estado ancestral – “0”(Simplesiomorfia)
• Apomorfia – estado derivado – “1”(Sinapomorfia - Autapomorfia)
Homologia:um caráter compartilhado entreduas ou mais espécies que estavapresente em seu ancestral comum.
Analogia:caráter “compartilhado” , nãopresente no ancestral comum (i.e.,o caráter evolui duas vezes,independentemente): evoluçãoconvergente, reversão.
Analogia
1 32 4Espécies:
Estado do caráter:
estado ancestral
Na Sp. 1 e 3 há uma analogia (caráter análogo);
Origem independente – evolução paralela ou convergente
6
Homologia Ancestral (0)
1 32 4Espécies:
Estado do caráter:
estado ancestral
em Sp. 1, 3 e 4 há uma homologia ancestral(simplesiomorfia); é ancestral porque está presente nabase da árvore
Homologia Derivada (1)
1 32 4Espécies:
Estado do caráter:
estado ancestral
nas Sp. 1 e 2 é homólogo derivado – sinapomorfia (i.e.,aconteceu uma transição do estado “basal” ou primitivono ancestral destas duas OTUs).
Separando Homologia de Analogia
Sistematas classificavam espécies em táxonssuperiores baseados na extensão de similaridade emmorfologia e outras características.
Homologia = Semelhança atribuída à ancestralidadecompartilhada. Os membros anteriores de mamíferossão homólogos, e compartilham uma similaridade nosuporte esquelético que tem uma base genealógica.
Homologia deve ser distinguida de analogia nasárvores evolutivas.
Analogia = Similaridades que podem ser devido aconvergência evolutiva (ou reversão):. não éancestralidade comum.
Convergência: origemindependente do caráter (i.e., duaslinhagens evoluem paralelamenteem um “fenótipo” similar).
Reversão: origem e subseqüenteperda ou mutação de volta aocaráter ancestral (i.e., reversão aoestado ancestral).
Evolução Convergente = Aquisição de
características similares em espécies de diferentes
linhas evolutivas, devido ao compartilhamento de
nichos ecológicos similares, sendo a seleção natural
responsável por moldar adaptações análogas.
Exemplo:
asas de insetos e pássaros
asas de pássaros e morcegos
Evolução convergente também se dá no nívelmolecular: sequências de DNA e proteínaspodem ter evoluções paralelas, reversões, etc
EvoluçãoConvergente
gerou similaridadesentre marsupiaisaustralianos emamíferosplacentários emoutros continentes
7
Um grupo monofilético:
é um grupo de táxons queinclui um ancestral comum e
todos seus descendentes
Exemplo de gruponão-monofilético: Répteis
Peixes TartarugasAnfíbios Cobras Crocodilos AvesMamíferos Lagartos
O ancestral comum mais recentedos répteis também deu origemaos mamíferos e aves
Classificação daBiodiversidade
Fenética(Taxonomia numérica)
Cladística(Sistemática Filogenética)
Fenética• Abordagem Clássica (Linnaeus).
• Agrupa espécies baseada nasimilaridade fenotípica (ougenotípica).
• Usa todas característicasdistinguíveis.
• Ex: métodos baseados emdistâncias (UPGMA)
Análise de várioscaracteres
(fenótipos, sítiospolimórficos, freq.
alélicas, etc.)
Matriz dedissimilaridade
em base ao númerode diferenças
Construçãode árvore
filogenética
FenogramaA B C
A
B
C
3
7 6
0
0
0
A B CA B
A
B
C
Relações de similaridade
MÉTODOS FENÉTICOS CladísticaØ Teoria Evolutiva que postula que grupos
de organismos similares descendem deum ancestral comum.
Ø Sistemática Filogenética (cladística)é um método de classificação taxonômicabaseado na história evolutiva.
Ø Foi desenvolvido por WilliHennig, um entomologistaalemão, em 1950.
8
Cladística• Nova abordagem (Hennig, 1950)
• Baseada nos padrões de ancestralidadecomum das espécies
• Usa apenas caracteres derivados(apomórficos) compartilhados(sinapomórficos / homólogos derivados)
• Portanto, objetiva traçar a históriaevolutiva real
• Ex: métodos baseados em caracteres(parcimônia)
Análise de várioscaracteres com
estados ancestrais(0) e derivados (1)
Construçãode árvore
filogenética
Cladograma
A B C
A
B
C
Relações de ancestralidade comum
MÉTODOS CLADÍSTICOS
D E123
45678
E
D
1
2 3
4
5 6
7 8
Caracteres utilizados
SimNãoNãoCladística
SimSimSimFenética
HomologiaDerivada
HomologiaAncestral
AnalogiaLagartoAve Dinossauro
Fenética Cladística
Lagarto AveDinossauro
Análise Filogenética
Ø Dado um conjunto de dados(caracteres morfológicos,alinhamento de múltiplassequências de DNA eproteína, etc), determinar(ou inferir) orelacionamento ancestraldentre as espécies.
Esp.1 Esp.2 Esp.3 Esp.4
Tempo
Não-resolvidaou filogenia tipo “estrela”
Filogenia parcialmente resolvida
Completamente resolvida,filogenia bifurcada
A A A
B
B B
C
C
C
E
E
E
D
D D
Politomia ou multifurcação uma bifurcação
O objetivo da inferência filogenética é resolver a ordem deramificação das linhagens nas árvores evolutivas:
9
Há 3 possíveis árvores sem raizpara 4 táxons (A, B, C, D)
A C
B D
árvore 1A B
C D
árvore 2A B
D C
árvore 3
Métodos de construção (ou inferência) de árvores filogenéticasobjetivam descobrir qual das possíveis árvores sem raiz é a"correta".Seria desejável que esta fosse a “verdadeira” árvore biológica— aquela que seguramente represente a história evolutiva dostáxons analisados – mas esta é normalmente chamada deárvore inferida a partir dos dados.
O número de árvores sem raiz aumentaexponencialmente com o número de táxons
# táxons 3 4 5 6 7 8 910 . . . .30
# árvores sem raiz 1 3 15 105 945 10,935 135,135 2,027,025 . . . . -3.58 x 1036
(2N - 5)!! = # árvores sem raiz para N táxons
CA
B D
A B
C
A D
B E
C
A D
B E
C
F
Inferir relacionamentos evolutivos entre ostáxons requer enraizar a árvore:
Note que nesta árvore
enraizada, o táxon A não
está mais estreitamente
relacionado ao táxon B em
relação a C ou D como
sugerido acima.
A
BC
Raiz D
A B C D
Raiz
árvore enraizada
árvore sem raiz
O enraizamento em outra posição:
A
BC
raiz
D
árvore sem raiz
Note que nesta árvore enraizada,táxon A é mais estreitamenterelacionado ao táxon B, enquantoo C é mais relacionado ao D.
C D
raiz
árvore enraizada
A
B
Uma árvore sem raiz, de 4-táxons, pode teoricamente serenraizada em cinco lugares diferentes para produzir cinco tipos
distintos de árvores enraizadas
árvore sem raiz:
A C
B D
árvore c/raiz 4 C
D
A
B
4
árvore c/raiz 3 A
B
C
D
3
árvore c/raiz 5 D
C
A
B
5
árvore c/raiz 2 A
B
C
D
2
árvore c/raiz 1 B
A
C
D
1
Estas árvores mostram cinco histórias evolutivas diferentes entre ostáxons, dependendo de onde se coloca a raiz !
Todos estes rearranjos mostram o mesmorelacionamento evolutivo entre táxons
B
A
C
D
A
B
D
C
B
C
AD
B
D
AC
B
ACD
árvoreenraizada 1 B
A
C
D
A
B
C
D
Todas estas árvores são idênticas
10
Há dois modos principais de enraizar árvores:Pelo outgroup (grupo externo):Usa táxons de referência (o “outgroup”)que sabidamente se situam fora do grupode interesse (o “ingroup”). Requerconhecimento a priori sobrerelacionamentos entre os táxons. Ooutgroup pode ser uma espécie (ex: avespara enraizar uma árvore de mamíferos)ou cópias de genes duplicados (ex: α-globina para enraizar β-globinas). outgroup
A
B
C
D
10
2
3
5
2
Pelo ponto-médio ou distância:enraiza a árvore no ponto médio entre osdois táxons mais distantes na árvore, talcomo determinado pelo tamanho dosramos. Pressupõe que os táxons evoluemcoordenadamente (clock-like). Estasuposição está embutida em algunsmétodos de construção de árvores talcomo o UPGMA
d (A,D) = 10 + 3 + 5 = 18Ponto-médio = 18 / 2 = 9
# táxons
3456789....30
# árvores sem raiz 1 3 15 105 945 10,935135,135....~3.58 x 1036
# raízes 3 5 7 9111315....57
# árvores com raiz 3
15 105 945 10,395 135,1352,027,025
.
.
.
.~2.04 x 1038
x =
CA
B D
A D
B E
C
A D
B E
C
F
Cada árvore sem raiz pode teoricamente ser enraizadaem qualquer lugar ao longo de qualquer de seus ramos
Reconstruções
filogenéticas com
dados moleculares
Variabilidade genéticaFenotípica
Morfológica
Funcional
Protéica
Genotípica
Macromutações
SNP’s – mutações de ponto
Inserções de retroposons
Microssatélites
POP1
A - 0,4B - 0,2C - 0,9D - 0,1E - 0,2
POP2
A - 0,6B - 0,5C - 0,8D - 0,3E - 0,1
POP3
A - 0,3B - 0,2C - 0,9D - 0,2E - 0,4
Freqüências alélicasFreqüência de um dos alelos em cinco locosbialélicos (A-E) em 3 populações (pop1, 2, 3)
MicrossatélitesAT
ATAT
AT
AT
CCG CCGCCG
CCG
CA CA CA CA
CA CA
CA
CA CA CA CA CA
CA CA CA CA CA CA
CAAlelo 3
Alelo 5
Alelo 7
são multi-alélicos
µ = 10-3 / locus / geração
11
Inserções de retroposons
Elementos Alu, L1, Retrovírus endógenos
são bialélicos
alelo 0
alelo 1
µ = 10-8 a 10-9 / locus / geração
SNPs ou mutações de ponto
Single Nucleotide Polymorphisms
são geralmente bialélicos
alelo 0 ...AAGCGTTATAGC...
alelo 1 ...AAGTGTTATAGC...
µ = 10-7 a 10-8 / locus / geração
* * * ** * * * * * *A aat tcg ctt cta gga atc tgc cta atc ctgB ... ..a ..g ... .a. ... ... t.. ... ..aC ... ..a ..c ..g ... ..t ... ... ... t.aD ... ..a ..a ..g ..g ..t ... t.g ..t t..
Cada diferença de nucleotídio é um SNP econsiderado como um caráter nareconstrução filogenética
* Caracteres variáveis entre estas sequências
Analogia
T A T C
C
1 32 4Espécies:
Estado do caráter:
estado ancestral
T Na Sp. 1 e 3 há uma analogia (caráter análogo);
Origem independente – evolução paralela ou convergente
Homologia Ancestral (0)
T C C
C
1 32 4Espécies:
Estado do caráter:
estado ancestral
C em Sp. 1, 3 e 4 há uma homologia ancestral(simplesiomorfia); é ancestral porque está presente nabase da árvore
C
Homologia Derivada (1)
T T C C
C
1 32 4Espécies:
Estado do caráter:
estado ancestral
T nas Sp. 1 e 2 é homólogo derivado – sinapomorfia (i.e.,aconteceu uma transição do estado “basal” ou primitivo,no ancestral destas duas OTUs).
12
Tipos de MétodosFilogenéticos
Øbaseados no caráterl Parcimônial Verossimilhança –ML
Øbaseados na distâncial Neighbor joining (NJ)l UPGMA
Envolvem um critériode otimização baseadona adequação doscaracteres na árvore.
Envolvem um critériode otimização baseadona adequação damatriz de distânciaspareadas à árvore
Seleciona a árvore que melhorrepresenta as distânciasobservadas entre os pares.
Seleciona a árvore que tem amaior probabilidade dereproduzir os dados observados.
Seleciona a árvore que explicaos dados com o menor númerode substituições (eventos mutacionais).
Distância
Verossimilhança
Parcimônia
Estima-se primeiro qual árvoresem raiz seria a mais “correta”
A
B
C
D
Alguns métodos produzem a árvore já com a raiz(UPGMA), outros podem fornecer árvores comraiz se os dados possuem informação suficiente
(parcimônia, verossimilhança) e outrosnecessitam obrigatoriamente de um grupo
externo para produzir uma árvore com raiz (NJ)
Tipos de dados usados em inferência filogenéticaMétodos baseados em caracteres : Usam diretamente os caracteresalinhados, tais como sequências de DNA ou proteína
táxons caracteresespécie A ATGGCTATTCTTATAGTACGespécie B ATCGCTAGTCTTATATTACAespécie C TTCACTAGACCTGTGGTCCAespécie D TTGACCAGACCTGTGGTCCGespécie E TTGACCAGTTCTCTAGTTCG
Métodos baseados em distâncias: Transformam os dados em distâncias(dissimilaridades) par-a-par, e usam a matriz durante inferência da árvore. A B C D E espécie A ---- 0.20 0.50 0.45 0.40 espécie B 0.23 ---- 0.40 0.55 0.50 espécie C 0.87 0.59 ---- 0.15 0.40 espécie D 0.73 1.12 0.17 ---- 0.25 espécie E 0.59 0.89 0.61 0.31 ----
Exemplo 1:Distância “p”(= percentagemobservada desequênciasdiferentes)
Exemplo 2: distância Kimura 2-parâmetros(estimativa do número real de substituições entre táxons)
MATRIZ
Similaridade vs. relacionamento evolutivoSimilaridade e relacionamento evolutivo não são a mesma coisa,mesmo que relacionamento evolutivo seja inferido de certos tiposde similaridade.
Similar: ser semelhante (uma observação)
Relacionado: geneticamente conectado (um fato histórico)
Dois táxons podem ser mais similares sem ser mais relacionados:
Táxon A
Táxon B
Táxon C
Táxon D
11
1
6
3
5
C é mais similar ao A (d = 3) doque ao B (d = 7), mas C e B sãomais estreitamente relacionados:C e B compartilham um ancestralcomum mais recente do que osdois com A.
métodos baseados em caracteres podem discriminar os tipos desimilaridade e teoricamente encontrar a verdadeira árvore evolutiva
Tipos de Similaridade
Similaridade observada entre duas OTUs pode ser por:
relacionamento evolutivo :caracteres ancestrais compartilhados (‘simplesiomorfias’)caracteres derivados compartilhados (‘’sinapomorfias’)
Homoplasia (evolução independente do mesmo caráter):Eventos Convergentes (em OTUs relacionadas ou não), Eventos Paralelos(em OTUs relacionadas), Reversões (em OTUs relacionadas ou não)
CCGG
C
CGG
C
CGG
CG
GT
Convergentes Paralelos Reversões
13
Métodos FenéticosØ Algoritmos de computador baseados nos modelos fenéticos
se valem dos Métodos de Distância para construção de
árvores.
Ø Métodos Fenéticos geralmente contam cada diferença na
seqüência de bases igualmente.
Ø Os algoritmos são mais rápidos e produzem propriedades
estatísticas “robustas” com dados moleculares.
Ø A abordagem fenética é popular com alguns pesquisadores
que “confiam” demasiado nos dados moleculares (tal como
seqüências) e requer relativamente poucos pressupostos.
Fenética molecularØ A sistemática faz o uso freqüente de dados numéricos,
(taxonomia numérica) os quais podem ser valores para
vários dos “estados de caráter” tal como o tamanho ou
forma de uma estrutura visível ou estas podem ser
seqüências de DNA ou proteína.
Ø Similaridades e diferenças entre organismos podem ser
codificadas como um grupo de caracteres, cada um com
dois ou mais estados alternativos de caráter.
Ø Os dados obtidos com análise molecular podem ser
freqüências alélicas, perfil ou impressão digital de DNA
(produzidos por enzimas de restrição, RAPD, etc) e
seqüências de DNA ou proteína.
Medidas de DistânciasØ É uma medida da diferença genética entre duas espécies,
populações, ou mesmo entre dois indivíduos.
Ø O conceito de taxonomia numérica está baseado em
computar filogenias a partir de uma matriz de distâncias.
Ø No caso de dados de seqüências, distâncias
par-a-par devem ser calculadas entre todas seqüências
que serão usadas para construir a árvore - criando uma
matriz de distâncias.
Ø Métodos de distâncias geram uma única medida da
quantidade de mudanças evolutivas entre duas seqüências
desde a divergência de um ancestral comum.
Distâncias entre DNAØ distâncias entre pares de seqüências de DNA são
relativamente simples de computar como a soma de
diferenças de bases entre as duas seqüências.
l Este tipo de algoritmo somente funciona para pares de
sequências similares o bastante para serem alinhadas
Ø Geralmente todas alterações de bases são consideradas iguais
Ø Inserções/deleções geralmente possuem um peso maior do
que substituições nucleotídicas (gap penalties).
Ø É também possível corrigir múltiplas substituições em um
único sítio, que é comum em relacionamentos filogenéticos
distantes e para sítios de rápida evolução.
Algoritmos baseados em distâncias(agrupamento)
Usam distâncias para calcular árvoresfilogenéticas. Estas são baseadas somente nonúmero relativo de similaridades e diferençasentre um grupo de seqüências.
l Começa com uma matriz de distâncias par-a-par
l Estes métodos constróem uma árvore ligandoos pares de táxons menos distantes,sucessivamente ligando táxons mais distantes.
l Ex: UPGMA, Neighbor joining
UPGMAØ O mais simples dos métodos de distância é o UPGMA
(Unweighted Pair Group Method using Arithmeticaverages).
Ø Assume taxas evolutivas idênticas para todas OTUs.
Ø Agrupa as distâncias menores e recalcula novas distânciasatravés de médias aritméticas para novo agrupamento.
Ø Os programas do PHYLIP DNADIST and PROTDISTcalculam distâncias genéticas entre grupos de seqüênciascriando uma matriz.
Ø Então o programa NEIGHBOR (que também constróiárvores NJ) do PHYLIP constrói a árvore UPGMA apartir da matriz.
Ø Esta árvore é visualizada em um programa apropriado(TREEVIEW ou PTP).
14
Neighbor JoiningØ O método Neighbor Joining (NJ) é o mais
popular na construção de árvores a partir demedidas de distâncias genéticas
(Saitou and Nei 1987, Mol. Biol. Evol. 4:406)
l NJ corrige o método UPGMA para seu pressuposto(freqüentemente inválido) de que uma mesma taxa deevolução se aplica a todos ramos de uma filogenia.
l A matriz de distância é ajustada para diferenças nastaxas de evolução de cada táxon (ramo).
l NJ apresentou melhores resultados em simulações e écomputacionalmente o mais eficiente algoritmo dedistâncias (N. Saitou and T. Imanishi, Mol. Biol. Evol. 6:514 (1989)
Métodos de Distância
A ACGA
B ATGC
C GTGC
D GCAA
A B C D
A 0
B 0,5 0
C 0,75 0,25 0
D 0,5 1,0 0,75 0
dij
A
B
C
D
a
b
c
d
e
e a be a e ce a e de b e ce b e de c d
AB
AC
AD
BC
BD
CD
= += + += + += + += + += +
Muitos métodosde distâncias (talcomo NJ) buscarencontrar umaárvore queminimize umvalor tal como:
( )d e
e
ij ij
ij
−
i< j∑
2
Métodos CladísticosØ São baseados na hipótese de que um grupo de
seqüências evolui de um ancestral comum por umprocesso de mutação, deriva e seleção, semtransferência horizontal de genes (hibridização,transdução de DNA por vírus, etc).
Ø Estes métodos funcionam melhor em construçõesde árvores, se pelo menos uma seqüência ancestraljá é conhecida, de modo que comparações podemser feitas entre um número finito de árvoresalternativas ao invés de se calcular todas possíveisárvores para um dado grupo de seqüências.
Parcimônia
Ø Parcimônia é o método mais popular dereconstrução de relacionamentos porancestralidade comum.
Ø Parcimônia permite o uso de todainformação evolutiva conhecida para aconstrução da árvore.
l em contraste, métodos de distância resumemtodas diferenças entre pares de seqüênciasem um único número, a percentagem dediferença ou distância genética.
Construindo árvorescom Parcimônia
Ø Parcimônia envolve a avaliação de todas árvores
possíveis considerando o número de mudanças
evolutivas necessárias par explicar os dados observados.
Ø A melhor árvore é aquela que requer o menor número
de alterações de bases (ou aminoácidos) para que todas
seqüências derivem de uma ancestral comum.
15
Ø Considere 4 seqüências a (ACGA), b (ATGC),
c (GTGC), d (GCAA).
Ø A parcimônia deve decidir qual das 3 possíveis
árvores sem raiz (4 táxons), é a mais “correta”
(parcimoniosa).
Ø Posteriormente, se houver informações
suficientes, deve-se colocar a raiz.
Exemplo de Parcimônia Exemplo de Parcimôniaa
b
c
d
a
c
b
da
d
b
c
a A C G A
b A T G C
c G T G C
d G C A A
árvore 1
árvore 2
árvore 3
1 2 3 4 Tot
árvore 1 1 2 1 2 6
árvore 2 2 2 1 2 7
árvore 3 2 1 1 1 5
Exemplo de Parcimôniaa
d
b
cárvore 3
Árvore sem raiz escolhida pela análise de parcimônia
Neste caso temos informações adicionais deque a sequência d , possui mais estadosalélicos plesiomórficos (ancestrais, ou “0”)
a b cdÁrvore com raizescolhida usandod como outgroup
A análise de parcimôniapode discriminar algunstipos de eventos paralelos.Na figura ao lado, 4seqüências alinhadashomólogas (a) de distintosorganismos foramutilizadas para construiruma árvore de parcimônia(b).Na árvore estão dispostasos eventos de mutações(apomorfias), numeradosde 1 a 8. No evento 2, oestado alélico derivado(nucleotídio A)demonstrou ser um eventoparalelo, aparecendoindependentemente naseqüência do homem e domilho