comparação entre sequências de dna - ib.unicamp.br · comparação entre sequências de dna 1....

34
Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em sequências de DNA 2. Implicações metodológicas do processo de mutação 3. Princípios metodológicos de comparação de sequências de DNA Objetivo: Compreender a natureza dos processos de divergência e mutação e suas implicações para a comparação entre sequências de DNA.

Upload: buinhu

Post on 12-Nov-2018

227 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

Comparação entre sequências de DNA

1. Processo evolutivo de divergência e mutação em

sequências de DNA

2. Implicações metodológicas do processo de mutação

3. Princípios metodológicos de comparação de

sequências de DNA

Objetivo: Compreender a natureza dos processos

de divergência e mutação e suas implicações para a

comparação entre sequências de DNA.

Page 2: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

EspaEspaççooTem

po

Tem

po

Descendência com modificação

Page 3: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

Histórica Comparativa Inferencial

A sistemática biológica éuma ciência

Page 4: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

Matriz de caracteres alinhadosEvolução (não-observável)

CGACTTG

CCACATG

DADOS DE SEQUÊNCIAS

GC TAA

Análise filogenética

Page 5: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

População descendente População descendente

Sequências descendentes

AA

CCTT

População ancestral

Sequência ancestral

Comparação de sequências

1. Divergência e mutação

Page 6: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

ACTGAACGTAACGC

ACTAAACGTAATGC

Mutação de ponto

ACTGAATGTAACGC

Comparação de sequências

1. Divergência e mutação

Page 7: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

ACTGAACGTAACGC

ACTAAACGTAATGC

Deleção

A∗TGAATGTAACGC

Comparação de sequências

1. Divergência e mutação

Page 8: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

ACTGAACGTAACGC

ACTAAACGTCAATGC

Inserção

A∗TGAATGTAACGC

Comparação de sequências

1. Divergência e mutação

Page 9: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

ACTGAACGTAACGC

ACTAAACGTCAATGC

Mutação de pontoDeleçãoInserção

A∗TGAATGTAACGC

Comparação de sequências

1. Divergência e mutação

Page 10: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

Comparação entre sequências de DNA

1. Processo evolutivo de divergência e

mutação em sequências de DNA

2. Implicações metodológicas do processo de

mutação

3. Princípios metodológicos de comparação de

sequências de DNA

Page 11: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

ACTGAACGTAACGC

ACTAAACGTAATGC

Mutação de ponto

ACTGAATGTAACGC

Comparação de sequências

2. Implicações metodológicas

• Mutações de ponto não mudam as posições

relativas das bases nas sequências

descendentes em relação à sequência ancestral

Page 12: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

ACTGAACGTAACGC

Inserção

ACTAAACGTCAATGC A∗TGAATGTAACGC

ACTGAACGTAACGC

Deleção

ACTAAACGTAATGC A∗TGAATGTAACGC

Comparação de sequências

2. Implicações metodológicas

• Mutações de deleção e inserção mudam as

posições relativas das bases nas sequências

descendentes em relação à sequência ancestral

Page 13: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

ACTAAACGTCAATGC ATGAATGTAACGC

ACTGAACGTAACGC

Processo evolutivo

Comparação de sequências

2. Implicações metodológicas

• Mutações de deleção e inserção alteram as posições relativas

dos sítios de nucleotídeos entre as sequências descendentes e a

sequência ancestral.

• Mutações de deleção e inserção alteram o comprimento das

sequências descendentes.

Page 14: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

Comparação de sequências

2. Implicações metodológicas

Preservação − destruição

da informação

ACTGAACGTAACGC

ACTAAACGTCAATGC ATGAATGTAACGC

ACTGAACGTAACGC

ACTAAACGTAATGC ACTGAATGTAACGC

Mutação de ponto Deleção/Inserção

Page 15: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

ACTAAACGTCAATGC ATGAATGTAACGC

ACTGAACGTAACGC

Processo evolutivo

Comparação de sequências

2. Implicações metodológicas

Dados experimentaisACTAAACGTCAATGCATGAATGTAACGC

Page 16: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

Comparação de sequências

2. Implicações metodológicas

Dados experimentais

ACTAAACGTCAATGCATGAATGTAACGC

• Comparações de sequências obtidas experimentalmente devem ser feitas entre bases cujas posições (sítios) coincidem no ancestral comum (homólogas).

• Problema consiste em restabelecer (estimar) a homologia ancestral nos sítios, perturbada pelas mutações de ponto, deleções e inserções.

• Solução consiste em introduzir espaçamentos para que as sequências obtidas experimentalmente tenham o mesmo comprimento.

• Esse procedimento é conhecido como ALINHAMENTO.

Page 17: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

Comparação entre sequências de DNA

1. Processo evolutivo de divergência e

mutação em sequências de DNA

2. Implicações metodológicas do processo de

mutação

3. Princípios metodológicos de comparação de

sequências de DNA

Page 18: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

• Número de possíveis alinhamentos entre

duas sequências de comprimento n,

Comparação de sequências

3. Princípios metodológicos

.2)!()!2( 2

2 nnn n

π≅

Durbin et al. 2007. Biological Sequence Analysis. :18.

Page 19: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

• Alinhamento consiste em introduzir

espaçamentos (gaps) para que as sequências

tenham o mesmo comprimento.

• Espaçamentos são hipóteses sobre a

homologia dos sítios.

• Para duas ou mais sequências são possíveis

diversos alinhamentos diferentes, sendo

necessária uma pontuação (score) para cada

um dos alinhamentos.

Comparação de sequências

3. Princípios metodológicos

Page 20: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

Comparação de sequências

3. Princípios metodológicos

• Pontuação é uma função do número de posições

com bases idênticas, bases diferentes e

espaçamentos.

• Espaçamentos são penalizados de uma forma geral

como,

g → penalidade pela abertura de cada espaçamento.

e → penalidade pela extensão do espaçamento.

l → comprimento do espaçamento.

)1( −+ leg

Page 21: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

ACTAAACGTCAATGC ATGAATGTAACGC

ACTGAACGTAACGC

Processo evolutivo

ACTAAACGTCAATGCA−TGAATGT−AACGC

Alinhamento verdadeiro

Exemplo: Cálculo do alinhamento de duas sequências de DNA

Comparação de sequências

3. Princípios metodológicos

Page 22: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

• Cálculo da pontuação do alinhamento

Cada coluna no alinhamento receberá um certo

valor dependendo do conteúdo.

Colunas iguais = 1; colunas diferentes = ‒1;

espaçamentos = ‒2.

A pontuação total do alinhamento será a soma

dos valores dados a cada uma das colunas.

Comparação de sequências

3. Princípios metodológicos

Page 23: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

ACTAAACGTCAATGCA−TGAATGT−AACGC

Alinhamento verdadeiro

• Pontuação do alinhamento verdadeiro

10 × 1 + 3 × (‒1) + 2 × (‒2) = 3.

Comparação de sequências

3. Princípios metodológicos

Page 24: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

ACTAAACGTCAATGCA−TGAATGT−AACGC

Alinhamento verdadeiro

• Pontuação do alinhamento alternativo 1

9 × 1 + 4 × (‒1) + 2 × (‒2) = 1.

Comparação de sequências

3. Princípios metodológicos

ACTAAACGTCAATGCAT−GAATGT−AACGC

Alinhamento alternativo 1

Page 25: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

ACTAAACGTCAATGCA−TGAATGT−AACGC

Alinhamento verdadeiro

• Pontuação do alinhamento alternativo 2

8 × 1 + 5 × (‒1) + 2 × (‒2) = ‒1.

Comparação de sequências

3. Princípios metodológicos

ACTAAACGTCAATGCATGA−ATGTA−ACGC

Alinhamento alternativo 2

Page 26: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

Comparação de sequências

3. Princípios metodológicos

ACTAAACGTCAATGCA−TGAATGT−AACGC

Alinhamento verdadeiro

ACTAAACGTCAATGCATGA−ATGTA−ACGC

Alinhamento alternativo 2

ACTAAACGTCAATGCAT−GAATGT−AACGC

Alinhamento alternativo 1

Pontuação = 3

Pontuação = 1

Pontuação = −1

Page 27: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

Comparação de sequências

3. Princípios metodológicos

ACTAAACGTCAATGCA−TGAATGT−AACGC

Alinhamento verdadeiro Pontuação = 3

Alinhamento ótimo

Page 28: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

• Alinhamento de múltiplas sequências

Método de alinhamento progressivo

1. Alinhar cada par de sequências e usar a pontuação

ótima para calcular distâncias (ou semelhanças) entre

pares de sequências.

2. Construir uma árvore-guia usando as distâncias (ou

semelhanças) entre os pares de sequências.

3. Gerar um alinhamento múltiplo baseado no grau de

semelhança entre as sequências definido pela árvore-

guia.

Comparação de sequências

3. Princípios metodológicos

Page 29: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

• Alinhamento de múltiplas sequências

Método de alinhamento progressivo

1. Alinhamento de sequências par a par. Alinhar

todos os possíveis pares de sequências e usar a

pontuação ótima para cada par para calcular distâncias

(ou semelhanças) entre pares de sequências.

Comparação de sequências

3. Princípios metodológicos

A

B

C

A B C

0,87

0,59 0,69

Page 30: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

2. Geração da árvore-guia. Usar as distâncias

(semelhanças) entre pares de sequências para gerar

uma árvore-guia.

Comparação de sequências

3. Princípios metodológicos

A

B

C

A B C

0,87

0,59 0,69

A

B

C

0,87

0,69Árvore-guia

Page 31: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

3. Alinhamento múltiplo baseado na árvore-guia.

Alinhar as sequências progressivamente baseado na

ordem definida pela árvore-guia.

Comparação de sequências

3. Princípios metodológicos

A

B

CÁrvore-guia

• Alinhar sequências A e B primeiro.

• Alinhar sequência C ao alinhamento

das sequências A e B.

Page 32: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

Comparação de sequências

3. Princípios metodológicos

Pássaro

Lemur

Chimpanzé

Humano

Cão

Gato

Vaca

Porco

Alinhamento de sequências de DNA

Page 33: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

Mutações de deleção e inserção alteram o comprimento das sequências de DNA e perturbam as posições

relativas dos nucleotídeos (homologia)

Problema consiste em restabelecer as posições relativas das sequências de DNA

Solução consiste em introduzir espaçamentos para que as sequências tenham o mesmo comprimento

ALINHAMENTO

Page 34: Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1. Processo evolutivo de divergência e mutação em ... Alinhamento múltiplo baseado

Comparação entre sequências de DNA

1. Processo evolutivo de divergência e

mutação em sequências de DNA

2. Implicações metodológicas do processo de

mutação

3. Princípios metodológicos de comparação de

sequências de DNA