polimorfismos de nucleotídeos únicos em espécies poliplóides

81
Polimorfismos de nucleotídeos únicos em espécies poliplóides Ramon Oliveira Vidal Email: [email protected] Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador: Gonçalo A.G. Pereira LGE - Laboratório de Genômica e Expressão @ramonvidal

Upload: dallon

Post on 23-Feb-2016

19 views

Category:

Documents


0 download

DESCRIPTION

Polimorfismos de nucleotídeos únicos em espécies poliplóides. LGE - Laboratório de Genômica e Expressão. Ramon Oliveira Vidal Email: [email protected] Doutorando em Genética e Biologia Molecular Sub área : Bioinformática Orientador : Gonçalo A.G. Pereira . @ ramonvidal. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Polimorfismos de nucleotídeos únicos em

espécies poliplóidesRamon Oliveira Vidal

Email: [email protected] em Genética e Biologia Molecular

Sub área: BioinformáticaOrientador: Gonçalo A.G. Pereira LG

E - L

abor

atór

io d

e G

enôm

ica

e E

xpre

ssão

@ramonvidal

Page 2: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Marcadores Moleculares◦ Marcadores por Hibridação◦ Marcadores por Amplificação

Polimorfismos X mutações SNPs

◦ Origem◦ Aplicações◦ Haplótipos◦ Genotipagem◦ Identificando os SNPs (em genomas e transcriptomas)

Sanger 454 Solexa

Taxa de evolução Identificação de SNPs em Coffea arabica

Tópicos da Apresentação

Page 3: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Fenótipo Propriedades observáveis de um indivíduo, que

se desenvolveram sob a influência de: genótipo do indivíduo fatores ambientais

Fenótipo e Genótipo

Genótipo Constituição genética de um organismo

como revelada pela análise genética e molecular, ou seja, o conjunto completo de genes, tanto dominantes e recessivos.

Page 4: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Qualquer característica morfológica ou molecular que diferencia indivíduos, e que seja facilmente detectável

Marcadores

Page 5: Polimorfismos de nucleotídeos únicos em espécies poliplóides

É um fenótipo de fácil identificação, normalmente determinado por um único alelo.

Características fenotípicas de fácil identificação visual são utilizadas como marcadores morfológicos desde os tempos de Mendel

Marcadores Morfológicos

Page 6: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Polimorfismo detectado na seqüência de DNA Vantagens:

- Não é objeto de influências ambientais;- Praticamente ilimitado em número;

Maior desvantagem é a necessidade de técnicas e equipamentos mais complexos.

Marcadores de DNA (moleculares)

Page 7: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Reprodutibilidade; Amplamente distribuído através do genoma;

Poder de discriminação; Ausência de influências ambientais; Barato; Fácil de mensurar

Características Desejáveis aos marcadores moleculares

Page 8: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Diplóide: Constituído por duas cópias (homólogos) de cada cromossomo.

Alelo: As formas alternativas de um caráter genético encontrado em um determinado locus de um cromossomo.

Homozigotos: Um organismo diplóide com alelos idênticos de um determinado gene em ambos os cromossomos homólogos.

Heterozigotos :Um organismo diplóide com alelos diferentes de um determinado gene em ambos os cromossomos homólogos.

Alguns conceitos básicos

Page 9: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Diplóide

Haplóide

Alelos

homozigoze

heterozigoze

Page 10: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Hibridação◦ RFLP – (Restriction Fragment Length Polymorphism)◦ Minissatélites – VNTR –(Variable Number of Tandem

Repeats)

Amplificação de DNA◦ RAPD – (Random Amplified Polymorphic DNA)◦ SCAR (Sequence Characterized Amplified Regions)

ou ASA (Amplified Specific Amplicon)◦ Microssatélites –SSR (Simple Sequence Repeats)◦ AFLP (Amplified Fragment Length Polymorphism)

Tipos de marcadores

Page 11: Polimorfismos de nucleotídeos únicos em espécies poliplóides

RFLP – Restriction Fragment Length Polymorphism

Page 12: Polimorfismos de nucleotídeos únicos em espécies poliplóides

RFLP – Restriction Fragment Length Polymorphism

Page 13: Polimorfismos de nucleotídeos únicos em espécies poliplóides

RAPD - Random Amplified Polymorphic DNA

Polimorfismo de DNA entre indivíduos pode ser devido a:• Ausência do sítio do

primer.• Surgimento de um novo

sítio.• Ao comprimento da

região amplificada entre sítios de primer

Page 14: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Significa Seqüências Simples Repetidas, a qual consiste de pequenas seqüências de nucleotídeos (1 a 4) repetidas em tandem.

Essas seqüências são distribuídas ao acaso no genoma e é um dos marcadores mais utilizados atualmente

Microssatélites – SSR (Simple Sequence Repeats)

Page 15: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Primers específicos (20 a 30 pb). Diferentes números de elementos simples

repetidos. Cada segmento amplificado de tamanho

diferente representa um alelo diferente do mesmo loco

Microssatélites – SSR (Simple Sequence Repeats)

Page 16: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Genótipos na eletroforese

Page 17: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Mutações genéticas◦ Alteração na seqüência de nucleotídeos de uma molécula de

DNA. ◦ O termo "mutação“ é geralmente usado para referir-se a

alterações na seqüência de DNA que não estão presentes na maioria dos indivíduos de uma espécie

Polimorfismos genéticos◦ Diferença na seqüência de DNA entre indivíduos, grupos ou

populações. ◦ Incluem SNPs, seqüências repetitivas, inserções, deleções e

recombinações. Podem dar origem a olhos ou olhos castanhos, cabelo liso ou cabelos

crespo◦ Resultado de processos naturais ou induzidos por agentes

externos (como vírus ou radiação).

Polimorfismos genéticos X Mutações genéticas

Page 18: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Polimorfismos genéticos X Mutações genéticas

Polimorfismos são alterações no DNA que se mantém nas gerações futuras◦ Polimorfismo: variação >1%◦ Mutação: variação <1%

C T T A G C T T

C T T A G T T T

Polimorfismo

C T T A G C T T

C T T A G T T T

Mutação

94%

6%

99.9%

0.1%

Page 19: Polimorfismos de nucleotídeos únicos em espécies poliplóides

TAAAAAT

TAACAAT

TAAAAAT TAAAAAT TAACAAT TAACAAT TAACAAT

TAAAAAT TAACAAT

TAAAAAT

• Polimorfismos foram mutações que se propagaram ao longo de gerações

Polimorfismos genéticos X Mutações genéticas

Page 20: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Single Nucleotide Polymorphism, ou SNP ("snip"):

◦ pequena mudança, ou variação, que pode ocorrer em um único nucleotídeo numa sequência de DNA em uma porção significativa (mais de 1%) de uma população.

SNPs

Page 21: Polimorfismos de nucleotídeos únicos em espécies poliplóides

SNPs são as mais frequêntes formas de variações genéticas◦90% das variações genéticas humanas vêm dos SNPs

SNPs tem se tornado marcadores de preferência pela sua grande abundância e pelo desenvolvimento de tecnologias de genotipagem em larga escala.

Single Nucleotide Polymorphism

Page 22: Polimorfismos de nucleotídeos únicos em espécies poliplóides

SNPs em menor quantidade em genes do que em regiões não-codificantes

Menor quantidade de SNPs nos cromossomos sexuais (humano). Dentro de um único cromossomo, SNPs podem se concentrar em

uma região específica, geralmente implicando uma região de interesse ou de pesquisa.

Em média, ocorrem a cada 300~600 nucleotídeos (humano). Genes com maior pressão para modificação tem maior frequência

de SNP (resistência, adaptação, interação parasita-hospedeiro, etc)

Distribuição dos SNPs

Page 23: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Intra espécie◦Diversidade entre os indivíduos de uma

mesma espécie◦Reflete os SNPs entre os alelos (espécies

diplóides) Inter espécies

◦Diversidade entre espécies diferentes

SNPs intra/inter específicos

Page 24: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Não-codificantes Codificantes

Sinônimas Não-sinônimas

conservativas Não-conservativas

Classificação dos SNPTransições

Purina<->PurinaPirimidina<->Pirimidina

TransversõesPurina<->Pirimidina

Page 25: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Genotipagem ◦ Detecção de genótipos de individuos. ◦ Pode ser realizada observando os SNPs.

Haplótipo (genótipo haplóide) ◦ Alelo encontrado em um único cromossomo que

apresenta o mesmo padrão de SNPs. ◦ Blocos haplótipos e tendem a ser herdados

juntos.◦ Podem servir como marcadores de doença

genética. ◦ A análise de haplótipos é útil na identificação

de eventos de recombinação.

Page 26: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Blocos de haplótipos Dentro de um bloco haplótipo, acontece

pouca ou nenhuma recombinação Os SNPs dentro de um bloco haplótipo são

passados juntos nas gerações futuras

Page 27: Polimorfismos de nucleotídeos únicos em espécies poliplóides

haplótipos Um haplótipo é um conjunto de SNP no

mesmo cromossomo

SNP1 SNP2 SNP3

-A C T T A G C T T-

-A A T T T G C T C-

-A C T T T G C T C-

Haplotype 2

Haplotype 3

C A T

A T C

C T CHaplotype 1

SNP1 SNP2 SNP3

Page 28: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Zonas de recombinação e Blocos de haplótipos

Recombinationhotspots

Chromosome

Haplotypeblocks

C1 C2 C1S1

S2

S3

S4

S5

S1

S2

S3

S4

S5

SNP loci

Haplotype patterns : Major allele

: Minor allele

SNP loci

C2

I1 I2

Page 29: Polimorfismos de nucleotídeos únicos em espécies poliplóides

SNPs estão relacionados com a diversidade de genótipos de humanos◦ podem ser mapeados relacionando-os a

diversidade de fenótipos. Um SNP individual ou um bloco haplótipo

pode servir de indicação para◦ características agronômicas◦ doenças◦ etc

Essa relação constitui a base e a motivação para a identificação e genotipagem de SNPs.

Blocos de Haplótipos

Page 30: Polimorfismos de nucleotídeos únicos em espécies poliplóides

O genoma de cada indivíduo contém distintos padrões de SNPs

Pessoas podem ser agrupadas de acordo com esse perfil

Perfil de SNPs são importantes na identificação de respostas a terapias◦ Existe uma correlação entre certos perfis de

SNPs e respostas específicas a tratamentos

Genotipagem e utilizando SNPs como marcadores

Page 31: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Genoma/transcriptoma◦Sanger◦454◦Solexa/Solid/...

Alinhamento de sequências Identificação de Discrepâncias

Identificação de SNPs através da análise de sequencias

Page 32: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Encontrando SNPs: Mineração de SNPs baseados no sequenciamento

(Sanger tradicional)

Sequenciamento De DNA

mRNA

cDNALibrary

ESTOverlap

Genomic

BACLibrary

RRSLibrary

BACOverlap

ShotgunOverlap

Page 33: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Fragment DNA

DNA from multiple individuals

Sequence and Reassemble (known sequence) Assembly with other overlapping

GTTACGCCAATACAGGATCCAGGAGATTACCGTTACGCCAATACAGCATCCAGGAGATTACC

mismatches = SNPs

Encontrando SNPs: Mineração de SNPs baseados no sequenciamento

Page 34: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Base-calling Contig assembly

Sequence viewingPolymorphism tagging

Relatório de polimorfismosGenotipagem individual

Polymorphism detection

PolyPhred

Consed

Analysis

Sequenciamento Phred PhrapAmplificação do DNA5’ 3’

Vários indivíduos

Page 35: Polimorfismos de nucleotídeos únicos em espécies poliplóides

SNP Discovery - Sanger sequencing (EST)

Page 36: Polimorfismos de nucleotídeos únicos em espécies poliplóides

SNP Discovery - Diploids (heterozygous loci)

Page 37: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Sequenciamentos de Nova geração para a

identificação de SNPs

Page 38: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Método Sanger foi o único utilizado por 30 anos

Sanger processa em paralelo 96 sequencias enquanto NGS processa milhões de sequencias a um custo 6X menor.

Problemas:◦ Fidelidade dos dados◦ Tamanho dos reads◦ Custo da infraestrutura◦ Manipular grandes volumes de dados

Sanger vs NGS

Page 39: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Problemas do tamanho da sequência

Sequencias curtas não mapeiam unicamente em um lugar no genoma.

Solução #1: Reads longos. Solução #2: Reads pareados.

ACTTAAGGCTGACTAGC TCGTACCGATATGCTG

Page 40: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Sequenciamentos de Nova Geração

Page 41: Polimorfismos de nucleotídeos únicos em espécies poliplóides
Page 42: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Necessário ter uma montagem de referência Mapeamento dos reads na referencia Coberturas médias necessárias:

◦ Solexa - 100X, 454 - 10X Análise estatística para validar discrepâncias com base na

redundância dos dados Muitos Softwares disponíveis Desenvolvimento de algorítmos para aumentar velocidade

de processamento

Ferramentas para descoberta de SNPs em reads curtos

Page 43: Polimorfismos de nucleotídeos únicos em espécies poliplóides

http://seqanswers.com/wiki/Special:BrowseData

Page 44: Polimorfismos de nucleotídeos únicos em espécies poliplóides

SNP Discovery: Goal

sequencing errors SNP

Page 45: Polimorfismos de nucleotídeos únicos em espécies poliplóides
Page 46: Polimorfismos de nucleotídeos únicos em espécies poliplóides
Page 47: Polimorfismos de nucleotídeos únicos em espécies poliplóides

SNP Discovery

AACGTTAGCATAAACGTTAGCATAAACGTTAGCATA

strain 1

strain 2

strain 3

haploid

individual 1

individual 3

individual 2

diploid

AACGTTCGCATAAACGTTCGCATA

AACGTTAGCATAAACGTTAGCATAAACGTTAGCATA

AACGTTAGCATAAACGTTAGCATAAACGTTCGCATAAACGTTCGCATA

AACGTTCGCATAAACGTTCGCATAAACGTTCGCATAAACGTTCGCATA

AACGTTAGCATAAACGTTAGCATA

Page 48: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Para inferir uma taxa de evolução a um gene são estimados o KA e o KS

KA - é a relação entre substituições não sinônimas e todos os possíveis sitios não sinônimos

KS – é a relação entre substituições sinônimas e todos os possíveis sítios sinônimos

Taxa de Evolução – kaks ou dn/ds

Page 49: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Exemplo:

Prolina:◦CCT◦CCA◦CCG◦CCC

Um sítio sinônimo e dois não sinônimos

Page 50: Polimorfismos de nucleotídeos únicos em espécies poliplóides

A taxa KA/KS é uma medida clássica da evolução de maneira global num gene

KA/KS << 1 indica que uma substancial proporção de mudanças de aminoácidos devem ter sido eliminadas por seleção de purificação.

KA/KS > 1 indica seleção adaptativa ou positiva

KA/KS (dn/ds)

Page 51: Polimorfismos de nucleotídeos únicos em espécies poliplóides

NG: Nei, M. and Gojobori, T. (1986) - Faster LWL: Li, W.H., et al. (1985) LPB: Li, W.H. (1993) and Pamilo, P. and

Bianchi, N.O. (1993) MLWL (Modified LWL), MLPB (Modified LPB):

Tzeng, Y.H., et al. (2004) YN: Yang, Z. and Nielsen, R. (2000) MYN (Modified YN): Zhang, Z., et al. (2006) GY: Goldman, N. and Yang, Z. (1994) MS (Model Selection), MA (Model Averaging)

KaKs_calculator - Métodos

Page 52: Polimorfismos de nucleotídeos únicos em espécies poliplóides

A taxa de KAKS em humanos e chimpanzes é de 0,23.

Assumindo que mutações sinônimas são neutras, esse resultado implica que 77% das alterações de aminoácidos em genes hominideos são suficientemente deletérias e são eliminadas por seleção natural. Como mutações sinônimas não são totalmente neutras, a proporção de alterações de aminoácido neutras com consequências deletérias deve ser maior

Page 53: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Identificação de SNPs e haplótipos na poliplóide Coffea arábica

Page 54: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Objetivos principais Identificar e caracterizar SNPs em

sequências de EST Identificar os haplótipos com base nos

padrões de SNPs Identificar kaks

Foram utilizados dados de duas espécies de café:◦ Coffea arabica,◦ Coffea canephora

Page 55: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Coffea canephora Espécie diplóide Polinização cruzada: Alógama. Alta variabilidade C. canephora é melhor adaptada ao clima

equatorial úmido e quente Cultivada em baixas e médias altitudes Qualidade de bebida inferior Mais resistente a diversas condições do

que Coffea arabica, em particular a doenças e pragas.

Page 56: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Coffea arabica Allopoliploide (tetraplóide) Autógama Baixa variabilidade Originada de um cruzamento recente

(1mya) entre Coffea eugenoides e Coffea canephora

Espécie mais cultivada. Ocupa 75% das plantações mundiais de café.

Qualidade da bebida excelente.

Page 57: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Poliploidia

Page 58: Polimorfismos de nucleotídeos únicos em espécies poliplóides

SoftwaresCAP3 para montagem dos ESTQualitySNP KaKs_calculatorScripts PERL

Page 59: Polimorfismos de nucleotídeos únicos em espécies poliplóides

A montagem 95% similaridade por 100bp

◦Previnir agrupamento de parálogos Remover clusters com menos de 4 ESTs

Remover clusters com mais de 500 ESTs◦Evitar contigs mal formados

Page 60: Polimorfismos de nucleotídeos únicos em espécies poliplóides

QualitySNP Analisar informações do CAP3 (Arquivo ACE) Detecção de SNPs

◦ Filtros◦ Reconstrução de haplótipos

Detecção de polimorfismos sinônimos e não sinônimos com o FASTY

Construir Banco de dados com os dados gerados.

Page 61: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Filtro 1 – Detectar SNPs potenciais Detecta todos os SNPs bi, tri e tetra

alélicos Cada alelo é representado com mais de

uma sequencia. ◦ Excluindo SNPs singlets

Classificação dos SNPs como intra ou inter espécies

Page 62: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Filtro 2 – Reconstrução dos haplótipos Agrupa sequências que representam um

mesmo alelo Tem os mesmos nucleotídeos nos sítios

polimorficos. Utiliza métodos matemáticos para

minimizar falsas reconstruções de haplótipos

Exclui haplótipos formados por apenas uma sequencia

Page 63: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Filtro 3 – Busca SNPs com alto score de confiabildade É calculado de acordo com a ocorrencia do

SNP em cada alelo com relação às regiões de alta e baixa qualidade

O score de confiabilidade é o menor valor Descartados valores abaixo de 2

Page 64: Polimorfismos de nucleotídeos únicos em espécies poliplóides
Page 65: Polimorfismos de nucleotídeos únicos em espécies poliplóides
Page 66: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Identificação de SNPs não-sinônimos Fasty

◦ Produz menores alinhamentos em sequencias de baixa qualidade

Detecção da ORF Correção de frameshifts Detecção de sSNP/nsSNP e SNPs ou INDELs

em regiões UTR Kaks Calculator

Page 67: Polimorfismos de nucleotídeos únicos em espécies poliplóides

The database

Page 68: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Identificação dos ancestrais haplótipos Padrões diferentes de expressão dos

homeologos Contribuição de cada ancestral de arabica

no transcriptoma relacionando ao fenótipo Genes com maior pressão seletiva para

mudança Genes com maior pressão seletiva para

estabilização Artigo submetido e em revisão

Resultados

Page 69: Polimorfismos de nucleotídeos únicos em espécies poliplóides

LGE - BioinformáticaGenômica, Transcriptômica, Biologia Sintética,

Biologia de Sistemashttp://www.lge.ibi.unicamp.br

Page 70: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Projetos

Page 71: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Projetos

Page 72: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Projetos

Page 73: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Projetos

Page 74: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Projetos

Page 75: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Projetos

Page 76: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Projetos

Page 77: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Projetos

Page 78: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Projetos

Page 79: Polimorfismos de nucleotídeos únicos em espécies poliplóides

Projetos

Page 80: Polimorfismos de nucleotídeos únicos em espécies poliplóides

O LGE

Page 81: Polimorfismos de nucleotídeos únicos em espécies poliplóides