montagem e análise de genomas janaina o. melo universidade federal de viÇosa bio 796 –...

31
Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Upload: internet

Post on 17-Apr-2015

104 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Montagem e análise de genomas

Janaina O. Melo

UNIVERSIDADE FEDERAL DE VIÇOSABIO 796 – Bioinformática

Page 2: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Sequenciamento de genomas Genoma: conjunto de toda informação

hereditária de um organismo codificada no DNA (ou RNA, em alguns vírus). Inclui tanto genes como seqüências não codificantes

Sequenciamento de genomas:• geralmente feito utilizando a estratégia de shotgun• Montagem “in silico’’ das seqüências• Identificação de genes, ORFs, análises filogenéticas,

etc Construção de bibliotecas genômicas:

• Vetores que propagam grandes insertos, como BACs, por exemplo

• Esses insertos precisam ser fragmentados, pois os métodos de sequenciamento geram leituras de aproximadamente 500-800 pb.

Page 3: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Nova fragmentação

Fragmentação

Cosmídeo, BAC, plasmídeo, etc.

Inserção em vetores de alta capacidade

plasmídeo

C A A T T G G G

Clonagem em plasmídeos e sequenciamento

actgactgactgactgactgactactgactgactgactgactgactactgactgactgactgactgactgactgactactgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgactMontagem dos contigs

genoma

Page 4: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Montagem de “contigs” de seqüências (clusters) :

Cluster 1

Cluster 3

Cluster 2

Page 5: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Estratégias de bioinformática para montagem (assembly) dos contigs

VNTI ContigExpress (http://www.invitrogen.com/content.cfm?pageid=10209)

TIGR

DNAMAN

SeqMan

CAP3 - Web Contig Assembly Program

(http://pbil.univ-lyon1.fr/cap3.php)

Phred/Phrap/Consed

Page 6: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

CAP3 - Web Contig Assembly Program

Copiar as seqüências em formato fasta para o

programa CAP3

CAP3: visualizar os contigs e as seqüências

únicas, ver detalhes dos contigs e obter suas

seqüências

Pode-se fazer uma busca no banco de dados

utilizando o BLAST

Page 7: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Phred/Phrap/Consed

Pacote de programas para:

• Leitura de cromatogramas

• Atribuição de qualidade a cada base

• Mascaramento de vetores

• Montagem de seqüências

• Visualização e edição dos contigs

Page 8: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Phred:

Programa que lê os arquivos dos

cromatogramas, atribui uma base a cada pico e

valores de qualidade às bases. A qualidade

Phred corresponde a um inteiro entre 0 e 99 e

está associada à probabilidade de erro de

leitura. Uma base com qualidade 40 indica que

o erro é 10-4, ou seja 1 erro a cada 10.000

bases. Desse modo, quanto maior o Phred

maior a qualidade do sequenciamento.

Page 9: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Phrap:

É um programa para montagem das seqüências. • Gera várias informações sobre os contigs,

contidas em path/edit_dir: phrap.out, *.ace and *.screen.contigs.qual files

• Uma quantidade enorme de seqüências podem ser manipuladas

• Gera dados importantes e permite a visualização gráfica por outros programas.

Page 10: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Consed:

Programa para visualização e edição dos

alinhamentos produzidos pelo Phrap.

Page 11: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática
Page 12: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática
Page 13: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática
Page 14: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Abrir o consed

Page 15: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Abrir os contigs

Page 16: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática
Page 17: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática
Page 18: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Pesquisar seqüências específicas

Page 19: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Selecionar um contig (não há diferença entre letras maiúsculas e minúsculas

na busca)

Page 20: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Menu Navigate:

Regiões de baixa qualidade

Discrepância na qualidade das seqüências

Regiões cobertas por somente uma fita

Pesquisa por ORFs

Page 21: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Percorrer o alinhamento

Page 22: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Regiões de baixa qualidade

Page 23: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Busca por ORFs

Page 24: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Menu Misc: Tradução da seqüência consenso em aminoácidos

Page 25: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Qualidade de uma base

Page 26: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática
Page 27: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Verificação da qualidade da base

Qualidade Cor/significado

0 – 4 Cinza escuro

5 – 9 Cinza

10 – 14 Cinza claro

... ...

40 – 97 Branco

99 O usuário editou a base e a caracterizou com certeza absoluta

98 O usuário editou a base, mas não a caracterizou com certeza

absoluta

Page 28: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Visualizar o cromatograma e editar as bases

Page 29: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Obter informação do contig

Page 30: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Busca de ORFs na sequência

ORF Finder: http://bioinformatics.org/sms/orf_find.html

GENSCAN:http://genes.mit.edu/GENSCAN.html

Page 31: Montagem e análise de genomas Janaina O. Melo UNIVERSIDADE FEDERAL DE VIÇOSA BIO 796 – Bioinformática

Obrigada!