montagem e análise de genomas janaina o. melo universidade federal de viÇosa bio 796 –...
TRANSCRIPT
Montagem e análise de genomas
Janaina O. Melo
UNIVERSIDADE FEDERAL DE VIÇOSABIO 796 – Bioinformática
Sequenciamento de genomas Genoma: conjunto de toda informação
hereditária de um organismo codificada no DNA (ou RNA, em alguns vírus). Inclui tanto genes como seqüências não codificantes
Sequenciamento de genomas:• geralmente feito utilizando a estratégia de shotgun• Montagem “in silico’’ das seqüências• Identificação de genes, ORFs, análises filogenéticas,
etc Construção de bibliotecas genômicas:
• Vetores que propagam grandes insertos, como BACs, por exemplo
• Esses insertos precisam ser fragmentados, pois os métodos de sequenciamento geram leituras de aproximadamente 500-800 pb.
Nova fragmentação
Fragmentação
Cosmídeo, BAC, plasmídeo, etc.
Inserção em vetores de alta capacidade
plasmídeo
C A A T T G G G
Clonagem em plasmídeos e sequenciamento
actgactgactgactgactgactactgactgactgactgactgactactgactgactgactgactgactgactgactactgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgact actgactgactgactgactgactMontagem dos contigs
genoma
Montagem de “contigs” de seqüências (clusters) :
Cluster 1
Cluster 3
Cluster 2
Estratégias de bioinformática para montagem (assembly) dos contigs
VNTI ContigExpress (http://www.invitrogen.com/content.cfm?pageid=10209)
TIGR
DNAMAN
SeqMan
CAP3 - Web Contig Assembly Program
(http://pbil.univ-lyon1.fr/cap3.php)
Phred/Phrap/Consed
CAP3 - Web Contig Assembly Program
Copiar as seqüências em formato fasta para o
programa CAP3
CAP3: visualizar os contigs e as seqüências
únicas, ver detalhes dos contigs e obter suas
seqüências
Pode-se fazer uma busca no banco de dados
utilizando o BLAST
Phred/Phrap/Consed
Pacote de programas para:
• Leitura de cromatogramas
• Atribuição de qualidade a cada base
• Mascaramento de vetores
• Montagem de seqüências
• Visualização e edição dos contigs
Phred:
Programa que lê os arquivos dos
cromatogramas, atribui uma base a cada pico e
valores de qualidade às bases. A qualidade
Phred corresponde a um inteiro entre 0 e 99 e
está associada à probabilidade de erro de
leitura. Uma base com qualidade 40 indica que
o erro é 10-4, ou seja 1 erro a cada 10.000
bases. Desse modo, quanto maior o Phred
maior a qualidade do sequenciamento.
Phrap:
É um programa para montagem das seqüências. • Gera várias informações sobre os contigs,
contidas em path/edit_dir: phrap.out, *.ace and *.screen.contigs.qual files
• Uma quantidade enorme de seqüências podem ser manipuladas
• Gera dados importantes e permite a visualização gráfica por outros programas.
Consed:
Programa para visualização e edição dos
alinhamentos produzidos pelo Phrap.
Abrir o consed
Abrir os contigs
Pesquisar seqüências específicas
Selecionar um contig (não há diferença entre letras maiúsculas e minúsculas
na busca)
Menu Navigate:
Regiões de baixa qualidade
Discrepância na qualidade das seqüências
Regiões cobertas por somente uma fita
Pesquisa por ORFs
Percorrer o alinhamento
Regiões de baixa qualidade
Busca por ORFs
Menu Misc: Tradução da seqüência consenso em aminoácidos
Qualidade de uma base
Verificação da qualidade da base
Qualidade Cor/significado
0 – 4 Cinza escuro
5 – 9 Cinza
10 – 14 Cinza claro
... ...
40 – 97 Branco
99 O usuário editou a base e a caracterizou com certeza absoluta
98 O usuário editou a base, mas não a caracterizou com certeza
absoluta
Visualizar o cromatograma e editar as bases
Obter informação do contig
Busca de ORFs na sequência
ORF Finder: http://bioinformatics.org/sms/orf_find.html
GENSCAN:http://genes.mit.edu/GENSCAN.html
Obrigada!