anotação de genomas e metabolismo secundáriogenomics.fcav.unesp.br/aulas2017/aula_05.pdf ·...
TRANSCRIPT
Anotação de Genomas e Metabolismo Secundário
Danillo Oliveira de Alvarenga
Departamento de TecnologiaUniversidade Estadual Paulista
Jaboticabal-SP
Metabolismo
● Reações químicas que ocorrem em organismos vivos
– anabolismo: síntese de biomoléculas
– catabolismo: quebra de biomoléculas
● Vias metabólicas
– série de reações em cadeia
– substrato(s) que sofre(m) modifcações
– enzimas que promovem modifcações
Metabolismo Primário
● Metabolismo fundamental
– essencial para o organismo
– função fsiológica
– moléculas estruturais ou regulatórias
Metabólitos Primários
● Biomoléculas mais abundantes
– nucleotídeos e ácidos nucleicos
– aminoácidos e proteínas
– carboidratos
– lipídeos
– outras
● Encontrados em todos os organismos
Metabolismo Secundário
● Metabolismo especializado
– não é essencial para o organismo
– função ecológica
– moléculas bioativas
Metabólitos Secundários
● Estruturas mais simples
– alcaloides: cafeína, nicotina
– terpenoides: limoneno, mentol, caroteno
● Estruturas mais complexas
– peptídeos ribossômicos modifcados pós-traducionalmente: bacteriocinas
– peptídeos não ribossômicos: gramicidina, ciclosporina
– policetídeos: afatoxina, antramicina
● Maior diversidade em bactérias, fungos e plantas
Alcaloides
● Derivados de moléculas nitrogenadas
– aminoácidos
– bases nitrogenadas
– outras
nicotina cafeína
ciclopamina
Terpenoides
● Derivados de isopreno
– hemiterpenos
– monoterpenos
– sesquiterpenos
– diterpenosmentol
isopreno
beta-caroteno geosmina
Peptídeos Ribossômicos Modifcados
● Precursor ribossômico
– um ou mais peptídeos
microviridina
● Enzimas modifcadoras pós-tradução
– ciclização
– desidratação
– alteração da cadeia lateral
Peptídeos Não Ribossômicos
● Peptídeo sintetases não ribossômicas (NRPS)– gastam ATP– aminoácidos proteinogênicos– aminoácidos não proteinogênicos
● Domínios mínimos– adenilação– condensação– carreador de peptidil
● Domínios complementares– metiltransferase– cetorredutase– epimerase
gramicidina
Policetídeos
● Policetídeo sintases– não usam ATP– ácidos carboxilícos
● Domínios mínimos– cetossintase– aciltransferase– carreador de acila
● Domínios complementares– cetorredutase– desidratase– enoil redutase
afatoxina
doxiciclina
Produtos Naturais
● Molécula sintetizada por um organismo vivo
– substância encontrada na natureza
– pode ser obtida por síntese química
● Bioprospecção
– processos industriais
– medicamentos
– cosméticos
– recuperação ecológica
Integração de Muitas Disciplinas
PRODUTOSNATURAIS
BIOQUÍMICA
QUÍMICA ORGÂNICA
QUÍMICAANALÍTICA
ECOLOGIA
FARMACOLOGIA
BIOINFORMÁTICA
GENÔMICA
BIOLOGIAMOLECULAR
● Ecologia
– interações
– ecofsiologia
– ecotoxicologia
● Biossegurança
– toxicologia
– bioterrorismo
Outros Interesses
● Bioquímica
– metabolismo completo
– evolução de vias
– comunicação química
● Genômica
– informação
– caracterização
Vias Metabólicas Codifcadas no Genoma
● Operons– genes controlados pela mesma região promotora– RNA mensageiro policistrônico em procariotos
● Agrupamentos gênicos– genes funcionalmente relacionados em proximidade– envolvidos no mesmo processo– interação entre agrupamentos
● Conservação de agrupamentos– pressão evolutiva– transferência vertical ou horizontal
Motivação de Projetos de Genômica
Penicilina
● Alexander Fleming (1928)
– descoberta e isolamento
● Microbiologia
– Staphylococcus sp.
– Penicillium notatum
– halo de inibição
● Nobel de Medicina (1945)
Penicilina
● Dorothy Hodgkin (1945)
– confrmação da estrutura
● Bioquímica
– cristalografa de raios-X
– contráriou algumas hipóteses
– insulina, vitamina B12
● Nobel de Química (1964)
Penicilina
● Bruno Díez & Juan Martín (1990)
– descrição do agrupamento gênico
● Biologia Molecular
– ligação a cosmídeo
– clonagem em E. coli
– sequenciamento
– expressão heteróloga
PenicilinaO
OHO
OH
NH2
ácido α-aminoadípico cisteína valina
isopenicilina N
penicilina G
+ +
δ (L-α-aminoadipil)-L-cisteinil-D-valina
2
ACV sintetase
isopenicilina N sintase
isopenicilina N N-aciltransferase
Penicilina
pcbAB: δ (L-α-aminoadipil)-L-cisteinil-D-valina sintetase
pcbC: isopenicilina N sintase
penDE: isopenicilina N N-aciltransferase
pcbAB pcbC penDE
peptídeo sintetase não ribossômica
oxidorredutase
aciltransferase
Actinobactérias
● Bactérias gram-positivas de alto GC
– metabólitos secundários
– geosmina
● Modos de vida
– livre
– simbiose
● Distribuição
– solos
– rizosfera
– ambientes marinhos
– ambientes áridos
● Metabólitos secundários
– ≃42% dos 30.000 conhecidos
● Principal fonte de antibióticos
– 45-55% dos 10.000 conhecidos
– Streptomyces spp.
● Bioatividade
– antibiótica
– antitumoral
– imunomodulatória
Metabólitos Secundários Actinobacterianos
● Genômica
– 17 anos depois do primeiro genoma
– 12.670 genomas actinobacterianos
– 800 completos
● Streptomyces spp.
– 985 genomas
– 78 completos
Genomas Actinobacterianos
● Processo praticamente aleatório
– isolamento
– cultivo e fermentação
– geração de extrato bruto
– testes de bioatividade
– caracterização química
Bioprospecção Tradicional
Bachmann et al,, 2014
● Limites para descoberta
– alvos específcos
– ensaios pré-determinados
– atividades conhecidas
– expressão e regulação
– alta concentração
Mineração Genômica
● Descoberta de metabolitos secundários a partir de genomas
– detecção de genes e agrupamentos
– predição e caracterização de candidatos
– orientação de análises químicas posteriores
● Função biológica
– papel fsiológico
– papel em interações
● Bentley et al. (2000)
– Streptomyces coelicolor A3(2)
– mais que o esperado
Bioprospecção Baseada em Genômica
Bachmann et al,, 2014
● Processo direcionado
– isolamento opcional
– caracterização genômica
– busca in silico
– expressão homóloga/heteróloga
– caracterização química
Outras Vantagens
● Evolução– herança
– variação
● Monitoramento
– detecção
– controle
● Síntese
– química– clonagem
● Biossíntese desconhecida para muitas moléculas
● Das moléculas para os genes
– hipóteses biossintéticas a partir da estrutura
– genética da biossíntese
● Biologia da molécula
– evolução
– distribuição
– regulação
Indo na Direção Oposta
Limitações da Genômica
● Grande número de agrupamentos órfãos
– sequências desconhecidas em bancos de dados
– biossíntese desconhecida
– moléculas desconhecidas
● Bancos de dados precisam ser aprimorados
– mais dados de alta qualidade
– melhor anotação e curadoria
● Espécimes cultivados
– linhagens isoladas axenicamente
● Bancos de dados parciais
– viés taxonômico
– viés ecológico
– viés geográfco
Conhecimento Limitado para Vários Grupos
● Quadro incompleto
– alta sub-representação
– maior grau de homogeneidade
– baixa diversidade metabólica
Metagenômica
● Genômica
– um organismo
– linhagem cultivada
– ambiente estranho
– mineração com expressão homóloga ou heteróloga
● Metagenômica
– vários organismos
– não cultivados ou em cocultivo
– genômica ambiental / genômica de comunidades
– mineração com expressão heteróloga
Metagenômica
● Caracterização e comparação de comunidades
– perfl taxonômico
– perfl funcional
● Acessar organismos inacessíveis por métodos tradicionais
– micro-organismos atualmente não cultiváveis
– ≃ 99 % de toda a diversidade bacteriana
– enorme número de genes desconhecidos
– enorme número de vias e metabólitos desconhecidos
Hug et al., 2016
Metagenômica
Metagenômica
Parks et al., 2017
● Alvo
– domínio/reino/flo
– espécies-tipo
– linhagens consagradas
– ambientes e regiões subexplorados
– táxons subexplorados e/ou novos
– tamanho do genoma
● Método
– tradicional ou pós-genômico
– isolados ou amostras mistas
– equipe interdisciplinar
Encontrando Novos Metabólitos Secundários
Anotação
● Identifcação de características biológicas
– regiões codifcantes e não codifcantes
– prováveis produtos
– regiões de repetição
● Métodos
– automático– manual
● Comparações entre sequências
– referências conhecidas
– algoritmos de predição
Anotação
Anotação
● Gene
– região que codifca proteína ou RNA– gene/rRNA/tRNA
– intron/exon– pseudo
● Sequência codifcante
– coding sequence (CDS)– éxons em eucariotos
● Quadro aberto de leitura
– open reading frame (ORF)– ATG → TAA/TAG/TGA
● Detecção de metabólitos secundários
– bancos de dados em expansão
– mais algoritmos
● Predição de agrupamentos– http://www.secondarymetabolites.org/mining/
Avanço nas ferramentas bioinformáticas
BLAST
● Alinhamentos locais
– encontra regiões com similaridade signifcativa
● Qualquer banco de dados que quiser
– NCBI GenBank/WGS
– banco local
● BLAST contra referências de produtos naturais
– agrupamentos de metabólitos já conhecidos
– inspecionar predições automáticas
BLAST
RAST
● Anotação genômica automática
– subsistemas
– SEED: função em um processo ou estrutura biológica
● Predições funcionais
– possibilidades metabólicas do organismo
● Curadoria
– melhor para micro-organismos populares
– pouca informação sobre metabólitos secundários
RAST
RAST
RAST
KEGG
KEGG
NaPDoS
antiSMASH
● Agrupamentos gênicos de metabólitos secundários
– banco de dados curado
– mais de 40 tipos detectados
● Predição algorítmica ou comparativa
– agrupamentos similares a sequências conhecidas
– agrupamentos hipotéticos
● Alguns agrupamentos não são preditos
– nenhum modelo implementado
antiSMASH
MIBiG
● Anotações padronizadas
– agrupamentos gênicos de metabólitos secundários
– produtos desses agrupamentos
● Vias conhecidas
– genética
– bioquímica
● Diversos organismos
– bactérias
– fungos
– plantas
MIBiG
MIBiG
Artemis
● Navegador de anotações genômicas
– visualizar e adicionar informações a arquivos GenBank/EMBL
– rodar BLAST sobre sequências codifcantes
● Curadoria manual
– inspecionar predições automáticas
– predizer agrupamentos gênicos
Artemis
Prática
I. Baixando um genoma
1) Abra a página do NCBI Genome em https://www.ncbi.nlm.nih.gov/genome.
I. Baixando um genoma
2) Visualize os genomas disponíveis por organismo.
I. Baixando um genoma
3) Navegue pelas opções e escolha um genoma.
I. Baixando um genoma
I. Baixando um genoma
4) Visualize o relatório de montagem e anotação dos genomas do táxon.
I. Baixando um genoma
5) Escolha o genoma de uma linhagem do táxon.
I. Baixando um genoma
6) Baixe o arquivo GenBank com o genoma-alvo anotado.
I. Baixando um genoma
7) Descomprima o genoma baixado.
I. Baixando um genoma
8) Renomeie o arquivo com a extensão .gb ou .gbk.
I. Baixando um genoma
II. Predizendo agrupamentos gênicos
1) Abra a página do antiSMASH em http://antismash.secondarymetabolites.org/.
II. Predizendo agrupamentos gênicos
2) Indique o tipo de organismo a ser analisado.
II. Predizendo agrupamentos gênicos
3) Entre o endereço para envio dos resultados.
II. Predizendo agrupamentos gênicos
4) Clique na opção de enviar arquivo.
II. Predizendo agrupamentos gênicos
5) Busque pelo arquivo do genoma no seu computador.
II. Predizendo agrupamentos gênicos
6) Submeta o arquivo à análise e espere pelos resultados.
II. Predizendo agrupamentos gênicos
7) Vá para http://genomics.fcav.unesp.br/Anabaena90/ e encontre os resultados para a análise do genoma da cianobactéria Anabaena sp. 90.
II. Predizendo agrupamentos gênicos
8) Verifque os resultados e diferencie agrupamentos com produtos potencialmente conhecidos e agrupamentos órfãos.
II. Predizendo agrupamentos gênicos
9) Baixe os arquivos GenBank para o agrupamento de interesse.
III. Analisando agrupamentos gênicos
1) Abra o Artemis.
III. Analisando agrupamentos gênicos
2) Selecione a tabela de código genético para bactérias e cloroplastos.
III. Analisando agrupamentos gênicos
3) Abra o arquivo GenBank baixado.
III. Analisando agrupamentos gênicos
4) Olhe a anotação e rode o BLAST em uma CDS.
III. Analisando agrupamentos gênicos
5) Adicione a informação do gene à CDS com base nos resultados de BLAST.
III. Analisando agrupamentos gênicos
6) Salve a anotação.