construção de banco de dados biológico para organismos fixadores de nitrogênio para o...

Post on 07-Apr-2016

219 Views

Category:

Documents

3 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Construção de banco de dados biológico para organismos

fixadores de nitrogênio para o reconhecimento de padrões

Michelly Alves Coutinho Gehlen

Orientadores: Roberto Tadeu Raittz, Dr.Liu Un Rigo, Dra.

Agenda

• Motivação do Trabalho• Fixação de Nitrogênio• Bancos de Dados de Fixadores de Nitrogênio• A Pesquisa

– Objetivos– Metodologia Utilizada– Resultados– Trabalhos em Andamento

• Agradecimentos

Motivação do Trabalho

Motivação do Trabalho

• 2 Questões :

1 – Quais são os organismos fixadores de nitrogênio ?

2 – Onde posso encontrar uma lista / relação com os organismos fixadores ?

Motivação do Trabalho

• Uma possível resposta :

Estudo realizado por Young, em 1992.

YOUNG, J.P.W. Phylogenetic Classification of Nitrogen-Fixing Organisms In: STACEY, G.; BURRIS, R.H.; EVANS, H.J. Biological Nitrogen Fixation. New York, London. Chapman e Holl, 1992. 43-86.

Motivação do Trabalho

• A idéia da criação de um Banco de Dados:

Separação e organização dos dados relacionados aos organismos fixadores de nitrogênio de forma a facilitar a busca e obtenção de informações.

Fixação de Nitrogênio

Fixação de Nitrogênio

• O nitrogênio é um elemento essencial encontrado em proteínas, ácidos nucléicos e outras biomoléculas.

• Com exceção da água, o nitrogênio é geralmente considerado o nutriente mais limitante para o crescimento de plantas no seu ambiente natural (FRANCO e DÖBEREINER, 1994).

Fixação de Nitrogênio

• Porém, mesmo sendo requerido em quantidades significativas pelos seres vivos, na natureza este elemento é encontrado em abundância em uma forma quimicamente muito estável (N2).

• Sua assimilação pela maioria dos seres vivos é limitada, o que requer sua transformação para uma forma que facilite sua absorção.

Fixação de Nitrogênio

• A fixação de nitrogênio é um processo químico ou biológico, no qual o dinitrogênio gasoso (N2) é reduzido à amônia (NH3).

• A síntese química da amônia é utilizada para a produção de fertilizantes nitrogenados para a agricultura.

RAMOS, J. R. L. S. Análises Moleculares Comparativas de Estirpes de Herbaspirillum por PFGE, RAPD, RFLP e Sequenciamento do gene que codifica o 16SrRNA. Universidade Federal do Paraná, 2003. p. 1. Tese de Doutorado.

Fixação de Nitrogênio

• Síntese química do nitrogênio : processo de custo elevado devido a necessidade de condições especiais como pressão de aproximadamente 200 atmosferas e temperaturas variando entre 400 e 600ºC (BOTHE et al., 1983).

Fixação de Nitrogênio

Fixação de Nitrogênio na Terra (adaptado de NEWTON, 1999)

65%Fixação Biológica

25%Produção Industrial

10%*Fenômenos Naturais

* Ação de descargas elétricas, radiação ultravioleta, ação vulcânica entre outros.

Fixação de Nitrogênio

• A fixação biológica de nitrogênio é catalisada pelo complexo enzimático da Nitrogenase, encontrado apenas em organismos procariontes, denominados diazotróficos.

• Organismos diazotróficos são encontrados nos Reinos Archaea e Bactéria, podendo ser simbióticos, de vida livre ou associativos.

POSTGATE, J. R. The fundamentals of nitrogen fixation. Cambridge University Press, 1982. p. 201-241

Fixação de Nitrogênio

• Simbióticos Nódulos Leguminosas– Família Rhizobiaceae

POSTGATE, J. R. The fundamentals of nitrogen fixation. Cambridge University Press, 1982. p. 201-241

• Vida livre Não se associam à plantas Rizosfera– Azotobacter spp– Klebsiella pneumoniae

• Associativos Endofíticos– Azospirillum brasilense– Herbaspirillum seropedicae

Fixação de Nitrogênio

• A nitrogenase é um complexo enzimático composto por 2 metaloproteínas: a proteína ferro (proteína Fe) e a proteína molibdênio-ferro (proteína MoFe) (DEAN et al., 1993).

• A proteína Fe funciona como doadora de elétrons para a proteína MoFe (HAAKER et al., 1984; GEORGIADIS et al.,1992).

• A proteína MoFe se encontra arranjada em dois tipos de centros redox: o centro-P e o cofator ferro-molibdênio ou FeMoco (SMITH e EADY, 1992).

Fixação de Nitrogênio

Complexo da Nitrogenase formado pelas proteínas Fe e MoFe em Azotobacter vinelandii

Fixação de Nitrogênio

• O complexo enzimático da Nitrogenase é altamente regulado e possui em sua composição estrutural um cluster de genes nif.

• Os genes nif possuem seqüências consenso idênticas entre os diazotrofos, porém mesmo com estruturas similares, seu processo regulatório varia entre as diferentes espécies, de acordo com sua hierarquia evolucionária.

Fixação de Nitrogênio

• O complexo enzimático da Nitrogenase é codificado por aproximadamente 20 diferentes genes nif (PEDROSA et al., 2001).

PEDROSA, F. O.; BENELLI, E. M.; YATES, M. G.; WASSEM, R.; MONTEIRO, R. A; KLASSEN, G.; STEFFENS, M. B. R.; SOUZA, E. M.; CHUBATSU, L. S.; RIGO, L. U. Recent developments in the structural organization and regulation of nitrogen fixation genes in Herbaspirillum seropedicae. 2001. Journal of Biotechnology 91 (2-3):189-195.

Fixação de Nitrogênio

TRIPLETT, E. W. Prokaryotic nitrogen fixation – a model system for the analysis of a biological process. (2000) Norfolk, UK: Horizon Scientific Press, 800pp.

Fixação de Nitrogênio

Adaptado por TIEPPO, E., a partir de: http://www.asahi-net.or.jp/~it6i-wtnb/BNF.html

Fixação de Nitrogênio

• Por que estudar?• Grande potencial agrícola.

• Redução do uso de adubos inorgânicos nitrogenados, resultando em economia para o produtor.

• Redução de impactos sobre o meio ambiente.

• Aumento de produtividade, especialmente em solos deficientes em nitrogênio disponível.

CABALLERO, S. U. Fixação biológica de nitrogênio. Extraído de : http://www.agencia.cnptia.embrapa.br/gestor/cana-de-acucar/arvore/CONTAG01_31_711200516717.html

Fixação de Nitrogênio

• Por que estudar?

O interesse na associação de bactérias diazotróficas com gramíneas reforça a importância do processo de fixação biológica de nitrogênio para os sistemas de agricultura sustentável do Brasil. (DÖBEREINER, 1995).

DÖBEREINER J. Biological nitrogen fixation in the tropics: Social and Economic contributions. In International Symposium on Sustainable Agriculture for the Tropics - The Role of Biological Nitrogen Fixation. 1995. p.3-4. Angra dos Reis.

• Pesquisadora brasileira mais referenciada em trabalhos científicos.

• Indicada ao prêmio Nobel de Química em 1997.

Fixação de Nitrogênio

Fixação de Nitrogênio

• Algumas instituições:

Fixação de Nitrogênio

• Algumas instituições:

Fixação de Nitrogênio

• Algumas instituições:

Fixação de Nitrogênio

• Algumas instituições:

Fixação de Nitrogênio

• Algumas instituições:

Bancos de Dados de Fixadores de Nitrogênio

Bancos de Dados de Fixadores de Nitrogênio

• NodMutDB:

Bancos de Dados de Fixadores de Nitrogênio

• NodMutDB:

Bancos de Dados de Fixadores de Nitrogênio

• Rhizobase:

Bancos de Dados de Fixadores de Nitrogênio

• Rhizobase:

Bancos de Dados de Fixadores de Nitrogênio

• Rhizobase:

Bancos de Dados de Fixadores de Nitrogênio

• GenBank:

Bancos de Dados de Fixadores de Nitrogênio

• BD da “Bioinfo”:

A Pesquisa

A Pesquisa

• Objetivo Geral:

• Construção de banco de dados biológico para organismos fixadores de nitrogênio para o reconhecimento de padrões .

A Pesquisa

• Objetivos Específicos:• Extrair, a partir do banco de dados de genomas completos, informações sobre organismos fixadores de nitrogênio.

• Identificar por homologia os organismos com genomas incompletos, portadores dos genes nif depositados nos bancos de dados genômicos mundiais.• Montar filogenia com alguns genes nif selecionados a partir dos genomas incompletos, ancorando-a com a filogenia dos genomas completos estudados.

A Pesquisa

• Objetivos:• Montar tabela de resultados dos genes nif encontrados e seus respectivos organismos, a partir do banco de dados dos genomas completos.

• Através de técnicas de extração de características, tentar buscar por padrões para reconhecimento de organismos fixadores de nitrogênio, através do gene 16SrRNA.

A Pesquisa

• Metodologia Utilizada:• Para a pesquisa por genomas completos:

• Utilização da linguagem SQL para a escrita de scripts de busca de informações, no banco de dados de genomas completos (“Bioinfo”).

• Uso de linguagens de programação, como Python, para a escrita de programas de relacionamento, sumarização e extração de características dos dados coletados.

A Pesquisa

• Metodologia Utilizada:• Para a pesquisa por genomas completos:

• Utilização da rede neuronal EasyFan para treinamento e estudo de modelos.

• Acesso a softwares estatísticos/planilhas de cálculo para análise, sumarização e composição gráfica dos resultados (MS Excel, MatLab).

A Pesquisa

• Metodologia Utilizada:• Para a pesquisa por genomas incompletos:

• Uso da linguagem de programação Python, para a escrita de programas para: busca, download, parsing, relacionamento, sumarização e extração de características dos dados coletados a partir do GenBank.

• Utilização de softwares de bioinformática para a realização de análises filogenéticas (MEGA 4).

• Acesso a softwares estatísticos/planilhas de cálculo para análise, sumarização e composição gráfica dos resultados (MS Excel, MatLab).

Resultados

Resultados

• Genomas Incompletos:

• Parsing e sumarização de informações taxonômicas relacionadas ao gene nifH.

• Genomas Incompletos:

• Download de informações relacionadas aos genes nifH, nifD e nifK, a partir do banco de dados de proteínas do GenBank.

Resultados

• Genomas Incompletos:

Resultados

• Genomas Incompletos:

Gene Cultivados Metagenômica Total GeralnifH 3363 14205 17568nifD 726nifK 315

Organismos Portadores dos Genes

nifH nifD nifKDownload 135 12 10Parsing 35Tuning 1Classificação Taxonômica 3

Tempo em MinutosScriptsTempo de Execução dos Scripts

• Dados atualizados em 22/03/2010.

Resultados

• Genomas Incompletos:Organismos Portadores do Gene nifH

Divisão por Reino

2%

98%

Archaea

Bacteria

Resultados

• Genomas Incompletos:

0100200300400500600700800900

1000110012001300140015001600

Eury

arch

aeot

a

Actin

obac

teria

Aqui

ficae

Chlo

robi

Chlo

rofle

xi

Cyan

obac

teria

Firm

icute

s

Nitro

spira

e

Prot

eoba

cter

ia

Spiro

chae

tes

Verr

ucom

icrob

ia

Archaea Bacteria

Organismos Portadores do Gene nifHDivisão por Filos

Resultados

• Genomas Incompletos:

0

200

400

600

800

1000

1200

Alph

apro

teob

acte

ria

Beta

prot

eoba

cter

ia

Delta

prot

eoba

cter

ia

Epsil

onpr

oteo

bact

eria

Gam

map

rote

obac

teria

Proteobactérias Portadoras do Gene nifH

Resultados

• Genomas Completos:

• Utilização do banco de dados da “Bioinfo” para consulta através de script SQL, para busca de organismos portadores dos genes nifHDK.

Resultados

• Genomas Completos:create table Busca select s.id s_id, s.source, ra.id nifh_id, ra.ini_min nifh_min, ra.fim_max nifh_max, ra.genomas nifh_genoma, rb.id nifd_id, rb.ini_min nifd_min, rb.fim_max nifd_max, rb.genomas nifd_genoma, rc.id nifk_id, rc.ini_min nifk_min, rb.fim_max nifk_max, rb.genomas nifk_genoma

from mi_anotacao a, mi_anotacao b, mi_anotacao c, genbankseg s, regiao ra, regiao rb, regiao rc

Where s.id = ra.genbankseg and s.id = rb.genbankseg and s.id = rc.genbankseg and ra.id = a.regiao and rb.id = b.regiao and rc.id = c.regiao and upper(a.valor) like '%NIFH%' and upper(b.valor) like '%NIFD%' and upper(c.valor) like '%NIFK%';

Resultados

• Genomas Completos:• Acidithiobacillus ferrooxidans ATCC 23270 • Alkaliphilus metalliredigens QYMF • Azoarcus sp. BH72 • Azorhizobium caulinodans ORS 571 • Azotobacter vinelandii DJ • Bradyrhizobium sp. BTAi1 • Bradyrhizobium japonicum USDA 110 • Bradyrhizobium sp. ORS278 • Burkholderia xenovorans LB400 • Candidatus Methanoregula boonei 6A8 • Chlorobium tepidum TLS • Clostridium acetobutylicum ATCC 824 • Clostridium beijerinckii NCIMB 8052 • Clostridium kluyveri DSM 555 • Cupriavidus taiwanensis • Synechococcus sp. JA-3-3Ab • Synechococcus sp. JA-2-3B'a(2-13) • Cyanothece sp. ATCC 51142 • Dehalococcoides ethenogenes 195 • Desulfitobacterium hafniense DCB-2

• Desulfobacterium autotrophicum HRM2 • Desulfotomaculum reducens MI-1 • Desulfovibrio magneticus RS-1 • Desulfovibrio vulgaris str. Hildenborough • Pectobacterium atrosepticum SCRI1043 • Frankia alni ACN14a • Geobacter sulfurreducens PCA • Gluconacetobacter diazotrophicus PAl 5 • Heliobacterium modesticaldum Ice1 • Klebsiella pneumoniae 342 • Mesorhizobium loti MAFF303099 • Methanothermobacter thermautotrophicus

str. Delta ... • Methanococcus maripaludis S2 • Methanosarcina acetivorans C2A • Methylobacterium sp. 4-46 • Methylococcus capsulatus str. Bath • Nostoc punctiforme PCC 73102 (Nostoc

punctiforme A... • Nostoc sp. PCC 7120 • Pelobacter carbinolicus DSM 2380 • Polaromonas naphthalenivorans CJ2

Resultados

• Genomas Completos:• Pseudomonas stutzeri A1501 • Rhizobium etli CFN 42 • Rhizobium etli CIAT 652 • Rhizobium leguminosarum bv. viciae 3841 • Rhizobium sp. NGR234 • Rhodobacter sphaeroides 2.4.1 • Rhodopseudomonas palustris CGA009 • Rhodospirillum centenum SW (Rhodocista centenaria ... • Teredinibacter turnerae T7901 • Thermodesulfovibrio yellowstonii DSM 11347 • uncultured methanogenic archaeon RC-I • Wolinella succinogenes DSM 1740 • Xanthobacter autotrophicus Py2 • Sinorhizobium medicae WSM419 • Sinorhizobium meliloti 1021 • Zymomonas mobilis subsp. mobilis ZM4

56 Organismos

Resultados

• Genomas Completos:

• O caso da Methanosarcina mazei.

• Comprovada fixadora de nitrogênio, porém não possui os genes nifDK.

• Uma nova pesquisa foi realizada para a obtenção dos organismos possuidores do gene nifH, acompanhado de um ou mais genes nif diferentes.

Resultados

• Genomas Completos:create table nifs_localizacaoselect s.id s_id, s.source, if(locate('plasmid',s.definition)>0,'Plasmídeo','Cromossomo') tipo_genoma, r.id,r.ini_min inicial, r.fim_max final, r.operador, r.direcao, if( locate('NIFH',upper(a.valor))>0,'nifH', if( locate('NIFD',upper(a.valor))>0,'nifD', if( locate('NIFK',upper(a.valor))>0,'nifK', if( locate('NIFL',upper(a.valor))>0,'nifL', if( locate('NIFA',upper(a.valor))>0,'nifA', if( locate('NIFE',upper(a.valor))>0,'nifE', if( locate('NIFB',upper(a.valor))>0,'nifB', if( locate('NIFS',upper(a.valor))>0,'nifS', if( locate('NIFT',upper(a.valor))>0,'nifT', if( locate('NIFN',upper(a.valor))>0,'nifN', if( locate('NIFX',upper(a.valor))>0,'nifX', if( locate('NIFU',upper(a.valor))>0,'nifU', if( locate('NIFV',upper(a.valor))>0,'nifV', if( locate('NIFW',upper(a.valor))>0,'nifW', if( locate('NIFZ',upper(a.valor))>0,'nifZ', if( locate('NIFM',upper(a.valor))>0,'nifM', if( locate('NIFF',upper(a.valor))>0,'nifF', if( locate('NIFQ',upper(a.valor))>0,'nifQ', if( locate('NIFJ',upper(a.valor))>0,'nifJ', if( locate('NIFY',upper(a.valor))>0,'nifY','DESCONHECIDO'))))) ))))) ))))) ))))) Motivo, q.qualifier,a.valor,a.ordem,f.chave as featurekeyfrom mi_anotacao a, genbankseg s, regiao r, qualifier q, featurekey fWhere a.regiao = r.id and r.genbankseg = s.id and a.qualifier = q.id and r.featurekey = f.id

Resultados

• Genomas Completos:

create table nifs_localizacao2hselect distinct s_id, source, tipo_genoma, inicial, final, operador, direcao, Motivofrom nifs_localizacaowheres_id in (select s_id from dnifh x where x.s_id = nifs_localizacao.s_id)

create table DnifHselect distinct s.id s_id, s.source, 'H'from mi_anotacao a, genbankseg s, regiao rWhere s.id = r.genbankseg and r.id = a.regiao and upper(a.valor) like '%NIFH%'order by s.id;

Resultados

• Genomas Completos:

0

100

200

300

400

500

600

700

nifH nifB nifE nifJ nifL nifN nifS nifU nifW nifY

Distribuição dos Genes nif Anotados em Organismos com Genoma Completo

Resultados

• Genomas Completos:

• Planilha com a composição do cluster nif anotado, por organismo e taxonomia reduzida.

Trabalhos em Andamento

Trabalhos em Andamento

create table dados_blastSELECT distinct r.id, n.Motivo, SUBSTRING(g.genoma, r.ini_min, r.fim_max - r.ini_min) seq FROM genomas g, regiao r , nifs_localizacao n WHERE r.genomas = g.id and r.id = n.id and n.s_id = '891'

Agradecimentos

Agradecimentos

• Professores Liu, Fabio e Roberto.

• Colegas do Mestrado.

• Agências Financiadoras: CAPES/CNPQ/REUNI.

top related