filogenias moleculares e o enraizamento da - livros...

113
UNIVERSIDADE DE SÃO PAULO FFCLRP DEPARTAMENTO DE BIOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM BIOLOGIA COMPARADA Filogenias moleculares e o enraizamento da “Árvore da Vida” Emanuelle Corbi Corrêa Orientador: Prof. Dr. Dalton de Souza Amorim RIBEIRÃO PRETO 2009 Tese apresentada à Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto da USP, como parte das exigências para a obtenção do título de Doutor em Ciências, Área: Biologia Comparada

Upload: trandan

Post on 03-Dec-2018

220 views

Category:

Documents


0 download

TRANSCRIPT

  • UNIVERSIDADE DE SO PAULO

    FFCLRP DEPARTAMENTO DE BIOLOGIA

    PROGRAMA DE PS-GRADUAO EM BIOLOGIA COMPARADA

    Filogenias moleculares e o enraizamento da

    rvore da Vida

    Emanuelle Corbi Corra

    Orientador: Prof. Dr. Dalton de Souza Amorim

    RIBEIRO PRETO

    2009

    Tese apresentada Faculdade de Filosofia,

    Cincias e Letras de Ribeiro Preto da USP, como

    parte das exigncias para a obteno do ttulo de

    Doutor em Cincias, rea: Biologia Comparada

  • Livros Grtis

    http://www.livrosgratis.com.br

    Milhares de livros grtis para download.

  • pessoa que at agora nunca saiu do meu lado...

    quela que por pior que a situao fosse sempre tinha palavras de refrigrio...

    quela que no poupou esforos para fazer de mim o que sou hoje...

    quela que na hora H de todos aqueles momentos mais cruciais da minha existncia

    ... esteve l por mim. Quanto amor! Hoje eu comeo a conseguir mensurar o quo

    grande o seu amor por mim...

    Este trabalho dedicado a voc... mame.

  • O melhor da cincia sua caracterstica inconstante,

    busca por quebras de paradigmas e

    a possibilidade de chegarmos ao fim e

    compreendermos que estvamos errados ou

    alegrarmo-nos por termos estado certos.

  • Agradecimentos

    Considero que a elaborao de uma tese de doutorado um produto coletivo

    embora sua redao, responsabilidade e stress seja predominantemente individual.

    Vrias pessoas contriburam para que este trabalho chegasse a bom termo. A todas elas

    registro minha gratido.

    Agradeo a Deus, pela graa de no ter tirado a minha vida por duas vezes

    quando com a morte quase face a face fiquei durante o perodo deste doutorado.

    Agradeo Ele por tudo que sou e que possuo, por cada momento da minha vida ao

    longo do tempo de durao deste trabalho e pelo resultado final...Obrigada Senhor!

    No mbito familiar, agradeo minha me Yara por todo apoio e amor

    incondicional, ao meu pai Paulo pela tomada de algumas decises surpreendentes e

    confortantes ao meu corao, ao meu marido, companheiro e parceiro sempre, minha

    filha que deixa minha vida repleta de alegria e finalmente, a minha irm Evelyn, a quem

    eu amo muito.

    Agradeo a todos do laboratrio do professor Dalton de Souza Amorim pela

    convivncia e bate-papos. Agradeo, principalmente ao professor Dalton pela

    oportunidade, confiana e orientao e a Bel por ser uma grande amiga.

    A todos da Excellent Global que entenderam minha quase ausncia por tantos

    anos, minhas infindveis anlises impedindo o uso dos computadores na escola e meus

    muitos agora no...espero agora estar mais com vocs.

    A todos da ps graduao e da Fapesp que sempre estiveram dispostos a ajudar.

  • Ao professor Fernando Portela de Luna Marques pelas oportunidades de cursos,

    pela disponibilidade de ajudar mesmo que a distncia e pela hospitalidade.

    A professora Maria de Lourdes Teixeira de Moraes Polizeli pela amizade,

    profissionalismo, oportunidades proporcionadas a minha carreira profissional,

    companheirismo e orientao.

    Ao professor Richard Ward por algumas conversas teis.

    A Fapesp pela bolsa concedida.

    A todos que contriburam para a concretizao deste trabalho e que, por um

    lapso meu, no foram citadas aqui.

    Muito obrigada

  • Sumrio

    Resumo..........................................................................................7

    Abstract.........................................................................................9

    Consideraes Iniciais..................................................................11

    Captulo I Estudo das Glicosidases............................................19

    Captulo II Estudo das xilanases................................................36

    Captulo III Anlise das xilanases do gnero Aspergillus...........68

    Captulo IV Estudo dos fatores de alongamento EF-Tu e G......82

    Comentrios Finais.....................................................................99

    Bibliografia.................................................................................100

  • Resumo

    Os seres vivos tm sido divididos em trs grandes domnios: Bacteria, Archaea e

    Eukarya. O relacionamento filogentico entre eles tem sido discutido por vrios autores,

    que em sua maioria concordam com o arranjo ((Archaea + Eukarya) Bacteria). Alguns

    desses autores tm utilizado protenas parlogas para enraizar as rvores geradas. A

    congruncia entre as propostas indicaria robustez no fosse a falta de rigor

    metodolgico no delineamento dos protocolos de anlise e no tratamento desses dados.

    As nomeaes atribudas a grupos de seqncias compartilhando a mesma

    funcionalidade qumica muitas vezes confusa dificultando as proposies de

    homologia, principalmente quando h interao de duas ou mais reas do conhecimento.

    Ademais, quando protenas so analisadas, importante selecionarmos corretamente

    qual parte da seqncia deve ser considerada. vasta a quantidade de trabalhos que

    omitem os protocolos metodolgicos completos dificultando ou impossibilitando a

    replicao da anlise.

    Nossas anlises falharam em propor uma hiptese mais robusta para os trs

    domnios, pois, glicosidases e xilanases demonstraram no compor grupos ortlogos de

    seqncias. As seqncias dos fatores de alongamento tambm resultaram na

    confirmao de que esse agrupamento qumico pode no refletir um grupo evolutivo

    vlido. Tambm questionvel a prpria paralogia entre EF-Tu-1 e EF-G-2. Qualquer

    futura proposio de alteraes na classificao dessas molculas necessitar de estudos

    ainda mais abrangentes no que diz respeito aos grupos taxonmicos includos dada a

    escassez de seqncias para alguns taxa.

    Devido a importncia das xilanases em estudos de biotecnologia, realizamos um

    estudo filogentico de fungos do gnero Aspergillus para entendermos o

    comportamento de mltiplas xilanases em uma mesma espcie e propondo uma hiptese

  • filogentica para o grupo, consegussemos separar xilanases ortlogas e focar futuros

    esforos por fungos do gnero Aspergillus que sejam bons produtores dessas enzimas.

    Finalmente, o programa POY cuja filosofia de anlise agrada muitos

    filogeneticistas pois o que melhor reflete os princpios cladsticos parece ter problemas

    em seu algoritmo quando conjuntos grandes de seqncias proticas so analisados.

  • 9

    Abstract

    All living beings have been divided into three great domains: Bacteria, Archaea

    and Eukatya. The phylogenetic relationship among them has been discussed by many

    authors who agree with the arrangement ((Archaea + Eukarya) Bacteria). Some of these

    authors have used paralog proteins to root the topologies. The congruence among these

    hypotheses would indicate robustness if it wasnt for the lack of strictness in the method

    outline of the protocols and in the treatment of this king of data. The names given to

    groups of sequences sharing the same chemical functions is confused most of the time

    leading to an extra difficulty in the homology proposition, mainly when different

    disciplines are compared. Furthermore, when proteins are analyzed it is important to

    correctly select which part of the sequence will be considered. Many papers dealing

    with this issue omit their complete methodological protocols making it harder or even

    impossible to replicate the analysis.

    Our analysis faild to propose a more robust hypothesis to the three domains,

    because glycosidases and xylanases are probably not natural entities. The elongation

    factor sequences also corroborate the idea chemical grouping may not reflect orthology

    or evolution. The paralogy between EF-Tu and G is also questionable. Any future

    proposition concerning the alteration of current molecules classification will need

    further studies including taxonomic groups poorly represented herein.

    Due to the importance of xylanases in biotechnological studies, we analysed

    phylogenetically a group of Aspergillus fungi. First, to understand the behavior of

    multiple xylanases in the same organism or species and then to propose a phylogenetic

    hypothesis for the group. As a consequence, ortholog xylanases nested in the same clade

    and efforts in the search of good xylanases producers was facilitated.

  • 10

    Finally, the phylogenetic program POY, which philosophy of analysis pleases

    many researchers because it better reflects cladistic principles seems to have problems

    in its algorithm when great protein data sets are analyzed.

  • Consideraes iniciais

  • _______________________________________________________Consideraes iniciais

    11

    A imensa diversidade biolgica existente move a curiosidade humana desde a

    antiguidade (Eldredge & Cracraft, 1980) e instiga o homem a agrupar e classificar os

    seres vivos conhecidos (Wolf, 1930). Essa classificao, em seu princpio, apia-se

    evidentemente em similaridades gerais entre os organismos, e no em suas relaes de

    parentesco. Entretanto, apenas arranjos taxonmicos que refletem grupos monofilticos

    possibilitam compreender os padres evolutivos existentes na natureza e entender os

    processos que os geraram (Eldredge & Cracraft, 1980).

    Estudos filogenticos que procuram recuperar as relaes de parentesco entre os

    grupos na natureza necessitam de caracteres interpretveis indicativos de

    transformaes evolutivas (Hawkins, 2000). At meados da dcada de 70, todas as

    tentativas de estudar a histria evolutiva dos organismos usando mtodos cladsticos

    restringiam-se basicamente a Metazoa e Metaphyta, baseadas em caracteres

    morfolgicos complexos, apoiadas adicionalmente em consideraes sobre o registro

    fossilfero. Apesar de os microorganismos j serem conhecidos, no era possvel inseri-

    los em arranjos taxonmicos filogeneticamente vlidos ou at mesmo puramente

    classificatrios devido ausncia de caracteres informativos (Stanier & van Niel, 1962

    e Woese et al., 1990). O advento das prticas de seqenciamento molecular

    (Zuckerkandl & Pauling, 1965), seu uso para fins de reconstruo filogentica, o

    refinamento computacional, com mquinas de alto desempenho e algoritmos mais

    eficientes, permitindo uma melhor anlise dessas seqncias, mudaram essa histria

    (Sanderon et al., 1993). A obteno de filogenias moleculares tornou-se um programa

    de pesquisa progressivamente mais difundido em Biologia Comparada.

    Conseqentemente, estudos filogenticos de uma gama muito maior de organismos,

    como fungos, bactrias e at mesmo vrus, passaram a ser publicados (p.ex., Gouvea et

    al., 1998; Tanabe et al., 2004; Schimitt & Lumbsch, 2004; Zhao et al., 2004).

  • _______________________________________________________Consideraes iniciais

    12

    Haeckel (1866) foi o primeiro a questionar a diviso do mundo vivo em apenas

    plantas e animais, reconhecendo que os protistas no se encaixavam em nenhum dos

    dois grupos, supondo que deveriam ter surgido independentemente. Copeland (1938)

    reuniu as bactrias em um quarto grupo e Whittaker (1959) criou um quinto para

    acomodar os fungos. Esse arranjo taxonmico que agrupa os seres vivos em cinco

    grandes reinos (Animais, Plantas, Fungos, Protistas e Monera) o mais amplamente

    utilizado atualmente. Devido ausncia de embasamento filogentico, no entanto, ele

    reflete um sistema de classificao artificial (Whittaker, 1959, 1969). Ademais,

    posicionar os procariotos (Monera) com o mesmo status taxonmico dos outros quatro

    grupos problemtico, j que as diferenas entre eles e os demais grupos so

    qualitativamente diferentes e quantitativamente maiores do que quando comparamos os

    outros grupos entre si (Kimura et al., 1979).

    luz de caracteres moleculares, um novo agrupamento dos seres vivos foi

    proposto por Woese & Fox (1977), posteriormente aprimorado por Woese (1987).

    Trabalhando com o gene que codifica o RNA da subunidade pequena do ribossomo

    (SSU rDNA, tambm chamado de 16S nos procariotos e 18S nos eucariotos), esses

    autores redividiram os Monera em dois grandes reinos, Eubacteria e Archaeobacteria,

    mantendo o grupo Eukarya. Posteriormente, Woese et al. (1990) propuseram a elevao

    de status dos trs reinos para domnios, Archaea, Bacteria e Eukarya. Essa elevao

    taxonmica visou acomodar melhor hierarquicamente os organismos que compunham

    os reinos. Adicionalmente, para uma simplificao ainda maior da nomenclatura, Woese

    et al. (1990) evitaram qualquer conotao que pudesse atribuir um maior

    relacionamento evolutivo entre Archaea e Bacteria. Entretanto, esse sistema de

    classificao sofreu contestaes, principalmente quanto ao seu relacionamento interno,

    e muitos problemas surgiram quanto s inferncias evolutivas quando novos dados

  • _______________________________________________________Consideraes iniciais

    13

    moleculares foram utilizados (Karlin et al., 2002; para uma viso diferente ver Gupta,

    1998 a e b, 2000; Poole et al., 1999; Lopez et al., 1999; Forterre & Philipe, 1999;

    Gribaldo & Philippe, 2002).

    A determinao adequada da identidade e do relacionamento cladstico entre os

    trs domnios complicada devido diversidade de organismos encontrada em cada

    grupo e as dificuldades inerentes ao estudo de organismos to morfologicamente

    simples. Archaea e Eukarya compartilham muitos genes e protenas envolvidas na

    formao e atividade celular, ao passo que Archaea e Bacteria compartilham muitas

    estruturas morfolgicas, genes e protenas metablicas operacionais (Rivera et al.,

    1998) possivelmente por plesiomorfia. Atualmente, o domnio Bacteria dividido em

    pelo menos 13 grandes grupos. A enorme plasticidade bioqumica e morfolgica

    exibida por esse domnio dificultou uma melhor diviso classificatria at que Woese

    (1987) props a primeira diviso do grupo com base em dados moleculares de SSU.

    Entretanto, genes universais em algum grau parecem definir os grupos, mas no o

    relacionamento filogentico entre eles (Baldauf et al., 2000 e Baldauf, 2003). Alm de

    SSU e LSU (Brochier et al., 2002), outros 14 genes conservados (Brown et al., 2001),

    57 protenas tradutoras (Brochier et al., 2002), 32 protenas ribossmicas (Wolf et al.,

    2001), somados a aproximadamente mais 121 genes, compem o conjunto de caracteres

    j utilizados para estabelecer diferentes subgrupos dentro deste domnio.

    Archaea um domnio cuja criao visou separar organismos que so

    morfologicamente muito semelhantes s bactrias e geneticamente to diferentes quanto

    o prprio homem de uma bactria. Os organismos que compem esse domnio foram

    primeiramente separados das bactrias por Woese e Fox (1977). Atualmente, esse

    domnio composto de quatro grandes agrupamentos: Euryarcheota, Crenarcheota,

    Korarcheota e Nanoarchaeota. Essa diviso suportada por anlises de SSU, LSU, 53

  • _______________________________________________________Consideraes iniciais

    14

    protenas ribossomais (Matte-Tailliez et al., 2002), 14 genes housekeeping (Brown et

    al., 2001), protenas ribossomais universais (Wolf et al., 2001) e 14 conjuntos

    randmicos de grupos de protenas ortlogas (COGs) (Cockrill & Baldauf, observaes

    no publicadas em Baldauf et al., 2004).

    Eukarya, finalmente, composto pelos organismos mais conhecidos. Estudos

    moleculares de modo geral suportam uma subdiviso em Excavata, amitocondriados,

    opistocontes, amebozoa, plantas, cercozoa, alveolados, hetercontes e discicristates

    (Sogin, 1991; Keeling & Doolittle, 1996; Van de Peer & De Wachter, 1997;

    Bhattacharya & Weber, 1997; Van der Auwera et al., 1998; Burger et al., 1999; Baldauf

    et al., 2000; Keeling et al., 2000 e Bapteste et al., 2002). Entretanto, a subdiviso dos

    Eukarya em grupos monofilticos menores deve corresponder discusso mais

    complexa em todo o estudo de filogenia basal dos seres vivos.

    Quais so as relaes de parentesco entre os trs domnios? A resposta para essa

    pergunta traria solues para muitas reas do conhecimento, como sade humana,

    conservao biolgica, processos heterocrnicos, dentre outros (Amorim & Amorim,

    1992 e Yates et al., 2004). No possumos, atualmente, estudos suficientes para inferir

    com nenhuma segurana a monofilia dos trs domnios, com a possvel excesso de

    Eukarya. Entretanto, se considerarmos cada um deles como grupos monofilticos, algo

    que pode ser contestado com relativa facilidade, h solues alternativas. Cada uma

    delas amparada por diferentes fontes de informao:

    (1) ((Archaea + Eukarya) Bacteria) suportado pela anlise individual dos

    genes alginosuccinato sintetase, aspartil-tRNA sintetase, ATPase subunidade , ATPase

    subunidade , fator de alongamento 1 /Tu, fator de alongamento G/2, 60-kDa protenas

    de choque trmico (HSP60), isoleucil-tRNA sintetase, protenas ribossomais (18),

  • _______________________________________________________Consideraes iniciais

    15

    subunidade A da RNA polimerase, subunidade B da RNA polimerase, componente de

    membrana SecY, triptofanil-tRNA sintetase, tirosil-tRNA sintetase;

    (2) ((Bacteria + Archaea) Eukarya) suportado pela anlise individual dos

    genes acido aminolevulnico desidratase (ALADH), citrato sintetase,

    fosforibosilformilglicinamidina sintetase, glutamato desidrogenase, protenas

    ribossomais e antranilato fosforibosil transferase (trp)D;

    (3) ((Bacteria + Eukarya) Archaea) suportado por estudos de enolase,

    FeMn superoxido dismutase, gliceraldedo-3-fosfato desidrogenase (GAPDH), his B, 3-

    Fosfoglicerato kinase, proC e trpB;

    (4) (Bacteria + Archaea + Eukarya) suportado por acetil-coenzima A

    sintetase, glu-tRNA redutase, diidrofosfalato redutase, his D e H, fotoliase e trpA, C, E

    e G.

    Apesar da grande disponibilidade de caracteres, todos os seres vivos so

    inseridos na anlise evolutiva dos trs domnios como grupo interno, tornando

    tecnicamente impossvel o enraizamento das rvores filogenticas nesses estudos

    utilizando grupos mais externos (Brinkmann & Philippe, 1999). A alternativa

    metodolgica baseada no uso de protenas parlogas cuja duplicao acredita-se ter

    ocorrido anteriormente ao incio da diversificao dos organismos atuais, ou seja,

    estavam presentes no organismo ancestral a esses trs domnios (LUCA).

    Historicamente, Iwabe et al. (1989) estudou os fatores de alongamento de

    traduo EF-Tu/1 -EF-G/2 e postulou um maior relacionamento filogentico entre

    Archaea e Eukarya do que qualquer um desses com bactria. Esses autores tambm

    embasaram sua proposta em estudos anteriores, como os de Hori & Osawa (1987 e

    1979). Apesar da anlise dos fatores de alongamento ter sido criticada pelo seu tamanho

    limitado de regies homlogas, erros de alinhamento e amostragem taxonmica

  • _______________________________________________________Consideraes iniciais

    16

    inadequada, Baldauf et al. (1996) corroboraram esses resultados re-analisando esses

    mesmos fatores, porm considerando seqncias mais longas e, em seu conjunto, mais

    representativas. Nesse mesmo ano, Gogarten et al., (1989a e b) trabalharam com as

    ATPases do tipo V e F e propuseram, igualmente, um maior relacionamento entre

    Archaea e Eukarya. As filogenias geradas a partir dos genes duplicados EF e ATPases

    sofreram contestaes, especialmente quando descobriram a existncia de ATPases tipo

    V, previamente conhecida apenas em Archaea, em algumas espcies de Bacteria

    (Tsutsumi et al., 1991 e Kakinuma et al., 1991) e a presena do gene ATPases-F1

    subunidade- em Methanosacrina barkeri, taxonomicamente posicionado dentro de

    Archaea (Sumi et al., 1992).

    A maioria dos estudos publicados at o momento, de fato, aponta para um maior

    parentesco entre Archaea e Eukarya, sendo Bacteria grupo irmo de ambos. Essa

    opinio aparentemente est embasada muito mais em observaes informais do que em

    estudos filogenticos per se (p.ex., Olsen & Woese, 1996). Entretanto, mesmo sem o

    desejado rigor metodolgico, a hiptese de monofilia de (Archaea + Eukarya) parece

    concreta (p.ex., Iwabe et al., 1989; Gogarten et al., 1989a e b; Brown e Doolittle, 1995;

    Baldauf et al., 1996; Lawson et al, 1996; Brown et al., 1997; Gribaldo & Cammarano,

    1998), mas carece de hipteses filogenticas mais robustas demonstrando esse arranjo.

    O estudo de novos grupos moleculares, parlogos ou no, poder contribuir

    aumentando a robustez ou falseando essas hipteses. Um grupo interessante a ser

    estudado um conjunto de enzimas existentes nos trs domnios, chamadas

    glicosidases. Essas enzimas, vitais para o funcionamento biolgico, so classificadas

    como compondo um grupo de protenas homlogas. Dentro desse grupo, as xilanases,

    enzimas de crescente interesse econmico, tambm constituem nosso grupo de

  • _______________________________________________________Consideraes iniciais

    17

    interesse. Uma reanlise dos fatores de alongamento, com considervel aumento na

    amostragem taxonmica igualmente parte deste estudo.

  • Captulo I

    Estudo das glicosidases

  • ______________________________________________________Estudo das Glicosidases

    19

    INTRODUO

    O grupo de molculas qumica e biologicamente denominado enzimas possui vrias

    propostas classificatrias utilizadas na literatura, cada qual com suas vantagens e

    desvantagens. A classificao enzimtica proposta em 1964 estabelecida pelo IUBMB

    (International Union of Biochemistry and Molecular Biology)

    (www.chem.qmul.ac.uk/iubmb/enzyme/index.html) baseada na especificidade de

    substrato, uma caracterizao fentica. Para as glicosidases ou glicosil-hidrolases (EC

    3.2.1.x), por exemplo, o primeiro dgito indica uma hidrolase, o segundo dgito indica uma

    glicosilase e o terceiro indica que a enzima hidrolisa compostos glicosdicos O e S. O ltimo

    dgito indica o substrato e, em alguns casos, indica o mecanismo molecular ou tipo de

    ligao (ex., -1,4, -1,3, etc.) da enzima. Embora essa classificao no seja adequada para

    enzimas com ampla especificidade, ela importante, pois foi criada para evitar

    ambigidades como: diferentes enzimas receberem o mesmo nome e enzimas iguais

    receberem nomes diferentes. Adicionalmente, evita nomes que reflitam pouco ou nada da

    natureza da reao catalisada.

    As desvantagens dessa classificao recaem no fato de no acomodarem de forma

    adequada e no ambgua as enzimas que possuem dois ou mais substratos de ao, realidade

    comum para as glicosidases, por exemplo. Falha tambm em refletir as estruturas tercirias,

    que se tornam cada vez mais vastas na literatura. Classifica ainda enzimas, como

    myrosinase, que hidroliza uma srie de S-glucosdeos, sob o cdigo EC 3.2.3.1

    (thioglucosidase) ainda que possua seqncia aminoacdica, mecanismo molecular e

    estrutura terciria muito similar a O--glucosidase, assinalada sob outro cdigo enzimtico,

    EC 3.2.1.21. Ainda sob o mesmo aspecto, algumas enzimas no relacionadas

    estruturalmente possuem o mesmo substrato de ao e podem ser classificadas sob o mesmo

    cdigo de EC. As endoglucanases (EC 3.2.1.4), por exemplo, oferecem uma ampla

    http://www.chem.qmul.ac.uk/iubmb/enzyme/index.html

  • ______________________________________________________Estudo das Glicosidases

    20

    variedade de conformaes tercirias possveis e encontradas naturalmente barris (/)

    clssicos e distorcidos, barris , jelly rolls e barris (/)6 (Henrissat & Davies, 1997). Essa

    caracterstica demonstra que enzimas com possvel relacionamento filogentico bastante

    distante podem, de acordo com essa classificao, ser assinaladas a um mesmo cdigo

    enzimtico. Essa classificao, portanto, no reflete a histria evolutiva dessas enzimas,

    resultando em agrupamentos artificiais.

    Historicamente, a classificao das glicosidases dentro de um contexto evolutivo tem

    sido complicada e encontra-se longe de refletir preceitos cladsticos. Henrissat (1991),

    assumindo homologia para o grupo das glicosidases realizou uma anlise de similaridade,

    isto , fentica, das seqncias proticas desse grupo e incluiu as ciclodextrin

    glucanotransferases devido similaridade existente com as -amilases (Hofmann et al.,

    1989 e Farber & Petsko, 1990). Um total de 301 seqncias tiveram seus domnios

    analisados e os agrupamentos resultantes foram denominados famlias. Trinta e cinco

    famlias foram criadas para acomodarem os agrupamentos de seqncias gerados.

    Entretanto, no ficou claro como e sob quais critrios as anlises foram feitas, desde os

    cortes para extrao dos domnios, passando por alinhamento e reconstruo da topologia.

    Posteriormente, com o crescimento constante do nmero de seqncias existentes, novas

    anlises foram realizadas por Henrissat & Bairoch (1993), Henrissat & Romeu (1995),

    Henrissat & Bairoch (1996), Torronen et al. (1993a e b), Henrissat & Bairoch (1996),

    Henrissat (1998), Henrissat & Davies (2000), Henrissat & Coutinho (2001), Bourne &

    Henrissat (2001) e Stam et al. (2005) aumentando o nmero de famlias. Para acomodar os

    dados de seqncias que se acumulam, Coutinho (1999) e colaboradores implementaram um

    endereo web no qual todas as hidrolases esto classificadas em famlias

    (www.cazy.org/CAZY/). Ao longo dos ltimos quatro anos de anlises extraindo dados e

    consultando este endereo web percebemos que o mesmo sofreu vrias alteraes. Famlias

    http://www.cazy.org/CAZY/

  • ______________________________________________________Estudo das Glicosidases

    21

    que antes englobavam algumas seqncias hoje no englobam mais. Como exemplo,

    podemos citar o grupo das xilanases, que no incio estavam presentes nas famlias 5, 8, 10,

    11, 16, 43 e 62; Atualmente, as famlias 16 e 62 no tm mais seqncias dessas enzimas.

    Infelizmente, os parmetros de anlise e procedimentos metodolgicos utilizados para sua

    classificao ou alteraes no esto disponveis no endereo web ou em qualquer de seus

    trabalhos anteriores (como Henrissat & Bairoch, 1993; Henrissat & Romeu, 1995 e

    Henrissat & Bairoch, 1996). A Tabela I mostra a classificao atual das hidrolases de acordo

    com a famlia a que pertencem. Ainda, algumas dessas famlias, que atualmente, vo de 1 a

    114 possuem enzimas que no so hidrolases assinaladas a elas. Como exemplo, podemos

    citar a famlia 16, que possui as seguintes enzimas: xiloglucosiltransferase (EC 2.4.1.207);

    keratano-sulfato endo-1,4- -galactosidase (EC 3.2.1.103); endo-1,3- -glucanase (EC

    3.2.1.39); endo-1,3(4)- -glucanase (EC 3.2.1.6); licheninase (EC 3.2.1.73); -agarase (EC

    3.2.1.81); -carrageenase (EC 3.2.1.83); xyloglucanase (EC 3.2.1.151).

    De acordo com essa proposta de classificao, algumas famlias, por possurem

    enzimas cujas seqncias aminoacdicas e conformaes tridimensionais muito similares

    entre si, foram agrupadas formando cls. Os cls das glycosyl-hydrolases foram nomeados

    pelas iniciais CGH ou somente GH, seguidos de letras do alfabeto de A a N. Portanto, 14

    cls foram criados e cada um abriga duas ou mais das atuais 110 famlias existentes (Tabela

    II).

    As famlias que no esto inseridas em nenhum cl, portanto, so nicas e no

    possuem similaridade primria (seqncias de aminocidos) e nem estrutural suficientes

    para que fossem agrupadas com qualquer outra famlia. Todas as seqncias de um mesmo

    cl exibem a mesma estrutura terciria, o que corrobora a idia de que conformaes

    estruturais so mais conservadas do que a seqncia primria das enzimas em geral e,

    http://us.expasy.org/cgi-bin/nicezyme.pl?2.4.1.207http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.103http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.39http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.6http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.73http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.81http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.83http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.151

  • ______________________________________________________Estudo das Glicosidases

    22

    portanto, carregam considervel informao evolutiva (Jansen, 2001; Mirny & Gelfand,

    2002). Entretanto, essa abordagem ainda subjetiva, pois a ausncia de uma descrio

  • ______________________________________________________Estudo das Glicosidases

    23

    do protocolo analtico obscurece as bases desses agrupamentos. Isso permite procedimentos

    subjetivos resultando em classes artificiais.

    Um outro critrio de classificao dessas enzimas quanto a seu mecanismo de

    ao. Glicosidases podem agir basicamente de duas formas. A primeira quando h uma

    reteno da configurao do carbono anomrico do anel do acar sofrendo catlise. A outra

    quando h uma inverso dessa configurao anomrica. Claramente, como apenas duas

    possibilidades existem, no h razo para fazer da estequiometria enzimtica uma base nica

    para sua classificao. Entretanto, um agrupamento que consiga refletir esses mecanismos

    auxiliaria na predio de reaes laterais, como a transglicosilao, catalizada por enzimas

    de reteno (isto , retm a configurao do carbono anomrico).

    Uma outra classificao denota se a enzima ataca os terminais (exo) do

    polissacardeo ou a regio interna (endo) da cadeia (Sabini et al., 1999). De acordo com

    Henrissat & Davies (1997), os resduos catalticos dessas enzimas podem ser encontrados

    em trs regies diferentes denominadas por esses autores: bolso (pocket), fissura (cleft)

    e tnel (tunnel). Se a enzima possui seus resduos catalticos na regio denominada bolso,

    ento, so denominadas verdadeiras enzimas exo. J as que possuem seus resduos

    catalticos na regio da fissura so denominadas verdadeiras enzimas endo. Essa

    configurao permite a ligao randmica e ao da enzima na parte interna da cadeia

  • ______________________________________________________Estudo das Glicosidases

    24

    polimrica. Para enzimas que degradam polissacardeos fibrosos com muito poucos

    terminais da cadeia expostos, como o caso da celulose, por exemplo, o melhor

    desempenho realizar mltiplos ataques, muitos eventos hidrolticos, sem que ocorra o

    desligamento com a cadeia polissacardica. Superficialmente, existe uma diferena

    acentuada entre endo e exo-glicosidases, porm, na prtica, a distino desses dois diferentes

    estados prova ser difcil de designar, com muitas enzimas aparentemente possuindo um

    estado intermedirio, como o caso das enzimas de ataque mltiplo (Thompson, et a.l,

    1999).

    Tomando esse conjunto de classificaes em grande medida, cabe a questo da

    homologia das glicosidases. O conhecimento das relaes filogenticas das glicosidases em

    geral seria importante, pois permitiria uma busca eficiente por clados que compartilham

    caractersticas de interesse comum, como econmico, por exemplo (Polizeli et al., 2005).

    Conseqentemente, uma classificao que reflita a histria evolutiva dessas enzimas

    proveria informaes valiosas a uma ampla rea do conhecimento. Este trabalho tem como

    objetivo propor uma hiptese filogentica para o grupo das glicosidases partindo da

    premissa essencial para anlises filogenticas, de que este grupo de enzimas estritamente

    homlogo.

  • ______________________________________________________Estudo das Glicosidases

    25

    MATERIAL E MTODOS

    Existem vrios bancos de dados eletrnicos abrigando diferentes conjuntos genmicos

    e proticos incluindo grupos enzimticos. Dentre os utilizados para este estudo, esto

    BRENDA (http://www.brenda-enzymes.info/), CAZY (http://www.cazy.org), UniProt

    (http://expasy.org/sprot/) e GenBank (www.ncbi.nlm.nih.gov). As seqncias proticas

    includas no grupo das glicosilases somam 7.258 em Agosto de 2006 de acordo com o site

    BRENDA. Antes de delimitarmos um conjunto representativo desse total existente, foi

    realizado um estudo mais detalhado de algumas seqencias pertencentes a esse grande grupo

    de enzimas.

    Conjuntos aleatrios de seqencias foram estudados quanto s conformaes

    primrias, resduos que compem domnios e stios ativos. Um desses conjuntos era

    composto pelas enzimas alfa-amilases em Pyrococcus furiosus DSM 3638, beta-

    galactosidase em Pyrococcus woesei, betaxilosidase e alfa-L-arabinosidase em Sulfolobus

    solfataricus P2, quitinase em Thermococcus kodakaraensis KOD1 e glucoamilase em

    Methanococcus jannaschii. As informaes pertinentes a essas seqencias e s de todos os

    outros grupos analisados por este estudo foram extradas dos sites supracitados. Algumas

    tentativas de estabelecimento de homologia primria foram efetuadas por meio de

    alinhamentos dessas seqencias. Somente as regies correspondentes aos domnios foram

    utilizadas. Para os cortes dos domnios, utilizamos o software BioEdit (Hall, 1999) e as

    informaes contidas no site UNIPROT (www.uniprot.org). Aps todos os domnios terem

    sido separados, eles foram submetidos a um protocolo de alinhamento no software ClustalW

    implementado em BioEdit (Hall, op. Cit.). O software POY3 (Wheeler, 2003), que uma

    alternativa de alinhamento por parcimnia, no analisa diretamente seqncias

    aminoacdicas. Assim, as seqncias devem ser extradas no formato de nucleotdeos e deve

    http://www.cazy.org/geno/186497.htmlhttp://www.ebi.ac.uk/newt/display?search=2262http://www.cazy.org/geno/273057.htmlhttp://www.cazy.org/geno/273057.htmlhttp://www.cazy.org/geno/273057.htmlhttp://www.cazy.org/geno/2190.html

  • ______________________________________________________Estudo das Glicosidases

    26

    ser feita a delimitao do cdigo iniciador com as informaes contidas em UNIPROT.

    Posteriormente, o smbolo # deve ser inserido de forma a separar cada cdon. Assim, o

    POY entende os trs pares de base de um cdon como sendo um carter. A questo

    metodolgica intrigante nesse ponto quando pensamos nas substituies sinnimas. O

    POY trata essas como substituies ordinrias. Entretanto, esse recurso metodolgico a

    nica forma de utilizarmos o POY para seqncias aminoacdicas.

  • ______________________________________________________Estudo das Glicosidases

    27

    RESULTADOS

    Na Figura 1, podemos ver uma ilustrao esquemtica das protenas utilizadas em um

    dos grupos de seqncias analisadas neste estudo. O resultado dos grficos e do estudo

    estabelecidos para as enzimas alpha-amilase em Pyrococcus furiosus DSM 3638, beta-

    galactosidase em Pyrococcus woesei, beta xylosidase e alpha-L-arabinosidase em

    Sulfolobus solfataricus P2, chitinase em Thermococcus kodakaraensis KOD1 e

    glucoamilase em Methanococcus jannaschii gerou um conjunto de informaes que nos

    permite discutir homologia dentro do contexto das glicosidases. A protena de Pyrococcus

    furiosus (cdigo Cazy - Q8TZP8) com domnio alfa-amilase (glicosidase) classificada

    como EC 3.2.1.1 de acordo com Brenda e essa protena encontra-se dentro da famlia 13 do

    Clan GHH de acordo com Cazy. Outros nomes que essa enzima pode receber so

    glucogenase, endoamilase, Taka-amilase A, 1,4--D-glucan glucanohidrolase e

    neopullulanase. Seus limites de domnio so estabelecidos nos aminocidos 211 e 577,

    estando os stios ativos localizados nos resduos D411, E426 e D502.

    A protena de Pyrococcus woesei (cdigo Cazy O52629) com domnio beta-

    galactosidase (glicosidase) classificada como EC 3.2.1.23 de acordo com Brenda e, apesar

    de essas protenas em geral estarem classificadas dentro de quatro famlias diferentes de

    glicosidases, essa especficamente encontra-se dentro do grupo da famlia 1 do Clan GHA.

    Outros nomes que esta enzima pode receber so exo-1,4-beta-D-galactanase e lactase. Seus

    limites de domnio so estabelecidos nos aminocidos 1 e 510, estando os stios ativos

    localizados nos resduos E210 e E414.

    As protenas de Sulfolobus sulfataricus (cdigo Cazy Q97UI4) com domnios beta

    xilosidase (glicosidase) classificada como EC 3.2.1.37 e alfa-L-arabinosidase (glicosidase)

    classificada como EC 3.2.1.55 esto inseridas na famlia 3 e no pertencem a nenhum Cl.

    http://www.cazy.org/geno/186497.htmlhttp://www.ebi.ac.uk/newt/display?search=2262http://www.cazy.org/geno/273057.htmlhttp://www.cazy.org/geno/2190.html

  • ______________________________________________________Estudo das Glicosidases

    28

    Seus limites de domnio so estabelecidos nos aminocidos 76 e 301 e tambm nos resduos

    372 e 620, respectivamente, estando os stios ativos localizados nos resduos D161 e D267.

    A protena de Thermococcus kodakaraensis (cdigo Cazy Q9UWR7) com domnio

    chitinase (glicosidase) classificada como EC 3.2.1.14 de acordo com Brenda e, apesar das

    protenas assinaladas a esse cdigo estarem classificadas dentro de trs famlias diferentes

    de glicosidases, essa em especfico encontra-se dentro do grupo da famlia 18 do Cl GHK.

    Seus limites de domnio so estabelecidos nos aminocidos 175 e 528. O stio ativo,

    curiosamente, encontra-se na posio E1024, isto , fora do domnio da protena. A protena

    de Methanococcus jannaschii (cdigo Cazy Q59005) com domnio glucoamilase

    (glicosidase) classificada como EC 3.2.1.3 de acordo com Brenda e encontra-se dentro do

    grupo da famlia 15 do Cl GHL. Seus limites de domnio so estabelecidos nos

    aminocidos 262 e 607. Os stios ativos esto localizados nos resduos D403 e D406.

    Pyrococcus furiosus DSM 3638 (Cazy - Q8TZP8) EC 3.2.1.1 (alpha-amilase)

    Pyrococcus woesei (Cazy O52629) EC 3.2.1.23 (beta-galactosidase)

    Sulfolobus solfataricus P2 (Cazy Q97UI4) EC 3.2.1.37 (beta xylosidase) e EC 3.2.1.55 (alpha-L-

    arabinosidase)

    http://www.cazy.org/geno/2190.htmlhttp://www.cazy.org/geno/186497.htmlhttp://www.ebi.ac.uk/newt/display?search=2262http://www.cazy.org/geno/273057.html

  • ______________________________________________________Estudo das Glicosidases

    29

    Thermococcus kodakaraensis KOD1 (Cazy Q9UWR7) EC 3.2.1.14 (chitinase)

    Methanococcus jannaschii (Cazy Q59005) EC 3.2.1.3 (glucoamilase)

    Figura 1. Desenho esquemtico de seis enzimas pertencentes a cinco organismos diferentes do domnio

    Archaea, classificadas como glicosidases: Pyrococcus furiosus EC 3.2.1.1 (alpha-amylase), Pyrococcus woesei

    EC 3.2.1.23 (beta-galactosidase), Sulfolobus solfataricus P2 EC 3.2.1.37 (beta xylosidase) e EC 3.2.1.55

    (alpha-L-arabinosidase), Thermococcus kodakaraensis KOD1 EC 3.2.1.74 (chitinase), Methanococcus

    jannaschii EC 3.2.1.3 (glucoamilase).

    O alinhamento resultante da anlise desse grupo de seqencias foi extremamente

    pobre no estabelecimento de homologias primrias. Como podemos observar na figura 2,

    grande parte das estruturas primrias das protenas no possuem regies ou resduos

    homlogos nas outras do grupo estudado.

    Por outro lado, o resultado da verificao quanto distribuio dessas glicosidases

    nos organismos nos possibilitou verificar a existncia de muitos domnios enzimticos

    diferentes de glicosidases em um nico genoma, como em Pyrococcus furiosus (Figura 3),

    por exemplo.

    A protena beta-galactosidase (Figura 3J), encontra-se classificada dentro da famlia

    35 pelo site cazy, porm, quando acessamos links auxiliares, como o Pfam, para a deteco

    dos domnios, verificamos que ambos os domnios existentes na seqncia protica so

    designados como pertencentes famlia 42. Esse tipo de incongruncia de informaes no

    incomum. Notamos ainda a presena de duas protenas beta-galactosidases, indicando

    http://www.cazy.org/geno/2190.htmlhttp://www.ebi.ac.uk/newt/display?search=2262http://www.cazy.org/geno/273057.htmlhttp://www.cazy.org/geno/2190.htmlhttp://www.cazy.org/geno/2190.htmlhttp://www.cazy.org/geno/2190.html

  • ______________________________________________________Estudo das Glicosidases

    30

    paralogia ou evoluo convergente. A mesma observao estende-se para todas as protenas

    da Figura 3 quando consideramos o grupo das glicosidases.

    Figura 2. Alinhamento realizado em Clustal W das seqncias aminoacdicas referentes aos domnios das

    protenas glicosidases: Pyrococcus furiosus EC 3.2.1.1 (alfa-amilase), Pyrococcus woesei EC 3.2.1.23 (beta-

    galactosidase), Sulfolobus solfataricus P2 EC 3.2.1.37 (betaxilosidase) e EC 3.2.1.55 (alfa-L-arabinosidase),

    Thermococcus kodakaraensis KOD1 EC 3.2.1.74 (quitinase), Methanococcus jannaschii EC 3.2.1.3

    (glucoamilase).

    a) Pyrococcus furiosus (cdigo Cazy Q9HHB3) beta-glucosidase (famlia 1)

    b) Pyrococcus furiosus (cdigo Cazy Q8U3U9) beta-galactosidase (famlia 1)

    c) Pyrococcus furiosus (cdigo Cazy Q51723) beta-glucosidase (famlia 1)

    http://www.ebi.ac.uk/newt/display?search=2262http://www.cazy.org/geno/273057.htmlhttp://www.cazy.org/geno/2190.html

  • ______________________________________________________Estudo das Glicosidases

    31

    d) Pyrococcus furiosus (cdigo Cazy Q51733) beta-mannosidase (famlia 1)

    e) Pyrococcus furiosus (cdigo Cazy - - - ) (famlia 5)

    Nome da protena e cdigo Cazy no disponveis

    Cdigo Genbank AAM56798.1

    f) Pyrococcus furiosus (cdigo Cazy Q9V2T0 ) - endoglucanase (famlia 12)

    g) Pyrococcus furiosus (cdigo Cazy Q8U3I9) - alfa-amilase (famlia 13)

    h) Pyrococcus furiosus (cdigo Cazy O73951) beta-glucanase (famlia 16)

    i) Pyrococcus furiosus (cdigo Cazy Q8U1H4) quitinase (famlia 18)

    j) Pyrococcus furiosus (cdigo Cazy Q8U3U2) beta-galactosidase (famlia 35)

    Figura 3. Desenhos esquemticos das seqncias proticas enzimticas de glicosidases encontradas em

    Pyrococcus furiosus (Archaea).

    Glyco_hydro 18

    Glyco_hydro 12

    http://www.ncbi.nlm.nih.gov/entrez/viewer.fcgi?db=protein&val=AAM56798.1

  • ______________________________________________________Estudo das Glicosidases

    32

    DISCUSSO

    O grupo de seqncias cujo resultado de alinhamento demonstramos aqui apenas

    um dos muitos grupos abordados por este estudo. A representatividade necessria s seria

    acessada se muitos grupos com arranjos diferentes de seqncias fossem estudados. Apenas

    um grupo exemplificado para basearmos nossa discusso porque os resultados obtidos da

    anlise so semelhantes e relevantes. Os programas computacionais de alinhamento, em

    geral, mostraram-se incapazes de gerar qualquer alinhamento confivel. Os resultados de

    alinhamentos das seqncias pelo POY e ClustalW foram igualmente pobres no sentido de

    estabelecer regies homlogas. Ainda que haja um protocolo computacional de alinhamento,

    as limitaes atuais de velocidade computacional e de desenvolvimento de algoritmos obriga

    a anlise visual do alinhamento resultante por parte do pesquisador para verificar se

    realmente existem regies homlogas. Mesmo quando POY utilizado, com alinhamento e

    reconstruo filogentica atravs de iluminao recproca, o alinhamento implcito deve ser

    igualmente analisado. Esse tipo de anlise est demonstrada na Figura 2, na qual podemos

    perceber a inexistncia de regies homlogas.

    Philippe & Laurent (1998) apontaram para o problema de analisarmos

    filogeneticamente organismos distantes. A evoluo tendo acontecido dentro de um perodo

    longo de tempo resultaria em inmeras regies saturadas nas seqncias moleculares. Esse

    processo causa a perda do sinal filogentico, incorrendo em resultados esprios, ainda que

    em molculas ortlogas. Essas modificaes podem ser to intensas que impossibilitam o

    estabelecimento de regies homlogas suficientes para reconstruirmos a histria evolutiva.

    Em nossos dados, no entanto, essa explicao nem mesmo parece plausvel. Organismos de

    apenas 1 domnio Archaea foram analisados. Ao incluirmos outras enzimas ainda do

    grupo das glicosidases e dos mesmos organismos porm com os outros cdigos (EC)

  • ______________________________________________________Estudo das Glicosidases

    33

    semelhantes aos j existentes na anlise altera o grau de similaridade dos dados e promove o

    aparecimento de regies homlogas aparentes.

    Estes resultados corroboram a hiptese de que grupos menores dentro das

    glicosidases classificados pelo ltimo nmero do cdigo enzimtico podem ser homlogos

    com algum grau de diferena, mas ainda assim com alguma histria evolutiva em comum.

    Entretanto, o grupo das glicosidases parece incluir grupos enzimticos evolutivamente muito

    distantemente relacionados, com possvel aparecimento independente no LUCA j que no

    h qualquer grau de similaridade entre as glicosidases de ECs diferentes nem mesmo dentro

    de um mesmo domnio de organismos. Outra possibilidade, a despeito de sua classificao

    como enzimas dentro da mesma classe geral, que elas seriam enzimas xenlogas.

    Ao verificarmos a distribuio dessas protenas nos organismos em geral,

    percebemos que muitos organismos possuem inmeras glicosidases em seus genomas. Esse

    fato, esperado e bvio, denota uma possvel paralogia das seqncias dentro de cada

    subgrupo enzimtico, alm de alguma possibilidade de xenologia mesmo nesses grupos.

    Ademais, tambm observado que em muitas espcies h dois ou mais domnios idnticos

    de uma determinada protena em seu genoma. Isso aponta para a existncia de duplicao ou

    multiplicao gnica recente e, portanto, algum nvel de paralogia.

    A concluso de que h mltiplas paralogias dentre as enzimas classificadas como

    glicosidases, ou por que no sugerir o mltiplo aparecimento independente deste tipo de

    protena ao longo da evoluo? - resulta na impossibilidade de reconstrues evolutivas

    utilizando essas protenas sem que seja refeita uma classificao que reconhea famlias

    estritamente ortlogas. Anlises filogenticas, nessa situao, ficam restritas apenas a grupos

    menores dentro do grupo das glicosidases, em que haja corroborao que se esteja lidando

    com ortologia. Ademais, estudos considerando eventos de transferncia horizontal podem

    elucidar a origem de determinadas molculas nos organismos e ajudar o estabelecimento de

  • ______________________________________________________Estudo das Glicosidases

    34

    uma hiptese filogentica promovendo explicaes que saem do padro dicotmico e

    entrelaam os eventos evolutivos resultando em um cenrio evolutivo mais em forma de

    rede do que de rvore (Huang & Gogarten, 2006).

    Este trabalho mostra, portanto, que a classificao das hidrolases glicosdicas,

    precisa sofrer alteraes substanciais para que tenha um carter evolutivo e no apenas

    artificial. Uma primeira anlise de grupos menores assinalados a um mesmo cdigo

    enzimtico necessria para identificar grupos homlogos menores, para gradualmente

    expandir a anlise e incluir grupos mais abrangentes. No grupo enzimtico das Glicosidases

    no esto necessariamente relacionados enzimas homlogas. Ainda que quimicamente a

    classificao seja til (Hennig, 1966), as glicosidases no compem uma unidade homloga

    ou evolutiva.

  • Captulo II

    Estudo das Xilanases

  • ________________________________________________________Estudo das Xilanases

    36

    INTRODUO

    Dentre as glicosidases, que em geral englobam grupos no homlogos de

    protenas, as xilanases compem um grupo de interesse para estudos evolutivos e em

    biotecnologia. Anlises filogenticas dessas enzimas facilitaro estudos mais

    abrangentes considerando o grande grupo das glicosidases. As xilanases so enzimas

    assinaladas sob o cdigo EC 3.2.1.8 e j foram relatadas como existentes em Bacteria e

    Eukarya (Ito, 1992, Whitehead, 1995; Hernandez et al., 2001; Sasaki et al., 2002 e

    Ciaffi et al., 2005, dentre inmeros outros). Essas enzimas poderiam, apesar de nunca

    terem sido relatadas em Archaea, oferecer maiores subsdios informativos para a

    elucidao da filogenia basal dos Eukarya. Em princpio, elas deveriam ao menos

    separar completamente os organismos pertencentes a cada um destes domnios.

    A biomassa vegetal compe uma extensa fonte renovvel que, alm do

    importante papel na nutrio herbvora, tambm possui um enorme potencial em servir

    como matria prima para processos industriais e, conseqentemente, produo de massa

    orgnica, produtos qumicos especficos e biocombustvel (Gilbert & Hazlewood,

    1991). Enzimas que degradam a biomassa produzidas tanto por procariotos (bactrias e

    archaeas), quanto por eucariotos (fungos, vegetais, nematdeos dentre outros),

    representam o meio pelo qual a maior parte da energia e do carbono nela contidos

    liberada. Atualmente, a identificao de bons produtores dessas enzimas (ou de algumas

    seqncias especficas dessas enzimas) importante para acessarmos organismos que

    podem tomar parte em processos industriais em larga escala.

    Os maiores componentes das paredes celulares vegetais so hemicelulose

    (glucans, mannans, xilans dentre outros), celulose (fibras insolveis de B-1,4-glucan) e

    lignina (uma estrutura polifenica complexa) (Demeyer, 1981). Dentre esses materiais

  • ________________________________________________________Estudo das Xilanases

    37

    hemicelulosdicos, a xilana geralmente o componente encontrado em maior

    abundncia, alm de ser a segunda mais extensa fonte de recursos renovveis, com alto

    potencial para degradao e conseqente produo de compostos finais teis (Kulkarni

    et al., 1999). As enzimas que decompem a xilana so, em geral, denominadas

    xilanases que so includas em uma classe maior de enzimas chamada de glicosidases,

    grupo de enzimas amplamente distribudo que em geral hidrolisa a ligao glicosdica

    entre dois ou mais carbohidratos ou entre um carbohidrato e uma outra poro

    molecular que no consiste em um carbohidrato. As xilanases foram primeiramente

    descobertas por Whistler e Masck (1955) e nomeadas pentosanases, mas s foram

    reconhecidas pela Unio Internacional de Bioqumica e Biologia Molecular (IUBMB)

    em 1961, tendo sido assinaladas sob o cdigo EC 3.2.1.8 (Collins et al., 2005).

    Atualmente, seu nome oficial 1,4- -xilanase, mas vrios outros termos sinnimos

    podem ser encontrados, como xilanase, endoxilanase, 1,4- -D-xilana-xilanohidrolase,

    endo-1,4- -D-xilanase, -1,4-xilanase e -xilanase.

    As xilanases catalisam a endohidrlise das ligaes 1,4- -D xilosdicas da xilana

    e, portanto, esto envolvidas com a produo de xilose, monmero que constitui a maior

    fonte primria de carbono para o metabolismo celular de organismos patgenos vegetais

    (Collins et al., 2005). Muitas vezes denominadas enzimas do complexo xilanoltico ou

    simplesmente xilanases e causadoras de certa confuso de nomenclatura (Sapag, 2002).

    Contudo, necessrio notar que h outras enzimas que possuem papel fundamental no

    processo de degradao da xilana. Isto ocorre porque a hemicelulose , na verdade,

    um composto heterogneo, constitudo por monossacardeos em diferentes propores,

    como D-xilose, D-mannose, D-glucose, L-arabinose, D-galactose, D-cido glucornico

    e D-cido galacturnico. Quando o polmero hidrolizado e o monmero que compem

    o produto da hidrlise a D-xilose, ento, a hemicelulose em questo denominada

  • ________________________________________________________Estudo das Xilanases

    38

    xilana e a enzima responsvel pela liberao da D-xilose a xilanase. Sendo assim, o

    que nomeia a hemicelulose a principal unidade de acar encontrada aps a hidrlise

    (Polizeli et al., 2005).

    Na natureza, raro encontrarmos hemiceluloses compostas de apenas um tipo de

    monmero de acar. A maioria das hemiceluloses composta por dois ou mais

    monmeros, recebendo nomes como xiloglucano (D-xilose + D-glucose), arabinoxilana

    (L-arabinose + D-xilose), glucuronoxilana (D-cido glucornico + D-xilan) e

    glucuronoarabinoxilana (D-cido glucornico + L-arabinose + D-xilan) dentre outros

    (Shallom & Shoham, 2003). Dessa forma, xilanase o nome dado para as enzimas que

    degradam a poro da xilana composta apenas por monmeros de D-xilose. O conjunto

    completo de enzimas que degradam todas as partes da xilana denominado enzimas do

    complexo xilanoltico.

    Conseqentemente, dada a imensa complexidade e heterogeneidade da xilana,

    esta requer um grupo de vrias enzimas atuando para que sua degradao ocorra (Biely,

    1985 e Subramaniyan & Prema, 2002). Enquanto a xilanase (EC 3.2.1.8) cliva

    randomicamente o esqueleto estrutural da xilana, as -xilosidases (EC 3.2.1.37) clivam

    ligaes liberando os monmeros de xilose dos terminais no redutores de xilo-

    oligossacardeos e xilobiose. A remoo dos grupos laterias catalisada pelas -L-

    arabinofuranosidases (EC 3.2.1.55), -D-glucoronidases (EC 3.2.1.139), acetilxilan

    esterases (EC 3.1.1.72), cido ferlico esterases (EC 3.1.1.73) e cido p-cumrico

    esterases (EC 3.1.1.-) (Collins et al., 2005).

    Dentre as 114 famlias de glicosidases, as xilanases podem ser encontradas

    em 6 diferentes famlias, de acordo com o site CAZY, e compondo cinco cls (CGH)

    5 (CGH A), 8 (CGH M), 10 (CGH A), 11 (CGH C), 16 (CGH B) e 43 (CGH F). Essa

  • ________________________________________________________Estudo das Xilanases

    39

    indicao inicial de falta de ortologia fornece subsdios para concluses relacionadas

    evoluo independente de seqncias que se especializaramao longo do tempo

    convergiram para atuarem sobre um mesmo substrato, nominalmente, a degradao da

    xilana. Entretanto, a prpria artificialidade da classificao nos obriga a investigao

    dessas relaes evolutivas mais a fundo com cuidados redobrados na constituio de

    protocolos de anlises de bases efetivamente filogenticas de modo a reconhecer os

    conjuntos de seqncias no-ortlogas.

    Ainda na a classificao acima das glicosidases, as xilanases (EC 3.2.1.8) no

    apenas esto distribudas em seis famlias, como tambm se encontram agrupadas com

    outras enzimas, principalmente celulasess (EC 3.2.1.4), endo-1,3- -xilanase (EC

    3.2.1.32), alph -L-arabinofuranosidases (EC 3.2.1.55), liqueninases (EC 3.2.1.73),

    chitosanases (EC 3.2.1.132) e reducing-end-xylose releasing exo-oligoxilanases (EC

    3.2.1.156), dentre outras. Existem basicamente muitos tipos de endoxilanases que j

    foram purificadas e seqenciadas (Sunna & Antranikian, 1997), demonstrando, mesmo

    dentro desse grupo relativamente restrito de enzimas uma imensa heterogeneidade, isto

    disparidade evolutiva.

    Cada uma das famlias de glicosidases caracterizada por estruturas e

    mecanismos de ao prprios. Em uma anlise pr-cladstica, podemos identificar essas

    diferenas entre xilanases mesmo dentro de uma mesma famlia. As xilanases das

    famlias 10 e 11 tm sido mais extensivamente estudadas, o que no se aplica s

    protenas das demais famlias com atividade xilanoltica. As xilanases da famlia 10

    apresentam domnios catalticos com pesos moleculares maiores do que os da famlia 11

    e uma conformao estrutural do tipo (/)8 (Harris et al., 1996), enquanto a famlia 11

    apresenta uma conformao estrutural do tipo -jelly roll (Himmel et al., 1997), dentre

    http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.4http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.32http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.55http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.73http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.132http://us.expasy.org/cgi-bin/nicezyme.pl?3.2.1.156

  • ________________________________________________________Estudo das Xilanases

    40

    outras caractersticas qumicas que as definem e diferenciam. Tambm sabido o fato

    de que algumas xilanases possuem outros domnios, como celulase, por exemplo, ou

    mais de um domnio cataltico xilanoltico (Trrnen & Rouvinen, 1997), tornando a

    discusso mais complexa.

    Mesmo na ausncia de um embasamento maior quanto s premissas existentes

    em qualquer anlise filogentica, hipteses alternativas e conflitantes tm sido propostas

    desde o trabalho pioneiro de Henrissat (1991) at o presente. Georis et al. (1999a)

    seqenciaram uma xilanase S38 Xyll de Streptomyces sp. e compararam-na com mais

    14 xilanases da famlia 11, deduzindo que os 27 resduos conservados entre as

    seqncias, dentre os 190 existentes, eram suficientes para a inferncia de homologia,

    (isto , ortologia), classificando-a na famlia 11. Essa nova seqncia no foi testada

    dentro de um contexto mais geral entre as xilanases e os autores selecionaram apenas as

    pores referentes aos domnios catalticos para minimizar o rudo da anlise, sem

    indicar claramente os procedimentos utilizados para sua separao, resultando em

    concluses frgeis e questionveis.

    Mais recentemente, uma anlise abrangente das enzimas restritas famlia 11 foi

    efetuada (Georis et al., 1999b). Sessenta e trs xilanases da famlia 11 foram includas

    nessa anlise, resultando em uma topologia que separa bactrias gram-positivas,

    negativas e fungos. Metodologicamente, os alinhamentos efetuados com algortimos de

    mxima verossimilhana e posterior reconstruo da topologia sob parmetros de

    distncia resultam em inconsistncia filosfica quanto aos procedimentos

    metodolgicos utilizados e, portanto, baixa robusts nos resultados gerados. Ademais,

    em nenhum desses estudos a homologia da famlia 11 foi testada, o que gera dvidas

  • ________________________________________________________Estudo das Xilanases

    41

    quanto premissa fundamental de uma anlise filogentica, que a ortologia das

    seqncias inseridas no grupo interno.

    Outra caracterstica da anlise realizada por esses autores a presena de

    xilanases diferentes provenientes de uma mesma espcie. Aspergillus awamori, por

    exemplo, est representado na topologia no enraizada por trs diferentes xilanases

    XynB, Xyn1 e Xyn3, sendo que Xyn1 e Xyn3 apresentam-se como grupos irmos e

    XynB agrupa-se com outras xilanases de outras espcies de fungos. A incluso de vrias

    xilanases de uma mesma espcie em uma anlise filogentica ser discutida em detalhes

    mais adiante, porm, torna evidente o problema da falta de homologia. Finalmente, seus

    resultados falharam em separar com eficincia os grupos Bacteria e Fungo (Figura 1).

    Figura 1. rvore no enraizada da hiptese filogentica das xilanases familia 11 proposta por Georis et

    al. (1999a). Os cdigos, origens microbianas e nmeros de acesso dos sites SWISS-PROT, Genbank or

    Clado Fungo + Bacteria

    XynB de Aspergillus

    awamori

    Xyn1 e Xyn3 de

    Aspergillus awamori

  • ________________________________________________________Estudo das Xilanases

    42

    PIR de 63 xilanases comparadas neste estudo so: Xyl1 aerca (Aeromonas cavia Xyl1; D32065), Xyl

    ascpi (Ascochyta pisi Xyl; Z68891), XynB aspak (Aspergillus awamori XynB; P48824), Xyn1 aspak (A.

    awamori Xyn1; P55328), Xyn3 aspak (A. awamori Xyn3; P33557), Xyn1 aspnd (Aspergillus nidulans

    Xyn1; Z49892), Xyn1 aspng (Aspergillus niger Xyn1; A19535), Xyn2 aspng (A. niger Xyn2; P55330),

    Xyn5 aspng (A. niger Xyn5; U39784), Xyn1 asptu (Aspergillus tubigensis Xyn1; P55331), XynA aurpu

    (Aureobasidium pullulans XynA; U10298), Xyn aurpu (A. pullulans Xyn; patent US-5591619), XynA

    bacci (B. circulans XynA; P09850), XynA bacpu (Bacillus pumilus XynA; X00660), BdX bacd3

    (Bacillus strain D3; Patent FR-9101191), XynS bacya (Bacillus sp. YA-14 XynS; S48126), XynY bacya

    (Bacillus sp. YA-335XynY; S51779), XynA bacst (Bacillus stearothermophilus XynA; P45705), XynA

    bacsu (Bacillus subtilis XynA; P18429), XynD celfi (C. fimi XynD; P54865), XylA celmx (Cellvibrio

    mixtus XylA; S52741), CgXA chagr (Chaetomium gracile CgXA; D49850), CgXB chagr (C. gracile

    CgXB; D49581), XynA cloab (Clostridium acetobutylicum XynA; P17137), XynA closr (C. stercorarium

    XynA; D13325), Xyl1 cocca (Cochliobolus carbonum Xyl1; Q06562), Xyl2 cocca (C. carbonum Xyl2;

    U58915), Xyl3 cocca (C. carbonum Xyl3; U58916), Xyn crysp (Cryptococcus sp.S2 Xyn; D63382),

    XynB dicth (Dictyoglomus thermophilum XynB; U76545), Xyn1 emeni (Emericella nidulans Xyn1;

    P55332), Xyn2 emeni (E. nidulans Xyn2; P55333), XynC fibsu (Fibrobacter succinogenes XynC;

    P35811), Xyn1 humin (Humicola insolens Xyn1; P55334), Xyl4 maggr (Magnaporthe grisea Xyl4;

    L81127), Xyn2 maggr (M. grisea Xyn2; P55335), Xyn1 neofr (Neocallimastix frontalis Xyn1; S49528),

    Xyn2 neofr (N. frontalis Xyn2; S48865), XynA neopa (Neocallimastix patriciarum XynA; P29127),

    XynB penpu (Penicillium purpurogenum XynB; Z50050), XylF psefl (Pseudomonas fluorescens XylF;

    S59633), XynA orpsp (Orpinomyces sp. XynA; U57819), XylA pirsp (Piromyces sp. XylA; X91858),

    XynA rumal (Ruminococcus albus XynA; U43089), XylA rumfl (R. flavefasciens XylA; P29126), XylB

    rumfl (R. flavefasciens XylB; S51592), XylD rumfl (R. flavefasciens XylD; A36910), Xyl1 rumsp

    (Ruminococcus sp.Xyl1; Z49970), XynA schco (Schizophyllum commune XynA; P35809), XlnB strli (S.

    lividans XlnB; P26515), XlnC strli (S. lividans XlnC; P26220), XlnC strec3 (Streptomyces sp. EC3 XlnC;

    S47512), Xyn str36 (Streptomyces sp. No.36aXyn; E02180), Xyl1 str38 (Streptomyces sp. S38 Xyl1;

    X98518), Stx2 strth (S. thermoviolaceus Stx-II; D85897), TfxA Thefu (T. fusca TfxA; U01242), XynA

    thela (Thermomyces lanuginosus XynA; PDB entry 1YNA), Xyn triha (T. harzianum; P48793), Xyn1

    trire (T. reesei Xyn1; P36218), Xyn2 trire (T. reesei Xyn2; U24191), Xy2a trivi (Trichoderma viride

    Xyn2A; A44594), Xy2b trivi (T. viride Xyn2B; U44595), Xyn unktfu (Unknown fungus; A17518

    patent EP 0463706-A).

    Seguindo a mesma linha de raciocnio, apenas implementando anlise de fator

    prvia ao alinhamento mltiplo das seqncias, Sapag et al. (2002) estudaram 82

    xilanases da famlia 11 de organismos pertencentes a Bacteria e Eukarya. Esses autores

    concluram que algumas xilanases bacterianas eram mais prximas a seqncias de

    fungos do que a de outras bactrias. A inadequao de seu protocolo de anlise

    filogentica provavelmente a maior responsvel pela baixa robustez de seus

    resultados.

    Degefu et al. (2004), por sua vez, estudaram 51 seqncias de xilanases de

    fungos e bactrias tambm pertencentes famlia 11, utilizando um protocolo mais bem

    elaborado, mas omisso em alguns pontos cruciais de uma anlise filogentica por

    exemplo, os critrios para a separao das regies conservadas anteriores ao

    alinhamento, parmetros de alinhamento utilizados etc. Suas anlises resultaram em

  • ________________________________________________________Estudo das Xilanases

    43

    uma completa separao entre xilanases de fungos e bactrias e mostrou uma duplicao

    gnica dentro de fungos (Figura 2). Esses autores, entretanto, concluram que o uso de

    xilanases em interferncias filogenticas s vlido para txons mais derivados e

    relacionados, ou seja, as xilanases no seriam capazes de recuperar com eficcia eventos

    evolutivos muito basais. Essa viso, no entanto, contraditria com seus prprios

    resultados, uma vez que a topologia obtida separa Fungo e Bacteria.

    Os conceitos de homologia e similaridade esto relacionados, mas no so

    idnticos ou bvios, o que torna complexa a tarefa de estabelecer homologia entre

    molculas. Definies quanto aos tipos diferentes de homologia encontrados em nvel

    molecular foram originalmente apresentadas por Walter Fitch em 1970 e recentemente

    se tornaram objeto de intensa discusso em Biologia Evolutiva e Bioqumica (Koonin,

    2001; Petsko, 2001; Jensen, 2001 e Gerlt & Babbitt, 2000). Similaridade molecular

    uma medida do quanto duas seqncias, duas molculas ou dois genes correspondem

    um ao outro, ao passo que homologia uma relao de duas seqncias gnicas quanto

    a sua derivao de um mesmo ancestral comum mais recente entre as espcies que as

    possuem. Homologia entre sequencias pode ser de trs tipos: homologia ortloga ou

    ortologia, correspondente aos genes dos quais o ltimo ancestral comum divergiu em

    duas linhagens de genes por meio de especiao; homologia parloga ou paralogia,

    genes os quais divergiram por meio de duplicao intragenmica; e homologia

    xenloga ou xenologia, na qual a relao de homologia surge por mecanismos de

    transferncia gentica horizontal. Esta ltima considerada mais freqente entre

    procariotos que em eucariotos; entretanto, devido ao menor nmero de seqncias

    especficas existentes para eucariontes, essa viso poder ser modificada em um futuro

    prximo.

  • ________________________________________________________Estudo das Xilanases

    44

    Quando genes parlogos ou xenlogos erroneamente identificados so

    erroneamente tomados como ortlogos, topologias profundamente equivocadas podem

    surgir. Primeiramente, a prpria fonte de informao est equivocada. Alm disso, os

    programas utilizados resultaro inevitavelmente em concluses indevidas tanto em

    protocolos de alinhamento quanto de reconstruo filogentica. Na Figura 3-1 podemos

    visualizar a filogenia dos grupos A, B e C gerada a partir da anlise dos genes parlogos

    Y e Z. Supondo essa como a filogenia verdadeira para o grupo em questo, as

    topologias geradas por dois genes distintos, mesmo quando analisados conjuntamente

    (evidncia total), devem expressar a mesma histria evolutiva (Figura 3-2). Entretanto,

    todas as duplas de seqncias parlogas existentes em cada organismo devem ser

    consideradas, o que nem sempre possvel, j que a natureza parloga de um grupo de

    seqncias nem sempre conhecida antes da anlise. Se, por um erro no processo desde

    extrao at seqenciamento, j que algumas regies de genes parlogos mantem-se

    extremamente conservadas, o iniciador identificar e genes parlogos forem

    amplificados, como no exemplo AY, BY e CZ, ento, uma outra topologia ser gerada

    (Figura 3-3) confundindo e alterando todas as discusses de processos evolutivos que

    conduziram diversidade de espcies e de sequencias do grupo.

    Ademais, muita ateno deve ser requerida na escolha dos fragmentos gnicos

    que sero analisados. Muitos dos atuais bancos de dados moleculares disponveis

    eletronicamente fornecem subsdios para que, em certas situaes, novas seqncias

    sejam analisadas e identificadas quanto paralogia com certa coerncia. Entretanto,

    algumas vezes a parlogia pode permanecer no identificada e, portanto de difcil

    diagnstico, a priori, mas tende a ter seus efeitos minimizados dentro de um contexto

    parcimonioso medida que mais caracteres so inseridos na anlise. Este cuidado na

    escolha e detalhamento das caractersticas das seqncias so procedimentos ainda mais

  • ________________________________________________________Estudo das Xilanases

    45

    importantes quando nos referimos seqncias codificadoras ou proticas per se. Isso

    ocorre, porque o grau de complexidade dos detalhes a serem observados aumenta com

    esse tipo de carter.

    Durante a fase inicial de evoluo da vida, antes da formao dos clados hoje

    conhecidos de bactrias, a duplicao gnica, dando origem a genes parlogos, foi de

    importncia crucial para a diversificao enzimtica, aumentando a diversidade de

    reaes catalizadas por essas protenas e, conseqentemente, conduzindo a um

    significativo aumento do tamanho do genoma (Lazcano & Miller, 1994).

    Adicionalmente, esses eventos de duplicao proveram material para o aparecimento de

    novas propriedades enzimticas, diversificao dos elementos do citoesqueleto e

    padres regulatrios de

    Fig. 4 Exemplo de seqncias de natureza parloga alinhadas e analisadas filogeneticamente como

    ortlogas.

    desenvolvimento mais complexos (Haldane, 1933; Ohno, 1970 e Chervitz et al., 1998).

    Quando tratamos de protenas, especificamente, podemos ter duas principais

    abordagens: (1) a busca por regies homlogas ortlogas, o que geralmente implica em

    A B CAY AZ BY BZ CY CZ

    A B C

    ABC

    2 3

    1

  • ________________________________________________________Estudo das Xilanases

    46

    um maior grau de similaridade entre as seqncias primrias, posies especficas nos

    diferentes genomas e funes muito semelhantes ou idnticas nos diferentes

    organismos; (2) a busca por regies homlogas ortlogas ou parlogas, as quais so

    inseridas como um todo na anlise afim de separarmos as famlias ortlogas e, dentro de

    cada unidade ortloga, reconstruir a filogenia dos organismos em questo.

    Na prtica, a busca pelas seqncias de ambos os grupos no to simples. Em

    recursos como o BLAST (Altschul, 1990), uma determinada seqncia comparada

    com aquelas armazenadas no banco de dados e o programa responde separando desde a

    seqncia mais similar encontrada at aquelas que possuem pouca similaridade. Embora

    evoluo convergente tenha sido observada (Gandbhir et al., 1995 e Haney et al., 1999),

    o espao de uma seqncia protica, ou seja, todas as possveis permutaes, inseres e

    delees de aminocidos, grande. Em conseqncia, muitos pesquisadores atribuem

    nfimas similaridades como resultado de homologia.

    Um estudo amplo das xilanases incluindo outras menos conhecidas das famlias

    5, 8, 16 e 43 poderia dar fundamentao filogentica a hipteses de homologia

    construdas com base nas enzimas das famlias 10 e 11. Assim, objetivo deste

    trabalho, estudar filogeneticamente as seqencias de xilanases includas nas seis

    famlias que as abrigam propondo uma hiptese filogentica para o grupo.

  • ________________________________________________________Estudo das Xilanases

    47

    Figura 2. A rvore mais parcimoniosa obtida analisando seqncias de DNA de xilanases da famlia 11.

    Bootstrap Valores de suporte bootstrap esto plotados em seus respectivos clados. Os nmeros em

    parnteses indicam os valores de bootstrap quando gaps foram codificados como 5 estado de caracter

    (Modificado de Degefu et al., 2004).

    Duas diferentes

    xilanases

    produzidas por

    uma mesma

    espcie,

    portanto

    parlogas ou

    completamente

    no relacionadas

  • ________________________________________________________Estudo das Xilanases

    48

    MATERIAL E MTODOS

    Bancos de dados de protenas de acesso pblico abrigam conjuntos diferentes e

    complementares de seqncias e informaes sobre as glicosidases. Cada qual apresenta

    um conjunto diferente de informaes. Foram escolhidos oito diferentes servidores de

    bancos de dados no s para extrao das seqncias enzimticas, mas tambm para o

    estudo individual de cada uma:

    SRS (http://srs.ebi.ac.uk/srsbin/cgi-bin/wgetz);

    CATH (www.biochem.ucl.ac.uk/bsm/cath/);

    GenBank (www.ncbi.nlm.nih.gov/GenBank);

    MODBASE (guitar.rockefeller.edu/modbase/);

    PDB (www.rcsb.org/pdb/);

    SWISS-PROT (www.ebi.ac.uk/swissprot);

    CAZY (http://afmb.cnrs-mrs.fr/CAZY/);

    BRENDA (www.brenda.uni-koeln.de).

    Sites interligados aos citados acima foram acessados para implementao de

    recursos e complementao de dados. Atualmente, um dos servidores mais completos e

    aquele que clama ser o mais freqentemente atualizado o CAZY. BRENDA to

    vasto quanto CAZY e com mais recursos computacionais, otimizando temporalmente a

    extrao de dados de seqncias completas (sem extrao dos domnios). Desta forma, o

    banco de dados BRENDA foi escolhido para a extrao dos dados e CAZY para o

    estudo estrutural das protenas includas na anlise. Foram selecionadas para anlise 229

    seqncias com tamanhos maiores que 100 aas (Tabela I).

    http://www.biochem.ucl.ac.uk/bsm/cath/http://www.ncbi.nlm.nih.gov/GenBankhttp://www.rcsb.org/pdb/http://www.ebi.ac.uk/swissprothttp://afmb.cnrs-mrs.fr/CAZY/http://www.brenda.uni-koeln.de/

  • ________________________________________________________Estudo das Xilanases

    49

    Tabela I. Lista de cdigos utilizados por este estudo para cada uma das seqncias acompanhado do cdigo da

    seqncia utilizado por CAZY, famlia a qual a seqncia pertence, organismo do qual a seqncia foi extrada e

    sua classificao sistemtica atual. As diferentes cores na tabela indicam grupos taxonmicos diferentes.

    Cdigo da

    sequencia

    Cdigo

    Cazy

    Famlia Organismo classificao

    1 P07986 10 Cellulomonas fimi Actinobacteria

    2 P55334 11 Humicola insolens Fungi ascomycetes

    4 P35811 11 Fibrobacter succinogenes Acidobacteria

    6 Q60041 10 Thermotoga neapolitana Thermotogales

    7 P00694 11 Bacillus pumilus Firmicutes

    8 P26223 10 Butyrivibrio fibrisolvens Firmicutes

    9 P83513 11 Pseudobutyrivibrio xylanivorans Firmicutes

    10 P07529 10 Cryptococcus albidus Fungi basidiomycota

    11 P26515 11 Streptomyces lividans Actinobacteria

    12 P55335 11 Magnaporthe grisea Fungi ascomycetes

    13 P29126 10 Ruminococcus flavefaciens Firmicutes

    14 P45796 43 Paenibacillus polymyxa Firmicutes

    15 P55329 11 Aspergillus niger Fungi ascomycetes

    16 P84195 10 Gloeophyllum trabeum Fungi basidiomycota

    17 P36217 11 Trichoderma reesei Fungi ascomycetes

    18 P35809 11 Schizophyllum commune Fungi basidiomycota

    19 Q53317 16 Ruminococcus flavefaciens Firmicutes

    20 Q12603 10 Dictyoglomus thermophilum Dyctioglomi

    21 P36218 11 Trichoderma reesei Fungi ascomycetes

    22 Q12667 11 Piromyces sp Neocallimastigomycota

    23 P45705 10 Bacillus stearothermophilus Firmicutes

    24 P23551 10 Butyrivibrio fibrisolvens Firmicutes

    25 P55333 11 Emericella nidulans Fungi ascomycetes

    26 P45703 10 Bacillus stearothermophilus Firmicutes

    27 P14768 10 Pseudomonas fluorescens Gama proteobacteria

    28 P54865 11 Cellulomonas fimi Actinobacteria

    29 P09850 11 Bacillus circulans Firmicutes

    30 P48824 11 Aspergillus kawachi Fungi ascomycetes

    31 P17137 11 Clostridium saccharobutylicum Firmicutes

    32 P23030 10 Pseudomonas fluorescens Gama proteobacteria

    33 P55328 11 Aspergillus awamori Fungi ascomycetes

    34 P55332 11 Emericella nidulans Fungi ascomycetes

    35 P55330 11 Aspergillus niger Fungi ascomycetes

    36 P48789 10 Prevotella ruminicola Chlorobi

    37 P26220 11 Streptomyces lividans Actinobacteria

    38 P23556 10 Caldocellum saccharolyticum Firmicutes

  • ________________________________________________________Estudo das Xilanases

    50

    39 P33559 10 Aspergillus kawachi Fungi ascomycetes

    40 P36917 10 Thermoanaerobacter saccharolyticum Firmicutes

    41 P33558 11 Clostridium stercorarium Firmicutes

    42 Q60037 10 Thermotoga maritima Thermotogae

    43 P48793 11 Trichoderma harzianum Fungi ascomycetes

    44 O59859 10 Aspergillus aculeatus Fungi ascomycetes

    45 Q60042 10 Thermotoga neapolitana Thermotogales

    46 P23557 10 Caldocellum saccharolyticum Firmicutes

    47 P23360 10 Thermoascus aurantiacus Fungi ascomycetes

    48 P51584 10 Clostridium thermocellum Firmicutes

    49 O60206 49 Agaricus bisporus Fungi basidiomycota

    50 P49942 10 Bacteroides ovatus Chlorobi

    51 Q06562 11 Cochliobolus carbonum Fungi ascomycetes

    52 P29417 10 Penicillium chrysogenum Fungi ascomycetes

    53 Q00177 10 Emericella nidulans Fungi ascomycetes

    54 Q8GJ44 11 Clostridium stercorarium Firmicutes

    55 O43097 11 Thermomyces lanuginosus Fungi ascomycetes

    56 P10478 10 Clostridium thermocellum Firmicutes

    57 P33557 11 Aspergillus kawachi Fungi ascomycetes

    58 P26514 10 Streptomyces lividans Actinobacteria

    59 P40942 10 Clostridium stercorarium Firmicutes

    60 P07528 10 Bacillus halodurans Firmicutes

    61 P40943 10 Bacillus stearothermophilus Firmicutes

    62 P81536 11 Paecilomyces variotii Firmicutes

    63 P40944 10 Caldicellulosiruptor sp. Firmicutes

    64 P18429 11 Bacillus subtilis Firmicutes

    66 P55331 11 Aspergillus tubingensis Fungi ascomycetes

    67 P29127 11 Neocallimastix patriciarum Neocallimastigomycota

    68 Q1XMC9 11 Flavobacterium johnsoniae Chlorobi

    69 Q3MDD9 10 Anabaena variabilis Cyanobacteria

    70 O94163 10 Aspergillus oryzae Fungi ascomycetes

    71 Q1FKL7 10 Clostridium phytofermentans Firmicutes

    72 Q0H3C1 8 uncultured bacterium Bacteria

    73 Q6QHA2 11 uncultured bacterium Bcateria

    74 Q7UU28 nc Rhodopirellula baltica Plactomycetes

    75 Q0Q592 11 Alternaria sp. Fungi ascomycetes

    76 Q12562 11 Aureobasidium pullulans Fungi ascomycetes

    77 O30700 10 Bacillus sp. Firmicutes

    78 Q7UFF3 nc Rhodopirellula baltica Plactomycetes

    79 Q3BMC4 10 Xanthomonas campestris Gama proteobacteria

  • ________________________________________________________Estudo das Xilanases

    51

    80 Q9HEP2 11 Bipolaris sorghicola Fungi ascomycetes

    81 Q9HGX1 10 Agaricus bisporus Fungi basidiomycota

    82 Q1FPL8 11 Clostridium phytofermentans Firmicutes *

    83 Q59301 10 Cellvibrio mixtus Gama proteobacteria

    85 Q0LVJ0 10 Caulobacter sp. Alpha proteobacteria

    86 Q45VU9 11 Paenibacillus polymyxa Firmicutes

    87 O74717 10 Claviceps purpurea Fungi ascomycetes

    88 Q2I0I8 11 Aspergillus sulphureus Fungi ascomycetes

    89 Q9HDL7 11 Cochliobolus heterostrophus Fungi ascomycetes

    90 P93187 10 Hordeum vulgare Spermatophyta

    91 Q11T96 10 Cytophaga hutchinsonii Chlorobi

    92 Q59257 11 Bacillus sp. Firmicutes

    93 Q5K2M7 nc Bacillus licheniformis Firmicutes

    94 Q9HEN3 11 Cochliobolus spicifer Fungi ascomycetes

    95 Q9HFH0 11 Penicillium funiculosum Fungi ascomycetes

    96 Q60046 10 Thermoanaerobacter thermosulfurogenes Firmicutes

    97 Q1R4L7 nc Escherichia coli Gama proteobacteria

    100 Q59922 10 Streptomyces halstedii Actinobacteria

    101 Q14ST6 11 Cellulomonas flavigena Actinobacteria

    102 Q7UMH7 nc Rhodopirellula baltica Plactomycetes

    104 Q5YB84 11 Neocallimastix frontalis Neocallimastigomycota

    105 Q19N52 11 Neocallimastix frontalis Neocallimastigomycota

    106 Q9HFA4 11 Aspergillus oryzae Fungi ascomycetes

    107 Q1FPM1 10 Clostridium phytofermentans Firmicutes

    108 Q45VU6 11 Bacillus amyloliquefaciens Firmicutes

    109 Q59278 10 Cellulomonas fimi Actinobacteria

    111 A0UUT3 10 Clostridium cellulolyticum Firmicutes

    112 Q9HEN4 11 Cochliobolus spicifer Fungi ascomycetes

    113 A2R4D1 11 Aspergillus niger Fungi ascomycetes

    114 Q4H018 10 Hordeum vulgare Spermatophyta

    115 Q9AG99 11 Cellulomonas flavigena Actinobacteria

    116 O69231 10 Bacillus sp. Firmicutes

    117 O52374 43 Caldicellulosiruptor sp. Firmicutes

    118 Q59254 11 Bacillus subtilis Firmicutes

    119 Q7UT87 nc Rhodopirellula baltica Plactomycetes

    120 Q2PGV8 10 Aureobasidium pullulans var. melanigenum Fungi ascomycetes

    121 Q59675 10 Cellvibrio japonicus Gama proteobacteria

    122 Q59256 11 Bacillus sp. Firmicutes

    123 Q5NUI5 10 uncultured bacterium Bacteria

    124 Q8GJ38 10 Clostridium stercorarium Firmicutes

  • ________________________________________________________Estudo das Xilanases

    52

    125 Q9UUQ2 11 Penicillium sp. Fungi ascomycetes

    126 Q094N0 10 Stigmatella aurantiaca Delta proteobacteria

    127 Q8GJ37 10 Clostridium stercorarium Firmicutes

    128 Q7WYB0 11 Fibrobacter succinogenes Acidobacteria

    129 Q9HEN7 11 Cochliobolus heterostrophus Fungi ascomycetes

    130 Q9RQB7 10 Xylanimicrobium pachnodae Actinobacteria

    131 Q45VU5 11 Brevibacillus brevis Firmicutes

    132 Q59790 11 Ruminococcus sp Firmicutes

    133 Q7P3F6 nc Fusobacterium nucleatum Fusobacteria

    134 Q5KQS0 10 Pseudomonas sp. Gama proteobacteria

    135 Q7UM13 nc Rhodopirellula baltica Plactomycetes

    136 O13436 10 Cryptococcus adeliensis Fungi basidiomycota

    137 Q6TDT4 10 Bacillus alcalophilus Firmicutes

    138 Q6QHA3 8 uncultured bacterium Bacteria

    139 Q2PGY1 11 Penicillium citrinum Fungi ascomycetes

    140 Q7Z8Q3 11 Trichoderma viride Fungi ascomycetes

    141 Q14RS0 11 Thermobacillus xylanilyticus Firmicutes

    142 Q2PS23 10 Penicillium chrysogenum Fungi ascomycetes

    143 Q12666 11 Penicillium purpurogenum Fungi ascomycetes

    144 A2QBA9 11 Aspergillus niger Fungi ascomycetes

    145 Q6QHA0 11 uncultured bacterium Bacteria

    146 Q5NDZ1 11 Gibberella zeae Fungi ascomycetes

    147 Q4H019 10 Hordeum vulgare Spermatophyta

    148 Q60044 10 Thermotoga sp Thermotogae

    151 Q5RZ98 11 Thermomonospora fusca Actinobacteria

    152 Q47QL8 11 Thermobifida fusca Actinobacteria

    153 Q45VU2 11 Bacillus subtilis Firmicutes

    154 Q76BV3 10 Streptomyces thermoviolaceus Actinobacteria

    155 Q21GI8 10 Saccharophagus degradans Gama proteobacteria

    156 Q4ZMT4 10 Pseudomonas syringae Gama proteobacteria

    157 Q7UGG0 nc Rhodopirellula baltica Plactomycetes

    158 Q12580 11 Chaetomium gracile Fungi ascomycetes

    159 Q45UD8 11 Aspergillus usamii Fungi ascomycetes

    160 Q8TG22 11 Aspergillus niger Fungi ascomycetes

    161 A2QVZ0 43 Aspergillus niger Fungi ascomycetes

    162 Q45VU7 11 Bacillus licheniformis Firmicutes

    164 Q76BV2 11 Streptomyces thermoviolaceus Actinobacteria

    165 Q704N9 11 Pseudobutyrivibrio xylanivorans Firmicutes

    167 O52730 8 Bacillus sp. Firmicutes

    169 A1YPP6 10 Thermobifida fusca Actinobacteria

  • ________________________________________________________Estudo das Xilanases

    53

    170 P77853 11 Dictyoglomus thermophilum Dyctioglomi

    171 Q9RJ91 10 Streptomyces coelicolor Actinobacteria

    172 Q45VU3 11 Bacillus cereus Firmicutes

    173 Q12550 11 Aspergillus niger Fungi ascomycetes

    174 Q59300 11 Cellvibrio mixtus Gama proteobacteria

    175 A0UUT4 10 Clostridium cellulolyticum Firmicutes bact

    176 Q3BMC2 10 Xanthomonas campestris Gama proteobacteria

    177 Q9UVF9 11 Trichoderma viride Fungi ascomycetes

    178 O69261 10 Thermobacillus xylanilyticus Firmicutes

    179 Q21BJ6 10 Rhodopseudomonas palustris Alpha proteobacteria

    180 Q21HD6 10 Saccharophagus degradans Gama proteobacteria

    181 Q59139 10 Actinomadura sp. Actinobacteria

    182 Q1WS39 nc Lactobacillus salivarius Firmicutes

    183 Q7UF11 nc Rhodopirellula baltica Plactomycetes

    184 Q31ND9 10 Synechococcus sp. Cyanobacteria

    185 Q7UKV6 10 Rhodopirellula baltica Plactomycetes

    186 Q9HEN5 11 Cochliobolus sativus Fungi ascomycetes

    188 Q47L48 10 Thermobifida fusca Actinobacteria

    189 O74716 11 Claviceps purpurea Fungi ascomycetes

    190 P93185 10 Hordeum vulgare Spermatophyta

    191 Q9XGT8 10 Triticum aestivum Spermatophyta

    193 A0PL74 nc Mycobacterium ulcerans Actinobacteria

    194 Q9HEP3 11 Bipolaris sorghicola Fungi ascomycetes

    195 Q9P8J1 10 Penicillium purpurogenum Fungi ascomycetes

    196 O97402 11 Phaedon cochleariae Arthropoda besouro

    197 Q59674 11 Cellvibrio japonicus Gama proteobacteria

    198 Q45VU1 11 Bacillus subtilis Firmicutes

    199 Q60043 10 Thermoanaerobacterium Firmicutes

    200 Q5XQ46 10 Cryptovalsa sp. Fungi ascomycetes

    201 Q6PRW6 10 Penicillium chrysogenum Fungi ascomycetes

    202 Q6TLP3 11 uncultured bacterium Bacteria

    203 O69230 10 Bacillus sp. Firmicutes

    204 Q59150 10 Anaerocellum thermophilum Firmicutes

    205 O52373 10 Caldicellulosiruptor sp. Firmicutes

    207 A0PQI8 nc Mycobacterium ulcerans Actinobacteria

    208 Q8RJN8 8 Pseudoalteromonas haloplanktis Gama proteobacteria

    209 Q01YB0 10 Solibacter usitatus Acidobacteria

    210 Q9EW89 11 Streptomyces olivaceoviridis Actinobacteria

    211 Q12549 11 Aspergillus niger Fungi ascomycetes

    212 Q8J0K5 11 Penicillium funiculosum Fungi ascomycetes

  • ________________________________________________________Estudo das Xilanases

    54

    213 Q45F01 11 Aspergillus niger Fungi ascomycetes

    214 Q0ZHI9 11 Verticillium dahliae Fungi ascomycetes

    215 Q45VU4 11 Bacillus pumilus Firmicutes

    217 A0LRT6 10 Acidothermus cellulolyticus Actinobacteria

    218 Q1FG63 10 Clostridium phytofermentans Firmicutes

    219 Q6QJ75 11 Aspergillus niger Fungi ascomycetes

    220 Q9HEN6 11 Cochliobolus sativus Fungi ascomycetes

    221 Q5ZNB1 10 Penicillium funiculosum Fungi ascomycetes

    222 Q70WH8 11 Polyplastron multivesiculatum Protozorio ciliophoro

    223 Q1FLY3 10 Clostridium phytofermentans Firmicutes

    224 Q024A6 10 Solibacter usitatus Acidobacteria

    225 Q4H017 10 Hordeum vulgare Spermatophyta

    227 Q6QHA1 11 uncultured bacterium Bacteria

    229 O52375 11 Caldicellulosiruptor sp. Firmicutes

    230 Q7WYB1 11 Fibrobacter intestinalis Acidobacteria

    231 Q3S401 11 Aspergillus sulphureus Fungi ascomycetes

    232 Q7Z948 10 Volvariella volvacea Fungi basidiomycota

    233 Q15SG8 10 Pseudoalteromonas atlantica Gama proteobacteria

    234 Q3YAW6 10 Cellulomonas fimi Actinobacteria

    235 Q19N51 11 Neocallimastix frontalis Fungi Neocallimastigomycota

    236 Q12579 11 Chaetomium gracile Fungi ascomycetes

    237 Q09E20 10 Stigmatella aurantiaca Delta proteobacteria

    238 Q9RQB8 11 Xylanimicrobium pachnodae Actinobacteria

    239 Q2K5B0 10 Rhizobium etli Alpha proteobacteria

    240 A2R5J7 11 Aspergillus niger Fungi ascomycetes

    241 A2QFV7 10 Aspergillus niger Fungi ascomycetes

    242 P93186 10 Hordeum vulgare Spermatophyta

    243 Q704P0 11 Pseudobutyrivibrio xylanivorans Firmicutes

    244 Q0M5K3 10 Caulobacter sp. Alpha proteobacteria

    245 Q45VU8 11 Paenibacillus macerans Firmicutes

    246 Q59962 11 Streptomyces sp. Actinobacteria

    247 Q3BMC7 10 Xanthomonas campestris Gama proteobacteria

    Essas 229 seqncias foram submetidas a alinhamento e reconstruo topolgica

    com base em parcimnia por meio de anlise dinmica implementada em POY 4 (Varn

    et al. 2008). Vrios grupos de dez construes de Wagner seguidos dos comandos select

    () e swap() foram realizados seguidos de um ltimo comando select(). Dessa forma, um

  • ________________________________