(sthael) (singer) phillips-mora por modelagem comparativa
Post on 08-Jan-2017
224 Views
Preview:
TRANSCRIPT
, seu
UNIVERSIDADE ESTADUAL DE FEIRA DE SANTANA
PROGRAMA DE PÓS-GRADUAÇÃO EM BIOTECNOLOGIA
MANOELITO COELHO DOS SANTOS JUNIOR
DETERMINAÇÃO ESTRUTURAL DA ENZIMA PIROFOSFORILASE DO FUNGO MONILIOPHTHORA
PERNICIOSA (STHAEL) (SINGER) PHILLIPS-MORA POR MODELAGEM COMPARATIVA
Feira de Santana, BA 2007
MANOELITO COELHO DOS SANTOS JUNIOR
DETERMINAÇÃO ESTRUTURAL DA ENZIMA PIROFOSFORILASE DO FUNGO MONILIOPHTHORA
PERNICIOSA (STHAEL) (SINGER) PHILLIPS-MORA POR MODELAGEM COMPARATIVA
Dissertação apresentada ao Programa de Pós-graduação em Biotecnologia, da Universidade Estadual de Feira de Santana, como requisito parcial para obtenção do título de Mestre em Biotecnologia. Orientador: Prof. Dr. Alex Gutterres Taranto Co-orientador: Prof. Drª Sandra Aparecida de Assis
Feira de Santana, BA 2007
Aos meus pais e a pessoa que me proporcionou os momentos mais felizes de minha vida.
AGRADECIMENTOS
A minha mãe, Aldezira Mascarenhas, por todo o amor e dedicação durante todas as etapas de
meu desenvolvimento, sem ela eu não conseguiria chegar onde estou. Ao meu pai, Manoelito
Coelho, devido ao incentivo dado nas horas mais difíceis. A meu irmão, Ailton Mascarenhas,
pelo companheirismo, amizade e incentivo.
A meu orientador professor Alex Gutterres pela dedicação e atenção dada durante a
construção deste trabalho e também pelos incentivos e apoio nos momentos mais
complicados, fatos estes que nem mesmo a distância conseguiu atrapalhar.
A minha co-orientadora Sandra Assis pela amizade e pelos incentivos dados, contribuindo
para meu desenvolvimento profissional.
Aos amigos do Laboratório de Modelagem Molecular, Franco Henrique e André Teles por
todo o companheirismo e ajuda, e por mostrar que a união no ambiente de trabalho ajuda
muito no desenvolvimento de qualquer atividade.
As minhas estagiárias de OURO, Vivian Miranda, Nara Andrade e Priscila Gonçalves, que
participaram de maneira marcante no desenvolvimento deste trabalho.
E aos amigos Vitor Francisco, Josimar Santos, Boni Sena, Larissa Morgan e Danyo Maia que
incentivaram em todos os momentos.
Ao programa de Pós-Graduação em Biotecnologia UEFS/FIOCRUZ-Ba pelos incentivos
dados para a construção deste trabalho.
A Fundação de Amparo a Pesquisa da Bahia (FAPESB), ao Conselho Nacional de
Desenvolvimento Científico e Tecnológico (CNPq) e a Financiadora de Estudos e Projetos
(FINEP) pelos incentivos financeiros para o desenvolvimento deste trabalho.
Conhecimento real é saber a extensão da própria ignorância (Confúcio).
RESUMO
A doença vassoura-de-bruxa, causada pelo fungo Moniliophthora perniciosa (Sthael)
(Singer) Phillips-Mora, é uma das enfermidades que mais afeta a produção do cacaueiro.
Reduzindo, assim, drasticamente o rendimento das lavouras nas diferentes regiões produtoras
do continente americano, sendo, atualmente, considerada a mais importante doença da lavoura
cacaueira da Bahia e da Amazônia brasileira. O presente trabalho teve como principal
objetivo a determinação estrutural (3D) da pirofosforilase por modelagem comparativa, que é
uma das enzimas encontrada na via metabólica da síntese de quitina. Após a liberação da
respectiva seqüência primária, esta foi submetida ao BLASTp obtendo-se a proteína 1JV1
com 46% de similaridade estrutural como molde. No entanto, como esta não possui as
coordenadas atômicas de duas regiões, um refinamento prévio do molde foi necessário
obtendo uma proteína resultante (CILA3) com 99,7% dos aminoácidos em regiões
energeticamente favoráveis segundo o gráfico de Ramachandran. A seguir, uma etapa de
validação foi executada para determinar o valor de cutoff e a melhor metodologia para o
sistema, obtendo 14Ǻ e a metodologia MM3 como resultado desse processo, respectivamente.
Assim, cinco estruturas modelos (MCJ1-MCJ5) foram criadas a partir da estrutura molde
(CILA3), sendo quatro (MCJ1-MCJ4) obtidos através do protocolo do BioMedCache e um
único modelo (MCJ5) pelo DeepView. Dentre os modelos contruídos, o MCJ4 foi o mais
satisfatório após refinamento e validação pelo PROCHECK. Este apresentou 94,9% dos
aminoácidos em regiões energeticamente favoráveis e um valor de rms de 1,2Ǻ quando
comparado com CILA3. Por este modelo foi possível constatar que a proteína pirofosforilase
pertence a familia α+β. A seguir estudos de docking, cálculo de energia livre e orbitais de
fronteira (HOMO e LUMO) foram executados para que se possa ter uma melhor compreenção
do mecanismo enzimático. Com estes estudos, foi possível identificar que a pirofosforilase do
fungo M. perniciosa não apresenta um bolsão hidrofóbico muito comum em outras
pirofosforilases. Os orbitais HOMO e LUMO localizaram-se sobre o átomo de oxigênio da
Glu304 e nos átomos de fósforos do ligante, respectivamente. Esta informação pode
contribuir para o desenvolvimento de novos fungicidas no combate da doença vassoura-de-
bruxa.
Palavras-chave: Pirofosforilase, Modelagem Comparativa, Moniliophthora perniciosa.
ABSTRACT
The Witche’s broom is a serious fungal disease of cocoa caused by Moniliophthora
perniciosa (Sthael) (Singer) Phillips-Mora, which reduces drastically the cocoa production in
different regions in the American continent. The witche’s broom is considered the most
important cocoa disease in Brazil. The main objective of this study was to evaluate the
structural determination (3D) of pyrophosphorylase, one of the enzymes of the metabolic way
of quitin synthesis, through comparative modeling. After the release of respective primary
sequence, this was submitted to the BLASTp resulting in the 1JV1 protein with 46% of
structural similarity as a template. However, this protein had not determinated the atomic
coordinates of two regions by ray-X. Thus, a previous refinement of the template was
necessary to build the whole protein. The result protein was denoted by CILA3, which had
99.7% of aminoacids in energetically favorable regions according to the Ramachandran plot.
Following, a validation stage was carried out to determinate the cutoff value and the best
methodology for this system. The cutoff value of 14Ǻ and the MM3 methodology were
obtained by this process, respectively. Thus, five models (MCJ1-MCJ5) were created from the
CILA3, being four (MCJ1-MCJ4) obtained through BioMedCache´s protocol and a model
(MCJ5) through the DeepView program. Among the models constructed by both protocols,
the MCJ4 was the most satisfactory after the refinement by DM simulations and validation
using PROCHECK software. This model showed 94.9% of aminoacids in energetically
favorable regions and a rms value of 1.2Ǻ, when this is compared with CILA3. This final
model showed a protein with characteristics typical of pyrophosphorylase, which belongs to
the family α+β. After, docking, free energy and frontier orbital (HOMO and LUMO) were
performed to obtain more information about enzymatic mechanism. These studies showed
that pyrophosphorylase from M. perniciosa has not a hydrophobic pocket that is very
common in other pyrophosphorylase. Orbital HOMO and LUMO were centered on the
oxygen atom of Glu304 and phosphorus atoms of ligant, respectively. These studies can
contribute to the development of new fungicides against the witche’s broom.
Keywords: Pyrophosphorylase, Comparative Modeling, Moniliophthora perniciosa
LISTA DE FIGURAS
Figura 1: Comparação entre partes do cacaueiro antes e após a infecção. Em I está mostrado uma plantação de cacau, em II folhas normais e III um fruto em perfeitas condições para consumo. IV fica evidente a mudança no tronco da árvore após a infecção, assim como nas folhas e frutos, V e VI respectivamente.
16
Figura 2: Segmento de quitina com unidades de N-acetil-D-glicosamina em ligações (α1→4).
19
Figura 3: Metabolismo de quitina. 20
Figura 4: Formação de UDP-N-acetilglicosaina devido à ação da pirofosforilase sobre acetilglicosamina-1-fosfato.
21
Figura 5: Estrutura da UDP-N-acetilglicosamina. 22
Figura 6: Interações hidrofílicas (A) e hidrofóbicas (B) entre a acetilglicosamina e o sítio ativo da enzima pirofosforilase.
23
Figura 7: Etapas da modelagem comparativa para a construção de modelos 3D de receptores, a direita de cada etapa se encontram exemplos de programas que podem ser utilizados
27
Figura 8: Equação clássica dos métodos empíricos. 31
Figura 9: Seqüência de aminoácidos da 1JV1 indicando as regiões sem estrutura 3D determinada.
42
Figura 10: Estruturas 3D dos GAP 1 e 2 após otimização por MM3. 42
Figura 11: Gráfico de Ramachandran para os GAP-1 (A) e GAP-2 (B). 43
Figura 12: Ligação de hidrogênio entre o O32 e H155 da His6, e entre o O87 e H88 da Asp11 do GAP-1.
44
Figura 13: Resultados encontrados nas simulações de Dinâmica Molecular utilizando-se as temperatura de 100K (A), 200k (B) e 300K (C) para o GAP 1. A figura mostra os confôrmeros de menor energia.
45
Figura 14: Gráficos de Ramachandran das estruturas com menor energia geradas após cálculos de Dinâmica Molecular. A - temperatura de 100K; B – temperatura de 200K; C – temperatura de 300K.
46
Figura 15: Resultados das dinâmicas moleculares do GAP-2. A - temperatura de 100K; B – temperatura de 200K; C – temperatura de 300K.
47
Figura 16: Gráfico de Ramachandran da 1JV1 após a adição dos GAP, correções
estruturais e neutralização.
48
Figura 17: Gráfico de Ramachandran da 1JV1: A) estrutura cristalina extraída do PDB; B) Otimizada pelo Amber; C) Otimizada pelo UFF; D) Otimizada por MM3; E) Otimizada por MOZYME-PM5.
50
Figura 18: Alinhamento realizado pelo Clustal W entre a proteína 1JV1 e a seqüência problema. Os resíduos conservados estão marcados com “*”, “:” indicam substituições conservadas e “.” denota regiões semi-conservadas
51
Figura 19: Modelo MCJ1. Em evidência a região sem estrutura terciária definida. 52
Figura 20: Gráfico de Ramachandran gerado pelo programa PROCHECK para o modelo MCJ1.
53
Figura 21: Modelo MCJ2. 54
Figura 22: Modelo MCJ3 construido os circulos indicam ligações com comprimento superior a 3Ǻ.
55
Figura 23: Alinhamento entre o molde 1JV1 e a seqüência da pirofosforilase. Os retângulos indicam as regiões onde foram inseridos aminoácidos na seqüência da
56
pirofosforilase.
Figura 24: Modelo MCJ4 57
Figura 25: Gráfico de Ramachandran gerado pelo programa PROCHECK para o modelo MCJ4.
58
Figura 26: Gráfico de Ramachandran para cada um dos aminoácidos do modelo MCJ4, o valor entre parênteses indica o numero do aminoácido correspondente na sequência da MCJ4
59
Figura 27: Seqüência de aminoácidos da MCJ4 evidênciando aqueles que estão localizados dentro das regiões desfavorecidas. Em azul a localização destes aminoácidos na proteína
60
Figura 28: Qualidade da cadeia principal do modelo MCJ4: a-Avaliação do gráfico de Ramachandran; b-Planaridade da ligação peptídica; c-Interações ruins; d-Distorção dos carbonos alfa; e-Energia das ligações de hidrogênio; f- Fator-G
61
Figura 29: Resultado encontrado após a simulação de DM para o modelo MCJ4. 62
Figura 30: Resultado da sobreposição feita pelo DeepView 3.7 para a construção do modelo MCJ5, na parte superior é possíve observar os moldes utilizados para a construção
63
Figura 31: Modelo MCJ5 contruido no DeepView 3.7 64
Figura 32: Gráfico de Ramachandran gerado pelo programa PROCHECK para o modelo MCJ5.
65
Figura 33: Gráfico de Ramachandran para cada um dos aminoácidos do modelo MCJ5. O valor entre parenteses indica o numero do aminoácido correspondente na seqüência da MCJ5
66
Figura 34: Sequência de aminoácidos da MCJ5 na qual os aminoácidos sombreados indicam aqueles que estão localizados dentro as regiões desfavorecidas de acordo com o gráfico de Ramachandran. A estrutura abaixo indica a localização destes aminoácido na proteína, os mesmos encontram-se marcados de azul
67
Figura 35: Qualidade da cadeia principal do modelo MCJ5: a-Avaliação do gráfico de Ramachandran; b-Planaridade da ligação peptídica; c-Interações ruins; d-distorção dos carbonos alfa; e-Energia das ligações de hidrogênio; f- Fator-G
68
Figura 36: Localização da UDP-N-acetilglicosamina no sitio ativo da enzima 1JV1 69
Figura 37: Alinhamento entre a proteína molde 1JV1 e os modelos MCJ4 e MCJ5. As regiões em vermelho indicam os aminoácidos que fazem parte do sítio ativo da enzima. A região em verde indica a porção semi-conservada responsável pela transferência do grupamento UDP.
70
Figura 38: Comparação entre a posição espacial dos aminoácidos que compõem o sítios ativos dos modelos construídos: A) Sítio ativo do modelo MCJ4; B) Sítio ativo do modelo MCJ5.
71
Figura 39: A- Localização do ligante no sítio ativo do modelo MCJ4. B- Em detalhe o ligante e os aminoácidos que fazem parte do sítio ativo da enzima
72
Figura 40: Ligações de hidrogênio identificadas após a otimização do complexo MCJ4-ligante. Em vermelho os aminoácidos e em azul as ligações de hidrogênio.
73
Figura 41: Orbitais de fronteira. As cores verde e azul indicam a distribuição do orbital HOMO, equanto as cores amarelo e vermelho mostram a distribuição do orbital LUMO. A) Complexo ligante-proteína; B) Sítio ativo; C) Ligante.
74
LISTA DE TABELAS
Tabela 1: Valores de energia relativa encontrados para os GAP 1 e 2, após os cálculos de dinâmica molecular.
44
Tabela 2: Valores de cutoff, energia relativa e tempo computacional encontrados para a proteína 1JV1.
49
Tabela 3: Valores de energia encontrados após as simulações de DM. 75
SUMÁRIO
1 INTRODUÇÃO 13
2 REVISÃO DA LITERATURA 15
2.1 A VASSOURA DE BRUXA 15
2.2 O FUNGO MONILIOPHTHORA PERNICIOSA 17
2.3 A PAREDE CELULAR DOS FUNGOS 18
2.4 METABOLISMO DA QUITINA 19
2.5 UDP-N-ACETILGLICOSAMINA PIROFOSFORILASE 20
3 MODELAGEM COMPARATIVA 24
4 MATERIAIS E MÉTODOS 37
4.1 DETERMINAÇÃO DA ESTRUTURA 3D 37
4.1.1 Identificação e alinhamento seqüencial da proteína molde 37
4.1.2 Validação dos métodos de MM e semi-empírico 38
4.1.3 Construção e refinamento do modelo 39
4.2 ESTUDOS DE DOCKING E CÁLCULO DE ENERGIA LIVRE 40
5 RESULTADOS E DISCUSSÕES 41
6 CONCLUSÕES 78
REFERÊNCIAS 80
1. INTRODUÇÃO
A cultura do cacau marcou época na economia brasileira, sendo uma das principais
fontes geradoras de divisas da década de 70. Nesta época, cerca de 90% da produção era
destinada à exportação (BASTOS, 1987). A partir de 1989, ocorreu uma queda da produção
de cacau, o que, em parte, pode ser explicado pelo surgimento e desenvolvimento do fungo
Moniliophthora perniciosa (Stahel) Singer, que é responsável por uma doença conhecida
como vassoura-de-bruxa do cacaueiro (PEREIRA et al., 1990). É uma enfermidade
responsável por danos que compreendem efeitos econômicos e sociais, além do impacto
agronômico imediato. E devido a ela o Brasil passou a importar o produto. Em 2000, foram
importadas cerca de 71.000 toneladas de amêndoas de cacau (COMPANHIA DAS DOCAS
DO ESTADO DA BAHIA, 2002).
Devido ao impacto socioeconômico decorrente desta enfermidade, os governos
Estaduais, Federais e produtores discutem medidas que possam solucionar ou amenizar o
problema nas lavouras de cacau. Atualmente, uma das recomendações da Comissão Executiva
do Plano da Lavoura Cacaueira (CEPLAC) para a reabilitação de plantas suscetíveis à
vassoura-de-bruxa é o uso de variedades clonais resistentes, por meio da enxertia, combinado
com aplicação de fungicidas cúpricos, como o óxido cuproso, para o controle da doença
(ROSA, 1998). No entanto, esta metodologia não mostra resultados muito satisfatórios, pois
estes fungicidas não protegem tecidos em crescimento, necessitando de inúmeras
pulverizações (CRONSHAW, 1979).
Vários compostos químicos vêm sendo testados com o objetivo de prevenir ou erradicar
a vassoura-de-bruxa, porém os resultados não têm sido satisfatórios, pois o rápido
crescimento da superfície dos frutos durante os dois ou três meses de desenvolvimento faz
com que o fungicida tenha que ser aplicado freqüentemente, entretanto, isto é especialmente
difícil em árvores muito altas (SOBERANIS et al., 2000).
Inibidores da biossíntese da parede celular bacteriana, como as penicilinas e
cefalosporinas, têm apresentado bons resultados no controle de infecções bacterianas. Desta
forma, a parede celular dos fungos é um bom alvo para o desenvolvimento de potentes
antifúngicos (GRIFFITH, TRACY, 2002). A UDP-N-acetlglicosamina, a forma ativa da
acetilglicosamina, é o precursor chave nas N- e O- alquilações, como também é essencial para
14
a síntese de quitina, o maior componente da parede celular de fungos (HERSCOVICS;
ORLEAN, 1993). Na busca por um controle efetivo da vassoura-de-bruxa, escolheu-se a rota
metabólica que leva a síntese da quitina. O alvo nessa via metabólica é a enzima
pirofosforilase que é a responsável em realizar a reação que forma UDP-N-acetlglicosamina.
Desta forma, a inibição da formação de UDP-N-acetlglicosamina afetará a formação de
quitina e assim a síntese da parede celular, um componente crucial para o desenvolvimento do
fungo.
O desenvolvimento racional de novos antifúngicos de baixo peso molecular baseia-se na
obtenção de substâncias detectadas por screening bioquímico completo. Levando, assim, em
consideração a relação quantitativa entre a estrutura e a atividade biológica; e elucidação de
interações ligante-enzima alvo, idealmente com um modelo tridimensional (RAST, 2003).
Desta forma, este trabalho visa à obtenção da enzima pirofosforilase e sua determinação
estrutural através de modelagem comparativa (Homologia), permitindo o desenvolvimento da
pesquisa de novos antifúngicos cada vez mais seletivos e eficazes. Patrick (2001) relata que
esta estratégia poderá levar a novos compostos com atividade biológica desenvolvidos de
forma racional, ou seja, leva ao desenvolvimento de substâncias quimicamente capazes de se
ligar a uma proteína específica e, assim, inibir ou estimular sua ação biológica, através do
conhecimento do mecanismo de ação.
O trabalho justifica-se nos impactos provocados pela vassoura-de-bruxa, pois esta causa
a queda de produção, aumento dos custos e gastos diretos em função do uso de medidas de
controle, afetando diretamente o produtor e o preço do produto, atingindo de forma indireta o
consumidor. Além de impactos sócios econômicos resultantes da menor produção de cacau,
outras mudanças ocorrem na região produtora da Bahia, como: uso da terra, venda de
propriedades, nível de emprego e danos ao meio ambiente (TREVIZAN, 1996).
15
2. REVISÃO DA LITERATURA
2.1. A VASSOURA DE BRUXA
A vassoura-de-bruxa foi observada inicialmente em 1700, mas a investigação científica
sobre a devastação que esta doença causa em plantações iniciou-se em 1890 por Gregor
Stahel, que isolou e nomeou o fungo causador - Marasmius perniciosa. A vassoura de bruxa
já foi detectada na Bolívia (1989), Brasil (Bahia e Região da bacia Amazônica) (1989),
Colômbia (1917), Equador (1921), Granada (1948), Guiana (1906), Panamá (1989), São
Vicente (1988), e em Trindade e Tobago (1939) (PURDY; SCHMIDT, 1996). Atualmente
distribui-se nas regiões da América do Sul e do Caribe podendo também ser encontrado no
Panamá. Neste caso, a disseminação ocorreu do lado da América do Sul (PURDY, 2005).
Na região costeira da Mata Atlântica da Bahia, a incidência da vassoura-de-bruxa foi
observada pela primeira vez em 1989. A alta densidade de plantações de cacau aliada à falta
de um período seco contribuiu para o estabelecimento e propagação da vassoura-de-bruxa. Na
cidade de Ilhéus-BA, uma grande área de plantações de cacau foi infectada pela vassoura-de-
bruxa, segundo dados da Companhia das Docas do Estado da Bahia (2002), até 1989, data em
que a vassoura-de-bruxa chegou à Bahia. Este estado correspondia à cerca de 84,5% da
produção nacional e 15% da mundial de cacau. Com a ocorrência da doença na região
cacaueira baiana, a produção caiu drasticamente transformando o Brasil de exportador a
importador de cacau.
A vassoura-de-bruxa é uma das mais importantes doenças do cacau, ocorrendo
principalmente nos países da América do Sul. No Brasil, atinge as lavouras cacaueiras da
Bahia e da Amazônia, causando perdas de até 90% da produção (PURDY; SCHIMIDT,
1996). A vassoura-de-bruxa provoca um superbrotamento das partes terminais do cacaueiro,
possuindo sintoma característico à formação dos brotos hipertrofiados de excessivo
desenvolvimento, aparentando vassoura - surgindo daí, o nome da doença. De início, o
desenvolvimento da doença é rápido, porém depois de 5 a 6 semanas começa a secar, podendo
cair ou ficar aderente à árvore (PEREIRA, 1990).
16
A infecção tem início quando os basidiósporos germinam e penetram no tecido
meristemático e vagens da planta originando assim o estágio biotrófico da colonização. Com
isso, ocorre uma hipertrofia ou hiperplasia das células hospedeiras. Esse intumescimento leva
a parte atingida a ter uma aparência de uma vassoura-de-bruxa. Essas vassouras, quando
jovens, têm uma coloração verde, mas morrem com 1 a 2 meses dando uma coloração marrom
as árvores infectadas, devido a necrose ocasionada pela colonização (estágio saprofítico). A
infecção mais grave ocorre nas flores jovens e nos frutos que estão no tronco (Fig. 1). Como o
fungo responsável pela infecção que leva a vassoura-de-bruxa acomete plantas em
desenvolvimento, a utilização de fungicidas não apresenta efetividade ficando o controle
biológico como alternativa estratégica para o combate a propagação da vassoura-de-bruxa
(GRIFFITH et al., 2003; RUBINI et al, 2005; PEREIRA, 1990).
Figura 1: Comparação entre partes do cacaueiro antes e após a infecção. Em I está mostrado uma plantação de cacau, em II folhas normais e III um fruto em perfeitas condições para consumo. IV mostra o tronco da árvore após a infecção, assim como nas folhas e frutos, V e VI respectivamente.
Fonte: BOTANISCHER GARTEN, 2007; NEW CROP, 2007.
As patologias relacionadas às plantas têm como principal causa patógenos do tipo
Ascomicetos, Oomicetos ou Heterobasidiomicetos. Fungos agáricos raramente causam
I II III
IV V VI
17
infecções em plantas, um exemplo bem conhecido é a infecção de raízes causada por
Armillaria mellea. Nestas condições, a vassoura-de-bruxa pode ser considerada uma doença
inesperada, uma vez que a sua causa é um Basidiomiceto, mais precisamente pelo
Moniliophthora perniciosa, cuja infecção causa deformação de tecidos verdes (GRIFFITH et
al., 2003).
2.2. O FUNGO MONILIOPHTHORA PERNICIOSA
O fungo M. perniciosa pertence à divisão Eumycota, subdivisão Basidimycotatina,
ordem agaricales e família Tricholomataceae (LANA, 2000). Foi identificado inicialmente
por Stahel, como Marasmius perniciosus, e posteriormente foi transferido por Singer para
outro gênero, Crinipellis, o que foi endossado por outros pesquisadores (BRANDEAU, 1992).
No entanto, a classificação sofreu uma reformulação, por meio de análises filogenéticas de
cinco regiões de genes nucleares (28S rDNA, 18S rDNA, RPB1 e EF1-α), Aime e Phillips-
Mora (2005) determinaram que os fungos C. perniciosa e Moniliophthora roreri pertencem
ao mesmo grupo taxonômico. Desta forma, o C. perniciosa passou a ser denominado de
Moniliophthora perniciosa.
O fungo M. perniciosa é um patógeno destrutivo, causador da vassoura-de-bruxa em
cacau (Theobroma cacao). Desde a sua ocorrência na costa do Equador, em 1984, este fungo
representa, atualmente, um dos principais fatores limitantes na produção de cacau na América
do Sul e nas Ilhas do Caribe, tendo assumido o papel de mais importante patógeno do
cacaueiro. Além disso, sua disseminação acompanhou a do T. cacao na Bacia Amazônica,
atualmente ambos são endêmicos nesta região (GRIFFITH et al, 1994). Originário da bacia
Amazônica, este fungo infecta plantas da família Malvaceae, Solanaceae, Bignoniaceae,
Bixácea e Malpighiaceae (RINCONES at al, 2006).
A grande variabilidade de hospedeiros do M. perniciosa permite separá-lo em grupos de
acordo com o gênero que infectam, denominados biótipos. Desta forma, há três biótipos
caracterizados: o biótipo Cacau (biótipo-C), que tem como hospedeiro as espécies do gênero
Theobroma, principalmente o T. cacao; o biotipo Solanacea (biótipo-S) que infetam as
18
espécies da família Solanaceae, e o biótipo Liana (biótipo-L) que são encontrados em lianas e
cipós das famílias Malpighiaceae e Bignoneaceae (PURDY, 2005). O biótipo Bixa é
considerado o quarto biótipo e foi relatado por Bastos e Andebrahn (1986) apud Leal Júnior et
al (2005), mas não foi notificada a produção de basidiocarpos nos ramos infetados. Um quinto
biótipo, o biótipo-H, foi sugerido por Griffith et al. (2003) no qual se enquadra o Heteropterys
acutifolia A. Juss.
O M. perniciosa é um patógeno hemibiotrófico nos quais os basidiósporos são as únicas
estruturas do fungo em condições naturais capazes de infectar os tecidos meristemáticos do
Theobroma cacao e várias outras espécies do gênero Theobroma e Herrania (todos os
membros da família Sterculiaceae). Estes são produzidos em lamelas, na região inferior do
píleo do basidiocarpo, onde os dois núcleos nas células da hifa dicariótica da camada do
himênio migram para o interior da basídia enquanto ocorre fusão nuclear. As condições
climáticas ideais para a liberação dos basidiósporos são a umidade do ar próximo a saturação
e temperaturas em torno de 20 a 30 ºC (GRIFFITH et al, 2003; PURDY; SHMIDT, 1996).
Os basidiósporos do M. perniciosa não têm grande disseminação. No entanto, devido à
curta distância entre as árvores da plantação de cacau, a disseminação tornou-se mais
devastadora. As pessoas que transitam nas regiões infectadas também contribuíram para a
propagação da vassoura-de-bruxa, podendo ser consideradas como os principais vetores de
transmissão da doença (GRIFFITH et al, 2003).
2.3. A PAREDE CELULAR DOS FUNGOS
A quitina é um homopolissacarídeo composto por resíduos de N-cetil-D-glicosamina em
ligação -β (ou β-(1→4) 2-acetoamido-2-deoxi-D-glicose) (Fig. 2) (LENHNINGER,
NELSON, COX, 2000). Trata-se de uma estrutura rígida amplamente distribuída pelos
invertebrados, fungos e algas conferindo a força necessária para proteger a célula de choques
osmóticos (TRABULSI, 1999; TAKAYA et al., 1998). Nos fungos filamentosos, a quitina é o
maior componente da parede celular atuando de forma marcante para a manutenção da
integridade celular (TAKAYA et al, 1998).
19
Figura 2: Segmento de quitina com unidades de N-acetil-D-glicosamina em ligações (α 1→4).
Fonte: NELSON; COX, 2000.
2.4. METABOLISMO DE QUITINA
A ocorrência de quitina, em organismos como nematódeos, moluscos, insetos e na
parede celular de fungos e algumas algas, leva o metabolismo de quitina a ser um excelente
alvo para o desenvolvimento de estratégias para o controle da disseminação de pestes
(KRAMER; MUTHUKRISHNAN, 1997).
Apesar da quitina ser um dos mais importantes biopolímeros da natureza, o
conhecimento da sua biossíntese ainda é fragmentado, até o presente momento se conhece
quatro etapas (Fig. 3): (i) conversão da frutose-6-fosfato em glicosamina-6-fosfato, pela ação
da frutose-6-fosfato aminotransferase (EC 2.6.1.16); (ii) acetilação da glicosamina-6-fosfato
formando N-acetilglicosamina-6-fosfato, catalisada pela 2-acetilglicerolfosfoetanolamina
acetiltransferase (EC 2.3.1.4); (iii) conversão de N-acetilglicosamina-6-fosfato em N-
acetilglicosamina-1-fosfato, pela ação da N-acetilglicosamina fosfomutase (EC 5.4.2.3); (iv)
conversão da N-acetilglicosamina-1-fosfato em UDP-N-acetilglicosamina, catalisada pela
ação da UDP-N-acetilglicosamina pirofosforilase (EC: 2.7.7.23) (MIO et al., 1998; POMPEO
et al., 2001; YAMADA-OKABE et al., 2001 ).
20
Figura 3: Metabolismo de quitina
Fonte: Adaptado de Pirovani et al., 2004.
2.5. UDP-N-ACETILGLICOSAMINA PIROFOSFORILASE
A enzima UDP-N-acetilglicosamina pirofosforilase (EC 2.7.7.23) é uma proteína que
pertence à superfamília nucleotídeos-difosfo-açúcar transferase e a família UDP-glicose
pirofosforilase. Esta enzima é constituída de folhas beta paralela (beta/alfa/beta) segundo a
Structural Classification of Protein Database- SCOP (RSCB, 2000a). Sua purificação foi
21
realizada a partir de cepas de Staphylococcus aureus cerca de 30 anos atrás. No entanto, a
seqüência gênica que codifica esta enzima foi elucidada a partir de genes de Escherichia coli,
somente em 1993 (DE LUCA et al. 1996).
No ciclo de formação da parede celular, a enzima UDP-N-acetilglicosamina
pirofosforilase cliva a acetilglicosamina-1-fosfato e UTP em UDP-N-acetilglicosamina,
conforme mostra a reação abaixo (Fig. 4):
Figura 4: Formação de UDP-N-acetilglicosaina devido a ação da pirofosforilase sobre acetilglicosamina-1-fosfato.
Fonte: DE LUCA, 1996.
UDP-N-acetilglicosamina é a forma ativa da acetilglicosamina (Fig. 5). Este metabólito
intermediário tem importância central em muitos organismos (OLSEN; RODERICK, 2001).
Dentre suas funções, pode-se destacar: a) precursor de muitas biomoléculas, incluindo
lipopolissacarídeos e peptidioglicano; b) um importante precursor de glicosilações N- e O-
dirigidas, quando presentes na superfície celular. As glicoproteínas atuam como sinalizadores
para o processamento de certas reações como a identificação imunológica, desenvolvimento
de tumores e interações célula-célula; c) essencial para a síntese de quitina (principal
componente da parede celular fúngica) e glicosilfosfatidilinositol (componente de muitas
proteínas de membrana) (PENEFF et al, 2001; MIO et al, 1998).
22
Figura 5: Estrutura da UDP-N-acetilglicosamina
Fonte: RSCB, 2007
As pirofosforilases mostram um domínio central na forma α/β, este enovelamento
característico é denominado de Rossmann fold, e é constituído de oito folhas beta rodeadas
por oito alfa hélices, e nas extremidades duas pequenas regiões de folha beta. Este pequeno
domínio carboxi terminal extra é formado por 68 resíduos de aminoácidos. Em contraste com
o domínio carboxi terminal, a região amino terminal é formada por seguimentos semi-
conservados na seqüência de aminoácidos (PENEFF et al, 2001). No entanto, mesmo sendo
descontinuo esta região mostra certo grau de homologia quando comparada com enzimas de
bactérias e de outros organismos superiores. A seqüência semi-conservada inclui Leu-X2-Gly-
X-Gly-Thr-X-Met-X4-Pro-Lys. Esta região é a responsável pela reação de transferência do
UTP para a acetilglicosamina, sendo que esta reação é estimulada por vários cátions
divalentes, incluindo Mg+2, Co+2 e Mn+2 (OLSEN; RODERICK, 2001).
O modo com o qual o nucleotídeo se liga no sítio ativo da pirofosforilase é similar em
todas as enzimas. O complexo açúcar-nucleotídeo acopla-se na região central da enzima,
estabelecendo contato com a primeira metade desta região (resíduos 68-260) e em particular
com o loop composto pelos resíduos Asp221-Leu226. O açúcar é estabilizado principalmente
por ligações de hidrogênio formadas com os resíduos da segunda metade do loop central
(resíduos 261-417) (PENEFF et al, 2001).
A conformação da acetilglicosamina também tem importância para seu reconhecimento
pelo sítio ativo da enzima. O grupamento hidroxila, ligado ao C4, liga-se em conformação
equatorial por meio de ligações de hidrogênio a Gly290 e Asn327. A porção N-acetil
N
HN
OO P
P
O
O
HO
OH
OHHN
O
O
O
HO
O
O
HO
HO
OH
O
23
estabelece numerosas ligações de hidrogênio com os aminoácidos Glu303, His331 e Asn223,
e uma interação hidrofóbica com Phe381 e Phe383. Estes contatos sugerem uma
especificidade da enzima por hexosaminas acetiladas (Fig. 6). Ao contrário do açúcar e do
nucleotídeo, o grupamento fosfato é bem menos estabilizado (PENEFF et al, 2001).
Figura 6: Interações hidrofílicas (A) e hidrofóbicas (B) entre a acetilglicosamina e o sítio ativo da enzima pirofosforilase
Fonte: RSCB, 2007.
24
3. MODELAGEM COMPARATIVA
Com os recentes sucessos de projetos genomas, principalmente nas técnicas de
seqüenciamento de aminoácidos e de genes, houve um avanço no entendimento das funções
desenvolvidas pelas proteínas nas células. No entanto, para uma melhor compreensão destas
funções é necessário um estudo das interações que ocorrem entre essas biomacromoléculas.
Para isso, a estrutura 3D de uma proteína geralmente providencia um grande número de
informações sobre a forma de interação entre a arrumação espacial de aminoácidos e outras
moléculas (KUNDROTAS, ALEXOV, 2006; SÁNCHEZ, SALI, 1998; SCHWEDE et al,
2003).
Uma variedade de seqüências de nucleotídeos ou aminoácidos é mantida em banco de
dados que permanecem disponíveis via acesso da Internet. Dentre diversos banco de dados
destacam-se o European Molecular Biology Laboratory (EMBL), o qual consiste em um
banco de dados somente com seqüências de nucleotídeos, e o SWISS-PROT que é destinado
para o depósito de proteínas que tiveram sua seqüência primária elucidada. Este de forma
conjunta com o Swiss Institute for Bioinformatics e com a European Bioinformatics Institute,
oferece um alto grau de informação sobre as proteínas depositadas. Desta forma, é possível
encontrar dados como a função da proteína, domínios estruturais e a família (HÖLTJE, 2003).
Para estruturas 3D o banco de dados mais conhecido é o Protein Data Bank, o qual
possui cerca de 43.045 estruturas depositadas, este número mostra como a elucidação da
seqüência de aminoácidos é uma tarefa relativamente mais simples que a elucidação
estrutural, uma vez que o SWISS-PROT contém cerca de 264.492 estruturas depositadas
(RSCB, 2007; SWISS-PROT, 2007). Desta forma, a busca por elucidações estruturais vem
crescendo a cada dia e a inclusão de métodos computacionais com este objetivo ganhou
especial interesse nos últimos anos (SCHWEDE et al, 2003).
A determinação da estrutura 3D de proteínas pode ser realizada por técnicas
experimentais como a cristalografia de raio-X e através de Ressonância Magnética Nuclear
(RMN). No entanto, estes métodos apresentam algumas limitações como: a) nem todas as
proteínas são passíveis de serem cristalizadas; b) a cristalização pode demorar muito tempo;
c) os cristais formados são em rendimento insuficiente. Estas limitações impossibilitam que
estas técnicas sejam utilizadas em larga escala, além de serem métodos com elevado custo
25
financeiro. Por outro lado, uma estrutura 3D de uma proteína pode ser determinada por meio
de técnicas computacionais. Existem diferentes metodologias computacionais com esta
finalidade. Um exemplo é a metodologia ab inicio. O método ab initio é aquele empregado
para predição de estruturas a partir da seqüência de aminoácidos utilizando uma função
objetiva que irá depender das energias de interação e algumas vezes do conhecimento acerca
de outra seqüência relatada. Infelizmente, tais metodologias têm produzidos modelos com
enovelamento ruim e com um erro de root mean square (rms) de aproximadamente 4Ǻ, isso
quando empregados em estruturas relativamente simples. Este valor de rms obtido indica que
a estrutura do modelo esta muito diferente da estrutura do molde, uma vez que o valor ideal é
próximo de zero (SÁNCHEZ, SALI, 1998). No entanto, a metodologia melhor sucedida é
denominada de homologia ou modelagem comparativa (SÁNCHEZ, SALI, 1998), segundo a
competição da área denominada de “Critical Assessment of techniques for protein Structure
Prediction (CASP)” 1.
A metodologia de modelagem comparativa, para que possa construir um modelo,
necessita de pelo menos uma estrutura molde elucidada previamente por técnicas
experimentais, e que as seqüências (problema e molde) sejam correlacionadas
evolucionariamente a partir de um ancestral comum, possuindo função e estrutura semelhante.
Quando isto é observado, significa que estas proteínas são homólogas entre si. Pode-se então
afirmar que a elucidação experimental e a modelagem comparativa completam-se uma a outra
na busca pela exploração de estruturas protéicas (SCHWEDE et al, 2003).
A modelagem comparativa baseia-se em alguns padrões gerais observados em nível
molecular durante processo de evolução biológica: A homologia entre seqüências de
aminoácidos implica em semelhança estrutural e funcional; proteínas homólogas apresentam
regiões internas conservadas, principalmente constituídas de elementos de estruturas
secundárias – alfa hélices e folhas beta; as principais diferenças estruturais entre proteínas
homólogas ocorrem nas regiões externas, constituídas principalmente por alças (loops), que
ligam os elementos de estruturas secundárias. Outro fator de extrema relevância é que as
proteínas agrupam-se em um número limitado de famílias tridimensionais, atualmente há uma
estimativa de cerca de 5.000 famílias protéicas. Desta forma, quando se conhece pelo menos a
estrutura de um representante de uma família é possível modelar, na maioria dos casos, os
demais membros da família (SANTOS FILHOS; ALENCASTRO, 2003).
1 Este evento é bianual sendo oferecido pelo Protein Structure Prediction Center. O CASP iniciou-se em 1994 e, atualmente, encontra-se em seu sétimo evento ocorrido no ano de 2006.
26
No desenvolvimento racional de fármacos, a modelagem comparativa tem assumido
importância crucial, uma vez que a estrutura 3D do receptor fornece informações importantes
acerca das interações que ocorrem entre o novo fármaco e seu sítio de ligação, assim como é
possível otimizar moléculas já existentes. A modelagem comparativa pode ser dividida nos
seguintes passos: a) seleção da seqüência; b) identificação de seqüências homologa e
estruturas relacionadas; c) alinhamento entre as seqüencias; d) modelagem das regiões
estruturalmente conservadas; e) modelagem das regiões não conservadas; f) refinamento do
modelo e g) validação do modelo. Estas etapas, assim como os possíveis programas e cálculos
empregados, estão descritos na figura 7. Após estas etapas, o modelo pode ser submetido a
estudos de docking para o desenvolvimento de novos ligantes (PATNY, DESAI, AVERY,
2006).
A metodologia de modelagem comparativa inicia-se com o processo de alinhamento
sequencial, o qual envolve a identificação da(s) proteína(s) de referência, sendo que estas
devem apresentar adequado grau de homologia com a proteína problema. Esta etapa é seguida
da seleção do molde a ser utilizado devendo possuir pelo menos 30% de homologia com a
seqüência problema. Nesta etapa utiliza-se os métodos FASTA e BLAST (ou PSI-BLAST),
que executam um alinhamento local entre a seqüência problema contra seqüências
depositadas em um banco de dados de estruturas elucidadas por técnicas experimentais.
Dentre estes depósitos, o mais conhecido é o Protein Data Bank (PDB) (PATNY; DESAI;
AVERY, 2006). Estes métodos buscam tanto pela seqüência completa como por seqüências
parciais que combinem com a seqüência da pesquisa, e necessariamente não se extende do
começo ao fim da seqüência. Pode ser interrompido e reiniciado, finalizando em qualquer
ponto. Assim, não é garantido encontrar a melhor solução para o alinhamento por estes
métodos. No entando, estes raramente não localizam uma estrutura que tenha um bom grau de
homologia. Na prática, os métodos de alinhamento local são mais utilizados para encontrar
um conjunto de proteínas homólogas no PDB. Esta é uma etapa fundamental, uma vez que a
qualidade do modelo a ser construído e, assim, sua aplicabilidade no desenvolvimento de
novos fármacos, depende predominantemente da similaridade entre a seqüência da proteína
com a estrutura conhecida (proteína molde) e a seqüência da proteína a ser modelada
(proteína problema). Geralmente, uma similaridade de 30% entre a seqüência problema e a
seqüência molde constitui um bom indício para a construção por modelagem comparativa
(SÁNCHEZ, SALI, 1998; PATNY, DESAI; AVERY, 2006).
27
Figura 7: Etapas da modelagem comparativa para a construção de modelos 3D de receptores. A direita de cada etapa se encontram exemplos de programas que podem ser utilizados.
Assim, o PDB é o mais importante banco de dados padrão para todas as informações
estruturais em biomacromoléculas. Por causa do contínuo crescimento do número de
estruturas experimentalmente resolvidas, o banco de dados é continuamente ampliado.
Baseado no PDB, alguns pequenos bancos de dados estruturais estão sendo criados, por
exemplo, os banco de dados Homology derived Secondary Structure of Proteins (HSSP) e o
Structural Classification of Proteins (SCOP). O HSSP contém derivados homólogos de
estruturas de proteínas, a qual combina a informação do PDB e seqüências de proteínas
derivadas de bancos de dados como SWISS-PROT. O banco de dados SCOP contêm
Seleção da seqüência
Identificação da(s) seqüência(s) homóloga(s)
Alinhamento entre as seqüências
Modelagem das regiões conservadas
Modelagem das regiões não conservadas
Refinamento do modelo
Validação do modelo
BLASTp
CLUSTAL W
BioMedCache,
Sybyl
MODELLER
Swiss-Pdb Viewer
BioMedCache
Amber
Sybyl
PROCHECK WATHCHECK
28
alinhamentos detalhados de todas as proteínas com estrutura conhecida e estas são agrupadas
em famílias, concordando com sua evolução e relações estruturais. Os domínios protéicos no
SCOP são agrupados dentro de espécies e classificados hierarquicamente (BERMAN et al,
2000; HÖLTJE, 2003).
Em geral, os arquivos PDB apresentam a organização e as informações contidas nos
diferentes arquivos de dados estruturais de forma muito semelhante. O início do arquivo
fornece alguns dados que compreendem informações gerais sobre a proteína, como o nome
oficial, referências da estrutura cristalina, e algumas observações úteis da estrutura secundária
que a compõe proteína. Adicionalmente, são listadas as coordenadas atômicas (BERMAN et
al, 2003). Os átomos que pertencem ao padrão de resíduos de aminoácidos são denominados
ATOM. Para a distinção entre as cadeias peptídicas individuais, os ATOMs são separados por
uma linha adicional começando com a abreviação TER. Entre ATOMs, a ligação é geralmente
construída quando os arquivos são lidos dentro do programa de modelagem. Os átomos, que
não pertencem a resíduos de aminoácidos, recebem a denominação de HETATM. Uma tabela
de conectividade é gerada no final do arquivo somente para os ATOMs. Esta tabela, por não
considerar a conectividade dos HEATOMs, podem gerar uma estrutura incorreta, requerendo
assim uma observação mais criteriosa, principalmente do ponto de vista químico (HÖLTJE,
2003; RSCB, 2007). Adicionalmente, os átomos deste grupo podem não pertencer aos padrões
definidos para aminoácidos como, por exemplo, no caso de ligantes complexados com a
proteína. Como o tipo de átomo proposto atribuído não é reconhecido pelo PDB, é
absolutamente necessário checar com cuidado todos os tipos de átomos para evitar uma
construção errada nestes ligantes (HÖLTJE, 2003; RSCB, 2003).
Usualmente, todas as estruturas do PDB não incluem átomos de hidrogênio. Para
muitos tipos de investigação, os átomos de hidrogênio podem ser negligenciados, mas para o
estudo entre interações ligante-proteína é inevitável adicionar os hidrogênios. As ligações das
moléculas devem ser checadas com cuidado especial com a ordem para confirmar o correto
grau de protonação que foi atribuído em casos de substâncias ácidas ou básicas.
Adicionalmente, os átomos de hidrogênio nunca são alocados para todas as moléculas de
água. Como conseqüência, elas são indicadas somente como simples pontos representando as
posições dos oxigênios. Estas podem apresentar-se distribuídas pela superfície da proteína
como em seu sítio ativo. No último caso, é absolutamente necessário incluir as coordenadas
completas nas informações adicionais porque eles podem influenciar na interação entre o
ligante e a proteína. Isto também é verdadeiro para cátions encontrados na estrutura cristalina
29
que podem ter um função importante para a formação do complexo proteína-ligante ou para a
atividade enzimática (BERMAN et al, 2000; RSCB, 2003; HÖLTJE, 2003; FUJTISU, 2003).
Muitos programas de modelagem molecular podem executar o arquivo pdb sem
problemas, transformando a informação estrutural em informação 3D. No entanto, alguns
cuidados devem ser tomados no momento de se utilizar o arquivo pdb. A estrutura cristalina
deve possuir pelo menos de 2,5 a 1,5 Ǻ de resolução, pois estruturas com baixa resolução
podem não apresentam informações de valor, uma vez que a falta de resíduos ou informações
incompletas podem dificultar o processo de construção por homologia. Algumas proteínas
apresentam função bioquímica somente na forma dimérica ou trimérica. Desta forma, não há
por que trabalhar com um arquivo que contenha somente uma cadeia (HÖLTJE, 2003).
De posse de um conjunto de estrutras obtidas pelo PDB, a etapa a seguir é o emprego
dos métodos de avaliação por comparação entre seqüências múltiplas. Estes métodos são
muito úteis quando o grau de homologia entre a seqüência problema e o molde esta abaixo de
25%. O alinhamento múltiplo usualmente detecta três vezes mais relações evolucionárias que
o alinhamento simples, quando o grau de identidade esta abaixo de 30%. Um dos programas
mais utilizados para este fim denomina-se CLUSTAL W (Fig. 7). Através de programação
dinâmica, o programa utiliza modelos matemáticos para gerar o alinhamento criando tabelas
de scores entre os aminoácidos. Estas tabelas são geradas pelas matrizes PAM250 e
BLOSUM62, as quais são capazes de realizar inserções ou deleções de diferentes tamanhos.
O alinhamento realizado pelo CLUSTAL W segue três etapas: a) as seqüências são alinhadas
separadamente com o objetivo de se calcular uma matriz de distância; b) uma árvore guia é
criada a partir da matriz gerada na primeira etapa; c) a seqüência é gradualmente alinhada de
acordo com a matriz e com a árvore gerada nas etapas anteriores (THOMPSON; HIGGINS;
GIBSON, 1994). Como descrito anteriormente, o sucesso para obtenção de um modelo para
sequência problema depende desta etapa. Estudos anteriores mostram que a um grau de
homologia entre a sequência alvo e a problema de 50% pode levar a obtenção de bons
modelos, com uma estrutura bem próxima do molde. A redução para 20% pode levar a
construção de modelos com grandes diferenças estruturais, mas a geometria do sítio ativo fica
mantida, uma vez que este é bem conservada durante o processo de evolução (SÁNCHEZ,
SALI, 1998; PATNY; DESAI; AVERY, 2006).
Após selecionado a proteína molde, a etapa a seguir é a contrução do modelo. De uma
forma geral, a construção do modelo pode ser realizada pelos métodos ab initio, restrição
espacial, e por transferência de coordenadas atômicas. A metodologia de construção por
30
restrição espacial é realizada por meio da geração de um conjunto de restrições espaciais que
são aplicadas à seqüência alvo. As restrições limitam, por exemplo, a distância entre dois
resíduos no modelo que está sendo construída baseada na distância entre dois resíduos
homólogos na estrutura molde. As restrições também podem ser aplicadas a outros parâmetros
como ângulos de ligação, ângulos diedros e pares diedros, aumentando-se o número de
restrições espaciais. Assim, pode-se efetivamente reduzir o número de conformações que o
modelo poderá assumir (GIBAS; JAMBECK, 2001; ŠALI; BLUNDELL, 1993).
As restrições são baseadas em análises estatísticas de diferenças entre pares de
estruturas homologas. Desta forma, estas estatísticas contribuem como uma descrição
quantitativa de quantas propriedades podem ser variadas entres as estruturas homologas. Esta
propriedade é expressa na forma de Função de Densidade de Probabilidade (PDF), e seria, por
exemplo, a variação permitida da distância entre carbonos-alfa (GIBAS; JAMBECK, 2001;
ŠALI; BLUNDELL, 1993).
O uso de restrições baseadas em PDF permite construir um modelo que não seja
exatamente igual a estrutura de referência. Esta pequena diferença estaria compatível com as
alterações encontradas entre as proteínas homologas com estruturas conhecidas. Vale ressaltar
que as restrições espaciais não são as únicas limitações aplicadas sobre o modelo. Um campo
de força para controlar a estereoquímica também é aplicado. Com isso evita-se que o modelo
possa violar as regras da química para satisfazer as restrições espaciais derivadas das
estruturas dos modelos. Sendo assim, a metodologia de restrição espacial adota tanto
restrições espaciais quanto restrições químicas para a construção de modelos 3D (ŠALI;
BLUNDELL, 1993; GIBAS; JAMBECK, 2001).
Diferentemente da construção de modelos por meio de restrição espacial, a metodologia
por transferência de coordenadas também pode ser empregada na modelagem compartiva.
Nesta metodologia, a construção da proteína problema ocorre por meio das transferências de
coordenadas atômicas. Após o alinhamento entre as seqüências molde e problema, os resíduos
são sobrepostos, de tal foram que os resíduos são trocados, mas as coordenadas espaciais são
mantidas (GOLDSMITH-FISCHMAN; HONIG, 2003). A seguir, um processo de
refinamento se faz necessário, o qual consiste na otimização de geometria e análise
conformacional de cadeias laterais e estruturas secundárias (LI et al, 1997).
Durante o desenvolvimento do modelo 3D, algumas anomalias estruturais podem ser
introduzidas na proteína problema. Desta forma, é imprescindível que o modelo 3D recém
construído seja cuidadosamente refinado, antes de ser utilizado para estudos de interação
31
fármaco-receptor. Algumas incongruências que podem ocorrer após a construção incluem:
substituição de uma cadeia grande por uma pequena ou vice-versa; ligações peptídicas
“esticadas” e loops com conformações ruins. A maioria destes problemas podem ser
resolvidos por meio de protocolos de minimização por mecânica molecular (MM) seguido de
simulações de dinâmica molecular (DM) (PATNY, DESAI; AVERY, 2006).
Dessa forma, o refinamento é realizado por métodos de mecânica molecular e
dinâmica molecular. Estes métodos não consideram explicitamente os elétrons em um sistema
molecular (baseiam-se em interações entre núcleos), embora os efeitos eletrônicos estejam
implicitamente incluídos nos campos de força através de parametrizações, reduzindo assim o
custo computacional. Portanto, esta é a metodologia de escolha para estudar propriedades de
grandes sistemas como biomacromoléculas dentre as disponíveis pela química teórica. A
parametrização é obtida por cálculos de orbital molecular e por métodos experimentais. A
mecânica molecular utiliza equações da física clássica Newtoniana para determinação da
geometria molecular. Esses métodos descrevem as forças atuantes nos átomos das moléculas
por meio de equações empiricamente derivadas. Nestes métodos empíricos, a energia do
sistema é descrita pelo somatório das contribuições das energias de ligação, angular, torsional
e por interações de átomos, não ligados, onde estes valores são previamente obtidos a partir de
dados experimentais ou através de cálculos ab initio2. A equação, descrita na figura 8 abaixo,
representa uma forma de como a energia de um modelo teórico é obtida após cálculos de
mecânica molecular (FUJTISU, 2003; FORESMAN; FRISCH, 1996).
Etotal = ∑Eligação + ∑Eangular + ∑Etorcional + ∑Eint. de átomos ...
Figura 8: Equação clássica dos métodos empíricos.
Assim, os métodos de MM utilizam algorítmos para otimizar a geometria encontrando
confôrmero de menor energia na superfície de energia potencial (SEP). Os algorítmos
aplicados para otimização de geometria normalmente encontram regiões de mínimo na SEP
próximo as coordenas inicias (geometria de partida). Dentre os algorítmos de minimização de
2 -Ab inicio nesta etapa refere-se a metodologia desenvolvida pela química tyeórica a qual propriedades atômicas e moleculares são obtidas através de aproximações da equação de Schrödinger, sendo impraticável (ainda) para biomacromoléculas.
32
energia, os mais frequentemente utilizados são: Steepest Descent e Gradiente Conjugado,
ambos utilizam técnicas que calculam a primeira derivada da energia. (LYBRAND, 1990).
Existem vários métodos de MM, também chamados de campos de força, os quais diferem-
se pela natureza das equações, assim como detalhes das suas parametrizações. A lista a seguir
são exemplos de campos de força: ff99 (AMBER), UFF, MM3, dentre outros.
O Amber é um pacote de programas utilizado para conduzir cálculos de Mecânica e
Dinâmica Molecular em biomoléculas. Em algumas situações, o termo Amber também é
empregado para descrever alguns campos de força empíricos, por isso em alguns outros
programas, como o Gaussian 03, é possível encontrar um campo de força com esta
denominação (CASE et al, 2004).
Vários campos de força foram desenvolvidos para Amber, a qual incluem: a) parm99,
usado para o tratamento eletrostático em aminoácidos e algumas moléculas orgânicas; b)
Gaff, campo de força para moléculas orgânicas; c) frcmod, para modificações nos ângulos phi
e psi e d) all_amino03 para determinação de carga e os tipos atômicos em proteínas. No
entanto, a parametrização padrão utiliza campos de força que fixam a carga parcial centradas
nos átomos. Exemplos destes campos de força incluem o ff94, ff03 e o ff99, implementados
no Amber 6, 7 e 8, respectivamente (FORESMAN; FRISCH, 1996; CASE et al, 2004).
A etapa inicial para a utilização do Amber é a identificação do arquivo de entrada, que
pode deve estar no formato pdb. Nesta fase, o programa LEaP analisa a proteína inserida no
sistema, valência, proximidade entre os átomos, erros estruturais e carga total. Além destas
funcionalidades, o LEaP tem como função gerar dois arquivos importantes para o
funcionamento do Amber que são eles: o arquivo topológico e o arquivo de coordenada. As
informações para a construção destes dois arquivos vêm de um banco de dados contido no
próprio Amber, onde estão descritos a topologia dos aminoácidos essenciais (bem como a
carga pontual das regiões N- e C- terminal dos mesmos), DNA, RNA, alguns açúcares
comuns, e um padrão de coordenadas internas para as unidades monoméricas. Assim, ao
submeter a molécula ao LEap, este a “prepara” corrigindo átomos não descritos anteriormente
e neutralizando a sua carga total. O LEaP utiliza um potencial Coulombiano para neutralizar a
molécula por meio de uma rede de 1Ǻ ao seu redor, podendo essa rede ser extendida para 4Ǻ
quando se utiliza solvente. Deve-se atentar que os íons a serem adicionados são de natureza
monoatômica. A topologia de moléculas, que não estejam padronizadas no banco de dados do
Amber, pode ser gerada por um outro programa chamado de Antechamber. A utilização do
Antechamber é de fundamental importância quando se deseja realizar estudos de Docking ou
33
cálculos de energia livre. Resumidamente, pode-se afirmar que a função do LEaP é preparar a
molécula para os programas de cálculos como o SANDER (CASE et al, 2004; PEARLMAN
et al, 1995).
SANDER é o principal módulo do Amber, pois é nele que são conduzidos cálculos de
minimização, dinâmica molecular e deslocamentos químicos para RMN. Os três principais
algorítmos utilizados são Steepest Descent, Gradiente Conjugado, ambos para o refinamento
de estrutura por MM, e o Verlet para cálculos de trajetória atômica em DM. Usualmente, a
energia de minização calculada pelo SANDER deriva de cálculos de Steepes Descent
seguidos por cálculos de Gradiente Conjugado, desta forma muitos contatos desnecessários
entre átomos são removidos. Este processo é uma das formas efetivas de se encontrar o
mínimo local. Os cálculos de DM no Amber seguem o princípio inicialmente desenvolvido no
programa GROMOS, como comentado, por meio do algorítmo Verlet (PEARLMAN et al,
1995).
O Universal Force Field (UFF) foi desenvolvido com o objetivo de facilitar o estudo de
uma variedade de associações atômicas, como as que ocorrem em proteínas e ácidos
nucléicos. Os parâmetros usados para gerar o UFF incluem um conjunto de hibridizações
dependente da ligação atômica, ângulos de hibridização, parâmetros de van der Waals,
barreiras torcionais e cargas nucleares. A energia potencial de uma geometria arbitrária para
uma molécula é escrita como uma sobreposição de várias interações entre dois, três e quatro
corpos. Esta energia é expressa como a soma da valência ou interações de ligação com as
interações não ligadas (REPPÉ et al, 1992).
Os átomos no campo de força UFF são padronizados de acordo com cinco caracteres
que são usados para descrevê-los, gerando um total de 126 tipos atômicos diferentes. Dessa
forma, os dois primeiros caracteres correspondem ao símbolo químico; se este possuir uma
letra, uma linha então é colocada no lugar do segundo caractere. O terceiro caractere descreve
a hibridização ou a geometria (1 = linear, 2 = trigonal, R = Resonante, 3 = tetraédrico, 4 =
quadrado plana, 5 = trigonal bipiramidal, 6 = octaédrica). O quarto e quinto caractere são
usados para descrever parâmetros de estado de oxidação (REPPÉ et al, 1992).
Diferentemente dos métodos de campo de força, recentemente foi desenvolvido o
método semi-empírico denominado de MOZYME/PM5 para o estudo de macromoléculas,
sendo implementado no pacote MOPAC 2002, também presente no BioMedCache. Os
métodos semi-empíricos, usam dentre outras aproximações, a aproximação NDDO (Neglect
of Diatomic Differential Overlap) (FORESMAN; FRISCH, 1996), considerando que os
34
orbitais atômicos de diferentes átomos não se sobrepõem. Empregam parâmetros empíricos e
utilizam somente os elétrons da camada de valência (restringindo-se a uma base mínima).
Com isso, os cálculos são simplificados, reduzindo o custo computacional (memória e tempo)
quando comparado aos métodos ab initio. Os prováveis erros introduzidos devido às várias
aproximações inerentes ao método são, muitas vezes, compensados através do próprio
processo de parametrização, o qual ajusta os resultados do método, a resultados experimentais
ou ab initio (FORESMAN; FRISCH, 1996). Este procedimento pode produzir modelos que
algumas vezes fornecem resultados mais próximos dos resultados experimentais do que os
resultados obtidos com modelos mais sofisticados ou por MM (FORESMAN; FRISCH,
1996).
O MOZYME possui a opção de substituir o algoritmo de busca de mínimos do MOPAC
(EF) pelo LBFGS. Neste, além de requisitar menor capacidade de memória do que o EF
realiza uma série de pequenos cálculos com cerca de 50 a 200 ciclos. Isto é necessário porque
a geometria poderá mudar consideravelmente durante a otimização. Os átomos que não
interagiram, durante o início do cálculo, podem interagir fortemente no final. O MOZYME é
usado para cálculos simples ligados à geometria de molécula, como, por exemplo, a
otimização de geometria, localização do estado de transição e cálculos de polaridade
(FUJITSU, 2003; STEWART, 1997). No entanto, este apresenta algumas limitações, uma vez
que, somente cálculos onde todos os elétrons estão emparelhados (camada fechada – Restrict
Hatree-Fock) podem ser executados. Conseqüentemente, não é permitido cálculos de radicais
livres e estados excitados. Para cálculos que exijam precisão, o MOZYME também não é
recomendado (FUJITSU, 2003; STEWART, 1997).
Se o modelo gerado é baseado somente em técnicas de modelagem comparativa, os loops
e as cadeias laterais necessitam de um refinamento mais apurado. Isto se deve ao fato que a
geometria obtida pelo processo de otimização representa somente uma possível conformação
encontrada pelo algorítmo na região de mínimo local. Sendo assim é necessário investigar o
comportamento conformacional através da SEP para que se possa aproximar o máximo
possível da região de mínimo global, encontrando a estrutura 3D mais favorável
energeticamente. A métodologia para que se possa resolver esta questão denomina-se
dinâmica molecular (DM), que é um processo sistemático de busca conformacional, sendo
uma ferramenta bastante útil para se encontrar várias regiões de mínimo na SEP (LYBRAND,
1990; HÖLTJE, 2003).
35
A dinâmica molecular (DM) consiste em determinar explicitamente as trajetórias de
pontos representativos no espaço através da solução numérica das equações de movimento. O
objetivo básico deste método é observar a evolução do sistema através destas equações.
Devido às interações entre as partículas, o sistema é capaz de manter tanto o equilíbrio
mecânico quanto térmico, e caso haja alguma perturbação externa, o sistema tende a atingir
um novo equilíbrio (RINO; STUDART, 2001).
Seguindo este conceito, as simulações de DM estimam aproximadamente os
movimentos dos átomos. A energia potencial de um sistema é governada por um campo de
força empírico. Muitos programas computacionais voltados para simulações de DM usam
campos de força ligados à métodos de mecânica molecular. As simulações de DM
determinam aproximadamente o movimento real do sistema por meio de algum campo de
força que descreve a energia potencial de uma molécula em termos de geometria molecular
demonstrando o movimento de cada átomo. A energia cinética de um sistema é derivada da
velocidade atômica, essa por sua vez é influenciada pela temperatura da simulação. Desta
forma, as simulações DM tem por objetivo estudar o movimento do sistema, sendo por isso
também empregados para a validação de modelos 3D (FUJTISU, 2003).
O Verlet é o algoritmo mais utilizado para simulações DM. O algoritmo Verlet é uma
integração numérica da equação Newtoniana do movimento. Esta simulação conserva a
energia total e o volume do sistema (FUJTISU, 2003). Neste algoritmo, as posições são
determinadas nos tempos t, ∆t, t + 2∆t, ... e as velocidades nos tempos t-∆t/2, t + ∆t/2, t +
∆t/2... a regulação da temperatura pode ser conduzida por escalonamento periódico, ou por
meio de uma relação com a velocidade (PEARLMAN et al, 1995).
Após o refinamento do modelo por meio das técnicas citadas acima, a etapa seguinte é a
validação do modelo (Fig. 7). O primeiro passo da validação consiste na checagem da
qualidade do enovelamento, sendo este parâmetro muito ligado a qualidade do molde
utilizado. Desta forma, esta análise é feita comparando-se o valor de rmsd do molde e do
modelo construído, cujo o valor deve ser menor do que 5Ǻ (PATNY, DESAI; AVERY,
2006).
Há uma série de programas que analisam a estereoquímica do modelo. Dentre estes
programas pode-se incluir: PROCHECK, WHATCHECK e AQUA. Estes programas
usualmente verificam os comprimentos de ligação, ângulos de ligação, ligação peptídica,
36
planaridade de anéis, quiralidade, ângulos torsionais da cadeia principal e lateral, contato
estérico entre átomos não ligados.
Após todas estas etapas, em princípio, se tem um modelo 3D de um alvo para que se
possa estudar as interações deste com um composto protótipo, e assim desenvolver um novo
composto bioativo.
37
4. MATERIAIS E MÉTODOS
4.1. DETERMINAÇÃO DA ESTRUTURA 3D
A predição da estrutura 3D da pirofosforilase foi realizada por modelagem
comparativa utilizando métodos computacionais como ferramentas. A modelagem
comparativa seguiu os seguintes passos sucessivos: 1- identificação e seleção da(s) proteína(s)
molde(s) e alinhamento das seqüências de resíduos; 2- análise estrutural da proteína molde
identificada; 3- refinamento da proteína molde; 4- construção do modelo; 3- validação do
modelo (GOLDSMITH-FISCHMAN; HONIG, 2003; SANTOS FILHO; ALENCASTRO,
2003). Também foi utilizado o processo automatizado de modelagem de proteínas por
homologia oferecido pelo SWISS MODEL (GUEX; PEITSCH, 1997). No final de todo
processo, vários modelos foram comparados entre si.
Os cálculos realizados pelos programas BioMedCache e Gaussian foram realizados em
um servidor Intel Xeon Dual-Core presente no Laboratório de Modelagem Molecular da
Universidade Estadual de Feira de Santana. Para o programa Amber foi utilizado a estação de
trabalho RedWood presente no Mississipi Center for Supercomputing Research (MCSR) da
University of Mississipi.
4.1.1 Identificação e alinhamento seqüencial da proteína molde
A seqüência primária da proteína, obtida em colaboração com Laboratório de pesquisa
Microbiológica (LAPEM) da Universidade Estadual de Feira de Santana, foi submetida ao
programa BLAST (ALTSCHUL et al, 1990) contra as proteínas presentes no Protein Data
Bank (PDB) (RSCB, 2005). Dessa forma selecionou-se proteínas conhecidas estruturalmente
38
como moldes. Estas devem apresentar o maior grau de homologia possível, igual ou superior
a 30% (GOLDSMITH-FISCHMAN; HONIG, 2003).
4.1.2 Validação dos métodos de MM e semi-empírico
Inicialmente, como o valor de cutoff é importante para especificar a distância das
interações de Van der Walls para átomos não ligados, foi realizado um prévio estudo cujo o
objetivo foi a determinação deste valor utilizando o próprio molde obtido no PDB como
referência. Para isso, variou-se o valor de cutoff entre 3 a 20Ǻ realizando cálculos de
MM3(ALLINGER; LII, 2004) no programa BioMedCache desenvolvido pela Fujitsu (2005).
A seguir, foi realizado uma etapa de validação em diferentes métodos e programas
disponíveis no Laboratório de Modelagem Molecular da UEFS. Esta etapa tem como objetivo
estudar o melhor método teórico para o sistema em questão. A etapa inicial de qualquer
cálculo independente do programa/campo de força a ser utilizado foi a neutralização da
molécula através do protocolo descrito no programa tLeap, com o campo de força ff99,
contido no pacote de programas Amber 8.0. Após a neutralização, a estrutura resultante foi
utilizada como input em todos os cálculos de otimização. Os pacotes utilizados foram o
BioMedCache 6.1, Gaussian 03W, e Amber com os seus respectivos campos de força MM3,
UFF, e ff99. O método semi-empírico MOZYME-PM5, presente no BioMedCache, também
foi utilizado. Assim, a qualidade geométrica das proteínas resultantes foram comparadas entre
si através do gráfico de Ramachandran.
Para o processo de otimização pelo campo de força MM3 foram especificados como
parâmetros de controle de interação um valor de convergência igual a 0,001kcal/mol e 300
ciclos, realizando um cálculo Steepest Descent, seguido de um cálculo de Gradiente
Conjugado, finalizando com um cálculo Steepest Descent (GETHER, KOBILKA, 1998). O
valor de cutoff foi o mesmo determinado na etapa anterior.
Através do programa Gaussian 03W, foi empregado o campo de força UFF, utilizando
as seguintes palavras chaves: opt (requere otimização de geometria), UFF (especificação do
campo de força a ser utilizado) e geom=connectivity (determina a ligação entre os átomos).
Nesta metodologia, o algorítmo de Berny foi utilizado durante o processo de otimização,
sendo o valor de cutoff determinado pelo default do programa. (FRISCH, FRISCH,
TRUCKS, 2003)
39
A otimização realizada no programa Amber 8.0 foi feita em duas etapas. Na primeira
etapa, a molécula foi preparada usando-se o programa tLeap por meio do campo de força ff99.
O programa tLeap também é utilizado para gerar os arquivos topológicos e de coordenadas da
proteína. Esses arquivos são fundamentais para os cálculos de otimização no Amber. A
otimização foi feita por meio do programa SANDER, sendo utilizadas as seguintes keyword:
a) imin=1, realiza uma otimização da estrutura; b) maxcyc=200, número máximo de ciclos; c)
ncyc=100, número de ciclos necessários para a mudança de Steepest Descent para Gradiente
Conjugado; d) cut=14, valor de cutoff; e) ntb=0, manter volume constante; f) igb=0, não
incluir modelo de solvatação.
O método MOZYME-PM5 do BioMedCache 6.1 tem como fundamento um
refinamento estrutural utilizando os parâmetros do método semi-empíricos PM5 para
estruturas de alto peso molecular. Para esta otimização foram implementados 50 ciclos
máximos, algorítmo de otimização BFGS, correção de mecânica molecular para grupos –
HNCO-. A keyword LBFGS foi utilizada para indicar uma otimização de geometria usando a
função minimizadora L-BFGS-B, que é um algorítmo específico para cálculos de moléculas
grandes como proteínas. A keyword GEO-OK foi utilizada para desconsiderar pequenos erros
de geometria que a molécula poderia apresentar.
Após a otimização da proteína molde por qualquer um dos protocolos acima citados, a
qualidade estrutural foi checada por meio dos gráficos gerados pelo programa PROCHECK.
4.1.3. Construção e refinamento do modelo
De posse da melhor metodologia para o sistema, validada pelo gráfico de
Ramanchandran, seguiu-se para a etapa de construção. O modelo 3D da proteína-problema foi
construído segundo protocolo presente no pacote BioMedCache (FUJITSU, 2003), e refinado
através sucessivos ciclos de otimização Steepest Descent, Gradiente Conjugado, seguido de
simulações de DM. A cadeia principal e as alfa-hélices foram fixadas durante uma simulação
inicial de 1.000K, procedidas de simulações a 600K, a qual as alfa-hélice foram “relaxadas”
uma a uma de forma sistemática. Todas as simulações foram executadas por 50 picosegundos.
Estas simulações permitem estudar o movimento atômico, observar as estruturas de menor
energia na SEP, e também avaliar o comportamento termodinâmico da proteína (FUJITSU,
40
2005; ŠALI; BLUNDELL 1993). O modelo resultante foi avaliado sobre a qualidade do efeito
estérico da cadeia lateral através do gráfico de Ramachandran (RAMACHANDRAN;
SASISEKHARAN, 1968).
4.2. ESTUDOS DE DOCKING E CÁLCULO DE ENERGIA LIVRE
A primeira etapa é a localização do sítio ativo da enzima homologa a partir do sítio ativo
da proteína modelo. Desta forma, as duas seqüências foram alinhadas. Os aminoácidos que
fazem parte do sítio ativo da proteína molde foram utilizados como referência na proteína
problema. Com base na localização do sítio ativo, o ligante é aproximado sendo orientado
pelos principais aminoácidos que fazem parte do sítio ativo na proteína molde. Após esta
etapa de localização espacial, o complexo formado é minimizado por meio de cálculos de
MM empregando os algoritmos SD e GC, sucessivamente. Após a otimização, fez-se uma
análise acerca dos principais tipos de interações que ocorreram.
O cálculo da energia de ligação foi realizado por meio do programa Amber 8.0. Para
isso foram realizadas otimizações MM seguidas de simulações DM nos seguintes sistemas:
proteína molde, complexo entre a proteína molde e o ligante, somente ligante, e complexo
entre proteína problema e ligante. Os seguintes parâmetros foram utilizados para as
minimizações de MM: imin=1; maxcyc=200; ncyc=100; cut=14, ntb=0; igb=1. Esta
otimização inicial tem por objetivo retirar os choques que possam ter ocorrido com a
aproximação do ligante da proteína. Para a DM foram empregados os seguintes parâmetros:
imin=0, realiza um cálculo de dinâmica molecular; irest=0; nstlim=10000; dt=0,001;
ntwx=20; cut=14, ntb=0; igb=1; ntt=3; gamma_ln=1,0; tempi=0,0; temp0=300,0. A energia
de ligação foi calculada pela seguinte fórmula: Eligação = Ecomplexo – Eproteína - Eligante.
41
5. RESULTADOS E DISCUSSÕES
A elucidação de seqüências de aminoácidos é uma tarefa proporcionalmente mais
simples que a determinação de estruturas tridimensionais. Devido a este fato, hoje se dispõe
muito mais de estruturas primárias e secundárias do que de estruturas terciárias (SANTOS
FILHO; ALENCASTRO, 2003). Ao submeter à seqüência problema ao servidor BLASTp, foi
possível identificar 180 seqüências com grau de homologia superior a 30%. No entanto,
somente duas proteínas possuíam estrutura tridimensional determinada, sendo que a proteína
originada do Mus musculus (PDB ID 1VM8) possuía 47% de similaridade e a proteína
originada do Homo sapiens (PDB ID 1JV1) cerca de 46%, logo estas estruturas foram
selecionadas para a construção do modelo 3D da proteína pirofosforilase do M. perniciosa.
Analisando-se o arquivo pdb da 1JV1 foi constatado que a mesma apresenta duas
cadeias polipeptídicas, sendo que estas cadeias apresentam elevado grau de homologia entre si
(98%). Desta forma, uma delas foi eleita para a construção do modelo da pirofosforilase,
sendo essa escolha realizada com base no número de erros estruturais existentes na estrutura.
Assim optou-se em trabalhar com a cadeia “A”, uma vez que esta cadeia apresentou um
menor número de erros.
As imperfeições estruturais ou falhas que ocorreram durante a sua determinação
estrutural foram detectadas utilizando-se os programas Amber e BioMedCache. Por meio do
programa tLeap do pacote de programas Amber 8.0, as falhas estruturais (incompleta
descrição geométrica) foram identificadas, e as devidas correções foram realizadas pelo
programa BioMedCache. Foram encontrados dois erros estruturais, um deles na Arg74 e outro
na Val501, em ambos os casos havia uma falta da cadeia lateral. Uma outra constatação foi
que a 1JV1 apresenta falha nas coordenadas atômicas de 15 aminoácidos, sendo 11 deles entre
os resíduos 56 e 68 (Phe57, Asn58, Gln59, Ser60, Ser61, His62, Gln63, Lys, Asn65, Val66,
Asp67, Ala68) e quatro na região terminal da seqüência (Lys 502, Asn 503, Gly 504 e Ile
505) (Fig. 9). Analisando-se o arquivo PDB foi possível identificar os aminoácidos destas
duas regiões. Devido a estas porções da molécula serem regiões de alça de grande mobilidade
conformacional, durante a cristalografia de raio-X não foi possível determinar com exatidão
sua posição espacial (PENEFF et al, 2001).
42
Região 1
Região 2
Figura 9: Seqüência de aminoácidos da 1JV1 indicando as regiões sem estrutura 3D determinada
Após o conhecimento dos aminoácidos que não obtiveram sua geometria espacial
estabelecida, foram utilizados os métodos de MM e DM para elucidar espacialmente esta
região. A etapa inicial desta construção foi o desenho estrutural dessas regiões no programa
BioMedCache. As regiões foram denominadas de GAP e cada uma recebeu uma numeração
específica em algarismo arábico, sendo desta forma o GAP 1 para os aminoácidos 57 a 68 e
GAP 2 para os aminoácidos 502 a 505. Após a construção destas duas regiões, partiu-se então
para sua otimização, utilizando-se o campo de força MM3 implementado no programa
BioMedCache, empregando 300 ciclos de otimização e um critério de convergência igual a
0,001kcal/mol. As estruturas dos GAP 1 e 2 estão indicados na figura 10.
Figura 10: Estruturas 3D dos GAP 1 e 2 após otimização por MM3.
GAP GAP-
43
Após a otimização por MM3 obteve-se uma energia de formação de 81,50 kcal/mol para
o GAP 1 e 41,10 kcal/mol para o GAP 2. A qualidade estrutural dos GAPs foi verificada pelo
gráfico de Ramachandran (Fig. 12). O GAP 1 apresenta 60% do aminoácidos em regiões
energeticamente favoráveis, sendo que dois aminoácidos (His6; Asp11) encontraram-se em
regiões desfavoráveis. O GAP 2 apresentou 100% de seus aminoácidos em regiões favoráveis
(Fig. 11).
Figura 11: Gráfico de Ramachandran para os GAP-1 (A) e GAP-2 (B).
A ocorrência da His6 do GAP-1 está em uma região não favorável, provavelmente foi
devido à formação de uma interação de hidrogênio entre o O32 e o H155, o mesmo tipo de
análise pode ser feita para a Asp11 no qual entre o O87 e H88 também houve a formação de
uma interação fraca (Fig 12). Desta forma, em ambos os casos, a ligação de hidrogênio
alterou os ângulos phi e psi fazendo com que os aminoácidos adotassem uma conformação
menos favorável segundo o gráfico de Ramachrandran.
44
Figura 12: Ligação de hidrogênio entre o O32 e H155 da His6, e entre o O87 e H88 da Asp11 do GAP-1.
Os GAPs construídos e otimizados foram submetidos a simulações de DM, usando os
seguintes parâmetros: a) período de equilíbrio de 1 ps; b) tempo de simulação de 100 ps; e)
constante dielétrica de 1,5. As simulações iniciaram-se a 100K, e o sistema foi “aquecido”
para 200K e por fim 300K, sucessivamente. A tabela 1 indica os valores de energia relativa
encontrados ao final de cada dinâmica. Com os cálculos de dinâmica molecular, espera-se que
essas ligações sejam rompidas e a molécula adote uma conformação mais estável.
Tabela 1: Valores de energia relativa encontrados para os GAP 1 e 2, após os cálculos de dinâmica molecular.
Temperatura (K)
Energia (kcal/mol)
GAP 1 GAP 2
100 18,59 40,79
200 22,17 40,79
300 0,0 0,0
Ligação de hidrogênio
45
Cada simulação de DM gerou cerca de 1.000 estruturas diferentes, sendo que a estrutura
de menor energia era utilizada na simulação seguinte. Essa escolha foi feita com base no
gráfico de energia gerada ao final de cada cálculo. O resultado para o GAP 1, utilizando uma
temperatura inicial de 100K, mostra que a molécula sofreu uma arrumação espacial (Fig. 13-
A), uma vez que a estrutura inicial era praticamente planar (Fig. 13-B). Ao submeter essa
estrutura gerada na simulação seguinte (200K), nota-se um crescimento do número de
moléculas com conformação energeticamente mais estável, zona verde e azul no gráfico.
Resultados semelhantes foram encontrados após a realização da dinâmica molecular com
temperatura de 300K (Fig. 13-C). Isso denota que na finalização do processo houve a
obtenção de uma confôrmero energeticamente mais estável que os demais.
Figura 13: Resultados encontrados nas simulações de dinâmica molecular utilizando-se as temperatura de 100K (A), 200k (B) e 300K (C) para o GAP 1. A figura mostra os confôrmeros de menor energia.
A
B
C
46
Os confôrmeros obtidos nas três simulações foram avaliados quanto à qualidade
geométrica da cadeia principal através do gráfico de Ramachandran. De acordo com a figura
15, pode-se observar que o gráfico C possui um número maior de aminoácidos dentro da
região energeticamente permitida, correspondendo a 60%, enquanto que os gráficos A e B
possuem 40%. Nas três simulações a His6 permaneceu em uma região energeticamente
desfavorável, fato este explicado pela formação da ligação de hidrogênio entre O32 e H155
deste aminoácido (Fig. 14). Este resultado era esperado uma vez que os confôrmeros gerados
a 300K obtiveram energia suficiente para romper barreiras rotacionais e adotar uma
conformação de menor energia.
Figura 14: Gráficos de Ramachandran das estruturas com menor energia geradas após cálculos de dinâmica molecular. A - temperatura de 100K; B – temperatura de 200K; C – temperatura de 300K.
47
Com o GAP-2 foram realizadas as mesmas etapas descritas para o GAP-1 (minimização
seguida de simulações DM). Os resultados da DM para o GAP-2 encontram-se na figura
abaixo:
Figura 15: Resultados das dinâmicas moleculares do GAP-2. A - temperatura de 100K; B – temperatura de 200K; C – temperatura de 300K.
Com base nos dados obtido nos cálculos de dinâmica molecular foi possível determinar
a conformação espacial de cada uma das regiões que não foram elucidadas estruturalmente
durante a cristalografia de raio-X (PENEEF et al, 2001). Os confôrmeros de menor energia
do GAP-1 e 2 obtidos na DM 300K foram então inseridos na cadeia da 1JV1. Essa inserção
ocorreu com a adição dos aminoácidos e depois o ajuste dos ângulos phi e psi de acordo com
48
os resultados obtidos nos cálculos de DM. Após as devidas inserções, a molécula foi
neutralizada no programa tLeap por meio da adição de íons H+.
Após a neutralização, a molécula foi otimizada pelo método MM3 implementado no
programa BioMedCache. Verificou-se a qualidade estrutural pelo gráfico de Ramachandran.
A figura 16 mostra que 100% dos aminoácidos encontram-se em regiões energeticamente
favoráveis, apresentando então uma boa qualidade estrutural.
Figura 16: Gráfico de Ramachandran da 1JV1 após a adição dos GAP, correções estruturais e neutralização.
Após sucessivos cálculos foi possível determinar o melhor valor de cutoff a ser
empregado para a otimização da 1JV1. Os resultados indicaram que após a otimização com o
valor de cutoff de 12Ǻ ocorreu uma queda brusca na energia de formação da molécula
(Tabela 2), sendo que o valor de energia passou a ficar praticamente constante, ou seja,
mesmo com o aumento do cutoff não ocorreram diminuições significativas na energia, e
portanto não havendo alteração na geometria. No entanto, observa-se um aumento no tempo
computacional para a realização do cálculo (Tabela 2). Com base nestes aspectos pode-se
inferir que o melhor valor de cutoff foi o de 14Ǻ, uma vez que é possível observar que a
molécula apresenta uma baixa energia de formação quando é utilizado este valor para sua
49
otimização. Valores de cutoff acima de 14Ǻ implicam apenas no aumento do tempo
computacional.
Tabela 2: Valores de cutoff, energia relativa e tempo computacional encontrados para a proteína 1JV1.
Com o objetivo de verificar qual seria a melhor metodologia de otimização disponível,
procedeu-se uma validação comparando os seguintes métodos: MM3, MOZYME-PM5,
Amber, UFF. Vale destacar que a própria proteína 1JV1 foi utilizada para essa validação.
Cutoff (Ǻ) Energia (Kcal/mol) Tempo (seg)
3 4810,04 450
4 4389,28 252
5 3299,37 238
6 2754,48 253
7 2473,43 297
8 2339,46 342
9 2259,34 406
10 2205,21 502
11 2174,42 619
12 2152,92 712
13 27,54 6824
14 19,39 7200
15 13,42 8640
16 8,89 8040
17 5,73 8640
18 3,28 9300
19 3,3 9600
20 0 10620
50
A comparação entre os resultados deste programas foi feita com base no gráfico de
Ramachandran (Figura 17). Pode-se afirmar que a melhor metodologia de otimização foi
aquela realizada pelo programa BioMedCache usando o campo de força MM3, pois, após
otimização o número de aminoácido em regiões energeticamente favoráveis foi maior
(99,7%) do que a dos outros programas cujos valores foram: 98,9% para o Amber, 100% para
o UFF, 97,6% para o MOZYME-PM5. Logo, a otimização de modelos da pirofosforilase
foram realizados no programa BioMedCache 6.1 usando-se o campo de força MM3.
Figura 17: Gráfico de Ramachandran da 1JV1: A) estrutura cristalina extraída do PDB; B) Otimizada pelo Amber; C) Otimizada pelo UFF; D) Otimizada por MM3; E) Otimizada por MOZYME-PM5.
51
Desta forma, o BioMedCache foi utilizado para a otimização dos modelos construídos
da pirofosforilase. No entanto, o campo de força UFF apresenta como desvantagem, em
relação ao MM3, o maior tempo computacional. A construção do modelo teve início com a
comparação entre as duas seqüências, sendo realizada no programa CLUSTAL W (Figura
18). Foram encontrados 11 gaps, duas inserções e nenhuma ligação dissulfeto no alinhamento
realizado. As duas seqüências apresentam tamanhos diferentes. A 1JV1 apresenta 506
aminoácidos, enquanto que a MP Pirofosforilase apresenta 456 aminoácidos. Essa diferença
no tamanho foi levada em consideração no momento da escolha e forma de construção do
modelo da proteína problema, pois foi necessário realizar inserções ou deleções durante a
etapa de construção.
CLUSTAL W (1.83) multiple sequence alignment Pirofosforilase MSFESLKKRYEVAGQGHLLKFWPQLSESEQKSLLDQLDALDIERVNRIYNNAVS-AEARA 59 Homo sapiens (1JV1) MNINDLKLTLSKAGQEHLLRFWNELEEAQQVELYAELQAMNFEELNFFFQKAIEGFFNQS 60 *.::.** . *** ***:** :*.*::* .* :*:*:::*.:* ::::*:. :: Pirofosforilase GDPNAPQVLIEPLPKDASESVT-DATKVEEWRRTGLDAISRGHVGVLLMAGGQGTRLGSS 118 Homo sapiens (1JV1) SHQKNVDARMEPVPREVLGSATRDQDQLQAWESEGLFQISQNKVAVLLLAGGQGTRLGVA 120 .. : :. :**:*::. *.* * ::: *. ** **:.:*.***:********* : Pirofosforilase APKGCYDIGLPSHKSLFQYQAERIARLQTVAELEFKKSAGSVIIPWYVMTSGPTRRDTED 178 Homo sapiens (1JV1) YPKGMYDVGLPSRKTLFQIQAERILKLQQVAEKYYGN---KCIIPWYIMTSGRTMESTKE 177 *** **:****:*:*** ***** :** *** : : . *****:**** * ..*:: Pirofosforilase FFTKHSYFDR-----------TLPCLTMDGKLLGSP-SHVAVAPDGNGGLYAATRSPLSP 226 Homo sapiens (1JV1) FFTKHKYFGLKKENVIFFQQGMLPAMSFDGKIILEEKNKVSMAPDGNGGLYRALAA---- 233 *****.**. **.:::***:: . .:*::********* * : : Pirofosforilase KDKSRTVLSDLAKRKILYVHAYCVDNCLVRVADPVFLGYSIQKQADCAAKVVPKTRPTES 286 Homo sapiens (1JV1) ----QNIVEDMEQRGIWSIHVYCVDNILVKVADPRFIGFCIQKGADCGAKVVEKTNPTEP 289 :.::.*: :* * :*.***** **:**** *:*:.*** ***.**** **.***. Pirofosforilase VGVVARRGDKFSVVEYSEIS--DRQRNEIPDRLAPHCS--QENLSHRRDGRVGETLETKW 342 Homo sapiens (1JV1) VGVVCRVDGVYQVVEYSEISLATAQKRSSDGRLLFNAGNIANHFFTVPFLRDVVNVYEPQ 349 ****.* .. :.******** *:.. .** :.. ::: * .: Pirofosforilase NETRTIRVRLPIHGTFCCLGGEERGISTECAGYRLRRPRNSRECAGYRLRR--------- 393 Homo sapiens (1JV1) LQHHVAQKKIPYVDTQGQLIKPDKPNGIKMEKFVFDIFQFAKKFVVYEVLREDEFSPLKN 409 : :. : ::* .* * :: . : : : : ::: . *.: * Pirofosforilase --PRNSR-----LVFPAQTVPTCWCDRQG---------------WRGDRDFTARLCRRRF 431 Homo sapiens (1JV1) ADSQNGKDNPTTARHALMSLHHCWVLNAGGHFIDENGSRLPAIPRLKDANDVPIQCEISP 469 .:*.: .. :: ** . * * : .. *. Pirofosforilase GIRQGQDFLQVWPG--RVHR-------GVGCIAL--- 456 Homo sapiens (1JV1) LISYAGEGLESYVADKEFHAPLIIDENGVHELVKNGI 506
Figura 18: Alinhamento realizado pelo Clustal W entre a proteína 1JV1 e a seqüência problema. “*”; “:” e “.” Denotam resíduos conservados, substituições conservadas e regiões semi-conservadas, respectivamente.
52
A partir do alinhamento entre a sequência molde e a sequência problema (figura 18) foi
possível identificar as regiões conservados assim como as regiões semi-conservadas e não-
conservadas. Com base nos resultados obtidos pelo Clustal W, foram estabelecidas 5
diferentes metodologias de construção de modelos da pirofosforilase do M. perniciosa, sendo
4 empregando-se o programa BioMedCache 6.1 e uma o DeepView 3.7. A primeira estratégia
foi a construção do modelo segundo o protocolo do BioMedCache (FUJTSU, 2003), ou seja,
substituição dos aminoácidos do molde pelos da sequência problema. O modelo originado
recebeu a denominação de MCJ1. No entanto, alguns problemas foram detectados nesta
construção, uma vez que o programa substitui os aminoácidos a partir do primeiro aminoácido
da sequência. Como as sequências possuem tamanhos diferentes (Figura 19), aminoácidos
conservados não tinham participação no processo de construção. Este modelo gerado foi
refinado por MM3 SD e GC. Ao final do cálculo obteve-se um valor de energia de -8,76 x 107
kcal/mol. No entanto vale salientar que mesmo com este valor de energia não houve
convergência durante os 300 ciclos, desta forma, este modelo foi submetido a outros cálculos
de otimização, no entanto, mesmo com estes cálculos os critérios de convergência não foram
alcançados.
Figura 19: Modelo MCJ1. Em evidência a região sem estrutura terciária definida.
53
A próxima etapa referente a construção deste primeiro modelo foi a verificação da
qualidade geométrica pelo gráfico de Ramachandran gerado pelo programa PROCHECK
(LASKOWSKI et al, 1994). Os resultados indicam que 64,6% dos aminoácidos encontram-se
em regiões energeticamente favoráveis, 29,2% em regiões energeticamente permitidas,
enquanto as regiões generosamente permitida e não permitidas foram encontrados 4,5 e 1,7%
dos resíduos, respectivamente (Fig. 20). Um bom modelo deve possuir pelo menos 90% dos
resíduos na região central (engergeticamente favorável + energeticamente permitida)
(LASKOWSKI et al, 1994). Portanto, este modelo construído apresenta boa qualidade
geométrica, uma vez que, 93,8% dos resíduos apresentam-se na região central.
Figura 20: Gráfico de Ramachandran gerado pelo programa PROCHECK para o modelo MCJ1.
No segundo modelo obtido (MCJ2), apenas os aminoácidos conservados tiveram seus
ângulos phi e psi alterados de acordo com os aminoácidos da seqüência molde. O resultado
encontrado foi um modelo sem estrutura 3D bem definida mesmo após o refinamento (Fig
21). A falta de informações das regiões variáveis e pouco conservadas levou a um modelo
com baixa qualidade de enovelamento.
54
Figura 21: Modelo MCJ2.
O terceiro modelo (MCJ3) teve uma adição de aminoácidos nas regiões de GAP,
fazendo com que as duas seqüências adquirissem o mesmo tamanho. Após a construção, os
aminoácidos adicionados para facilitar a construção foram deletados da seqüência, fazendo
com que a seqüência da pirofosforilase retornasse ao seu tamanho original. No entanto, este
mesmo modelo apresentou muitos problemas estruturais, principalmente com ligações
químicas com comprimento superior a 3Ǻ (Fig. 22). Mesmo após a otimização, as ligações
continuaram com valores superiores a 3Ǻ. Devido a este fato, o modelo não foi submetido ao
programa PROCHECK para sua validação.
55
Figura 22: Modelo MCJ3 construído. Os circulos indicam ligações com comprimento
superior a 3Ǻ
O quarto modelo (MCJ4) teve como metodologia de construção a adição de
aminoácidos nas regiões de GAP e deleção de 3 aminoácidos na seqüência problema (Ser156,
Ala157 e Gly158). Desta forma, obteve-se duas seqüências de tamanho compatível. Sendo
assim, durante a substituição de aminoácidos manteve-se conservado os ângulos phi e psi
gerando um modelo sem aparentes problemas espaciais. O novo alinhamento com a
substituição está representado na figura 23.
56
Figura 23: Alinhamento entre o molde 1JV1 e a seqüência da pirofosforilase. Os retângulos indicam as regiões onde foram inseridos aminoácidos na seqüência da pirofosforilase.
O modelo resultante foi analisado mostrando que não há anormalidades estruturais na
proteína. O modelo MCJ4 apresenta 13 alfa hélices, sendo 4 destas do subtipo hélice 310.
Estas hélices são menos estáveis e raramente são concontradas em proteínas (SILVA, 1999).
Com relação as folhas beta, é possível verificar 24 folhas na estrutura da MCJ4, sendo 15
delas do tipo beta paralela (segmentos orientados no mesmo sentido) e 9 do tipo antiparalela
(segmentos adjacentes orientados em direções opostas). Adicionalmente, algumas folhas betas
são muito curtas apresentando, em alguns casos, apenas 2 aminoácidos (Fig. 24). Pode-se
notar que a proteína pertence a classe α+β, na qual a disposição de alfa hélices e folhas beta
não apresentam uma ordem específica
57
Figura 24: Modelo MCJ4.
Este modelo foi então otimizado por MM SD seguido por GC e, assim, obtendo como
resultado final uma energia de -2,25 x 103 kcal/mol. A qualidade geométrica foi analisada
pelo gráfico de Ramachandran gerado pelo programa PROCHECK (Fig 25). O modelo gerado
possui 78,6% dos aminoácidos em regiões energeticamente permitidas, 16,3% em regiões
favoráveis, 3,5% em regiões generosamente permitidas e 1,6% em regiões não permitidas.
Logo, o modelo construído possui boa qualidade geométrica, uma vez que, 94,9% dos
aminoácidos estão dentro da região central, localizando-se dentro da região vermelha do
gráfico de Ramachandran (Fig. 25). O valor de rms de 1,17 foi obtido entre 1JV1 e MCJ4
para a sobreposição dos Cα.
58
Figura 25: Gráfico de Ramachandran gerado pelo programa PROCHECK para o modelo MCJ4.
O gráfico de Ramachandran pode ser analisado por aminoácido. Esta análise permite
uma melhor descrição da qualidade geométrica do modelo, sendo também gerado pelo
programa PROCHECK (Fig. 26). Todas as asparaginas, glicinas, histidinas, lisinas,
metioninas, triptofanos e tirosinas estavam dentro das regiões energeticamente favoráveis. No
entanto, alguns aminoácidos apresentaram conformações geométricas desfavoráveis
enegerticamente: Arg315, Asp186, Asp298, Asp320, Cys366, Gln314, Glu4, Glu27, Glu90,
Ile42, Leu69, Phe3, Phe185, Pro63, Pro66, Pro72, Pro482, Ser2, Ser5, Ser415, Thr115,
Thr235, Val53, Val264.
59
Figura 26: Gráfico de Ramachandran para cada um dos aminoácidos do modelo MCJ4, o valor entre parênteses indica a quantidade do aminoácido correspondente na seqüência da MCJ4.
Os aminoácidos em regiões energeticamente desfavoráveis estão presentes na superfície
da molécula. Desta forma, a estrutura global da proteína não é afetada de forma significativa.
A figura 27 mostra a localização de cada um destes aminoácidos na seqüência de MCJ4 e na
estrutura 3D.
60
Figura 27: Seqüência de aminoácidos da MCJ4 evidênciando aqueles que estão localizados dentro das regiões desfavorecidas. Em azul a localização destes aminoácidos na proteína.
A qualidade da cadeia principal do modelo MCJ4 foi analisada por meio do gráfico
número 4 gerado pelo programa PROCHECK. Neste gráfico o modelo contruído é
representado por um quadrado que é plotado em seis gráficos com regiões que indicam a
qualidade do Ramachandran, planaridade da ligação peptídica, interações ruins, distorção do
carbono alfa, energia das ligações de hidrogênio e o fator-G (Figura 28). Os resultados para a
qualidade do gráfico de Ramachandran (Figura 28-a) mostraram que o modelo encontra-se
dentro da faixa ideal. Este fato pode ser corroborado analisando-se o próprio gráfico de
Ramachandran do modelo MCJ4 exposto na figura 28. A planaridade da ligação peptídica do
modelo MCJ4 encontra-se fora dos limites estabelecidos, indicando que alguns aminoácidos
possuem o ângulo torsional ômega em uma conformação não ideal (Figura 28-b). Verificou-se
61
que no modelo construído ainda é possível encontrar alguns contatos ruins, mesmo após os
cálculos de otimização. Esses contatos ruins ocorrem devido a proximidade inferior a 2Ǻ ou
entre 2 e 4Ǻ para resíduos e átomos respectivamente (Figura 28-c). A distorção do ângulo
diedro do carbono alfa mostrou-se dentro dos limites aceitáveis (Figura 28-d). A energia das
ligações de hidrogênio encontram-se fora dos limites estabelecidos (Figura 28-e). O fator-G é
uma medida da normalidade da estrutura. Ele é obtido pela média dos outros fatores-G (phi-
psi, chi1-chi2 distribuição e resíduos-resíduo), com base nos resultados apresentados pela
figura 28-f, a modelo construído não apresenta um bom fator-G.
Figura 28: Qualidade da cadeia principal do modelo MCJ4: a-avaliação do gráfico de Ramachandran; b-planaridade da ligação peptídica; c-interações ruins; d-distorção dos carbonos alfa; e-energia das ligações de hidrogênio; f- fator-G.
62
O modelo foi então submetido a simulações de DM, com o objetivo de verificar a sua
estabilidade, termodinâmica e buscar um confôrmero de menor energia na superfície de
energia potencial, uma vez que é possível observar o movimento das partículas individuais a
medida que a simulação se desenvolve. Ao final das simulações cerca de 2501 confôrmeros
foram gerados. Os resultados da dinâmica estão indicados na figura 29. É possível constatar
uma diminuição nos valores de energia a medida que a simulação se desenvolve. A região em
vermelho indicada no gráfico representa confôrmeros que possuem alta energia de formação,
enquanto que as regiões em azul indicam estruturas de menor energia, como pode ser
observado na figura 29 a maioria das estruturas encontraram-se dentro desta região.
Figura 29: Resultado encontrado após a simulação de DM para o modelo MCJ4
O confôrmero de menor energia foi analisado com relação a sua qualidade geométrica.
Por meio do gráfico de Ramachandran foi possível constatar que 91,1% dos aminoácidos
encontram-se em regiões energeticamente favoráveis (core region), sendo que apenas 2,8%
estão localizados em regiões desfavoráveis. Este fato indica que o modelo apresentou uma
boa qualidade geométrica após as simulações de DM. Adicionalmente, o modelo não perdeu
63
sua estrutura terciária após a finalização dos cálculos, mostrando uma estabilidadde
termodinâmica. Modelos instáveis podem perder as estruturas terciárias no fim da simulação.
Comparando-se os valores do gráfico de Ramachandran antes e após a dinâmica molecular,
pode-se verificar uma queda no número de aminácidos em regiões favoráveis e um aumento
dos localizados em regiões desfavoráveis. No entanto, é importante destacar que o objetivo da
dinâmica também é avaliar a estabilidade do modelo.
Além dos modelos construídos no BioMedCache 6.1, um outro programa de modelagem
comparativa foi utilizado para a construção do modelo 3D da pirofosforilase do M.
perniciosa. O programa DeepView 3.7 foi empregado para a construção de um outro modelo,
identificado como MCJ5. A maior vantagem deste programa é que há a possibilidade de se
trabalhar com várias estruturas como molde, enquanto que no BioMedCache 6.1 a construção
ocorre com apenas um molde por vez. O DeepView 3.7 é uma forma automática de
construção de modelos 3D. O próprio programa faz uma busca por molde com base na
seqüência FASTA da proteína problema, e posteriormente é feito uma sobreposição das
estruturas 3D. Como pode ser observado na figura 30. O programa identificou cerca de 10
moldes para a seqüência submetida. Além destes moldes, também foi inserido durante a
construção o molde CILA3, este molde foi a proteína 1JV1 com a inserção das duas regiões
que não tiveram sua estrutura 3D determinada. O modelo foi então submetido ao servidor do
Swiss-Model.
Figura 30: Resultado da sobreposição feita pelo DeepView 3.7 para a construção do modelo MCJ5, na parte superior é possíve observar os moldes utilizados para a construção.
64
A figura 31 abaixo mostra o modelo resultante das sobreposições. Como pode ser
observado as regiões em verde e vermelho indicam regiões com alta e baixa similaridade,
respectivamente (GUEX; PEITSCH, 1997). O modelo MCJ5 apresentou um alto grau de
similaridade estrutural com os moldes, como pode ser visto na figura 32. Apenas uma
pequena região apresentou uma baixa similaridade, a qual é um loop composto pelos
aminoácidos Leu151, Glu152, Phe153, Lys154, Lys 155, Ser156, Ala157, Gly158.
Figura 31: Modelo MCJ5 contruído no DeepView 3.7
O modelo MCJ5 foi então refinado comforme descrito anteriormente. Seguindo a
mesma metodologia adotada para o modelo MCJ4, a qualidade geométrica foi analisada por
meio do gráfico de Ramachandran gerado pelo programa PROCHECK (Fig 32). O modelo
gerado possui 78,3% dos aminoácidos em regiões energeticamente permitidas; 17,3% em
regiões favoráveis; 3,1% em regiões generosamente permitidas e 1,3% em regiões não
permitidas. O modelo construído possui boa qualidade geométrica, uma vez que, 95,6% dos
aminoácidos estão dentro da região central (Fig. 32). Para este modelo o valor de rms
encontrado foi de 7,51
65
Figura 32: Gráfico de Ramachandran gerado pelo programa PROCHECK para o modelo MCJ5.
Analisando-se os aminoácidos individualmente pode-se perceber que todas as argininas,
metioninas, triptofanos e tirosinas estavam dentro das regiões energeticamente favoráveis (Fig
33). No entanto, alguns aminoácidos apresentaram conformações geométricas
enegerticamente desfavoráveis: Ala52, Ala219, Ala318, Asn51, Asn311, Asp295, Asp412,
Cys321, Cys414, Cys453, Gln270, Gln435, Glu312, Gly112, Gly158, Gly452, His183,
His320, Ile42, Ile69, Ile348, Leu317, Lys241, Phe401, Pro62, Pro65, Pro210, Pro279,
Pro314, Pro319, Pro472, Ser54, Ser204, Ser298, Thr113, Thr168, Thr181, Thr220, Thr232,
Thr347, Val53, Val12, Val166, Val67, Val400, Val451. Percebe-se que este modelo
construído apresenta um número maior de aminoácidos em regiões desfavoráveis, quando
comparado com o modelo MCJ4.
66
Figura 33: Gráfico de Ramachandran para cada um dos aminoácidos do modelo MCJ5. O valor entre parênteses indica a quantidade do aminoácido correspondente na seqüência da MCJ5.
Os aminoácidos em regiões energeticamente desfavoráveis estão presentes na superfície
da proteína e alguns poucos em seu interior. Desta forma, sua conformação não afeta de
maneira siginificativa a estrutura global da proteína. A localização de cada um destes
aminoácidos na seqüência e na estrutura de MCJ5 é mostrado pela figura 34. Como pode ser
observado estes aminoácidos localizam-se essencialmente na parte esterna da proteína.
67
Figura 34: Seqüência de aminoácidos da MCJ5 na qual os aminoácidos sombreados indicam aqueles que estão localizados dentro as regiões desfavorecidas de acordo com o gráfico de Ramachandran. A estrutura abaixo indica a localização destes aminoácido na proteína, os mesmos encontram-se marcados de azul.
Utilizando-se o programa PROCHECK, a qualidade da cadeia principal do modelo
MCJ5 foi analisada por meio do gráfico número 4 (Fig. 35). Observando os resultados para a
qualidade do gráfico de Ramachandran (Figura 35-a), pode-se concluir que o modelo
encontra-se dentro da faixa ideal. Este fato pode ser corroborado analisando-se o próprio
gráfico de Ramachandran do modelo MCJ5 exposto na figura 35. A planaridade da ligação
pepitídica do modelo MCJ5 encontra-se dentro dos limites estabelecidos, indicando que os
ângulos torsionais ômega dos aminoácidos da MCJ5 estão na conformação ideal (Figura 35-
b). Verificou-se que no modelo construído possui alguns contatos ruins (Figura 35-c). A
distorção para o carbono alfa mostrou-se dentro dos limites aceitáveis (Figura 35-d). A
energia das ligações de hidrogênio encontraram-se fora dos limites estabelecidos (Figura 35-
e). Com base nos resultados apresentados pela figura 36-f, o modelo construído apresenta um
bom fator-G.
68
Figura 35: Qualidade da cadeia principal do modelo MCJ5: a-avaliação do gráfico de Ramachandran; b-planaridade da ligação peptídica; c-interações ruins; d-distorção dos carbonos alfa; e-energia das ligações de hidrogênio; f- fator-G.
Durante a elucidação estrutural da enzima pirofosforilase obteve-se dois modelos que
apresentaram boa qualidade estrutural como visto pelos resultados mostrados pelo programa
PROCHECK. A etapa seguinte foi a localização do sítio ativo nos modelos construídos. Para
isso a etapa inicial foi a localização do sítio ativo por meio da metodologia descrita no
programa BioMedCache 6.1. De pose das coordenadas do ligante UDP-N-acetilglicosamina,
69
presente na proteína molde, foi feito um corte de 5Ǻ ao redor deste sendo possível indentificar
os aminácidos que interagem com o ligante (Fig 36).
Figura 36: Localização da UDP-N-acetilglicosamina no sítio ativo da enzima 1JV1.
Os seguintes resíduos são cruciais para a reação feita pela pirofosforilase: Leu108,
Gly111, Gly112, Gln197, Gly223, Asn224, Asp254, Gly291, Glu304, Tyr305, Asn328,
His331, Phe381, Phe383 e Lys408 (PENEFF, 2001). A porção osídica da UDP-N-
acetilglicosamina estabelece numerosas ligações de hidrogênio com a Glu304, His331 e a
Asn224, e também uma interação hidrofóbica com o Phe381 e Phe383. Desta forma as
seqüências da proteína molde e dos modelos MCJ4 e MCJ5 foram alinhadas, e os
aminoácidos que fazem parte do sítio ativo da proteína molde foram marcados nos dois
modelos (Fig 38). O grupamento UDP é transferido para a acetilglicosamina por uma região
semi-conservada, composta pelos seguintes resíduos: Leu-X2-Gly-X-Gly-Thr-X-Met-X4-Pro-
Lys (OLSEN; RODERICK, 2001).
70
Figura 37: Alinhamento entre a proteína molde 1JV1 e os modelos MCJ4 e MCJ5. As regiões em vermelho indicam os aminoácidos que fazem parte do sítio ativo da enzima. A região em verde indica a porção semi-conservada responsável pela transferência do grupamento UDP.
Como pode ser observado pela figura 37, o sítio ativo da enzima encontra-se
extremamente conservado. Apenas as regiões compreendidas entre os resíduos 379-384 e
403-409 não apresentaram similaridade. Adicionalmente, os modelos construídos não
apresentam as fenilalaninas necessárias para a formação das interações hidrofóbicas. No
entanto, diferenças espaciais entre a localização dos sítios ativos dos dois modelos foram
constatadas. Na figura 38 estão indicadas os sítios ativos dos dois modelos. Pode ser
71
observado que os amoniácidos que se encontram fora das especificações do gráfico de
Ramachandran (Fig. 25 e 32) não fazem parte do sítio ativo dos modelos construídos.
Figura 38: Comparação entre a posição espacial dos aminoácidos que compõem o sítios ativos dos modelos construídos: A) sítio ativo do modelo MCJ4; B) sítio ativo do modelo MCJ5.
A
B
72
O sítio ativo do modelo MCJ4 apresentou uma disposição espacial melhor do que o
modelo MCJ5. Neste último, os resíduos que foram indentificados apresentaram-se muito
dispersos pela enzima, fato este não observado no modelo MCJ4. A construção manual
realizada no programa BioMedCache gerou resultados melhores do que a construção
automática feita pelo Deep View 3.7. Desta forma a proteína MCJ4 foi utilizada para a
realização dos estudos de docking. O ligante utilizado foi o mesmo que estava complexado
com o molde 1JV1.
A ancoragem do ligante no modelo foi realizada por meio da aproximação entre o
ligante e os aminoácidos que fazem parte do sítio ativo da enzima. Este processo foi realizado
por meio da observação das coordenadas do ligante complexado com a proteína molde
(1JV1), e levando-se em consideração os aminoácidos chaves, descritos anteriormente (Fig.
39).
Figura 39: A- Localização do ligante no sítio ativo do modelo MCJ4. B- Em detalhe o ligante e os aminoácidos que fazem parte do sítio ativo da enzima.
As otimizações inicias do complexo enzima-ligante foram realizadas com o objetivo de
reduzir as interações muito próximas, e observar as possíveis ligações hidrofóbicas e
hidrofílicas que se formaram. Neste sentido foi possível constatar que houve a formação de
ligações de hidrogênios entre o grupamento amino do resíduo Asn224 e Leu383 com o
oxigênio 22 e 29 do ligante, respectivamente (Fig. 40). Estes dois aminoácidos tem
73
importância comprovada para a ligação de um substrato no sítio ativo de pirofosforilases,
pois, os aminoácidos Asn224 e Phe383 são fundamentais para o acoplamento do ligante com
o sítio ativo da enzima, levando a formação de interações como ligações de hidrogênio e
hidrofóbicas (PENEFF et al, 2001; POMPEO, 2001). Desta forma interações deste tipo
também foram observadas no modelo construído. No entanto, deve-se atentar para o fato que
na posição 383 no modelo MCJ4 o resíduo correspondente é uma leucina e não uma
fenilalanina, como descrito por Pennef et al (2001). Estes resíduos guardam proximidade
química, uma vez que ambos são hidrofóbicos e ocorrem comumente em alfa hélices e folhas
beta.
Figura 40: Ligações de hidrogênio identificadas após a otimização do complexo MCJ4-ligante. Em vermelho os aminoácidos e em azul as ligações de hidrogênio.
A interações hidrofóbicas que ocorrem no sítio ativo de pirofosforilase derivam
principalmente de uma bolsa hidrofóbica formada entre dois anéis benzênicos de resíduos de
fenilalaninas localizadas nas posições 381 e 383. No entanto, o modelo construído não
apresenta esta bolsa hidrofóbica. No modelo MCJ4, as posições 381 e 383 encontraram-se
uma glicina e uma leucina, respectivamente. Estas informações podem ser levadas em
consideração para o desenvolvimento de novos inibidores mas específicos para a
pirofosforilase fúngica.
Com o objetivo de estudar as principais interações que realmente contribuem para a
formação do complexo entre a proteína e o ligante, os orbitais de fronteira (Highest Occupied
Molecular Orbital – HOMO e Lowest Unoccupied Molecular Orbital – LUMO) foram
74
obtidos através de cálculo single point (sem otimização de geometria), pelo método
MOZYME-PM5. Como pode ser observado pela figura 41a, os orbitais HOMO localizaram-
se essencialmente no oxigênio da Glu304 (-7,25 ev), enquanto os orbitais LUMO localizaram-
se nos átomos de fósforos (-3,20 ev) do ligante. A posição destes orbitais não se alteraram
quando o sítio ativo e o ligante foram calculados isoladamente (Fig. 41b e c). Estes resultados
podem sugerir mais detalhadamente o mecanismo de ação da enzima pirofosforilase, em que
o par de elétrons do oxigênio da glutamina pode realizar um ataque nucleofílico nos fósforos
do ligante acarretando em sua hidrólise. No entanto, cálculos QM/MM e simulações Car-
Parrinello são necessários para o completo entendimento deste mecanismo. A sua
compreensão é de fundamental importância para o desenvolvimento de novos ligantes, uma
vez que análogos do estado de transição se ligam mais fortemente as enzimas (MANNHOLD;
KUBINYI; FOLKERS, 2003).
Figura 41: Orbitais de fronteira. As cores verde e azul indicam a distribuição do orbital HOMO, equanto as cores amarelo e vermelho mostram a distribuição do orbital LUMO. A) Complexo ligante-proteína; B) Sítio ativo; C) Ligante.
75
Simulações de DM realizadas no programa Amber foram empregadas para calcular a
energia livre após o docking do ligante no sítio ativo do modelo construído. Conforme
mostrado pela tabela 3, a energia livre do sistema obtida foi de 34,66 kcal/mol. As simulações
de DM sugerem que este valor poderia ser reduzido se a MCJ4 possuísse a bolsa hidrofóbica
característica da família das pirofosforilases (PENEFF et al, 2001), fazendo uma provável
interação hidrofóbica com o ligante.
Tabela 3: Valores de energia encontrados após as simulações de DM.
Estrutura Energia (kcal/mol)
Complexo (Ligante+MCJ4) -15,438 x 103
MCJ4 -15,030 x 103
UDP-N-acetilglicosamina -4,443 x 102
Energia Livre* 34,66
* Eligação = Ecomplexo – Eproteína - Eligante
76
6 CONCLUSÕES
A elucidação estrutural de alvos moleculares tem sido uma das principais ferramentas
para o desenvolvimento racional de novos fármacos. Tendo em mãos a conformação espacial
de um receptor é possível prever qual a estrutura do novo ligante, e com isso há um
planejamento racional deste composto protótipo. Desta forma há um ganho de tempo
significativo e uma redução nos custos das pesquisas. O presente trabalho teve como objetivo
central o desenvolvimento de um modelo 3D, por modelagem comparativa, da enzima
pirofosforilase.
Durante o desenvolvimento 3D do modelo da pirofosforilase foi possível encontrar uma
proteína molde com grau de homologia satisfatório, permitindo a construção da proteína
homologa. No entanto, houve a necessidade de construir duas regiões da proteína problema
que não foram determinadas experimentalmente, mostrando assim a versatilidade dos
métodos teóricos. Assim pode-se construir um molde, e conseqüentemente um modelo mais
próximo da realidade considerando o completo ambiente protéico.Tendo a proteína molde
completa, foi possível proceder para a construção do modelo, para isso dois programa foram
utilizados, BioMedCache e DeepView 3.7. Os dois programas ofereceram bons modelos para
a pirofosforilase do fungo M. perniciosa, no entanto, o método automático do DeepView 3.7
não foi muito satisfatório quanto o do BioMedCache, uma vez que o sítio ativo da enzima não
assumiu uma conformação espacial esperada.
A pirofosforilase é uma enzima beta/alfa/beta, assim como a maioria das pirofosforilases
descritas na literatura. O fator que mais chamou a atenção nessa estrutura foi a presença de
hélices 310. Estas hélices diminuem a estabilidade do modelo, sendo por isso muito
importante durante as etapas de otimização do modelo, uma vez que, otimizações com
número de ciclos superiores ao necessário podem levar a uma “desnaturação” da conformação
espacial para esta enzima.
Por meio da proteína molde foi possível determinar o sítio ativo do modelo construído.
Este sítio ativo apresentou-se muito conservado, o que irá facilitar bastante futuros estudos
sobre um desenvolvimento racional de fungicida com o modelo construído, uma vez que
existem análises sobre o sítio ativo de pirofosforilase em outros trabalhos científicos
(PENEFF et al, 2001; OLSEN; RODERICK, 2001). Adicionalmente o modelo 3D não
apresenta uma bolsa hidrofóbica muito comum em algumas pirofosforilases (PENEFF et al,
77
2001), devendo-se então levar este fator em consideração durante o desenvolvimento do
inibidor específico.
Durante o desenvolvimento deste trabalho, foi construído e validado o modelo da
pirofosforilase, o que representou um grande avanço em termos de aprendizado para o grupo,
considerando-se este como o primeiro trabalho na área. A etapa a seguir de desenvolvimento
será realizar estudos de inibição, tanto teórico quanto experimentalmente. Em nível teórico
serão utilizados os métodos QM/MM, Car-Parrinello e efeito solvente, com isso pode-se ter
uma melhor compreeensão sobre o mecanismo de ação enzimática, direcionando assim o
desenvolvimento do novo fungicida. Paralelo a este estudo teórico, será realizado o
isolamento, purificação, carcaterização e estudos de inibição da enzima pirofosforilase do M.
perniciosa. Espera-se assim, obter uma avaliação da utilização da enzima pirofosforilase
como uma possível forma de controle da doença de vassoura-de-vassoura.
78
REFERÊNCIAS
AIME, M. C.; PHILLIPS-MORA, W. The Causal agents of witche’s broom and frosty pod of cacao (chocolate, Theobroma cacao) form a new lineage of Marasmiaceae. Mycologia, v. 97, n. 5, p. 1012-1022, 2005.
ALLINGER, N. L.; LII, J. H. The MM3 force field for amides, polypeptides and proteins. Journal of Computational Chemistry, v. 12, p. 186 – 199, 2004. ALTSCHUL, S. F. et al. Basic local aligment search tool. Journal Molecular Biology, v. 215, p. 403, 1990.
BASTOS, E. Cacau: a riqueza agrícola da América. São Paulo: Ícone, 1987. 130p.
BERMAN, H. M. et al.The Protein Data Bank. Nucleic Acids Research. v. 28, n. 1, p. 235-242, 2000.
BRANDEAU, J. El cacao. Barcelona: Blume, 1992.
BOTANISCHER GARTEN, 2007. Theobroma cacao. Disponível em: http://www.botanik.uni-karlsruhe.de/garten/fotos-knoch/Theobroma%20cacao%20Echter%20Kakaobaum%207.jpg. Acesso em: 14 mar. 2007
CASE, D. A. et al. Amber 8: User Manual. San Francisco: University of California, 2004, 320 p.
COMPANHIA DAS DOCAS DO ESTADO DA BAHIA, 2002. Apresenta em estatística os principais produtos movimentados. Disponível em: http://www.cobeda.com.br/portoilheus. Acesso em: 25 jan. 2005.
CRONSHAW, D. K. Fungicide application together with cultural practices to control cocoa disease in Ecuador. Tropical Agriculture, v. 56, n. 2, p. 165-171, 1979.
DAPPRICH, S. et al. A new ONIOM implementation in Gaussian98. Part I. The calculation of energies, gradients, vibrational frequencies and electric field derivatives. Journal of Molecular Structure, n.461, p. 1-21, 1999.
DE LUCA, C. et al. Overexpression, one-step purification and characterization of UDP-glucose dehydrogenase and UDP-N-acetylglucosamine pyrophosphorylase. Bioorganic e Medicinal Chemistry. v. 4, n.1, p. 131-142, 1996.
FORESMAN, J. B.; FRISCH, Æ, Exploring Chemistry with Electronic Structure Methods 2. ed. Pittsburgh, Gaussian, Inc. 1996.
FRISCH, Æ.; FRISCH, M. J.; TRUCKS, G. W. Gaussian 03: User’s Reference. Gaussian Inc: Carnegie, 2003, 327p.
FUJITSU, 2002. BioMedCaChe protein-drug discovery modeling software on windows. Disponível em: http://www.cachesoftware.com/biomedcache/index.shtml. Acesso em : 23 mai 2005.
79
FUJITSU. BioMedCache 6.1: User Guide. Oxford: Fujitsu Limited, 2003, 200 p.
GETHER, U.; KOBILKA, B.K. G protein-coupled receptors. II. Mechanism of agonist activation. Journal of Biological Chemisthy, n. 273, p. 17979-17982, 1998.
GIBAS, C.; JAMBECK, P. Visualização de estruturas de proteínas e computação de propriedades estruturais. In: ______. Desenvolvendo a Bioinformática. Rio de Janeiro, 2001, p. 222-277.
GOLDSMITH-FISCHMAN, S.; HONIG, B. Structural genomics: computacional methods for structure analyses. Protein Science, v. 12, p. 1813-1821, 2003.
GRIFFITH, G. W. et al. Autencology and evolution of the wicth’broom patogen (Crinipellis perniciosa) of cocoa. In: BLAKEMAN, J. P.; WILLIAMISON, B. Ecology of Plant Pathogens. Oxon: CAB International, 1994, p. 245-267.
GRIFFITH, G. W. et al. Witches’brooms and frosty pods: two major pathogens of cacao. New Zeland Journal of Botany. v. 41, p. 423-435, 2003.
GRIFFITH, R.; TRACY, T. Antifungal drugs. In: WILLIANS, D. A.; LEMKE, L. Foye’s principles of medicinal chemistry. 5. ed. Philadelphia. Lippincott Williams & Wilkins, 2002, p. 891-903.
GUEX, N.; PEITSCH, M. C. SWISS-MODEL and the Swiss-PdbViewer: An environment for comparative protein modeling. Electrophoresis, n.18, p. 2714-2723, 1997
KABSCH, W.; SANDER, C. Dictionary of protein secondary structure: pattern recognition of hydrogen-bonded and geometrical features. Biopolimers, v. 22, p. 2577-2637, 1983.
KRAMER, K. J.; MUTHUKRISHNAN, S. Insect chitinase: molecular biology and potencial use as biopesticides. Insect Biochemstry Molecular Biology, v. 27, n. 11, p. 887-900, 1997.
KUNDROTAS, P. J.; ALEXOV, E. Predicting 3D structures of transcient protein-protein complexes by homology. Biochimica et Biophysica Acta. 2006.
HEHRE, W. J.; et al. Ab Initio Molecular Orbital Theory . New York: Wiley, 1986.
HENSEN, C. et al. A combined QM/MM approach to protein-ligant interactions: polarization effects of the HIV-1 protease on selected high affinity inhibitors. Journal of Medicinal Chemistry, n. 47, p. 6673-6680, 2004. HERSCOVICS, A.; ORLEAN, P. Glycoprotein biosynthesis in yest. FASEB Journal, n. 7, p. 540-550, 1993.
HÖLTJE, H. D. et al. Introduction to comparative protein modeling. In: ______. Molecular Modeling: basics principles and applications. 2. ed. Germany: Wiley-VCH GmbH, 2003, p. 87-144.
LANA, T. G. Caracterização genética e fisiológica de Crinipellis perniciosa. 2000. 106p. Tese (doutorado) – Escola Superior de Agricultura Luiz de Queiroz, Universidade de São Paulo, Piracicaba.
80
LEAL JÚNIOR, G. A. Produção de soros policlonais com alta afinidade contra o biótipo ‘C’ e o biótipo ‘S’ de Crinipellis perniciosa. Fitopatologia Brasileira, v. 30, n. 5, p. 482-488, 2005.
LI, H. et al. Homology modeling using simulated annealing of restrained molecular dynamics and conformacional search calculations with CONGEN: Aplication in predicting the three-dimensional structure of murine homeodomain Msx-1. Protein Science, n. 6, p. 956-970, 1997.
LYBRAND, T. P. Computer Simulation of Biomolecular Systems Using Molecular Dynamics and Free Energy Pertubation Methods. In: LIOKWITZ, K. B.; BOYD, D. B. Reviews in computacional chemistry. United States of America: VCH Publishers, 1990, p. 295-320.
MANNHOLD, R.; KUBINYI, H.; FOLKERS, G. Quantum Medicinal Chemistry. Weinheim: WILEY-CCH GmbH & Co. KGaA, 2003.
MIO, T. et al. The eukaryotic UDP-N-Acetylglucosamine pyrofosforilases. The Journal of Biological Chemistry. v. 273, n. 23, p. 14392-14397, 1998.
NEW CROP, 2007. Tropical Beverage Crops-Cacao. Disponível em: http://www.hort.purdue.edu/newcrop/tropical/lecture_18/lec_18.html. Acesso: 14 mar. 2007.
OLSEN, L. R.; RODERICK, S. L. Structure of Echerichia coli GlmU pyrophosphorylase and acetyltransferase active sites. Biochemistry, n. 40, p. 1913-1921, 2001.
PATNY, A.; DESAI, P.; AVERY, M. A. Homology modeling of G-protein-coupled receptors and implications in drug design. Current Medicinal Chemistry , n. 13, p. 1667-1691, 2006.
PATRICK, G. L. An Introduction to Medicinal Chemistry. Oxford University Press Inc., New York, 2001.
PEARLMAN, D. A. et al. Amber, a package of computer programs for applying molecular mechanics, normal mode analysis, molecular dynamics and free energy calculations to simulate the structural and energetic properties of molecules. Computer Physics Communications. n. 91, p. 1-41, 1995.
PENEFF, C. el al. Crystal structures of two human pyrophosphorylase isoforms in complexes with UDPGlc(Gal)NAc: role of the alternatively spliced insert in the enzyme oligomeric assembly and active site architecture. The European Molecular Biology Organization Journal, v. 20, n. 22, p. 6191-6202, 2001.
PEREIRA, J. L. et al. First occurence of witches’broom disease in the principal cocoa-growins region of Brazil. Tropical Agriculture , v. 67, n. 2, p. 188-189, 1990. POMPEO, F. et al. Dissection of the bifunctional Escherichia coli N-Acetylglucosamine –1-phosphate uridyltransferase enzyme into autonomously functional domains and evidence that trimerization is absolutely required for glucosamine-1-phosphate acetyltransferase activity and cell growth. The Journal of Biological Chemistry, v.276, p.3833-3839, 2001.
PURDY, L. H. Fungal Disease of Cacao. Disponível em: http://www.cabi-commodities.org/Acc/ACCrc/PDFFiles/W-BPD/Ch1.pdf. Acesso em: 25 abr 2007.
81
PURDY, L. H.; SCHMITDT, R. A. Status of caco witches’ broom: biology, epidemiology and management. Annual Review of Phytopathology, v. 34, p. 573-594, 1996.
RAST, D. M. et al. Cell wall-associated in fungi. Phytochemistry, v. 64, p. 339-366, 2003.
RAMACHANDRAN G. N.; SASISEKHARAN, V. Conformation of polypeptides and proteins. Advanced Protein Chemistry, n. 23, p. 283-438, 1968.
RINCONES, J. et al. Genetic variability and chromosome-lenght polymorphisms of the witches’broom pathogen Crinipellis perniciosa from various plant hosts in South America. Mycological Research, p. 821-832, 2006.
RINO, J. P.; STUDART, N. Um potencial de interação para o estudo de materiais e simulações por dinâmica molecular. Química Nova, v. 24, n. 6, p. 838-845, 2001.
ROSA, I. S. Enxertia do cacaueiro. Ilhéus: CEPALC/SUBES/CEPEC, 1998, 42p.
RSCB, 2000a. RSCB Protein Data Bank. Disponível em: http://www.rcsb.org/pdb/explore/explore.do?structureId=1JV1. Acesso em: 25 abr 2007.
RSCB, 2000b. RSCB Protein Data Bank. Disponível em: http://www.rcsb.org/pdb/ligand/ligandsummary.do?hetId=UD1&sid=1JV1. Acesso: 22 abr 2007.
RUBINI, M. R. et al. Diversity of endophylic fungal community of cacao (Theobroma cacao L.) and biological control of Crinipellis perniciosa, causal agent of Witches’broom disease. International Journal of Biological Sciences, n. 1, p. 24-33, 2005.
ŠALI, A.; BLUNDELL, T. L. Comparative protein modelling by satisfaction of spacial restraints. Journal Molecular Biology. v. 234, p. 779-815, 1993.
SÁNCHEZ, R.; SALI, A. Comparative protein modelling in genomics. Journal of Computacional Physics. n. 151, p. 388-401, 1999.
SANTOS FILHO, O. A.; ALENCASTRO, R. B. Modelagem de proteínas por homologia. Química nova, v. 26, n. 2, p. 253-259, 2003.
SCHWEDE, T. et al. SWISS-MODEL: an automated protein homology-modeling server. Nucleic Acids Research, v. 31, n. 13, p. 3381-3385, 2003.
SOBERANIS, W. Increased frequency of phitissanitary pod removal in cocoa (Teobroma cacao L.) increases yied economically in eastern Peru. Crop Protetion, v. 18, p. 667-685, 2000.
STEWART, J. J. P. Calculation of the geometry of a small protein using semiempirical methods. Journal of Molecular Structure, v. 401, n. 3, p. 195-205, 1997.
SWISS-PROT, 1996, Swiss-Prot Protein knowledgebase. Disponível em: http://ca.expasy.org/sprot/. Acesso: 25 abr 2007.
TAKAYA, N. et al. Intracellular chitinase gene from Rhizopus oligosporus: molecular cloning and characterization. Microbiology, n. 144, p. 2647-2654, 1998.
82
TOMPSON, J.D.; HIGGINS, D.; GIBSON, T.J. CLUSTAL W: improving the sensitivy of progressive multiple aligment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucleic Acids Research, v. 22, n. 22, p. 4673-4680, 1994.
TRABULSI, L. R. et al. Microbiologia . 3. ed. São Paulo: Atheneu, 1999.
YAMADA-OKABE, T.; et al. Identification and characterization of the genes for N-Acetylglucosamine kinase and N-Acetylglucosamine-phosphate deacetylase in the pathogenic fungus Candída albicans European Journal of Biochemistry, v.268, p.2498-2505, 2001.
VREVEN, T. et al. Combining quantum mechanics methods with molecular mechanics methods in ONIOM. Journal of Chemical Theory and Computation, n. 2, p. 815-826, 2006.
top related