dissertação carolina correções norberto

Upload: norberto-monteiro

Post on 06-Jul-2018

246 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/17/2019 Dissertação Carolina Correções Norberto

    1/103

     

    UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE

    PROGRAMA DE PÓS GRADUAÇÃO EM CIÊNCIAS FARMACÊUTICAS

    DESENVOLVIMENTO E AVALIAÇÃO DE MEDICAMENTOS

    PROSPECÇÃO IN SILICO DE COMPOSTOS

    BIOATIVOS CONTRA MALÁRIA UTILIZANDO

    MODELOS DE PREVISÃO DE ATIVIDADE BIOLÓGICA 

    NATAL - RN

    2016 

  • 8/17/2019 Dissertação Carolina Correções Norberto

    2/103

     

    CAROLINA ARRUDA BRAZ 

    PROSPECÇÃO IN SILICO DE COMPOSTOS

    BIOATIVOS CONTRA MALÁRIA UTILIZANDO

    MODELOS DE PREVISÃO DE ATIVIDADE BIOLÓGICA. 

    Dissertação apresentada ao Programa de

    Pós Graduação em Ciências Farmacêuticas

    da Universidade Federal do Rio Grande do

    Norte, como requisito para obtenção do título

    de mestre em Ciências Farmacêuticas.

     Área de Concentração: Desenvolvimento e

    avaliação de Medicamentos

    Orientador: Prof. Dr. Euzébio Guimarães

    Barbosa

    NATAL – RN

    2016

  • 8/17/2019 Dissertação Carolina Correções Norberto

    3/103

     

    CAROLINA ARRUDA BRAZ

    PROSPECÇÃO IN SILICO DE COMPOSTOS

    BIOATIVOS CONTRA MALÁRIA UTILIZANDO

    MODELOS DE PREVISÃO DE ATIVIDADE BIOLÓGICA

    Dissertação apresentada ao Programa de

    Pós Graduação em Ciências Farmacêuticas

    da Universidade Federal do Rio Grande do

    Norte, como requisito para obtenção do título

    de mestre em Ciências Farmacêuticas, pela

    Banca examinadora, formada por:

    Data de aprovação:

     ___/___/___

    Presidente – Prof. Dr. Euzébio Guimarães Barbosa.

    Menbro: Prof. Dr. Norberto de Kassio Vieira Monteiro.

    Menbro: Prof. Dr. Davi Serradella Vieira.

  • 8/17/2019 Dissertação Carolina Correções Norberto

    4/103

     

     Agradecimentos

    Primeiramente ao meu orientador, o professor Euzébio pelas oportunidades

    oferecidas durante o mestrado. Pelos conselhos, parceria e exemplos de postura de

    pesquisador. Por transferir tanta calma e segurança que o mestrado passou

    tranquilo. Que essa parceria possa perdurar por projetos futuros. E pela indicação de

     jogos.

     Aos meus colegas de laboratório, em especial ao Edjan, pelas ajudas mútuas nos

    nossos respectivos projetos.

     A toda equipe do Programa de Pós Graduação em Ciências Farmacêuticas.

     A Sarah e Izadora, minhas amigas, conterrâneas de estágio e Mestrado. Pelas

    angústias e aperreios compartilhados nessa vida acadêmica.

     À minha família, Cristina, in memoriam Alberto e Max, por me acompanhar e

    acreditar nessa jornada. Ao meus primos, em especial a Laura, por tantas vezesnegar essa viagem para Jeriquaquara.

     Ao meu querido companheiro Magnus, pela companhia, por se estressar junto

    comigo durante o processo de escrituras e me convencer sempre que eu consigo

    entregar os documentos nos prazos.

    E aos meus amigos por me aguentarem usar o diploma de cientista pra ganhardiscussões.

  • 8/17/2019 Dissertação Carolina Correções Norberto

    5/103

     

    ÉPIGRAFE

    “The nitrogen in our DNA, the calcium in our teeth, the iron in our blood, the carbon in our

    apple pies were made in the interiors of collapsing stars

    . We are made of starstuff.”  

    ― Carl Sagan. 

    https://www.goodreads.com/author/show/10538.Carl_Saganhttps://www.goodreads.com/author/show/10538.Carl_Sagan

  • 8/17/2019 Dissertação Carolina Correções Norberto

    6/103

     

    LISTA DE FIGURAS

    Figura 1 Número de casos confirmados de malária mundialmente em 2014.

    Figura 2 Casos confirmados de malária no Brasil em 2014

    Figura 3 Ciclo de vida do Plasmodium no homem e mosquito.

    Figura 4 Rota geral do metabolismo da hemoglobina no P. falciparum

    Figura 5 Principais fármacos utilizados no tratamento da malaria

    Figura 6 Representação de uma caixa cúbica utilizada para calcular descritores

    MIF. A sonda utilizada para calcular as energias de interação está no

    canto superior esquerdo.

    Figura 7 Funcionamento esquemático do OPS. Figura 8 Exemplo de exibição espacial de descritores para a metodologia LQTA

    e CoMFA. a) Representação descritores LJ e QQ em esferas. b) Mapas

    de contorno obtidos por CoMFA

    Figura 9 Mecanismo da quebra da ligação peptídica feita pelas proteases

    aspárticas. 

    Figura 10 Estrutura cristalográfica da Plasmepsina.II.

    Figura 11 Inibidores peptidiomiméticos das plasmepsinas.Figura 12 Pepstatina A e alofenilnorstatina.

    Figura 13  Estrutura cristalina da Plasmepsina II (4CKU).

    Figura 14 Etapas dos filtros virtuais .

    Figura 15 Farmacóforo característico da série de compostos utilizada na

    construção do modelo LQTA-QSAR. Anel de cinco membros tiazolidina

    e os locais de possíveis substituições (R1, R2, R3 e R4)

    Figura 16  Dendograma referente à análise de grupamentos hierárquicos para oconjunto de dados (a numeração dos compostos não corresponde a

    numeração referente a tabela). 

    Figura 17  Alinhamento das melhores conformações obtidas pelo processo de

    docagem automatizado.

    Figura 18 Sitio ativo da Plm II com o Composto 33 (roxo) e ligante natural do cristal

    (azul). 

    Figura 19 Composto 33 após adaptação do sítio ativo.

    Figura 20 Melhor alinhamento após a adaptação do sitio ativo.

    Figura 21 Resultado do filtro virtual referente ao tratamento dos descritores de LJ.

  • 8/17/2019 Dissertação Carolina Correções Norberto

    7/103

     

    Figura 22 Resultados dos testes de validação LNO e y-randomization e a qualidade

    de previsão do modelo.

    Figura 23 Visualização dos descritores no sitio ativo da proteína. 

    Figura 24 Representação gráfica dos descritores do modelo final. Visões com os

    compostos 33 (a) e 25 (b). 

    Figura 25 Composto 39 (pKi: 9,6), mais potente, em cinza e 27 (pki: 4,89) em

    laranja. 

    Figura 26 Orientação do anel tiazolidina. Composto 33 (pki: 7,69) e 30 (pki: 5,03).

    Figura 27 Mapas de contorno obtidos por Muthas (MUTHAS et al., 2005). A região

    S1’ está assinalada pelo mapa verde, que representa região estérica

    favorável para presença de grupos volumosos. Figura 28 Composto 39 (azul) com pKi: 9,7 e 25 (verde), pK i: 4,02. Em roxo os

    resíduos de aminoácidos próximos aos descritores. 

    Figura 29 Composto 30 (verde) e 7 (vermelho) representando o pior e melhor perfil

    para descritor QQ7.

    Figura 30  A) Descritor QQ4 relacionado com substituintes alifáticos e cíclicos.

    Compostos mais potente, 33 (roxo) com pK i de 7,69 e menos potente,

    25 (azul) com pki de 4,01 foram usados como exemplo. B) Contribuiçãode interações eletronegativas negativas. Composto 9 em azul de pK i:

    9,31 e 18, marrom de pKi: 6,14.

    Figura 31 Esquema de interação das alofenilnorstatinas de acordo com o modelo

    LQTA. Em vermelho, as regiões do sitio ativo da Plm II que cada porção

    do inibidor interage. 

  • 8/17/2019 Dissertação Carolina Correções Norberto

    8/103

     

    LISTA DE TABELAS

    Tabela 1. Candidatos a fármacos em estudos clínicos durante o ano de 2014

    Tabela 2. Parâmetros estatísticos básicos para modelos de regressão

    Tabela 3.  Lista dos principais resíduos de aminoácidos e suas regiões respectivas

    no sitio ativo da Plm II

    Tabela 4. Conjunto de dados retirados da literatura

    Tabela 5 Números de descritores iniciais e após casa processo de filtragem

    virtual.

    Tabela 6. Figuras de mérito para o modelo final obtido.

  • 8/17/2019 Dissertação Carolina Correções Norberto

    9/103

     

    RESUMO

    Estratégias de planejamento de fármacos auxiliadas por computador utiliza-se

    de técnicas computacionais para auxiliar o descobrimento de novos fármacos.

    Economizando custos e agilizando o processo de pesquisa e desenvolvimento, além

    de poder processar uma quantidade grande de dados. A utilização da técnica do

    LQTA-QSAR permite a criação de modelos de previsão de atividade biológica capazes

    de sugerir estruturas inéditas sem a real necessidade de execução de teste de

    atividade biológica in vitro ou in vivo. A malária é uma doença causada pelo parasito

    do gênero Plasmodium e afeta principalmente as regiões da África e América Latina.

    Estima-se que em 2014 ocorreram 214 milhões de caso de malária e 438 mil demortes de acordo com a Organização Mundial de Saúde. A enzima Plasmepsina II é

    responsável pela clivagem inicial da hemoglobina e é um alvo validado para o

    planejamento de novos agentes antimaláricos. O objetivo geral desse trabalho foi

    desenvolver um modelo de previsão de atividade biológica baseado na relação

    estrutura atividade de compostos inibidores da Plasmepsina II que possuem um

    núcleo derivado de alofenilnostatinas. Foi criado um modelo de previsão com 37

    amostras. O modelo PLS apresentou um Q² = 0,92 e R² = 0,95 com 10 variáveis e 2variáveis latentes. O modelo apresentou bons parâmetros estatísticos e boa

    capacidade preditiva (Q² ext = 0,79) Os descritores também estão corroboram com a

    interação dos inibidores com sítio receptor da Plm II. Os dados obtidos servem como

    guia para o planejamento de novos antimaláricos com maior potência.

  • 8/17/2019 Dissertação Carolina Correções Norberto

    10/103

     

    ABSTRACT

    Strategies for drug design aided by computer uses of computational techniques

    for guidance on the discovery of new drugs. Saving costs and speeding the process of

    research and development, besides it being able to process a big volume data. The

    utilization of LQTA-QSAR allows the creation of predicting models of biological activity

    able to propose novel compounds without the real necessity of in vitro biological activity

    essays. Malaria is a disease caused by the parasite from genre Plasmodium  and

    affects mainly the Africa and Latin America regions. It is estimated that in 2014 it

    happened 214 million cases of malaria and 438 thousand cases of death according to

    World Health Organization. Plasmepsin II is responsible for the metabolism ofhemoglobin and it is a valid target for the development of new antimalarial agents. The

    general objective of this work is to develop a predictive model of biological activity

    based on the structure of Plasmepsin II inhibitors derivate from allophenylnorstatine.

     A model was built with 37 samples, Q² = 0.92 and R² = 0.95 with 10 variables and 2

    latent variables. The model present good statistical parameters and good predicting

    ability (Q²ext=0.79). The descriptors could be well correlated to ligand-Plm II

    interactions. The data obtained serves as guides to the design of new optimizedantimalarial agents.

  • 8/17/2019 Dissertação Carolina Correções Norberto

    11/103

     

    SUMÁRIO 

    1.  INTRODUÇÃO .........................................................................................................................................13 

    1.1  MALÁRIA................................................................................................................................................. 13 

    1.1.1   Aspectos Epidemiológicos. .............................................................. ................................................. 13 

    1.1.2  Ciclo evolutivo ............................................................ .............................................................. ........ 16 

    1.1.2.1  Degradação da hemoglobina. .................................................................................................................18 

    1.1.3  Tratamento / Quimioterapia e Resistência. .......................................................... ........................... 19 

    1.1.4  Resistência ....................................................................................................................................... 22 

    1.2  DESCOBERTA DE FÁRMACOS........................................................................................................................ 23 

    1.2.1  Ferramentas computacionais para o desenvolvimento de fármaco........................................ ........ 24 

    1.2.2  QSAR-4D .......................................................................................................................................... 25 

    1.2.3  Descritores moleculares de interação. ....................................................... ...................................... 28 

    1.2.4  Validação dos modelos de LQTA-QSAR ................................................................ ............................ 29 

    1.3  APLICAÇÃO DO LQTA-QSAR PARA ALVOS E INIBIDORES DE PROTEÍNA DE P. FALCIPARUM ....................................... 31 

    1.3.1  Plasmepsina II do Plasmodium falciparum. .......................................................... ........................... 31 

    1.3.2  Inibidores da Plasmepsina II : alofenilnorstatinas. .......................................................................... 34 

    2  OBJETIVOS ..............................................................................................................................................37 

    2.1  OBJETIVOS ESPECÍFICOS ........................................................ .............................................................. ........ 37 

    3  MATERIAL E MÉTODOS ...........................................................................................................................38 

    3.1  MATERIAL ............................................................................................................................................... 38 

    3.1.1  Computadores. ................................................................................................................................ 38 

    3.1.2  Conjunto de dados ........................................................................................................................... 38 

    3.1.3  Receptor .......................................................... ................................................................. ................ 38 

    3.2  METODOLOGIA ........................................................ ................................................................. ................ 39 

    3.2.1  Padronização do conjunto de dados e preparo das estruturas tridimensionais. ............................. 39 

    3.2.2   Adaptação do sítio ativo ................................................................. ................................................. 40 

    3.2.3  Dinâmica molecular .............................................................. ........................................................... 41 

    3.2.4  Geração do modelo 4D LQTA-QSAR ........................................................... ...................................... 41 

    3.2.4.1  Filtros virtuais ..........................................................................................................................................42 

    3.2.4.2  Seleção de variáveis ................................................................................................................................43 

    3.2.5  Validação do modelo ....................................................................................................................... 43 

    3.2.5.1  Leave-N-out e y-randomization ...............................................................................................................43 

    4  RESULTADOS E DISCUSSÕES. ..................................................................................................................45 

    4.1  CARACTERIZAÇÃO DO CONJUNTO DE DADOS. .......................................................................................... ........ 45 4.2  DIVISÃO DO CONJUNTO DE DADOS PARA A CONSTRUÇÃO DO MODELO LQTA-QSAR .............................................. 51 

    4.3  ADAPTAÇÃO DO SÍTIO ATIVO........................................................................................................................ 51 

  • 8/17/2019 Dissertação Carolina Correções Norberto

    12/103

     

    4.4  4D LQTA-QSAR ..................................................................................................................................... 55 

    4.5  INTERPRETAÇÃO DOS DESCRITORES. ............................................................. ................................................. 58 

    5  CONCLUSÕES E PERSPECTIVAS. ..............................................................................................................68 

    6  REFERÊNCIAS ..........................................................................................................................................69 

    7  ANEXOS ..................................................................................................................................................76 

    7.1  ANEXO 1. SCRIPT PARA TRATAR A MATRIZ DE DESCRITORES DO OPEN3DQSAR ..................................................... 76 

    7.2  ANEXO 2. SCRIPT REALIZADO PARA A REALIZAÇÃO DOS FILTROS VIRTUAIS NO MATLAB. ........................................... 76 

    7.3  ANEXO 3. TABELA COM A REGRESSÃO PLS PARA O MELHOR MODELO 4D LQTA-QSAR ......................................... 78 

    7.4  ANEXO 4. ARQUIVO PDB DAS COORDENADAS DOS DESCRITORES. ........................................................ ................ 80 

    7.5  ANEXO 5. ARTIGO ............................................................... ................................................................. ..... 81 

  • 8/17/2019 Dissertação Carolina Correções Norberto

    13/103

    13

    1. INTRODUÇÃO

    1.1 Malária.

    Os agentes etiológicos da malária são protozoários eucariotos unicelulares

    pertencentes ao filo Apicomplexa, da família Plasmodiidae e ao gênero Plasmodium,

    onde as espécies P. falciparum, P. vivax , P. malariae, e P. ovale são conhecidas por

    causarem a doença. A malária é transmitida pela picada da fêmea do mosquito

     Anopheles, compartilhamento de agulhas e seringas infectadas, transfusão de

    sangue, ou da gestante para o bebê antes ou durante o parto. Os principais sinais

    clínicos são febre alta, calafrio, sudorese e cefaleia. (MINISTÉRIO DA SAÚDE, 2010).

     Apesar de na maioria dos casos a malária não apresentar um risco à vida, sua

    manifestação em mulheres grávidas e crianças é de extremo perigo. A espécie P.

    falciparum é a mais virulenta das formas de malária humana e é o principal causador

    de casos relatados de mortes em crianças, além de ser a única capaz de evoluir para

    malária cerebral (SNOW; KORENROMP; GOUWS, 2004).

     A resistência crescente à terapia atual (WHITE et al., 1999) e enquadramento

    da malária como uma doença negligenciada (BRASIL, 2008) denota a importância na

    pesquisa em inovação para o planejamento de novos candidatos as fármacos

    antimaláricos. De fato, as técnicas de modelagem molecular vem demonstrando umpapel importante na descoberta de candidatos a fármacos antimaláricos (BARMADE

    et al., 2015).

    O custo de realização desse tipo de projeto é puramente computacional, e por

    isso, bastante reduzido e seus resultados podem minimizar despesas desnecessárias

    na síntese dos compostos ativos. O uso de altos níveis da teoria quântica molecular é

    mínimo nesse tipo de estudo, barateando ainda mais o custo computacional por

    molécula investigada nos estudos QSAR. Dessa forma, com estações de trabalho,embora modestas, gera-se em tempo hábil resultados empíricos que podem ser

    utilizados diretamente na triagem de novos compostos bem como na proposição de

    estruturas químicas com possível atividade in vitro e in vivo.

    1.1.1 Aspectos Epidemiológicos.

    De acordo com a OMS (Organização Mundial da Saúde) a malária é uma doença

    que põe em risco cerca de 3,2 bilhões de pessoas  – quase metade da populaçãomundial. Estima-se que em 2015 ocorreram 214 milhões de casos de malária e 438

  • 8/17/2019 Dissertação Carolina Correções Norberto

    14/103

    14

    mil mortes. Felizmente, este é um número decrescente, nos últimos 15 anos a

    incidência de casos de malária diminuiu 37% mundialmente. Os casos de morte,

    também no mesmo período, diminuíram 60% em todas as idades. A África continua

    sendo a região de maior incidência, com 89% dos casos mundiais (Figura 1). Apesar

    da maioria dos casos se concentrarem na África, também há grande incidência de

    casos de malária na Ásia, América Latina e parte do Oriente Médio (DALRYMPLE;

    MAPPIN; GETHING, 2015; WHO, 2015).

    Figura 1. Número de casos confirmados de malária em 2014.

    Fonte: Global Malaria Mapper  (Disponível em: < http://www.worldmalariareport.org>).

    Para região da América Latina a quantidade de casos confirmados de malária

    diminuiu de 1,2 milhões de casos no ano de 2000 para 390 mil casos em 2014. Ainda

    no ano de 2014, foi reportado somente 79 casos de morte por malária, uma diminuição

    de 80% dos casos quando comparados com os últimos 14 anos. O Brasil contabiliza

    quase metade dos casos de mortes na região (WHO, 2015).

     A malária transmitida através da picada de fêmeas do mosquito Anopheles spp. 

    Existem cerca de 400 espécies de  Anopheles no mundo, onde somente 60 sãopossíveis vetores da malária e destes, 30 de maior importância epidemiológica. Nas

  • 8/17/2019 Dissertação Carolina Correções Norberto

    15/103

    15

     Américas, ocorrem principalmente as espécies  Anopheles darlingi ,  Anopheles

    aquasalis,  Anopheles albimanus e  Anopheles pseudopunctipennis. No Brasil, o

    principal vetor é o A. darlingi  (REY, 2011). 

    No Brasil, 99% dos casos de malária estão restritos à Amazônia Legal (Figura

    2), totalizando cerca de 310 mil novos casos por ano, quase todos os casos s

    causados pelo P. vivax (OLIVEIRA-FERREIRA et al., 2010). Apesar da baixa

    incidência, quando comparada ao continente africano, o quadro endêmico nesta

    região representa gastos substanciais para o Sistema Único de Saúde (SUS),

    chegando a aproximadamente US$ 72 milhões apenas em 2014 (WHO, 2015).

    Na Amazônia, a diminuição da incidência de casos por P. falciparum está

    correlacionada a melhoras no diagnóstico. É provável também que a adição daassociação arterméter + lumefantrina à terapia no estado de Manaus e outros

    municípios também contribuiu para a diminuição da incidência do P. falciparum. O

    crescimento do número de casos de P.vivax  pode ser explicado pela compensação

    de comorbidades aguda ou crônica da malária (SAMPAIO et al., 2015).

    Figura 2. Casos confirmados de malária no Brasil em 2014.

    Fonte: adaptado de (WHO,2015).

    Na Amazônia, a diminuição da incidência de casos por P. falciparum está

    correlacionada com melhorias na agilidade do diagnóstico. É provável também que a

    adição do tratamento medicamentoso associação arterméter + lumefantrina no estado

    de Manaus e outros municípios também contribuiu para a diminuição da incidência do

    P. falciparum. O crescimento do número de casos de P.vivax  pode ser explicado pela

    compensação de comorbidades agudas ou crônicas da malária (SAMPAIO et al.,

    2015).

  • 8/17/2019 Dissertação Carolina Correções Norberto

    16/103

    16

    1.1.2 Ciclo evolutivo

    O Plasmodium possui um ciclo biológico complexo, dividido em três etapas:

    ciclo hepático, ciclo eritrocitário e ciclo esporocogônico. O seu desenvolvimento ocorre

    envolvendo um hospedeiro invertebrado ( Anopheles) nas fases sexuadas e um

    hospedeiro vertebrado no ciclo assexuado. O processo evolutivo do parasita requer a

    expressão de proteínas, importantes para sua sobrevivência tanto no hospedeiro

    invertebrado como vertebrado. (TUTEJA, 2007). A Figura 3 (próxima página)

    apresenta as etapas envolvidas no ciclo de vida do Plasmodium spp. 

    Os esporozoítos (forma infectante), localizados nas glândulas salivares do

    mosquito Anopheles, são inoculados no hospedeiro vertebrado durante a picada do

    mosquito. Estas formas alcançam as células hepáticas em média de 30 a 60 minutos

    após a picada (REY, 2013; TUTEJA, 2007). Antes que ocorra a infecção dos

    hepatócitos, há a possibilidade dessas formas entrarem em diferentes células, sem

    que ocorra o desenvolvimento. Os esporozoítos apresentam motilidade graças a

    reorientação de proteínas de superfícies e de proteínas adesivas, que são essenciais

    para invasão das células hospedeiras (BRAGA; FONTES, 2005; MOTA et al., 2001).

    Os esporozoítos transformam-se em criptozoítos, que são estruturas

    arredondadas que crescem e iniciam o ciclo de reprodução assexuada. Apósnumerosas divisões nucleares passa a constituir um esquizonte. No P. falciparum, a

    fase esquizogonia pré-eritrocítica dura 6 dias, enquanto que em P. vivax  dura 8 dias.

    Essa é a primeira fase do ciclo, denominada exoeritrocítica, antecedendo o ciclo

    sanguíneo (REY, 2013).

    Em infecções causadas por P. falciparum  e P. malariae, os esquizontes se

    rompem todos ao mesmo tempo e não persistem no interior dos hepatócitos. Já no P.

    ovale  e no P. vivax , algumas formas exo eritrocı ́ticas, denominadas hipnozoı ́taspermanecem latentes no fígado, e parecem ser responsáveis pelas recidivas tardias

    da doença (BRAGA; FONTES, 2005).

    O ciclo eritrocítico se inicia quando os esquizontes localizados nas células

    hepáticas dão origem aos merozoítos, que são liberados após o rompimento da célula

    parasitada. Os merozoítos invadem as hemácias iniciando ciclo eritrocítico, onde se

    desenvolvem e multiplicam por divisão binária até romperem a célula e serem

    liberados na corrente sanguínea para infectar novamente outras hemácias (REY,

    2013). Para o P. falciparum o ciclo sanguíneo se repete a cada 48 horas (NEVES,

    2005).

  • 8/17/2019 Dissertação Carolina Correções Norberto

    17/103

    17

    Figura 3. Ciclo de vida do Plasmodium no homem e mosquito.

    Fonte: adaptado de (ERSMARK; SAMUELSSON; HALLBERG, 2006)

    Os merozoítos podem também se diferenciar em estágios sexuados,

    gametócitos femininos (macrogametócitos) e masculinos (microgametócitos) que irão

    dar início ao ciclo sexuado (esporogônico) no vetor. O inseto, após se alimentar de

    sangue infectado pode ingerir esses gametócitos. Estes gametas se fundem e formam

    um zigoto. O zigoto se diferencia em oocineto, que por sua vez migra até o intestinodo inseto e dá origem a um oocisto. O oocisto maduro libera estes esporozoítos que

  • 8/17/2019 Dissertação Carolina Correções Norberto

    18/103

    18

    migram para as glândulas salivares, podendo infectar outros seres humanos.

    Retomando assim, o ciclo (DOUGLAS et al., 2015; TUTEJA, 2007).

    O período de incubação da doença varia de 7 a 14 dias, podendo, contudo,

    chegar a vários meses devido às formas latentes de P. vivax e P. malariae. A crise

    aguda caracteriza-se por episódios de febre, calafrios, tosse, dificuldade respiratória,

    dor nas articulações, dor de cabeça, diarreia, vômitos e convulsões. Os intervalos

    entre as febres acompanham os ciclos repetidos de obstrução dos eritrócitos,

    repetindo-se a cada 48 horas para infecções por P. vivax e P. falciparum e de 72 horas

    para infecções causadas pelos demais parasitos (TUTEJA, 2007).

     A gravidade do quadro clínico da malária depende da espécie do parasito, da

    quantidade de parasitos circulantes, do tempo de doença e do nível de imunidadeadquirida pelo paciente. O P. falciparum está sempre associado a quadros graves,

    acarretando em complicações clínicas como icterícia, insuficiência renal, anemia

    grave e obstrução dos capilares que levam sangue ao cérebro (SNOW;

    KORENROMP; GOUWS, 2004; TUTEJA, 2007).

    1.1.2.1 Degradação da hemoglobina.

    O parasita degrada a hemoglobina (Hb) nas células eritrocíticas do hospedeirodurante fases morfológicas distintas do seu ciclo evolutivo (esquizonte e trofozoíta). A

    atividade metabólica varia muito entre as fases e é mais intensa durante o estágio

    trofozoita (GOLDBERG, 1993). A hemoglobina, uma proteína tetramérica com ~64k

    Da, é metabolizada pelas enzimas do parasito. Esses aminoácidos obtidos da

    metabolização são utilizados para biossíntese de proteínas do próprio Plasmodium.

     Ajudando a manter a osmolaridade intracelular durante esta fase de crescimento

    intenso (MOURA; DAME; FIDOCK, 2009).O P.falciparum digere mais de 80% da hemoglobina do eritrócito, para nutrir o

    parasito durante sua fase de crescimento e replicação assexuada na fase eritrocítica.

    (LAZARUS; SCHNEIDER; TARASCHI, 2008). A degradação da hemoglobina ocorre

    via proteases dentro do vacúolo digestivo do parasita e a sua internalização ocorre

    por meio do citostoma, uma invaginação da membrana externa do vacúolo (MILANI;

    SCHNEIDER; TARASCHI, 2015). A hematina livre é potencialmente tóxica tanto para

    o parasito quanto seu hospedeiro, devido a sua atividade membranotropica. Para

    bloquear essa toxicidade o Plasmodium sequestra a hematina na forma do pigmento

    malárico cristalizado e insolúvel, hemozoina (AZOUZI; EL KIRAT; MORANDAT,

  • 8/17/2019 Dissertação Carolina Correções Norberto

    19/103

    19

    2015). Fármacos como cloroquina, se acumulam no vacúolo digestivo e interferem

    neste processo (SCHOLL; TRIPATHI; SULLIVAN, 2005). As quinolinas agem

    interferindo no processo de transformação da hematina (GOLDBERG, 1993).

    O processo de degradação apresenta uma cascata ordenada de reações

    (Figura 4). Várias enzimas são atribuídas ao processo de degradação, no P. falciparm

    são as proteases aspárticas (Plasmepsinas (Plm)  –  I, II, IV e HAP), falcipainas,

    metaloproteases (falcilisina) e dipeptil aminopeptidases (DPAP 1). A clivagem inicial

    se dá nos resíduos Phe33 e Leu34 na cadeia A da hemoglobina, região do domínio

    responsável por manter a estabilidade da estrutura quaternária. A clivagem

    subsequente da Hb em peptídeos menores é realizada pelas proteases plasmepsinas

    e falcipainas. Esses peptídeos menores são então clivados pela falcilisina, DPAP 1 eaminopeptidases formando os aminoácidos que são aproveitados pelo Plasmodium.

    (ERSMARK; SAMUELSSON; HALLBERG, 2006).

    Figura 4. Rota geral do metabolismo da hemoglobina no P. falciparum.

    Fonte: adaptado de (ERSMARK, 2006).

    1.1.3 Tratamento / Quimioterapia e Resistência.

    O tratamento da malária deve tanto prevenir a ocorrência de casos graves

    quanto eliminar fontes de infecção para os mosquitos. Tratamento e diagnósticoadequado tem grande contribuição para redução e erradicação da doença, mas

  • 8/17/2019 Dissertação Carolina Correções Norberto

    20/103

    20

    enfrentam grandes dificuldades frente a não existência de uma única terapia eficaz

    contra as quatro espécies parasitárias que infectam o ser humano. Além da crescente

    resistência do P. falciparum aos esquemas terapêuticos utilizados (BRASIL, 2010).

     A conduta terapêutica na utilização dos fármacos antimaláricos deve levar em

    consideração a tolerabilidade, segurança e tratamento com regimes de curta duração.

     Atualmente se preconiza o uso de associações entre antimaláricos com mecanismos

    de ação distintos, tornando o tratamento mais efetivo e evitando a expansão dos casos

    de resistência (GINER ALMARAZ et al., 2010; PETERSEN; EASTMAN; LANZER,

    2011).

    Os fármacos antimaláricos são compostos naturais ou sintéticos. Os

    antimaláricos eritrocíticos atuam nas formas presentes nas células sanguíneas dohomem enquanto que os antimaláricos gametocíticos atuam nas formas sexuadas do

    parasita no individuo, com o intuito de evitar a disseminação da doença caso o

    indivíduo seja picado (GRIMBERG; MEHLOTRA, 2011). Grande parte dos fármacos

    utilizados na rotina como antimaláricos são denominados esquizonticidas sanguíneos,

    porque apresentam ação sobre os estágios assexuados sanguíneos do parasita

    responsáveis pelas manifestações clínicas (BIAMONTE; WANNER; LE ROCH, 2013;

    PRAZERES et al., 2007).Os medicamentos antimaláricos podem ser classificados de acordo com seu

    grupo químico (Figura 5) : 4-aminoquinolinas (cloroquina e amodiaquina), aril-

    aminoálcoois (quinina, mefloquina, halofantrina e lumefantrina), 8-aminoquinolinas

    (primaquina), peróxido de lactona sesquiterpênica (derivados da artemisinina),

    naftoquinonas (atovaquona) e os antibióticos (tetraciclina, doxiciclina e

    clindamicina)(BRASIL, 2010). A primeira terapia amplamente utilizada para as quatro

    espécies do parasita que causam a malária foi a quinina e seus derivados sintéticos,desde o século XVII. Na segunda metade do século XX, a cloroquinolona foi utilizada

    como medicamento de primeira linha para o tratamento das quatro espécies de

    Plasmodium e uma combinação de sulfadoxina e pirimetamina como tratamento de

    segunda escolha (WELLS; ALONSO; GUTTERIDGE, 2009).

    No Brasil, o esquema terapêutico para casos não complicados de malária são

    realizado com cloroquina e primaquina, para infecções pelo P. falciparum usa-se a

    combinação de artemeter+lumefantrina e artesunato+mefloquina e o tratamento de

    segunda escolha é realizado com quinina, doxiclina e primaquina (BRASIL, 2010).

    Comumente, a terapia da malária é utilizada em associação com outros

  • 8/17/2019 Dissertação Carolina Correções Norberto

    21/103

    21

    quimioterápicos, como sulfonamidas (sulfadoxina), tetraciclinas (tetraciclina,

    doxicilina) e lincosaminas (clindamicina e lincomicina), mas o seu uso apresenta

    inconvenientes como administração de regimes complexos e rígidos e muitos efeitos

    colaterais. O que contribui para interrupção do tratamento e o consequente

    desenvolvimento de resistência do parasita (PIMENTEL et al., 2007).

    Figura 5. Principais fármacos utilizados no tratamento da malária

  • 8/17/2019 Dissertação Carolina Correções Norberto

    22/103

    22

    Fonte: elaborado pelo autor

    O aparecimento de cepas multirresistentes aos fármacos antimaláricos

    disponíveis tem impulsionado a pesquisa de novos fármacos. A Tabela 1 ilustra osprincipais candidatos a fármacos em fase clínica de desenvolvimento no ano de 2014.

    É possível observar que a maioria dos candidatos são novas associações de

    medicamentos, ou mudança de formulação, ou adequação de doses para pacientes

    pediátricos (MMV, 2014) ou reproposição de outras terapias (KUNDU et al., 2015).O

    que não sana a real necessidade apontada pelo surgimento de cepas resistentes a

    maioria das terapias atuais, que é o planejamento e desenvolvimento de novas

    moléculas.

    Tabela 1. Candidatos a fármacos em estudos clínicos durante o ano de 2014.Fase I Fase II Fase III Fase IV Registro

    DSM 265

    (Takeda)

    OZ439/PQ

    (Sanofi)

    Tafenoquina

    (GSK)

     Artesunato

    retal

     Artesunato

    injetável (Guilin)

    MMV 048

    (UCT/TIA)

    Ferroquina

    (Sanofi

     Aventis )

    co-

    trimoxazol( in

    stituto

    Medicina

    Tropical)

    Pironaridina/Ar 

    tesunato

    pediátrico

    (Shin Poong)

     ACT (Sigma  – 

    Tau)

    P218 (Novatis ) KAE609

    ( Novartis )

     ASAQ (Sanofi

     Aventis/DNDi)

    GSK030

    (GSK)

    KAF156

    ( Novartis)

    Pironaridina/Art

    esunato

    (Shin Poong)Fonte: adaptado de (MMV, 2014).

    1.1.4 Resistência

     A partir da década de 90 estudos já apontavam para a resistência global à

    múltiplos fármacos pelo P.falciparum nos casos agudos de malária (WHITE et al.,

    1999). Terapias combinadas a base de artemisinina são utilizadas atualmente nos

    programas de controle globais em resposta a resistência do P .falciparum (MAZIER;RÉNIA; SNOUNOU, 2009). A descoberta de parasitas com diminuição da

  • 8/17/2019 Dissertação Carolina Correções Norberto

    23/103

    23

    sensibilidade a artemisinina (WELLS, 2010), os efeitos colaterais da atual terapia

    medicamentosa e a ausência de vacinas efetivas (HOFFMAN et al., 2015; LONGLEY;

    HILL; SPENCER, 2015; RICHIE; SAUL, 2002) denotam a necessidade da busca por

    novos alvos terapêuticos e do desenvolvimento de uma nova geração de fármacos

    para o tratamento, controle e erradicação da malária (WELLS; VAN HUIJSDUIJNEN;

    VAN VOORHIS, 2015).

    O principal mecanismo de resistência à cloroquina está relacionado com

    mutações no gene Plasmodium falciparum cloroquine resistance transporter  (PFCRT),

    que permite alterações nos transportadores de membrana. Polimorfismo no gene

    Plasmodium falciparum multidrug resistance I   (PFMDRI) estão relacionados a

    resistência a quinina e mefloquina. Mutações no gene Citocromo b conferemresistência a atovaquona, que acarretam em mutações no sitio ativo da enzima alvo,

    diminuindo a afinidade de ligação do fármaco (ARAV-BOGER; SHAPIRO, 2005) .

    Mutações nos genes das enzimas diidrofolato redutase (DHFR) e diidropteroato

    sintetase (DHPS) estão associados a resistência a pirimetamina e sulfadoxina,

    respectivamente, para o P.falciparum (BASCO; RINGWALD, 1998). A resistência a

    artemisinina está relacionada a uma maior expressão do gene PFMDR I (AFONSO et

    al., 2006) e a resistência ao artesunato está relacionada a uma mutação no gene daubiquitina (HUNT et al., 2007).

    1.2 Descoberta de Fármacos.

     A descoberta e o desenvolvimento de fármacos pode ser dividida em três fases.

     A fase de descoberta, na qual ocorre a identificação e validação do alvo,

    desenvolvimento de ensaios, identificação e otimização de compostos protótipos e

    seleção de candidatos a fármacos. Fase de estudos pré-clínicos, onde sãoexecutados estudos extensos em animais. Fase de desenvolvimento clínico: durante

    a qual o composto selecionado é testado quanto à eficácia, efeitos colaterais e riscos

    potenciais em humanos (NWAKA; RIDLEY, 2003). O processo de pesquisa e

    desenvolvimento de fármacos, então, consiste e uma etapa de descoberta (pesquisa)

    e desenvolvimento (ensaios pré-clínicos e clínicos) (ELEBRING; GILL; PLOWRIGHT,

    2012).

  • 8/17/2019 Dissertação Carolina Correções Norberto

    24/103

    24

    1.2.1 Ferramentas computacionais para o desenvolvimento de fármaco.

    O planejamento de novos candidatos a agentes terapêuticos e otimização

    destes pode ser obtido por diferentes estratégias da Química Medicinal. A escolha da

    estratégia a ser adotada depende da elucidação da estrutura do alvo (BARREIRO,

    2009). A utilização de métodos computacionais no processo de pesquisa e

    desenvolvimento de novos fármacos é uma área de destaque nos últimos anos. O

    conhecimento das estruturas de alvos macromoleculares ou de complexos ligante-

    receptor permite a aplicação de estratégias de planejamento de fármacos baseado na

    estrutura (SBDD - Structure-based Drug Design) (COHEN, 1996).

    Pela exploração de bancos de dados que compilam informações sobre testes

    biológicos em alvos proteicos podem ser construídos modelos de previsão da

    atividade biológica a partir da relação quantitativa da atividade destes compostos com

    a sua estrutura (QSAR  –  Quantitative Structure-Activity Relationship) (VERMA;

    KHEDKAR; COUTINHO, 2010). A metodologia de QSAR foi inicialmente estabelecida

    na década de 1960, pelos trabalhos de Hansch e Fujita (HANSCH; FUJITA, 1964). O

    QSAR desempenha um papel vital no design de novos fármacos, já que se trata de

    uma metodologia que permite um custo baixo, processamento rápido e diminuição daquantidade de amostras in vitro geralmente envolvidas (PATEL et al., 2014).

    O objetivo do estudo QSAR é a criação de modelos capazes de prever a

    atividade ou propriedade e explicar as relações entre características estruturais

    específicas (descritores moleculares) e atividade biológica ou propriedade. Métodos

    estes que já se tornaram uma parte essencial do desenvolvimento de novas moléculas

    na atualidade. Atualmente, nenhum fármaco é criado sem a análise por QSAR

    (ANDRADE et al., 2010).Métodos de QSAR são classificados de acordo com a dimensionalidade dos

    descritores utilizados, estabelecendo quantitativamente a correlação entre

    propriedades da estrutura química das moléculas e a atividade biológica. Assim, são

    desenvolvidos modelos matemáticos capazes de prever a atividade biológica de

    moléculas, através de um conjunto de dados (HANSCH; FUJITA, 1964).

    Diferentes tipos de descritores químicos refletem diferentes níveis de

    representação estrutural. Esses descritores podem ser classificados quanto à sua“dimensionalidade”: unidimensionais (1D), baseados em propriedades físico-químicas

    e da fórmula molecular (ex., massa molecular, refratividade molar, logP, entre outros);

  • 8/17/2019 Dissertação Carolina Correções Norberto

    25/103

    25

    bidimensionais (2D), que descrevem propriedades que podem ser calculadas de uma

    representação 2D (ex., número de átomos, número de ligações, índices de

    conectividade, entre outros); e tridimensionais (3D), que dependem da conformação

    das moléculas (ex., volume de Van der Waals, área de superfície acessível ao

    solvente, entre outros) (XUE; BAJORATH, 2000).

    1.2.2 QSAR-4D

     A análise de QSAR-4D, proposta inicialmente por Hopfinger e colaboradores

    (HOPFINGER et al., 1997) incorpora a liberdade conformacional com o alinhamento

    para o desenvolvimento de modelos QSAR-3D levando em conta, então uma quarta

    dimensão para os descritores moleculares. Nessa abordagem, os valores dos

    descritores são as ocupações medidas para os átomos que compõe as moléculas do

    conjunto investigado a partir da amostragem de conformação e do espaço de

    alinhamento (ANDRADE et al., 2010).

    Uma nova abordagem de QSAR-4D, desenvolvida pelo grupo Laboratório de

    Quimiometria Teórica e Aplicada (LQTA  – Unicamp) é baseado na geração de um

    perfil de amostragem conformacional para cada composto. Ao invés de somente uma

    conformação seguindo os princípios do QSAR-3D (KUBINYI, 1997). Esse perfilconformacional é seguido para os cálculos de descritores 3D (MIFF - Molecular

    Interaction Fields ou descritores de interação molecular).

    Essa metodologia contempla simultaneamente, as principais características do

    método CoMFA (Comparative Molecular Field Analisys). Técnica desenvolvida por

    Cramer que demonstra que a propriedade biológica dos compostos pode ser

    correlacionada com as energias estéricas e eletrostática (descritores MIF)

    provenientes das interações formadas com o ligante no sítio ativo do alvo biológico(CRAMER; PATTERSON; BUNCE, 1988) e o QSAR-4D (HOPFINGER et al., 1997).

    Essas metodologias de QSAR-3D e 4D apresentam alguns problemas. No

    QSAR-3D realizado pelo CoMFA, o fato da conformação bioativa não ser conhecida

    acarreta ao usuário fazer a escolha de uma única conformação para cada molécula

    (geralmente a conformação bioativa). Em QSAR-4D a ausência dos descritores de

    interação dificultam a interpretação dos modelos obtidos (GHASEMI; SAFAVI-SOHI;

    BARBOSA, 2012). Aliás, não existe programas livres que possibilite a geração dedescritores para essas duas metodologias. Existe uma versão gratuita do programa,

    Open3DQSAR (TOSCO; BALLE, 2011), mas para utilizar o CoMFA é necessário

  • 8/17/2019 Dissertação Carolina Correções Norberto

    26/103

    26

    adquirir a versão do programa pago. Para usar o QSAR-4D, é necessário adquirir uma

    licença colaborativa com o grupo do Hopfinger.

    O LQTA-QSAR faz uso do pacote livre GROMACS (VAN DER SPOEL et al.,

    2005) para calcular as simulações de dinâmicas moleculares (MD) e estimar o perfil

    conformacional gerado. As simulações de MD podem ser desenvolvidas considerando

    moléculas de solvente explicito, que gera aproximações biológicas mais precisas (mas

    aumenta o custo computacional) ou com solvente implícito, menos dispendioso.

    O programa open3DQSAR gera ao redor do alinhamento de todas as estruturas

    uma caixa virtual cúbica (grid) (Figura 6). A energia de interação para cada tipo de

    campo de interação molecular (descritores estéricos e eletrostáticos) para onde, onde

    em casa canto do grid, as interações entre uma sonda e cada moléculas sãocalculadas (PATEL et al., 2014; TOSCO; BALLE, 2011).

     A geração de descritores MIF pelas metodologias de QSAR 3D geram uma

    quantidade exorbitante de descritores. O número total de variáveis disponíveis é muito

    maior do que o número que será efetivamente incluído nos modelos, incluindo ruído e

    informações redundantes ou irrelevantes (TEÓFILO; MARTINS; FERREIRA, 2009a).

    O objetivo da seleção de variáveis é diminuir o volume de processamento de data e

    melhorar a performance preditiva do modelo(ARAKAWA; HASEGAWA; FUNATSU,2007; GONZÁLEZ et al., 2008).

    Figura 6. Representação de uma caixa cúbica utilizada para calcular descritores MIF. A sonda utilizada para calcular as energias de interação está no canto superioresquerdo.

    Fonte: (RONCAGLIONI; BENFENATI, 2008).

  • 8/17/2019 Dissertação Carolina Correções Norberto

    27/103

    27

    O algoritmo de seleção de preditores ordenados (OPS) (TEÓFILO; MARTINS;

    FERREIRA, 2009a) foi desenvolvido para realizar esta seleção das variáveis. A

    seleção com algoritmo OPS é realizada através do programa QSARModelling(Disponível em: < http://lqta.iqm.unicamp.br/programasOPS.html>) (MARTINS et al.,

    2009). A regressão multivariada para construir o modelo é feita com o método de PLS

    ( partial least squares).

    O OPS visa melhorar a qualidade dos modelos de regressão, removendo

    descritores que possuem baixa capacidade de prever a atividade biológica. Para isso

    é feito um ordenamento dos descritores utilizando um vetor informativo. Esse vetor

    informativo pode ser a correlação destes descritores com a atividade biológica, oumesmo os valores de regressão multivariada (vetor de regressão do PLS). Os modelos

    são construídos com um determinado número de descritores (janela inicial) e

    posteriormente tal janela é aumentada de um incremento fixo até que todas os

    descritores ou uma porcentagem do total sejam adicionadas a esta. O conjunto de

    variáveis que apresentarem os melhores parâmetros de qualidade contém as

    variáveis que apresentam a melhor capacidade de previsão para o modelo construído

    e, portanto, são estas as variáveis selecionadas (TEÓFILO; MARTINS; FERREIRA,

    2009a). A Figura 7 mostra um esquema do algoritmo OPS.

    Figura 7. Funcionamento esquemático do OPS.

    Fonte : adaptado de (TEÓFILO; MARTINS; FERREIRA, 2009a).

  • 8/17/2019 Dissertação Carolina Correções Norberto

    28/103

    28

    1.2.3 Descritores moleculares de interação.

    Na metodologia QSAR-3D a energia de interação de um átomo de prova ou

    fragmento molecular (sonda) com cada molécula em uma conformação alinhada écalculada em ponto de uma grade e constitui os descritores chamados de  campo de

    interação molecular (MIF, molecular interacion fields) (CRUCIANI, 2006).

     As energias de interação mais empregadas são as de van der Waals e

    Coulomb, calculadas por funções comuns aos campos de força moleculares, como o

    potencial de Lennard-Jones (LJ) (2) e o potencial de Coulomb (1), respectivamente.

    ∑ =   (1)   ∑ −6  =   (2)

    Onde E QQ e a E vdw  são as energias que irão compor os descritores eletrostáticos

    (QQ) e de Van der Waals calculada pelo potencial de Lennard-Jones (VDW). qsonda

    é a carga da sonda, qk  é a carga parcial do átomo k da molécula, D é a constante

    dielétrica, e r sondak  é a distância da sonda dentro da grade virtual até o átomo k da

    molécula. Os termos  A e C são constantes dependentes do raio de van der Waals

    parametrizados para o campo de força usado no cálculo da energia (MARTINS et al.,

    2009).

    Os descritores no modelo final com a metodologia LQTA QSAR são expressos

    como esferas, coloridas de acordo com o sinal do vetor de regressão e a natureza dos

    descritores (LJ ou QQ). Diferentemente do CoMFA que os descritores de interação

    são demonstrados através de mapas de contorno (Figura 8).

  • 8/17/2019 Dissertação Carolina Correções Norberto

    29/103

    29

    Figura 8. Exemplo de exibição espacial de descritores para a metodologia LQTA eCoMFA. a) Representação descritores LJ e QQ em esferas. b) Mapas de contornoobtidos por CoMFA.

     Fonte : adaptado de (a) (DE ARAÚJO SANTOS et al., 2014) e (b) (DOWEYKO, 2004).

    1.2.4 Validação dos modelos de LQTA-QSAR

     A validação do modelo QSAR é essencial para garantir a qualidade da

    capacidade de previsão do modelo. Para tanto, a validação deve ocorrer tanto demaneira interna (do próprio modelo) quanto de maneira externa (do grupo de

    previsão). A validação cruzada (leave-one-out - LOO) é utilizada para determinar o

    número de variáveis latentes no modelo PLS (KIRALJ; FERREIRA, 2009). A validação

    cruzada leave-one-out  consiste em excluir uma amostra de cada vez do conjunto de

    treinamento, construir um modelo sem essa amostra, e então realizar a previsão da

    atividade para esta amostra deixada de fora. O procedimento é realizado quantas

    vezes for o número das amostras do conjunto de treinamento. A diferença entre ovalor experimental e o estimado para as amostras retiradas são usados para calcular

  • 8/17/2019 Dissertação Carolina Correções Norberto

    30/103

    30

    o erro padrão da validação cruzada (SEV , standart error of validation) e o coeficiente

    de correlação da validação LOO (Q2 ). O modelo com todas as amostras é expresso

    em termos do coeficiente de correlação de determinação múltipla (R 2 ) e o erro padrão

    de calibração (SEC , standart error of calibration).

    Se a diferença entre os valores de Q2  LOO e R 2  for de 0,2 a 0,3 há indícios de

    sobreajuste do modelo. É preconizado que os valores de Q² e R² devem ser maiores

    que 0,6 para um modelo satisfatório (CHIRICO; GRAMATICA, 2011; GRAMATICA,

    2007; KIRALJ; FERREIRA, 2009). A tabela 2 mostra os parâmetros estatísticos

    básicos para os modelos de regressão.

    Tabela 2. Parâmetros estatísticos básicos para modelos de regressão.Parâmetro Definição

    Coeficiente de validação cruzada 1 ∑ ²=

    ∑ []²= 

    Coeficiente de correlação de

    determinação múltipla 1 ∑ ²

    ∑ []²

     

    Coeficiente de correlação de validação

    externa 1

    ∑ ²∑ []²

     

     A validação cruzada Leave-N-out (LNO) é recomendada para testar a robustez

    do modelo. Diferente do LOO, são retiradas do conjunto de treinamento N amostras

    em bloco. Um novo modelo é construído sem estas amostras, e os valores de

    atividade biológica são previstos para o bloco de amostras separadas para validação.

    O valor de N deve apresentar uma porção significativa das amostras, sendo

    preconizado um número de 20% a 30% de amostras a serem retiradas (CHIRICO;

    GRAMATICA, 2011). Os coeficientes de correlação da validação cruzada LNO

    (Q2LNO) são calculados da mesma maneira que para Q2 LOO. É recomendado um

    valor máximo de oscilação de 0,1. Os resultados do teste de LNO é expresso através

    de um gráfico que mostra o desvio máximo entre Q2 LOO e Q2 LNO. Devem também

    ser expressos dois desvios padrão ao redor do valor médio para a diferença entre o

    Q2 LOO e Q2 LNO (KIRALJ; FERREIRA, 2009).

  • 8/17/2019 Dissertação Carolina Correções Norberto

    31/103

    31

    O último teste, de y-randomization  detectar e quantifica as chances de

    correlações ao acaso entre a variável dependente e os descritores. De modo que o

    modelo não seja obtido ao acaso. O teste consiste em construir vários modelos com

    as variáveis independentes, mas utilizando valores randomizados da matriz de

    variáveis latentes (y). Nessas condições, os modelos obtidos não podem obter valores

    bons de Q² e R² LOO. Valores ideais para os parâmetros obtidos com o teste y-

    randomization, Q²yrand e R²yrand  são preconizados como : Q²yrand e R²yrand  < 0,2 para

    um modelo obtido sem chance de correlação ao acaso (ERIKSSON et al., 2003).

    Os resultados do teste ainda podem ser expressos levando em conta o

    coeficiente de correlação absoluta de Pearson, |r|. São construídos dois gráficos, no

    eixo y com os valores de Q2 yrand e outro R 2 yrand  e no eixo x os valores de |r| para osdois gráficos. É feita então uma regressão linear com os valores e se o modelo foi

    obtido com descritores que possuem correlação ao acaso, os interceptos desses

    gráficos são aQ > 0,05 e aR > 0,3. Estes interceptos são medidas da correlação ao

    acaso (KIRALJ; FERREIRA, 2009).

    1.3 Aplicação do LQTA-QSAR para alvos e inibidores de proteína de P. falciparum 

    1.3.1 Plasmepsina II do Plasmodium falciparum. Presentes no P. falciparum, as plasmepsinas são um grupo de dez isoformas

    de proteases aspárticas presentes no Plasmodium e estão envolvidas no processo de

    degradação da hemoglobina. Quatro proteínas são ativas no vacúolo alimentar (I, II,

    IV e HAP) e são expressas na fase eritrocítica. Proteases aspartáticas se constituem

    de uma das maiores subclasses de proteínas e são encontradas em sua maioria,

    somente em eucariotos (ERSMARK; SAMUELSSON; HALLBERG, 2006).

     A utilização das Plm como alvos farmacológicos já é uma realidade no mercadode fármacos. O FDA (Food and Drug Administration) já aprovou fármacos tanto para

    alvos em humanos quanto na terapia contra o HIV. A maioria desses esforços foi

    guiado pelo projeto de protótipos baseados em estrutura. As descobertas feitas nos

    últimos vinte anos quanto ao design de fármacos permitem uma orientação para o

    descobrimento de possíveis novos compostos para a inibição das plasmepsinas.

    Existe uma vasta coleção na literatura de compostos com atividade inibitória

    comprovada contra a enzima, que podem se tratar de ponto de partida para a pesquisa

  • 8/17/2019 Dissertação Carolina Correções Norberto

    32/103

    32

    de um novo antimalárico (BJELIC et al., 2007; J. MEYERS; E. GOLDBERG, 2012;

    WEGSCHEID-GERLACH; GERBER; DIEDERICH, 2010).

    O desenvolvimento de fármacos baseado na estrutura dos receptores foca

    primariamente na Plm II como alvo proteico, pois se trata da primeira estrutura

    cristalográfica a ficar disponível para pesquisa. (HUIZING; MONDAL; HIRSCH, 2015;

    SILVA et al., 1996). O sequenciamento da Plm II também permitiu o desenvolvimento

    in silico de modelos para a Plm I, IV e HAP, considerando que o sitio ativo destas

    proteínas são similares  –  63% de similaridade (BHAUMIK; GUSTCHINA;

    WLODAWER, 2012; ERSMARK; SAMUELSSON; HALLBERG, 2006).

     A estrutura madura da Plm II tem 329 aminoácidos e consiste em dois domínios

    (C- e N-terminal), apresentando a forma típica bilobal das proteases aspárticas, formaesta que define o sítio ativo. Cada domínio contribui com um resíduo de ácido

    aspártico para compor o sítio catalítico da proteína, Asp214 e Asp34 (Figura 9). É

    formada ainda por uma formação de grampo β (β-hairpin) e um uma aba ( flap) que

    cobre o sitio ativo e interage com o substrato (ASOJO et al., 2003; ERSMARK;

    SAMUELSSON; HALLBERG, 2006; SILVA et al., 1996).

    Figura 9.Mecanismo da quebra da ligação peptídica feita pelas proteases aspárticas.

    Fonte: adaptado de (J. MEYERS; E. GOLDBERG, 2012)

     A Figura 10 mostra uma lista dos principais resíduos de aminoácidos e como

    se organizam em bolsões hidrofóbicos de interação. Essas regiões de bolsões estão

    denominados de acordo os dados de Schechter e colaboradores (SCHECHTER;

    BERGER, 1967), seguindo a adaptação feita por Huizing (HUIZING; MONDAL;

    HIRSCH, 2015). Em azul a região S2’; em laranja a região S1’; em amarelo a aba; em

    vermelho a díade catalítica; em verde a região S1/S3 e em roxo a região S2.

  • 8/17/2019 Dissertação Carolina Correções Norberto

    33/103

    33

    Figura 10. Estrutura cristalográfica da Plasmepsina.II.

    Fonte: elaborado pelo autor.

    Tabela 3. Lista dos principais resíduos de aminoácidos e suas regiões respectivas nositio ativo da Plm II. 

    Díade

    AspFlap S1/S3 S2 S1' S2'

     Asp34,

     Asp214.

    Pro43,

    Met75,

    Val105,

    Phe111,

    Ile123,

    Tyr77.

    Tyr17, Ile32,

    Ser215,

    Ser218,

    Phe120,

    Met15,

    Ile123,Ile14,

    Thr114.

    Pro243,

    Leu271,

    Phe244,

    Met286,

    Ile290,

    Tyr273.

    Tyr192,

    Trp193,

    Ile300,

    Ile212,

    Phe294.

     Asn39,

    Leu131,

    Ser132,

    Ile133.

    Esse grupo de proteínas é capaz de clivar a cadeia A da hemoglobina entre os

    resíduos Phe33 e Leu34 (BRINKWORTH et al., 2001). Acredita-se que tal processo

    induza um desenrolamento da proteína e permita a exposição de mais sítios catalíticos

    (ASOJO et al., 2003). Sendo assim, as plasmepsinas responsáveis pelo metabolismo

    da hemoglobina, são também consequentemente responsáveis pelos sintomas

    clínicos característicos da malária (febre); reforçando a proteína como alvo potencialpara terapia antimalárica.

  • 8/17/2019 Dissertação Carolina Correções Norberto

    34/103

    34

    1.3.2 Inibidores da Plasmepsina II : alofenilnorstatinas.

     A principal estratégia do planejamento de inibidores das Plasmepsinas utiliza a

    ação da díade catalítica formada pelos resíduos de ácido aspártico. O mecanismo de

    ação consiste na clivagem da ligação peptídica, gerando um substrato intermediário

    tetraédrico. Análogos desse substrato intermediário simulam a interação com as Plm

    de maneira mais específica. Isósteros desse estado de transição são definidos por

    possuir um grupamento funcional capaz de simular esse intermediário, mas é mais

    resistente a clivagem da proteína. Os inibidores peptidiomiméticos (Figura 11)

    resistentes a essa clivagem são amidas reduzidas, estatinas, estatinas reversas

    hidroxietilaminas, hidroxipropilaminas, norstatinas e dihidroxietilenos (C e N

    duplicados) (DAN; BHAKAT, 2015).

    Figura 11. Inibidores peptidiomiméticos das plasmepsinas.

    Fonte: adaptado de (PÉREZ et al., 2013).

     As norstatinas foram previamente desenvolvidas como inibidores de HIV e

    utilizadas pela primeira vez como inibidores de Plasmepsina II por Nezami e

  • 8/17/2019 Dissertação Carolina Correções Norberto

    35/103

    35

    colaboradores, com uma série de norstationas com um núcleo de alofenilnorstatinas 

    associado a tiazolidina (NEZAMI et al., 2002).

    Em uma colaboração entre a Universidade Jonhs Hopkins e Universidade

    Farmacêutica de Kyoto, a série chamada de KNI, com o intuito final de inibir as quatro

    Plasmepsinas I, II, IV e HAP presentes no vacúolo digestivo, mas primariamente a

    plasmepsina II com maior potência pelo design de inibidores adaptativos (HIDAKA et

    al., 2007; KISO et al., 2004; MIURA et al., 2010; NEZAMI et al., 2002). Essa estratégia

    tenta planejar inibidores mais potentes e específicos que interagem com as regiões

    mais conservadas no sitio ativo (área catalítica) e mantendo a flexibilidade dos

    compostos para que se adaptem as regiões menos conservadas (S2, S1’ e flap) da

    proteína (NEZAMI et al., 2003).Compostos baseados nesse núcleo químico demonstraram grande

    biodisponibilidade e baixa toxicidade. As alofenilnorstatinas apresentam uma estrutura

    similar ao primeiro sitio de clivagem da hemoglobina, Phe33-Leu34 e a porção

    tiazolidina simula uma leucina conformacionalmente restringida. Estudos de docking

    realizados por Nezami (NEZAMI et al., 2002) demonstraram que as alofenilnortatinas

    se ligam a Plasmepsna II da mesma forma que a Pepstatina A (Figura 12), um potente

    inibidor natural da proteases aspárticas (ASOJO et al., 2003). Interações doscompostos com os resíduos da Plm II sugeriam que a otimização desta classe deveria

    ser direcionada para interações com o flap e as bordas dos bolsões de interações.

    (NEZAMI et al., 2003).

    Figura 12. Pepstatina A e alofenilnorstatina.

  • 8/17/2019 Dissertação Carolina Correções Norberto

    36/103

    36

    Fonte: elaborado pelo autor

  • 8/17/2019 Dissertação Carolina Correções Norberto

    37/103

    37

    2 OBJETIVOS

    O objetivo geral dessa dissertação consiste no desenvolvimento de um modelo de

    previsão LQTA-QSAR para uma série de inibidores da Plasmepsina II.

    2.1 Objetivos específicos

      Padronização do conjunto de dados de compostos ativos contra o Plasmodium

    falciparum para a geração d modelo.

      Desenvolvimento do modelo de LQTA-QSAR-4D

      Validar extensivamente o melhor modelo obtido.

      Identificação de pontos estruturais relevantes para a atividade biológica por

    meio da interpretação dos descritores.

  • 8/17/2019 Dissertação Carolina Correções Norberto

    38/103

    38

    3 MATERIAL E MÉTODOS

    3.1 Material

    3.1.1 Computadores.

    Todos os estudos foram realizados no Laboratório de Química Farmacêutica

    Computacional, em estações computacionais operando em Linux, com processadores

    Intel® Xeon®E5-2690, 2.9 GHz, 20 MB cache, 16 GB RAM. Os softwares utilizados

    estão disponíveis através de licenças acadêmicas ou são de uso livre.

    3.1.2 Conjunto de dados

    Para os estudos de modelagem molecular, foram selecionados um conjunto de

    dados de 49 inibidores derivados da estrutura do ácido (2S,3S) -3-amina-2-hidroxi-4-

    fenilbutirato ( ALOFENILNORSTATINAS) com Ácido (R)-1,3-tiazolidina 4-carboxilico

    (BHAUMIK et al., 2011; HIDAKA et al., 2007; KISO et al., 2004; MIURA et al., 2010;

    NEZAMI et al., 2002). Os valores da constante de inibição (Ki) foram obtidos sobre as

    mesmas condições experimentais. Esses valores de K i foram transformados para a

    escala logarítmica pki (-log Ki).  A faixa de valores variou de 4,01 a 9,69.

    3.1.3 Receptor

     A estrutura cristalográfica da enzima Plasmepsina II presente no Plasmodium

    falciparum foi obtida a partir do banco de dados online Protein Data Bank   ( PDB)

    (BERNSTEIN et al., 1977) sob o código 4CKU (JAUDZEMS et al., 2014), com

    resolução de 1,85 Å e valor-R de 0,209 (Figura 13). As estruturas, que apresentavam

    resíduos de aminoácidos incompletos foram reconstruídas utilizando modelos de

    homologia com o Swiss Model (GUEX; PEITSCH, 1997). 

  • 8/17/2019 Dissertação Carolina Correções Norberto

    39/103

    39

    Figura 13. Estrutura cristalina da Plasmepsina II (4CKU).

    Fonte:

    3.2 Metodologia

    3.2.1 Padronização do conjunto de dados e preparo das estruturas tridimensionais. As estruturas 3D dos compostos foram desenhadas com o auxílio do programa

    Marvin Scketch versão 15.9 (ChemAxon). O estado de protonação foi estimado para

    pH = 7,40 e os átomos de hidrogênio foram adicionados com o programa Avogadro

    (HANWELL et al., 2012). Foi realizada uma inspeção criteriosa do banco de dados

    selecionado da literatura utilizando o protocolo descrito por Fourches & Tropsha

    (FOURCHES, 2010).

    Todos os modelos moleculares, nos devidos estados de protonação, passarampor uma minimização de energia com o campo de forma MMFFFG94 e tiveram suas

    energias otimizadas ao nível semi-empírico PM6, com o programa Gaussian. Cargas

     AM1-BCC (JAKALIAN; JACK; BAYLY, 2002) foram adicionadas com o UCSF Chimera

    (PETTERSEN et al., 2004).

    Para as simulações de dinâmica molecular, todo o conjunto de dados tiveram

    suas ligações parametrizadas para o campo de força AMBER99SB-ILDN (LINDORFF-

    LARSEN et al., 2010).

  • 8/17/2019 Dissertação Carolina Correções Norberto

    40/103

    40

    3.2.2 Adaptação do sítio ativo

     A estrutura cristalográfica 3D do complexo Plasmpepsina II com um ligante

    natural baseado na estrutura da hidroxietilamina (código PDB: 4CKU) (JAUDZEMS et

    al., 2014) foi utilizado como receptor para a construção do modelo de previsão

    dependente de receptor LQTA-QSAR. A estrutura química do ligante cristalizado se

    interage com a proteína por um modo de interação distinto dos compostos do conjunto

    de dados. O que não permite a inserção direta dos ligantes escolhidos na conformação

    apresentada pelo sítio ativo cristalizado.

     A adaptação do sítio ativo foi feita a partir do estudo de docking  do composto

    mais potente da série (composto 33). Para tal, o ligante natural foi removido da

    estrutura do cristal e foi realizada a docagem com o composto 33. As melhores poses

    foram submetidas a simulações de dinâmica molecular e propiciaram a adaptação do

    sítio ativo por meio de encaixe induzido. O processo automatizado de docking   foi

    realizado com o programa AutoDock Vina (TROTT; OLSON, 2010) e as simulações

    de dinâmica molecular com o pacote GROMACS 4 (VAN DER SPOEL et al., 2005). O

    novo sítio ativo hipotético, adaptado e aperfeiçoado para o modo de interação do

    composto 33 foi utilizado para orientar os processos de refinamento subsequentescom dinâmica molecular de todos os ligantes da série de derivados Alofenilnorstatinas 

    e obter os perfis conformacionais necessários para a construção do modelo LQTA-

    QSAR-DR.

     As conformações iniciais (input ) para a realização das simulações de todos os

    ligantes dos conjuntos de dados foram obtidas a partir de um processo de docagem

    manual, utilizando a estrutura da Plm II com o sítio ativo adaptado. O processo manual

    foi realizado utilizando a ferramenta de ajuste de torções (adjust torsions) e omovimento do mouse (movement mouse),  átomo por átomo, baseados no

    conhecimento do modo de interação do ligante natural cocristalizado e interações

    relatadas na literatura (DAN; BHAKAT, 2015; HUIZING; MONDAL; HIRSCH, 2015).

    Otimizações da geometria dos compostos foram realizadas para eliminar possíveis

    distorções nas posições dos átomos. As estruturas otimizadas foram submetidas ao

    programa topobuild  para a criação dos arquivos de topologia GAFF (WANG et al.,

    2004) para as subsequentes simulações de dinâmica molecular.

  • 8/17/2019 Dissertação Carolina Correções Norberto

    41/103

    41

    3.2.3 Dinâmica molecular

     As simulações de dinâmica molecular ocorreram utilizando o pacote

    GROMACS 4 (VAN DER SPOEL et al., 2005). Todas as simulações foram feitas em

    solvente implícito empregando o formalismo generalizado de Born (FAN et al., 2005).

    Como não foi construído uma caixa, não foi levado em consideração as condições

    periódicas de limite. Todos os complexos tiveram sua energia otimizada usando o

    algoritmo de descida mais inclinada (steepest descent algorithm - SDA). O critério de

    convergência empregado nas otimizações foi que a força máxima que agisse sobre

    os átomos não superasse 10 kJ mol-1 nm-1. Caso a convergência não fosse atingida

    em 20 000 passos, foi empregado o algoritmo de Broydens-Fletcher-Goldfarb-Shanno

    (BFGS). Foram aplicadas Correções de dispersão de longo alcance somente para

    energia. Restrições de posições com penalidades de energia totais foram adicionadas

    à cadeia principal (backbone) e parciais à cadeia lateral da proteína. Todas as ligações

    foram vínculos pelo algoritmo LINCS, foi removido o centro de massa translacional e

    rotacional ao redor do centro de massa e um algoritmo de leap-frog foi utilizado para

    integrar as equações de Newton de movimento. As interações de Lennard-Jones e

    Coulombic sofreram consideradas até 2 nm. As simulações duraram 2 000 ps para

    cada composto, ou o suficiente para adaptação e estabilização da posição do liganteno sítio ativo.

    3.2.4 Geração do modelo 4D LQTA-QSAR

    Os descritores de interação foram calculados com o programa Open3DQSAR

    (TOSCO; BALLE, 2011). Estes descritores foram criados com a utilização das

    conformações alinhadas provenientes da dinâmica molecular. A seleção destas

    conformações foi realizada a partir da ferramenta de análise de agrupamentos doChimera. Foi utilizada uma caixa cúbica com 1.0 Å de espaçamento e dimensões de

    33x32x30 Å. Foram calculados no total 63360 descritores paras energias de interação

    de Lennard-Jones (LJ) e Coulomb (QQ). Os descritores de LJ foram calculados com

    uma sonda sp³, e os de QQ com uma sonda de carga +1.

     A filtragem (Figura 14), seleção e construção dos modelos de QSAR seguiram

    os protocolos já estabelecidos por Barbosa e colaboradores (BARBOSA; FERREIRA,

    2012) para a metodologia do LQTA-QSAR. O script utilizado para retirar os descritores

  • 8/17/2019 Dissertação Carolina Correções Norberto

    42/103

    42

    do Open3DQSAR e o script feito para aplicar os filtros virtuais nas matrizes do Matlab

    estão disponíveis no Anexo I.

    Figura 14. Etapas dos filtros virtuais.

    Fonte: elaborado pelo autor

    3.2.4.1 Filtros virtuais

    Os descritores moleculares excessivamente distantes (baixa variância) das

    estruturas 3D alinhadas dentro da grade virtual foram eliminados. O corte da variância

    foi de 0,02 para descritores abaixo desse valor, de acordo com o proposto por Kubiny

    e colaboradores (KUBINYI, 1997). Os descritores de LJ são submetidos a um

    tratamento devido a seus valores positivos serem de elevada magnitude nos postos

    da grade próximos aos átomos. Um corte (cut-off ) de energia é realizado seguindo a

    equação X. Se um descritor de LJ nas coordenadas x, y, z tiver valor de energia menor

    ou igual que 30 kcal/mol não foi aplicado nenhum corte. Se não, o valor logaritmo

    residual da energia foi adicionado a 30 kcal/mol.

    ,,   ≤ 30 −  ,ã ′,, ,,  ,,   > 30 −  ,ã ′,, 30 +

    ,, 29  (3)

  • 8/17/2019 Dissertação Carolina Correções Norberto

    43/103

    43

    O segundo filtro virtual foi realizado por meio da eliminação dos descritores de

    baixa correlação, ou seja, se comportam como um vetor aleatório. Para tal, são

    eliminados os descritores que tem correlação de Pearson absoluta (|r|) com atividade

    biológica (y) no mesmo nível de ruído aleatório.

     A última etapa de filtros virtuais visa eliminar os descritores com perfil de

    distribuição muito diferente em relação a atividade biológica (y), utilizando o

    Comparative Distribution Detection Algorithm (CDDA) (BARBOSA; FERREIRA, 2012).

    Tal algoritmo permite um modo de quantificar o quão similar y está distribuído para

    um descritor especifico.

    3.2.4.2 Seleção de variáveis Após o procedimento de filtragem virtual, foi realizado a seleção de descritores

    com o algoritmo OPS (TEÓFILO; MARTINS; FERREIRA, 2009a). Foram removidos

    descritores redundantes (com coeficiente de correlação inter descritor igual ou maior

    que 0,9), que apresentaram discrepância entre o sinal do vetor de regressão e do

    coeficiente de correlação com a atividade biológica (KIRALJ; FERREIRA, 2009).

    3.2.5 Validação do modelo A validação interna do modelo foi obtida a partir dos parâmetros de méritos R²

    e Q², e testes de validação y-randomization  e Leave-N-out (LNO)  (GRAMATICA,

    2007; KIRALJ; FERREIRA, 2009). A validação externa foi realizada empregando um

    conjunto teste de 12 compostos, a fim de se verificar a capacidade preditiva dos

    melhores modelos obtidos. Tal capacidade foi avaliada utilizando o coeficiente de

    correlação externo (Q²ext).

    O modelo final que passou nas devidas etapas de validação teve seusdescritores visualizados no espaço 3D ao redor das moléculas alinhadas. As

    coordenadas que definem os descritores são expressas em formato . pdb e exibidas

    como esferas utilizando o programa USCF Chimera (PETTERSEN et al., 2004). A

    interpretação dos descritores do modelo foi feita com base na disposição espacial,

    natureza energética e pelo sinal do vetor de regressão.

    3.2.5.1 Leave-N-out e y-randomizationPara o teste de LNO, os modelos foram considerados robustos se os desvios

    máximos absolutos de Q²LNO e que o Q²LOO não fossem superiores que 0,1, para N

  • 8/17/2019 Dissertação Carolina Correções Norberto

    44/103

    44

    sendo cerca de 20-30% das amostras separadas para validação interna

    (GRAMATICA, 2007; KIRALJ; FERREIRA, 2009). O resultado é mostrado

    graficamente, exibindo o valor do desvio máximo e o valor médio de dois desvios

    padrão.

    No teste y-r andomization os modelos foram construídos com atividades

    biológicas randomizadas para gerar modelos que apresentassem pouca qualidade

    estatística (R² e Q² baixos). Os descritores obtidos para os modelos foram

    considerados livres de correlação ao acaso quando os interceptos para as regressões

    lineares dos valores de |r| x Q²yrand e |r| x R²yrand forem aQ  < 0,05 e aR  < 0,3

    (ERIKSSON et al., 2003). Os resultados foram expressos em dois gráficos contendo

    a linha para a regressão linear, seguindo as equações:

    i) ² + ||  (4)ii) ² + || 

    Onde Q²yrad e R²yrad são os parâmetros estatísticos do coeficiente de correlação

    para os modelos randômicos, aQ e aR são os interceptos da reta e |r| é o coeficiente

    de correlação de Pearson. Foram realizadas 100 randomizações de y.

  • 8/17/2019 Dissertação Carolina Correções Norberto

    45/103

    45

    4 RESULTADOS E DISCUSSÕES.

    4.1 Caracterização do conjunto de dados.

    Um conjunto de dados de 49 compostos foi utilizado para a construção de

    modelos LQTA-QSAR dependente de receptor (JAUDZEMS et al., 2014). A figura 15

    mostra o esqueleto principal dos inibidores da série escolhida. As moléculas do

    conjunto de dados variam a partir de quatro pontos de modificação, R1, R2, R3, R4,

    mantendo sempre o radical Alofenilnorstatinas com um anel tiazolidina.

    Seguindo a convenção de Schechter (SCHECHTER; BERGER, 1967), as

    regiões dos substratos, ou inibidores (P1-Pn/P1’-Pn’) são correspondentes a regiões

    que interagem no sitio ativo (S1-Sn/S1’-Sn’) das plasmepsinas (BHAUMIK;

    GUSTCHINA; WLODAWER, 2012).

    Figura 15 – Farmacóforo característico da série de compostos utilizada na construçãodo modelo LQTA-QSAR. Anel de cinco membros tiazolidina e os locais de possíveissubstituições (R1, R2, R3 e R4)

    Fonte: elaborado pelo autor

    Tal conjunto de dados é inédito na criação de modelos de QSAR na literatura.

     As estruturas químicas dos compostos e seus respectivos valores de atividade

    biológicas, expresso em pki, estão apresentados na Tabela 4.

  • 8/17/2019 Dissertação Carolina Correções Norberto

    46/103

    46

    Tabela 4 – Conjunto de dados retirados da literatura (continua).

    Composto¹ R1 R2 R3 pKi 

    1 H CH3  H 8.04

    3 CH3  H H 8.07

    4 CH3  CH3  H 7.92

    5 H CH2 CH3  H 9.16

    6 H CH2 CH3  CH2 CH3  8.29

    7 CH2 CH3  CH2 CH3  H 8.37

    8 CH2 CH3  CH2 CH3  CH2 CH3  8

    Composto² R pKi Composto

    R pKi 

    9 9.30 17 6.95

    10 7.14 18 6.14

    11 7.65 19 7.02

  • 8/17/2019 Dissertação Carolina Correções Norberto

    47/103

    47

    Tabela 4 – Continuação. 

    Composto² R pKi Composto

    R pKi 

    12 6.27 20 7.38

    13 7.95 21 6.25

    15 7.82 23 7 

    16 7 24 6.56

    Composto³ R1 R2 R3 R4 pKi

    25 - - 4.02

  • 8/17/2019 Dissertação Carolina Correções Norberto

    48/103

    48

    Tabela 4 – Continuação. Composto³ R1 R2  R3  R4 pKi

    26 CH3  CH3  5.06

    27

    - - 4.89

    29 CH3  CH3  7.15

    30 - - 5.03

    31 - - 6.22

  • 8/17/2019 Dissertação Carolina Correções Norberto

    49/103

    49

    32 CH3  CH3  7.52

    33

    CH3  CH3  7.69

    35 - - 5.09

    Composto4  R pKi 

    36 8.52

    37 7.82

  • 8/17/2019 Dissertação Carolina Correções Norberto

    50/103

    50

    Tabela 4 – Continuação 

    Composto4  R pKi 

    38 8.0k5

    39 9.7

    40 8.3

    Composto4R1 R2 R3 pKi

    41 H CH3  - 7.75

    42 - - CH3  8.30

    43 NH2  - - 8.40

    44 - NH2  - 7.92

    45 OH - - 7.95

    46 - OH - 8.40

    47 OCH3  - - 8.05

    48 - OCH3  - 7.77

    49 - - OCH3  8.40

    1Miura et al., 2010; 2Kiso et al., 2004; 3Nezami et al., 2002; 4Hidaka et al., 2007.

  • 8/17/2019 Dissertação Carolina Correções Norberto

    51/103

    51

    4.2 Divisão do conjunto de dados para a construção do modelo LQTA-QSAR

    O conjunto de dados foi dividido em grupo de treinamento e grupo teste, 85%

    e 25% dos compostos, respectivamente. Para esta divisão, utilizou-se o método de

    análise de grupamentos hierárquicos (HCA –Hierarchical Cluster Analyses) a partir de

    um dendograma (Figura 16). Os grupos testes e de treinamento foram escolhidos de

    modo que o menor e o maior valor de pKi (composto 25 e 39) não fossem selecionados

    para o grupo externo (conjunto teste) e de modo que os dois conjuntos apresentassem

    uma boa distribuição ao longo do intervalo de atividade. O grupo de treinamento ficou

    constituído de 37 compostos e o grupo teste de 12 compostos. O grupo teste foi

    constituídos dos compostos 17, 21, 29, 14, 40, 30, 32, 43, 5, 6, 3 e 27. O restante foi

    utilizado como conjunto de treinamento para o modelo LQTA-QSAR.

    Figura 16  – Dendograma referente à análise de grupamentos hierárquicos para o

    conjunto de dados (a numeração dos compostos não corresponde a numeração

    referente a tabela).

    4.3 Adaptação do sítio ativo.

     A adaptação do sitio ativo do cristal da Plasmepsina II se mostrou necessária,

    porque o ligante cocristalizado tem uma estrutura química baseada em

    hidroxietilaminas, diferente dos compostos que compõe a série utilizada para a

  • 8/17/2019 Dissertação Carolina Correções Norberto

    52/103

    52

    construção do modelo. A alta flexibilidade da estrutura da proteína (HUIZING;

    MONDAL; HIRSCH, 2015) acrescentou à necessidade de realizar o processo de

    docagem manualmente, e não, com o docking automatizado.

    Inicialmente, todo o conjunto de dados passou pelo processo de docking  

    automatizado, utilizando o programa AutoDock Vina (TROTT; OLSON, 2010). As

    conformações obtidas para todo o conjunto de dados, apesar de apresentarem uma

    função de avaliação (score) alto, não apresentaram conformações que permitissem o

    alinhamento das moléculas, ou que traduzissem um modo legítimo de interação

    similar entre si. A figura 17 mostra o melhor alinhamento das conformações obtidas

    com o docking  automatizado. É perceptível que o alinhamento obtido impossibilita a

    construção de um modelo QSAR-3D.

    Figura 17. Alinhamento das melhores conformações obtidas pelo processo dedocagem automatizado.

    Fonte: elaborado pelo autor

    Enquanto é perceptível que o processo automatizado traduz em conformações

    similares ao modo de interação desvendado pelo cristal, ela não condiz com modo de

    interação encontrado na literatura para as estruturas baseadas nas alofenilnorstatinas 

    (BJELIC et al., 2007; BOSS et al., 2003; ERSMARK; SAMUELSSON; HALLBERG,

    2006). As alofenilnorstatinas são desenhados para ocupar o espaço S1’ do sitio ativo

    da proteína e explorar o bolso S2’ (WEGSCHEID-GERLACH; GERBER; DIEDERICH,

  • 8/17/2019 Dissertação Carolina Correções Norberto

    53/103

    53

    2010), diferentemente da natureza do composto hidroxietilaminas cocristalizadas

    (JAUDZEMS et al., 2014).

    Frente a essa problemática, a realização de um modelo de previsão 4D se

    mostrou necessária. Utilizando-se das ferramentas de dinâmica molecular e

    aproveitando as vantagens de um modelo QSAR-4D frente a um 3D clássico (PATEL

    et al., 2014). Assim, foi possível adaptar o sitio ativo por encaixe induzido à série de

    compostos do conjunto de dados e aferir um modo de interação mais consonante ao

    modo de interação com a proteína.

    Composto 33 (pKi = 7,69), uma das moléculas mais ativa da série, foi escolhida

    para a adaptação do sitio ativo. A simulação de MD resultou em diversas

    conformações, entre elas, uma mais frequente revelando um modo de interaçãodistinto para moléculas derivadas de alofenilnorstatinas. A figura 18 mostra um corte

    transversal do sitio ativo.

    Figura 18 – Sitio ativo da Plm II com o Composto 33 (roxo) e ligante natural do cristal(azul).

     Fonte: elaborado pelo autor.

    Foi observado que o anel tiazolidina do composto ocupava a região S1’ do bolso

    hidrofóbico do sitio ativo, permitindo que o ligante alcance a região S2’. Atingindo

    assim, uma conformação mais estável do que a apresentada pela forma cristalizada.

    O benzil na região P1, comum para toda a série, interagiu com a região S1/S3 do sítio

  • 8/17/2019 Dissertação Carolina Correções Norberto

    54/103

    54

    ativo, fazendo interações de empilhamento-π  com os resíduos de Phe120, Try77 e

    Phe111 (flap). A Figura 19 mostra o composto 33 e os principais resíduos após a

    adaptação do sitio ativo 

    Figura 19. Composto 33 após adaptação do sítio ativo.

    Fonte: elaborado pelo autor.

     A díade catalítica, formada pelos resíduos Asp34 e Asp214 fazem ligações de

    hidrogênio com a carbonila e hidroxila da estrutura das alofenilnorstatinas. O anel

    tiazolidina interage com a região S1’ do sitio ativo, principalmente com os resíduos de

    Tyr192, Ile300 e Ile212.Sabe-se que o conjunto de dados foram planejados para simular um estado de

    transição do substrato da proteína Plasmepsina II, estado esse em que o substrato se

    estende pelos dois lados do centro catalítico e preenche a região hidrofóbica S1/S3 e

    S1’ (SHIM; MACKERELL, JR., 2011). Tal característica peptidiométrica foi confirmada

    pelos resultados da adaptação do sitio ativo e as simulações de dinâmica moleculares

    puderam ser conduzidas para o restante do conjunto de dados.

     Após a adaptação do sitio ativo para o composto 33, as moléculas restantes doconjunto de dados foi manualmente ancorado para a posição do modo de interação.

  • 8/17/2019 Dissertação Carolina Correções Norberto

    55/103

    55

    Translações e rotações das ligações permitiram produzir o input inicial para as

    subsequentes simulações de dinâmica molecular de todo o conjunto. A Figura 20

    mostra o alinhamento do conjunto de dados após o processo de adaptação do sitio

    ativo e docagem manual, antes do processo de cálculo dos descritores. É possível

    observar que o anel tiazolidina e o benzil de todos os conjuntos de dados estão

    alinhados todos no mesmo modo de interação.

    Figura 20. Melhor alinhamento após a adaptação do sitio ativo.

    Fonte: elaborado pelo autor.

    4.4 4D LQTA-QSAR

    Os descritores calculados com o programa Open3DQSAR e submetidos ao

    protocolo de filtragem virtual e seleção de variáveis descritos anteriormente. A tabela

    5 mostra a eliminação de descritores subsequentes de cada etapa de filtragem virtual.

    No Anexo 2 está disponível o script utilizado para automatizar as etapas de filtragem

    através do programa Matlab (“Mathlab.”, 2000)..A matriz inicial, após o cálculo dos

    descritores, com proporções de 49x63360 foi tratada como duas matrizes distintas,

    com 49 amostras e 31680 descritores cada, para descritores de LJ e QQ. A matriz

    final utilizada para a criação do modelo teve proporções de 37x443 (37 amostras

    referente ao grupo de treinamento e 443 descritores). A figura 21 mostra a matriz

    referentes aos descritores LJ no tocante ao corte. É possível observar, no primeiro

    gráfico, os valores elevados na casa de 3*10¹¹ de energia. No segundo gráfico, após

  • 8/17/2019 Dissertação Carolina Correções Norberto

    56/103

    56

    o tratamento, os descritores apresentam distribuição