planejamento e identificação de novos agentes...

105
Planejamento e identificação de novos agentes esquistossomicidas a partir de estratégias em Química Medicinal Goiânia 2014 UNIVERSIDADE FEDERAL DE GOIÁS FACULDADE DE FARMÁCIA Cleber Camilo de Melo Filho

Upload: nguyenminh

Post on 24-May-2018

218 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

Planejamento e identificação de novos agentes esquistossomicidas a partir de estratégias em

Química Medicinal

Goiânia

2014

UNIVERSIDADE FEDERAL DE GOIÁS

FACULDADE DE FARMÁCIA

Cleber Camilo de Melo Filho

Page 2: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

Cleber Camilo de Melo Filho

Planejamento e identificação de novos agentes esquistossomicidas a partir de estratégias em

Química Medicinal

Goiânia

2014

Dissertação apresentada ao Programa de Pós-

Graduação em Ciências Farmacêuticas da

Faculdade de Farmácia da Universidade Federal

de Goiás, como parte dos requisitos para

obtenção do título de Mestre em Ciências

Farmacêuticas.

Área de Concentração: Fármacos e

Medicamentos

Orientadora: Profª. Drª. Carolina Horta Andrade

Page 3: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do
Page 4: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

DEDICATÓRIA

Dedico este trabalho aos meus pais, Cleber

e Judite, exemplos de perseverança e

esforço que me inspiraram na luta pelos

meus sonhos.

Page 5: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

AGRADECIMENTOS

Primeiramente a Deus, pela oportunidade de estar aqui hoje, realizando mais um

sonho.

À professora Dra. Carolina Horta Andrade, pelo exemplo de profissionalismo e

competência, pela orientação, paciência e oportunidade de realizar este trabalho.

Aos meus pais, Cleber e Judite, pelo carinho e por me incentivarem, desde a infância,

a buscar o conhecimento e a lutar pelos meus sonhos.

Ao Rodolpho de Campos Braga, pela contribuição, ensinamentos e disposição em

ajudar.

A todos os colegas do LabMol pelos momentos de descontração e troca de

conhecimento.

À minha esposa Wagna, pelo amor, carinho, companheirismo e compreensão.

À OpenEye Scientific Software, pela licença acadêmica de programas utilizados neste

trabalho.

Ao CNPq, CAPES e FAPEG pelo apoio financeiro.

Ao Portal de Periódicos da CAPES.

Page 6: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

EPÍGRAFE

“Saber muito não lhe torna inteligente. A

inteligência se traduz na forma que você

recolhe, julga, maneja e, sobretudo, onde e

como aplica esta informação."

Carl Sagan

Page 7: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

SUMÁRIO

LISTA DE FIGURAS X

LISTA DE TABELAS XIII

LISTA DE ABREVIATURAS E SIGLAS XV

RESUMO XVIII

ABSTRACT XIX

1. INTRODUÇÃO 20

1.1. Esquistossomose 20

1.1.1. Etiologia e patogenia 20

1.1.2. Ciclo de vida do parasito 21

1.1.3. Distribuição e epidemiologia 23

1.3.3.1. A esquistossomose no Brasil 24

1.1.4. Fármacos utilizados no tratamento da esquistossomose 25

1.1.4.1. Praziquantel 25

1.1.4.2. Oxamniquina 27

1.1.4.3. Novos candidatos ao controle da esquistossomose 28

1.2. Planejamento e descoberta de novos fármacos 30

1.3. Química Medicinal e planejamento de fármacos 33

1.3.1. Relações Quantitativas entre a Estrutura e Atividade (QSAR) 34

1.3.1.1. Holograma QSAR (HQSAR) 36

1.3.1.2. Análise Comparativa de Campos Moleculares (CoMFA) 38

1.3.1.3. Análise Comparativa dos Índices de Similaridade Molecular (CoMSIA) 40

1.4. Bases Moleculares para o planejamento de novos fármacos

esquistossomicidas

42

1.4.1. Tioredoxina Glutationa Redutase de Schistosoma mansoni (SmTGR) 42

1.4.2. Oxadiazóis-2-óxidos 45

2. JUSTIFICATIVA 47

3. OBJETIVOS 48

3.1. Objetivo geral 48

3.2. Objetivos específicos 48

4. MATERIAL E MÉTODOS 49

Page 8: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

4.1. Material 49

4.1.1. Computadores e softwares 49

4.1.2. Conjunto de dados 49

4.2. Métodos 51

4.2.1. Construção das estruturas 3D, minimização de energia e cálculo de cargas 51

4.2.2. Divisão do conjunto de dados 52

4.2.3. QSAR-2D 52

4.2.3.1. HQSAR 52

4.2.4. QSAR-3D 53

4.2.4.1. Alinhamento molecular 53

4.2.4.2. CoMFA 54

4.2.4.3. CoMSIA 55

4.2.5. Validação dos modelos de QSAR 55

4.2.5.1. Validação interna 55

4.2.5.2. Validação externa 56

4.2.6. Planejamento de novos inibidores de SmTGR a partir dos estudos de QSAR 58

5. RESULTADOS E DISCUSSÃO 59

5.1. Caracterização do conjunto de dados 59

5.2. QSAR-2D 60

5.2.1. HQSAR 60

5.2.1.1. Identificação de outliers 60

5.2.1.2. Construção dos modelos de HQSAR 63

5.3. QSAR-3D 70

5.3.1. Cálculo de cargas atômicas parciais 70

5.3.2. Alinhamento molecular 70

5.3.3. Análises de CoMFA 74

5.3.3.1. Identificação de outliers 74

5.3.3.2. Modelos de CoMFA utilizando as cargas Gasteiger-Hückel 75

5.3.3.2.1. Modelos obtidos a partir do alinhamento 1 (ROCS) 76

5.3.3.2.2. Modelos obtidos a partir do alinhamento 2 (Surflex-Sim) 76

5.3.3.3. Modelos de CoMFA utilizando as cargas AM1-BCC 77

5.3.3.3.1. Modelos obtidos a partir do alinhamento 1 77

5.3.3.3.2. Modelos obtidos a partir do alinhamento 2 78

Page 9: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

5.3.3.4. Melhores modelos de CoMFA 79

5.3.3.5. Mapas de contorno de CoMFA 81

5.3.4. Análises de CoMSIA 84

5.3.4.1. Identificação de outliers 84

5.3.4.2. Modelos de CoMSIA utilizando as cargas Gasteiger-Hückel 84

5.3.4.2.1. Modelos obtidos a partir do alinhamento 1 (ROCS) 84

5.3.4.2.2. Modelos obtidos a partir do alinhamento 2 (Surflex-Sim) 85

5.3.4.3. Modelos de CoMSIA utilizando as cargas AM1-BCC 86

5.3.4.3.1. Modelos obtidos a partir do alinhamento 1 86

5.3.4.3.2. Modelos obtidos a partir do alinhamento 2 87

5.3.4.4. Melhores modelos de CoMSIA 88

5.3.4.5. Mapas de contorno de CoMSIA 89

5.4. Planejamento de novos inibidores de SmTGR a partir dos estudos de

QSAR

91

6. CONCLUSÕES 95

7. PERSPECTIVAS 96

8. REFERÊNCIAS BIBLIOGRÁFICAS 97

Page 10: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

X

LISTA DE FIGURAS

Figura 1 Ciclo de vida dos parasitos do gênero Schistosoma. As setas vermelhas

indicam a fase do ciclo que ocorre na água e no hospedeiro intermediário.

As setas azuis indicam a fase do ciclo que ocorre no hospedeiro

definitivo.

22

Figura 2 Distribuição global da esquistossomose em 2011 (Adaptado de WHO,

2013). 24

Figura 3 Estrutura química dos dois enantiômeros do praziquantel. 26

Figura 4 Estrutura química da oxamniquina. 27

Figura 5 Etapas envolvidas na gênese de fármacos (Adaptado de NWAKA,

RIDLEY, 2003).

31

Figura 6 Esquema das etapas envolvidas na geração dos hologramas moleculares e

dos modelos HQSAR. 37

Figura 7 Etapas envolvidas na geração de modelos CoMFA. 40

Figura 8 Comparação entre os potenciais de Lennard-Jones e de Coulomb

(CoMFA) e a função Gaussiana (CoMSIA). Em CoMFA, pequenas

variações na distância (r) podem provocar variações muito grandes de

energia (Adaptado de KUBINYI, 1997).

41

Figura 9 Enzimas tioredoxina redutase e glutationa redutase envolvidas na

proteção contra espécies reativas de oxigênio na maioria dos eucariotos

(A) e a enzima tioredoxina glutationa redutase que desempenha essa

função no Schistosoma mansoni (B) (Adaptado de Kuntz et al., 2007).

43

Figura 10 Estrutura da SmTGR (PDB ID: 2V6O) (ANGELUCCI et al., 2008). A

alça C-terminal flexível de um monômero fornece elétrons para os

domínios Trx e Grx do outro monômero (adaptado de SACCOCCIA et

al., 2012).

45

Figura 11 Estrutura química do furoxano (A) e estrutura do anel 1,2,5-oxadiazol-2-

óxido (anel oxadiazólico) (B) presente em todos compostos da série de

inibidores da tioredoxina glutationa redutase de S. mansoni.

46

Figura 12 Gráfico de dispersão dos valores de pIC50 experimental para os

compostos do conjunto de dados.

49

Page 11: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

XI

Figura 13 Curvas de regressão com interceptação em zero (linha pontilhada) e sem

interceptação em zero (linha contínua). O rm2 é obtido sem a inversão dos

eixos (A); O r’m2 é obtido após a inversão dos eixos (B) (Adaptado de

ROY et al., 2013).

57

Figura 14 Estrutura química do anel 1,2,5-oxadiazol-2-óxido. 59

Figura 15 (A) Distribuição dos valores de potência no conjunto de dados total e nos

conjuntos treinamento e teste; (B) Proporção entre compostos do

conjunto treinamento e teste dentro de cada uma das três unidades

logarítmicas de potência.

60

Figura 16 Gráficos de atividade biológica experimental versus predita para os

modelos 2 e 3 (os círculos representam os compostos do conjunto

treinamento e os losangos os compostos do conjunto teste).

66

Figura 17 Mapas de contribuição gerados a partir do modelo 2. (A) Mapa de

contribuição para o composto mais potente do conjunto de dados; (B)

Mapa de contribuição para o composto menos potente do conjunto de

dados. Os fragmentos em azul representam a máxima subestrutura

comum (MCS).

68

Figura 18 Esquema demonstrando a liberação de NO a partir de uma molécula de

oxadiazol-2-óxido em solução fisiológica contendo tióis. O ataque

nucleofílico do grupo tiolato pode ocorrer nos carbonos C4 e C3 do anel

oxadiazólico (Adaptado de GASCO et al., 2004).

69

Figura 19 Alinhamentos moleculares utilizados nos estudos de QSAR-3D. (A)

Alinhamento no ROCS (alinhamento1); (B) alinhamento no Surflex-Sim

(alinhamento 2).

71

Figura 20 Esquema demonstrando o alinhamento realizado pelo programa ROCS.

As moléculas do conjunto de dados são sobrepostas a uma molécula de

referência e em seguida, é realizado um processo de otimização que

maximiza a sobreposição dos volumes moleculares (OPENEYE

SCIENTIFIC SOFTWARE INC., 2011).

72

Figura 21 Esquema demonstrando o alinhamento realizado no Surflex-Sim. (A) A

similaridade entre as moléculas é definida como as diferenças entre

medidas de superfície e pontos de observação; (B) Representação do

procedimento de otimização do alinhamento, o qual utiliza tripletos

constituídos de pontos de observação de duas moléculas (Adaptado de

JAIN, 2004).

73

Page 12: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

XII

Figura 22 Gráficos das atividades experimental versus predita construídos a partir

dos dois melhores modelos de CoMFA. Os círculos representam os

compostos do conjunto treinamento e os losangos os compostos do

conjunto teste.

80

Figura 23 Mapas de contorno para o composto mais potente do conjunto de dados

obtidos a partir do modelo I. Mapa de contorno estérico (A); Mapa de

contorno eletrostático (B).

82

Figura 24 Mapas de contorno para o composto mais potente do conjunto de dados

obtidos a partir do modelo II. Mapa de contorno estérico (A); Mapa de

contorno eletrostático (B).

83

Figura 25 Gráficos da atividade experimental versus predita construídos a partir dos

dois melhores modelos de CoMSIA. (A) modelo I, obtido com cálculo de

cargas Gasteiger-Hückel e alinhamento 1; (B) modelo II, obtido com

cálculo de cargas AM1-BCC e alinhamento 1.

89

Figura 26 Mapas de contorno obtidos a partir do modelo II (SEHA). (A) mapa de

contorno estérico; (B) mapa de contorno eletrostático; (C) mapa de

contorno hidrofóbico; (D) mapa de contorno de aceptores de ligação de

hidrogênio.

90

Figura 27 Resumo das informações obtidas através dos estudos de QSAR-2D e

QSAR-3D.

92

Page 13: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

XIII

LISTA DE TABELAS

Tabela 1 Candidatos a fármacos esquistossomicidas, fitoterápicos e vacinas em

estudos pré-clínicos e clínicos.

29

Tabela 1

(cont.)

Candidatos a fármacos esquistossomicidas, fitoterápicos e vacinas em

estudos pré-clínicos e clínicos.

30

Tabela 2 Parâmetros de distinção de fragmentos no método HQSAR. 38

Tabela 3 Estruturas químicas, valores de IC50 e pIC50 dos inibidores de SmTGR. 50

Tabela 3

(cont.)

Estruturas químicas, valores de IC50 e pIC50 dos inibidores de SmTGR. 51

Tabela 4 Análises de HQSAR utilizando o conjunto de dados total, várias

distinções de fragmento e tamanho padrão de fragmento (4-7 átomos). 61

Tabela 5 Atividade experimental, predita e resíduos obtidos com modelo de

distinção de fragmento A/B/C/H/DA e tamanho de fragmento padrão (4-

7), utilizando todos os compostos.

62

Tabela 6 Análises de HQSAR utilizando o conjunto treinamento, após a retirada de

dois outliers, utilizando várias distinções de fragmento e tamanho padrão

de fragmento (4-7 átomos).

64

Tabela 7 Modelos de HQSAR com maior preditividade externa após variação do

tamanho de fragmento.

65

Tabela 8 Atividade biológica experimental, predita e valores residuais relacionados

aos dois melhores modelos de HQSAR. 66

Tabela 9 Atividade biológica experimental, predita e valores residuais obtidos a

partir de um modelo de CoMFA utilizando todos os compostos do

conjunto de dados.

74

Tabela 9

(cont.)

Atividade biológica experimental, predita e valores residuais obtidos a

partir de um modelo de CoMFA utilizando todos os compostos do

conjunto de dados.

75

Tabela 10 Melhores modelos de CoMFA obtidos a partir do alinhamento 1. 76

Tabela 11 Melhores modelos de CoMFA obtidos a partir do alinhamento 2. 77

Tabela 12 Melhores modelos de CoMFA obtidos a partir do alinhamento 1. 78

Tabela 13 Melhores modelos de CoMFA obtidos a partir do alinhamento 2. 78

Page 14: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

XIV

Tabela 14 Melhores modelos finais de CoMFA e seus resultados de robustez e

preditividade externa. 79

Tabela 15 Atividade biológica experimental, predita e resíduos dos compostos do

conjunto teste preditos pelos dois melhores modelos de CoMFA. 80

Tabela 16 Melhores modelos de CoMSIA obtidos a partir de cargas Gasteiger-

Hückel e alinhamento 1.

85

Tabela 17 Melhores modelos de CoMSIA obtidos a partir de cargas Gasteiger-

Hückel e alinhamento 2.

86

Tabela 18 Melhores modelos de CoMSIA obtidos a partir de cargas AM1-BCC e

alinhamento 1.

87

Tabela 19 Melhores modelos de CoMSIA obtidos a partir de cargas AM1-BCC e

alinhamento 2.

88

Tabela 20 Atividade biológica experimental, predita e resíduos dos compostos dos

conjunto teste após predição a partir dos dois melhores modelos de

CoMSIA.

89

Tabela 21 Estrutura química, valores de pIC50 preditos e valores de IC50 preditos

para os potenciais inibidores de SmTGR e o composto 33.

93

Tabela 21

(cont.)

Estrutura química, valores de pIC50 preditos e valores de IC50 preditos

para os potenciais inibidores de SmTGR e o composto 33.

94

Page 15: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

XV

LISTA DE ABREVIATURAS E SIGLAS

4D Quarta dimensão

5D Quinta dimensão

6D Sexta dimensão

ABC Proteína de transporte ABC (ATP-binding cassette)

ADMET Absorção, distribuição, metabolismo, excreção e toxicidade

CADD Planejamento de fármacos auxiliado por computador (Computer-

Aided/Assisted Drug Design)

Cav Canais de cálcio voltagem dependentes

CoMFA Análise Comparativa de Campos Moleculares (Comparative Molecular Field

Analysis)

CoMSIA Análise Comparativa dos Índices de Similaridade Molecular (Comparative

Molecular Similarity Analysis)

Cys Cisteína

DNA Ácido desoxirribonucleico (deoxyribonucleic acid)

DTN Doença tropical negligenciada

FAD Flavina adenina dinucleotídeo

GR Glutationa redutase

GSH Glutationa

GSSG Glutationa dissulfeto

H2O2 Peróxido de hidrogênio

HQSAR Holograma-QSAR

HTS Triagem biológica automatizada em alta escala (High Throughput Screening)

IC Intervalo de confiança

iRNA RNA interferente

IUPAC União Internacional de Química Pura e Aplicada (International Union of Pure

and Applied Chemistry)

LBDD Planejamento de fármacos baseado no ligante (Ligand-Based Drug Design)

LMO Deixe muitos de fora (Leave-Many-Out)

LOO Deixe um de fora (Leave-One-Out)

S-PZQ S-praziquantel

Page 16: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

XVI

MIFs Campos de interação moleculares (Molecular Interaction Fields)

NAPDPH Fosfato de dinucleotídeo de nicotinamida e adenina na forma reduzida

NCE Novas entidades químicas (New Chemical Entities)

NO Óxido nítrico

P&D Pesquisa e Desenvolvimento

pIC50 Logaritmo negativo de IC50 (-log IC50)

pKa Logaritmo negativo da constante de acidez (-log Ka)

PLS Regressão por mínimos quadrados parciais (Partial Least Squares)

PZQ praziquantel

q2

LMO Coeficiente de correlação da validação cruzada por LMO

q2

LOO Coeficiente de correlação da validação cruzada por LOO

QSAR Relação quantitativa entre a estrutura e atividade (Quantitative Structure-

Activity Relationships)

QSAR-2D QSAR bidimensional ou QSAR em duas dimensões

QSAR-3D QSAR tridimensional ou QSAR em três dimensões

QSAR-3D-RD QSAR-3D dependente do receptor (Receptor Dependent 3D-QSAR)

QSAR-3D-RI QSAR-3D independente do receptor (Receptor Independent 3D-QSAR)

r2

pred Coeficiente de correlação da predição

rm2 Coeficiente de correlação modificado

RMN Ressonância magnética nuclear

ROCS Rapid Overlay of Chemical Structures

ROS Espécies reativas de oxigênio (Reactive Oxygen Species)

SAR Relação entre a estrutura e atividade (Structure-Activity Relationships)

SBDD Planejamento de fármacos baseado na estrutura (Structure-Based Drug

Design)

SDC Coeficiente do desvio padrão (Standard Deviation Coefficient)

Sec Selenocisteína

SMDR2 Proteína de transporte de múltiplos fármacos (Multidrug transporter protein)

SmMRP1 Proteína associada a resistência a múltiplos fármacos 1 (Multidrug

Resistance-Associated Protein)

SmTGR Tioredoxina glutationa redutase de Schistosoma mansoni

Trx Tioredoxina

Trx-[SH]2 Tioredoxina reduzida

Page 17: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

XVII

TrxR Tioredoxina redutase

Trx-S2 Tioredoxina oxidada

VS Triagem virtual (Virtual Screening)

WHO Organização Mundial da Saúde (World Health Organization)

Page 18: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

XVIII

RESUMO

A esquistossomose é uma doença tropical negligenciada (DTN) que afeta grande número de

indivíduos, principalmente em áreas tropicais. Esta doença é causada por vermes platelmintos

do gênero Schistosoma, que possuem como hospedeiros intermediários os caramujos do

gênero Biomphalaria. O fármaco mais utilizado no tratamento atualmente é o praziquantel,

que devido à grande disseminação do seu uso, traz preocupações quanto ao desenvolvimento

de resistência. A enzima tioredoxina glutationa redutase de Schistosoma mansoni (SmTGR)

desempenha um papel importante na detoxificação de espécies reativas de oxigênio (ROS),

permitindo a sobrevivência dos parasitos por muito tempo na circulação sanguínea,

protegendo-os do sistema imune do hospedeiro. A dependência do parasito de um único

sistema para detoxificação de ROS, torna a SmTGR um alvo promissor no desenvolvimento

de novos fármacos esquistossomicidas. Frente à necessidade de se desenvolver novos

fármacos contra esquistossomose, foram realizados estudos quantitativos da relação entre

estrutura e atividade (QSAR) para uma série de oxadiazóis-2-óxidos reportados na literatura

como inibidores de SmTGR. Foi realizada análise de holograma-QSAR (HQSAR), que é um

método de QSAR bidimensional (QSAR-2D). Além disso, foram utilizadas a análise

comparativa de campos moleculares (CoMFA) e a análise comparativa dos índices de

similaridade molecular (CoMSIA), que são métodos de QSAR tridimensional (QSAR-3D). Nos

métodos de QSAR-3D foram utilizados dois métodos de cálculo de cargas parciais: o método

empírico Gasteiger-Hückel e o semi-empírico AM1-BCC. Foram também testadas duas

estratégias de alinhamento, uma baseada na sobreposição de volumes moleculares e outra

baseada em uma função de similaridade morfológica. Os modelos de QSAR gerados

demonstraram boa robustez e preditividade externa e foram usados para predição da atividade

biológica de novos compostos inibidores de SmTGR. Os mapas de contribuição e de contorno

obtidos forneceram informações estruturais importantes a respeito dos oxadizóis-2-óxidos,

que foram utilizadas no planejamento de novos inibidores da SmTGR.

Palavras-chave: Esquistossomose, Schistosoma mansoni, tratamento, SmTGR, HQSAR,

CoMFA, CoMSIA, planejamento de fármacos.

Page 19: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

XIX

ABSTRACT

Schistosomiasis is a neglected tropical disease (NTD) that affects many individuals, mainly in

tropical areas. This disease is caused by blood flukes of the genus Schistosoma, which have

the snails of the genus Biomphalaria as their intermediate hosts. The most used drug in

schistosomiasis treatment is praziquantel, which because of its widespread use, brings

concerns about the development of resistance. The enzyme Thioredoxin Glutathione

Reductase of Schistosoma mansoni (SmTGR) has an important function in reactive oxygen

species (ROS) detoxification, allowing the survival of parasites for a very long time in blood

stream, protecting them against the host immune system. The dependence of the parasite on a

single system for ROS detoxification, makes the SmTGR a promissing target in the

development of new schistosomicidal drugs. Facing the need for development of new drugs

against schistosomiasis, quantitative structure activity relationships (QSAR) studies were

carried out for a series of oxadiazoles-2-oxides reported in literature as SmTGR inhibitors.

Hologram-QSAR (HQSAR) analysis, a two-dimensional QSAR method (2D-QSAR), was

performed. Furthermore comparative molecular field analysis (CoMFA) and comparative

similarity indices analysis (CoMSIA), that are three-dimensional QSAR (3D-QSAR), were

also carried out. In 3D-QSAR methods, two partial charge calculation methods were used: the

empirical method Gasteiger-Hückel and the semiempirical method AM1-BCC. Two

alignment strategies were also tested, one based on molecular volume superposition and the

other based on a morphological similarity function. The QSAR models generated showed

great robustness and external predictivity and can be used to predict the biological activity of

new compounds inhibitors of SmTGR. The contribution and contour maps showed important

structural information about oxadiazoles-2-oxides that was used for the design of new

SmTGR inhibitors.

Keywords: Schistosomiasis, Schistosoma mansoni, treatment, SmTGR, HQSAR, CoMFA,

CoMSIA, drug design.

Page 20: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

20

1. INTRODUÇÃO

1.1. Esquistossomose

A esquistossomose é uma doença tropical negligenciada (DTN), termo usado para

descrever um grupo de doenças, infecciosas e parasitárias, que afetam um grande número

de indivíduos, principalmente em áreas tropicais, cuja ocorrência está associada a

condições de pobreza e falta de acesso a condições sanitárias adequadas. São doenças que

por muito tempo foram esquecidas pela comunidade internacional e receberam pouco

investimento da indústria farmacêutica (NWAKA; RIDLEY, 2003). Outros exemplos de

DTNs são: a tripanossomíase africana, a doença de Chagas, as leishmanioses, úlcera de

Buruli, hanseníase, tracoma, ascaridíase, tricuríase, filariose linfática, oncocercose e

dranculíase (FENWICK, 2012).

A esquistossomose apresenta grande impacto social, uma vez que a infecção

crônica pode debilitar os indivíduos, levando à má nutrição, anemia, baixa performance

escolar de crianças, baixa produtividade no trabalho e manutenção da pobreza (KING,

2010; KLOOS et al., 2008).

1.1.1. Etiologia e patogenia

A esquistossomose é uma doença parasitária, causada por vermes do gênero

Schistosoma, pertencentes ao filo dos platelmintos e à classe Trematoda, os quais são

parasitos do sistema circulatório humano e de animais. Na circulação, os parasitos se

alimentam de células sanguíneas, globulinas, realizam seu metabolismo anaeróbio e se

reproduzem sexuadamente. Dentre as espécies mais comuns destacam-se: S. mansoni e S.

japonicum, que se instalam nas veias mesentéricas causando a forma intestinal da doença;

S. haematobium, que se instala nas veias perivesicais causando a esquistossomose do trato

urinário. As espécies S. intercalatum, S. mekongi e S. malayensis ocorrem com menor

frequência. O ser humano é o hospedeiro definitivo, no qual ocorre a reprodução sexuada.

Os hospedeiros intermediários, nos quais ocorre a reprodução assexuada do parasito, são

encontrados em coleções de água doce com pouca correnteza. Exemplos de hospedeiros

intermediários são os caramujos dos gêneros Biomphalaria (S. mansoni), Bulinus (S.

haematobium) e Oncomelania (S. japonicum) (GRYSEELS, 2012).

Page 21: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

21

A fase aguda da doença se inicia após a penetração de cercárias na pele do

hospedeiro definitivo, o qual entra em contato com a água contendo cercárias provenientes

do hospedeiro intermediário. Os sintomas de fase aguda, que se manifestam

principalmente em indivíduos infectados pela primeira vez, consistem em lesões urticárias

na pele penetrada pelas cercárias, que podem persistir por horas ou até mesmo dias. Uma a

quatro semanas após a infecção, pode ser desenvolvida hipersensibilidade sistêmica,

causada pela migração e maturação de esquistossômulos, que representam a fase juvenil

do verme adulto. O diagnóstico nessa fase só é possível através de sorologia e histórico

recente de exposição a reservatórios aquáticos contendo caramujos (GRAY et al., 2011;

GRYSEELS, 2012).

A fase crônica da doença é caracterizada por morbidade causada principalmente

pelos vários anos de infecção crônica. Essa fase é diagnosticada observando-se a presença

de ovos nas fezes (forma intestinal, S. mansoni) ou na urina, acompanhada de hematúria

(forma urinária, S. haematobium). Episódios de anemia e diarréia sanguinolenta podem

ser observados como consequência da espoliação sanguínea. A maior parte dos sintomas

dessa fase está relacionada à migração dos ovos para diversos tecidos, onde os ovos ficam

presos e ocorrem reações inflamatórias e imunes do hospedeiro (formação de

granulomas). Infecções duradouras podem levar a lesões irreversíveis, caracterizadas por

fibrose. Os ovos podem ficar presos em órgãos próximos ao trato intestinal ou sistema

urinário. O fígado e o baço são dois órgãos onde os ovos comumente se depositam. A

presença desses ovos, em grande quantidade, estimula a resposta imune do hospedeiro em

larga escala, o que pode obstruir a veia porta, causando hipertensão e aumento do volume

desses órgãos (hepato-esplenomegalia). Além das formas intestinais e urinárias, pode

ocorrer esquistossomose ectópica, na qual o sistema nervoso central é afetado, além de

pulmões e órgãos genitais (BEZERRA et al., 1996; CONLON, 2005; GRYSEELS, 2012;

GRYSEELS et al., 2006).

1.1.2. Ciclo de vida do parasito

As fêmeas de Schistosoma podem produzir centenas ou até milhares de ovos por

dia (Figura 1). Cada ovo contém uma larva ciliada, o miracídio, o qual secreta enzimas

que auxiliam na migração dos ovos pelos vasos sanguíneos, através dos tecidos, chegando

até o lúmen do intestino (S. mansoni e S. japonicum) ou da bexiga (S. haematobium). A

Page 22: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

22

maioria dos ovos é levada pela corrente sanguínea ou presa em tecidos durante essa

jornada. Aproximadamente um terço desses ovos é excretado nas fezes ou na urina.

Quando o ovo entra em contato com a água, este libera o miracídio que utiliza seus cílios

para nadar à procura de um hospedeiro intermediário susceptível (caramujo). O miracídio

penetra o caramujo e se transforma, por um período de 4 a 6 semanas, em um esporocisto

multicelular, que se divide em várias larvas secundárias (reprodução assexuada),

denominadas cercárias. Sob o estímulo da luz, centenas de cercárias deixam o caramujo.

Figura 1 – Ciclo de vida dos parasitos do gênero Schistosoma. As setas vermelhas

indicam a fase do ciclo que ocorre na água e no hospedeiro intermediário. As setas azuis

indicam a fase do ciclo que ocorre no hospedeiro definitivo. (1) os ovos são eliminados

nas fezes (S. mansoni e S. japonicum) ou urina (S. haematobium). (2) sob condições

favoráveis os ovos eclodem e liberam miracídios. (3) os miracídios nadam e penetram os

hospedeiros intermediários. (4) os estágios no hospedeiro intermediário incluem duas

gerações de esporocistos e a produção de cercárias. (5) as cercárias são liberadas do

hospedeiro intermediário e nadam. (6) as cercárias penetram a pele do hospedeiro

definitivo. (7) as cercárias perdem a cauda bifurcada, tornando-se esquistossômulos. (8, 9)

Page 23: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

23

Os esquistossômulos migram através de vários tecidos e chegam ao sangue portal. (10) Os

vermes adultos se instalam nas veias mesentéricas (Adaptado de: CDC, 2013).

As cercárias se movimentam na água por até 72 horas. Quando entram em contato

com a pele humana, as cercárias penetram a derme, perdem a cauda, o glicocálix e

adquirem aspecto vermiforme, sendo a partir dessa fase denominadas esquistossômulos .

Os esquistossômulos, os quais representam a fase juvenil do verme adulto, migram através

da corrente sanguínea até o coração, atravessam os pulmões e vão para o fígado e veias

portais. Nesse local, os esquistossômulos amadurecem entre 4 a 6 semanas, se tornando

vermes adultos. Os vermes adultos se acasalam e migram para as veias mesentéricas, onde

a fêmea libera os ovos, que podem atingir a circulação sanguínea ou ser eliminados pelas

fezes ou urina do hospedeiro, dependendo da espécie em questão.

1.1.3. Distribuição e epidemiologia

A esquistossomose está presente em 78 países, mas dentre eles 19 não

apresentaram casos reportados recentemente, indicando que a transmissão da doença pode

ter sido interrompida nesses países. Estima-se que 52 países apresentem transmissão da

doença com intensidade que justifique a quimioterapia em grande escala. A situação atual

dos 7 países restantes ainda não foi determinada. A figura 2 representa a distribuição

mundial da esquistossomose em 2011 (WHO, 2013a).

Atualmente, estima-se que pelo menos 237 milhões de pessoas necessitem de

quimioterapia preventiva para esquistossomose. Destas, 90% vivem na África

Subsaariana. Mais de 70 % dos casos de infecção estão concentrados em apenas 10 países

africanos. Entretanto, resultados animadores têm sido observados em outras regiões do

planeta, como por exemplo, nas ilhas do Caribe e no Suriname, onde a transmissão é baixa

ou não foi detectada nos últimos anos. Na América do Sul, ainda são observadas baixas

taxas de transmissão no Brasil e na Venezuela, onde algumas áreas já poderiam ter

interrompido a transmissão se os esforços fossem aumentados. O controle da doença foi

alcançado na região leste do Mediterrâneo.

Page 24: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

24

Figura 2 – Distribuição global da esquistossomose em 2011 (Adaptado de WHO, 2013).

Na região oeste do Pacífico, o controle de S. japonicum tem sido promissor. Como já

mencionado, o quadro é preocupante no continente africano, em que a endemicidade

continua alta em países como a Somália, o Sudão e o Yêmen. (WHO, 2013b).

1.3.3.1. A esquistossomose no Brasil

No Brasil, a espécie de interesse é o Schistosoma mansoni, cujos hospedeiros

intermediários são os caramujos do gênero Biomphalaria. O S.mansoni é também

encontrada na África, Arábia e em outras regiões da América do Sul (GRYSEELS, 2012).

A introdução da esquistossomose no Brasil ocorreu durante a chegada de escravos

africanos, portadores da doença, à região nordeste do país durante o período colonial. A

esquistossomose foi descrita pela primeira vez no Brasil pelo médico Manoel Augusto

Pirajá da Silva, em 1908, com uma publicação na revista “Brazil Médico”, em que

levantou a hipótese pela primeira vez, de que o verme causador da doença, no Brasil, não

era o mesmo responsável pela forma urinária da doença, observada em outros países

(KATZ, 2008).

Page 25: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

25

A desigualdade social, os aspectos socioeconômicos e os movimentos migratórios

contribuíram para a disseminação da doença no nordeste e demais regiões do país. A

agricultura e atividade de pesca parecem estar significativamente relacionadas com a

prevalência da doença em comunidades rurais. Somados a esses fatores, destacam-se a

falta de condições adequadas de saneamento, o acesso e contato com fontes de água não

confiáveis e a educação sanitária da população. O grande movimento migratório de

indivíduos de regiões endêmicas para grandes centros urbanos contribuiu para o

aparecimento de casos nas periferias de metrópoles, como Belo Horizonte, São Paulo e

Rio de Janeiro (KLOOS et al., 2008).

1.1.4. Fármacos utilizados no tratamento da esquistossomose

O controle da esquistossomose consiste na integração de estratégias como o

tratamento através de fármacos esquistossomicidas, controle do hospedeiro intermediário,

educação e implementação de saneamento básico. O controle do hospedeiro intermediário

através de molusquicidas é realizado, mas a toxicidade dos compostos disponíveis afeta

outros organismos aquáticos, como pequenos peixes e anfíbios (GRYSEELS et al., 2006).

Os dois fármacos de escolha para tratamento da esquistossomose são o praziquantel e a

oxamniquina, sendo o primeiro mais utilizado devido à eficácia, baixo custo e poucos

efeitos adversos (ABDUL-GHANI et al., 2009; GRYSEELS et al., 2006).

1.1.4.1. Praziquantel

O praziquantel (PZQ) é um derivado pirazino-isoquinolínico com baixa toxicidade,

o qual foi sintetizado e testado em meados dos anos 70 (Figura 3). É um fármaco eficaz

contra as cinco espécies do parasito que infectam humanos. Ele está disponível como

mistura racêmica, na qual o isômero óptico (S)-praziquantel foi identificado como

provável composto ativo (ABDUL-GHANI et al., 2009). O PZQ apresenta baixa eficácia

contra parasitos imaturos. Os esquistossômulos são suscetíveis apenas nos primeiros 7

dias de vida. Nas semanas seguintes, os parasitos apresentam baixa resposta ao tratamento

com PZQ, tornando a ser sensíveis apenas 40 dias após a infecção. Portanto, em

indivíduos com alta carga parasitária, a presença de vermes imaturos diminui a capacidade

do PZQ de erradicar o parasito do organismo, exigindo-se repetição da quimioterapia

(CAFFREY; SECOR, 2011; CAFFREY, 2007; HAGAN et al., 2004).

Page 26: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

26

Figura 3 – Estrutura química dos dois enantiômeros do praziquantel.

O PZQ age sobre o parasito induzindo um influxo de cálcio, causando contrações

na sua musculatura e alterações estruturais no tegumento. Essas alterações causam danos à

superfície do parasito, que acaba expondo antígenos que o tornam suscetível ao ataque por

anticorpos do hospedeiro. Essa exposição dos antígenos, induzida pelo fármaco, explica o

sinergismo entre PZQ e sistema imune na morte de parasitos, como já foi demonstrado em

estudos in vivo (DOENHOFF et al., 2009). O mecanismo de ação proposto para esse

fármaco consiste na ligação do fármaco a subunidades (beta) de canais de cálcio

voltagem dependentes (Cav, além da ligação do fármaco às cadeias leves de miosina,

induzindo a paralisação do parasito. Entretanto, o mecanismo não está completamente

elucidado (CAFFREY; SECOR, 2011; SALVADOR-RECATALÀ; GREENBERG,

2012).

Apesar dos bons resultados obtidos pelo PZQ no tratamento da esquistossomose, a

terapia em grande escala tem levantado preocupações quanto ao desenvolvimento de

resistência ao fármaco por parte do parasito. Essas preocupações aumentam quando se

observa a grande frequência de casos de reinfecção em que o indivíduo, após ser tratado,

retoma o contato com coleções de água contaminada. O potencial de desenvolver

resistência da espécie S. mansoni foi avaliado experimentalmente em ratos em que os

parasitos foram submetidos a doses sub-terapêuticas. Após várias gerações do parasito,

foram observadas algumas com menor sensibilidade ao fármaco (ABDUL-GHANI et al.,

2009). Um isolado de S. mansoni no Senegal demonstrou ser menos suscetível ao PZQ,

quando comparado a isolados mantidos em laboratório. Algo semelhante foi reportado no

Page 27: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

27

Egito, em uma região de alta transmissão do parasito (ABDUL-GHANI et al., 2009;

CAFFREY, 2007; DOENHOFF et al., 2009). No Brasil, Bonesso-Sabadini & Dias

realizaram estudos de susceptibilidade ao PZQ em camundongos utilizando a cepa

humana (Ouh) de S. mansoni isolada de pacientes. Observou-se susceptibilidade reduzida

do parasito adulto ao PZQ acompanhada de retomada da liberação de ovos pelos

helmintos sobreviventes (BONESSO-SABADINI; DIAS, 2002).

Duas proteínas no S. mansoni podem estar envolvidas no mecanismo de resistência

ao PZQ, a SmMRP1 e SMDR2. Evidências indicam que há um aumento da expressão

dessas duas proteínas em resposta ao PZQ. Elas são homólogas de proteínas de transporte

ABC (do inglês, ATP-binding cassette), que constituem uma grande família de proteínas

de membrana que possuem várias funções celulares em animais, plantas e bactérias,

incluindo o transporte e peptídeos, hormônios, colesterol e ferro. Várias proteínas dessa

família podem estar envolvidas na resistência de parasitos a fármacos. Níveis mais altos

de SMDR2 são encontrados em fêmeas do parasito, enquanto a SmMRP1 é encontrada em

maior quantidade em machos. A SMDR2 parece ser modulada pelo PZQ e evidências

indicam que o PZQ é também um substrato de SMDR2 (WANG; WANG; LIANG, 2012).

1.1.4.2. Oxamniquina

A oxamniquina é um derivado tetrahidroquinolínico, descrito e sintetizado no final

dos anos 60 (Figura 4). É um fármaco utilizado principalmente no Brasil e países da

América do Sul. Ao contrário do PZQ, a oxamniquina é ativa somente contra S. mansoni.

De forma semelhante ao PZQ, a oxamniquina afeta de forma mais significativa os

parasitos adultos, sendo menos efetiva contra as formas mais jovens (esquistossômulos e

formas jovens no fígado) (ABDUL-GHANI et al., 2009).

Figura 4 - Estrutura química da oxamniquina.

O mecanismo de ação da oxamniquina está associado com a inibição irreversível

da síntese de ácidos nucléicos no parasito. O fármaco é ativado por uma enzima do

parasito, com características de sulfotransferase, através de esterificação. O éster formado

Page 28: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

28

se dissocia espontaneamente e o eletrófilo resultante é capaz de alquilar o DNA do

Schistosoma mansoni (ABDUL-GHANI et al., 2009; DOENHOFF et al., 2009).

Em 1973, as primeiras cepas de S. mansoni resistentes a oxamniquina foram

isoladas no Brasil. Nessas cepas, a inibição da síntese de ácidos nucléicos nos parasitos,

após tratamento, era reversível, ao contrário do que ocorre em parasitos sensíveis, nos

quais a inibição é irreversível (ABDUL-GHANI et al., 2009). Além disso, em cepas

resistentes é observada a ausência de atividade da enzima sulfotransferase, impedindo a

ativação do fármaco (DOENHOFF et al., 2009).

1.1.4.3. Novos candidatos ao controle da esquistossomose

O uso disseminado de PZQ no tratamento de esquistossomose associado aos casos

frequentes de reinfecção traz preocupações quanto ao desenvolvimento de resistência do

parasito à terapia, como já foi observado em certas regiões endêmicas. Tal fato tem

impulsionado a busca e o desenvolvimento de novos fármacos esquistossomicidas

(LOUKAS; BETHONY, 2008). Atualmente, há uma variedade de fármacos em fase pré-

clínica (Tabela 1) como os 1,2,4-trioxolanos, o antimalárico cloroquina, derivados do

PZQ, antimaláricos derivados da artemisinina combinados com PZQ (trioxaquantéis), os

ácidos aminoalcanoetilsulfúricos, os oxadiazóis e o composto K11777 (MÜLLNER et al.,

2011). Há compostos em estudos clínicos (Tabela 1) como os derivados da artemisinina

(artesunato, arteméter) (UTZINGER et al., 2007), a mefloquina (estudos de fase II

concluídos) e Mirazid® (fitoterápico, desenvolvido no Egito, em estudos de fase III)

(NIH, 2012a, 2013).

Atualmente, duas vacinas estão em fase de estudos clínicos (Tabela 1): Bilhvax1a,

cujos estudos de fase I estão concluídos e sm14, em que estudos de fase I serão iniciados

(NIH, 2012b, 2012c). A vacina Bilhvax1a, desenvolvida para esquistossomose urinária, é

baseada na glutationa S-transferase recombinante de S. haematobium. Recentemente, esta

vacina foi testada por Riveau e colaboladores em 24 voluntários sadios do sexo

masculino. Os resultados indicaram que a vacina é capaz de gerar resposta imune e

apresenta bom perfil de segurança e tolerabilidade (RIVEAU et al., 2012). No Brasil,

pesquisadores da Fundação Oswaldo Cruz realizarão estudos clínicos de fase I para a

vacina sm14, desenvolvida contra S. mansoni. Atualmente, aguarda-se o início do

Page 29: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

29

recrutamento de voluntários sadios para avaliação da imunogenicidade e segurança da

sm14 (NIH, 2012c).

Tabela 1 - Candidatos a fármacos esquistossomicidas, fitoterápicos e vacinas em estudos pré-

clínicos e clínicos.

Compostos Estrutura Química Fase Referência

1,2,4-trioxolanos

Pré-clínica

(XIAO et al.,

2007)

cloroquina

Pré-clínica

(OLIVEIRA et

al., 2004)

derivados do PZQ

Pré-clínica

(RONKETTI et

al., 2007)

trioxaquantéis

Pré-clínica

(LAURENT et

al., 2008)

ácidos

aminoalcanoetilsulfúricos

Pré-clínica

(MOREIRA et

al., 2007)

oxadiazóis

Pré-clínica

(SAYED et al.,

2008)

K11777

Pré-clínica

(ABDULLA et

al., 2007)

Page 30: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

30

Tabela 1 (cont.) - Candidatos a fármacos esquistossomicidas, fitoterápicos e vacinas em

estudos pré-clínicos e clínicos.

Adaptado de MÜLLNER et al., 2011; NIH, 2012a-c; NIH, 2013.

1.2. Planejamento e descoberta de novos fármacos

A descoberta e o desenvolvimento de novos fármacos é um processo longo e

complexo que compreende várias etapas e custos elevados. Esse processo envolve a

integração de várias áreas estratégicas relacionadas à inovação, conhecimento, tecnologia,

gerenciamento e altos investimentos em Pesquisa e Desenvolvimento (P&D). (DIMASI;

HANSEN; GRABOWSKI, 2003; FERREIRA; OLIVA; ANDRICOPULO, 2011;

LOMBARDINO; LOWE, 2004). Os custos envolvidos em todas as etapas de

desenvolvimento de novos fármacos, na última década, variaram de US$ 200 milhões a

US$ 880 milhões, em alguns casos ultrapassando US$ 1 bilhão. Esse processo requer um

tempo médio de 13,5 anos de investimento em P&D (ADAMS; BRANTNER, 2006;

MORGAN et al., 2011; PAUL et al., 2010).

Compostos Estrutura Química Fase Referência

derivados da

artemisinina

Fase II

(UTZINGER et al.,

2007)

mefloquina

Fase II concluída

(VAN NASSAUW

et al., 2008)

Mirazid®

Fitoterápico

Fase III em

andamento

(NIH, 2012a)

Bilhvax1a

Vacina

Fase I concluída

(RIVEAU et al.,

2012)

sm14

Vacina

Fase I

(NIH, 2012c)

Page 31: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

31

A gênese de fármacos pode ser dividida em duas grandes etapas: a descoberta

(pesquisa básica) e o desenvolvimento (ensaios pré-clínicos e clínicos) (Figura 5)

(ELEBRING; GILL; PLOWRIGHT, 2012; LOMBARDINO; LOWE, 2004).

Figura 5 - Etapas envolvidas na gênese de fármacos (Adaptado de NWAKA, RIDLEY,

2003).

A etapa de descoberta se inicia com a identificação de um potencial alvo

relacionado a determinado quadro clínico ou doença. Tal alvo geralmente consiste em

uma proteína (macromolécula), por exemplo, uma enzima, receptor ou transportador. É

importante que esse alvo seja validado, ou seja, que ele demonstre um papel importante no

processo fisiopatológico estudado. A validação de um alvo pode ser feita, por exemplo,

através de técnicas que bloqueiam a expressão de genes que o codificam (knock out),

observando a influência, no processo fisiopatológico, da não expressão desses genes. Em

doenças infecciosas e parasitárias a validação do alvo consiste em se avaliar o impacto da

não expressão de determinado gene na sobrevivência do agente etiológico (ELEBRING;

GILL; PLOWRIGHT, 2012; GASHAW et al., 2011; HUGHES et al., 2011; NWAKA;

HUDSON, 2006).

Uma vez definido o alvo, estudos são realizados para se buscar novos compostos

ligantes (hits) que sejam capazes de modular in vitro a atividade do alvo selecionado. Os

hits, que podem ser de origem natural ou sintética, podem ser identificados a partir de

triagens experimentais (biológicas, bioquímicas), virtuais (computacionais) ou por meio

de planejamento racional. Um exemplo de triagem experimental é a triagem biológica

automatizada em alta escala (HTS, do inglês High Throughput Screening). Nos estudos

computacionais destacam-se as estratégias de organização de bases de dados, aplicação de

filtros para seleção dos compostos mais promissores e triagem virtual (VS, do inglês

Virtual Screening). Os hits devem ser otimizados em relação às propriedades

farmacodinâmicas (potência, afinidade, seletividade) e farmacocinéticas (absorção,

metabolismo, biodisponibilidade). Os compostos otimizados são então selecionados como

compostos líderes (DUFFY et al., 2012; GUIDO; OLIVA; ANDRICOPULO, 2008).

Durante a otimização de compostos líderes, estudos da relação entre a estrutura e

Page 32: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

32

atividade (SAR, do inglês Structure-Activity Relationships) e da relação quantitativa entre

a estrutura e atividade (QSAR, do inglês Quantitative Structure-Activity Relationships) são

realizados com o intuito de se obter informações que possam guiar o desenvolvimento de

análogos com propriedades otimizadas. Além disso, a potência e as propriedades ADMET

(absorção, distribuição, metabolismo, excreção e toxicidade) são aprimoradas através da

modulação de certas propriedades físico-químicas importantes (lipofilicidade,

solubilidade, permeabilidade). Finalmente são obtidas novas entidades químicas (NCE, do

inglês New Chemical Entities), ou seja, novos candidatos a fármacos que serão

submetidos a estudos pré-clinicos e clínicos (CRAMER, 2012; ELEBRING; GILL;

PLOWRIGHT, 2012; NWAKA; RIDLEY, 2003).

A etapa de desenvolvimento compreende os estudos pré-clínicos e clínicos. Nos

estudos pré-clínicos, são realizados estudos in vivo em animais com objetivo de se avaliar

a segurança dos novos candidatos a fármacos. Além disso, estudos de formulação são

conduzidos. Os estudos clínicos compreendem os testes em seres humanos e podem ser

divididos em três fases. Na fase I, os candidatos a fármacos, que apresentaram resultados

promissores nos estudos pré-clínicos, são testados em um pequeno grupo de voluntários

sadios. O objetivo dessa fase é estabelecer doses seguras e obter mais informações a

respeito do perfil de ADMET dos compostos. Os estudos de fase II são realizados em

indivíduos portadores da doença ou quadro clínico investigado. O objetivo dos estudos é

obter informações sobre a segurança e resultados preliminares de eficácia. Nessa fase, é

recrutado um número maior de indivíduos que na fase I. Os estudos de fase III consistem

em testes em larga escala, utilizando um número ainda maior de indivíduos. Nesse

momento, a eficácia do candidato a fármaco é estabelecida e os efeitos adversos menos

comuns são observados. Uma vez que informações suficientes a respeito da potência e

eficácia do novo candidato a fármaco são obtidas, os resultados são submetidos a um

órgão regulador para que o novo fármaco possa ser aprovado e comercializado. Uma vez

no mercado, estudos de farmacovigilância, ou estudos de fase IV, são realizados para

monitoramento do novo fármaco na população geral. Uma vez que a amostragem de

indivíduos é muito mais ampla nessa fase e o tempo de estudo é maior, possíveis

problemas não detectados em fases anteriores podem aparecer, o que pode culminar com a

retirada do fármaco do mercado ou proscrição (DIMASI; HANSEN; GRABOWSKI,

2003; LOMBARDINO; LOWE, 2004).

Page 33: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

33

1.3. Química Medicinal e planejamento de fármacos

Segundo a União Internacional de Química Pura e Aplicada (IUPAC, do inglês

International Union of Pure and Applied Chemistry), a Química Medicinal é uma

disciplina baseada na química e que integra diversas áreas do conhecimento, envolvendo

aspectos das ciências biológicas, médicas e farmacêuticas, cujo objetivo é a invenção,

descoberta, planejamento, identificação e preparação de compostos biologicamente ativos,

além do estudo e interpretação do seu modo de interação a nível molecular, seu

metabolismo e das relações entre a estrutura química e atividade biológica (WERMUTH

et al., 1998).

A Química Medicinal está inserida em praticamente todo o processo de descoberta

e desenvolvimento de novos fármacos, desde o projeto inicial até a aprovação de um novo

fármaco (LOMBARDINO; LOWE, 2004). Diversas estratégias da Química Medicinal

podem ser utilizadas nesse processo, dentre elas destaca-se o planejamento de fármacos

auxiliado por computador (CADD, do inglês Computer-Aided/Assisted Drug Design). O

uso de métodos computacionais, atualmente, permeia todos os aspectos da descoberta de

fármacos e apresenta a vantagem de auxiliar na identificação de candidatos a fármacos de

forma mais rápida e com custos reduzidos. Tal expansão se deve aos grandes avanços

obtidos, nas últimas décadas, nas áreas de software e hardware. Somados a esses avanços,

também se destaca o crescimento experimentado pelas áreas de genômica e proteômica,

que permitiu o acesso a um grande número de informações estruturais de alvos biológicos.

Estima-se que, em 2006, houve um aumento de aproximadamente 7% no número de

estruturas únicas de proteínas depositadas no PDB (do inglês Protein Data Bank) e que

1000 novas estruturas sejam depositadas a cada ano (BAJORATH, 2012; DUFFY et al.,

2012; GUIDO; OLIVA; ANDRICOPULO, 2011; JORGENSEN, 2004; KAPETANOVIC,

2008; TALELE; KHEDKAR; RIGBY, 2010; WEIGELT et al., 2008).

Diferentes abordagens podem ser utilizadas para o planejamento de novos

candidatos a fármacos, dependendo do nível de conhecimento que se tem do alvo

terapêutico escolhido. Quando a estrutura do alvo macromolecular ou do complexo

ligante-receptor estão disponíveis, pode ser usada a estratégia de planejamento de

fármacos baseada na estrutura (SBDD, do inglês Structure-Based Drug Design).

Entretanto, quando a estrutura do alvo não é conhecida, métodos de planejamento

baseados no ligante (LBDD, do inglês Ligand-Based Drug Design) são utilizados. Em

muitos casos, o uso combinado das duas estratégias SBDD e LBDD, pode ser útil no

Page 34: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

34

processo de descoberta de novos fármacos, gerando informações adicionais fruto do

sinergismo entre as duas abordagens (COHEN, 1996; GUIDO; ANDRICOPULO;

OLIVA, 2010; GUIDO; OLIVA; ANDRICOPULO, 2011; JORGENSEN, 2004).

1.3.1. Relações Quantitativas entre a Estrutura e Atividade (QSAR)

A estratégia de QSAR é baseada no conceito de que diferenças observadas na

atividade biológica de compostos podem ser correlacionadas quantitativamente com

mudanças na estrutura molecular e parâmetros físico-químicos. Em um estudo de QSAR, a

atividade biológica ou a propriedade que se deseja modelar é tratada como variável

dependente e é correlacionada com descritores moleculares, que são as variáveis

independentes, através de métodos de regressão. O objetivo é a obtenção de modelos

capazes de predizer a atividade biológica de compostos relacionados, os quais não foram

usados na construção dos modelos. Além disso, os resultados de QSAR trazem

informações que podem guiar posteriores modificações moleculares em compostos

protótipos, com intuito de se obter análogos mais potentes e com propriedades físico-

químicas otimizadas (ALBUQUERQUE et al., 2007; DUDEK; ARODZ; GÁLVEZ, 2006;

KUBINYI, 1993).

Em estudos de QSAR, alguns critérios devem ser observados para se obter

resultados confiáveis e reprodutíveis. Um aspecto importante é a qualidade dos dados

experimentais utilizados na construção dos modelos. Os compostos devem ser testados

sob as mesmas condições experimentais, em um mesmo local, permitindo a comparação

direta dos dados obtidos. O conhecimento da origem e da forma como os dados foram

obtidos é importante em QSAR. Os dados de atividade biológica podem ser apresentados

como média de diversas medidas repetidas (replicatas), as quais devem apresentar sinais

de uma distribuição normal, indicando a ausência de erro sistemático durante as medidas.

A diferença entre a maior e menor medida de atividade biológica deve estar no mínimo

entre 3 ou 4 ordens de grandeza em escala logarítmica. Além disso, as moléculas devem

cobrir toda a faixa de atividade biológica e apresentar um esqueleto comum (DEARDEN;

CRONIN; KAISER, 2009; SCIOR et al., 2009).

Um estudo de QSAR deve atender aos seguintes critérios: (i) possuir um endpoint

(dado biológico) definido; (ii) utilizar algoritmos não ambíguos; (iii) possuir um domínio

Page 35: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

35

de aplicabilidade definido; (iv) ser validado utilizando medidas apropriadas de robustez e

preditividade; (v) permitir uma interpretação mecanística, se possível (OECD, 2007).

Desde as contribuições de Hansch e Fujita, nos anos 60, diferentes abordagens de

QSAR foram desenvolvidas e atualmente há uma grande variedade de métodos de QSAR

aplicados à descoberta deNCEs. De acordo com o número de dimensões consideradas no

cálculo dos descritores moleculares, os métodos de QSAR podem ser divididos em QSAR

clássico (2D), QSAR tridimensional (QSAR-3D) e QSAR multidimensional (4D, 5D, 6D).

No QSAR clássico, são calculados descritores relacionados a parâmetros físico-

químicos e descritores derivados de estruturas moleculares bidimensionais (QSAR-2D), ou

seja, que não dependem da orientação tridimensional dos compostos (HANSCH; FUJITA,

1964). Em contrapartida, os métodos de QSAR-3D utilizam descritores que dependem da

conformação tridimensional dos compostos. Os estudos de QSAR-3D podem ser

dependentes do receptor (QSAR-3D-RD, do inglês Receptor Dependent) ou indepententes

do receptor (QSAR-3D-RI, do inglês Receptor Independent). Métodos de QSAR-3D-RD

são baseados na estrutura tridimensional do complexo ligante-receptor. Métodos de

QSAR-3D-RI são baseados apenas na estrutura tridimensional dos compostos. Dentre os

métodos de QSAR-3D-RI, se destacam os baseados em farmacóforos, os baseados na

forma (shape-based) e aqueles baseados em campos moleculares (ALBUQUERQUE et

al., 2007; CLARK, 2009; HOPFINGER et al., 1997; VERMA; KHEDKAR; COUTINHO,

2010). Os avanços em hardware e software, nos anos 80, permitiram que diversos

métodos de QSAR-3D fossem desenvolvidos (COHEN, 1996). Um exemplo é o método

de Análise Comparativa de Campos Moleculares (CoMFA, do inglês Comparative

Molecular Field Analysis) (CRAMER; PATTERSON; BUNCE, 1988). Nas décadas

seguintes, métodos que adicionaram outras dimensões ao QSAR-3D foram desenvolvidos,

como o método proposto por Hopfinger e colaboradores que inclui, além das três

dimensões, múltiplas conformações dos ligantes como a quarta dimensão (4D)

(HOPFINGER et al., 1997). Outros exemplos são os métodos desenvolvidos por Vedani e

colaboradores, com os múltiplos confôrmeros, orientações e estados de protonação

considerados como a quarta dimensão (4D) (VEDANI et al., 2000), modelos de encaixe

induzido como a quinta dimensão (5D) (VEDANI et al., 2005) e múltiplos modelos de

solvatação como a sexta dimensão (6D) (VEDANI; DOBLER; LILL, 2005).

Page 36: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

36

1.3.1.1. Holograma QSAR (HQSAR)

O HQSAR é uma método de QSAR-2D baseado em fragmentos moleculares que não

requer informação explícita sobre a estrutura tridimensional dos compostos e não depende

do cálculo e seleção de descritores físico-químicos. Cada molécula utilizada na construção

do modelo é fragmentada, dando origem a diversos fragmentos estruturais que são

organizados em hologramas moleculares, os quais são formados por diversas caixas

(bins). Esses hologramas são semelhantes a “impressões digitais” moleculares

(fingerprints). Entretanto, nos fingerprints a representação é binária (indica presença ou

ausência de determinado fragmento) e nos hologramas moleculares cada bin contém a

informação do número de vezes que determinado fragmento se repete (LOWIS, 1997;

SALUM; ANDRICOPULO, 2009; SEEL; TURNER; WILLETT, 1999). As informações

codificadas nos hologramas moleculares são tratadas como variáveis independentes, as

quais são correlacionadas com a atividade biológica (variável dependente), através do

método de regressão por mínimos quadrados parciais (PLS, do inglês Partial Least

Squares) (LINDBERG; PERSSON; WOLD, 1983; SEEL; TURNER; WILLETT, 1999;

WOLD; SJÖSTRÖM; ERIKSSON, 2001). Como resultado, é gerada a equação de

HQSAR, a qual é usada para predizer a atividade biológica de compostos estruturalmente

relacionados que não participaram da construção do modelo. Os resultados de uma análise

de HQSAR podem ser representados graficamente através de mapas de contribuição, que

consistem em esquemas de cores aplicados aos átomos de cada estrutura, indicando a

contribuição de cada átomo para atividade biológica (SEEL; TURNER; WILLETT,

1999). Apesar de ser um método de QSAR-2D, informações tridimensionais podem ser

codificadas nos hologramas moleculares, tais como hibridação e quiralidade (SALUM;

ANDRICOPULO, 2009). A figura 6 mostra o esquema geral da construção de um modelo

HQSAR.

Page 37: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

37

Figura 6 - Esquema das etapas envolvidas na geração dos hologramas moleculares e dos

modelos HQSAR.

Em um estudo de HQSAR, alguns parâmetros que podem ser definidos pelo

usuário podem afetar a qualidade dos modelos, tais como: o comprimento de holograma, o

tamanho de fragmento e a distinção de fragmentos. O comprimento de holograma define a

quantidade de bins que serão usados na geração do modelo. O tamanho de fragmento

define a quantidade mínima e máxima de átomos que cada fragmento deve conter. A

distinção de fragmentos indica quais parâmetros serão usados na construção dos

hologramas moleculares, ou seja, que características moleculares serão levadas em conta

para diferenciação entre os fragmentos (LOWIS, 1997; SEEL; TURNER; WILLETT,

1999; TRIPOS, 2010a). A tabela 2 indica os parâmetros de distinção de fragmentos

disponíveis no método de HQSAR.

Em determinados casos, em que a quantidade de fragmentos é maior que o

comprimento de holograma, pode ocorrer o fenômeno de colisão de fragmentos. Este

fenômeno consiste em alocar fragmentos diferentes em um mesmo bin, podendo levar à

perda de informações importantes que acabam não sendo captadas pelo método de

regressão por PLS. Entretanto, para que a colisão de fragmentos não se perpetue à medida

que se aumenta o comprimento de holograma, todos os comprimentos disponíveis devem

ser números primos (SALUM; ANDRICOPULO, 2009; SEEL; TURNER; WILLETT,

1999; TRIPOS, 2010a).

Page 38: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

38

Tabela 2 - Parâmetros de distinção de fragmentos no método HQSAR.

Parâmetros Definição

Átomo (A) Tipos de átomos

Ligação (B)* Tipos de ligação química (simples, dupla, tripla e aromática)

Conectividade (C)* Hibridação dos átomos contidos no fragmento

Hidrogênio (H) Presença e número de átomos de hidrogênio

Quiralidade (Ch) Presença de centros estereogênicos

Doador e aceptor (DA) Presença de átomos aceptores ou doadores de ligação de

hidrogênio

* Parâmetros semelhantes. Ao incluir o parâmetro Ligação (B), porém, a vizinhança dos átomos é levada

em consideração, o que permite distinguir fragmentos que possuam o mesmo tipo de hibridação, mas

estejam localizados em diferentes ambientes químicos. Por exemplo, H-C=C-H (etileno) e H-C:C-H

(benzeno). Neste caso ambos os átomos de carbono possuem hibridização sp². O que os diferencia é que no

etileno a ligação é dupla e no benzeno a ligação é aromática.

1.3.1.2. Análise Comparativa de Campos Moleculares (CoMFA)

A Análise Comparativa de Campos Moleculares (CoMFA, do inglês Comparative

Molecular Field Analysis) é um método de QSAR-3D, o qual foi introduzido por Cramer e

colaboradores em 1988. Esse método é baseado no princípio de que as interações não-

covalentes entre os ligantes e o sítio ativo do alvo macromolecular, especialmente as

interações estéricas e eletrostáticas, são importantes para explicar determinado efeito

biológico. Portanto, o cálculo de campos de interação moleculares (MIFs, do inglês

Molecular Interaction Fields) ao redor de uma série de ligantes pode fornecer

informações importantes a respeito de sua atividade biológica (CRAMER; PATTERSON;

BUNCE, 1988).

O primeiro passo em um estudo de CoMFA, como em todo estudo de QSAR, é a

escolha de compostos quimicamente relacionados, ou seja, que possuam um farmacóforo

em comum, que se liguem ao mesmo alvo e atuem por um mesmo mecanismo de ação.

Portanto, a estrutura tridimensional dos compostos deve ser gerada e os confôrmeros de

menor energia, de cada composto (provável conformação bioativa) são escolhidos. É

realizado o cálculo de cargas atômicas parciais para todos os compostos e os mesmos são

alinhados para que seja representada a provável conformação bioativa dos compostos,

sendo esta etapa crucial em um estudo de CoMFA. O alinhamento molecular se apoia no

princípio de que moléculas que possuem um farmacóforo comum apresentam modos de

Page 39: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

39

ligação ao alvo biológico semelhantes (KUBINYI, 1997). As estruturas alinhadas são

colocadas em uma caixa tridimensional reticulada, com espaçamento entre os vértices

definido pelo usuário (normalmente de 0,5 a 2 Å). Os MIFs, representados pelos campos

estéricos (potencial Lennard-Jones) e eletrostáticos (potencial de Coulomb) são

calculados, em cada ponto de intersecção da grade, entre um átomo de prova e as

moléculas alinhadas. As energias de interação obtidas são usadas como descritores e

armazenadas em uma matriz em que cada linha corresponde a um composto do conjunto

de dados e cada coluna o valor da energia de interação (estérica e eletrostática), em

kcal/mol em determinado ponto da caixa reticulada. Os dados de atividade biológica são

armazenados em uma coluna que deve ser correlacionada com a matriz de descritores

(CRAMER; PATTERSON; BUNCE, 1988). Entretanto, o número de colunas na matriz de

descritores é muito maior que o número de linhas, tornando difícil a correlação entre a

atividade biológica e as energias de interação através de uma regressão linear

convencional. Portanto, é utilizado o método de regressão por PLS (LINDBERG;

PERSSON; WOLD, 1983; WOLD; SJÖSTRÖM; ERIKSSON, 2001).

O PLS é baseado no cálculo de variáveis latentes, as quais são combinações

lineares dos descritores originais (energias de interação calculadas) e também ortogonais

entre si, ou seja, cada variável codifica informações diferentes. Em outras palavras, a

regressão por PLS é baseada na projeção da matriz dos descritores originais e as novas

coordenadas resultantes são usadas como variáveis independentes na construção do

modelo de QSAR-3D. Esse procedimento reduz o número de variáveis (descritores)

evitando superajuste do modelo (overfitting). Portanto, cada componente da análise por

PLS é uma regressão que correlaciona parte da atividade biológica com uma variável

latente (HASEGAWA; FUNATSU, 2012; STANTON, 2012; WOLD; SJÖSTRÖM;

ERIKSSON, 2001). A figura 7 apresenta o esquema geral da geração de um modelo de

CoMFA.

Os resultados de um estudo de CoMFA podem ser representados graficamente

através dos mapas de contorno, os quais indicam pontos da grade reticulada onde

variações de energia estão relacionadas com variações na atividade biológica. Esses

mapas podem ser usados para estimar as regiões das moléculas onde alguns tipos de

interações estéricas e eletrostáticas têm influência favorável ou desfavorável na atividade

biológica. A interpretação desses mapas pode ser útil para guiar o planejamento de

Page 40: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

40

análogos mais potentes e desenvolvimento de novas moléculas (CRAMER;

PATTERSON; BUNCE, 1988; KUBINYI, 1997).

Figura 7 - Etapas envolvidas na geração de modelos CoMFA.

1.3.1.3. Análise Comparativa dos Índices de Similaridade Molecular (CoMSIA)

A Análise Comparativa dos Índices de Similaridade Molecular (CoMSIA, do inglês

Comparative Molecular Similarity Analysis) é outro método de QSAR-3D bastante

utilizado. Ao contrário do método de CoMFA, em que apenas os potenciais de Lennard-

Jones e de Coulomb são considerados, o método de CoMSIA acrescenta os campos

hidrofóbicos e de ligação de hidrogênio. Os potenciais de Lennard-Jones e Coulomb,

descrevem as contribuições energéticas da constante de ligação do complexo ligante-

receptor. Entretanto, esses dois potenciais não descrevem bem as contribuições entrópicas,

relacionadas à dessolvatação, o que é possível acrescentando-se os campos hidrofóbicos.

Além dos campos hidrofóbicos, o método de CoMSIA utiliza campos moleculares que

descrevem as propriedades de doadores e aceptores de ligação de hidrogênio (KLEBE;

ABRAHAM; MIETZNER, 1994).

No método de CoMSIA, semelhantemente ao CoMFA, as moléculas devem estar

previamente na conformação de menor energia, com as cargas parciais calculadas e com

as estruturas alinhadas. As moléculas são inseridas em uma caixa tridimensional

Page 41: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

41

reticulada, onde cada ponto de intersecção é percorrido por um átomo de prova, o qual é

usado para o cálculo dos índices de similaridade molecular. Os índices de similaridade,

obtidos em cada ponto de intersecção, são armazenados em uma matriz em que cada

coluna indica o índice calculado entre as moléculas e o átomo de prova. É utilizado o

método de regressão por PLS, em que as variáveis latentes resultantes são correlacionadas

com a atividade biológica (KLEBE; ABRAHAM; MIETZNER, 1994).

Assim como em CoMFA, os resultados podem ser representados graficamente

através de mapas de contorno. Entretanto, os mapas de contorno obtidos em CoMSIA, são

mais suaves e interpretáveis, pois não apresentam cortes abruptos de energia (KLEBE;

ABRAHAM, 1999). Isso ocorre, pois no método de CoMSIA é utilizada uma função do

tipo gaussiana, que ao contrário dos potenciais de Lennard-Jones e Coulomb, não

apresenta variações abruptas de energia em regiões próximas ao raio de van der Waals dos

átomos. Como consequência, o método CoMSIA é menos sensível ao alinhamento (Figura

8) (KLEBE; ABRAHAM; MIETZNER, 1994).

Figura 8 – Comparação entre os potenciais de Lennard-Jones e de Coulomb (CoMFA) e a

função Gaussiana (CoMSIA). Em CoMFA, pequenas variações na distância (r) podem

provocar variações muito grandes de energia (Adaptado de KUBINYI, 1997).

Page 42: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

42

1.4. Bases Moleculares para o planejamento de novos fármacos esquistossomicidas

Os avanços da genômica e proteômica nas últimas décadas, aliados aos avanços na

bioinformática e nos métodos de elucidação estrutural como cristalografia de raios-x e

ressonância magnética nuclear (RMN), possibilitaram uma expansão no conhecimento de

alvos moleculares. O conhecimento dos alvos e das vias metabólicas possibilita o

planejamento de novos candidatos a fármacos através de várias estratégias de CADD

(COHEN, 1996; JORGENSEN, 2004).

O sequenciamento completo do genoma de S. mansoni, em 2012, abriu novas

possibilidades na busca de alvos moleculares. Além disso, os dados do genoma trazem

informações importantes na exploração das diferenças entre as vias metabólicas do

parasito e do hospedeiro (ANGELUCCI et al., 2011; PROTASIO et al., 2012).

1.4.1. Tioredoxina Glutationa Redutase de Schistosoma mansoni (SmTGR)

S. mansoni pode sobreviver por décadas nas veias mesentéricas de indivíduos

infectados. A sobrevivência nos vasos sanguíneos, um ambiente aeróbio, exige que o

parasito desenvolva mecanismos de proteção contra espécies reativas de oxigênio (ROS,

do inglês Reactive Oxygen Species) produzidas pelo sistema imune do hospedeiro. Na

maioria dos eucariotos, dois sistemas principais participam da proteção contra ROS: um é

baseado no tripeptídeo glutationa (GSH) e outro baseado na proteína tioredoxina (Trx).

Nos dois sistemas, equivalentes redutores são fornecidos por NADPH através das enzimas

glutationa redutase (GR) e tioredoxina redutase (TrxR). Essas enzimas transferem elétrons

para seus respectivos carreadores, a glutationa dissulfeto (GSSG) e a tioredoxina oxidada

(Trx-S2). Portanto, esses carreadores são convertidos em GSH e tioredoxina reduzida

(Trx-[SH]2). O GSH e a Trx-[SH]2 fornecem equivalentes redutores para várias reações,

incluindo aquelas relacionadas à proteção contra ROS (ANGELUCCI et al., 2010;

KUNTZ et al., 2007).

No S. mansoni, as enzimas GR e TrxR são substituídas por uma única enzima

multifuncional, chamada tioredoxina glutationa redutase (SmTGR) (Figura 9). Esta é uma

enzima capaz de reduzir não apenas GSSG e Trx-S2, mas compostos como H2O2

(HUANG et al., 2011; KUNTZ et al., 2007).

Page 43: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

43

Figura 9 - Enzimas tioredoxina redutase e glutationa redutase envolvidas na proteção

contra espécies reativas de oxigênio na maioria dos eucariotos (A) e a enzima tioredoxina

glutationa redutase que desempenha essa função no Schistosoma mansoni (B) (Adaptado

de Kuntz et al., 2007).

A SmTGR é uma flavoproteína homodimérica, na qual cada monômero apresenta

componentes do domínio TrxR e do domínio Grx. O domínio TrxR é composto de

resíduos de ambos monômeros: FAD; o par Cys-154/Cys159 proveniente de um

monômero; o par Cys-596’/Sec-597’ proveniente do outro monômero. Este último par se

encontra na extremidade C-terminal de cada monômero. O domínio Grx contém o par

Cys-28/Cys-31. Através de Cys-28/Cys-31 e de Cys-596’/Sec-597’, a SmTGR catalisa a

redução de uma variedade de substratos por NADPH. A SmTGR é uma selenoproteína,

pois possui um resíduo de selenocisteína (Sec) na sua extremidade C-terminal. A Sec é

uma cisteína onde o átomo de enxofre é substituído por um átomo de selênio

(ANGELUCCI et al., 2010; HUANG et al., 2011). A Figura 10 mostra a estrutura da

SmTGR.

O mecanismo catalítico proposto para a enzima SmTGR pode ser descrito da

seguinte forma: equivalentes redutores presentes no NADPH são transferidos para o FAD,

o qual os transfere para um par de cisteínas (Cys-154/Cys159) adjacentes ao FAD. Os

equivalentes redutores continuam sendo transferidos e chegam ao par Cys-596’/Sec-597’,

Page 44: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

44

e se necessário, são transferidos para o par de cisteínas Cys-28/Cys-31. Os resíduos Cys-

596’/Sec-597’, localizados na cauda C-terminal, apresentam alta mobilidade para aceitar

os elétrons de Cys-154/Cys-159 e doar pares de elétrons para Trx ou para extreminade N-

terminal Cys-28/Cys-31 (domínio Grx) (HUANG et al., 2011). A presença de um resíduo

de selenocisteína, na extremidade C-terminal, confere uma alta reatividade a essa região.

Selenocisteínas são mais reativas que cisteínas e apresentam um menor pKa (trê ordens de

grandeza menor). Portanto, as selenocisteínas são nucleófilos mais fortes que as cisteínas,

o que demonstra o papel essencial desse tipo de resíduo na atividade catalítica de enzimas

que participam de reações de oxi-redução (JOHANSSON; GAFVELIN; ARNÉR, 2005;

NAUSER; STEINMANN; KOPPENOL, 2012).

A SmTGR é uma enzima vital para manutenção do equilíbrio redox do parasito.

Estudos de validação dessa enzima, como alvo de novos fármacos esquistossomicidas, já

foram realizados. O silenciamento da SmTGR através de RNA interferente (iRNA) foi

capaz de causar a morte do parasito. Além disso, estudos de HTS identificaram inibidores

dessa enzima capazes de diminuir a carga parasitária em camundongos (HUANG et al.,

2011; KUNTZ et al., 2007). A SmTGR é portanto, um alvo validado para o planejamento

de novos agentes esquistossomicidas.

Nos mamíferos, a tioredoxina glutationa redutase (TGR) é somente encontrada em

abundância nos testículos, após a puberdade, sendo menos expressa em outros órgãos. Sua

função pode estar relacionada à isomerização de ligações dissulfeto de proteínas que

formam componentes estruturais dos espermatozoides, ou seja, atua em uma função

diferente da observada em Schistosoma mansoni (SU et al., 2005). A TGR de mamíferos,

assim como a SmTGR, apresenta um resíduo Sec em sua extremidade C-terminal.

Entretanto, diferenças entre as duas enzimas são observadas na porção N-terminal

(domínio Grx). Enquanto a SmTGR possui dois resíduos de cistéina no domínio N-

terminal, a TGR de mamíferos possui apenas um resíduo de cisteína. As duas enzimas

apresentam identidade sequencial de 54% (PRAST-NIELSEN; HUANG; WILLIAMS,

2011).

Page 45: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

45

Figura 10 - Estrutura da SmTGR (PDB ID: 2V6O) (ANGELUCCI et al., 2008). A alça C-

terminal flexível de um monômero fornece elétrons para os domínios Trx e Grx do outro

monômero (adaptado de SACCOCCIA et al., 2012).

1.4.2. Oxadiazóis-2-óxidos

Os oxadiazóis-2-óxidos são compostos capazes de inibir a enzima SmTGR, como

foi demonstrado em ensaios de HTS (SAYED et al., 2008; SIMEONOV et al., 2008).

Além disso, a partir de ensaios com GR humana e TrxR de ratos, foi demonstrada baixa

ou nenhuma afinidade dos oxadiazóis-2-óxidos por essas enzimas, indicando seletividade

desses inibidores para a enzima SmTGR (RAI et al., 2009; SAYED et al., 2008). Dentre as

moléculas selecionadas, o furoxano (Figura 11), em baixas concentrações, foi capaz de

causar a morte de S.mansoni desde as formas mais jovens até a forma adulta. Com base

nesses resultados, estudos in vivo foram realizados em camundongos infectados por S.

mansoni. Nesses estudos, foi observada significativa redução da carga parasitária, além de

redução da hepatomegalia e esplenomegalia em todas as fases do ciclo de vida do parasito

(RAI et al., 2009). Sayed e colaboradores realizaram estudos de citotoxicidade do

furoxano frente a células de mieloma de camundongos da linhagem SP2/0. Em

concentrações de 25 M de furoxano e PZQ, a viabilidade das células foi de 54% e 62%,

respectivamente (SAYED et al., 2008).

Page 46: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

46

Figura 11 – Estrutura química do furoxano (A) e estrutura do anel 1,2,5-oxadiazol-2-

óxido (anel oxadiazólico) (B) presente em todos compostos da série de inibidores da

tioredoxina glutationa redutase de S. mansoni.

Os oxadiazóis-2-óxidos são compostos com capacidade de liberar óxido nítrico

(NO), quando incubados em solução fisiológica na presença de tióis. Como resultado, é

observada a presença de nitrosotióis na solução, resultado da S-nitrosilação que ocorre

durante a reação (FEELISCH; SCHÖNAFINGER; NOACK, 1992; GASCO et al., 2004).

A SmTGR possui em sua estrutura 13 resíduos de cisteína e um resíduo de selenocistéina.

Consequentemente, a S-nitrosilação foi observada nos ensaios de inibição de SmTGR por

oxadiazóis-2-óxidos, indicando que além de serem capazes de inibir a enzima, esses

compostos liberam NO, uma molécula com conhecida atividade antiparasitária (RAI et al.,

2009; RIVERO, 2006).

Page 47: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

47

2. JUSTIFICATIVA

A terapia da esquistossomose, utilizando apenas um fármaco, somada aos

inúmeros casos de reinfecção em áreas endêmicas, traz preocupações quanto ao

aparecimento de cepas resistentes ao PZQ. Relatos de cepas menos sensíveis ao

tratamento com PZQ em determinados países, aliados a experimentos laboratoriais que

demonstram a capacidade de desenvolvimento de resistência desse parasito, tornam a

busca de novos fármacos esquistossomicidas uma necessidade premente.

Os avanços na área de genética e bioinformática permitiram o sequenciamento e

análise do genoma de S. mansoni. O entendimento da bioquímica do parasito e de seus

mecanismos de evasão do sistema imune do hospedeiro permitiram a identificação de

alvos moleculares importantes, como a enzima multifuncional SmTGR, um alvo validado

que participa da proteção do parasito contra ROS.

A SmTGR é uma enzima vital para manutenção do equilíbrio redox do parasito.

Estudos de validação dessa enzima como alvo de novos fármacos esquistossomicidas

foram realizados através de silenciamento por RNA interferente (iRNA). Além disso,

estudos de HTS identificaram inibidores dessa enzima capazes de diminuir a carga

parasitária em camundongos (HUANG et al., 2011; KUNTZ et al., 2007). Ensaios in vitro

e in vivo foram realizados demonstrando que uma série de oxadiazóis-2-óxidos são

capazes de inibir a SmTGR, causando a morte do parasito (RAI et al., 2009; SAYED et

al., 2008). Esses compostos são potenciais doadores de NO, uma substância que apresenta

conhecida atividade antiparasitária (RIVERO, 2006).

Os dados experimentais de atividade biológica permitem a realização de estudos de

QSAR para a série de oxadiazóis-2-óxidos com a finalidade de se definir os requisitos

estruturais importantes para a atividade esquistossomicida. A partir das informações

obtidas no QSAR é possível planejar novos inibidores de SmTGR.

Page 48: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

48

3. OBJETIVOS

3.1. Objetivo geral

Face ao exposto, o objetivo geral deste trabalho foi utilizar a série de oxadiazóis-2-

óxidos inibidores de SmTGR para a construção de modelos de QSAR-2D e QSAR-3D, com

a finalidade de se obter informações sobre o requisitos estruturais relevantes para a

atividade esquistossomicida e utilizá-las no planejamento de novos inibidores de SmTGR.

3.2. Objetivos específicos

Gerar modelos de QSAR com boa consistência interna e preditividade

externa a partir do método de HQSAR (QSAR-2D) e dos métodos de

CoMFA e CoMSIA (QSAR-3D)

Interpretar os mapas de contribuição e de contorno obtidos a partir dos

estudos de QSAR;

Nos estudos de QSAR-3D, utilizar dois métodos diferentes de cálculo de

cargas atômicas parciais (método empírico Gasteiger-Hückel e método

semi-empírico AM1-BCC) e duas estratégias diferentes de alinhamento

baseadas no ligante (alinhamento no ROCS e alinhamento no Surflex-Sim);

Planejar novos inibidores de SmTGR a partir de modificações moleculares

baseadas nas informações estruturais obtidas dos mapas de QSAR-2D e

QSAR-3D.

Page 49: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

49

4. MATERIAL E MÉTODOS

4.1. Material

4.1.1. Computadores e softwares

Todos os estudos foram realizados em estações computacionais do Laboratório de

Modelagem Molecular (LabMol) na Faculdade de Farmácia da Universidade Federal de

Goiás, utilizando sistema operacional Linux. Os seguintes softwares foram utilizados:

SYBYL-X v.1.2 (Tripos, Inc., St. Louis, MO, USA), PICTO, QUACPAC v.1.5.0,

OMEGA v.2.4.6, ROCS v.3.1.2, BROOD v.2.0.0, VIDA v.4.1.2 (OpenEye Scientific

Software, Santa Fe, NM, USA) e PyMol v.1.3 (Schrödinger, LLC, New York, NY,

USA).

4.1.2. Conjunto de dados

Para a construção dos modelos de QSAR-2D e QSAR-3D, utilizou-se um conjunto

de 35 oxadiazóis-2-óxidos selecionados da literatura (RAI et al., 2009; SAYED et al.,

2008). A atividade biológica de todos os compostos foi determinada através de ensaios de

inibição da enzima SmTGR e expressa por valores de IC50 (concentração do composto

para que ocorra 50 % de inibição da enzima, potência). Os ensaios foram realizados

utilizando o mesmo protocolo experimental. Todos os valores de IC50 foram convertidos

para os valores correspondentes de pIC50 (-log IC50), os quais foram usados como

variáveis dependentes nas análises de QSAR. A figura 12 indica o gráfico de dispersão dos

valores de pIC50 calculados para os 35 oxadiazóis-2-óxidos. As estruturas químicas dos

compostos e seus respectivos valores de IC50 e pIC50 estão representados na Tabela 3.

Figura 12 - Gráfico de dispersão dos valores de pIC50 experimental para os compostos do

conjunto de dados.

Page 50: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

50

Tabela 3 - Estruturas químicas, valores de IC50 e pIC50 dos inibidores de SmTGR.

Composto Estrutura R X IC50

(M)

pIC50

1

CN - 6,30 5,20

2 CH3 - 50,1 4,30

3 CH2OH - 11,2 4,95

4 CHO - 0,11 6,95

5 COOH - 0,63 6,20

6 CONH2 - 17,7 4,75

7

3-NO2 - 2,23 5,65

8 3-CF3 - 2,51 5,60

9 3-Br, 4-F - 2,81 5,55

10* 3-Br - 2,81 5,55

11 3-Cl - 3,54 5,45

12 4-Br - 3,54 5,45

13* 4-Cl - 4,07 5,39

14 4-CF3 - 7,07 5,15

15 3-OH - 7,07 5,15

16* 4-F - 7,94 5,10

17 2-OMe - 7,94 5,10

18 3,4,5-

OMe

- 8,91 5,05

19* 3-OMe - 8,91 5,05

20 4-OMe - 10,0 5,00

21 4-Me - 11,2 4,95

22 4-Ph - 15,8 4,80

23 4-OH - 18,1 4,74

24

-

-

0,040

7,39

25*

O

-

2,81

5,55

26

S

-

3,54

5,45

27

-

-

0,063

7,20

* Compostos selecionados para compor o conjunto teste

Page 51: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

51

Tabela 3 (cont.) – Estruturas químicas, valores de IC50 e pIC50 dos inibidores de SmTGR.

* Compostos selecionados para compor o conjunto teste

4.2. Métodos

4.2.1. Construção das estruturas 3D, minimização de energia e cálculo de cargas

Os compostos do conjunto de dados foram inicialmente desenhados no programa

PICTO (OpenEye Scientific Software, Santa Fe, NM, USA) e salvos no formato

SMILES (.smi). Em seguida, as estruturas foram convertidas para o formato 3D utilizando

o programa OMEGA v.2.4.6 (OpenEye Scientific Software, Inc., Santa Fe, NM, USA),

que gera um grande número de conformações iniciais para cada composto a partir de um

banco de dados de fragmentos pré-calculados, em que cada átomo é incorporado

aleatoriamente no espaço cartesiano e otimizado pelo campo de força MMFF94

(HAWKINS et al., 2010).

Composto Estrutura R X IC50

(M)

pIC50

28

- 1,3-Ph 3,54 5,45

29 - 1,4-Ph 1,00 6,00

30 - 5-F-

1,3-Ph

0,47 6,32

31 - 2,5-

tiofeno

0,40 6,39

32* - 2,4-

tiofeno

0,35 6,45

33

-

-

0,038

7,42

34

-

-

1,28

5,89

35*

-

-

0,10

6,98

Page 52: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

52

Foram empregados dois métodos diferentes para o cálculo das cargas atômicas

parciais: o método empírico Gasteiger-Hückel, disponível no programa SYBYL-X v.1.2

(Tripos, Inc., St. Louis, MO, USA) e o método semi-empírico AM1-BCC (JAKALIAN;

JACK; BAYLY, 2002; JAKALIAN et al., 1999), disponível no programa QUACPAC

v.1.5.0 (OpenEye Scientific Software, Inc., Santa Fe, NM, USA).

4.2.2. Divisão do conjunto de dados

Os 35 compostos do conjunto de dados foram divididos em conjunto treinamento e

conjunto teste, mantendo em ambos a diversidade estrutural e valores representativos de

toda a faixa de distribuição da potência (Figura 12). Durante a divisão, foram selecionados

28 compostos (80% do conjunto total) para compor o conjunto treinamento e 7 compostos

(20% do conjunto total) para compor o conjunto teste. Entretanto, durante a construção

dos modelos de QSAR-2D e QSAR-3D foram retiradas amostras atípicas (outliers),

alterando a proporção inicial entre os conjuntos teste e treinamento. Os compostos

selecionados para conjunto treinamento e conjunto teste estão indicados na Tabela 3.

4.2.3. QSAR-2D

4.2.3.1. HQSAR

O módulo de HQSAR da plataforma SYBYL-X v.1.2 (Tripos, Inc., St. Louis, MO,

USA) foi empregado na geração dos modelos de HQSAR para o conjunto de inibidores da

enzima SmTGR. Inicialmente, foram gerados modelos HQSAR utilizando todas as

moléculas do conjunto de dados, sem divisão entre treinamento e teste. Foram gerados

diversos modelos com diferentes parâmetros de distinção de fragmentos. Foi utilizado o

tamanho de fragmento padrão (4-7 átomos). Em seguida, a atividade biológica de todos os

compostos do conjunto de dados foi predita, obtendo-se o valor residual (diferença entre

atividade biológica experimental e predita). Assumindo um intervalo de confiança (IC) de

95%, todos os compostos que apresentaram valor residual duas vezes maior que o desvio-

padrão médio dos resíduos foram considerados outliers. Portanto, os modelos finais de

HQSAR foram gerados após a retirada dos outliers.

Page 53: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

53

Após a seleção do conjunto treinamento, foram gerados modelos de HQSAR

variando diversos parâmetros que influenciam na geração de hologramas moleculares.

Foram variados os parâmetros de distinção de fragmentos, comprimento de holograma e

tamanho de fragmento. Foram gerados hologramas com diferentes combinações dos

seguintes parâmetros de distinção de fragmentos: átomos (A), ligação (B), conectividade

(C), átomos de hidrogênio (H), doadores e aceptores de ligação de hidrogênio (DA). Foi

utilizada uma série padrão de comprimentos de holograma (53, 59, 61, 71, 83, 97, 151,

199, 257, 307, 353, 401). Além disso, para se observar a influência do comprimento de

holograma nos modelos de HQSAR, foram gerados modelos com comprimentos maiores

(457 a 997). Diversos tamanhos mínimos e máximos de fragmentos (4-7, 5-8, 6-9, 7-10)

foram testados para se avaliar a influência do tamanho de fragmento nos modelos de

HQSAR.

As informações codificadas nos hologramas moleculares (variáveis independentes)

foram correlacionadas com os valores de atividade biológica (variável dependente) através

do método de regressão por PLS.

4.2.4. QSAR-3D

4.2.4.1 Alinhamento molecular

O alinhamento molecular é uma etapa crucial antes de se iniciar uma análise de

CoMFA. Nessa etapa, as moléculas são dispostas em uma mesma orientação no espaço

tridimensional de forma que representem a sua conformação bioativa.

Foram utilizadas duas estratégias de alinhamento baseadas no ligante: o

alinhamento obtido pelo programa ROCS (do inglês, Rapid Overlay of Chemical

Structures) (OpenEye Scientific Software, Inc., Santa Fe, NM, USA), que se baseia na

comparação entre os volumes e características moleculares (Shape-based), e o

alinhamento gerado pelo programa Surflex-Sim, disponível na plataforma SYBYL-X

v.1.2 (Tripos, Inc., St. Louis, MO, USA), que se baseia na similaridade morfológica.

No alinhamento pelo ROCS, os confôrmeros gerados previamente (seção 3.2.1)

foram sobrepostos a estrutura do composto mais potente do conjunto de dados (composto

33). Após cada sobreposição, os confôrmeros foram classificados a partir da função de

pontuação TanimotoCombo. Essa função de pontuação é uma combinação das funções

Page 54: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

54

ShapeTanimoto (compara as moléculas baseando-se na melhor sobreposição dos volumes

moleculares) e ColorTanimoto (pontuação relacionada à sobreposição apropriada de

grupos com propriedades como doador de ligação de hidrogênio, aceptor de ligação de

hidrogênio, hidrofóbico, cátion, ânion e anel) (HAWKINS; SKILLMAN; NICHOLLS,

2007).

No alinhamento pelo Surflex-Sim, não foram gerados confôrmeros previamente.

Esse programa utiliza uma função de similaridade morfológica e técnicas rápidas para

geração de poses. A similaridade morfológica é definida como uma função gaussiana das

distâncias de duas moléculas em relação a pontos de observação uniformes de uma grade

(JAIN, 2004). Os compostos 24 e 33, que apresentavam maior potência, foram escolhidos

para definição do molde, sobre o qual os demais compostos do conjunto de dados seriam

sobrepostos. Em seguida, foi realizado o alinhamento flexível dos demais compostos do

conjunto de dados. O número máximo de poses geradas para cada molécula foi igual a 20.

Para cada composto, foi escolhida a pose com maior valor de similaridade com o molde.

4.2.4.2. CoMFA

Os modelos de CoMFA foram gerados na plataforma SYBYL-X v.1.2 (Tripos,

Inc., St. Louis, MO, USA). As moléculas alinhadas de acordo com cada estratégia foram

inseridas em uma caixa 3D reticulada, em que os campos estéricos (potencial de Lennard-

Jones) e eletrostáticos (potencial de Coulomb) foram calculados entre as moléculas e um

átomo de prova carregado positivamente, utilizando o campo de força Tripos (CLARK;

CRAMER III; VAN OPDENBOSCH, 1989). Foi utilizado nos cálculos um átomo de

prova que consistia em um átomo de carbono de hibridização sp3 (Csp

3) e carga +1,0. Foi

utilizado o valor de corte (cut-off) de energia igual a 30 kcal/mol.

Inicialmente, foi gerado um modelo utilizando todos os compostos do conjunto de

dados, sem divisão entre treinamento e teste. Em seguida, a atividade biológica de todos

os compostos do conjunto de dados foi predita, obtendo-se o valor residual. Assumindo

um intervalo de confiança (IC) de 95%, todos os compostos que apresentaram valor

residual duas vezes maior que o desvio-padrão médio dos resíduos foram considerados

outliers, os quais não foram inclusos nos modelos finais.

Os modelos finais foram gerados utilizando quatro diferentes espaçamentos entre

os vértices da caixa 3D reticulada (0,5; 1,0; 1,5; 2,0 Å). Foi utilizado o recurso de

focagem da região, através do método do coeficiente do desvio padrão (SDC, do inglês

Standard Deviation Coefficient), para que somente regiões com variações de energia

Page 55: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

55

relevantes fossem consideradas na correlação com a atividade biológica. Foram

exploradas variações do SDC de 0,3 até 1,5. As energias de interação entre o átomo de

prova e as moléculas alinhadas em cada ponto da caixa 3D reticulada (variáveis

independentes) foram correlacionadas com a atividade biológica (variável dependente)

através do método de regressão por PLS. O número ótimo de variáveis latentes foi obtido

pela técnica de validação cruzada LOO (do inglês Leave-One-Out). A filtragem de coluna

adotada para a análise de PLS foi de 2,0 kcal/mol.

4.2.4.3. CoMSIA

Os modelos de CoMSIA foram gerados na plataforma SYBYL-X v.1.2 (Tripos,

Inc., St. Louis, MO, USA). Os modelos foram calculados com a mesma divisão entre

conjunto treinamento e teste usada no HQSAR e na análise de CoMFA. Os mesmos

outliers identificados na análise de CoMFA foram mantidos para a análise de CoMSIA.

As moléculas alinhadas de acordo com cada estratégia foram inseridas em uma

caixa 3D reticulada, na qual foram calculados os índices de similaridade molecular, em

cada intersecção, entre as moléculas e o átomo de prova. Além dos campos estéricos e

eletrostáticos, foram considerados os campos hidrofóbicos e doadores/aceptores de

ligação de hidrogênio. A análise foi feita utilizando-se um átomo de prova de raio igual a

1,0 Å e carga +1,0. Uma função do tipo gaussiana foi usada para descrever os termos

energéticos em função da distância entre o átomo de prova e as moléculas alinhadas. Foi

atribuído o valor de 0,3 ao fator de atenuação (), o qual descreve a inclinação da função

gaussiana.

4.2.5. Validação dos modelos de QSAR

4.2.5.1. Validação interna

A validação interna dos modelos foi realizada utilizando todos os compostos do

conjunto treinamento, através do método de validação cruzada LOO. Nesse método um

composto do conjunto treinamento é retirado e os demais são utilizados na construção de

um modelo, o qual é usado para predizer a atividade biológica do composto retirado. Esse

procedimento é repetido várias vezes até que todos os compostos do conjunto tenham sido

retirados e preditos pelo menos uma vez (PICARD; COOK, 1984; TRIPOS, 2010b). Os

resultados da validação cruzada foram expressos pelo coeficiente de correlação da

validação cruzada (q2).

Page 56: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

56

Após a escolha dos melhores modelos de QSAR-2D e QSAR-3D, a estabilidade dos

mesmos foi avaliada através do método de validação cruzada LMO (do inglês, Leave-

Many-Out). Nesse método os compostos do conjunto treinamento são divididos em

subgrupos. Uma parte dos subgrupos é utilizada para construção de um modelo e um

subgrupo restante tem suas atividades biológicas preditas por esse modelo. Esse

procedimento é repetido várias vezes (número de rodadas), de acordo com a escolha do

usuário (BAUMANN, 2003; TRIPOS, 2010b). Nesse trabalho, a validação cruzada LMO

foi realizada utilizando 5 subgrupos, ou seja, a cada rodada o conjunto treinamento era

dividido em 5 grupos dos quais 4 (80%) eram utilizados para construção do modelo e o

grupo restante (20%) tinha a atividade biológica predita pelo modelo. O procedimento foi

realizado em 25 rodadas e o resultado final foi expresso pela média dos valores de q2

obtidos em cada rodada.

4.2.5.2. Validação externa

Na validação externa, os sete compostos do conjunto teste tiveram suas atividades

biológicas preditas pelos modelos gerados a partir do conjunto treinamento. Assumindo

um intervalo de confiança de 99%, todas as moléculas do conjunto teste que apresentaram

valor residual maior que o desvio padrão médio dos resíduos foram consideradas mal

preditas pelo modelo. Foi avaliada a capacidade de predição dos modelos através do

cálculo do coeficiente de correlação da predição (r2pred) e das seguintes variantes do

coeficiente de correlação modificado (rm2): rm

2 médio e rm

2 delta.

O r2

pred foi calculado a partir da seguinte equação:

[∑ ( ̂ )

] ⁄

[∑ (

– ̅ ) ] ⁄ (1)

em que representa a atividade biológica predita; corresponde a atividade biológica

experimental; é a média da atividade biológica do conjunto treinamento; nEXT é o

número de compostos no conjunto teste; nTR é o número de compostos no conjunto

treinamento. Essa equação é menos dependente do tamanho e da distribuição do conjunto

teste quando comparada às outras equações que calculam o r2

pred (CONSONNI;

BALLABIO; TODESCHINI, 2010).

O rm2 foi calculado conforme a seguinte equação:

Page 57: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

57

( |√ |) (2)

em que r² representa o coeficiente de correlação da reta entre os valores observados e

preditos de atividade biológica; r02 corresponde ao coeficiente de correlação da reta que

intercepta a origem (ponto zero); Diferentemente das fórmulas clássicas de se calcular o

r2

pred, o rm2

independe da média dos valores de atividade do conjunto teste e do conjunto

treinamento, ou seja, não sofre influência da distribuição dos valores de atividade

biológica e não é sensível à forma como o conjunto de dados foi dividido (ROY; ROY,

2008).

Nesse trabalho, duas variantes do rm2

foram calculadas: o rm2

médio (Equação 3) e

o rm2 delta (Equação 4). Essas duas variantes da equação original do rm

2 são obtidas após a

definição do rm2 inverso (r’m

2), calculado partir da inversão dos eixos contendo as

atividades biológicas experimentais e preditas (Figura 13) (ROY et al., 2013).

(

) ⁄ (3)

|

| (4)

Figura 13 – Curvas de regressão com interceptação em zero (linha pontilhada) e sem

interceptação em zero (linha contínua). O rm2 é obtido sem a inversão dos eixos (A); O

r’m2 é obtido após a inversão dos eixos (B) (Adaptado de ROY et al., 2013).

Page 58: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

58

4.2.6. Planejamento de novos inibidores de SmTGR a partir dos estudos de QSAR

Com o objetivo de desenvolver novos inibidores de SmTGR, foram propostas

modificações moleculares com base nas informações obtidas dos melhores modelos de

QSAR-2D e QSAR-3D. O planejamento foi realizado através da substituição bioisostérica

de fragmentos utilizando o programa BROOD v.2.0.0 (OpenEye Scientific Software,

Santa Fe, NM, USA). A estrutura utilizada como referência para a substituição foi o

composto mais potente do conjunto de dados (composto 33).

No programa BROOD v.2.0.0, após a definição da estrutura de referência, foi

selecionada a região molecular a ser substituída por fragmentos através da busca por

bioisósteros. A busca foi realizada a partir do banco de dados do próprio programa, que

possui uma quimioteca de fragmentos derivados de compostos comercialmente

disponíveis. Para a substituição dos fragmentos foram utilizados os parâmetros pré-

definidos pelo programa, obtendo-se para a molécula de referência 1000 compostos

diferentes agrupados em clusters de acordo com a similaridade estrutural e propriedades

físico-químicas (OPENEYE, 2010). No programa VIDA v.4.1.2 (OpenEye Scientific

Software, Santa Fe, NM, USA) foi selecionada a molécula representativa de cada

cluster, denominada cluster-head. As cluster-heads selecionadas foram submetidas à

geração de confôrmeros no programa OMEGA v.2.4.6 e as cargas atômicas parciais foram

calculadas de acordo como o modelo de QSAR que seria utilizado na predição da atividade

biológica. Para a predição através dos modelos de QSAR-3D, os compostos obtidos foram

alinhados de acordo com o item 3.2.4.1. Os melhores modelos de QSAR-2D e QSAR-3D

foram utilizados na predição da atividade biológica dos compostos planejados.

Page 59: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

59

5. RESULTADOS E DISCUSSÃO

5.1. Caracterização do conjunto de dados

Os modelos de QSAR-2D e QSAR-3D foram desenvolvidos para um conjunto de

35 oxadiazóis-2-óxidos inibidores da enzima SmTGR (RAI et al., 2009; SAYED et al.,

2008). Os dados de potência dos compostos estavam disponíveis em valores de IC50 (M),

os quais foram convertidos para pIC50 (-log IC50). Todos os compostos tiveram seus dados

de atividade biológica obtidos a partir de um mesmo protocolo experimental, um requisito

recomendado para a construção de modelos de QSAR confiáveis (OECD, 2007). Os

valores de pIC50 compreendiam uma faixa de aproximadamente 3,12 unidades

logarítmicas.

Todos os compostos do conjunto de dados apresentaram em sua estrutura o anel

1,2,5-oxadiazol-2-óxido (anel oxadiazólico) (Figura 14), destacando a importância desse

anel na atividade inibitória sobre a enzima SmTGR (RAI et al., 2009; SAYED et al.,

2008).

Figura 14 - Estrutura química do anel 1,2,5-oxadiazol-2-óxido.

A geração de modelos de QSAR robustos e preditivos depende da utilização de um

conjunto de dados com compostos de adequada distribuição da diversidade estrutural e de

dados de atividade biológica entre o conjunto treinamento e o conjunto teste. O conjunto

treinamento compreende as moléculas que são utilizadas para a construção do modelo de

QSAR, ou seja, a partir dessas moléculas são calculados os descritores moleculares os

quais, através de métodos estatísticos, são correlacionados com a atividade biológica,

obtendo-se um modelo matemático capaz de predizer a atividade de compostos externos

que pertençam ao mesmo espaço químico e biológico. Portanto, para que um modelo de

QSAR seja preditivo, ele deve passar por uma validação externa, que consiste na predição

da atividade de compostos de um conjunto teste, os quais não foram utilizados na geração

do modelo.

Page 60: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

60

A série de 35 oxadiazóis-2-óxidos foi dividida em conjunto treinamento (80% dos

compostos) e conjunto teste (20% dos compostos) (Tabela 3). A divisão foi realizada

mantendo-se a diversidade química e de atividade biológica homogênea entre os dois

conjuntos (Figura 15).

Figura 15 - (A) Distribuição dos valores de potência no conjunto de dados total e nos

conjuntos treinamento e teste; (B) Proporção entre compostos do conjunto treinamento e

teste dentro de cada uma das três unidades logarítmicas de potência.

O conjunto teste utilizado para a validação externa dos modelos de QSAR-2D e

QSAR-3D foi o mesmo, constituído por 7 compostos. Entretanto, o conjunto treinamento,

constituído inicialmente de 28 compostos teve essa quantidade reduzida para 26

compostos tanto nos estudos de QSAR-2D, quanto no QSAR-3D. Portanto, foram retirados

dois outliers antes da geração dos modelos finais de QSAR.

5.2. QSAR-2D

5.2.1. HQSAR

5.2.1.1. Identificação de outliers

Foram gerados modelos utilizando todos os compostos do conjunto de dados, sem

divisão. Foram testadas várias distinções de fragmento, utilizando o tamanho de

fragmento padrão (4-7 átomos) (Tabela 4).

Page 61: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

61

Tabela 4 - Análises de HQSAR utilizando o conjunto de dados total, várias distinções de

fragmento e tamanho padrão de fragmento (4-7 átomos).

q2

LOO: coeficiente de correlação de validação cruzada; r2: coeficiente de correlação de determinação

múltipla; SEE: erro padrão estimado; N: número ótimo de componentes PLS ou variáveis latentes; HL:

comprimento de holograma; Distinção de fragmento: A, átomo; B, ligação; C, conectividade; H, hidrogênio;

DA, doador e aceptor; *modelos que apresentaram q2LOO maior que 0,5.

Os modelos que apresentaram valor de q2

LOO maior que 0,5 foram usados para predizer

a atividade de todos os 35 compostos. Aqueles compostos que apresentaram valor residual

duas vezes maior que o desvio padrão médio dos resíduos foram considerados outliers (IC =

95%) e não participaram da construção dos modelos finais. Os compostos 4 e 6 foram

considerados outliers uma vez que seus valores residuais superaram mais que duas vezes o

desvio padrão nos modelos A/B/C/H/DA, C/H e H/DA. A tabela 5 demonstra os valores

residuais de todos os compostos do conjunto de dados no modelo gerado com distinção de

fragmento A/B/C/H/DA e tamanho de fragmento padrão (4-7).

Distinção de

fragmento

q2

LOO r2 SEE HL N

A 0,400 0,638 0,499 199 2

A/B 0,482 0,771 0,404 97 3

A/B/C 0,413 0,795 0,382 307 3

A/B/C/H 0,369 0,854 0,333 83 5

A/B/C/H/DA* 0,509 0,827 0,357 97 4

A/C 0,422 0,740 0,423 307 2

A/C/H 0,449 0,769 0,412 83 4

A/C/DA 0,413 0,869 0,321 59 6

A/C/H/DA 0,474 0,798 0,385 97 4

A/H 0,464 0,773 0,408 199 4

A/H/DA 0,444 0,756 0,423 61 4

B/C 0,392 0,702 0,453 257 2

B/C/H/DA 0,489 0,856 0,325 97 4

C/H* 0,566 0,901 0,280 53 6

C/H/DA 0,452 0,788 0,395 71 4

H/DA* 0,504 0,739 0,438 53 4

A/DA 0,420 0,776 0,405 151 4

A/B/H 0,427 0,776 0,406 97 4

B/C/DA 0,489 0,856 0,325 97 4

A/B/C/DA 0,492 0,916 0,253 353 5

Page 62: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

62

Tabela 5 - Atividade experimental, predita e resíduos obtidos com modelo de distinção de

fragmento A/B/C/H/DA e tamanho de fragmento padrão (4-7), utilizando todos os

compostos.

a pIC50 experimental - pIC50 predito; * Compostos identificados como outliers; Desvio padrão = 0,33.

Composto

pIC50

Experimental Predito Resíduoa

6* 4,75 5,44 -0,69

4* 6,95 5,85 1,11

1 5,20 5,10 0,10

2 4,30 4,58 -0,27

3 4,95 4,63 0,32

5 6,20 5,94 0,26

7 5,65 5,42 0,24

8 5,60 5,40 0,20

9 5,55 5,50 0,05

10 5,55 5,50 0,05

11 5,45 5,39 0,06

12 5,45 5,41 0,05

13 5,39 5,36 0,04

14 5,15 5,33 -0,18

15 5,15 5,27 -0,12

16 5,10 5,22 -0,12

17 5,10 5,08 0,03

18 5,05 4,66 0,39

19 5,05 5,19 -0,14

20 5,00 5,19 -0,19

21 4,95 5,25 -0,30

22 4,80 4,90 -0,10

23 4,74 5,17 -0,42

24 7,39 7,76 -0,36

25 5,55 5,70 -0,14

26 5,45 5,86 -0,40

27 7,20 6,56 0,64

28 5,45 5,95 -0,49

29 6,00 5,83 0,17

30 6,31 6,16 0,16

31 6,39 6,37 0,03

32 6,45 6,74 -0,29

33 7,42 7,51 -0,09

34 5,89 5,73 0,16

35 6,98 6,75 0,23

Page 63: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

63

Além dos altos valores residuais, os outliers 4 e 6 apresentam estruturas químicas

com grupos funcionais únicos, não observados no restante das moléculas do conjunto de

dados. O composto 4 apresenta um grupo aldeído ligado ao anel oxadiazólico, enquanto o

composto 6 apresenta um grupo amida ligado ao anel oxadiazólico. Após a retirada dos

outliers, o conjunto treinamento passou a ter 26 compostos, sendo mantida a quantidade

de compostos no conjunto teste. Portanto, uma nova proporção entre os conjuntos foi

obtida: 78,7% dos compostos no conjunto treinamento e 21,3% no conjunto teste.

5.2.1.2. Construção dos modelos de HQSAR

Os parâmetros como o comprimento do holograma molecular, a distinção e

tamanho de fragmentos influenciam a qualidade do resultado de uma análise de HQSAR.

Portanto, várias combinações de distinções de fragmentos e comprimento de holograma

foram investigados.

Foram utilizadas as seguintes distinções de fragmento na geração dos modelos de

HQSAR: átomos (A), ligações (B), conectividade (C), átomos de hidrogênio (H) e

doadores e aceptores de ligação de hidrogênio (DA). Foi empregado o tamanho padrão de

fragmento (4-7). Os comprimentos de holograma variaram de 53 a 401, que são os

padrões pré-definidos no programa SYBYL-X v.1.2 (Tabela 6). Entretanto, comprimentos

maiores de holograma foram testados para se analisar a influência do aumento do

comprimento de holograma na qualidade dos modelos de HQSAR. A investigação de

comprimentos maiores de holograma tem por objetivo evitar a influência de um possível

fenômeno de colisão de fragmentos na geração dos modelos. A colisão de fragmentos é

definida como a alocação de fragmentos moleculares diferentes dentro de um mesmo bin,

definindo-os erroneamente como fragmentos iguais. Geralmente ocorre quando o número

de fragmentos moleculares gerados é superior ao número de hologramas moleculares

disponíveis. Tal evento pode levar à perda de informações importantes que não são

capturadas durante a regressão por PLS (SEEL; TURNER; WILLETT, 1999; TRIPOS,

2010a).

Page 64: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

64

Tabela 6 - Análises de HQSAR utilizando o conjunto treinamento, após a retirada de dois

outliers, utilizando várias distinções de fragmento e tamanho padrão de fragmento (4-7

átomos).

q2LOO: coeficiente de correlação de validação cruzada; r

2: coeficiente de correlação de

determinação múltipla; SEE: erro padrão estimado; N: número ótimo de componentes PLS ou

variáveis latentes; HL: comprimento de holograma; Distinção de fragmento: A, átomo; B,

ligação; C, conectividade; H, hidrogênio; DA, doador e aceptor; *único modelo com q2

LOO

menor que 0,6.

Após a retirada dos outliers, nove modelos apresentaram valor de q2

LOO maior que 0,6.

Todos esses modelos foram, posteriormente, testados com seis tamanhos de fragmento

diferentes (2-5, 3-6, 4-7, 5-8, 6-9, 7-10 átomos). No total, após a variação dos tamanhos de

fragmento, foram gerados 54 diferentes modelos de HQSAR. Destes, 34 modelos

apresentaram boa robustez, ou seja, q2

LOO maior que 0,6. Dentre eles, três apresentaram boa

preditividade externa, com valores de r2

pred maiores que 0,6, rm2

médio maior que 0,5 e rm2

delta menor que 0,2 (ROY et al., 2013) (Tabela 7). A construção de modelos utilizando

comprimentos maiores de holograma não alterou significativamente os resultados estatísticos.

Portanto, os modelos com comprimentos maiores de holograma não foram utilizados nas

análises futuras.

Distinção de

fragmento

q2

LOO r2 SEE HL N

A 0,494 0,862 0,327 401 4

A/B 0,525 0,851 0,333 97 3

A/B/C 0,568 0,962 0,180 71 6

A/B/C/H 0,547 0,937 0,227 83 5

A/B/C/H/DA 0,583 0,911 0,269 59 5

A/C 0,444 0,907 0,275 61 5

A/C/H 0,534 0,913 0,266 307 5

A/C/H/DA 0,665 0,941 0,225 97 6

A/C/DA 0,612 0,978 0,137 199 6

A/H 0,637 0,918 0,259 307 5

A/H/DA 0,650 0,937 0,233 83 6

B/C 0,576 0,884 0,293 257 3

C/H 0,617 0,892 0,289 353 4

C/H/DA 0,671 0,963 0,179 199 6

H/DA 0,719 0,935 0,236 53 6

A/DA 0,612 0,930 0,238 59 5

A/B/H 0,572 0,820 0,374 71 4

B/C/DA 0,639 0,966 0,168 97 5

A/B/C/DA 0,596 0,974 0,145 353 5

Page 65: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

65

Tabela 7 - Modelos de HQSAR com maior preditividade externa após variação do

tamanho de fragmento.

q2LOO: coeficiente de correlação de validação cruzada; r

2: coeficiente de correlação de determinação múltipla; SEE: erro

padrão estimado; N: número ótimo de componentes PLS ou variáveis latentes; HL: comprimento de holograma; Distinção

de fragmento: A, átomo; B, ligação; C, conectividade; DA, doador e aceptor.

O modelo 3, com tamanho de fragmento de 4 a 7 átomos, apresentou maior

robustez, com valor de q2

LOO igual a 0,639. O modelo que apresentou maior preditividade

externa foi o modelo 2, com valor de r2

pred igual a 0,939, rm2médio igual a 0,878 e rm

2 delta

igual a 0,017. Isso significa que o modelo 2 foi capaz de predizer de forma satisfatória os

valores de atividade biológica dos compostos do conjunto teste, utilizados na validação

externa dos modelos. Dos sete compostos do conjunto teste, apenas dois apresentaram valor

residual maior que o desvio padrão dos resíduos, para um intervalo de confiança de 99%,

indicando capacidade preditiva do modelo igual a 71,42% para o conjunto teste considerado

(Tabela 8).

O valor de q2

LOO, considerado isoladamente, não é um parâmetro suficiente para se

avaliar a preditividade externa de um modelo. Valores de q2

LOO abaixo de 0,5 podem indicar

modelos com baixa preditividade externa, porém o inverso nem sempre acontece, ou seja,

modelos com altos valores de q2

LOO não apresentam, necessariamente, maior preditividade

externa (GOLBRAIKH; TROPSHA, 2002). O modelo 1 apresentou valor de q2

LOO igual a

0,636 , rm2médio igual a 0,700 e rm

2 delta igual a 0,133. De acordo com esses dados, pode ser

observar que a preditividade externa desse modelo é semelhante à do modelo 2. Entretanto, o

modelo 2 apresentou capacidade preditiva de 71,42% (Tabela 8). No modelo 1, três dos sete

compostos do conjunto teste apresentaram valor residual maior que o desvio padrão dos

resíduos (intervalo de confiança igual a 99%), indicando capacidade preditiva de 57,14%, a

qual foi inferior em relação aos modelos 2 e 3. O modelo 3 apresentou capacidade preditiva

Modelo

Distinção de

fragmento

Tamanho

de

fragmento

q2

LOO

r2

SEE

HL

N

r²pred

rm2

médio

rm2

delta

1 A/B/C/DA 2-5 0,636 0,963 0,179 97 6 0,915 0,700 0,133

2 A/DA 2-5 0,613 0,847 0,345 61 4 0,939 0,878 0,017

3 B/C/DA 4-7 0,639 0,966 0,168 97 5 0,899 0,763 0,135

Page 66: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

66

igual à observada no modelo 2, 71,42 %. O gráficos de atividade biológica experimental

versus predita indicam que os modelos 2 e 3 apresentam boa preditividade externa (Figura

16).

Tabela 8 - Atividade biológica experimental, predita e valores residuais relacionados aos

dois melhores modelos de HQSAR.

Composto

Modelo 2 (A/DA)

Modelo 3 (B/C/DA)

pIC50

Experimental

pIC50

Predito

Resíduoa

)

pIC50

Experimental

pIC50

Predito

Resíduoa

)

25 5,55 5,73 -0,18 5,55 5,91 -0,35*

32 6,45 6,46 0,00 6,45 6,67 -0,22

10 5,55 5,16 0,40* 5,55 5,37 0,19

19 5,05 5,12 -0,07 5,05 5,12 -0,07

13 5,39 5,30 0,10 5,39 5,28 0,12

35 6,98 7,00 -0,02 6,98 6,55 0,43*

16 5,10 5,35 -0,25* 5,10 5,28 -0,17 aDiferença entre pIC50 experimental e predito; desvio padrão dos resíduos; *valores residuais que

ultrapassaram o desvio padrão (IC = 99%).

Figura 16 - Gráficos de atividade biológica experimental versus predita para os modelos 2

e 3 (os círculos representam os compostos do conjunto treinamento e os losangos os

compostos do conjunto teste).

Page 67: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

67

Os modelos 2 e 3 foram submetidos à validação cruzada utilizando o método de

LMO. Nessa análise, foram realizadas 25 corridas e os valores de q2 obtidos em cada

corrida foram usados para se calcular uma média, correspondente ao valor de q2

LMO. Os

modelos 2 e 3 apresentaram valores de q2

LMO iguais a 0,568 e 0,632, respectivamente,

indicando a boa estabilidade desses modelos.

Além de serem utilizadas para a predição da atividade biológica de compostos que

não participaram da construção dos modelos, as análises de HQSAR fornecem

informações a respeito da relação entre os fragmentos estruturais e a atividade biológica.

Essas informações são obtidas através dos mapas de contribuição, os quais indicam a

contribuição individual de cada átomo ou fragmento estrutural para a atividade biológica.

Os mapas de contribuição apresentam escalas de cores para indicar a magnitude da

contribuição de cada átomo. As cores próximas ao vermelho no espectro (vermelho,

laranja avermelhado e laranja) indicam contribuições desfavoráveis ou negativas,

enquanto cores na região do verde (amarelo, azul esverdeado e verde) indicam

contribuições favoráveis ou positivas. Os átomos com contribuições intermediárias são

apresentados em branco.

Os mapas de contribuição gerados a partir do modelo 2, para os compostos mais e

menos potentes do conjunto de dados, estão representados na figura 17. O mapa de

contribuição gerado para o composto mais potente (composto 33) indica que o átomo O11

da carbonila têm contribuição positiva para a atividade biológica. O anel furano ligado a

essa carbonila, como sugere o mapa, é importante para a atividade biológica, visto que o

átomos O17 do anel têm contribuição positiva para a atividade. Os carbonos C10, C13 e

C14 do outro anel furano também têm contribuição positiva para a atividade biológica. O

anel 1,2,5-oxadiazólico juntamente com os átomos C7 e C8 constituem a máxima

subestrutura comum (MCS), presente em todos os compostos do conjunto de dados. O

mapa de contribuição gerado para o composto menos potente (composto 2), apesar de

indicar fragmentos em verde e amarelo no anel aromático ligado ao anel oxadiazólico,

permite concluir que a ausência do anel furano e das carbonilas diminui a potência dos

compostos em três unidades logarítmicas, ou seja, de um pIC50 igual a 7,42 no composto

33 para um pIC50 igual a 4,30 no composto 2.

Page 68: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

68

Figura 17 - Mapas de contribuição gerados a partir do modelo 2. (A) Mapa de

contribuição para o composto mais potente do conjunto de dados; (B) Mapa de

contribuição para o composto menos potente do conjunto de dados. Os fragmentos em

azul representam a máxima subestrutura comum (MCS).

Como mencionado anteriormente, a SmTGR é uma selenoproteína, ou seja,

apresenta em sua estrutura a selenocisteína (Sec), que é um aminoácido mais reativo que a

cisteína (Cys), na qual o átomo de enxofre é substituído por um átomo de selênio

(KUNTZ et al., 2007). A diferença na reatividade ocorre porque os selenóis são mais

ácidos que os tióis, como se pode observar na diferença de pKa entre a Cys e a Sec, com

valores de 8,5 e 5,2, respectivamente. Portanto, a Sec apresenta maior nucleofilicidade que

a Cys (JOHANSSON; GAFVELIN; ARNÉR, 2005; NAUSER; STEINMANN;

KOPPENOL, 2012). Os oxadiaxóis-2-óxidos são capazes de liberar óxido nítrico (NO) na

presença de tióis em solução fisiológica (Figura 18) (FEELISCH; SCHÖNAFINGER;

NOACK, 1992). O NO é um composto conhecido por apresentar atividade antiparasitária,

participando da resposta imune do hospedeiro contra parasitos (RIVERO, 2006). Tanto a

Cys quanto a Sec, presentes na SmTGR, reagem com os oxadiazóis-2-óxidos por meio de

ataque nucleofílico ao anel oaxadiazólico, resultando na liberação de NO. Além da

liberação de NO, a ligação dos oxadiazóis-2-óxidos pode ocorrer nos resíduos

Page 69: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

69

Cys596’/Sec597’, localizados na extremidade C-terminal da enzima, o quais possuem

papel crucial no ciclo catalítico da SmTGR. Portanto, a atividade esquistossomicida desses

compostos pode estar relacionada à liberação de NO em associação à inibição do ciclo

catalítico da enzima (RAI et al., 2009).

Figura 18 - Esquema demonstrando a liberação de NO a partir de uma molécula de

oxadiazol-2-óxido em solução fisiológica contendo tióis. O ataque nucleofílico do grupo

tiolato pode ocorrer nos carbonos C4 e C3 do anel oxadiazólico (Adaptado de GASCO et

al., 2004).

De acordo com o mecanismo de liberação de NO proposto para os oxadiazóis-2-

óxidos, o ataque nucleofílico do grupo tiolato pode ocorrer nos carbonos C4 e C3 do anel

oxadiazólico (Figura 18). Portanto, a presença do anel oxadiazólico, que constitui a MCS

dos compostos do conjunto de dados, é essencial para a liberação de NO. O mapa de

contribuição obtido para o composto mais potente do conjunto de dados (composto 33)

sugere que a presença da carbonila, como espaçador, ligada ao anel furano, é responsável

pela maior potência do composto (Figura 17). Esses resultados sugerem que a presença de

um grupo retirador de elétrons, como a carbonila, ligado ao anel oxadiazólico, favorece o

mecanismo de liberação de NO a partir do ataque nucleofílico de tióis nas posições 3 e 4

(Figura 18). A presença do grupo metila e do anel aromático, no composto menos potente,

sugere que a ausência de um retirador de elétrons nessas posições dificulta a abertura do

anel oxadiazólico e consequentemente a liberação de NO.

Page 70: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

70

5.3. QSAR-3D

5.3.1. Cálculo de cargas atômicas parciais

O cálculo de descritores eletrostáticos nas análises de CoMFA depende da

atribuição de cargas atômicas parciais às moléculas do conjunto de dados. Portanto, as

energias de interação eletrostáticas entre o átomo de prova e as moléculas podem variar de

acordo com o método de cálculo de cargas parciais adotado. Consequentemente, os mapas

de contorno obtidos após as análises podem exibir resultados diferentes (KROEMER et

al., 1998; TSAI et al., 2010).

Foram empregados dois métodos diferentes para o cálculo das cargas atômicas

parciais: o método empírico Gasteiger-Hückel, disponível na plataforma SYBYL-X v.1.2

(Tripos, Inc., St. Louis, MO, USA) e o método semi-empírico AM1-BCC (JAKALIAN;

JACK; BAYLY, 2002; JAKALIAN et al., 1999), disponível no programa QUACPAC

v.1.5.0 (OpenEye Scientific Software, Inc., Santa Fe, NM, USA).

O método Gasteiger-Hückel é uma combinação dos métodos de cálculo de carga

Gasteiger-Marsili e Hückel (GASTEIGER; MARSILI, 1978; PURCELL; SINGER,

1967). O primeiro é utilizado para cargas e o segundo é uma extensão utilizada para

descrever cargas distribuídas em ligações CLARKO método AM1-BCC utiliza

uma abordagem complementar entre o método AM1 e o método ESP-fit. As cargas

atômicas AM1 são calculadas rapidamente e capturam uma parte essencial da estrutura

eletrônica. São acrescentadas aos cálculos de AM1, as correções ligação-carga (BCCs, do

inglês Bond Charge Corrections). As BCCs são utilizadas para corrigir deficiências

encontradas na função de onda de AM1, como por exemplo, a dificuldade na

parametrização de cargas em moléculas contendo enxofre e fósforo (átomos com orbitais

p). As BCCs consistem em parâmetros pré calculados, que são computados de acordo com

o tipo de átomos e ligações presentes nas estruturas das moléculas. O cálculo de cargas

por AM1-BCC permite resultados comparáveis a métodos mecânico-quânticos como

HF/6-31G* ESP, com a vantagem de apresentar reduzido custo computacional

(JAKALIAN; JACK; BAYLY, 2002; JAKALIAN et al., 1999).

5.3.2. Alinhamento molecular

Uma etapa crucial antes de se realizar a análise de CoMFA é o alinhamento dos

compostos que compõem o conjunto de dados. O alinhamento pode afetar a qualidade dos

Page 71: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

71

resultados estatísticos relacionados aos modelos (DOWEYKO, 2004). Há uma diversidade

de estratégias de alinhamento que se são divididas entre aquelas baseadas na estrutura e

aquelas baseadas no ligante. O alinhamento das estruturas se baseia no princípio da

similaridade, ou seja, ligantes com características similares possuem modos de ligação

semelhantes com o alvo macromolecular. O objetivo final de uma estratégia de

alinhamento é a representação da provável conformação bioativa dos compostos. Portanto,

antes de se realizar o alinhamento, conformações apropriadas das moléculas devem ser

calculadas (MARTIN, 1998). Nesse trabalho, as conformações foram geradas no

programa OMEGA v.2.4.6 (OpenEye Scientific Software, Inc., Santa Fe, NM, USA).

A ausência de estruturas cristalográficas da SmTGR contendo os oxadiazóis-2-

óxidos ou outros inibidores co-cristalizados, exigiu a adoção de estratégias de alinhamento

molecular baseadas no ligante. Foram executadas duas estratégias de alinhamento, uma

baseada na sobreposição de volumes e características moleculares (alinhamento no ROCS)

e outra baseada em uma função de similaridade morfológica (alinhamento no Surflex-

Sim) (Figura 19).

Figura 19 - Alinhamentos moleculares utilizados nos estudos de QSAR-3D. (A)

Alinhamento no ROCS (alinhamento1); (B) alinhamento no Surflex-Sim (alinhamento 2).

O ROCS se baseia na descrição da forma molecular (molecular shape), ou seja, as

moléculas são tratadas como um conjunto de esferas interseccionadas. A superfície

exposta dessas esferas define os limites do volume molecular. Nesse método, uma função

gaussiana é utilizada para descrever a forma molecular, que por sua vez pode refletir a

distribuição de cargas nas moléculas, permitindo informações relacionadas ao

reconhecimento molecular no sítio de ligação. O alinhamento pelo ROCS é realizado com

as estruturas rígidas. Portanto, um conjunto de confôrmeros deve ser gerado previamente

Page 72: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

72

para que o espaço conformacional das moléculas seja explorado (GRANT; GALLARDO;

PICKUP, 1996; HAWKINS; SKILLMAN; NICHOLLS, 2007). Nesse estudo, o composto

33 (mais potente do conjunto de dados) foi utilizado como referência para o alinhamento

dos demais compostos, utilizando-se o anel oxadiazólico como referência para

sobreposição (Figura 20). Foi utilizada a função de pontuação TanimotoCombo,

implementada no ROCS, para a classificação e escolha dos melhores confôrmeros, ou seja,

aqueles que melhor se sobrepõem ao composto de referência. A função TanimotoCombo é

uma combinação das funções ShapeTanimoto, a qual compara as moléculas baseando-se

na melhor sobreposição dos volumes moleculares e ColorTanimoto, a qual consiste em

uma pontuação relacionada à sobreposição adequada de grupos com propriedades como

doadores de ligação de hidrogênio, aceptores de ligação de hidrogênio, hidrofóbicos,

cátion, ânion e anéis (HAWKINS; SKILLMAN; NICHOLLS, 2007).

Figura 20 - Esquema demonstrando o alinhamento realizado pelo programa ROCS. As

moléculas do conjunto de dados são sobrepostas a uma molécula de referência e em

seguida, é realizado um processo de otimização que maximiza a sobreposição dos

volumes moleculares (OPENEYE SCIENTIFIC SOFTWARE INC., 2011).

O Surflex-Sim utiliza uma função de similaridade morfológica e uma técnica

rápida de geração de poses para alinhar moléculas ou fragmentos a outras moléculas. A

Page 73: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

73

similaridade morfológica é definida como uma função gaussiana das diferenças na

distância da superfície de duas moléculas aos pontos de observação de uma grade. As

distâncias computadas incluem tanto as distâncias à superfície atômica mais próxima

quanto distâncias a superfícies doadoras e aceptoras. Além disso, é realizada uma

otimização da similaridade entre pares de moléculas não alinhadas, que consiste na

definição de pontos de observação que formam triângulos de mesmo tamanho, em que

cada par de pontos correspondentes nos triângulos observam características similares

(Figura 21).

Figura 21 - Esquema demonstrando o alinhamento realizado no Surflex-Sim. (A) A

similaridade entre as moléculas é definida como as diferenças entre medidas de superfície

e pontos de observação; (B) Representação do procedimento de otimização do

alinhamento, o qual utiliza tripletos constituídos de pontos de observação de duas

moléculas (Adaptado de JAIN, 2004).

Page 74: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

74

5.3.3. Análises de CoMFA

5.3.3.1. Identificação de outliers

Um modelo de CoMFA foi gerado utilizando todos os compostos do conjunto de

dados, sem divisão entre treinamento e teste. As cargas atômicas parciais foram calculadas

pelo método AM1-BCC e o alinhamento molecular realizado através do programa ROCS.

O modelo foi gerado utilizando o espaçamento padrão dos vértices da caixa 3D reticulada

(2,0 Å). Os valores de corte de energia adotados foram de 30 kcal/mol e a filtragem de

coluna adotada na análise de PLS igual a 2,0 kcal/mol. Em seguida, a atividade biológica

de todos os compostos do conjunto de dados foi predita, obtendo-se o valor residual

(Tabela 9).

Tabela 9 - Atividade biológica experimental, predita e valores residuais obtidos a partir

de um modelo de CoMFA utilizando todos os compostos do conjunto de dados.

Composto

pIC50

Experimental Predito Resíduoa

1 5,20 5,37 -0,17

24 7,39 7,01 0,39

2 4,30 5,33 -1,03

3 4,95 5,33 -0,38

4* 6,95 5,39 1,57

5 6,20 5,57 0,63

6* 4,75 5,86 -1,11

7 5,65 5,20 0,46

8 5,60 5,26 0,35

9 5,55 5,28 0,28

10 5,55 5,31 0,25

11 5,45 5,32 0,14

12 5,45 5,31 0,14

13 5,39 5,30 0,10

14 5,15 5,54 -0,39

15 5,15 5,29 -0,14

16 5,10 5,57 -0,47

17 5,10 5,66 -0,56

18 5,05 5,52 -0,47

19 5,05 5,38 -0,33

20 5,00 5,43 -0,43

21 4,95 5,31 -0,36

Page 75: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

75

Tabela 9 (cont.) - Atividade biológica experimental, predita e valores residuais obtidos a

partir de um modelo de CoMFA utilizando todos os compostos do conjunto de dados.

a pIC50 experimental - pIC50 predito; * Composto identificado como outlier; Desvio padrão = 0,59.

Assumindo um intervalo de confiança (IC) de 95%, um composto apresentou valor

residual duas vezes maior que o desvio padrão médio dos resíduos: o composto 4

(composto contendo grupo aldeído). Entretanto, o composto 6 foi considerado outlier, no

qual o valor residual foi igual a 1,11, ou seja, um valor próximo a duas vezes o desvio

padrão. Além disso, o composto 6 foi retirado pois nos estudos de HQSAR ele já havia

sido considerado um outlier, pois apresenta um grupo amida ausente nas demais

moléculas do conjunto de dados.

Os modelos finais de CoMFA foram construídos com a mesma divisão entre

conjunto teste e conjunto treinamento utilizada nos modelos de QSAR-2D.

5.3.3.2. Modelos de CoMFA utilizando as cargas Gasteiger-Hückel

Após o cálculo de cargas atômicas parciais pelo método de Gasteiger-Hückel,

foram gerados modelos de CoMFA utilizando duas diferentes estratégias de alinhamento:

o alinhamento no ROCS (alinhamento 1) e o alinhamento no Surflex-Sim (alinhamento

2). Foram utilizados quatro diferentes espaçamentos dos vértices da caixa 3D reticulada

(espaçamento da grade): 0,5; 1,0; 1,5; 2,0 Å. Todos modelos foram gerados mediante

Composto

pIC50

Experimental Predito Resíduoa

22 4,80 5,49 -0,69

23 4,74 5,15 -0,40

25 5,55 5,47 0,09

26 5,45 5,55 -0,10

27 7,20 6,34 0,87

28 5,45 5,65 -0,20

29 6,00 5,47 0,53

30 6,31 5,80 0,52

31 6,39 5,58 0,82

32 6,45 5,66 0,80

33 7,42 6,85 0,57

34 5,89 6,96 -1,07

35 6,98 7,16 -0,18

Page 76: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

76

focagem da região, através do método do coeficiente do desvio padrão (SDC), com

variações de 0,3 até 1,5 desse coeficiente.

5.3.3.2.1. Modelos obtidos a partir do alinhamento 1 (ROCS)

Em cada espaçamento da grade foram gerados 13 modelos de CoMFA diferentes

(SDC de 0,3 até 1,5). Todos os modelos foram submetidos a validação interna pelo

método de LOO. Nenhum modelo obtido a partir do alinhamento 1 apresentou q2

LOO

maior que 0,6, indicando que os modelos obtidos apresentaram baixa robustez. A tabela

10 indica os melhores modelos obtidos a partir de cada espaçamento da grade.

Tabela 10 - Melhores modelos de CoMFA obtidos a partir do alinhamento 1.

SDC: coeficiente do desvio padrão utilizado na focagem; N: número ótimo de componentes na análise de

PLS; q²LOO: coeficiente de correlação de validação cruzada; r²: coeficiente de correlação determinação

múltipla; SEE: erro padrão estimado;

5.3.3.2.2. Modelos obtidos a partir do alinhamento 2 (Surflex-Sim)

Em cada espaçamento da grade foram gerados 13 modelos de CoMFA diferentes

(SDC de 0,3 até 1,5). Todos foram submetidos a validação interna pelo método de LOO.

Nenhum modelo obtido a partir do alinhamento 2 apresentou q2

LOO maior que 0,6,

indicando que os modelos obtidos apresentaram baixa robustez (Tabela 11).

Espaçamento

da grade

(Å)

SDC N q²LOO r² SEE

0,5 0,6 2 0,559 0,778 0,397

1,0 1,5 1 0,549 0,701 0,451

1,5 0,8 1 0,495 0,660 0,481

2,0 0,7 1 0,526 0,677 0,469

Page 77: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

77

Tabela 11 - Melhores modelos de CoMFA obtidos a partir do alinhamento 2.

E.G.: espaçamento da grade; SDC: coeficiente do desvio padrão utilizado na focagem; N: número ótimo

de componentes na análise de PLS; q²LOO: coeficiente de correlação de validação cruzada; r²: coeficiente

de correlação determinação múltipla; SEE: erro padrão estimado.

5.3.3.3. Modelos de CoMFA utilizando as cargas AM1-BCC

Após o cálculo de cargas atômicas parciais pelo método AM1-BCC, foram gerados

modelos de CoMFA utilizando duas diferentes estratégias de alinhamento: o alinhamento

no programa ROCS (alinhamento 1) e o alinhamento no Surflex-Sim (alinhamento 2).

Foram utilizados quatro diferentes espaçamentos dos vértices da caixa 3D reticulada

(espaçamento da grade): 0,5; 1,0; 1,5; 2,0 Å. Todos modelos foram gerados mediante

focagem da região, através do método do coeficiente do desvio padrão (SDC), com

variações de 0,3 até 1,5 desse coeficiente.

5.3.3.3.1. Modelos obtidos a partir do alinhamento 1

Foram gerados 13 modelos de CoMFA para cada espaçamento de grade, da mesma

forma que os modelos com cargas Gasteiger-Hückel. A validação interna foi realizada

através do método de LOO. Os modelos obtidos com espaçamento da grade de 0,5 a 1,5 Å

apresentaram boa robustez com valores de q²LOO entre 0,711 e 0,813 (Tabela 12). Portanto,

foi avaliada a preditividade externa desses modelos, através do cálculo de r²pred, rm2médio

e rm2 delta. O modelo com melhor preditividade externa foi obtido com espaçamento de

grade igual a 0,5 Å, no qual o valor de r²pred foi igual a 0,904 e os valores de rm2médio e

rm2 delta iguais a 0,832 e 0,042, respectivamente. O modelo com espaçamento de grade

igual a 1,0 Å também apresentou boa preditividade externa, com valor de r²pred foi igual a

0,818 e valores de rm2médio e rm

2 delta dentro da faixa ideal: 0,694 e 0,170,

respectivamente (ROY et al., 2013). Os modelos com espaçamento de 2,0 Å não

apresentaram boa robustez, com valores de q²LOO menores que 0,6.

E.G.

(Å)

SDC N q²LOO r² SEE

0,5 0,9 3 0,512 0,843 0,342

1,0 1,1 1 0,574 0,670 0,474

1,5 1,4 1 0,387 0,556 0,549

2,0 1,5 2 0,329 0,654 0,496

Page 78: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

78

Tabela 12 - Melhores modelos de CoMFA obtidos a partir do alinhamento 1.

E.G.: espaçamento da grade; SDC: coeficiente do desvio padrão utilizado na focagem; N: número ótimo de

componentes na análise de PLS; q²LOO: coeficiente de correlação de validação cruzada; r²: coeficiente de

correlação determinação múltipla; SEE: erro padrão estimado; r²pred: coeficiente de correlação preditivo;

rm2médio: média dos valores de rm

2 e r’m

2; rm

2 delta: diferença entre os valores de rm

2 e r’m

2.

5.3.3.3.2 Modelos obtidos a partir do alinhamento 2

O mesmo protocolo utilizado na geração dos modelos do alinhamento 1 foi usado.

A validação interna dos modelos foi feita através do método de validação cruzada LOO.

Apenas um modelo com espaçamento de grade igual a 1,0 Å apresentou valor de q²LOO

maior que 0,6. Entretanto, a preditividade externa do modelo não foi satisfatória em

termos de rm2médio e rm

2 delta, 0,549 e 0,258, respectivamente. O valor de rm

2 delta

estava acima do recomendado (rm2 delta < 0,2) (ROY et al., 2013). Todos os demais

espaçamentos da grade testados não foram capazes de gerar modelos com boa

consistência interna (q²LOO menor que 0,6) (Tabela 13).

Tabela 13 - Melhores modelos de CoMFA obtidos a partir do alinhamento 2.

E.G.: espaçamento da grade; SDC: coeficiente do desvio padrão utilizado na focagem; N: número ótimo de

componentes na análise de PLS; q²LOO: coeficiente de correlação de validação cruzada; r²: coeficiente de

correlação determinação múltipla; SEE: erro padrão estimado; r²pred: coeficiente de correlação preditivo;

rm2médio: média dos valores de rm

2 e r’m

2; rm

2 delta: diferença entre os valores de rm

2 e r’m

2.

E.G.

(Å)

SDC N q²LOO r² SEE r²pred rm2médio rm

2 delta

0,5 0,3 6 0,711 0,997 0,052 0,904 0,832 0,042

1,0 0,3 6 0,719 0,997 0,052 0,818 0,694 0,170

1,5 0,3 6 0,813 0,998 0,040 0,829 0,632 0,207

2,0 0,3 5 0,516 0,987 0,102 0,831 0,715 0,161

E.G.

(Å)

SDC N q²LOO r² SEE r²pred rm2médio rm

2 delta

0,5 1,3 1 0,371 0,476 0,597 - - -

1,0 0,7 5 0,628 0,991 0,087 0,696 0,549 0,258

1,5 1,5 1 0,347 0,469 0,601 - - -

2,0 0,4 1 0,272 0,463 0,604 - - -

Page 79: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

79

5.3.3.4. Melhores modelos de CoMFA

Dentre os vários modelos de CoMFA gerados a partir de dois métodos de cálculo

de carga e dois métodos de alinhamento molecular, foram escolhidos dois modelos, os

quais apresentaram consistência interna e melhor preditividade externa (Tabela 14).

Tabela 14 - Melhores modelos finais de CoMFA e seus resultados de robustez e

preditividade externa.

aAlinhamento no ROCS; E.G.: espaçamento da grade; N: número ótimo de componentes na análise de PLS; q²LOO:

coeficiente de correlação de validação cruzada; q²LMO: coeficiente de validação cruzada leave-many-out; r²:

coeficiente de correlação determinação múltipla; r²pred: coeficiente de correlação preditivo; rm2médio: média dos

valores de rm2 e r’m

2; rm

2 delta: diferença entre os valores de rm

2 e r’m

2.

Os dois modelos escolhidos apresentaram boa robustez e boa preditividade

externa. Os valores de rm2 delta estavam abaixo de 0,2, como é recomendável. O rm

2 é um

parâmetro de avaliação da preditividade bastante rigoroso, podendo penalizar bastante a

qualidade das predições. Entretanto, nos melhores modelos de CoMFA, o rm2 delta não

ficou acima de 0,2 e o rm2médio permaneceu acima de 0,5. Além disso, os resultados de

r²pred ficaram entre 0,8 e 0,9 (OJHA et al., 2011; ROY et al., 2013). Os modelos gerados a

partir de cargas Gasteiger-Hückel e alinhamento pelo Surflex-Sim mostraram-se inferiores

aos modelos gerados a partir de cargas AM1-BCC e alinhamento pelo ROCS, tanto na

consistência interna, quanto na preditividade externa. Na tabela 15 são demonstrados os

valores residuais após a predição da atividade biológica dos compostos do conjunto teste,

utilizando os dois melhores modelos de CoMFA.

Modelo Cargas Alinhamento E.G.

(Å)

N q²LOO q²LMO r² r²pred rm2

médio

rm2

delta

I AM1-BCC 1 a

0,5 6 0,711 0,665 0,997 0,904 0,832 0,042

II AM1-BCC 1 a

1,0 6 0,719 0,671 0,997 0,818 0,694 0,170

Page 80: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

80

Tabela 15 - Atividade biológica experimental, predita e resíduos dos compostos do

conjunto teste preditos pelos dois melhores modelos de CoMFA.

aDiferença entre pIC50 experimental e predito; desvio padrão dos resíduos; *valores residuais que

ultrapassaram o desvio padrão (IC = 99%).

O modelo I conseguiu predizer, de forma satisfatória, a atividade de seis dos sete

compostos do conjunto teste. Apenas o composto 32 apresentou seus valores residuais

maiores que o desvio padrão dos resíduos (intervalo de confiança de 99%). Portanto, a

capacidade preditiva do modelo I foi de 85,71%. O modelo II conseguiu predizer bem a

atividade de cinco dos sete compostos do conjunto teste, apresentando capacidade

preditiva de 71,42%. A figura 22 mostra os gráficos das atividades experimentais e

preditas pelos dois modelos.

Figura 22 - Gráficos das atividade experimental versus predita construídos a partir dos

dois melhores modelos de CoMFA. Os círculos representam os compostos do conjunto

treinamento e os losangos os compostos do conjunto teste.

Composto

Modelo I

Modelo II

pIC50

Experimental

pIC50

Predito

Resíduoa

)

pIC50

Experimental

pIC50

Predito

Resíduoa

)

25 5,55 5,44 0,11 5,55 5,36 0,19

32 6,45 5,93 0,52* 6,45 5,78 0,67*

10 5,55 5,53 0,03 5,55 5,50 0,05

19 5,05 5,28 -0,23 5,05 5,26 -0,21

13 5,39 5,27 0,12 5,39 5,27 0,12

16 5,10 4,94 0,16 5,10 4,84 0,26

35 6,98 7,16 -0,18 6,98 7,40 -0,42*

Page 81: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

81

5.3.3.5. Mapas de contorno de CoMFA

Além de fornecer modelos capazes de prever a atividade biológica de compostos,

as análises de CoMFA permitem a visualização de informações gráficas a partir de mapas

de contorno. Esses mapas indicam os pontos da caixa 3D reticulada onde variações nos

campos estéricos e elestrotáticos são relacionadas a variações na atividade biológica.

Esses mapas podem ser usados para estimar as regiões das moléculas que são favoráveis

ou desfavoráveis para a atividade biológica. A interpretação desses mapas fornece

informações úteis no planejamento de novos compostos inibidores do alvo biológico em

estudo. (CRAMER; PATTERSON; BUNCE, 1988; KUBINYI, 1997).

Foram gerados mapas de contorno para os modelos I e II, obtidos após a análise de

CoMFA (Figuras 23 e 24). Os mapas foram gerados marcando-se as opções

STDEV*COEFF e a função contour by actual. Nos mapas de contorno estéricos, os

poliedros verdes indicam regiões em que grupos volumosos favorecem a atividade

biológica, enquanto os poliedros amarelos indicam regiões em que grupos volumosos são

desfavoráveis para atividade biológica. Nos mapas de contorno eletrostáticos, os poliedros

vermelhos indicam regiões em que grupos eletronegativos favorecem a atividade

biológica, enquanto os poliedros azuis indicam regiões onde grupo eletronegativos não

são favoráveis a atividade biológica.

O mapa de contorno estérico, obtido a partir do modelo I (Figura 23A), indica que

grupos volumosos na região próxima ao anel furano favorecem a atividade biológica.

Esse resultado sugere, assim como nos estudos de HQSAR, que o anel furano, que pode

ser considerado um grupo volumoso, apresenta importância para a atividade biológica. O

mapa eletrostático, obtido a partir do modelo I (Figura 23B), indica que grupos

eletronegativos em regiões próximas aos átomos de oxigênio O12 e O11 favorecem a

atividade biológica. Além disso, grupos eletronegativos são desfavoráveis na região do

carbono C7.

Page 82: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

82

Figura 23 - Mapas de contorno para o composto mais potente do conjunto de dados

obtidos a partir do modelo I. Mapa de contorno estérico (A); Mapa de contorno

eletrostático (B).

Ao analisar o mapa eletrostático nas proximidades da carobonila (C7 e O12),

observa-se que esse grupo funcional é essencial para atividade biológica. Comparando as

informações obtidas do mapa eletrostático com o mecanismo de liberação de NO pelos

oxadiazóis-2-óxidos (Figura 18), observa-se que a presença de um espaçador, como a

carbonila, com capacidade de atrair elétrons favorece a liberação de NO através do ataque

nucleofílico de tióis nas posições 3 e 4 do anel oxadiazólico (GASCO et al., 2004).

Compostos que não possuem esse espaçador apresentam menor potência como, por

exemplo, o composto 2. O mapa de contorno estérico, obtido a partir do modelo II (Figura

24A), indica que grupos volumosos são favoráveis na região do anel furano, o que está de

acordo com o mapa estérico obtido no modelo I.

Page 83: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

83

Figura 24 - Mapas de contorno para o composto mais potente do conjunto de dados

obtidos a partir do modelo II. Mapa de contorno estérico (A); Mapa de contorno

eletrostático (B).

Oberva-se que os dois compostos mais potentes do conjunto de dados (compostos

33 e 24) possuem anel furano e anel tiofênico, respectivamente, o que sugere a

importância desses grupos para a atividade biológica. No mapa de contorno eletrostático,

obtido a partir do modelo II (Figura 24B), a carbonila ligada ao anel furano (C7 e O12)

novamente demonstra ser favorável à atividade biológica, pois como já foi mencionado,

ele pode favorecer o ataque nucleofílico de tióis ao anel oxadizólico, liberando NO

(GASCO et al., 2004).

Page 84: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

84

5.3.4. Análises de CoMSIA

5.3.4.1 Identificação de outliers

Os compostos 4 e 6 foram também considerados outliers na análise de CoMSIA.

Os modelos finais de CoMSIA foram construídos com a mesma divisão entre conjunto

treinamento e conjunto teste utilizada na análise de CoMFA. Portanto, a divisão do

conjunto de dados seguiu a mesma proporção: 78,7% dos compostos no conjunto

treinamento e 21,3% no conjunto teste.

5.3.4.2. Modelos de CoMSIA utilizando as cargas Gasteiger-Hückel

Após o cálculo de cargas atômicas parciais pelo método de Gasteiger-Hückel,

foram gerados modelos de CoMSIA utilizando duas diferentes estratégias de alinhamento:

o alinhamento no programa ROCS (alinhamento 1) e o alinhamento no Surflex-Sim

(alinhamento 2). O espaçamento dos vértices da caixa 3D reticulada (espaçamento da

grade) utilizado foi de 2,0 Å. Não foram gerados modelos de CoMSIA com outros

espaçamentos da grade.

5.3.4.2.1. Modelos obtidos a partir do alinhamento 1 (ROCS)

Foram gerados 26 modelos de CoMSIA, utilizando diferentes combinações dos

campos estérico, eletrostático, hidrofóbico, doador e aceptor de ligação de hidrogênio.

Foram considerados satisfatórios aqueles modelos que apresentaram boa robustez (q2

LOO >

0,6) e boa preditividade externa (r2

pred > 0,6; rm2 médio > 0,5; rm

2 delta < 0,2)

(GOLBRAIKH; TROPSHA, 2002; ROY et al., 2013). A tabela 16 mostra os melhores

modelos de CoMSIA gerados a partir do alinhamento 1.

Page 85: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

85

Tabela 16 - Melhores modelos de CoMSIA obtidos a partir de cargas Gasteiger-Hückel e

alinhamento 1.

q²LOO: coeficiente de correlação de validação cruzada; r²: coeficiente de correlação determinação múltipla

N: número ótimo de componentes na análise de PLS; SEE: erro padrão estimado; r²pred: coeficiente de

correlação preditivo; rm2médio: média dos valores de rm

2 e r’m

2; rm

2 delta: diferença entre os valores de rm

2

e r’m2; S: campo estérico; E: campo eletrostático; H: campo hidrofóbico; D: campo doador de ligação de

hidrogênio; A: campo aceptor de ligação de hidrogênio. *melhor modelo gerado utilizando cargas

Gasteiger-Hückel. .

Apesar de os melhores modelos apresentarem q2

LOO menor que 0,6, indicativo de

menor consistência interna, todos demonstraram boa preditividade externa com valores de

r²pred, rm2médio e rm

2 delta satisfatórios (r

2pred > 0,6; rm

2 médio > 0,5; rm

2 delta < 0,2).

5.3.4.2.2. Modelos obtidos a partir do alinhamento 2 (Surflex-Sim)

Foram gerados 26 modelos a partir do alinhamento 2. Os modelos que

apresentaram melhor robustez e preditividade externa estão apresentados na tabela 17. Os

Modelo q2

LOO r2

N SEE Contribuição r2

pred rm2

médio

rm2 delta

EH 0,559 0,960 5 0,181 0,449 0,551 0,971 0,944 0,034

HD 0,525 0,910 6 0,278 0,856 0,144 0,888 0,687 0,154

SEA 0,538 0,987 6 0,106 0,189 0,345

0,466

0,812 0,668 0,066

SHA 0,504 0,996 6 0,061 0,181 0,342

0,477

0,957 0,894 0,051

EDA 0,537 0,924 5 0,250 0,368 0,155

0,476

0,782 0,636 0,045

HDA 0,502 0,937 4 0,221 0,347 0,239

0,414

0,972 0,878 0,037

SEHA* 0,513 0,995 6 0,068 0,115 0,248

0,269 0,367

0,947 0,884 0,065

SEHD 0,506 0,911 4 0,263 0,112 0,344

0,351 0,193

0,930 0,769 0,101

SEDA 0,564 0,969 5 0,158 0,130 0,316

0,135 0,420

0,789 0,620 0,013

EHDA 0,568 0,981 5 0,124 0,259 0,272

0,126 0,343

0,965 0,928 0,042

SHDA 0,508 0,950 4 0,197 0,120 0,303

0,206 0,371

0,982 0,929 0,025

SEHDA 0,562 0,990 5 0,090 0,091 0,236

0,238 0,118

0,317

0,961 0,899 0,053

Page 86: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

86

três melhores modelos, apesar de apresentarem q2

LOO menor que 0,6, foram aprovados em

todos os critérios de preditividade externa (r2

pred, rm2 médio e rm

2 delta).

Tabela 17 - Melhores modelos de CoMSIA obtidos a partir de cargas Gasteiger-Hückel e

alinhamento 2.

q²LOO: coeficiente de correlação de validação cruzada; r²: coeficiente de correlação determinação

múltipla N: número ótimo de componentes na análise de PLS; SEE: erro padrão estimado; r²pred: coeficiente de correlação preditivo; rm

2médio: média dos valores de rm

2 e r’m

2; rm

2 delta: diferença

entre os valores de rm2 e r’m

2; S: campo estérico; E: campo eletrostático; H: campo hidrofóbico; D:

campo doador de ligação de hidrogênio; A: campo aceptor de ligação de hidrogênio; *melhor modelo

gerado utilizando cargas Gasteiger-Hückel.

5.3.4.3. Modelos de CoMSIA utilizando as cargas AM1-BCC

Após o cálculo de cargas atômicas parciais pelo método AM1-BCC, foram gerados

modelos de CoMSIA utilizando duas diferentes estratégias de alinhamento: o alinhamento

no programa ROCS (alinhamento 1) e o alinhamento no Surflex-Sim (alinhamento 2). O

espaçamento dos vértices da caixa 3D reticulada (espaçamento da grade) utilizado foi de

2,0 Å.

5.3.4.3.1. Modelos obtidos a partir do alinhamento 1

Foram gerados 26 modelos de CoMSIA a partir do alinhamento 1. Os melhores

modelos, que demonstraram melhor consistência interna e preditividade externa, estão

representados na tabela 18. O modelo SEHA, foi aquele que apresentou os melhores

resultados, dentre todos os modelos que usaram cargas AM1-BCC, demonstrando

robustez e boa preditividade externa, ao ser aprovado em todos critérios de preditividade

externa (r2

pred, rm2 médio e rm

2 delta).

Modelo q2

LOO r2

N SEE Contribuição r2

pred rm2

médio

rm2 delta

EH 0,500 0,947 5 0,209 0,473 0,527 0,863 0,736 0,155

SHDA 0,509 0,975 6 0,145 0,116 0,312

0,149 0,422

0,919 0,753 0,073

SEHDA 0,515 0,970 5 0,155 0,074 0,255

0,234 0,130

0,307

0,912 0,739 0,092

Page 87: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

87

Tabela 18 - Melhores modelos de CoMSIA obtidos a partir de cargas AM1-BCC e

alinhamento 1.

q²LOO: coeficiente de correlação de validação cruzada; r²: coeficiente de correlação determinação múltipla

N: número ótimo de componentes na análise de PLS; SEE: erro padrão estimado; r²pred: coeficiente de

correlação preditivo; rm2médio: média dos valores de rm

2 e r’m

2; rm

2 delta: diferença entre os valores de rm

2 e

r’m2; S: campo estérico; E: campo eletrostático; H: campo hidrofóbico; D: campo doador de ligação de

hidrogênio; A: campo aceptor de ligação de hidrogênio; *melhor modelo gerado utilizando cargas AM1-

BCC.

5.3.4.3.2. Modelos obtidos a partir do alinhamento 2

Foram gerados 26 modelos a partir do alinhamento 2. Os modelos que

apresentaram boa robustez e preditividade externa estão representados na tabela 19.

Modelo q2

LOO r2

N SEE Contribuição r2

pred rm2

médio

rm2 delta

EH 0,669 0,985 5 0,111 0,673 0,327 0,875 0,668 0,164

SE 0,658 0,994 6 0,070 0,173 0,827 0,864 0,738 0,161

HD 0,525 0,910 6 0,278 0,856 0,144 0,888 0,687 0,154

SEA 0,615 0,996 6 0,058 0,153 0,508

0,339

0,868 0,747 0,077

SEH 0,609 0,990 5 0,090 0,109 0,605

0,287

0,921 0,797 0,102

EHA 0,565 0,984 4 0,111 0,430 0,237

0,333

0,926 0,817 0,078

SHA 0,504 0,996 6 0,061 0,181 0,342

0,477

0,957 0,894 0,051

EDA 0,539 0,983 6 0,119 0,494 0,150

0,356

0,763 0,593 0,106

HDA 0,502 0,937 4 0,221 0,347 0,239

0,414

0,972 0,878 0,037

SEHA* 0,597 0,996 6 0,056 0,103 0,385

0,212 0,300

0,965 0,902 0,036

SEHD 0,614 0,986 6 0,111 0,100 0,496

0,261 0,144

0,898 0,651 0,155

SEDA 0,597 0,993 6 0,078 0,105 0,435

0,134 0,326

0,798 0,621 0,137

EHDA 0,630 0,992 6 0,084 0,360 0,216

0,147 0,277

0,921 0,731 0,100

SHDA 0,508 0,950 4 0,197 0,120 0,303

0,206 0,371

0,982 0,929 0,025

SEHDA 0,623 0,994 6 0,069 0,074 0,334

0,192 0,136

0,264

0,928 0,754 0,095

Page 88: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

88

Tabela 19 - Melhores modelos de CoMSIA obtidos a partir de cargas AM1-BCC e

alinhamento 2.

q²LOO: coeficiente de correlação de validação cruzada; r²: coeficiente de correlação determinação múltipla N:

número ótimo de componentes na análise de PLS; SEE: erro padrão estimado; : desvio padrão dos

resíduos; r²pred: coeficiente de correlação preditivo; rm2médio: média dos valores de rm

2 e r’m

2; rm

2 delta:

diferença entre os valores de rm2 e r’m

2; S: campo estérico; E: campo eletrostático; H: campo hidrofóbico; D:

campo doador de ligação de hidrogênio; A: campo aceptor de ligação de hidrogênio;

5.3.4.4. Melhores modelos de CoMSIA

Os modelos de CoMSIA mais robustos e preditivos foram: o modelo SEHA, obtido

a partir do cálculo de cargas Gasteiger-Hückel e alinhamento 1 (Modelo I); o modelo

SEHA, obtido a partir do cálculo de cargas AM1-BCC e alinhamento 1 (Modelo II). Esses

modelos foram submetidos a validação cruzada por LMO, obtendo-se q2LMO igual 0,477

para o modelo I e 0,554 para o modelo II. Na tabela 20 são demonstrados os valores

residuais após a predição da atividade biológica dos compostos do conjunto teste,

utilizando esses dois modelos.

O modelo I apresentou capacidade preditiva igual a 57,14%, ou seja, dos sete

compostos que compõem o conjunto teste, três apresentaram valor residual maior que o

desvio padrão dos resíduos (intervalo de confiança igual a 99%). O modelo II apresentou

capacidade preditiva igual a 85,71%, ou seja, dos sete compostos que compõem o

conjunto teste, apenas um apresentou valor residual maior que o desvio padrão dos

resíduos (intervalo de confiança igual a 99%). O modelo II foi utlizado posteriormente

para a geração dos mapas de contorno. A figura 25 mostra os gráficos das atividades

experimentais e previstas pelos dois modelos.

Modelo q2

LOO r2

N SEE Contribuição r2

pred rm2

médio

rm2 delta

EHA 0,521 0,944 3 0,203 0,422 0,261

0,317

0,874 0,681 0,158

SEHA 0,532 0,946 3 0,201 0,072 0,389

0,239 0,300

0,872 0,649 0,173

EHDA 0,538 0,965 4 0,165 0,360 0,230

0,137 0,274

0,851 0,639 0,180

SHDA 0,507 0,975 6 0,145 0,116 0,312

0,149 0,423

0,919 0,753 0,073

Page 89: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

89

Tabela 20 - Atividade biológica experimental, predita e resíduos dos compostos do

conjunto teste após predição a partir dos dois melhores modelos de CoMSIA.

Composto

Modelo I b

Modelo II c

pIC50

Experimental

pIC50

Predito

Resíduoa

)

pIC50

Experimental

pIC50

Predito

Resíduoa

)

25 5,55 5,33 0,22* 5,55 5,58 -0,03

32 6,45 6,19 0,27* 6,45 6,09 0,36*

10 5,55 5,53 0,02 5,55 5,46 0,09

19 5,05 5,15 -0,10 5,05 5,05 0,00

13 5,39 5,32 0,08 5,39 5,32 0,07

16 5,10 5,25 -0,15 5,10 5,14 -0,04

35 6,98 7,25 -0,27* 6,98 6,95 0,03 aDiferença entre pIC50 experimental e predito;

b modelo obtido a partir das cargas Gasteiger-Hückel e

alinhamento 1; c modelo obtido a partir das cargas AM1-BCC alinhamento 1; desvio padrão dos resíduos;

*valores residuais que ultrapassaram o desvio padrão (IC = 99%).

Figura 25 - Gráficos da atividade experimental versus predita construídos a partir dos

dois melhores modelos de CoMSIA. (A) modelo I, obtido com cálculo de cargas

Gasteiger-Hückel e alinhamento 1; (B) modelo II, obtido com cálculo de cargas AM1-

BCC e alinhamento 1.

5.3.4.5. Mapas de contorno de CoMSIA

As análises de CoMSIA, assim como as análises de CoMFA, permitem a

visualização de informações a partir de mapas de contorno. Esses mapas podem ser

usados para estimar as regiões das moléculas que são favoráveis ou desfavoráveis para a

atividade biológica e sua interpretação fornece informações úteis no planejamento de

novos compostos bioativos.

Page 90: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

90

Foram gerados mapas de contorno para o modelo II, o qual apresentou melhor

capacidade preditiva (Figura 26 ). Os mapas foram gerados utilizando a função contour by

actual. No mapa de contorno estérico, os poliedros verdes indicam regiões em que grupos

volumosos favorecem a atividade biológica, enquanto poliedros amarelos indicam regiões

em que grupos volumosos são desfavoráveis para a atividade biológica. No mapa de

contorno eletrostático, os poliedros vermelhos indicam regiões em que grupos

eletronegativos favorecem a atividade biológica, enquanto os poliedros azuis indicam

regiões em que grupos eletronegativos não são favoráveis a atividade biológica. No mapa

de contorno hidrofóbico, os poliedros amarelos indicam regiões em que grupos

hidrofóbicos favorecem a atividade biológica, enquanto os poliedros cinzas indicam

regiões em que grupos hidrofóbicos são desfavoráveis para atividade biológica. No mapa

de aceptores de ligação de hidrogênio, os poliedros de cor violeta indicam regiões em que

aceptores de ligação de hidrogênio são favoráveis a atividade biológica, enquanto os

poliedros de cor magenta indicam regiões em que aceptores de ligação de hidrogênio são

desfavoráveis a atividade biológica.

Figura 26 - Mapas de contorno obtidos a partir do modelo II (SEHA). (A) mapa de

contorno estérico; (B) mapa de contorno eletrostático; (C) mapa de contorno hidrofóbico;

(D) mapa de contorno de aceptores de ligação de hidrogênio.

Page 91: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

91

O mapa de contorno estérico (Figura 26A), ao indicar a região em que grupos

volumosos são favoráveis, sugere novamente a importância do anel furano na atividade

biológica da série de compostos. O mapa de contorno eletrostático (Figura 26B), assim

como nos estudos de CoMFA, destaca a importância da carbonila para a atividade

biológica através do mecanismo de liberação de NO. O mapa de contorno hidrofóbico

indica que grupos hidrofóbicos são desfavoráveis na região em que se encontram os dois

oxigênios (O12 e O11) das carbonilas, sugerindo a importância de grupos polares nessa

região e reforçando ainda mais o papel da carbonila a atividade biológica. O mapa de

contorno de aceptores de ligação de hidrogênio confirma também a importância para a

atividade biológica de aceptores de ligação de hidrogênio, como o átomo de oxigênio O12

da carbonila. Observa-se que aceptores de ligação de hidrogênio são desfavoráveis em

regiões próximas ao anel furano.

5.4. Planejamento de novos inibidores de SmTGR a partir dos estudos de QSAR

Os estudos de QSAR-2D e QSAR-3D forneceram informações importantes que

foram usadas no planejamento de novos inibidores da enzima SmTGR. Os mapas de

contribuição do HQSAR e os mapas de contorno de CoMFA e CoMSIA indicaram

requisitos estruturais importantes para o planejamento de novos oxadiazóis-2-óxidos

capazes de inibir SmTGR, como se pode observar na figura 27.

O planejamento de novos inibidores de SmTGR foi realizado a partir da estrutura

do composto mais potente do conjunto de dados (composto 33, pIC50 = 7,42). A partir das

informações obtidas dos mapas de HQSAR, CoMFA e CoMSIA, foram propostas

substituições bioisostéricas para os dois anéis furano (anel A e anel B) utilizando o

programa BROOD v.2.0.0. Foi utilizada uma quimioteca de fragmentos, disponível no

programa, com propriedades farmacocinéticas e parâmetros de acessibilidade sintética

desejáveis.

Page 92: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

92

Figura 27 – Resumo das informações obtidas através dos estudos de QSAR-2D e QSAR-

3D.

Após as modificações no anel A, foram obtidas 1000 moléculas agrupadas em 17

clusters, obtendo-se 17 cluster-heads, que são as moléculas mais representativas de cada

cluster. Entretanto, apenas 9 moléculas foram selecionadas. Cinco moléculas que

apresentavam quiralidade foram excluídas, pois os compostos usados na construção dos

modelos de QSAR não apresentavam quiralidade. Outras 3 moléculas foram excluídas,

pois as modificações realizadas não estavam de acordo com os mapas dos modelos de

QSAR. Após as modificações no anel B, foram obtidas 1000 moléculas agrupadas em 20

clusters. Das 20 cluster-heads iniciais, foram escolhidas apenas 3, após a retirada de

compostos quirais e compostos que não estavam de acordo com os mapas de QSAR.

Portanto, foram obtidos 12 novos compostos que tiveram suas atividades biológicas

preditas pelos melhores modelos de QSAR-2D e QSAR-3D.

Antes de se realizar a predição da atividade dos novos compostos, os mesmos

foram preparados. Foram gerados confôrmeros para os compostos por meio do programa

OMEGA v.2.4.6. A escolha dos melhores confôrmeros de cada molécula foi realizada

após sobreposição, no programa ROCS, com o composto mais potente do conjunto de

dados. Os melhores confôrmeros foram escolhidos através dos escores de

TanimotoCombo e posteriormente foram submetidos ao cálculo de cargas AM1-BCC. A

atividade biológica dos 12 novos compostos foi predita através dos três melhores modelos

de QSAR (HQSAR, CoMFA CoMSIA) e foi feita uma média (consenso) das predições

(Tabela 21).

Page 93: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

93

Tabela 21 – Estrutura química, valores de pIC50 preditos e valores de IC50 preditos para os

potenciais inibidores de SmTGR e o composto 33.

a pIC50 predito pelo melhor modelo de HQSAR;

b pIC50 predito pelo melhor modelo de CoMFA;

c pIC50 predito

pelo melhor modelo de CoMSIA; d Consenso das predições.

e AS = acessibilidade sintética; * pIC50

experimental = 7,42.

Comp Estrutura HQSARa

(A/DA)

CoMFAb

CoMSIAc

Consenso d

IC50 pred

(M)

ASe

hit-1

7,609 6,518 6,927 7,018 0,095 0,55

hit-2

6,934 5,831 6,323 6,362 0,434 0,62

hit-3

7,543 6,464 5,969 6,658 0,219 0,53

hit-4

7,494 6,631 6,671 6,932 0,116 0,53

hit-5

8,243 5,959 5,442 6,548 0,283 0,54

hit-6

7,558 5,814 5,714 6,362 0,434 0,45

hit-7

8,469 6,008 5,685 6,720 0,190 0,54

hit-8

7,606 6,311 6,367 6,71 0,194 0,53

hit-9

8,075 6,051 6,006 6,710 0,194 0,55

hit-10

6,663 5,589 6,360 6,204 0,625 0,62

Page 94: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

94

Tabela 21 (cont.) – Estrutura química, valores de pIC50 preditos e valores de IC50 preditos

para os potenciais inibidores de SmTGR e o composto 33.

a pIC50 predito pelo melhor modelo de HQSAR;

b pIC50 predito pelo melhor modelo de CoMFA;

c pIC50 predito

pelo melhor modelo de CoMSIA; d Consenso das predições.

e AS = acessibilidade sintética; * pIC50

experimental = 7,42.

Dentre os novos compostos planejados, o hit-1 demonstrou ser o mais promissor.

Apesar de a potência predita para esse composto ser inferior à do composto 33, o valor de

IC50 predito foi igual a 0,095 M, ou seja, o composto é um potencial inibidor da enzima

SmTGR em escala nanomolar. Além disso, a boa acessibilidade sintética (AS) de 0,55 indica

que o hit-1 é um composto promissor para que seja dado prosseguimento à síntese e

avaliação experimental. Considerando-se a boa acessibilidade sintética dos compostos, a

qual tem seu valor sempre superior a 0,5, com exceção do hit-6, todos os potenciais

inibidores dão possibilidades de se realizar a síntese e a avaliação experimental.

Comp Estrutura HQSARa

(A/DA)

CoMFAb

CoMSIAc

Consensod

IC50 pred

(M)

ASe

hit-11

7,612 5,359 7,236 6,735 0,184 0,55

hit-12

7,543 6,205 6,013 6,587 0,258 0,53

33*

7,567 7,414 7,410 7,463 0,034 -

Page 95: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

95

6. CONCLUSÕES

Os oxadiazóis-2-óxidos parecem exercer atividade esquistossomicida através

de um mecanismo de ação duplo, pois inibem a enzima SmTGR através da

ligação (S-nitrosilação) a resíduos de cisteína e selenocisteína e liberam, ao

mesmo tempo, o NO, o qual exerce atividade antiparasitária;

Os modelos de HQSAR, CoMFA e CoMSIA para a série de oxadiazóis-2-

óxidos inibidores da enzima SmTGR apresentaram bons resultados estatísticos,

tanto de validação interna quanto externa. Tais modelos foram usados para a

predição da atividade biológica de novos compostos;

Os mapas de contribuição do HQSAR e de contorno de CoMFA e CoMSIA

indicaram a importância de determinados grupos para a atividade biológica

como, por exemplo, a carbonila e os anéis tiofênico e furano. Os mapas

permitiram correlacionar a estrutura dos inibidores com o mecanismo de

liberação de NO pelos oxadiazóis-2-óxidos;

Os estudos de QSAR-3D utilizando dois métodos diferentes de cálculo de

cargas e duas estratégias de alinhamento demonstraram a importância do

cálculo do potencial eletrostático e do alinhamento molecular nos estudos de

CoMFA e CoMSIA;

As cargas AM1-BCC e a estratégia de alinhamento pelo ROCS geraram

modelos de QSAR-3D superiores aos obtidos com as cargas Gasteiger-Hückel

e alinhamento pelo Surflex-Sim;

As informações obtidas dos mapas gerados por HQSAR, CoMFA e CoMSIA

foram utilizadas no planejamento de novos inibidores da enzima SmTGR,

permitindo a identificação de um potencial inibidor na faixa nanomolar.

Page 96: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

96

7. PERSPECTIVAS

A identificação de 12 novos potenciais inibidores com boa acessibilidade sintética

justifica a realização da síntese desses compostos e posterior validação experimental

através de ensaios biológicos de inibição da enzima SmTGR e de ensaios in vitro contra

Schistosoma mansoni. Além disso, é interessante a realização de estudos in silico de

predição de propriedades físico-químicas e farmacocinéticas para garantir que os

compostos apresentem propriedades ADMET satisfatórias.

Page 97: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

97

8. REFERÊNCIAS BIBLIOGRÁFICAS

ABDUL-GHANI, R. et al. Current chemotherapy arsenal for schistosomiasis mansoni:

alternatives and challenges. Parasitology research, v. 104, n. 5, p. 955–965, 2009.

ABDULLA, M.-H. et al. Schistosomiasis mansoni: novel chemotherapy using a cysteine

protease inhibitor. PLoS medicine, v. 4, n. 1, p. e14, 2007.

ADAMS, C. P.; BRANTNER, V. V. Estimating the cost of new drug development: is it really

802 million dollars? Health affairs (Project Hope), v. 25, n. 2, p. 420–428, 2006.

ALBUQUERQUE, M. G. et al. Multidimensional-QSAR: Beyond the third-dimension in drug

design. In: TAFT, C. A.; SILVA, C. H. T. P. (Eds.). Current methods in medicinal

chemistry and biological physics. Kerala: Research signpost, 2007. v. 1p. 91–100.

ANGELUCCI, F. et al. Glutathione reductase and thioredoxin reductase at the crossroad: the

structure of Schistosoma mansoni thioredoxin glutathione reductase. Proteins, v. 72, n. 3, p.

936–945, 2008.

ANGELUCCI, F. et al. Mapping the catalytic cycle of Schistosoma mansoni thioredoxin

glutathione reductase by X-ray crystallography. The Journal of biological chemistry, v. 285,

n. 42, p. 32557–32567, 2010.

ANGELUCCI, F. et al. Macromolecular bases of antischistosomal therapy. Current topics in

medicinal chemistry, v. 11, n. 16, p. 2012–2028, 2011.

BAJORATH, J. Computational chemistry in pharmaceutical research: at the crossroads.

Journal of computer-aided molecular design, v. 26, n. 1, p. 11–12, 2012.

BAUMANN, K. Cross-validation as the objective function for variable-selection techniques.

TrAC Trends in Analytical Chemistry, v. 22, n. 6, p. 395–406, 2003.

BEZERRA, J. C. B. et al. Ocorrência de paraplegia associada a infecção com Schistosoma

mansoni não autóctone no estado de Goiás. Revista de patologia tropical, v. 25, n. 1, p. 73–

79, 1996.

BONESSO-SABADINI, P. I. P.; DIAS, L. C. S. Altered Response of Strain of Schistosoma

mansoni to Oxamniquine and Praziquantel. Memórias do instituto oswaldo cruz, v. 97, n. 3,

p. 381–385, 2002.

BROOD version 2.0.0, OpenEye Scientific Software, Inc., Santa Fe, NM, USA,

www.eyesopen.com, 2010.

CAFFREY, C. R. Chemotherapy of schistosomiasis: present and future. Current opinion in

chemical biology, v. 11, n. 4, p. 433–439, 2007.

CAFFREY, C. R.; SECOR, W. E. Schistosomiasis: from drug deployment to drug

development. Current opinion in infectious diseases, v. 24, n. 5, p. 410–417, 2011.

Page 98: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

98

CDC. Centers for Disease Control and Prevention. Disponível em:

<http://www.cdc.gov/parasites/schistosomiasis/biology.html> Acesso em: 10 ago. 2013.

CLARK, M.; CRAMER III, R. D.; VAN OPDENBOSCH, N. Validation of the general

purpose tripos 5.2 force field. Journal of computational chemistry, v. 10, n. 8, p. 982–1012,

1989.

CLARK, R. D. Boosted leave-many-out cross-validation: the effect of training and test set

diversity on PLS statistics. Journal of computer-aided molecular design, v. 17, n. 2-4, p.

265–275, 2003.

CLARK, R. D. Prospective ligand- and target-based 3D QSAR: state of the art 2008. Current

topics in medicinal chemistry, v. 9, n. 9, p. 791–810, 2009.

COHEN, N. C. Guidebook on molecular modeling in drug design. San Diego: Academic

Press, 1996. p. 361

CONLON, C. P. Schistosomiasis. Medicine, v. 33, n. 8, p. 64–67, 2005.

CONSONNI, V.; BALLABIO, D.; TODESCHINI, R. Evaluation of model predictive ability

by external validation techniques. Journal of Chemometrics, v. 24, n. 3-4, p. 194–201, 17

2010.

CRAMER, R. D. The inevitable QSAR renaissance. Journal of computer-aided molecular

design, v. 26, n. 1, p. 35–38, 2012.

CRAMER, R. D.; PATTERSON, D. E.; BUNCE, J. D. Comparative molecular field analysis

(CoMFA). 1. Effect of shape on binding of steroids to carrier proteins. Journal of the

american chemical society, v. 110, n. 18, p. 5959–5967, 1988.

DEARDEN, J. C.; CRONIN, M. T. D.; KAISER, K. L. E. How not to develop a quantitative

structure-activity or structure-property relationship (QSAR/QSPR). SAR and QSAR in

environmental research, v. 20, n. 3-4, p. 241–266, 2009.

DIMASI, J. A; HANSEN, R. W.; GRABOWSKI, H. G. The price of innovation: new

estimates of drug development costs. Journal of health economics, v. 22, n. 2, p. 151–85,

2003.

DOENHOFF, M. J. et al. Praziquantel: its use in control of schistosomiasis in sub-Saharan

Africa and current research needs. Parasitology, v. 136, n. 13, p. 1825–1835, 2009.

DOWEYKO, A. M. 3D-QSAR illusions. Journal of computer-aided molecular design, v.

18, n. 7-9, p. 587–596, 2004.

DUDEK, A. Z.; ARODZ, T.; GÁLVEZ, J. Computational methods in developing quantitative

structure-activity relationships (QSAR): a review. Combinatorial chemistry & high

throughput screening, v. 9, n. 3, p. 213–228, 2006.

Page 99: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

99

DUFFY, B. C. et al. Early phase drug discovery: cheminformatics and computational

techniques in identifying lead series. Bioorganic & medicinal chemistry, v. 20, n. 18, p.

5324–5342, 2012.

ELEBRING, T.; GILL, A.; PLOWRIGHT, A. T. What is the most important approach in

current drug discovery: doing the right things or doing things right? Drug discovery today, v.

17, n. 21-22, p. 1166–1169, 2012.

FEELISCH, M.; SCHÖNAFINGER, K.; NOACK, E. Thiol-mediated generation of nitric

oxide accounts for the vasodilator action of furoxans. Biochemical pharmacology, v. 44, n.

6, p. 1149–1157, 1992.

FENWICK, A. The global burden of neglected tropical diseases. Public health, v. 126, n. 3,

p. 233–236, 2012.

FERREIRA, R. S.; OLIVA, G.; ANDRICOPULO, A. D. Integração das técnicas de triagem

virtual e triagem biológica automatizada em alta escala: oportunidades e desafios em P&D de

fármacos. Química nova, v. 34, n. 10, p. 1770–1778, 2011.

GASCO, A. et al. NO donors: Focus on furoxan derivatives. Pure and applied chemistry, v.

76, n. 5, p. 973–981, 2004.

GASHAW, I. et al. What makes a good drug target? Drug discovery today, v. 16, n. 23-24,

p. 1037–1043, 2011.

GASTEIGER, J.; MARSILI, M. A new model for calculating atomic charges in molecules.

Tetrahedron letters, v. 19, n. 34, p. 3181–3184, 1978.

GOLBRAIKH, A.; TROPSHA, A. Beware of q2! Journal of molecular graphics &

modelling, v. 20, n. 4, p. 269–276, 2002.

GRANT, J. A.; GALLARDO, M. A.; PICKUP, B. T. A fast method of molecular shape

comparison: A simple application of a Gaussian description of molecular shape. Journal of

computational chemistry, v. 17, n. 14, p. 1653–1666, 1996.

GRAY, D. J. et al. Diagnosis and management of schistosomiasis. British medical journal,

v. 342, n. d2651, p. 1–11, 2011.

GRYSEELS, B. et al. Human schistosomiasis. Lancet, v. 368, n. 9541, p. 1106–1118, 2006.

GRYSEELS, B. Schistosomiasis. Infectious disease clinics of North America, v. 26, n. 2, p.

383–397, 2012.

GUIDO, R. V. C.; ANDRICOPULO, A. D.; OLIVA, G. Planejamento de fármacos,

biotecnologia e química medicinal: aplicações em doenças infecciosas. Estudos avançados,

v. 24, n. 70, p. 81–98, 2010.

GUIDO, R. V. C.; OLIVA, G.; ANDRICOPULO, A. D. Virtual screening and its integration

with modern drug design technologies. Current medicinal chemistry, v. 15, n. 1, p. 37–46,

2008.

Page 100: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

100

GUIDO, R. V. C.; OLIVA, G.; ANDRICOPULO, A. D. Modern drug discovery technologies:

opportunities and challenges in lead discovery. Combinatorial chemistry & high

throughput screening, v. 14, n. 10, p. 830–839, 2011.

HAGAN, P. et al. Schistosomiasis control: keep taking the tablets. Trends in parasitology, v.

20, n. 2, p. 92–97, 2004.

HANSCH, C.; FUJITA, T. p-σ-π analysis. A method for the correlation of biological activity

and chemical structure. Journal of the american chemical society, v. 86, n. 8, p. 1616–1626,

1964.

HASEGAWA, K.; FUNATSU, K. Evolution of PLS for Modeling SAR and omics Data.

Molecular informatics, v. 31, n. 11-12, p. 766–775, 2012.

HAWKINS, P. C. D. et al. Conformer generation with OMEGA: algorithm and validation

using high quality structures from the Protein Databank and Cambridge Structural Database.

Journal of chemical information and modeling, v. 50, n. 4, p. 572–584, 2010.

HAWKINS, P. C. D.; SKILLMAN, A G.; NICHOLLS, A. Comparison of shape-matching

and docking as virtual screening tools. Journal of medicinal chemistry, v. 50, n. 1, p. 74–82,

2007.

HOPFINGER, A. J. et al. Construction of 3D-QSAR Models Using the 4D-QSAR Analysis

Formalism. Journal of the american chemical society, v. 119, n. 43, p. 10509–10524, 1997.

HUANG, H. et al. Investigations of the catalytic mechanism of thioredoxin glutathione

reductase from Schistosoma mansoni. Biochemistry, v. 50, n. 26, p. 5870–5882, 2011.

HUGHES, J. P. et al. Principles of early drug discovery. British journal of pharmacology,

v. 162, n. 6, p. 1239–1249, 2011.

JAIN, A. N. Ligand-based structural hypotheses for virtual screening. Journal of medicinal

chemistry, v. 47, n. 4, p. 947–961, 2004.

JAKALIAN, A. et al. Fast, Efficient Generation of High-Quality Atomic Charges. AM1-BCC

Model: I. Method. Journal of computational chemistry, v. 21, n. 2, p. 132–146, 1999.

JAKALIAN, A.; JACK, D. B.; BAYLY, C. I. Fast, efficient generation of high-quality atomic

charges. AM1-BCC model: II. Parameterization and validation. Journal of computational

chemistry, v. 23, n. 16, p. 1623–1641, 2002.

JOHANSSON, L.; GAFVELIN, G.; ARNÉR, E. S. J. Selenocysteine in proteins-properties

and biotechnological use. Biochimica et biophysica acta, v. 1726, n. 1, p. 1–13, 2005.

JORGENSEN, W. L. The many roles of computation in drug discovery. Science (New York,

N.Y.), v. 303, n. 5665, p. 1813–1818, 2004.

KAPETANOVIC, I. M. Computer-aided drug discovery and development (CADDD): in

silico-chemico-biological approach. Chemico-biological interactions, v. 171, n. 2, p. 165–

176, 2008.

Page 101: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

101

KATZ, N. The discovery of Schistosomiasis mansoni in Brazil. Acta tropica, v. 108, n. 2-3,

p. 69–71, 2008.

KING, C. H. Parasites and poverty: the case of schistosomiasis. Acta tropica, v. 113, n. 2, p.

95–104, 2010.

KLEBE, G.; ABRAHAM, U. Comparative molecular similarity index analysis (CoMSIA) to

study hydrogen-bonding properties and to score combinatorial libraries. Journal of

computer-aided molecular design, v. 13, n. 1, p. 1–10, 1999.

KLEBE, G.; ABRAHAM, U.; MIETZNER, T. Molecular similarity indices in a comparative

analysis (CoMSIA) of drug molecules to correlate and predict their biological activity.

Journal of medicinal chemistry, v. 37, n. 24, p. 4130–4146, 1994.

KLOOS, H. et al. Socioeconomic studies of schistosomiasis in Brazil: a review. Acta tropica,

v. 108, n. 2-3, p. 194–201, 2008.

KROEMER, R. T. et al. Improving the predictive quality of COMFA models. In: KUBINYI,

H.; FOLKERS, G.; MARTIN, Y. C. (Eds.). 3D QSAR in Drug Design Recent Advances.

Dordrecht: Kluwer Academic Publishers, 1998. p. 41–56.

KUBINYI, H. QSAR: Hansch analysis and related approaches. Weinheim: VCH, 1993. p.

1–13

KUBINYI, H. QSAR and 3D QSAR in drug design Part 1: methodology. Drug discovery

today, v. 2, n. 11, p. 457–467, 1997.

KUNTZ, A. N. et al. Thioredoxin glutathione reductase from Schistosoma mansoni: an

essential parasite enzyme and a key drug target. PLoS medicine, v. 4, n. 6, p. e206, 2007.

LAURENT, S. A.-L. et al. Synthesis of “Trioxaquantel”® Derivatives as Potential New

Antischistosomal Drugs. European journal of organic chemistry, v. 2008, n. 5, p. 895–913,

2008.

LINDBERG, W.; PERSSON, J.-A.; WOLD, S. Partial least-squares method for

spectrofluorimetric analysis of mixtures of humic acid and lignin sulfonate. Analytical

chemistry, v. 55, n. 4, p. 643–648, 1983.

LOMBARDINO, J. G.; LOWE, J. A. The role of the medicinal chemist in drug discovery-

then and now. Nature reviews. Drug discovery, v. 3, n. 10, p. 853–862, 2004.

LOUKAS, A.; BETHONY, J. M. New drugs for an ancient parasite. Nature medicine, v. 14,

n. 4, p. 365–367, 2008.

LOWIS, D. R. HQSAR: a new, highly predictive QSAR technique. Tripos technical notes,

v. 1, n. 5, p. 1–17, 1997.

MARTIN, Y. C. 3D QSAR: current state, scope, and limitations. In: KUBINYI, H.;

FOLKERS, G.; MARTIN, Y. C. (Eds.). 3D QSAR in Drug Design Recent Advances.

Dordrecht: Kluwer Academic Publishers, 1998. p. 3–23.

Page 102: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

102

MOREIRA, L. S. A. et al. A study of the activity of 2-(alkylamino)-1-phenyl-1-

ethanethiosulfuric acids against infection by Schistosoma mansoni in a murine model.

Transactions of the Royal Society of Tropical Medicine and Hygiene, v. 101, n. 4, p. 385–

390, 2007.

MORGAN, S. et al. The cost of drug development: a systematic review. Health policy

(Amsterdam, Netherlands), v. 100, n. 1, p. 4–17, 2011.

MÜLLNER, A et al. Chemistry and pharmacology of neglected helminthic diseases. Current

medicinal chemistry, v. 18, n. 5, p. 767–789, 2011.

NAUSER, T.; STEINMANN, D.; KOPPENOL, W. H. Why do proteins use selenocysteine

instead of cysteine? Amino acids, v. 42, n. 1, p. 39–44, 2012.

NIH. National Institutes of Health. Mirazid clinicaltrial.gov (NCT01529710), Rockville,

USA, 2012a. Disponível em:

<http://clinicaltrials.gov/ct2/show/NCT01529710?term=schistosomiasis&rank=2>. Acesso

em: 15 ago. 2013.

NIH. National Institutes of Health. Bilhvax1a clinicaltrial.gov (NCT01512277), Rockville,

USA, 2012b. Disponível em:

<http://clinicaltrials.gov/ct2/show/NCT01512277?term=schistosomiasis&rank=12>. Acesso

em: 15 ago. 2013.

NIH. National Institutes of Health. sm14 clinicaltrial.gov (NCT01154049), Rockville, USA,

2012c. Disponível em:

<http://clinicaltrials.gov/ct2/show/NCT01154049?term=schistosomiasis&rank=18>. Acesso

em: 26 mar. 2014.

NIH. National Institutes of Health. Mefloquine clinicaltrial.gov (NCT01132248), Rockville,

USA, 2013. Disponível em:

<http://clinicaltrials.gov/ct2/show/NCT01132248?term=schistosomiasis&rank=5>. Acesso

em: 15 ago. 2013.

NWAKA, S.; HUDSON, A. Innovative lead discovery strategies for tropical diseases. Nature

reviews. Drug discovery, v. 5, n. 11, p. 941–955, 2006.

NWAKA, S.; RIDLEY, R. G. Virtual drug discovery and development for neglected diseases

through public-private partnerships. Nature reviews. Drug discovery, v. 2, n. 11, p. 919–

928, 2003.

OECD. Organization for Economic Co-operation and Development (OECD). Guidance

document on the validation of (Quantitative) Structure-Activity Relationship [(Q)SAR]

models., 2007. Disponível em: <OECD Web>. Acesso em: 5 out. 2013

OJHA, P. K. et al. Further exploring rm2 metrics for validation of QSPR models.

Chemometrics and intelligent laboratory systems, v. 107, n. 1, p. 194–205, 2011.

OLIVEIRA, M. F. et al. Inhibition of heme aggregation by chloroquine reduces Schistosoma

mansoni infection. The Journal of infectious diseases, v. 190, n. 4, p. 843–852, 2004.

Page 103: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

103

OMEGA version 2.4.6, OpenEye Scientific Software, Inc., Santa Fe, NM, USA,

www.eyesopen.com, 2012.

OPENEYE. BROOD, version 2.0.0. Santa Fe, NM, USA: p. 110

OPENEYE SCIENTIFIC SOFTWARE INC. ROCS Release 3.1.2, 2011.

PAUL, S. M. et al. How to improve R&D productivity: the pharmaceutical industry’s grand

challenge. Nature reviews. Drug discovery, v. 9, n. 3, p. 203–214, 2010.

PICARD, R. R.; COOK, R. D. Cross-Validation of Regression Models. Journal of the

american statistical association, v. 79, n. 387, p. 575–583, 1984.

PRAST-NIELSEN, S.; HUANG, H.-H.; WILLIAMS, D. L. Thioredoxin glutathione

reductase: its role in redox biology and potential as a target for drugs against neglected

diseases. Biochimica et biophysica acta, v. 1810, n. 12, p. 1262–1271, 2011.

PROTASIO, A. V et al. A systematically improved high quality genome and transcriptome of

the human blood fluke Schistosoma mansoni. PLoS neglected tropical diseases, v. 6, n. 1, p.

e1455, 2012.

PURCELL, W. P.; SINGER, J. A. A Brief Review and Table of Semiempirical Parameters

Used in the Hückel Molecular Orbital Method. Journal of chemical and engineering data,

v. 12, n. 2, p. 235–246, 1967.

PyMol, version 1.3. Schrödinger, LLC, New York, NY, USA, 2010.

QUACPAC version 1.5.0, OpenEye Scientific Software, Inc., Santa Fe, NM, USA,

www.eyesopen.com, 2011.

RAI, G. et al. Structure-Mechanism Insights and the Role of Nitric Oxide Donation Guide the

Development of Oxadiazole-2-Oxides as Therapeutic Agents against Schistosomiasis.

Journal of medicinal chemistry, v. 52, n. 20, p. 6474–6483, 2009.

RIVEAU, G. et al. Safety and immunogenicity of rSh28GST antigen in humans: phase 1

randomized clinical study of a vaccine candidate against urinary schistosomiasis. PLoS

neglected tropical diseases, v. 6, n. 7, p. e1704, 2012.

RIVERO, A. Nitric oxide: an antiparasitic molecule of invertebrates. Trends in parasitology,

v. 22, n. 5, p. 219–225, 2006.

ROCS version 3.1.2, OpenEye Scientific Software, Inc., Santa Fe, NM, USA,

www.eyesopen.com, 2011.

RONKETTI, F. et al. Praziquantel derivatives I: Modification of the aromatic ring.

Bioorganic & medicinal chemistry letters, v. 17, n. 15, p. 4154–7, 2007.

ROY, K. et al. Some case studies on application of “r(m)2” metrics for judging quality of

quantitative structure-activity relationship predictions: emphasis on scaling of response data.

Journal of computational chemistry, v. 34, n. 12, p. 1071–1082, 2013.

Page 104: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

104

ROY, P. P.; ROY, K. On Some Aspects of Variable Selection for Partial Least Squares

Regression Models. QSAR & combinatorial science, v. 27, n. 3, p. 302–313, 2008.

SACCOCCIA, F. et al. On the mechanism and rate of gold incorporation into thiol-dependent

flavoreductases. Journal of inorganic biochemistry, v. 108, p. 105–111, 2012.

SALUM, L. B.; ANDRICOPULO, A. D. Fragment-based QSAR: perspectives in drug design.

Molecular diversity, v. 13, n. 3, p. 277–285, 2009.

SALVADOR-RECATALÀ, V.; GREENBERG, R. M. Calcium channels of schistosomes:

unresolved questions and unexpected answers. Wiley interdisciplinary reviews. Membrane

transport and signaling, v. 1, n. 1, p. 85–93, 2012.

SAYED, A. A. et al. Identification of oxadiazoles as new drug leads for the control of

schistosomiasis. Nature medicine, v. 14, n. 4, p. 407–412, 2008.

SCIOR, T. et al. How to recognize and workaround pitfalls in QSAR studies: a critical

review. Current medicinal chemistry, v. 16, n. 32, p. 4297–4313, 2009.

SEEL, M.; TURNER, D. B.; WILLETT, P. Effect of Parameter Variations on the

Effectiveness of HQSAR Analyses. Molecular informatics, v. 18, n. 3, p. 245–252, 1999.

SIMEONOV, A. et al. Quantitative high-throughput screen identifies inhibitors of the

Schistosoma mansoni redox cascade. PLoS neglected tropical diseases, v. 2, n. 1, p. e127,

2008.

STANTON, D. T. QSAR and QSPR Model Interpretation Using Partial Least Squares ( PLS )

Analysis. Current computer-aided drug design, v. 8, n. 2, p. 107–127, 2012.

SU, D. et al. Mammalian selenoprotein thioredoxin-glutathione reductase. Roles in disulfide

bond formation and sperm maturation. The Journal of biological chemistry, v. 280, n. 28, p.

26491–26498, 2005.

SYBYL-X, version 1.2: Tripos, Inc., St. Louis, MO, USA , 2010.

TALELE, T. T.; KHEDKAR, S. A; RIGBY, A. C. Successful applications of computer aided

drug discovery: moving drugs from concept to the clinic. Current topics in medicinal

chemistry, v. 10, n. 1, p. 127–141, 2010.

TRIPOS, HQSAR TM Manual: SYBYL®-X 1.1 2010.Saint Louis, USA, 2010a.

TRIPOS,QSAR and COMFA® Manual: SYBYL®-X 1.1 2010.Saint Louis, USA, 2010b.

TSAI, K.-C. et al. A comparison of different electrostatic potentials on prediction accuracy in

COMFA and CoMSIA studies. European journal of medicinal chemistry, v. 45, n. 4, p.

1544–1551, 2010.

UTZINGER, J. et al. Artemisinins for schistosomiasis and beyond. Current opinion in

investigational drugs (London, England : 2000), v. 8, n. 2, p. 105–116, 2007.

Page 105: Planejamento e identificação de novos agentes ...repositorio.bc.ufg.br/tede/bitstream/tede/3614/5/dissertacao... · partir de um modelo de CoMFA utilizando todos os compostos do

105

VAN NASSAUW, L. et al. Schistosomicidal activity of the antimalarial drug, mefloquine, in

Schistosoma mansoni-infected mice. Travel medicine and infectious disease, v. 6, n. 5, p.

253–258, 2008.

VEDANI, A et al. Multiple-conformation and protonation-state representation in 4D-QSAR:

the neurokinin-1 receptor system. Journal of medicinal chemistry, v. 43, n. 23, p. 4416–

4427, 2000.

VEDANI, A. et al. Novel ligands for the chemokine receptor-3 (CCR3): a receptor-modeling

study based on 5D-QSAR. Journal of medicinal chemistry, v. 48, n. 5, p. 1515–1527, 2005.

VEDANI, A.; DOBLER, M.; LILL, M. A. Combining protein modeling and 6D-QSAR.

Simulating the binding of structurally diverse ligands to the estrogen receptor. Journal of

medicinal chemistry, v. 48, n. 11, p. 3700–3703, 2005.

VERMA, J.; KHEDKAR, V. M.; COUTINHO, E. C. 3D-QSAR in drug design - a review.

Current topics in medicinal chemistry, v. 10, n. 1, p. 95–115, 2010.

WANG, W.; WANG, L.; LIANG, Y.-S. Susceptibility or resistance of praziquantel in human

schistosomiasis: a review. Parasitology research, v. 111, n. 5, p. 1871–1877, 2012.

WEIGELT, J. et al. Structural genomics and drug discovery: all in the family. Current

opinion in chemical biology, v. 12, n. 1, p. 32–39, 2008.

WERMUTH, C. et al. Glossary of terms used in medicinal chemistry (IUPAC

recommendations 1998). Pure and applied chemistry, v. 71, n. 10, p. 1919–1981, 1998.

WHO. Schistosomiasis: progress report 2001-2011 and strategic plan 2012-2020., 2013a.

WHO. Sustaining the drive to overcome the global impact of neglected tropical diseases.,

2013b.

WOLD, S.; SJÖSTRÖM, M.; ERIKSSON, L. PLS-regression: a basic tool of chemometrics.

Chemometrics and intelligent laboratory systems, v. 58, n. 2, p. 109–130, 2001.

XIAO, S.-H. et al. In vitro and in vivo activities of synthetic trioxolanes against major human

schistosome species. Antimicrobial agents and chemotherapy, v. 51, n. 4, p. 1440–1445,

2007.