universidade estadual de campinas instituto de ......biológica dos compostos. a falta das...

204
UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE QUÍMICA FLÁVIA DA SILVA PEREIRA ESTUDO QSAR DA ARTEMISININA E DERIVADOS COM ATIVIDADE ANTIMALÁRICA CAMPINAS 2016

Upload: others

Post on 01-Dec-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

UNIVERSIDADE ESTADUAL DE CAMPINAS

INSTITUTO DE QUÍMICA

FLÁVIA DA SILVA PEREIRA

ESTUDO QSAR DA ARTEMISININA E DERIVADOS COM ATIVIDADE ANTIMALÁRICA

CAMPINAS

2016

Page 2: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

FLÁVIA DA SILVA PEREIRA

ESTUDO QSAR DA ARTEMISININA E DERIVADOS COM ATIVIDADE

ANTIMALÁRICA

Tese de Doutorado apresentada ao Instituto de

Química da Universidade Estadual de Campinas

como parte dos requisitos exigidos para a obtenção

do título de Doutora em Ciências

Orientadora: Profa. Dra. Márcia Miguel Castro Ferreira

ESTE EXEMPLAR CORRESPONDE À VERSÃO FINAL DA TESE DEFENDIDA PELA

ALUNA FLÁVIA DA SILVA PEREIRA , E ORIENTADA PELA PROFA. DRA. MÁRCIA

MIGUEL CASTRO FERREIRA

CAMPINAS

2016

Page 3: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina
Page 4: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina
Page 5: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

A minha amada família.

Page 6: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

AGRADECIMENTOS

Ao amigo de todas as horas, Deus;

Aos meus pais (Antônio Carlos e Marlene), irmãos (Carlos Eduardo e Edivaldo) e sobrinhos

(João Carlos e Carlos Eduardo Filho) pelo amor, compreensão, paciência e apoio em todos os

momentos de minha vida;

A minha orientadora, Profª Drª Márcia Miguel Castro Ferreira, pela amizade, apoio e

orientação no desenvolvimento deste trabalho;

Aos amigos Boaz Galdino, Iracema Camilo, Pe. Adriano e Analice Arruda pela amizade e

incentivo;

As minhas amigas do pensionato morada da condessa pelo convívio harmonioso e alegre;

Aos Profs. Drs. Eduardo Borges de Melo, Rudolf Kiralj, Kerly Fernanda Mesquita Pasqualoto

e Maria Cristina A. Costa pelas valorosas contribuições e amizade;

Ao amigo Pedro Mariz por sua grande contribuição no estudo de QSAR4D;

Aos amigos do Laboratório de Quimiometria Teórica e Aplicada (LQTA) pelo

companheirismo;

A todos os professores e funcionários do Instituto de Química da UNICAMP;

Ao CNPq pela bolsa concedida.

Page 7: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

RESUMO

A malária é uma doença parasitária, considerada enfermidade negligenciada que, desde a

antiguidade, causa problemas sociais e econômicos no mundo. A artemisinina e seus derivados

constituem uma nova classe de antimaláricos e um efeito significativo, para o tratamento da

malária. Este estudo teve por finalidade construir modelos QSAR-2D e 4D para 180 análogos e

derivados de artemisinina. Foram feitos cálculos de orbitais moleculares ab initio em níveis

HF e DFT/B3LYP. Simulações de Dinâmica Molecular foram feitas para o estudo QSAR-4D.

Descritores estruturais, eletrônicos, geométricos, topológicos e estéricos foram calculados para

o estudo 2D e descritores de campo eletrostático para o estudo 4D. Os parâmetros estatísticos

obtidos para os modelos 2D e 4D estão de acordo com os critérios de validação sugeridos na

literatura. Os resultados indicam que a presença de uma dupla ligação na posição C9, bem

como, de um grupo substituinte na posição C9 afetaram de forma negativa a atividade

biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade

dos análogos da secoartemisinina. A inversão do O11 (ou N11) e do átomo de hidrogênio no

C12 e a inversão do grupo peróxido em C3 e C12a em relação à artemisinina são

características que ocasionaram uma grande queda na atividade de alguns análogos em relação

à artemisinina. De um modo geral, grupos polares na posição C10 contribuem para o aumento

da atividade biológica. A partir do estudo de QSAR-4D observou-se que os descritores de

Coulomb 9C-, 8C-, 7C- e 6C- indicam que o aumento da densidade eletrônica em regiões

específicas do ligante favorece a atividade biológica. O descritor de Coulomb 5C- sugere que

um grupo substituinte altamente polar na posição C10 favorece a atividade biológica. Os

descritores de Coulomb 1C+, 2C+, 3C+ e 4C+ indicam que um grupo substituinte hidrofílico

na posição C9 desfavorece a atividade antimalárica. O descritor de Lennard Jones 3LJ+

sugere que o aumento do número de átomos de carbono do substituinte n-alquila nesta região

favorece a atividade biológica. Os descritores de Lennard Jones 1LJ- e 2LJ- indicam que a

presença um grupo substituinte muito volumoso desfavorece a atividade biológica. Novos

candidatos a fármacos foram propostos a partir dos estudos de QSAR (2D e 4D).

Page 8: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

ABSTRACT

Malaria is a parasitic disease, considered to be neglected and that since from antiquity, causes

social and economic problems in the world. Artemisinin and its derivatives emerged as a new

class of antimalarials, which are effective against drug-resistant strains of Plasmodium

falciparum. This study aims the construction of QSAR (2D and 4D) models for a set of 180

artemisinin analogs and derivatives. Molecular orbital calculations ab initio were carried out

at HF and DFT / B3LYP levels. Molecular dynamics simulations were performed for the

QSAR-4D study. Structural, electronic, geometric, topological and steric descriptors were

calculated for the 2D study and filed descriptors were calculated for the 4D study. The

statistical parameters for both models are in accordance with validation criteria suggested in

the literature. The results indicate that the presence of a double bond at carbon 9, C9, and a

substituent group at C9 produced a negative effect in the biological activity. The lack of C4-

C5 and C5- C5a chemical bonds are detrimental to the activity of secoartemisinin analogs.

The inversion of O11 (or N11) and the hydrogen from C12 and the inversion of the peroxide

group at C3 and C12a with respect to artemisinin are characteristics that led to the very low

activity of some analogues in relation to artemisinin. In general, the presence of polar groups

in the C10 position contributes to increase biological activity. Regarding the QSAR-4D study,

it has observed that Coulomb descriptors 9C-, 8C-, 7C- and 6C- indicate that the increased

electron density in specific regions of the ligand favors the biological activity. The Coulomb

descriptor 5C- indicates that a highly polar substituent group in the C10 position favors the

biological activity. The Coulomb descriptors 1C +, C2 + C3 + and C4 + suggest that a

hydrophilic substituent group at C9 position dis harmful for the antimalarial activity. The

3LJ + Lennard Jones descriptor suggests that increasing the number of carbon atoms in the n-

alkyl substituent promotes biological activity. The Lennard Jones descriptors 1LJ- and 2LJ-

indicate the presence a very bulky substituent group disadvantages biological activity.

According to the results from 2D and 4D QSAR models, new potential candidates were

proposed.

Page 9: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

LISTA DE FIGURAS

Figura 1. Distribuição mundial da malária. Adaptado da referência [4]. 21

Figura 2. Distribuição da malária no Brasil. Adaptado da referência [5]. 22

Figura 3. Mosquito do gênero Anopheles. Adaptado da referência [7]. 23

Figura 4. Ciclo de vida do parasita da malária que envolve os dois hospedeiros, o

mosquito Anopheles e o homem. Adaptado da referência [16].

24

Figura 5. Estrutura molecular 2D e 3D da artemisinina.

27

Figura 6. Mecanismo de ação da artemisinina considerando a interação do O1 com o Fe

do grupo heme.

28

Figura 7. Representação de uma molécula dentro da caixa virtual tridimensional (3D). 34

Figura 8. Representação do orbital 1s para funções de base STO e GTO. 48

Figura 9. Representação gráfica das funções GTO para produzir a base STO-3G. 49

Figura 10. Estrutura molecular da artemisinina indicando o número de cada átomo. 58

Figura 11. Sequência dos passos adotados para otimização da geometria da artemisinina

e a seguir, dos compostos análogos.

70

Figura 12. Fluxograma das etapas a serem seguidas na construção e validação dos

modelos de QSAR.

71

Figura 13. Histograma apresentando a distribuição dos valores de LogRA para 180

compostos.

76

Figura 14. Visualização 2D do resultado da PCA. Escores de PC1 versus PC2. Os

resultados experimentais estão representados por EXP.

77

Figura 15. Dendrograma ilustrando a distribuição dos descritores selecionados para a

construção do modelo QSAR.

78

Figura 16. Gráficos bivariados dos três descritores selecionados versus a atividade

biológica, LogRA.

79

Figura 17. Estrutura molecular 2D dos compostos 55 e 57.

79

Figura 18. Estrutura molecular 2D da artemisinina e do análogo 164.

80

Page 10: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

LISTA DE FIGURAS

Figura 19. Gráficos dos resultados obtidos para o teste de robustez a partir do método LNO

(N = 1 - 50).

83

Figura 20. Gráficos dos resultados obtidos no teste de aleatorização de y. (a) Q2 em função

de R2 para 100 randomizações. (b) Coeficientes de correlação absoluto entre y aleatorizado

(yal) e os respectivos valores originais (y) versusR2. (c) Coeficientes de correlação absoluto

entre y aleatorizado (yal) e os valores originais (y) versus Q2.

84

Figura 21. (a) Gráfico dos valores experimentais versus os valores estimados de LogRA para

o modelo de regressão PLS construído com 2 fatores. (b) Gráfico dos valores previstos versus

resíduos (LogRAexp - LogRAprev).

85

Figura 22. Dendrograma destacando os compostos selecionados para formarem o conjunto

de validação externa.

86

Figura 23. Gráfico da relação entre o descritor %RB e LogRA para os compostos da Tabela

10.

94

Figura 24. Interação da artemisinina com o heme (átomos. C - cinza; H;-branco, O -

vermelho; N - violeta Fe - verde). Adaptado da referência [37].

95

Figura 25. Gráfico da relação entre o descritor Mor03e e LogRA.

96

Figura 26. Gráfico da relação entre o descritor %RB e LogRA.

103

Figura 27. Gráfico da relação entre o descritor Mor03e e LogRA.

105

Figura 28. Composto 92(LogRA = 1,36) docado com o heme. Análogo com os substituintes

C5H9O2, C4H9 e H nas posições C3, C9 e C9, respectivamente.

107

Figura 29. Gráfico da relação entre o descritor %RB e LogRA.

109

Figura 30. Gráfico da relação entre o descritor Mor03e e LogRA.

109

Figura 31. Gráfico da relação entre o descritor Mor03e e LogRA.

112

Figura 32. Gráfico da relação entre o descritor Mor03e e LogRA para compostos com

átomos de hidrogênio nas posições C9 e C9.

134

Figura 33. Gráfico da relação entre o descritor Mor03e e LogRA para compostos com uma

metila na posição C9 e um átomo de hidrogênio na posiçãoC9.

135

Page 11: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

LISTA DE FIGURAS

Figura 34. Histograma apresentando a distribuição dos valores de Log RA para 89

compostos.

138

Figura 35. Estrutura molecular da artemisinina indicando a numeração dos átomos

selecionados para o alinhamento.

145

Figura 36. Descritores resultantes após o corte pela variância.

146

Figura 37. Descritores de campo resultantes após o processo de filtragem Para os

compostos 55 (a). Composto 164 (b). As esferas com a cor cinza ilustram os descritores de

Coulomb e as esferas com a cor chumbo, os descritores de Lennard Jones.

147

Figura 38. Gráfico da influência versus Resíduos de Student para o conjunto de 89

compostos.

148

Figura 39. Estrutura molecular 2D dos compostos eliminados no estudo de QSAR4D.

149

Figura 40. Gráfico dos valores experimentais versus os valores estimados de LogRA para o

modelo de regressão PLS construído com 2 fatores.

150

Figura 41. Gráfico dos valores previstos versus resíduos (LogRAexp - LogRAcal).

150

Figura 42. Gráficos dos resultados obtidos para o teste de robustez a partir do método

LNO (N = 1 - 50).

152

Figura 43. Gráficos dos resultados obtidos no teste de aleatorização de y. (a) Q2 em função

do R2 para 50 randomizaçõs.

152

Figura 44. Gráficos do teste de aleatorização de y. (a) Coeficientes de correlação absoluto

entre y aleatorizado (yal) e os respectivos valores originais (y) versus R2. (b) Coeficientes

de correlação absoluto entre y aleatorizado (yal) e os valores originais (y) versus Q2.

153

Figura 45. Visualização dos descritores 4D selecionados pelo melhor modelo de QSAR

para a artemisinina.

154

Figura 46. Análise do descritor 9C- com base nas estruturas 2D e 3D da artemisinina.

155

Figura 47. Análise dos descritores 7C- e 8C- com base nas estruturas 2D e 3D da

artemisinina.

157

Figura 48. Análise do descritor 6C- com base nas estruturas 2D e 3D da artemisinina.

158

Figura 49. Análise do descritor 5C- com base nas estruturas 2D e 3D do composto 80.

160

Figura 50. Gráfico de LogRA versus Descritor de Coulomb, 5C-.

160

Page 12: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

LISTA DE FIGURAS

Figura 51. Análise dos descritores 1C+, 2C+, 3C+ e 4C+ com base nas estruturas 2D e 3D

dos compostos (a) 1 e (b) 178.

161

Figura 52. Análise do descritor 3LJ+ a partir do composto 164. 162

Figura 53. Derivados propostos a partir dos estudos de QSAR(2D e 4D). 163

Figura 54. Derivados selecionados para a predição a partir dos estudos de QSAR(2D e

4D).

164

Page 13: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

LISTA DE TABELAS

Tabela 1. Descritores calculados a partir dos programas MARVIN e E-Dragon, para o

conjunto de 180 análogos de artemisinina.

42

Tabela 2. Modificações estruturais e os valores de atividade relativa (LogRA) dos análogos

da artemisinina (composto 14).

60

Tabela 3. Modificações estruturais e os valores de atividade relativa (LogRA) dos análogos

da azartemisinina (composto 40).

65

Tabela 4. Modificações estruturais e os valores de atividade relativa (LogRA) dos análogos

da secoartemisinina (composto 171).

66

Tabela 5. Modificações estruturais e os valores de atividade relativa (LogRA) dos análogos

do arteéter (composto 35).

67

Tabela 6. Modificações estruturais e os valores de atividade relativa (LogRA) de outros

análogos da artemisinina.

68

Tabela 7. Modificações estruturais e os valores de atividade relativa (LogRA) dos análogos

da diidroartemisinina (composto 88).

69

Tabela 8. Coeficientes de correlação descritor-descritor e descritor-LogRA.

81

Tabela 9. Análise dos sinais dos coeficientes de correlação descritor-atividade e o vetor de

regressão.

82

Tabela 10. Análise dos descritores SCORE, ASA_H, %RB e Mor03e para os compostos

selecionados com substituição na posição C3.

91

Tabela 11. Análise de contribuições para o descritor SCORE. S é o valor final do descritor

(a soma de todas as contribuições).

92

Tabela 12. Contribuições do descritor %RB para os compostos da Tabela 10. (BC =

número de ligações no composto; RBC = número de ligações com rotação livre).

94

Tabela 13. Análise dos descritores SCORE, ASA_H, %RB e Mor03e para os compostos

selecionados na posição C9.

98

Tabela 14. Análise de contribuições de diferentes substituintes no carbono C9 para o

descritor SCORE.

100

Tabela 15. Análise de contribuições de diferentes substituintes no carbono C9 para o

descritor SCORE.

100

Tabela 16. Análise de contribuições de diferentes substituintes no carbono C9 para o

descritor SCORE.

101

Page 14: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

LISTA DE TABELAS

Tabela 17. Análise de contribuições de diferentes substituintes no carbono C9 para o

descritor SCORE.

102

Tabela 18. Análise dos descritores SCORE, ASA_H, %RB e Mor03e para os compostos

selecionados com substituinte na posição C3, mantendo o substituinte em C9 fixo.

106

Tabela 19. Análise de contribuições de diferentes substituintes no carbono C3 para o

descritor SCORE.

108

Tabela 20. Análise dos descritores SCORE, ASA_H, %RB e Mor03e para os compostos

selecionados com substituições nas posições C9(e

110

Tabela 21. Análise de contribuições de diferentes substituintes na posição C9 ( e para

o descritor SCORE.

111

Tabela 22. Análise dos descritores SCORE, ASA_H, %RB e Mor03e para os compostos

selecionados na posição C10.

113

Tabela 23. Análise de contribuições de diferentes substituintes no carbono C10 para o

descritor SCORE.

120

Tabela 24. Análise de contribuições de diferentes substituintes no carbono C10 para o

descritor SCORE.

122

Tabela 25. Análise de contribuições de diferentes substituintes no carbono C10 para o

descritor SCORE.

123

Tabela 26. Análise de contribuições de diferentes substituintes no carbono C10 para o

descritor SCORE.

124

Tabela 27. Análise de contribuições de diferentes substituintes no carbono C10 para o

descritor SCORE.

124

Tabela 28. Análise de contribuições de diferentes substituintes no carbono C10 para o

descritor SCORE.

125

Tabela 29. Análise de contribuições de diferentes substituintes no carbono C10 para o

descritor SCORE.

126

Tabela 30. Análise dos descritores SCORE, ASA_H, %RB e Mor03e para os derivados da

secoartemisinina.

128

Tabela 31. Análise de contribuições de diferentes substituintes dos derivados da

secoartemisinina para o descritor SCORE.

129

Page 15: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

LISTA DE TABELAS

Tabela 32. Análise dos descritores SCORE, ASA_H, %RB e Mor03e para os compostos

selecionados do conjunto das azaartemisininas.

130

Tabela 33. Análise de contribuições de diferentes substituintes dos derivados da

azaartemizinina para o descritor SCORE contendo átomos de hidrogênio nas posições C9 e

C9.

132

Tabela 34. Análise de contribuições de diferentes substituintes dos derivados da

azaartemizinina para o descritor SCORE nas posições C9 (CH3) e C9 (H).

133

Tabela 35. 89 compostos selecionados para o estudo de QSAR4D.

139

Tabela 36. Número de descritores iniciais e após a filtragem para cada alinhamento.

146

Tabela 37. Análise dos sinais dos coeficientes de correlação descritor-atividade e dos

coeficientes de regressão.

151

Tabela 38. Valores de densidade de carga para os compostos 92 e 54. 156

Tabela 39. Valores de densidade de carga para os compostos 18 e 52. 157

Tabela 40. Valores de densidade de carga para os compostos 1 e 65.

159

Page 16: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

LISTA DE ABREVIATURAS

3DMoRSE: Molecule Representation of Structure based on Electron diffraction

(Representação da estrutura molecular baseada na difração de elétrons);

ADF: Amsterdam Density Functional;

any ou a: Qualquer tipo de átomo;

APYY: YY Componente de polarizabilidade molecular Pol3D;

ar: Aromático;

ASA: Representação poliédrica que é usada para cada átomo no cálculo da área

superficial;

ASA_H: Água de superfície acessível para a áraea superficial;

ASA+: Água de superfície acessível para a área superficial de todos os átomos com

carga positiva parcial (estritamente maior que 0);

B3LYP: Becke, three-parameter, Lee-Yang-Parr;

BC: Bond Count (number of bonds between non-H atoms) (Ligação contagem

(número de ligações entre átomos de não-H));

C-003: Corresponde ao número de subfragmentos moleculares CHR3, ou átomos de

carbono terciários.

CAC: Chain Atom Count (number of non-H atoms forming chains) (Contagem de

cadeias atômicas (número de átomos de não-H formando cadeias));

CADD: Computer-Aided Drug Design (Planejamento de fármacos auxiliado por

computador);

CBC: Chain Bond Count (number of bonds between non-H atoms forming chains)

(Contagem de ligações de cadeias (número de ligações entre átomos não-H formando

cadeias));

CEP: Conformational Ensemble Profile (Perfil de amostragem conformacional);

ChelpG: CHarges from ELectrostatic Potentials using a Grid based method;

CIC0: Índice de conteúdo complementar de Informação (simetria de vizinhança de

ordem - 0);

CIC1: Índice de conteúdo complementar de Informação (simetria de vizinhança de

ordem - 1);

CSD: Cambridge Structural Database;

Page 17: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

LISTA DE ABREVIATURAS

CoMFA Comparative Molecular Field Analysis (Análise comparativa dos campos

moleculares);

DFT: Density Function Theory (Teoria do funcional de densidade);

DM: Dinâmica Molecular;

gapHOMO-LUMO: Highest Occupied Molecular Orbital - Lowest Unoccupied

Molecular (diferença de energia entre HOMO (Orbital molecular mais alto ocupado) e

LUMO (Orbital molecular mais baixo desocupado));

GCODs: Grid Cell Occupancy Descriptors (Descritor de ocupação da célulade grade

virtual);

GTO: Orbitais gaussianos;

H3u: Matriz de autocorrelação H entre átomos separados por 3 ligações;

Hbd: Doador de ligação de hidrogênio;

Hba: Aceptor de ligação de hidrogênio;

HF : HF: Hartree-Fock;

HOMO: Highest Occupied Molecular Orbital (Orbital molecular mais alto ocupado);

IC50: Concentração requerida para atingir 50% do efeito inibitório máximo;

IPE: Interaction Pharmacophore Elements (Elementos de interação farmacofórica);

LCAO: Linear Combination of Atomic Orbitals;

LQTA-QSAR: Laboratório de Quimiometria Teórica e Aplicada – QSAR;

LUMO: Lowest Unoccupied Molecular (Orbital molecular mais baixo desocupado);

np: Não-polar;

MBPT: Many Body Perturbation Theory (Teoria de perturbação de muitos corpos);

MM: Massa Molecular;

Mor03e: Sinal 03 dos descritores 3D-MoRSE ajustado pela eletronegatividade atômica

de Sanderson;

Mor03u: Sinal 03 dos descritores 3D-MoRSE;

Mor12e: Sinal 12 dos descritores 3D-MoRSE ajustado pela eletronegatividade atômica

de Sanderson;

Mor12u: Sinal 12 dos descritores 3D-MoRSE;

Mor17u: Sinal 17 dos descritores 3D-MoRSE;

Page 18: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

LISTA DE ABREVIATURAS

Mor19u: Sinal 06 dos descritores 3D-MoRSE;

Nall: Number of All Atoms (including H atoms) (Número de todos os átomos (incluindo

átomos de hidrogênio);

OMS: Organização mundial de saúde;

OPS: Ordered Predictors Selection (Seleção por preditores ordenados);

p+: Polar Positivo;

p-: Polar Negativo;

PCA: Principal Component Analysis (Análise de componentes principais);

PlI: Platt Index (Índice Platt);

PLS: Partial Least Square (Quadrados mínimos parciais);

Pol3D: Polarizabilidade eletrônica 3D;

Q2

LNO: Coeficiente de correlação da validação cruzada leave-N-out;

Q2LOO: Coeficiente de correlação da validação cruzada leave-one-out;

QSAR: Quantitative Structure-Activity Relationship (Relações estrutura-atividade

quantitativa);

R2: Coefficient of Multiple Determination (Coeficiente de determinação múltipla);

R2

pred: Coeficiente de correlação da validação externa;

RA: Relative Activity (Atividade relativa);

RB%: Percentage of Rotatable Bonds defined as ratio: RB%=RBC/BC (Porcentagem

de ligações rotativas definidas como média: RB%=RBC/BC);

RBC: Rotatable Bond Count (number of bonds between non-H atoms possessing free

rotation) (Contagem de ligações rotativas (número de ligações entre átomos não-H

apresentando rotações livres));

RdI: Randic Index (Índice de Randic);

RHF: Restricted Hartree-Fock;

ROHF: Restricted open-shell Hartree–Fock;

RR: O somatório de contribuições particulares para o Score, ponderada por meio de

cargas atômicas das posições de substituintes;

RR2: O somatório de contribuições particulares para o Score, ponderada por meio de

valores absolutos de cargas atômicas;

SA: Índice de tamanho total / ponderado pelo estado eletrotopológico;

Page 19: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

LISTA DE ABREVIATURAS

Score: Somatório de inúmeros efeitos;

SCS: Somatório de quarto descritores: SCS=CAC+CBC+CCC+RBC;

SEC: Standard Error of Calibration (Erro padrão de calibração);

SEP: Standard Error of Prediction (Erro padrão de predição externa);

SEV: Standard Error of Validation (Erro padrão da validação cruzada leave- one-out);

SPC: Somatório dos componentes das moléculas de polarizabilidade:

STO: Slater Type Orbitals (Orbitais do tipo Slater);

UHF: Unrestricted Hartree–Fock;

VL :Variáveis Latentes;

VvdW: Volume de van der Waals;

ZORA: Zero Order Relativistic Approximation (Aproximação Regular de Ordem

Zero);

WHIM: Weighted Holistic Invariant Molecular index.

Page 20: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

SUMÁRIO

1. Introdução 21

1.1. Malária - um problema mundial 21

1.2. O ciclo da malária 24

1.3. Agentes Quimioterápicos 25

1.3.1. Artemisinina 26

1.4. Relações Quantitativas entre Estrutura Química e Atividade Biológica

(QSAR, Quantitative Structure Activity Relationships)

34

1.5. Descritores Moleculares 35

1.6. Modelos Teóricos em Química Quântica 43

1.6.1. Conjuntos de Base 47

1.7. A Quimiometria empregada em estudos de QSAR 50

1.7. 1. Análise por Componentes Principais 52

1.7. 2. Regressão por Quadrados Mínimos Parciais 53

1.7. 3. Validação de modelos QSAR 54

2. Objetivos 57

2.1. Objetivo Geral 57

2.2. Objetivos Específicos 57

3. Metodologia 58

4. Resultados e Discussão 76

4.1. Conclusões parciais para o estudo de QSAR-2D 136

4.2. Estudo de QSAR-4D 138

4.3. Proposição e predição possíveis candidatos a antimaláricos 163

4.4. Conclusões parciais para o estudo de QSAR-4D 165

5. Conclusões Finais 166

6. Referências 168

Anexos 187

Page 21: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

21

Capítulo 1 Introdução

Universidade Estadual de Campinas

1.1. Malária - um problema mundial

A malária é uma doença parasitária, considerada enfermidade negligenciada que,

desde a antiguidade, causa problemas sociais e econômicos no mundo. Em número de mortes

é superada somente pela Aids.

A etimologia do termo malária é o italiano mal aria( ar ruim ou nocivo) e a do

termo paludismo, outra denominação para a doença, é o latim palus (pântano). Há outras

designações para a malária, tais como impaludismo, sezão, maleita, febre palustre, febre

intermitente, febre terçã benigna e febre terçã maligna [1-3].

Segundo a Organização Mundial de Saúde (OMS) [4], a endemia ocorre em 95

países e territórios, ou seja, 3,2 bilhões de pessoas convivem com os riscos de contágio (Figura

1). Aproximadamente 214 milhões de pessoas ao redor do mundo estão infectadas estimando-

se em 438.000 os casos de óbitos por ano. As pessoas que vivem nos países mais pobres são as

mais vulneráveis. Entre as áreas consideradas de risco, estão: as Américas Central e do Sul,

África, Índia, Sudeste da Ásia, Oriente Médio e Oceania. O quadro epidemiológico da malária

no Brasil é preocupante e a transmissão está basicamente restrita aos estados da Amazônia

Legal (Figura2) que compreende Acre, Amapá, Amazonas, Maranhão, Mato Grosso, Pará,

Rondônia, Roraima e Tocantins.

Figura 1. Distribuição mundial da malária. Adaptado da referência [4].

Page 22: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

22

Capítulo 1 Introdução

Universidade Estadual de Campinas

Figura 2. Distribuição da malária no Brasil. Adaptado da referência [5].

A doença é causada por protozoários do gênero Plasmodium que foram

descobertos por Charles Louis Alphonse Laveran, médico do exército francês, que recebeu o

Prêmio Nobel de Fisiologia ou Medicina pelo seu trabalho, em 1907 [6]. Somente quatro de

aproximadamente 100 espécies desses protozoários são responsáveis por infectar seres

humanos: P. falciparum, P. vivax, P. malariae e P. ovale [4-7]. A doença é transmitida ao

homem por fêmeas de mosquitos do gênero Anopheles (Figura 3) infectadas. Os machos não

são responsáveis em transmitir a malária; eles alimentam-se apenas de fluídos de plantas e

flores.

O protozoário é transmitido ao homem pelo sangue, por meio da picada da fêmea

do mosquito infectada. Entretanto, há casos em que o contágio é dado a partir do sangue de

uma pessoa infectada em contato com o de outra sadia. Por exemplo, durante uma transfusão

de sangue, como compartilhamento de seringas (consumidores de drogas) ou, ainda, da mãe

para o feto.

Page 23: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

23

Capítulo 1 Introdução

Universidade Estadual de Campinas

Figura 3. Mosquito do gênero Anopheles. Adaptado da referência [7].

O P. falciparum é encontrado em regiões tropicais e subtropicais, sobretudo na

África onde há o predomínio da espécie. Sua multiplicação muito rápida pode levar a uma

enorme perda de sangue e, consequentemente, ocasionar uma grave anemia. Outro agravante

ocorre quando o parasita infectado obstrui os vasos sanguíneos do cérebro, causando a morte

do paciente. Esta forma de malária (cerebral) é considerada o tipo mais grave da doença. O P.

vivax é encontrado na Ásia, América Latina e em algumas partes da África. Causa uma forma

de malária terçã menos grave do que aquela causada pelo P. falciparum, a terçã benigna. As

formas eritrocitárias podem ser recidivas por muitos anos. O P. malarie é responsável pela

forma quartã, com casos da doença registrados no mundo inteiro. O P. ovale predomina,

quase que exclusivamente, na África sendo responsável pela forma terçã da doença, assim

como o P. vivax.

O desenvolvimento das manifestações clínicas da malária ocorre de acordo com o

gênero de Plasmodium. A infecção possui uma variedade de sintomas, que podem ser

categorizados como malária não complicada e malária severa [8]. Os primeiros sintomas

podem ser percebidos logo após o período de incubação, que varia de 7 a 30 dias.

Os sintomas mais comuns são compreendidos por uma combinação de febre,

aumento do baço e do fígado, arrepios, suores, dores de cabeça, náuseas, vômitos e dores

articulares. As manifestações da malária grave incluem sintomas como complicação

neurológica (convulsões, coma, entre outros), anemia grave (em função da destruição das

hemácias), insuficiência renal, icterícia, edema pulmonar, hipoglicemia entre outros. As

Page 24: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

24

Capítulo 1 Introdução

Universidade Estadual de Campinas

maiores complicações encontram-se no grupo de risco, compreendido por crianças com idade

inferior a 5 anos e por mulheres que encontram-se em estado gestacional.

1.2. O ciclo da malária

O ciclo de vida do parasita da malária (Figura 4) envolve dois hospedeiros꞉ o

mosquito Anopheles e o homem [9-15].

Figura 4. Ciclo de vida do parasita da malária que envolve os dois hospedeiros, o

mosquito Anopheles e o homem. Adaptado da referência [16].

O primeiro ciclo tem início a partir da ingestão de gametócitos de um indivíduo

contaminado pelo mosquito. No aparelho digestivo do mosquito, os gametócitos são

transformados em gametas e são fecundados originando o zigoto. Este ultrapassa a parede do

estômago e torna-se uma célula-ovo, denominada de oocisto, que se rompe liberando outros

esporozoítas. Após serem liberados, os esporozoítas se deslocam para as glândulas salivares do

mosquito e assim podem infectar outro indivíduo e dar início ao ciclo de vida do parasita no

homem.

O mosquito Anopheles fêmea, enquanto alimenta-se (de sangue), introduz na

corrente sanguínea do homem, por meio de saliva, uma forma ativa do Plasmodium,

denominada de esporozoítas. Assim que alcançam a corrente sanguínea, os esporozoítas

instalam-se nas células parenquimatosas do fígado. Este processo leva em torno de 30 minutos

Page 25: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

25

Capítulo 1 Introdução

Universidade Estadual de Campinas

e eles permanecem nas células do fígado por um período de 10 a 14 dias, onde se multiplicarão

por reprodução assexuada dando origem aos esquizontes teciduais, que posteriormente

resultarão em uma fase evolutiva denominada merozoíta. Esta primeira fase do ciclo é

denominada exo-eritrocítica (pré-eritrocítica).

O ciclo eritrocítico, por sua vez, inicia-se quando os merozoítas penetram nos

eritrócitos da circulação e formam parasitas intracelulares móveis, os trofozoítas. O rápido

crescimento e a divisão por esquizogonia constituem outra fase de multiplicação dos

merozoítas, até que sejam liberados na circulação após ruptura do eritrócito, para em seguida

invadirem novos eritrócitos iniciando um novo ciclo. Alguns merozoítos penetram nas

hemácias transformando-se em gametócitos, que são formas infectantes para o mosquito e que

darão continuidade à propagação da doença.

Nos homens, os parasitas da malária digerem mais de 70% da hemoglobina

produzindo a globina e o heme [17]. A globina é digerida pelo parasita e usada como fonte de

aminoácidos para a síntese de suas próprias proteínas. O heme proveniente da hemoglobina é

tóxico para o parasita, que o converte no pigmento malarial. Neste processo, o parasita é

destoxificado ao polimerizar o heme, com o auxílio da enzima heme polimerase, produzindo o

pigmento da malária (hemozoína).

1.3. Agentes Quimioterápicos

Nos dias atuais, os agentes antimaláricos têm origem em produtos naturais ou

compostos sintéticos. Esses fármacos são específicos para cada etapa do ciclo de vida [18] do

Plasmodium e são classificados em:

Eritrocíticos que são aqueles que atuam nas formas presentes nos eritrócitos do

homem.

Gametocíticos, que matam as formas sexuadas do parasita (gametócitos) de um

indivíduo infectado, de forma que quando esse é picado por outro mosquito se evita a

transmissão da doença para o inseto e, assim, a disseminação da doença para outras

pessoas.

Esporonticidas que são aqueles que agem contra os esporozoítos e são capazes de

matar os parasitas assim que eles entram na corrente sanguínea, após a picada do

mosquito, ou ainda destruí-los quando são liberados pelos esquizontes hepáticos ou

sanguíneos.

Page 26: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

26

Capítulo 1 Introdução

Universidade Estadual de Campinas

É importante salientar que os fármacos antimaláricos podem atuar contra mais de

uma forma do protozoário e serem efetivos contra uma espécie, mas totalmente ineficazes

contra outras. Entre os agentes quimioterápicos estão a quinina, cloroquina, mefloquina e a

artemisinina.

A quinina foi o primeiro fármaco utilizado no combate à malária. Este alcalóide

quinolínico, extraído do gênero Cinchona, está presente em árvores originárias das Américas

do Sul e Central. A quinina foi isolada, em 1820, por Pelletier e Caventou [19,20] e foi

sintetizada em 1945 por Woodward e Doering. Este esquizonticida sanguíneo é eficaz contra

as formas eritrocitárias do P. falciparum, P. vivax, P. malariae e P. ovale. Entretanto, não

apresenta efeito eficaz sobre as formas exo-eritrocitárias e nem tão pouco sobre os

gametócitos do P. falciparum.

A cloroquina foi descoberta em 1934 pelo pesquisador alemão Hans Andersag.

No entanto, o reconhecimento como antimalárico só ocorreu após a segunda guerra mundial,

em 1946 [21]. Acredita-se que o mecanismo de ação da cloroquina esteja associado à inibição

da polimerização do heme em hemozoína [22]. A resistência ao fármaco é ocasionada pela

diminuição da concentração de cloroquina intracelular no vacúolo digestivo do parasita

[23,24].

A mefloquina foi desenvolvida pelo exército dos Estados Unidos, por volta de

1970. O mecanismo de ação da mefloquina é similar ao da quinina e cloroquina inibindo a

heme polimerase. Os efeitos adversos ocasionados pelo medicamento são náuseas, vertigens,

confusões, insônia, entre outros [25].

Os agentes quimioterápicos convencionais têm diminuído sua efetividade, devido

o aumento da resistência do P. Falciparum a esses medicamentos, ocasionando desta forma

uma ameaça ao controle da malária. Com base nisto, a Organização Mundial da Saúde

determinou prioritário o desenvolvimento de esquizonticidas sanguíneos de ação rápida para o

tratamento da malária grave e/ou complicada e para o controle das cepas multi-resistentes de

P. falciparum.

1.3.1. Artemisinia

A artemisinina e seus análogos constituem uma nova classe de antimaláricos que

tem apresentado um efeito significativo para o tratamento da malária [26-28]. Extraída de

uma planta oriental, denominada qinghao, ela foi utilizada por mais de 2.000 anos na

medicina chinesa tradicional com a finalidade de "controlar e reduzir as febres". Em 1967, o

Page 27: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

27

Capítulo 1 Introdução

Universidade Estadual de Campinas

Governo da República Popular da China iniciou o programa de identificação de princípios

ativos de plantas que apresentassem atividade antimalárica. Em 1971, pesquisadores do

Instituto Farmacêutico da Academia de Medicina Chinesa Tradicional divulgaram que

extratos de quinghao eliminavam o P. berghei em ratos, e o P. cynomolgi em primatas. Em

1972, os mesmos pesquisadores isolaram e identificaram das folhas da Artemisia annua L., o

qinghaosu, atualmente denominado de artemisinina.

A artemisinina (Figura 5) é uma lactona sesquiterpênica com uma ligação

endoperóxido em sua estrutura, que determina um papel essencial na atividade antimalárica,

necessário para a interação com o grupo heme, como sugerido por alguns autores [29].

Estudos demonstraram que compostos que não apresentavam um dos átomos de oxigênio no

anel endoperóxido, como na desoxiartemisinina, ou compostos em que o átomo de oxigênio

foi substituído por um átomo de carbono, como na 1-carba-10 desoxoartemisinina [28],

perderam a atividade antimalárica.

O

O

O

H

OO

CH3

H

21

3

45

5a6 7

88a

910

11

1212a13

H3C

CH3

HH

Figura 5. Estrutura molecular 2D e 3D da artemisinina.

As rotas de administração têm sido o foco de inúmeros estudos, a fim de verificar a

toxicidade, a farmacocinética e a eficácia de tais agentes quimioterápicos. A rapidez de ação

da artemisinina e seus análogos, praticamente isentos de efeitos colaterais. os colocam entre

as mais importantes e estudados agentes quimioterápicos da atualidade.

A artemisinina elimina os parasitas tanto in vitro quanto in vivo, mais rapidamente

que outros antimaláricos, além de inibir processos metabólicos como glicólise, síntese de ácido

nucléico e de proteínas [30,31].

No estágio eritrocitário a hemoglobina presente no hospedeiro é levada até o

vacúolo alimentar do parasita para ser digerida, formando dois produtos: uma porção proteica,

Page 28: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

28

Capítulo 1 Introdução

Universidade Estadual de Campinas

a globina, e um complexo ferro-porfirina, o grupo heme. Meshnick et al [32] demonstraram

que o grupo heme no interior do parasita (Fe+2

) pode ser o responsável por ativar a

artemisinina. O mecanismo de ação sugere a redução do anel endoperóxido levando à

formação de radicais de oxigênio por meio de um estresse oxidativo nos eritrócitos infectados,

ou à formação de radicais de carbono provenientes da artemisinina que agem como agentes

alquilantes de proteínas do parasita. Os radicais livres formados inibem diversos componentes

essenciais ao parasita levando-o, assim, à morte [33,34].

Várias hipóteses foram sugeridas para a interação entre o grupo heme e a

artemisinina (Figura 6). A figura mostra, também, a estrutura do heme, onde o átomo de Fe+2

se encontra no estado de oxidação +2 e os propionatos, na forma iônica. Trabalhos como os de

Jefford C. W. et al. [35], Tonmunphean S. et al [36], Costa M. S. et al. [37], Srivastava M. et

al. [38], Ferreira et al [39] sugeriram que o ferro do grupo heme ataca o anel endoperóxido na

posição O1.

Figura 6. Mecanismo de ação da artemisinina considerando a interação do O1 com o Fe do

grupo heme.

Quando o ferro do heme ataca a artemisinina ou seus derivados na posição O1

ocorre a formação de um radical livre na posição O2. Há a quebra da ligação carbono-

carbono, C3-C4, originando um carbocátion na posição C4. Segundo os estudos realizados, o

radical livre C4 é essencial à atividade antimalárica [40,41]. O mecanismo de ação mais

aceito envolve a formação do complexo de transição, por intermédio dos átomos de ferro e O1

O

O

O

H

OOCH3

H

H

123

CH3

4

Fe2+

O

O

O

H

O

CH3

H

H

1

3

CH3

4

Fe (III)

O

HH

AcO

O

O

H

O

H

H

1

CH3

4

Fe (III)

H

.

AcO

O

O

H

H

H

CH3

H

.

O

3A

3B

3C

Artemisinina

Page 29: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

29

Capítulo 1 Introdução

Universidade Estadual de Campinas

do endoperóxido. Essa posição é determinada por interações estereoeletrônicas que interferem

no rearranjo do complexo até o rompimento da ligação Fe-O.

A descoberta e o desenvolvimento de agentes terapêuticos potenciais ocorrem nos

dias atuais de forma multidisciplinar. A química medicinal é uma disciplina da farmácia, da

qual participam especialistas nas mais diversas áreas visando o desenvolvimento de fármacos

e a obtenção de candidatos a fármacos que sejam mais seletivos, ou seja, mais potentes e

menos tóxicos (com efeitos menos adversos). Além disto, esta equipe de especialistas se

dedica ao entendimento do modo de interação dos fármacos ao nível molecular,

estabelecimento de medidas de previsão envolvendo relações entre estruturas químicas e as

respectivas atividades biológicas e ao estudo de seus metabolismos.

O planejamento de fármacos auxiliado por computador (Computer-Assisted Drug

Design, CADD) [42-45] envolve uma variedade de técnicas computacionais para descobrir,

planejar e otimizar agentes terapêuticos potenciais. As estratégias do CADD variam

dependendo das informações disponíveis sobre a biomacromolécula alvo (receptor/enzima) e

os respectivos ligantes. As duas principais estratégias do CADD são os planejamentos direto e

indireto. No planejamento direto, as características tridimensionais do sítio ativo de uma

biomacromolécula alvo conhecida são consideradas (cristalografia de raios-X – pdb

www.rcsb.org; RMN), enquanto que na abordagem indireta, o planejamento é baseado na

análise comparativa de características estruturais de compostos ativos e inativos conhecidos,

que são interpretadas em termos da sua complementaridade com um modelo de sítio ativo de

uma biomacromolécula hipotética.

A busca por relações quantitativas estrutura-atividade biológica (QSAR:

quantitative structure activity relationships) [46,47] é uma abordagem amplamente utilizada

no planejamento de fármacos. O objetivo destes estudos é racionalizar a busca por compostos

com propriedades desejadas utilizando a intuição e o conhecimento químico de uma forma

quantificada e computadorizada.

Foram feitos vários estudos de QSAR envolvendo artemisinina e derivados com

atividade antimalárica. A seguir serão listados apenas os estudos recentes.

No trabalho publicado por Avery et al [ 48] em 2002 foram realizados estudos de

análise comparativa de campos moleculares, CoMFA e holograma QSAR (HQSAR) para uma

serie inicial de 211 análogos da artemisinina com atividade antimalárica. O mapa eletrostático

do modelo CoMFA, representado por poliedros, indica regiões no espaço 3D ao redor desses

análogos que são importantes para a atividade antimalárica. Poliedros em torno das metilas

Page 30: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

30

Capítulo 1 Introdução

Universidade Estadual de Campinas

dos carbonos 3 e 9, e do hidrogênio na posição 7 da artemisinina sugerem que o aumento do

volume estérico nessas regiões poderia aumentar a atividade. Poliedros que aparecem ao redor

do anel endoperóxido sugerem que o aumento do volume prejudica a atividade biológica.

Poliedros são visualizados em regiões onde carga parcial negativa está associada ao aumento

da atividade. Esses poliedros são visíveis perto do anel peróxido e do oxigênio ou nitrogênio

nas posições O-11 ou N-11 (Figura 5). Poliedros indicam carga parcial positiva está associada

ao aumento da atividade e podem ser correlacionadas com a interação lipofílica.

Um novo estudo de QSAR foi realizado por de Pinheiro et al [49] em 2003, no

qual foram empregados métodos de química quântica e regressão por mínimos quadrados

parciais PLS para dezenove análogos da artemisinina com substituições nas posições C9 e

C10. Os autores fizeram estudos de gráficos moleculares e docking molecular. Cinco

descritores foram selecionados por meio das analises de Análises por Componentes Principais

(PCA) e Agrupamentos Hierárquicos (HCA): A energia do orbital molecular desocupado de

menor energia (LUMO+1), cargas atômicas nos átomos C9 (Q9) e C11 (Q11), o número

máximo de átomos de hidrogênios que devem interagir com o heme (NH) e a distribuição da

função radial centrada na distância Interatômica de 3Å ponderadas pelas massas atômicas

(RDF030m). Os compostos altamente ativos têm maiores contribuições do LUMO+1 e do

NH, cargas mais negativas Q9 e Q11e menor contribuição de RDF030m. Cálculos

moleculares de docking revelaram que a região polar da artemisinina (ligação peróxido e

carbonila) interage por meio de uma interação polar com um dos grupos propionato do heme

(parte polar). O método PLS usado para predizer a atividade de dez novos compostos que

podem ser considerados candidatos potenciais a fármacos.

Srivastava et al [50] realizou estudos de QSAR para um conjunto de 194

compostos incluindo as desoxiartemisininas, secoartemisininas, derivados derivados da

artemisinina com substituição no carbono 10, azaartemisininas entre outras. Foram calculados

diversos descritores como: topológicos, termodinâmicos, eletrônicos, espaciais, estruturais e

físico-químicos. A seleção de variáveis foi feita de maneira sistemática e incluindo algoritmo

genético. Modelo estatisticamente significativo foi obtido com descritores como índice de

conectividade molecular, índice de estado de energia, razão comprimento--largura, coeficiente

de partição octanol/água calculado pelo algoritmo MlogP, energias do orbital molecular

ocupado de maior energia (HOMO), densidade eletrônica, índice topológico de Balaban e

energia de deformação das moléculas.

Page 31: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

31

Capítulo 1 Introdução

Universidade Estadual de Campinas

Cardoso et al [51 ] utilizou métodos de análise multivariada (PCA, HCA e PLS)

para discriminar quatorze compostos com diferentes substituições na posição C10 em duas

classes: compostos mais ativos e menos ativos. Os compostos mais ativos têm maiores

contribuições dos descritores꞉ área superficial total (TSA) e diferença máxima

eletrotopologica positiva, (MAXDP) enquanto, os menos ativos têm maiores contribuições da

energia do orbital molecular desocupado de menor energia desocupado LUMO+1, carga

atômica no C10 (Q10) e ângulo de ligação formado pelos átomos O1, C12a e C12 (A5). Esses

resultados estão em contradição com a referência [49]. O modelo de regressão PLS proposto

pelos autores indica corretamente que com o aumento da atividade biológica os valores de

LUMO+1 sofrem acréscimo. O modelo PLS proposto foi aplicado para prever atividade

antimalárica de onze novos compostos. Os compostos mais ativos tem uma região de

potencial negativo de forma similar e próximo do anel endoperóxido podendo ser visualizado

no mapa de potencial eletrostático, MPE.

O mesmo grupo [52] publicou no ano seguinte um estudo formado pela

artemisinina e vinte derivados com diferentes substituintes na posição do átomo C10. Foram

construídos Mapas de Potencial Eletrostáticos para identificar as principais características que

favorecem a atividade biológica e usar essas características para propor novos derivados da

artemisinina. O método de regressão multivariada PLS foi empregado para gerar um modelo

preditivo. Foram selecionados os seguintes descritores: energia do orbital molecular ocupado

de maior energia do HOMO, carga atômica no átomo O1 (Q1), carga atômica no átomo C3

(Q3), volume molecular (VOL) e um Índice hidrofílico (HYF). O modelo PLS mostrou

significância estatística e revelou que altos valores de energia do HOMO, combinado menor

carga negativa no átomo O1 (Q1), maior carga positiva no átomo C3 (Q3), altos valores para

o Vol e geralmente, baixos valores para HYF aumentam a atividade biológica.

Jamaludin et al [53] realizou estudo de QSAR para um conjunto de 197

compostos entre eles os análogos da artemisinina, desoxiartemisininas, secoartemisininas,

bicicloartemisininas, azaartemisininas, dihidroartemisininas, entre outras. Descritores

topológicos, geométricos, físico-químicos, índices de conectividade e descritores de carga

foram determinados para este estudo. Os descritores foram selecionados por procedimentos

que incluem o teste zero, análise de correlação e algoritmo genético. Métodos de análise

multivariada (PLS e MLR) foram empregados. Modelos robustos foram obtidos com alta

capacidade de predição interna e externa. A única interpretação feita pelos autores é de que o

anel endoperóxido deve ser responsável pela atividade biológica.

Page 32: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

32

Capítulo 1 Introdução

Universidade Estadual de Campinas

Ferreira et al [54] estudou em 2010 a artemisinina e um conjunto de dezoito

derivados com diferentes substituições nas posições C3 e C9, através de química quântica e

análise multivariada. Mapas de Potencial Eletrostático e docking molecular foram usados para

investigar a interação entre o ligante e o receptor (heme). Cálculos moleculares de docking

revelaram que Fe2+

ataca preferencialmente O1 da artemisinina ao invés de O2, o que já era

conhecido na literatura [37,49]. Análises PCA e HCA foram empregados para selecionar os

descritores que estão relacionados com a atividade biológica: função de distribuição radial

RDF060e, energia de hidratação (HE) e distância entre o átomo de oxigênio 1 do ligante e o

átomo de ferro do heme, d(FeO1) . Esses descritores são responsáveis por diferenciar os

compostos com alta atividade dos compostos com baixa atividade biológica. O modelo PLS

revelou que os compostos mais ativos têm altos valores do descritor d(FeO1), baixos valores

de RDF060e e valores mais negativos de HE.

Em 2012 foi publicada uma minirevisão [55] discutindo os principais resultados

publicados da metodologia QSAR para artemisinina e endoperóxidos relacionados. Algumas

considerações são citadas no artigo:

i) um aumento na atividade contra o P. falciparum D-6 pode ser obtida se os

valores de carga nas posições C5a e C8 são mantidos moderadamente positivos, enquanto que

os valores de carga nas posições O2 e O11 são menos negativos. Um aumento na atividade

contra o P. Falciparum W-2 pode ser obtida ao diminuir a densidade eletrônica na posição

O11 enquanto que os valores de carga nas posições O1, C5a e C8 devem ser mantidos

moderados.

ii) a atividade está diretamente relacionada ao comprimento da ligação peróxido,

da ligação O14-C15 e a carga liquida do carbono da carbonila.

iii) compostos que se ligam mais fortemente ao grupo heme possuem distâncias

O-Fe mais curtas e têm maior atividade biológica.

iv) peróxidos com alta atividade antimalárica são caracterizados por um contínuo

potencial eletrônico negativo em volta da molécula.

v) altos valores para a energia do HOMO combinado com uma menor carga

negativa em O1, uma maior carga positiva em C3, maior volume e menor hidrofobicidade

aumentam a atividade antimalárica.

Cristino et al [56] estudou em 2012, dezenove compostos incluindo a artemisinina

e derivados da desoxoartemisinina com substituição na posição C10. Mapas de Potencial

Eletrostáticos indicam que uma superfície próxima ao 1,2,4- anel trioxano sugere que a

Page 33: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

33

Capítulo 1 Introdução

Universidade Estadual de Campinas

artemisinina tem um sítio reativo para ataque eletrolítico e deve possuir atividade

antimalárica. O ataque eletrofílico do íon de Fe2+

do grupo heme contra uma região negativa

dos compostos estudados ocorre através do envolvimento do anel endoperóxido. Estudos de

docking molecular confirmam que o átomo O1 da artemisinina se liga ao íon Fe2+

ao invés do

O2. Este ataque pode ser devido ao maior volume estérico em O2 do que O1 e uma carga

mais negativa nesse último átomo, esses dois fatores são essenciais para a aproximação

intermolecular. Esses resultados já haviam sido confirmados anteriormente pelo mesmo grupo

de pesquisa. Métodos multivariados (PCA, HCA, KNN, SIMCA e SDA) classificaram os

análogos da artemisinina em duas classes: mais ativas (MA) e menos ativas (LA). Os

descritores energia do orbital molecular desocupado de menor energia desocupado (LUMO+),

distância entre o átomo de oxigênio 1 do ligante e o átomo de ferro do heme (DFeO1), Índice

de conectividade média Chi-1 (X1A) e representação molecular da estrutura baseada na

difração de elétron Mor15u foram responsáveis por separar MA e LA. Estas propriedades

representam três classes distintas de descritores: eletrônico (Energia do LUMO), estérico

(DFeO1 e Mor15u) e hidrofóbico (X1A). Os resultados mostram que cinco dos oito

compostos tiveram sua atividade predita como MA.

Estudos de SAR e QSAR da artemisinina e vinte derivados com diferentes

substituições na posição C10 foram realizados em 2014 por Santos et al [57]. Mapas de

Potencial Eletrostáticos e docking molecular foram usados para investigar a interação entre o

ligante e o receptor (heme). Mapas de Potencial Eletrostáticos e docking molecular foram

empregados a fim de compreender a correlação entre a estrutura e atividade biológica, bem

como investigar a interação entre os ligantes (artemisinina e derivados) e o receptor (heme).

Métodos de análises multivariadas (PCA, HCA, PCR, PLS) foram empregados. Cálculos de

docking molecular revelaram que Fe2+

ataca preferencialmente O1 da artemisinina ao invés de

O2. Além disso, o ligante se posiciona paralelamente ao plano do anel porfirínico do grupo

heme (resultados já conhecidos de estudos de docking anteriores). A região polar do anel

peróxido está dirigida para a parte polar do grupo heme que contém o íon Fe2+

.

O mesmo grupo [58 ] realizou em 2015 estudos de SAR para um conjunto de

vinte e um compostos com diferentes substituições na posição C10, incluindo a artemisinina.

A interação entre a artemisinina, seus derivados (ligante) e o heme (receptor) foi estudada

para determinar a melhor geometria para o complexo ligante-receptor. Cálculos de docking

mais uma vez revelaram que Fe2+

ataca preferencialmente O1 da artemisinina ao invés de O2.

Essa preferência pode ser devida ao maior impedimento estérico no átomo O2. Mapas de

Page 34: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

34

Capítulo 1 Introdução

Universidade Estadual de Campinas

Potencial Eletrostáticos (MEP) caracterizaram a região do anel 1,2,13 trioxano como região

de potencial eletrostático negativo.

1.4. Relações Quantitativas entre Estrutura Química e Atividade Biológica (QSAR,

Quantitative Structure Activity Relationships)

Os estudos de QSAR clássico ou QSAR bidimensional (2D) tiveram início com os

trabalhos de Hansch-Fujita [59] e de Free-Wilson [60], na década de 60. Nessa metodologia,

relaciona-se quantitativamente parâmetros estruturais, eletrônicos, termodinâmicos,

hidrofóbicos e estéricos, que chamamos de descritores, com os resultados de uma propriedade

experimental que pode ser a atividade biológica de um determinado conjunto de compostos

análogos.

No final década de 80, ocorreu um grande avanço na área de QSAR com a

introdução dos métodos de QSAR–3D. Uma nova abordagem para o cálculo dos descritores

denominada análise comparativa de campos moleculares, CoMFA (Comparative Molecular

Fields Analysis), foi proposta por Cramer et al [61,62]. Essa metodologia se difundiu

rapidamente e é muito utilizada hoje especialmente para o planejamento de novos fármacos,

tornando-se uma ferramenta fundamental nos estudos QSAR. Nessa nova abordagem, as

moléculas em estudo, após a otimização de geometria, são devidamente alinhadas de acordo

com um farmacóforo comum, derivado do conhecimento da interação fármaco-receptor. Em

seguida, elas são inseridas em uma caixa virtual 3D, como indicado na Figura 7 para um

único composto. A caixa virtual consiste em um espaço cartesiano fixo (com eixos x, y e z) e

tem dimensões que excedem as coordenadas atômicas máximas e mínimas de cada molécula

da série em estudo. A grande vantagem desta metodologia é que a caixa 3D mimetiza o

espaço no sítio ativo do receptor (biomacromolécula alvo).

Figura 7. Representação de uma molécula dentro da caixa virtual tridimensional (3D).

Page 35: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

35

Capítulo 1 Introdução

Universidade Estadual de Campinas

Quase uma década mais tarde surgiu uma nova metodologia, designada por

QSAR-4D e proposta por Hopfinger e colaboradores [63]. Essa metodologia propõe várias

novidades, como a incorporação da liberdade conformacional e de alinhamento, e a

introdução do tempo representando a quarta ―dimensão‖.

Um novo avanço nesta área foi introduzido por Martins et al. [64], com a

proposição do método LQTA-QSAR. (Laboratório de Quimiometria Teórica e Aplicada –

QSAR). Este novo método reúne as principais características dos paradigmas CoMFA,

introduzido por Cramer, e QSAR-4D, proposto por Hopfinger.

1.5. Descritores Moleculares

Conforme Todeschini e Consonni, ―descritor molecular é o resultado final de um

procedimento matemático e lógico o qual transforma informação química codificada dentro

de uma representação simbólica de uma molécula em um número útil ou resultado de algum

experimento padronizado‖ [65]. Por exemplo, os descritores eletrônicos podem ser obtidos a

partir de cálculos mecânico-quânticos e descrevem as propriedades eletrônicas das moléculas,

bem como a influência de certos grupos ou substituintes na densidade de distribuição

eletrônica.

O vetor momento de dipolo, ou momento dipolar é uma propriedade eletrônica

que mede a magnitude da carga deslocada quando átomos de eletronegatividades diferentes

são interligados. A direção desse vetor momento dipolar de uma molécula é obtida com base

nas eletronegatividades relativas dos átomos desta molécula e o seu módulo é obtido pelo

vetor resultante dos momentos de dipolo de cada ligação presente na molécula. A presença de

substituintes com eletronegatividades diferentes modifica as propriedades moleculares como,

por exemplo, a acidez e a basicidade de um composto, de forma que o momento de dipolo

pode ser usado para elucidar dúvidas sobre a sua reatividade.

As energias do orbital molecular ocupado de maior energia (highest occupied

molecular orbital, HOMO) e do orbital molecular desocupado de menor energia desocupado

(lowest unoccupied molecular orbital, LUMO) estão relacionados, respectivamente, com o

caráter elétron-doador e elétron-receptor de um composto. Dessa forma, quanto maior a

energia do HOMO, maior a capacidade elétron-doadora e, quanto menor a energia do LUMO

menor será a resistência para aceitar elétrons.

Page 36: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

36

Capítulo 1 Introdução

Universidade Estadual de Campinas

A diferença de energia entre o LUMO e o HOMO, Gap, é um importante índice

de estabilidade da molécula, pois uma grande diferença entre o LUMO e o HOMO implica

em menor reatividade, ou seja, maior estabilidade da molécula. O Gap também se

correlaciona com a polarizabilidade estática, independe da luz incidente na molécula, pois

quanto menor a diferença de energia entre HOMO e o LUMO maior a facilidade de

polarização da molécula.

A polarizabilidade estática é a medida da tendência de deformação da nuvem

eletrônica de uma molécula quando sujeita a um campo elétrico externo, à presença de um íon

ou dipolo nas proximidades. Em outras palavras, é uma medida da susceptibilidade da

molécula ser polarizada quando sofre uma perturbação externa. A polarizabilidade,

(constante de proporcionalidade entre o campo elétrico e o dipolo induzido), de uma

molécula anisotrópica é descrita por um tensor simétrico (uma matriz 3x3 tal que ij = ji)

com elementos

zzzyzx

yzyyyx

xzxyxx

α . Por exemplo, o elemento xz fornece uma medida do

quanto a molécula é polarizada na direção z quando sujeita a um campo elétrico aplicado na

direção x. O traço do tensor dividido por três representa a parte esférica e, portanto, um

descritor.

O potencial de ionização de um átomo é uma medida da força com que um elétron

está ligado a ele. O primeiro potencial de ionização, PI, é a energia necessária para remover

um elétron de um átomo no estado gasoso (A → A+ + e

-). Baixos valores de potencial de

ionização para compostos ativos podem indicar possíveis mecanismos de transferência de

carga na interação ligante-receptor, assim como também podem indicar que a forma iônica da

substância é a que apresenta atividade biológica.

A afinidade eletrônica ou eletroafinidade é a energia liberada quando um átomo

isolado, no estado gasoso, "captura" um elétron.

As cargas atômicas parciais são fatores importantes, pois influenciam as

propriedades químicas e físicas de uma molécula e correspondem às distribuições de

densidades de carga ou densidades eletrônicas. Dois métodos muito utilizados para o cálculo

de cargas atômicas são os de Mulliken e CHELPG.

A análise populacional de Mulliken [66] é o método mais amplamente utilizado

entre os químicos. A definição de análise populacional sugerida por Mulliken divide com

Page 37: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

37

Capítulo 1 Introdução

Universidade Estadual de Campinas

equidade as densidades eletrônicas entre dois átomos, mesmo que tenham diferentes

eletronegatividades.

O método de cargas derivadas do potencial eletrostático ESP (Electro Static

Potential), ou método CHELPG (Charges from Electrostatic Potential Grid based), foi

proposto por Breneman e Wiberg [67]. Nesse método as cargas atômicas são ajustadas a fim

de reproduzir o potencial eletrostático em uma malha de pontos ao redor da molécula. A

primeira etapa do ajuste consiste em definir um cubo ao redor da molécula, tal que haja um

espaço de 0,3 Ǻ entre a parede do cubo e a molécula nas três dimensões. O potencial

eletrostático é calculado nos pontos da malha (gridpoints) espaçada de 0,03 Ǻ e distribuída

regularmente no cubo. Todos os pontos que caírem dentro do raio de van der Waals da

molécula são eliminados por meio do sistema de ajuste. A única condição exigida é que a

soma de todas as cargas atômicas seja igual à carga total do sistema.

Tanto o tamanho quanto a forma das moléculas e dos grupos substituintes são

essenciais para o processo de reconhecimento e importantes para os estudos de QSAR. O

volume é um descritor estérico considerado importante para a compreensão dos mecanismos

envolvidos na interação entre o ligante e o receptor, bem como nos mecanismos responsáveis

pela atividade biológica. O volume molecular pode ser estimado por meio de cálculos a partir

do raio de van der Waals dos átomos individuais.

Um índice topológico é um descritor numérico da estrutura química baseado em

certas características topológicas do grafo molecular e caracteriza o tamanho e a forma

molecular [68]. A análise topológica de uma molécula inicia com a sua representação em um

grafo molecular que reflete a conexão entre seus átomos. Os descritores topológicos são

obtidos a partir da topologia da molécula e formam um importante conjunto, frequentemente

utilizado em estudos de toxicidade e propriedades biomédicas [69]. Estes parâmetros

químicos foram desenvolvidos utilizando a teoria de grafos [70]. Na teoria dos grafos, as

características geométricas como comprimentos de ligação, ângulos de ligação ou

configurações tridimensionais não são consideradas. No grafo molecular os vértices, ou

pontos, correspondem aos átomos, e as linhas, ou arestas, representam as ligações covalentes

entre os átomos [68]. Os átomos de hidrogênio e suas ligações são desconsiderados fazendo-

se uso apenas do esqueleto molecular [71]. A grande vantagem dos descritores topológicos é

que eles podem ser facilmente codificados e calculados a partir da estrutura 2D. Entretanto,

em muitos casos, eles são difíceis ou mesmo impossíveis de serem interpretados, tornando

difícil propor modificações estruturais a fim de obter compostos com melhores propriedades

Page 38: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

38

Capítulo 1 Introdução

Universidade Estadual de Campinas

ou mesmo contribuir para mecanismo de ação dos compostos em estudo. Os índices de

Wiener e Randic são alguns exemplos de descritores topológicos.

O índice de Wiener [72] foi o primeiro índice de grafo utilizado em estudos

químicos. Sua teoria baseia-se na definição topológica de distância, a qual é definida como a

soma das distâncias topológicas entre todos os pares possíveis de vértices do grafo químico. O

número de Wiener (equação 1) é obtido a partir da metade da soma das menores distâncias

entre dois pontos i e j da matriz de distância.

ij

ijDW2

1 (1)

onde, Dij é a distância entre os dois pontos i e j

Os descritores Randic (RdI) [73] são derivados da matriz de distância geométrica,

D, de uma estrutura. Da matriz D extrai-se a soma das linhas (ou colunas) onde cada elemento

da matriz está elevado à k-ésima potência e o somatório é normalizado para k! resultando no

fator kD. O valor final do descritor corresponde ao somatório de

kD para diferentes potências

k. Este descritor está correlacionado com a forma molecular.

Os descritores 3DMoRSE (Molecule Representation of Structure based on

Electron diffraction) refletem a distribuição em três dimensões (3D) de diferentes

propriedades moleculares e fornecem informações sobre a ramificação das moléculas [74,75].

São exemplos de descritores de MoRSE: o descritor Mor20m (Sinal 20 dos descritores 3D-

MoRSE ajustado pela massa atômica) e o descritor Mor08v (Sinal 08 dos descritores 3D-

MoRSE ajustado pelo volume de van der Walls). Uma descrição mais detalhada desses

descritores será dada no capítulo 5.

Os descritores WHIM (Weighted Holistic Invariant Molecular) [76, 61] são

índices moleculares 3D que simulam diferentes fontes de informações químicas.

Desenvolvidos por Todeschini et al [76-78], eles contêm informações sobre a forma, simetria

e a distribuição atômica na molécula.

Estes índices são calculados a partir das coordenadas x, y, z de uma estrutura

geométrica 3D da molécula, usualmente de uma conformação espacial de energia mínima.

L2u (2a componente direcional do índice WHIM) é um exemplo desse descritor.

Os descritores provenientes da abordagem de QSAR-3D [61,62] são as energias

dos campos moleculares 3D gerados por sondas (eletrônica, estérica, hidrofóbica e de ligação

de hidrogênio, dentre outras) e nos dão informação das possíveis interações de cada ligante

Page 39: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

39

Capítulo 1 Introdução

Universidade Estadual de Campinas

(molécula em estudo) com o receptor. As energias de interação eletrostática e estereoquímica

entre as moléculas e as sondas virtuais são calculadas em cada ponto de interseção da grade

tridimensional. Esta etapa só termina quando todos os pontos da grade foram percorridos pela

sonda. Cabe mencionar que cada ponto da grade virtual dá origem a dois descritores de

campo: um referente à interação eletrostática e o outro à interação estérica.

No formalismo 4D [63] os descritores não são originados dos campos moleculares

determinados em cada ponto da caixa 3D virtual. Ao invés, são feitos cálculos de dinâmica

molecular (DM) dos ligantes a fim de obter uma amostragem de conformações para cada

composto. As conformações determinadas durante a simulação de DM de cada ligante

compõem o perfil da amostragem conformacional (conformational ensemble profile, CEP).

Cada conformação do CEP de um determinado ligante, é então, inserido na caixa

tridimensional virtual para o cálculo dos descritores. Essa metodologia não adota os

descritores de campo, mas propõe um novo tipo de descritores, que são ―de ocupação‖ e

denominados GCODs (grid cell occupancy descriptors). Estes descritores da célula de

ocupação são gerados para um número de diferentes classes de átomos, chamados elementos

de interação farmacofórica (Interaction Pharmacophoric Elements, IPEs). Assim sendo, os

átomos de cada molécula do conjunto de treinamento serão classificados de acordo com o tipo

de interação que eles sejam capazes de realizar com o receptor. As sete classes de IPEs são:

polar positivo (p+), polar negativo (p-), não-polar (np); doador de ligação de hidrogênio

(Hbd), aceptor de ligação de hidrogênio (Hba), aromático (ar) e qualquer tipo de átomo (any

ou a). Estes descritores de ocupação das células da grade espacial são usados como conjunto

de descritores para construir os modelos de QSAR-4D.

No método LQTA-QSAR [64], o cálculo de descritores 3D considera o perfil de

amostragem conformacional, CEP, obtido a partir de cálculos de dinâmica molecular para

cada composto como proposto por Hopfinger, ao invés de uma única conformação como no

método CoMFA. Por outro lado, eles são descritores de campo como no método CoMFA e

não de ocupação. Inicialmente são realizadas simulações de dinâmica molecular empregando

o programa GROMACS [79], a fim de gerar o perfil conformacional ,CEP, para cada ligante.

As simulações de dinâmica molecular podem ser realizadas considerando moléculas de

solvente explícito que é a melhor aproximação do meio biológico.

O programa GROMACS fornece informações a respeito de coordenadas atômicas

e topologias. As coordenadas são armazenadas em arquivos com a extensão ―gro‖. Por sua

vez, as cargas atômicas e os diferentes tipos de sondas empregadas para calcular as energias

Page 40: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

40

Capítulo 1 Introdução

Universidade Estadual de Campinas

de Coulomb e van der Waals são obtidos do arquivo de topologia (―top‖ou ―tip‖) criados em

um servidor PRODRG [80]. Cabe mencionar que o programa GROMACS utiliza um banco

de dados interno que contém parâmetros de reconhecimento apenas para aminoácidos, ácidos

nucléicos e alguns lipídios. Dessa forma, não é possível parametrizar moléculas que não

estejam enquadradas nas classes mencionadas anteriormente e por este motivo se faz

necessário o uso do servidor PRODRG.

No módulo LQTAgrid do programa LQTA-QSAR, o usuário define as

coordenadas iniciais, bem como o tamanho das células da caixa virtual (3D) e os descritores de

campo são calculados, como no método CoMFA.

Cada átomo de prova (sonda) selecionado pelo usuário percorre, uma a uma, todas

as células da grade virtual e as propriedades de caráter 3D, eletrônicas e estereoquímicas são

determinadas para cada ponto da grade para cada conformação de cada composto. As energias

de interação (que são na realidade os descritores, são definidas de acordo com os potencias de

Coulomb (eq. 2) e de Lennard-Jones (eq. 3).

ij

jiele

r

qq

nE

04

1

(2)

6

)6(

12

)12(

ij

ij

ij

ijvdW

r

C

r

CE (3)

onde2

1)12()12()12( 1

jjiiij xCC

nC e

21

)6()6()6( 1

jjiiij xCC

nC .

Nas equações 2 e 3, qi é a carga do i-ésimo átomo de prova; jq é a carga do j-ésimo átomo do

CEP; 0 é a constante de permissividade do vácuo; )12(

iiC , )6(

iiC , )12(

jjC e )6(

jjC são parâmetros

adaptados do campo de forca Gromos ffG43a1 [81].

O arquivo de saída dos cálculos feitos no programa LQTAgrid é uma tabela

contendo duas colunas com valores de energia para cada ponto da grade (descritores) e cada

linha corresponde a um determinado ligante da série.

Nessa tese, foram feitos dois tipos de estudo QSAR. Para o estudo de QSAR-4D,

foram considerados os descritores de campo definidos pela metodologia LQTA-QSAR.

Lembre-se que são descritores de campo que consideram o CEP e não apenas uma

conformação.

Page 41: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

41

Capítulo 1 Introdução

Universidade Estadual de Campinas

No estudo de QSAR 2D, os descritores empregados foram determinados por meio

dos programas MARVIN [82], E-DRAGON 1.0 [83] e GAUSSIAN [84]. Além disso, o

descritor SCORE foi proposto especificamente para este trabalho e calculado manualmente.

SCORE é um descritor "a priori‖ [85], que significa aquele que é obtido antes da utilização do

computador. Para obter este descritor, usa-se somente fórmulas (esquemas de estruturas 2D),

algumas constantes e outras informações numéricas encontradas na literatura especializada,

sobre os compostos ou estruturas moleculares. Esse descritor relaciona os valores numéricos

das atividades biológicas com as diversas mudanças estruturais presentes nos análogos e

derivados, a partir do fármaco de referência. Suas contribuições serão definidas e descritas no

capítulo 4.

A Tabela 1 descreve os descritores calculados pelos programas MARVIN [82] e E-

DRAGON 1.0 [83] utilizados no estudo QSAR-2D.

Page 42: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

42

Capítulo 1 Introdução

Universidade Estadual de Campinas

Tabela 1. Descritores calculados a partir dos programas MARVIN e E-DRAGON 1.0, para o

conjunto de 180 análogos de artemisinina.

Descritores Definição Classe

POL Polarizabilidade eletrônica Eletrônico

SA Índice de tamanho total / ponderado pelo estado

eletrotopológico

Eletrônico

Nall Número de todos os átomos (incluindo átomos de

hidrogênio).

Topológico

Pol3D Polarizabilidade eletrônica 3D. Eletrônico

APYY componente YY da polarizabilidade molecular Pol3D. Topológico

VvdW Volume de van der Waals (vdW). Estérico

ASA Representação poliédrica que é usada para cada átomo no

cálculo da área superficial.

Geométrico

ASA+ Área superficial de todos os átomos com carga positiva

parcial (estritamente maior que 0).

Geométrico

ASA_H Área superficial acessível ao solvente de todos os átomos

hidrofóbicos

Geométrico

BC Número de ligações entre átomos de não-H. Topológico

CAC Número de átomos de não-H formando cadeias. Topológico

CBC Contagem de ligações de cadeias. Topológico

RBC Contagem de ligações apresentando rotações livres. Topológico

PlI Índice Platt (número de pares de linhas adjacentes em um

grafo).

Topológico

RdI Índice de Randic. Topológico

RB% Porcentagem de ligações livres definida como:

RB%=RBC/BC

Topológico

SCS Somatório de quarto descritores:

SCS=CAC+CBC+CCC+RBC

Topológico

RR O somatório de contribuições particulares ponderadas por

meio de cargas atômicas das posições de substituintes.

Topológico

RR2 O somatório de contribuições particulares para o SCORE,

ponderada pelos valores absolutos de cargas atômicas.

Topológico

Page 43: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

43

Capítulo 1 Introdução

Universidade Estadual de Campinas

Tabela 1(continuação). Descritores calculados a partir dos programas MARVIN e E-

DRAGON 1.0, para o conjunto de 180 análogos de artemisinina.

Descritores Definição Classe

CIC0 Índice de conteúdo complementar de Informação

(simetria de vizinhança de ordem - 0).

Topológico

CIC1 Índice de conteúdo complementar de Informação

(simetria de vizinhança de ordem - 1).

Topológico

SPC SPC=APXX+APYY+APZZ

APXX, APYY e APZZ são as componentes XX, YY e

ZZ da polarizabilidade molecular Pol3D, respectivamente

Topológico

Mor03u Sinal 03 dos descritores 3D-MoRSE. 3DMoRSE

Mor12u Sinal 12 dos descritores 3D-MoRSE. 3DMoRSE

Mor17u Sinal 17 dos descritores 3D-MoRSE. 3DMoRSE

Mor19u Sinal 06 dos descritores 3D-MoRSE. 3DMoRSE

Mor03e Sinal 03 dos descritores 3D-MoRSE ajustado pela

eletronegatividade atômica de Sanderson.

3DMoRSE

Mor12e Sinal 12 dos descritores 3D-MoRSE ajustado pela

eletronegatividade atômica de Sanderson.

3DMoRSE

H3u Matriz de autocorrelação H entre átomos separados por 3

ligações.

3DMoRSE

C-003 Número de subfragmentos moleculares CHR3, ou

átomos de carbono terciários.

Topológico

1.6. Modelos Teóricos em Química Quântica

Um dos objetivos da química é esclarecer o modo como os átomos se combinam

para formar as moléculas, bem como predizer as reações que podem ocorrer entre átomos e

moléculas, incluindo constantes de velocidades e de equilíbrio, propriedades termodinâmicas,

entre outros. A Modelagem Molecular, que engloba o uso de uma série de métodos

computacionais, se tornou uma área importante da química devido ao alto desempenho

apresentado pelos computadores nas últimas décadas.

Segundo a modelagem molecular é possível concatenar todas as propriedades

moleculares relevantes, tais como estabilidade, reatividade e propriedades eletrônicas, com a

Page 44: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

44

Capítulo 1 Introdução

Universidade Estadual de Campinas

estrutura molecular. A estrutura eletrônica de um composto químico, por exemplo, gera

informações que permitem determinar não somente propriedades físico-químicas, mas

também a sua atividade biológica.

Os métodos de química computacional podem ser classificados em: métodos de

campo de força (baseados em mecânica molecular) e métodos quânticos (baseados na teoria

dos orbitais moleculares), sendo estes últimos compreendidos pelos métodos semiempíricos e

os métodos ab initio. Os métodos de campo de força são baseados na mecânica clássica onde

a ligação química é simbolizada por modelos simples do tipo massa-mola e a estrutura

eletrônica é desconsiderada. Os métodos quânticos têm por finalidade resolver a equação de

Schrödinger não-relativística, independente do tempo, para um sistema multieletrônico

empregando uma série de aproximações. A principal delas é a Aproximação de Born-

Oppenheimer que desacopla os movimentos eletrônicos dos nucleares [86]. Desse modo, a

função de onda total, Ψtotal, passa a ser escrita como um produto das funções de onda

eletrônica, Ψel, e nuclear, Ψnuclear, (Ψtotal= ΨelΨnuclear), sendo que a função Ψel é determinada

mediante a solução da parte eletrônica da equação de Schrödinger. Essas soluções podem ser

parametrizadas, usando alguns resultados experimentais como calor de formação, potencial de

ionização, geometria, entre outros, dando origem aos chamados métodos semiempíricos [87].

Em contrapartida, para os métodos ab initio (do latim, do começo) unicamente constantes

fundamentais como a massa e a carga do elétron, a constante de Planck, entre outras, são

usadas para resolver a equação de Schrödinger eletrônica independente do tempo [88].

Comumente, há dois tipos de métodos de estrutura eletrônica ab initio: os

variacionais e os perturbativos [89,90]. Os primeiros são baseados no princípio variacional,

onde a energia é minimizada em função dos coeficientes, usando técnicas de multiplicadores

indeterminados de Lagrange, sendo esta sempre maior ou igual ao resultado exato. Alguns

métodos de estrutura eletrônica variacional são: os métodos baseados na aproximação

Hartree–Fock (Restricted Hartree-Fock, RHF; Restricted open-shell Hartree–Fock, ROHF e

Unrestricted Hartree–Fock, UHF), Já os métodos perturbativos são fundamentados na Teoria

de Perturbação de Muitos Corpos, MBPT (Many Body Perturbation Theory) que consiste em

particionar o operador Hamiltoniano do sistema em: uma parte perturbada e outra parte não-

perturbada obtendo assim, soluções para cada uma das partes. Os métodos de Moller-Plesset

são baseados na teoria MBPT. Além desses, existem também os métodos da Teoria do

Funcional de Densidade, DFT (Density Function Theory), cuja fundamentação não é baseada

na função de onda e sim a existência de funcionais que descrevem a densidade eletrônica.

Page 45: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

45

Capítulo 1 Introdução

Universidade Estadual de Campinas

A aproximação Hartree-Fock, HF, usa o modelo da partícula independente onde o

problema da repulsão intereletrônica é tratado de forma média, isto é, a função de onda

descreve o comportamento de um elétron do sistema num campo médio efetivo devido ao

restante dos elétrons. As equações de HF são resolvidas usando um procedimento iterativo

chamado de SCF (Self-Consistent Field). Contudo, devido à complexidade dessas equações

(conjunto de equações integro-diferenciais), elas podem ser resolvidas apenas para sistemas

muito simples como, por exemplo, os átomos.

O problema da inviabilidade de resolver as equações de HF para o caso molecular

foi resolvido por Roothan [91] em 1951. A solução proposta consistia em expressar os orbitais

moleculares como combinações lineares de um conjunto de funções de base de orbitais

atômicos, LCAO (Linear Combination of Atomic Orbitals). Dessa forma, as equações

diferenciais de HF eram transformadas num conjunto de equações algébricas (matriciais) que

são mais facilmente tratáveis.

Visto que na formulação dos métodos HF cada um dos N elétrons se move num

potencial médio formado pelos outros N-1 elétrons, apenas parte da energia de correlação

eletrônica é considerada. A energia de correlação é estabelecida como a diferença entre a

energia exata, obtida da equação de Schrödinger eletrônica (totalmente correlacionada e

usando um conjunto de base infinito) e a energia obtida no limite de HF (também para um

conjunto de base infinito) [86].

A principal consequência dos métodos Hartree-Fock é a superestimação da

repulsão eletrônica em função da aproximação do campo médio, acarretando erros

expressivos nos cálculos de várias propriedades e, principalmente, uma descrição incorreta da

superfície de energia potencial dissociativa.

Diversos métodos contêm correlação eletrônica no seu formalismo. Dentre os

principais ressaltamos: MPn (método de Moller-Plessed onde n é a ordem da perturbação)

[92] e o funcional híbrido B3LYP [93] (Becke’s three-parameter hybrid exchange functional

and the Lee-Yang-Parr correlation functional, ou Becke, three-parameter, Lee-Yang-Parr)

baseado na teoria do funcional de densidade, ambos aplicados neste trabalho.

A aproximação principal dos métodos MPn é que o valor da perturbação no

Hamiltoniano é pequena, isto é, admite que o operador de perturbação que produz a série da

expansão, é suficientemente pequeno, o que nem sempre é válido, sobretudo para os sistemas

onde a função de referência (Hartree-Fock) não é válida. Uma das consequências direta desse

problema é a não convergência da expansão para ordens elevadas [90,91]. Contudo, os

Page 46: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

46

Capítulo 1 Introdução

Universidade Estadual de Campinas

resultados MP2 para geometrias, energias e frequências vibracionais são, em geral, mais

precisos que os resultados Hartree-Fock. A proposta da Teoria do Funcional de Densidade,

DFT, é obter as propriedades do estado fundamental das moléculas sem a utilização da função

de onda. Em 1964, Hohenberg & Kohn [93] comprovaram a relevância da densidade

eletrônica para esse fim. O benefício do uso da densidade eletrônica ao contrário da função de

onda se encontra na diminuição considerável da dimensão do problema.

A função de onda para N-1 elétrons contém 3(N-1) variáveis (três para cada

elétron) além do spin. Por outro lado, a densidade eletrônica é estabelecida como o quadrado

da função de onda integrada sobre N-1 coordenadas eletrônicas. Portanto, a densidade

eletrônica depende somente de três coordenadas, independentemente do número de elétrons.

Ou seja, enquanto a complexidade de uma função de onda aumenta com o número de elétrons,

a densidade eletrônica tem sempre o mesmo número de variáveis. Contudo, a existência de

um funcional que acople a densidade eletrônica à energia ainda não é conhecido, e a

finalidade dos métodos DFT é obter de maneira aproximada esse funcional [94]. Para definir a

dependência da densidade com a energia, dois importantes teoremas estabelecidos por

Hohenberg-Kohn foram essenciais. O primeiro indica a existência de uma relação unívoca

entre todas as energias, incluindo a energia total e a densidade, ou seja, a energia é um

funcional da densidade eletrônica: .

O segundo teorema determina que, semelhantemente ao que ocorre com a teoria

dos orbitais moleculares para a função de onda, o funcional de densidade eletrônica também

segue ao princípio variacional. Isto é, para uma densidade eletrônica aproximada ( )

determinada pela integração sobre o número total de elétrons, rdr

)( , a energia

dada por essa densidade é sempre maior ou igual à energia obtida usando o funcional de

densidade exato: ][][ 00 .

O grande benefício da metodologia do funcional de densidade em relação aos

métodos ab initio padrões (métodos baseados nas equações de Hartree-Fock-Roothaan-HFR)

está no ganho em velocidade computacional e em memória. Considerando-se um sistema

arbitrário qualquer modelado com n funções de base, o esforço computacional utilizando-se

Diferença entre funcional e função:

Uma função f descreve a relação entre dois conjuntos de números (f: R R‘), onde um número do conjunto R

tem um ou mais correspondentes no conjunto R‘. A notação usada para representar uma função é, por exemplo,

f(x) = y. No entanto, um funcional F indica a correspondência entre um conjunto de funções e um número (F:

f(x) R). A notação usual para simbolizar um funcional é, por exemplo, F[f(x)] = y.

Page 47: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

47

Capítulo 1 Introdução

Universidade Estadual de Campinas

DFT aumenta na ordem de n3, enquanto que para os métodos Hartree-Fock aumenta na ordem

de n4 ou n

5. Assim, este método é particularmente útil no estudo de sistemas moleculares

grandes, descrevendo-se de forma mais realística sistemas orgânicos e inorgânicos, metálicos

e semicondutores.

O programa ADF (Amsterdam Density Functional) [95] tem a finalidade de

explorar esses benefícios computacionais do método DFT. Ele suporta uma ampla variedade

de funcionais de troca de correlação (XC) ZORA [96] (Aproximação Regular de Ordem Zero,

Zero Order Relativistic Approximation) na abordagem escalar ou termos de spin-órbita

incluídos. Sendo assim, a metodologia do funcional de densidade tem sido cada vez mais

empregada em pesquisas na área farmacêutica, agroquímica e biotecnológica, bem como na

ciência de materiais e polímeros, dentre outras áreas [97].

1.6.1. Conjuntos de Base

Uma das aproximações essenciais para os cálculos ab initio de estrutura eletrônica

é o uso de funções de base para descrever os orbitais moleculares (OM). Se a base forma um

conjunto completo, a expansão é dita ―exata‖. Contudo, para a base ser exata é indispensável

um número infinito de funções o que é impraticável mesmo para sistemas simples. Assim

sendo, a escolha da função de base é imprescindível para a correta descrição da função de

onda molecular. A seguir, serão consideradas algumas características importantes das funções

de base.

As funções de base são baseadas em dois tipos de orbitais: orbitais de Slater (STO

– Slater Type Orbitals) e orbitais gaussianos (GTO – Gaussian Type Orbitals), que são

descritos pelas equações 4 e 5 a seguir:

a. Funções do tipo Slater- STO

Zrnmemln rr e θ,AYθ,,X 1

,,,Z, (4)

b. Funções do tipo Gaussiana-GTO

2

eAθ,,X l-Z-,,Z,

ZrZnmln rr

(5)

onde,

n, l e m São os números quânticos: principal, momento angular e magnético,

respectivamente;

Page 48: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

48

Capítulo 1 Introdução

Universidade Estadual de Campinas

e θ ,r São as coordenadas esféricas para funções do tipo Slater;

Z: Zeta Coeficiente ajustável da exponencial;

A Constante de normalização;

Y Harmônicos esféricos (solução exata da equação de Schröringer para átomos

hidrogenóides).

As funções do tipo Slater, STO, diferem das funções Gaussianas, GTO,

principalmente na dependência em relação à parte exponencial com respeito ao parâmetro r

[98]. Essa dependência gera algumas vantagens e desvantagens, por exemplo, as funções do

tipo Slater têm a vantagem de possuir uma representação correta para a densidade eletrônica

no núcleo (a função tem um cúspide para r = 0, como exemplificado na Figura 8).

Por sua vez, a principal desvantagem das funções STO é não ter fórmulas

analíticas para o cálculo das integrais de 3 e 4 centros. Entretanto, para as funções gaussianas,

as integrais de 3 e 4 centros são determinadas mais facilmente mas, em contrapartida funções

GTO representam incorretamente a densidade eletrônica para r = 0. Então, surge a pergunta:

“Qual a função de base adequada para descrever os orbitais moleculares?”.

STO (1s) GTO (1s)

Figura 8. Representação do orbital 1s para funções de base STO e GTO.

A solução obtida foi associar a descrição correta da densidade eletrônica no

núcleo, ou seja, o sentido físico das funções de base STO, com a eficiência computacional das

funções de base do tipo GTO. A título de ilustração, o conjunto de base mínima STO-3G [99]

é construído usando 3 funções gaussianas a fim de reproduzir o desempenho da densidade

eletrônica da STO no núcleo. A representação gráfica desta função é indicada na Figura 9.

Page 49: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

49

Capítulo 1 Introdução

Universidade Estadual de Campinas

Figura 9. Representação gráfica das funções GTO para produzir a base STO-3G.

Nesta base, apenas um conjunto mínimo de orbitais é considerado, sendo para os

átomos de H e He: (1s), Li F: (1s,2s,2p), Na Cl: (1s,2s,3s,2p,3p) e assim por diante.

a) Bases de Valência Desdobrada (Split Valence)

As bases de valência desdobrada, denominadas, também, de bases de Pople

[100,101], descrevem os orbitais mais internos (orbitais de caroço) usando funções contraídas,

ou seja, cujos coeficientes não foram otimizados, e os orbitais de valência são desdobrados

em dois conjuntos: orbitais de valência interna e externa. Para o átomo de nitrogênio, por

exemplo, os orbitais são separados da seguinte forma:

valência

caroço

pssN

externainterna

221: . Os coeficientes dos

orbitais de valência são devidamente otimizados de modo a reproduzir melhor o orbital de

Slater.

b) Funções de Polarização

Da mesma forma que ocorre com a densidade eletrônica de um átomo sujeita à

ação de um campo elétrico uniforme, a ligação química distorce a nuvem eletrônica dos

átomos, tornando-a assimétrica, isto é, polarizada. Com isso, o orbital s do átomo de H, por

exemplo, passa a ter contribuição do orbital p e o orbital p do átomo de Li passa a ter

Page 50: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

50

Capítulo 1 Introdução

Universidade Estadual de Campinas

contribuição dos orbitais d, e assim por diante. Portanto, a inclusão de funções de polarização

é quase obrigatória para uma boa descrição dos orbitais moleculares.

No caso de átomos pesados, as funções de polarização correspondem à adição de

orbitais do tipo d (representado por um asterisco, por exemplo, 6-31G*) e para o átomo de

hidrogênio correspondem a orbitais do tipo p (6-31G**).

c) Funções de Difusas

As funções difusas são necessárias para descrever ânions, complexos fracamente

ligados, estados excitados, ou seja, para todo sistema molecular onde há elétrons fracamente

ligados [102,103]. As funções difusas permitem descrever uma região maior do espaço dos

orbitais ocupados. São empregadas para melhorar a representação de sistemas que tenham

densidades eletrônicas significativas a ―longas‖ distancias. A inclusão de funções difusas à

base é indicada pelo símbolo ‗+‘ significando que funções difusas do tipo s e p são

adicionadas aos átomos pesados, e ‗++‘ significando que funções difusas do tipo s também

são adicionadas ao átomo de H. O uso de funções difusas contribuiu para a boa

reprodutibilidade da geometria experimental da artemisinina.

Nesse trabalho foram realizados cálculos de orbitais moleculares ab initio HF e o

funcional híbrido B3LYP com os conjuntos de base 6-NG, 6-N++G, 6-NG** e 6-N++G**,

onde N=31 e 311, para otimização completa de geometria da artemisinina, análogos e

derivados.

1.7. A Quimiometria empregada em estudos de QSAR

A quimiometria [104] teve início na primeira metade da década de 70, mas só se

consolidou de fato quando o computador conquistou o laboratório químico. Segundo Beebe

[105], a quimiometria é a ―Utilização de técnicas estatísticas e matemáticas para analisar

dados químicos. É o processo completo no qual os dados são transformados em informação

usada para tomada de decisão‖.

A Quimiometria é uma área de pesquisa da química, ou seja, os problemas que ela

se propõe a resolver são de interesse e originados na química, ainda que as ferramentas de

trabalho originem principalmente da matemática, estatística e computação. Para Kowalski

[106], "as ferramentas quimiométricas são veículos que podem auxiliar os químicos a se

Page 51: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

51

Capítulo 1 Introdução

Universidade Estadual de Campinas

moverem mais eficientemente na direção do maior conhecimento". Resultou numa definição

formal de quimiometria: "... uma disciplina química que emprega métodos matemáticos e

estatísticos para planejar ou selecionar experimentos de forma otimizada e para fornecer o

máximo de informação química com a análise dos dados obtidos".

O conjunto de dados em uma análise quimiométrica é arranjado em uma matriz X

(I x J) (equação 6), onde cada linha corresponde a um composto e cada coluna a um descritor

(uma variável) e um vetor y que contém aos valores de atividade biológica dos I compostos

(variável dependente).

1

1

2

1

21

21

22221

112111

I

i

J

IJII

iJii

J

J

y

y

y

y

xxx

xxx

xxx

xxx

I

yX (6)

De acordo com Beebe e colaboradores [105], o pré-processamento dos dados pode

ser definido como qualquer tratamento matemático realizado na matriz, antes da construção

dos modelos quimiométricos. Então, antes de se iniciar qualquer tipo de análise multivariada é

necessária a realização de um pré-tratamento do conjunto de dados para a adequação, ou às

vezes até mesmo remoção de possíveis fontes indesejáveis de variação‖. O sucesso de

qualquer análise de dados depende da escolha adequada do pré-processamento.

Em estudos de QSAR, o autoescalamento é o procedimento indicado para o

tratamento das variáveis. Nesse pré-processamento, cada valor da variável j é subtraído de seu

valor médio e dividido por seu desvio padrão, como pode ser observado na equação 7.

A transformação realizada sobre o conjunto original dos dados faz com que cada

variável (descritor) apresente média zero e variância igual a um. Deste modo, todas as

variáveis são adimensionais e terão o mesmo grau de importância durante a análise dos dados,

independente de sua dimensão original.

j

jij

ijs

xxaex

)( (7)

Page 52: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

52

Capítulo 1 Introdução

Universidade Estadual de Campinas

Nesta equação, aeijx é o valor autoescalado da variável j para a amostra i, ijx é o valor

original da variável j na amostra i, jx é a média dos valores das amostras na coluna j (eq.

8)

I

iijj x

Ix

1

1 (8)

e js é o desvio padrão (eq. 9) dos valores da variável j, calculado a partir da variância, 2js

I

i

ijj xxI

s

1

22

1

1 (9).

1.7. 1. Análise por Componentes Principais

A base da maioria dos métodos modernos para tratamento de dados multivariados

é a Análise por Componentes Principais- ACP (do inglês Principal Component Analysis,

PCA) [107], que se baseia na projeção dos dados com o objetivo de representar as variações

presentes em muitas variáveis, através de um número menor de fatores. Constrói-se um novo

sistema de eixos (denominados de fatores, componentes principais, variáveis latentes ou

autovetores) a fim de representar as amostras, no qual a natureza multivariada dos dados pode

ser visualizada em poucas dimensões. Estas novas variáveis são determinadas em ordem

decrescente de quantidade de informação estatística que descrevem. A primeira componente

principal aponta na direção de maior variação dos dados, a segunda, que é ortogonal à

primeira, aponta na direção que descreve a maior variação restante dos dados e assim por

diante. Usando a notação matricial, as componentes principais são obtidas por meio de

transformações lineares conforme a equação 10:

X P = T (10)

onde X é a matriz pré-processada dos dados, T é a matriz de escores que contém as

coordenadas das amostras no novo sistema de eixos e P é a matriz dos pesos, onde os

elementos de cada coluna correspondem aos coeficientes das combinações lineares das

variáveis originais.

O método PCA está fundamentado na correlação entre variáveis, agrupando

aquelas que estão altamente correlacionadas. As colunas da matriz de pesos correspondem aos

Page 53: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

53

Capítulo 1 Introdução

Universidade Estadual de Campinas

autovetores da matriz de correlação (ou variância - covariância dependendo do pré-

processamento utilizado), de modo que os autovalores representam uma fração da variância

total dos dados. Assim, cada componente principal descreve uma porcentagem da variância

total dos dados.

1.7. 2. Regressão por Quadrados Mínimos Parciais

O método de regressão multivariada PLS (do inglês: Partial Least Square) foi

proposto por Herman Wold em 1964 [108]. Na regressão por quadrados mínimos parciais, a

matriz X dos descritores é correlacionada com o vetor y (dado pelas respostas biológicas) de

tal modo que as novas coordenadas dos compostos, descritas na matriz T, são otimizadas para

estimar y. Isto significa que os valores das atividades biológicas são incluídos no processo de

decomposição. O modelo geral é escrito pelas equações 11 e 12,

EXEPTX AAAT

(11)

fqTy A (12)

onde o super-índice T indica a transposta da matriz e o sub-índice A é o número de variáveis

latentes no modelo. E e f contém os resíduos.

No método PLS, cada componente é obtida maximizando a covariância entre os

escores T de X e o vetor y de modo que T = XW, em que W é a matriz de fatores-peso para

não confundir com a matriz de pesos P. A restrição de que os vetores t e y sejam altamente

correlacionados é assegurada fazendo cada fator-peso w proporcional à covariância entre X e

y.

O algoritmo é iniciado estimando os elementos do fator-peso, w, para a primeira

variável latente,1TT

1ˆ y)y(yXw . Na equação 11, é feita a decomposição da matriz X em

escores e pesos com A fatores e na equação 12, q é determinado por quadrados mínimos

fazendo a regressão de y em t. O vetor de regressão, b, é definido na eq. 13 como

t1tˆ qWPWb

(13).

Page 54: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

54

Capítulo 1 Introdução

Universidade Estadual de Campinas

1.7. 3. Validação de modelos QSAR

Após a determinação do modelo de QSAR, o mesmo deve ser validado antes de

sua interpretação e utilização para predizer a atividade biológica ou outra propriedade de

interesse. A validação pode ser definida como ―o processo no qual a confiabilidade e a

relevância de uma abordagem, método, processo ou avaliação específica, são estabelecidas

com um objetivo definido‖ [109]. É nessa etapa de validação que se garante que os modelos

de QSAR propostos são robustos e apresentem uma boa capacidade preditiva.

Para validar o modelo de regressão proposto, o conjunto completo de compostos é

dividido em um conjunto de treinamento contendo aproximadamente 70 - 80% deles e um

conjunto de validação externa formado pelos restantes. O modelo é validado internamente

considerando o conjunto de treinamento e a seguir validado pelo conjunto de validação que

não participou do processo de modelagem.

Durante a validação interna de um modelo avalia-se:

(1) A capacidade de o modelo ajustar os dados, ou a quantidade de variância

explicada, o coeficiente de determinação múltipla (R2:coefficient of multiple determination), o

desvio padrão do ajuste dos dados ou de calibração (SEC: standard error of calibration).

(2) A qualidade da predição interna, determinada pelo processo de validação

cruzada (ou validação LOO, leave-one-out: ‗deixe-um-de-fora‘). Neste método, uma das

amostras é excluída, o modelo é construído e usado para estimar o valor desta amostra. O

valor previsto deve desviar o mínimo possível do experimental, e o resultado é avaliado por

meio dos resultados obtidos para o coeficiente de correlação de validação cruzada LOO

(Q2

LOO) e para o erro padrão de validação (SEV: standard error of validation) [110].

Os parâmetros citados acima e usados para avaliar a qualidade do modelo são

definidos nas equações 14 - 16.

ii

cal

)y(y

PRESSR

2

2 1 e

ii

vc

)y(y

PRESSQ

2

2 1 (14)

onde y é o valor da atividade média experimental e nos denominadores tem-se a soma

quadrática total corrigida pela média. PRESS de validação PRESSvc, e calibração, PRESScal,

estão definidos na equação 15.

Page 55: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

55

Capítulo 1 Introdução

Universidade Estadual de Campinas

i

vciivc )y(yPRESS 2ˆ i

ciical )y(yPRESS 2ˆ (15)

Durante a validação cruzada os valores de PRESSvc nos auxilia a determinar o

número ótimo de fatores, ou de variáveis latentes (VL) do modelo de regressão.

Na expressão 15, vciy e ciy são os valores estimados da i-ésima amostra

durante a validação interna LOO e com todas as amostras incluídas no modelo,

respectivamente. Os erros padrão de validação, SEV (do inglês standard error of cross-

validation) ou RMSECV (root mean square error of cross validation), e de calibração, SEC

ou RMSEC (root mean square error of calibration), estão definidos na equação 16, onde I

representa o número de amostras utilizadas.

I

PRESSSEV cv ,

I

PRESSRMSEC cal e

1

AI

PRESSSEC cal

(16)

Em estudos de QSAR, um método bastante utilizado para a verificação da

robustez de um modelo é a validação na qual mais de uma amostra é retirada (conhecida

como leave-N-out – LNO ou leave-many-out - LMO). O processo é semelhante ao da

validação LOO: retira-se um número N de compostos do modelo (N = 2, 3, 4,...), o qual é

reconstruído sem os mesmos [111,112] e usados para estimar a atividade dos compostos

excluídos.

A construção de diferentes modelos gera diferentes valores para os parâmetros

estatísticos como, por exemplo, os valores de Q2LNO. Contudo, esses valores não podem ser

muito diferentes entre si porque um modelo robusto não pode ser muito sensível às amostras

que são removidas. Então, para avaliar se um modelo é robusto, recomenda-se que o teste da

validação cruzada leave-N-out seja aplicado com repetições e indique-se o desvio padrão.

Para modelos considerados robustos, N deve representar entre 20 e 30% do número de

amostras (leave-20 a 30% - out).

O valor crítico de N [112] é o valor máximo de N no qual Q2

LNO é ainda estável e

elevado. Um bom modelo deve apresentar valores de Q2

LNO bem próximos ao de Q2

LOO, para

todas as N amostras retiradas, com pequenas variações em todos os valores de N até o N

crítico. Um modo de determinar o valor crítico de N no teste LNO é utilizar o valor limite de

Page 56: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

56

Capítulo 1 Introdução

Universidade Estadual de Campinas

0,1 para dois desvios padrão em Q2

LOO (Q2

LNO ≤ Q2

LOO ± 0,05), i. e., dois desvios padrão não

devem ser superiores a 0,1 para N = 2, 3, etc., incluindo o valor crítico de N.

Outro teste importante de validação é aplicado para garantir que o modelo não foi

obtido ao acaso, i.e., que o modelo não apresenta correlações ao acaso. Isto é feito aplicando o

teste de aleatorização de y (y-randomization), onde a matriz dos descritores permanece

inalterada e o vetor y, que contém os valores das atividades biológicas, tem seus valores

trocados aleatoriamente [113]. Neste teste, o valor real de Q2

LOO deve ser bem maior do que os

valores obtidos para os modelos com y aleatorizado. Sugere-se que os modelos com os

valores de y ‗trocados aleatoriamente‘ apresentem valor de R2 inferior a 0,4 e valor de Q

2LOO

inferior a 0,05 Esse procedimento torna-se extremamente útil para garantir que o modelo de

QSAR não seja obtido ao acaso. Por sua vez, na validação externa, o modelo obtido é testado

a fim de predizer a atividade de um conjunto de compostos conhecidos e não utilizados para a

construção do modelo, cuja atividade de interesse foi determinada com mecanismo ou modo

de ação similar. Vale salientar que alguns parâmetros estatísticos podem ser utilizados para

avaliar a predição externa, em especial o coeficiente de correlação de predição (R2

pred ou

Q2

pred:correlation coefficient of prediction) e o erro padrão de predição (SEP: standard error

of prediction).

A fim de detectar amostras anômalas, que poderiam ser consideradas como

estando fora do domínio de aplicabilidade, foram utilizadas duas grandezas

complementares: a influência ou leverage e os resíduos de Student [114,115]. Como o

próprio nome diz, a influência é uma medida do quanto uma amostra pode influenciar o

modelo de regressão (a equação matemática que relaciona descritores-atividades). Um valor

de influência pequeno indica que o composto se encontra próximo do centróide dos dados e

consequentemente tem pouca influência na construção do modelo. Em geral, amostras

solitárias apresentam influência alta e são visíveis no gráfico de escores. O resíduo de

Student é outro parâmetro usado na detecção de amostras anômalas. Como o nome indica,

são desvios entre os dados de referência e os estimados pelo modelo, só que padronizados

pela influência. Valores de resíduos de Student e influências altas indicam que o composto

em questão apresenta um comportamento atípico e, se necessário, deverá ser excluído do

conjunto de dados.

Page 57: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

57

Capítulo 2 Objetivos

Universidade Estadual de Campinas

2. Objetivos

2.1. Objetivo Geral

Face ao quadro alarmante da malária no Brasil e no mundo, este trabalho visa

realizar um estudo de QSAR e de modelagem molecular da artemisinina e seus derivados,

com a finalidade de sugerir modificações nos substituintes para a obtenção de compostos mais

efetivos e específicos, e que possam ser testados como potenciais antimaláricos.

2.2. Objetivos Específicos

Para que o objetivo geral do trabalho pudesse ser alcançado, as seguintes etapas

foram cumpridas:

i. Seleção de um conjunto de treinamento com número expressivo de compostos que

contenha o grupo farmacofórico (grupo 1,2,4-trioxano), que apresente um grau de

variabilidade estrutural razoável e, para o qual a determinação da potência de cada

composto contra o P. Falciparum tenha sido efetuada com mecanismo ou modo de

ação similar;

ii. Desenho da estrutura tridimensional de cada composto do conjunto de treinamento e

aplicação de métodos de modelagem molecular para a obtenção das geometrias

otimizadas;

iii. Cálculo dos descritores moleculares a partir das geometrias mais estáveis obtidas

durante a modelagem molecular. Nesta etapa foram obtidos descritores eletrônicos,

topológicos e geométricos, bem como os descritores de campo eletrostático e estérico;

iv. Realização dos estudos QSAR-2D e -4D relacionando os descritores calculados na

etapa anterior com as atividades biológicas, utilizando o método de regressão PLS;

v. Validação dos modelos (obtidos na etapa iv) quanto à sua qualidade estatística fazendo

a validação externa com o objetivo de testar a sua capacidade de predição, bem como

a verificação da sua robustez e confirmação de que os modelos propostos não foram

obtidos ao acaso;

vi. Interpretação do modelo relacionando-o com o mecanismo de ação da atividade

antimalárica (interação com o grupo heme);

vii. Propor as características estruturais de novos derivados da artemisinina que se

apresentem mais eficazes com base nos resultados obtidos.

Page 58: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

58

Capítulo 3 Metodologia

Universidade Estadual de Campinas

3. Metodologia

Realizou-se um estudo preliminar com um conjunto formado por cento e oitenta

compostos, entre análogos e derivados da artemisinina, que estão listados nas Tabelas 2 a 7

[29, 48,116-125], e, para os quais as atividades biológicas foram determinadas, a partir da

atividade relativa.

O

O

O

H

OO

CH3

H

21

3

45

5a6 7

88a

910

11

1212a13

H3C

CH3

HH

Figura 10. Estrutura molecular da artemisinina indicando o número de cada átomo.

A estrutura experimental da molécula de artemisinina, determinada por

cristalografia de raios-X, foi extraída do Cambridge Structural Database (CSD) [126] com o

código QNGHSU03 (Fator R 3.60%) [127].

A artemisinina, cuja atividade biológica é 2,2 ng/mL e cuja massa molar (MM) é

283,33 g mol-1

, foi utilizada como composto de referência para gerar os valores de atividade

relativa (RA, Relative Activity) dos demais compostos do conjunto investigado. Esta

transformação é necessária porque os compostos selecionados para este estudo foram

determinados sob diferentes protocolos farmacológicos. Vale salientar, que a seleção ocorreu

a partir de análogos com mecanismo ou modo de ação similar. Os análogos foram testados in

vitro no sangue humano parasitado contra fármacos resistentes às linhagens de P. Falciparum

Indochine W-2. O clone W-2 é resistente à cloroquina e sensível a mefloquina e apresenta

relatos do controle da atividade para artemisinina.

Os valores de RA para os análogos foram obtidos através da relação entre o valor

de IC50 (concentração necessária para atingir 50% do efeito inibitório máximo) da

artemisinina (ng/mL) e o valor de IC50 do análogo, ajustando-se às diferentes massas

Page 59: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

59

Capítulo 3 Metodologia

Universidade Estadual de Campinas

moleculares (razão entre a MM do análogo e a MM da artemisinina). Os dados biológicos

foram expressos em unidades logarítmicas de RA, conforme apresentado na equação 17

[29,48,].

LogRA =

NAARTEMISINIMM

ANÁLOGOMMxANÁLOGOIC

NAARTEMISINIICLog

50

50 (17)

As Tabelas 2 e 6 contêm as modificações estruturais e valores das atividades

biológicas para análogos da artemisinina. As substituições foram realizadas nos carbonos C3

(R), C9 (R1 e R2) e C10 (R3) (veja a Figura 10 para a numeração dos átomos,). Observa-se

que há compostos mais ativos do que o fármaco de referência que é o composto 14 (a

artemisinina), com LogRA = 0,0. Por exemplo, o composto 18 que possui o LogRA igual a

1,40. Já o composto 55, que possui LogRA igual a -4,00, é menos ativo quando comparado à

artemisinina.

Na Tabela 3 encontram-se as modificações estruturais e valores das atividades

biológicas para análogos da azaartemisinina. Para esses compostos foram realizadas

substituições na ligação NR1 e na posição do átomo de carbono C9 (R). É importante

mencionar que nenhuma mudança foi realizada no anel endoperóxido (R2).

Na Tabela 4 estão as modificações estruturais e os valores das atividades

biológicas para análogos da secoartemisinina, que é caracterizada pela ausência das ligações

C3-C4, C4-C5 e C5-C5a. Para essas moléculas as substituições foram realizadas nas posições

dos átomos C3 (R, R), C6 (R1), C9 (R2) e C10 (R3).

A Tabela 5 apresenta as modificações estruturais e diferentes atividades para

análogos do arteeter. Observa-se que as substituições foram realizadas nos átomos C5 (R4),

C6 (R3) e C7 (R1 e R2).

Finalmente, na Tabela 7 se encontram as modificações estruturais e os valores das

atividades biológicas para análogos da diidroartemisinina. Para a referida molécula as

substituições foram feitas na ligação C10 O (R1 e R2).

Page 60: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

60

Capítulo 3 Metodologia

Universidade Estadual de Campinas

Tabela 2. Modificações estruturais e os valores de atividade relativa (LogRA) dos análogos da

artemisinina (composto 14).

[14] artemisinina

*i se refere ao prefixo iso: utilizado quando a valência livre está localizada no carbono

primário de uma cadeia ramificada.

Compostos R R1 R2 R3 LogRA

1 CH3 C6H13 H C=O 0,86

2 CH3 =CH2 C=O -0,89

3 CH3 =CHCH2 C=O -0,36

4 CH3 CH3 H C3H6OH 0,78

5 i-C4H9 H H H 0,4

6 CH3 =CH2 OH -2,39

7 CH3 CH3 OH OC2H5 -0,44

9 CH3 OH CH3 O C2H5 -1,13

10 C4H9 H H C=O -0,74

11 CH3 C4H9 H C=O 0,17

12 CH3 H CH3 C=O -0,17

13 CH3 i-C3H7 H C=O -0,04

14 CH3 CH3 H C=O 0,00

15 C2H5 H H C=O 0,05

16 CH3 H H C=O 0,79

17 CH3 C3H7 H C=O 1,13

18 CH3 C2H5 H C=O 1,40

19 C3H7 H H C=O 0,83

20 C4H9 C4H9 H C=O -0,48

21 CH3 C3H7 H O C2H5 -0,04

22 CH3 C5H11 H H 0,16

23 CH3 CH3 H O CH3 0,28

24 CH3 H H O C2H5 0,43

25

26

CH3

CH3

C2H5

C2H5

H

H

O C2H5

H

0,50

0,67

O

O

O

H

O

OR

R1

R2

O

O

H

OOR

R1

R2

R3

O

O

O

H

O

OR

R1

R2

Page 61: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

61

Capítulo 3 Metodologia

Universidade Estadual de Campinas

Tabela 2 (continuação). Modificações estruturais e os valores de atividade relativa (LogRA)

dos análogos da artemisinina (composto 14).

*i se refere ao prefixo iso: utilizado quando a valência livre está localizada no carbono

primário de uma cadeia ramificada.

** quando grupo substituinte em R1 está do lado oposto de R3.

*** : quando grupo substituinte em R1 está do mesmo lado de R3.

*** *: ligantes permanecem do mesmo lado da dupla ligação.

***** : ligantes permanecem do lado oposto da dupla ligação.

Compostos R R1 R2 R3 LogRA

27 CH3 C3H7 H H 0,74

28 CH3 CH3 H H 0,75

29 C4H9 H H H 0,75

30 C3H7 H H H 0,84

31 CH3 C4H9 H H 1,32

32 CH3 H H H 0,28

33 CH3 CH3 H C4H9 0,06

34 C2H5 H H H -1,00

36 CH3 C4H9 H OH 0,96

48 CH3 OCH2- C=O -2,09

51 CH3 Br CH2Br C=O -1,64

52 CH3 =O C=O -2,47

54 H H H C=O -2,76

55 CH3 OH CH2OH C=O -4,00

57 CH3 OCH2- C=O -4,00

58 CH3 C3H5 C=O -0,10

59 C4H8(C6H5) H H C=O 0,45

60 C4H8(C6H5) C4H9 H C=O -0,32

63 CH3 -N=NC2H4- C=O -2,70

64 CH3 -C2H4- C=O -0,94

65 CH3 H Z- C4H7 C=O -1,10

66 CH3 H E- C4H7 C=O -0,60

67 CH3 i- C4H9 H C=O -0,55

68 i- C4H9 H H C=O -0,35

O

O

O

H

O

OR

R1

R2

O

O

H

OOR

R1

R2

R3

O

O

O

H

O

OR

R1

R2

Page 62: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

62

Capítulo 3 Metodologia

Universidade Estadual de Campinas

Tabela 2 (continuação). Modificações estruturais e os valores de atividade relativa (LogRA)

dos análogos da artemisinina (composto 14).

*i se refere ao prefixo iso: utilizado quando a valência livre está localizada no carbono

primário de uma cadeia ramificada.

** - quando grupo substituinte em R1 está do lado oposto de R3.

*** - quando grupo substituinte em R1 está do mesmo lado de R3.

**** R: Enantiômero R possui uma rotação no sentido horário.

***** S: Enantiômero S possui uma rotação no sentido anti-horário

Compostos R R1 R2 R3 LogRA

69 CH3 -OCH2- OOH -0,62

70 CH3 -OCH2- OOH -0,57

71 CH3 CH3 H C2H3F2 0,11

72 CH3 CH3 H C3H5F2 -0,17

73 CH3 CH3 OH - OH -0,89

74 CH3 CH3 OH OCH2CF3 0,29

75 CH3 OH CH3 OCH2CF3 -0,70

79 CH3 CH3 H (R) C5H9O3 1,79

80 CH3 CH3 H (S) C5H9O3 2,25

81 CH3 CH3 H (R) C5H9O3 0,87

82 CH3 CH3 H (S) C5H9O3 1,70

83 CH3 C5H11 H C=O 1,02

86 CH3 CH3 H OCH2(C6H4)CO2H -0,15

87 CH3 C3H6(p-ClC6H4)

H H 1,84

88 CH3 CH3 H OH 0,55

89 CH3 CH3 H - OC2H5 0,32

91 C3H6(p-

ClC6H4)

C4H9 H C=O -0,28

92 C5H9O2 C4H9 H C=O 1,36

93 CH3 i-C6H13 H C=O -0,04

94 CH3 i-C5H11 H C=O 0,07

95 C3H6(p-Cl

C6H4)

H H C=O 0,10

100 CH3 CH3 H C14H16O10 0,89

O

O

O

H

O

OR

R1

R2

O

O

H

OOR

R1

R2

R3

O

O

O

H

O

OR

R1

R2

Page 63: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

63

Capítulo 3 Metodologia

Universidade Estadual de Campinas

Tabela 2 (continuação). Modificações estruturais e os valores de atividade relativa (LogRA)

dos análogos da artemisinina (composto 14).

*i se refere ao prefixo iso: utilizado quando a valência livre está localizada no carbono

primário de uma cadeia ramificada.

** p: Indica a posição ―para‖ no substituinte

Compostos R R1 R2 R3 LogRA

106 CH3 CH3 H OOC(CH3)3

0,92

107 C3H6(p-

ClC6H4)

H H C=O -0,55

108 C5H9CO2 H H H 070

115 C5H9O2 H H C=O 0,37

116 CH3 CH3 H C4H7O2 0,52

117 C2H4(C6H5) H H C=O -2,00

118 CH3 CH3(p-ClC6H4) H C=O 1,37

119 CH3 CH3 H C11H18O 0,28

122 CH3 C3H6(C6H5) CH3 H 1,40

123 CH3 CH3 Br NH (3-FC6H5) 0,79

124 CH3 CH3 H NH-2-(C5H4N) -0,09

125 CH3 CH3 H OC2H4CO2CH3 0,10

126 CH3 CH3 H OCH2(p-CO2CH3

C6H4)

-0,07

127 CH3 CH3 H OC3H6CO2CH3 -0,03

128 CH3 C2H4(C6H5) H C=O 0,12

129 CH3 C3H6(C6H5) H C=O 0,78

130 CH3 C4H8(C6H5) H C=O 0,63

131 C2H4(C6H5) H H H -1,70

132 C4H8(C6H5) H H H 0,58

143 CH3 (C2H4)CN H C=O -0,01

144 CH3 H C3H6(C6H5) C=O 0,63

145 CH3 (C3H6) C6H4(p-

SCH3)

H C=O -0,54

146 CH3 (C3H6) C6H4(p-

SO2CH3)

H C=O -0,14

O

O

O

H

O

OR

R1

R2

O

O

H

OOR

R1

R2

R3

O

O

H

OOR

R1

R2

Page 64: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

64

Capítulo 3 Metodologia

Universidade Estadual de Campinas

Tabela 2 (continuação). Modificações estruturais e os valores de atividade relativa (LogRA)

dos análogos da artemisinina (composto 14).

Compostos R R1 R2 R3 LogRA

147 CH3 C3H6 (p-OH C6H4) H C=O 0,49

148 CH3 C3H6 (3,5-(C2F6) C6H4) H C=O -0,04

149 CH3 H C3H6 (3,5-(C2F6)

C6H4)

C=O 0,25

150 CH3 (C3H6) C6H4(p-

NH(CH3)2)

H C=O 0,11

151 CH3 H (C3H6) C6H4(p-

NH(CH3)2)

H -0,63

152 CH3 (C3H6) C6H4(p-

NH(CH3)2)

H H 0,01

153 CH3 CH3 H C3H6NH(C4

H4N2)

1,00

154 CH3 CH3 H C6H9O4 1,40

155 CH3 CH3 H C10H13O4 1,40

156 CH3 CH3 H C4H5O4 0,72

159 C2H5 C4H9 H C=O 0,41

164 CH3 C14H29 H C=O 3,22

166 CH3 C=O CO2H -0,74

167 CH3 H OH OH -0,72

169 CH3 C2H2O OH -0,36

173 CH3 C2H3O2 H C=O -1,79

174 CH3 CH3 CH3 C=O -1,06

176 CH3 C2H4NO2 H C=O -0,03

177 CH3 CH2CN H C=O -1,59

178 CH3 C3H5O2 H C=O -2,14

179 CH3 CH2OH H C=O -2,43

180 CH3 CN H C=O 0,22

* p: Indica a posição ―para‖ no substituinte.

O

O

O

H

O

OR

R1

R2

O

O

H

OOR

R1

R2

R3

O

O

H

OOR

R1

R2

Page 65: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

65

Capítulo 3 Metodologia

Universidade Estadual de Campinas

Tabela 3. Modificações estruturais e os valores de atividade relativa (LogRA) dos análogos

da azartemisinina (composto 40).

O

N

O

H

R

R2

R1

[40] azaartemisinina

*i se refere ao prefixo iso: utilizado quando a valência livre está localizada no carbono

primário de uma cadeia ramificada.

** o: Indica a posição ―orto‖ no substituinte.

Compostos R R1 R2 LogRA

8 CH3 i-C5H11 O-O -0,04

37 H CH3 O-O 0,70

38 H C3H7 O-O 0,05

39 CH3 CH3 O-O 0,43

40 CH3 H O-O 0,0

41 CH3 C2H3O

O-O 1,47

42 H C5H11 O-O -0,20

90 CH3 C4H3O O-O 0,11

101 CH3 i-C4H9 O-O 1,03

102 CH3 CH2CH=CH2 O-O -0,04

103 H CH2(C6H5) O-O 0,34

104 H CH2(p-ClC6H4) O-O -0,16

105 H i-C4H9 O-O 0,02

113 H C3H6(C6H5) O-O 0,02

114 H C2H4(C6H5) O-O 0,16

120 CH3 2- C4H3S O-O 0,17

121 CH3 CH2(o-C5NH4) O-O 1,46

160 CH3 C5H11 O-O 0,17

161 CH3 C4H1ON O-O -0,43

162 CH3 C2H3O2 O-O -1,22

163 CH3 C6H11O2 O-O -0,92

Page 66: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

66

Capítulo 3 Metodologia

Universidade Estadual de Campinas

Tabela 4. Modificações estruturais e os valores de atividade relativa (LogRA) dos análogos

da secoartemisinina (composto 171).

O

O

H

OO

R

R2

R3

R

R1

[171] secoartemisinina

Compostos R R1 R2 R3 LogRA

43 CH3 H H C=O -2,37

44 CH3 H C4H9 C=O -1,13

45 C2H5 H CH3 C=O -0,60

46 CH3 CH3 CH3 C=O -0,15

47 CH3 H CH3 C=O -1,27

56 CH3 CH3 CH3 H -0,80

61 CH3 CH3 CH3 C=O -0,86

62 -C4H8- CH3 CH3 H -0,26

171 CH3 CH3 CH3 C=O 0,01

172 CH3 CH3 CH3 C=O -0,68

Page 67: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

67

Capítulo 3 Metodologia

Universidade Estadual de Campinas

Tabela 5. Modificações estruturais e os valores de atividade relativa (LogRA) dos análogos

do arteéter (composto 35).

O

O

OEt

H

OO

R3R4

R2

R1

[35] arteéter

Compostos R1 R2 R3 R4 LogRA

35 H H CH3 H 0,35

50 H H CH3 OH -1,08

53 OH H CH3 H 0,34

77 H H H C=O -0,36

78 F CH3 H -0,12

84 H H CHF2 H 0,41

85 F F CH3 H 0,19

96 C=O CH3 H 0,16

97 H H CHO H 0,21

157 F CH3 CHO H 1,62

158 F CH3 CH3 H -0,12

Page 68: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

68

Capítulo 3 Metodologia

Universidade Estadual de Campinas

Tabela 6. Modificações estruturais e os valores de atividade relativa (LogRA) de outros

análogos da artemisinina.

Compostos LogRA Compostos LogRA

0,78

0,23

0,78

-0,79

-0,24

-2,47

-2,59

OO

O

O

S N

N

S

O

H

H

H

O

OH

OO

O

O

O

H

OO

H

O

OO

O

H

H

169 [Rf107: 153]170 [Rf107: 130]

168 [Rf107: 148]

-2,09

-1,24

-0,93

Page 69: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

69

Capítulo 3 Metodologia

Universidade Estadual de Campinas

Tabela 7. Modificações estruturais e os valores de atividade relativa (LogRA) dos análogos

da diidroartemisinina (composto 88).

O

O

O

H

OO

H R1

R2

* p: Indica a posição ―para‖ no substituinte.

A Figura 11 resume a metodologia seguida na etapa de otimização completa da

geometria da artemisinina obtida por cristalografia de raios-X e de todos os outros compostos

em estudo. A estrutura experimental da artemisinina [127], extraída do banco de dados CSD

[126], foi inicialmente otimizada empregando o método de mecânica molecular (MM+) [128].

A estrutura molecular resultante foi então otimizada pelo método semiempírico (AM1) [129].

Compostos R1 R2 LogRA

112 CH2CO2H p-NO2(C6H5) 0,10

133 C3H7 CH2(C6H5) -0,09

134 CH2(C6H5) C3H7 0,31

135 C6H5 C3H5O 1,25

136 C4H7O2 C6H5 0,90

137 C6H5 C4H7O2 1,07

138 CH3 (C6H5)CO2CH3 0,68

139 (C6H5)CO2CH3 CH3 0,48

140 CH3 p-CO2H(C2H5) 0,21

141 p-CO2H(C2H5) CH3 0,12

142 C4H7O2 p-NO2-C6H5 0,90

165 OCH(C6H4)OCH3 C2H4CO2H 0,02

Page 70: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

70

Capítulo 3 Metodologia

Universidade Estadual de Campinas

A estrutura molecular obtida a partir do método AM1 foi otimizada usando o método de

orbitais moleculares ab initio em nível Hartree-Fock [130] com o conjunto de base HF/3-21G.

A estrutura molecular resultante foi novamente otimizada em sequência empregando os

conjuntos de base HF/6-NG, HF/6-N++G, HF/6-NG** e HF/6-N++G**, onde N = 31 e 311.

Uma última série de otimizações foi efetuada a partir das estruturas moleculares

resultantes do método Hartree-Fock, utilizando a Teoria do Funcional de Densidade, DFT,

com o funcional híbrido B3LYP e os mesmos conjuntos de base já mencionados

(DFT/B3LYP/6-NG, 6-N++G, 6-NG** e 6-N++G**, onde N = 31 e 311). Os programas

HyperChem versão 6.0 [131] e Gaussian-03 [84] foram utilizados para as otimizações de

geometria.

O método quimiométrico não supervisionado de análise de componentes

principais, PCA, foi aplicado aos parâmetros estruturais otimizados com a finalidade de

verificar qual dos métodos de otimização e que conjunto de base melhor reproduziria a

geometria experimental da artemisinina. Uma vez escolhido o método e o conjunto de base

mais adequado (B3LYP/6-311++G**), a geometria otimizada da artemisinina foi utilizada

como estrutura base para a otimização da estrutura molecular dos demais compostos da série.

Figura 11. Sequência dos passos adotados para otimização da geometria da artemisinina

e dos compostos análogos.

Page 71: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

71

Capítulo 3 Metodologia

Universidade Estadual de Campinas

Em seguida foram calculados os descritores. A Figura 12 contém um fluxograma

das etapas que serão desenvolvidas para a obtenção dos modelos de QSAR.

Figura 12. Fluxograma das etapas seguidas na construção e validação dos modelos de

QSAR.

Como descrito anteriormente, os seguintes descritores foram calculados para o

estudo de QSAR-2D:

Com o uso do programa Gaussian [84]:

Comprimentos de ligação O1-O2, O2-C3, C3-O13, O13-C12 e C12-C12a, e ângulos de

ligação C12a-C12-O13 e C12-O13-C3; cargas CHELPG (Charges from Electrostatic Grid

Based [51]) no seguintes átomos: O1, O2, C6, C7, C10, C12, C12a e O13; momento dipolar

(D) e seus componentes ao longo dos eixos X (Dx), Y (Dy) e Z (Dz); energia dos orbitais de

fronteira HOMO, LUMO e a diferença GAP = (HOMO – LUMO).

Descritores calculados pelo programa MARVIN [82] e E-DRAGON 1.0 [83]:

Topológicos, 3DMORSE, WHIM, 2D, eletrônicos e estruturais

Outros descritores:

Page 72: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

72

Capítulo 3 Metodologia

Universidade Estadual de Campinas

Refratividade molar, polarizabilidade molecular, área superficial molecular, índice de

Balaban, índice de Wiener e coeficiente de partição calculado logP. O descritor a priori

SCORE foi determinado a partir das estruturas 2D e está descrito no anexo 1. Dois descritores

TOR e RTOR foram calculados a partir da interação (docagem) artemisinina-heme. TOR =

ângulo de torsão em graus definido como, Cm-Fe-O1-O2, onde Cm é o carbono da porfirina

entre os dois grupos proprionato. RTOR = ângulo TOR relativo e definido como: a) para

valores positivos: RTOR = ||91,7-TOR||, b) para valores negativos: RTOR = ||-91,7-TOR||;

No total, foram considerados em torno de mil e quinhentos descritores para os estudo QSAR-

2D.

A geometria otimizada de cada composto foi empregada como estrutura molecular

inicial nas simulações de Dinâmica Molecular, DM. As cargas CHELPG foram usadas para o

cálculo das energias de Coulomb no módulo LQTAgrid do programa LQTA-QSAR. As

energias dos compostos otimizados foram submetidas ao servidor PRODRG 2.5M para gerar

informações a respeito de coordenadas atômicas e topologias. Como mencionado

anteriormente, as coordenadas são armazenadas em arquivos com a extensão ―gro‖. As cargas

atômicas são obtidas do arquivo de topologia (―top‖). As cargas atômicas de Gasteiger [132]

calculadas no programa AutoDock Tool [133] foram adaptadas ao campo de força ffG43a1

[134] e empregadas na simulações de dinâmica molecular.

O modelo de solvatação utilizado para realizar simulações de DM foi o modelo de

solvatação explícita, em meio aquoso. Encontra-se na literatura diversos potenciais que foram

desenvolvidos e parametrizados para descrever as moléculas de água explicitamente. Para este

trabalho foi usado o modelo de carga pontual, SPC/E desenvolvidos por Berendsen e

colaboradores [135].

Para reduzir os efeitos de fronteira foi empregada a condição de contorno de 10 Å entre o

soluto (ligantes) e as moléculas de água do solvente. O problema das interações de longo

alcance (potencial de Coulomb) foi contornado com a utilização de métodos baseados em

somas de Ewald como o PME (Particle Mesh Ewald) [136].

Na DM a energia total é sempre constante, com número de partículas e volume

fixos. Novas alternativas foram desenvolvidas, onde se controla separadamente a temperatura,

T, e a pressão, P, ao invés da energia total (E). Neste trabalho o número de partículas, pressão

e temperatura constantes são controlados separadamente. Durante as simulações de DM o

controle de T pode ser realizado por meio de um processo conhecido como termostato de

Page 73: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

73

Capítulo 3 Metodologia

Universidade Estadual de Campinas

Berendsen [137]. Para o controle da pressão, os barostatos mais utilizados são os de

Berendsen [1350] e Parrinello-Rahaman [138].

As posições atômicas foram minimizadas com os algoritmos steepest descent e o

método dos gradientes conjugados. O sistema foi aquecido gradativamente, de acordo com o

seguinte esquema: 50 K, 100 K, 200 K e 350 K para simulações de DM de 20 ps, que

corresponde a 20.000 passos, sendo cada passo de 1 fs (0,001 ps). Em seguida, o sistema foi

resfriado a 310 K para simulações de DM de 500 ps (500.000 passos de 1 fs).

O perfil de conformações, CEP (conformation ensamble profile), da artemisinina

foi alinhado e em seguida utilizado como referência no alinhamento dos CEPs dos demais

ligantes da série. Os átomos foram alinhados (O1, O2, C3, C12, C12a) de acordo com o anel

endoperóxido (o farmacóforo). Os CEP provenientes da dinâmica molecular, depois de

alinhados foram usados para obter os descritores de campo (energia de interação sonda-

átomos) utilizando o módulo LQTAgrid do programa LQTA-QSAR.

O tamanho da caixa virtual foi definido com uma resolução de (1Å). Todos os

descritores (contribuições de energia eletrostática e de Lennard Jones) foram determinados

utilizando o grupo de prova NH3+ como sonda. No total, forma calculados em torno de

50.000 descritores de campo, para o estudo QSAR-4D.

Uma vez obtidos os descritores para ambos os estudos (2D e 4D), a etapa seguinte

(Figura 12) é a seleção daqueles que seriam relevantes para os estudos de QSAR.

Os descritores 2D foram autoescalados para realizar a seleção de variáveis e

consequentemente a construção de modelos. Segundo Kubinyi e colaboradores, [139] é

recomendado descartar aqueles descritores cuja variância seja menor do que 0,01 ou 0,02. Foi

determinada então a variância de cada descritor e aqueles com variância menor de que 0,01

foram eliminados. A seguir, foram excluídos os descritores com comportamento aleatório

quando comparado a atividade biológica. Para isto, determinou-se os valores absolutos dos

coeficientes de correlação entre cada descritor e a atividade biológica. Aqueles que

apresentaram coeficientes de correlação abaixo de 0,4 também foram excluídos. Finalmente,

foram eliminados aqueles descritores considerados como degenerados, i.e., que não

apresentaram uma distribuição adequada em relação à distribuição de y. Nesta etapa, foi

utilizado o filtro digital designado como CDDA (Comparative Distribution Detection

Algorithm) [140]. Este filtro permite quantificar a similaridade de distribuição entre y e cada

descritor e eliminar os descritores que tem um comportamento de distribuição muito diferente

de y. O algoritmo funciona em três etapas: 1) Um descritor (xj) é escalado pela amplitude de

Page 74: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

74

Capítulo 3 Metodologia

Universidade Estadual de Campinas

modo que o valor mínimo seja 0 e o valor máximo seja 1; 2) é feito um histograma onde o

intervalo [0,1] é dividido em k subdivisões, k = 2n (1, 2, 3,... ). O mesmo procedimento é

aplicado aos valores de y. A terceira etapa envolve a contagem do número de valores dentro

de cada subdivisão e os resultados são armazenados em um vetor fk(j). O mesmo procedimento

é empregado para y dando origem ao vetor de frequência, fk(j). Somando a diferença absoluta

entre cada vetor fk(j) e fk(y), é determinado um valor εj que é dependente do valor de n escolhido

na etapa anterior (eq. 17).

k

kykjknj ff

1)()()( (17)

Se um descritor tem exatamente a mesma distribuição de y fará com que qualquer

valor j(n)seja zero. No entanto, ej(n) será maior que zero quando isso não ocorrer, indicando

que existem subdivisões muito populadas e, ao mesmo tempo, há outras mais vazias. Pode-se

reescrever j(n) em uma forma normalizada, ej(n), de acordo com a equação 18.

221

le

njnj

(18)

Os valores de ej(n) mudam em função do número de subdivisões selecionado.

Considerou-se o valor padrão para n aquele que maximizou a expressão:

njnj ee minmax .

Terminada a filtragem dos dados, somente descritores em potencial foram

selecionados. A seleção final dos descritores foi realizada com o algoritmo de seleção de

variáveis ordenadas, OPS, (Ordered Predictors Selection) proposto por Teófilo e

colaboradores [141]. Este método consiste em ordenar as variáveis em ordem decrescente de

importância de acordo com um vetor de informação. Dessa forma, as colunas da matriz são

rearranjadas de tal forma que os descritores mais importantes são apresentados nas primeiras

colunas. Foram usados os seguintes vetores informativos: vetor de regressão, vetor de

correlação e o vetor produto, que é o produto, elemento a elemento, dos dois vetores

anteriores.

A filtragem e seleção dos descritores de campo de interação molecular (Molecular

Interaction Field, MIF) para o estudo de QSAR-4D seguiram os mesmos passos, com apenas

um etapa extra. A presença de valores positivos de elevada ordem de magnitude pode

ocasionar instabilidade na construção do modelo com o método PLS. Desse modo, os

descritores de Lennard Jones, LJ, passam por um pré-tratamento (equação 19) a fim de

Page 75: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

75

Capítulo 3 Metodologia

Universidade Estadual de Campinas

assegurar que a informação dos pontos da grade próximos às moléculas alinhadas não sejam

perdidas.

Se zyxzyxzyx LJLJmolkcalLJ ,,,,1

,, então30

Se

29logentão301

,,10,,,,

1,,

molkcal

LJLJLJmolkcalLJ

zyxzyxzyxzyx

(19)

Quando todos os valores em certo ponto da grade são transformados para 30 kcal

mol-1

a variância desse descritor se torna muito próximo de zero e todos os pontos que estão

bem próximos da molécula são excluídos quando o corte de variância é aplicado.

Em seguida foi empregado o método de regressão por mínimos quadrados parciais

PLS, (parcial least squares) [93] para a obtenção dos modelos de QSAR.

Os modelos obtidos foram validados conforme descrito no capítulo 1, quanto à

robustez [112,113] e à ausência de correlação ao acaso [112]. Terminada a construção e

validação dos modelos com o conjunto completo dos dados, o processo foi reiniciado após a

sua repartição em dois conjuntos de compostos. O primeiro deles, chamado de conjunto de

treinamento, contém cerca de 70% dos compostos e foi usado para a construção do modelo

final de QSAR O outro, chamado de conjunto de validação externa, contém os compostos

restantes que não participaram do processo de modelagem e serão usados para validar a

capacidade preditiva do modelo proposto. Os novos modelos de regressão, construídos com

um conjunto menor de compostos, devem ser semelhantes aos respectivos modelos obtidos

anteriormente (com o conjunto completo de compostos). Por fim, foi feita a validação externa,

utilizando um conjunto de compostos que não participaram da construção dos modelos,

quando se testou a capacidade preditiva dos modelos finais propostos.

Uma vez construído e validado o modelo de QSAR, resta ainda uma última etapa,

que é a interpretação dos resultados, do ponto de vista químico.

Page 76: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

76

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

4. Resultados e discussão

Os 180 compostos estudados neste trabalho apresentam uma ampla faixa de

atividade biológica, como pode ser visto no histograma da Figura 13. A classificação em

compostos inativos, com baixa atividade, ativos e com alta atividade foi feita com base na

atividade do fármaco de referência, a artemisinina (LogRA = 0,00). Neste trabalho optou-se

por considerar compostos inativos aqueles que possuem LogRA abaixo de -1,83. Os

compostos com baixa atividade tem valores de LogRA -1,83 LogRA < -0,39. Os compostos

ativos -0,39 LogRA < 2,50. Os compostos com alta atividade possuem valore de LogRA

2,50.

Figura 13. Histograma apresentando a distribuição dos valores de LogRA para

180 compostos.

Como mencionado anteriormente (Tabelas 2 a 7) para os análogos e derivados da

artemisinina, os diferentes grupos substituintes R, R2 e R3 entraram nas posições dos átomos

de carbono C3, C9 e C10, respectivamente. Para a molécula da azaartemisinina foram

realizadas substituições no átomo de nitrogênio (R1) e na posição do átomo de carbono C9.

Substituições foram realizadas nas posições dos átomos C3 (R e R), C6 (R1), C9 (R2) e C10

Page 77: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

77

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

(R3), para os derivados da secoartemisinina. No arteéter as substituições foram feitas nos

átomos C5 (R4), C6 (R3) e C7 (R1 e R2) e, finalmente, para a molécula da diidroartemisinina

essas substituições foram realizadas na ligação C10-O (R1 e R2).

Utilizando os parâmetros estruturais otimizados para a artemisinina

(comprimentos de ligação, ângulos de ligação e ângulos diedros) e que estão listados nas

Tabelas 1 a 6 do anexo 2, foi feita uma análise de componentes principais para decidir qual o

melhor nível de cálculo e o melhor conjunto de base a ser utilizado para todos os 180

compostos envolvidos neste estudo. A Figura 14 apresenta o gráfico de escores de PC1 versus

PC2, O pré-processamento utilizado foi o autoescalamento dos dados. Há aproximadamente

88,1% de informação acumulada nas duas primeiras componentes principais.

A partir do gráfico observa-se que a primeira componente principal (Fator 1 ou

PC1) separa os resultados obtidos pelo método HF ( grupos A e B) daqueles obtidos pelos

métodos DFT/B3LYP ( grupos C e D). Por sua vez, a segunda componente principal, PC2,

discrimina os conjuntos de base que apresentam funções de polarização (grupos B e D) dos

demais (grupos A e C). Os parâmetros calculados pelo método DFT/B3LYP++G** contendo

as funções de polarização e difusas (grupo D) foram os que mais se aproximaram dos

resultados experimentais.

Figura 14. Visualização 2D do resultado da PCA. Escores de PC1 versus PC2. Os

resultados experimentais estão representados por EXP.

Page 78: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

78

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Após este estudo, decidiu-se que a geometria de todos os derivados da

artemisinina seria otimizada utilizando o método DFT/B3LYP e a função de base 6-311++

G**.

Foram calculados em torno de mil e quinhentos descritores para o estudo de

QSAR-2D. Foram eliminados descritores que apresentaram variância menor do que 0,01.

Aqueles que apresentaram um coeficiente de correlação com a atividade biológica menor do

que 0,4 também foram eliminados. Neste corte, todos os descritores quânticos (cargas,

parâmetros estruturais, momento de dipolo, refratividade molar, volume, logP, área superficial

além de vários outros descritores tradicionais) foram eliminados. A seguir, o filtro digital

CDDA foi aplicado para checar a distribuição dos valores de atividade versus descritor,

resultando em um conjunto com 23 descritores (os descritores degenerados foram todos

eliminados nessa fase).

A seleção de variáveis foi feita empregando do algoritmo OPS. Foram salvos

vários modelos e os seguintes descritores apareceram nos dez melhores modelos: SCORE,

ASA_H, %RB e Mor03e. A distribuição desses descritores no dendrograma construído

usando o método do vizinho mais próximo se encontra na Figura 15. Eles pertencem a grupos

distintos e, portanto, devem conter informações complementares. O modelo inicial de QSAR

foi construído utilizando estes quatro descritores.

Figura 15.Dendrograma ilustrando a distribuição dos descritores selecionados para a

construção do modelo QSAR.

Page 79: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

79

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Foi feita uma análise visual dos dados e observou-se que três compostos (55, 57 e

164) apresentaram um comportamento diferente dos restantes. Pode-se ver que estes

compostos estão distanciados do grupo central que é relativamente homogêneo e, portanto,

foram eliminados de análises futuras.

Figura 16. Gráficos bivariados dos quatro descritores selecionados versus a atividade

biológica, LogRA.

Analisando as estruturas destes três compostos, observa-se que o composto 55

apresenta o grupo substituinte OH na posição R1 e o grupo substituinte CH2OH na posição

R2. O composto 57 apresenta o grupo substituinte OCH2- nas posições R1 (C9β) e R2

(C9α). A estrutura molecular desses compostos pode ser visualizada na Figura 17.

O

O

O

OO

O

H

H

57 [LogRA = -4,00]

O

O

H

H

OO

O

O

O

H

H

55 [LogRA = -4,00]

Figura 17. Estrutura molecular 2D dos compostos 55 e 57.

Page 80: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

80

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Ao comparar o composto 164 à artemisinina (Figura 18) pode-se observar que na

posição C9desse composto há uma cadeia longa (C14H29), comparada aos outros

substituintes nessa posição.

H

H

OO

O

O

O

164 (LogRA = 3,22)

H

H

OO

O

O

O

14 (LogRA = 0,00)

Figura 18. Estrutura molecular 2D da artemisinina e do análogo 164.

Foram feitas várias tentativas de validar um modelo com estes descritores e os

177 compostos, mas foi impossível uma vez que os valores de Q2 e R

2 estavam abaixo dos

limites adequados (Q2

LOO superior a 0,5 e R2 superior a 0,6) e os erros padrões (RMSECV e

RMSEC na equação16) bastante altos. Além disso, o modelo apresentava o problema de

sinais quando o sinal do coeficiente de correlação descritor-atividade era comparado com o

respectivo sinal do coeficiente de regressão.

Foi feita uma análise dos resíduos de Student e vários compostos que

apresentaram resíduos muitos altos foram excluídos, com o objetivo de se obter um modelo

que fosse mais adequado. No total, 17 compostos foram eliminados (12, 16, 18, 28, 32, 46,

74, 76, 77, 117, 121, 131, 145, 163, 169,171 e 179). Um modelo adequado foi obtido com 160

compostos e os 4 descritores selecionados anteriormente: SCORE, ASA_H, RB% e Mor03e.

Os valores do coeficiente de correlação entre cada descritor e a atividade biológica para os

Page 81: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

81

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

160 compostos, bem como os coeficientes de correlação entre os próprios descritores estão

listados na Tabela 8.

Tabela 8. Coeficientes de correlação descritor-descritor e descritor-LogRA.

Descritores LogRA

SCORE ASA_H %RB Mor03e

SCORE 0,43 0,48 -0,50 0,78

ASA_H 0,80 -0,73 0,53

%RB -0,78 0,54

Mor03e -0,58

O modelo de regressão PLS, construído com duas variáveis latentes (A = 2), obtido

está indicado na equação 20.

LogRA = 0,64SCORE + 0,078ASA_H + 0,070%RB – 0,14Mor03e

(20)

LogRA = – 1,12 +0,49SCORE + 0,001ASA_H + 0,022 %RB – 0,056Mor03e

São apresentadas duas equações. A primeira delas se refere aos coeficientes de

regressão autoescalados, quando todos eles podem ser comparados entre si. SCORE é o mais

importante seguido do descritor Mor03e; os descritores ASA_H e %RB são os menos

importantes. A segunda equação apresenta os coeficientes quando cada descritor foi

multiplicado pelo seu desvio padrão original e a média somada. Note que há o termo

independente nessa equação (-1,12). Os parâmetros estatísticos obtidos para esse modelo

contendo 160 compostos e duas variáveis latentes (A = 2) foram os seguintes: R2 = 0,66;

RMSEC = 0,559; Q2

LOO = 0,65; RMSECV = 0,572. Bons modelos de QSAR devem apresentar

parâmetros estatísticos tais como: valor de Q2

LOO superior a 0,5 e R2 superior a 0,6. No

entanto, quanto mais próximos de 1 forem esses valores, melhor a qualidade do modelo obtido.

Além disso, um modelo adequado não pode apresentar uma diferença entre os valores R2 e Q

2

superior a 0,3, pois é um forte indício de superajuste (overfitting). Para o modelo mencionado,

essa diferença foi de 0,01, indicando que o modelo obtido não está superajustado.

Page 82: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

82

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Esse modelo foi totalmente validado conforme as indicações da literatura e a

seguir, serão apresentados os resultados de robustez e ausência de correlação ao acaso. Foram

checados também os sinais dos coeficientes de correlação descritor-atividade e o vetor de

regressão. Os resultados obtidos estão na Tabela 9.

Tabela 9. Análise dos sinais dos coeficientes de correlação descritor-atividade e o

vetor de regressão.

Descritor Coef. de regressão Coef. de correl. Des./LogRA

SCORE + 0,64 + 0,78

ASA_H + 0,078 + 0,53

%RB + 0,070 + 0,54

Mor03e – 0,14 – 0,58

O número de amostras retiradas a cada etapa no teste de robustez do modelo

variou de 1 a 50. Cada teste foi repetido 50 vezes. Os valores médios de Q2 e o desvio padrão

obtidos versus o número de amostras retiradas no teste Leave-N-Out são mostrados na Figura

19.

Page 83: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

83

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Figura 19. Gráficos dos resultados obtidos para o teste de robustez a partir do método

LNO (N = 1 – 50 sendo que N = 1, corresponde ao teste ―leave one out‖, LOO)

Os resultados obtidos indicam que o modelo é robusto. Todos os valores de Q2

LNO

estão dentro dos limites sugeridos na literatura que é Q2

LOO ± 0,05, i.e., os valores de Q2 estão

entre 0,60 e 0,70 para todos os valores de N considerados. Sendo assim, o valor de N crítico

não foi atingido mesmo com a exclusão de 50 compostos dos 160 compostos.

O modelo de QSAR também foi validado aplicando a metodologia de

aleatorização. Nesta metodologia, as atividades biológicas são trocadas entre as amostras de

forma aleatória. Dessa forma, a qualidade dos modelos obtidos com as atividades biológicas

trocadas deve ser bem inferior à do modelo correto. Esse procedimento torna-se

extremamente útil para garantir que o modelo QSAR não seja obtido ao acaso Este teste foi

aplicado ao modelo, com 100 repetições. Pode-se ver pelos três gráficos da Figura 20 que o

modelo não sofre de correlação ao acaso. No primeiro gráfico (Figura 20a), estão plotados os

valores de Q2 versus R

2. Todos os valores de R

2 obtidos para os 100 modelos aleatorizados

estão bem abaixo do limite recomendado, que é 0,4 (o valor de Q2 e de R

2 do modelo correto

Page 84: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

84

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

foi incluído para comparação). Os gráficos das Figuras 20b e 20c foram construídos usando os

valores absolutos dos coeficientes de correlação de Pearson, |r|, entre os valores aleatorizados

da atividade biológica (yal) e os valores originais (y) no eixo das abscissas, e os valores de R2

ou Q2

LOO de cada um dos modelos (original e dos modelos obtidos após a aleatorização) no

eixo das ordenadas. Fazendo o ajuste de uma reta aos pontos dos gráficos, ela deve ter

intercepto menor do que 0,05 no gráfico de Q2 e menor do que 0,3 no de R

2.

(a)

(b) (c)

Figura 20. Gráficos dos resultados obtidos no teste de aleatorização de y. (a) Q2 em

função de R2 para 100 randomizações. (b) Coeficientes de correlação absoluto entre y

aleatorizado (yal) e os respectivos valores originais (y) versusR2. (c) Coeficientes de correlação

absoluto entre y aleatorizado (yal) e os valores originais (y) versus Q2.

Page 85: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

85

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

A qualidade do ajuste do modelo de regressão pode ser vista através dos gráficos

do valor experimental de LogRA versus o valor estimado (Figura 21a) e do gráfico do valor

previsto de LogRA versus resíduos (Figura 21b).

(a)

(b)

Figura 21. (a) Gráfico dos valores experimentais versus os valores estimados de

LogRA para o modelo de regressão PLS construído com 2 fatores. (b) Gráfico dos valores

previstos versus resíduos (LogRAexp - LogRAprev).

Page 86: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

86

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Como todos os testes foram tão bem sucedidos, pode-se assegurar que o modelo

obtido satisfaz aos critérios de validação.

Para a construção do modelo final de QSAR-2D, os compostos foram divididos

em dois conjuntos: o conjunto de treinamento (110 compostos) e o conjunto de avaliação (50

compostos). Todo o processo de modelagem foi repetido, de modo que os compostos do

conjunto de validação externa não participassem do processo como um todo.

Os seguintes compostos foram excluídos para formar o conjunto de validação

externa: 1, 2, 4, 5, 8, 10, 15, 17, 19, 21, 22, 24, 31, 42, 47, 59, 61, 69, 70, 72, 73, 86, 87, 88,

93, 103, 106, 107, 109, 110, 111, 116, 122, 123, 128, 129, 133, 134, 139, 147, 150, 151, 158,

160, 165, 167, 173, 175, 178, 180. A análise hierárquica de grupamentos foi empregada a fim

de selecionar os compostos do conjunto de treinamento, garantindo que estejam

homogeneamente distribuídos em toda a faixa de atividade. O dendrograma foi construído

usando o método completo de aglomeração pode ser visto na Figura 22. Nota-se que os

compostos excluídos (representados por pontos) estão homogeneamente dispostos de acordo

com as faixas de atividade biológica.

Figura 22. Dendrograma destacando os compostos selecionados para formarem o

conjunto de validação externa.

Page 87: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

87

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

O modelo final (equação 21) foi construído com os 110 compostos do conjunto de

treinamento e duas variáveis latentes (A = 2).

LogRA = 0,62SCORE + 0,11ASA_H + 0,13%RB – 0,14Mor3e

(21)

LogRA = – 1,43 + 0,48SCORE + 0,001ASA_H + 0,042 %RB – 0,056Mor03e

Os parâmetros estatísticos produzidos foram os seguintes: R2 = 0,71; RMSEC =

0,553; Q2

LOO = 0,69; RMSECV =0,573; R2

pred = 0,52 e SEP= 0,60. Esse modelo final

construído com 110 compostos e com os quatro descritores selecionados anteriormente é bem

semelhante ao modelo inicial (construído com os 160 compostos).

De acordo com o modelo proposto (equação 21), os seguintes descritores

apresentam coeficientes de regressão positivos: SCORE (+ 0,62), ASA_H (+ 0,11) e %RB (+

0,13 ), o que sugere uma contribuição favorável para a atividade farmacológica. Por outro

lado, o coeficiente de regressão do descritor Mor03e é negativo (– 0,13), o que desfavorece a

atividade farmacológica.

SCORE é um descritor multivariado a priori, proposto com base nas fórmulas

moleculares dos compostos e sua relação com a atividade biológica. Ele é constituído de

várias contribuições dos substituintes e do esqueleto da artemisinina. Nessas contribuições

são considerados o tamanho e a flexibilidade do substituinte, presença de inversão e

impedimento estérico, além de outros efeitos. O descritor SCORE é a soma das 14

propriedades definidas a seguir:

R – anel de 7 membros: 0 se o anel é fechado; -1 se o anel é de 6 membros e -2 se

o anel é aberto.

D – ligação dupla no carbono C9: -1 se ela está presente e 0 se ausente.

A – substituinte no carbono C9: -2 se ele está presente e 0 se ausente.

B - substituinte no carbono C9: -1 se ele está ausente, 0 se ele está ausente mas

há substituinte em C9, ou se eles está presente incluindo sistemas que apresentem ligações

duplas ou anéis; -2 se há substituinte altamente polar; 1 para os de cadeias longas e

flexíveis; -2 para sistema de anel com ligação dupla em C10; -3 como no caso anterior, se

C10não é H; -2 se há sistema , que contribui par ao impedimento estérico.

Page 88: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

88

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

C - substituinte no carbono C3: -1 se está ausente, 0 se presente (principalmente

hidrofóbico) ou outro caso especial, 1 se presente como substituinte anfifílico ou polar (pelo

menos dois heteroátomos, com boas propriedades de doador/aceptor).

N - substituinte átomo de nitrogênio N11: 0 se está ausente ou outro (rígido ou

bastante polar); 1 se presente (muito pequeno ou muito flexível), hidrofóbico ou anfifílico.

T - duas cadeias laterais longas (2>= sem átomos de H): -1 se as direções são

opostas (ambos hidrofóbicos), 0 para a mesma direção ou outros casos (um é hidrofóbico).

H – heteroátomo (s) no anel de 7 membros: -1 se ele está presente e 0 se ausente;

M - Cadeias flexíveis com mais de um átomo de não-H, não considerando a

posição C10, N11 e sistemas de ligação dupla (ao menos que estas sejam partes de uma

cadeia flexível): 0 se ausente; 1 se presente e de tamanho moderado e 2 se presente e muito

longa.

O - substituintes contendo o oxigênio ou flúor na parte superior do anel de 6

membros (nas posições C4, C5, C6 e C7): 0 se ausente; 1 se presente e 2 para dois

substituintes presentes;

G – grupo metil na posição C6: 0 para presente, -1 para ausente;

F – substituinte no carbono C10, contendo cadeia flexível com pelo menos dois

heteroátomos em grupos com boas propriedades doador/aceptor (átomos de O, S e N): 0

para ausente, 1 para presente;

I – inversão do átomo X11 e H no átomo de carbono C12 em relação à

artemisinina: 0 se ausente ou outro (não é contado se o anel de 7 membros é aberto) e -2 se

presente.

P - inversão do grupo peróxido nas posições C3 e C12a em relação à

artemisinina: 0 se ausente, -1 se presente;

S – é o valor final do descritor SCORE, que corresponde à soma de todas as

contribuições definidas acima, para cada composto.

O descritor ASA_H está relacionado à superfície acessível ao solvente de todos os

átomos hidrofóbicos (qi < 0,125; tal que qi é o valor absoluto da carga parcial do átomo)

determinada através da passagem de uma molécula de água (sonda) com raio de 1,4Å que

percorre a superfície total do ligante [134,142]. Esse descritor depende da conformação e das

cargas parciais na molécula, e fornecendo informações relevantes visto que sugere a presença

de interações hidrofóbicas e/ou de van de Waals entre o ligante e o receptor.

Page 89: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

89

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

O descritor %RB [143] está relacionado com o número de ligações com rotação

livre na molécula. Ele é definido como a razão entre o número de ligações que apresentam

rotações livres e o número total de ligações na molécula, incluindo as dos átomos de

hidrogênio. São consideradas rotações livres as seguintes ligações: todas as ligações simples

não pertencentes a um anel ou envolvendo átomos de hidrogênio. Estão excluídas também da

contagem, as ligações a átomos terminais pesados (CH3, NH2 etc), as ligações duplas e triplas

e as ligações amida, tioamida e sulfonamida, devido à sua elevada barreira de energia de

rotação. Como exemplo, podemos usar a artemisinia que possui no total 45 ligações mas

nenhuma ligação com rotação livre. Neste caso, %RB = 0. O valor do descritor %RB para o

composto 59 é 8,06. Nesse caso tem-se um total de 62 ligações, das quais 5 são rotações

livres.

O descritor Mor03e pertence à serie dos descritores de 3D-MORSE (do inglês

Molecule Representation of Structure based on Electron diffraction) [144-146]. A função de

cálculo (equação 22) foi obtida a partir da equação de difração de elétrons. Para essa função, s

é o parâmetro de espalhamento, rij é a distancia entre o i-ésimo átomo e o j-ésimo átomo; N é

o número total de átomos na molécula e Ai e Aj são as diferentes propriedades usadas como

pesos.

N

i

i

j ij

ijji

sr

srAAsI

2

1

1

sin)( (22)

Os descritores 3D-MORSE [144-146] normalmente são calculados com pesos

diferentes. Os seis pesos mais utilizados são: 1) Ai = Aj = 1, quando não são atribuídos

nenhum peso (não ponderado);. 2) o descritor é ponderado pela massa atômica; nesse caso, a

contribuição dos átomos de hidrogênio é praticamente eliminada enquanto que as

contribuições de átomos pesados com cloro, bromo e iodo são bastante intensificadas; 3) O

volume atômico van der Waals é o fator de ponderação; novamente diminuindo

significativamente a contribuição dos átomos de hidrogênio e atribuindo mais peso aos

átomos mais volumosos; 4) o fator de ponderação é a eletronegatividade de Sanderson [144-

146]; nesse caso, maiores contribuições são dadas pelos átomos de flúor, oxigênio, nitrogênio

e cloro; 5) o fator de ponderação é a polarizabilidade que atua de modo similar ao volume de

van der Waals. A principal diferença está no efeito de metais, quando presentes (não é muito

utilizado em química medicinal); 6) carga atômica; que diferentemente dos outros pesos, pode

Page 90: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

90

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

ter valores positivos e negativos. Além disso, os pesos não são constantes por meio dos

átomos e dependem da vizinhança. Esse fator de ponderação é bem significativo, porque

reflete a distância entre os átomos com excesso e deficiência de densidade eletrônica. Nesse

trabalho, a eletronegatividade de Sanderson, designada como E, foi o fator de ponderação

utilizado.

Quanto ao fator de espalhamento s da equação 22, ele é sempre positivo e um

número inteiro. Por exemplo, os valores do parâmetro de espalhamento para o descritor

Mor01e é s = 0 Å-1

e para o descritor Mor02e é s = 1 Ǻ-1

e assim por diante (a letra ―E‖ no

final do nome do descritor indica a ponderação, A, utilizada e o número 01, 02, etc se refere

ao fator de espalhamento). Neste trabalho, o fator de espalhamento utilizado foi s = 2 Ǻ-1

, que

corresponde à designação Mor03e.

A artemisinina e vários dos seus derivados contêm apenas átomos de carbono,

oxigênio e hidrogênio cujas eletronegatividade de Sanderson são 2,746, 3,654 e 2,592,

respectivamente, e os valores dos pesos A utilizados são normalizados pela eletronegatividade

do carbono resultando nos valores AC = 1; AO = 1,33 e AH = 0,94. Distâncias maiores do que 3

Ǻ pouco contribuem para o valor final do somatório da equação 22 pois a distância entre dois

átomos aparece na função seno (função periódica), no numerador e também no denominador.

Com o objetivo de auxiliar na discussão dos resultados, os compostos serão

agrupados em tabelas, que serão discutidas separadamente. Os descritores selecionados serão

analisados com base nas posições dos átomos de carbono C3, C5, C6, C7, C9 e C10.

Para a análise da Tabela 10, cada descritor será avaliado considerando diferentes

substituintes contendo átomos de hidrogênios nas posições beta e alfa do carbono C9 e a

carbonila na posição C10.

Page 91: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

91

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 10. Análise dos descritores SCORE, ASA_H, %RB e Mor03e para os

compostos selecionados com substituição na posição C3.

Composto Descritor Composto Descritor Composto Descritor

0,00■

326,96*

0,0

-9,00**

0,00■

388,76*

5,88

-12,00**

0,00■

325,49*

2,22

-10,00**

0,00■

365,15*

4,17

-11,00**

0,00■

505,13*

8,06

-14,00**

0,00■

374,99*

3,92

-11,00**

0,00■

491,04*

6,78

-12,00**

1,00■

432,97*

9,26

-12,00**

-1,00■

440,80*

5,36

-11,00**

SCORE■, ASA_H*, %RB

e Mor03e**

I. Descritor SCORE

As contribuições do descritor SCORE estão dispostas na Tabela 11. Como os

compostos presentes na Tabela 10 não possuem grupos substituintes na posição beta do

carbono 9, então B = -1. Possuindo grupos substituintes, principalmente hidrofóbicos, na

posição C3, a contribuição C é igual a zero (C = 0). A exceção é o composto 115 cujo

substituinte é polar contendo dois heteroátomos com propriedades de doador/aceptor (C = 1).

Todos os compostos apresentam cadeias flexíveis de tamanho moderado e, portanto, M = 1.

Esta característica é importante para a interação entre o ligante e o grupo heme.

Page 92: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

92

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 11. Análise de contribuições para o descritor SCORE. S é o valor final do

descritor (a soma de todas as contribuições).

No. Y R D A B C N T H M O G F I P S

14 0,00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

10 -0,74 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

15 0,05 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

19 0,83 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

59 0,45 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

68 -0,35 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

95 0,10 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

115 0,37 0 0 0 -1 1 0 0 0 1 0 0 0 0 0 1

117 0,52 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

II. Descritor ASA_H

O descritor ASA_H se relaciona à área superficial de todos os átomos

hidrofóbicos. Ao aumentar a área dos substituintes hidrofóbicos na posição C3, verifica-se

que há um aumento no valor do descritor. Dois compostos possuem substituintes que não são

hidrofóbicos (os compostos 95 e 115).

Nota-se uma tendência em aumentar o valor desse descritor com o aumento na

atividade biológica. Esse efeito é notado com os compostos 15 e 19 que apresentam,

respectivamente, os substituintes C2H5 e C3H7. Entretanto, o mesmo efeito não ocorre para o

composto 10 (LogRA= -0,74) que possui como substituinte o grupo C4H9 (um grupo metila a

mais). Esta análise sugere que para esse substituinte deve haver algum impedimento estérico

na interação com o grupo heme, que é prejudicial para a atividade desses compostos.

Comparando o composto 19 com os compostos 68 e 117 observa-se que a

ramificação (i- C4H9) ou a inserção de um anel aromático de cadeia curta (C2H4(C6H5))

ocasionou a diminuição da atividade biológica. No entanto, grupos aromáticos inseridos na

posição C3 também podem acarretar um incremento na atividade. Isto pode ser notado nos

Page 93: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

93

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

compostos 59 e 95 que apresentam, respectivamente os seguintes grupos hidrofóbicos:

C4H8(C6H5) e C3H6(p-Cl C6H4). Para estes compostos, quanto maior o número de átomos de

carbono ligados ao anel benzênico maior será a atividade do composto. No entanto, este

incremento não ocorreu para o composto 117 (LogRA= -2,00) que possui apenas dois grupos

metila no substituinte C2H4(C6H5).

A substituição de um grupo hidrofóbico por um grupo hidrofílico favoreceu a

atividade do composto 115, indicando a existência de alguma interação polar com o receptor.

III. Descritor %RB

O descritor %RB nos informa sobre a fração de ligações com rotação livre na

molécula. Um incremento no substituinte aumenta o número de rotações livres e também o

número total de ligações. A Tabela 12 contém o número de ligações com rotação livre e o

número total de ligações para os compostos da Tabela 10. Os compostos 10 e 68 são

isômeros, mas o número de rotações livres é diferente e, portanto, o valor do descritor. Os

compostos 10 e 117 têm o mesmo número de rotações livres, mas o número total de ligações é

diferente. O composto 19 é o mais ativo da Tabela 10 e tem um total de 48 ligações, das quais

2 são rotações livres. No entanto, o composto 117, o mais inativo dessa série, apresenta um

total de 56 ligações e 3 rotações livres.

Esse descritor é positivamente correlacionado com a atividade biológica. Espera-

se então, que um acréscimo na atividade biológica cause um aumento no valor do descritor, o

que nem sempre é verdade uma vez que ele é incapaz de reconhecer substituintes volumosos

como o anel aromático no composto 117. Os análogos 59, 95 e 117 possuem os seguintes

substituintes aromáticos: C4H8(C6H5), C3H6(p-Cl C6H4) e C2H4(C6H5). Os compostos 59 e 95

são mais ativos do que a artemisinina e o composto 117 é o menos ativo do grupo. Seus

valores para o descritor %RB são, na devida ordem, 8,06, 6,78 e 5,36, respectivamente.

A Figura 23 mostra a tendência observada para o descritor e a atividade, LogRA.

Page 94: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

94

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 12. Contribuições do descritor %RB para os compostos da Tabela 10. (BC =

número de ligações no composto; RBC = número de ligações com rotação livre).

No BC RBC %RB = (RBC./BC)*100

14 45 0 0

10 51 3 5,88

15 45 1 2,22

19 48 2 4,17

59 62 5 8,06

68 51 2 3,92

95 59 4 6,78

115 54 5 9,26

117 56 3 5,36

Figura 23. Gráfico da relação entre o descritor %RB e LogRA para os compostos da

Tabela 10.

O comportamento geral dos dois descritores discutidos até o momento é

praticamente o mesmo: aumentando o número de carbonos da cadeia de substituintes n-

alcanos observa-se que há um incremento da atividade até 3 átomos de carbono e, a seguir,

uma diminuição da mesma, mas não do descritor. A introdução de ramificação ou de um anel

Page 95: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

95

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

volumoso de cadeia curta causou decréscimo no valor do descritor e também da atividade.

Ambos descritores não reconhecem explicitamente grupos polares na molécula, como o

descritor SCORE e o descritor Mor03e, que discutiremos a seguir. Eles descrevem

principalmente o tamanho das regiões hidrofóbicas e a flexibilidade dos substituintes, que se

mostraram importantes para a atividade biológica.

Segundo Costa et al [37], com base em um estudo conformacional realizado

empregando o método semiempírico PM3, a artemisinina se posiciona paralelamente ao plano

do anel porfirínico do grupo heme. O oxigênio1 do anel peróxido está dirigido para a parte

polar central do heme que contém o íon Fe2+

. As partes polares e hidrofóbicas (grupos metil)

da artemisinina estão, respectivamente, direcionadas para as regiões polares (área central Fe-

N) e hidrofóbicas (grupos metil e etil) do receptor heme. No trabalho realizado por Pinheiro et

al [49] uma série de estruturas foram otimizadas pelo método HF/6-31G* e descritores

moleculares calculados. Foram empregadas metodologias de gráficos moleculares e docking.

Assim como, Costa et al [37] esse estudo concorda que as interações ocorrem principalmente

por intermédio dos átomos hidrogênios axiais (5a, 8a, 4, 7,9) e um átomo de hidrogênio de

cada grupo metil (3-Me, 6-Me, 9-Me). Esse estudo confirmou os resultados obtidos por

Cheng e colaboradores [147], os quais também detectaram interações entre átomos de H da

artemisinina e o anel porfirínico do grupo heme em um estudo de docking flexível e QSAR-

3D, ao considerar a flexibilidade das cadeias laterais do heme. A Figura 24 mostra a interação

da artemisinina com o grupo heme conforme estudo realizado por Costa [37]. Note que o

carbono C3 está posicionado na direção das cadeias laterais polares do grupo heme. Isso

poderia justificar o decréscimo da atividade do composto 10 e o acréscimo da atividade do

composto 115.

Figura 24. Interação da artemisinina com o heme (átomos. C - cinza; H;-branco, O -

vermelho; N - violeta Fe - verde). Adaptado da referência [37].

Page 96: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

96

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

IV. Descritor Mor03e

Como o descritor SCORE, o descritor Mor03e considera a polaridade bem como o

tamanho dos grupos substituintes na molécula. Esse é o único descritor inversamente

correlacionado à atividade biológica. Ele é constituído de uma soma das distâncias de todos os

pares de átomos na molécula, com contribuições positivas e negativas devido ao caráter

periódico do descritor dado pela função seno. Ao final, o valor do descritor é negativo para

todos os compostos e apresenta uma variação estreita (de -10 a -14). A Figura 25 mostra as

tendências observadas nos valores do descritor e de LogRA dos compostos em discussão, que

estão na Tabela 10. Para os compostos 15, 19 e 10, ao aumentar um grupo metila no

substituinte, aumenta de uma unidade o descritor (negativamente).

Figura 25. Gráfico da relação entre o descritor Mor03e e LogRA.

Para análogos em que seus substituintes possuem anéis aromáticos, à medida que

o número de átomos de carbono ligados ao anel benzênico aumenta, há um acréscimo na

atividade biológica. Em contrapartida, o valor numérico do descritor diminui. Esta relação é

notada por meio dos compostos: 59, 95 e 117, cada um com o seu respectivo grupo

substituinte, C4H8 (C6H5), C3H6 (C6H4Cl) e C2H4 (C6H5);

Os análogos 19, 68 e 117 possuem diferentes substituintes na posição C3: C3H7,

uma ramificação (i- C4H9) e o grupo C2H4(C6H5) que contém um anel aromático,

respectivamente. O valor do descritor Mor03e desses três compostos é o mesmo mas a

Page 97: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

97

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

atividade sofreu um grande decréscimo. Por outro lado, esse é o descritor que apresenta uma

descrição razoável para os compostos inativos (10, 68 e 117).

A presença de um grupo hidrofílico na posição C3 favoreceu a atividade do

composto 115 e o valor numérico do descritor é o segundo mais negativo.

Terminada a discussão dos análogos da artemisinina listados na Tabela 10 e que

possuem substituintes na posição C3, pode-se concluir que o tamanho do substituinte, a sua

flexibilidade e também a polaridade são importantes para a interação com o grupo heme.

Substituintes ramificados e volumosos mas de cadeia curta desfavorecem a atividade, mais

provavelmente devido ao impedimento estérico com o receptor. A presença de grupos

volumosos mas de cadeia de tamanho moderado favorece a atividade biológica. O composto

115 tem um éster que pode promover a formação de alguma ligação de hidrogênio com

cadeias laterais do grupo heme.

A seguir serão discutidos os análogos da artemisinina com substituição na posição

do carbono 9 e que estão listados na Tabela 13.

Para a análise da Tabela 13 foram fixados um grupo metil na posição C3, a

carbonila na posição C10 e, somente, a cadeia de n-alcanos na posição C9 foi modificada.

Ela está constituída de duas partes. Na primeira, com 15 compostos, há somente substituintes

hidrofóbicos (contendo carbono e hidrogênio). Isso será importante na discussão dos

descritores ASA_H e Mor03e. O aumento da cadeia n-alcano é o fator que mais afeta a

atividade. Os compostos 1, 17 e 83 são os mais ativos dessa série. O acréscimo de grupos

metila nos compostos ramificados (13, 67, 93 e 94) em geral não afetam a atividade, que é

aproximadamente igual à da artemisinina (exceto o composto 67 que é mais inativo).

Compostos contendo dupla ligação (58, 65 e 66) são prejudiciais à atividade.

Page 98: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

98

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 13. Análise dos descritores SCORE, ASA_H, %RB e Mor03e para os

compostos selecionados na posição C9.

Composto Descritor Composto Descritor Composto Descritor

0,00■

326,96*

0,0

-9,00**

-2,00■

406,19*

3,85

-9,00**

1,00■

439,30*

5,26

-12,00**

1,00■

485,16*

8,33

-14,00**

-2,00■

422,86*

3,85

-10,00**

1,00■

479,35*

5,08

-12,00**

1,00■

378,42*

1,96

-12,00**

1,00■

400,89*

3,70

-11,00**

1,00■

511,14*

6,45

-12,00**

1,00■

390,29*

3,92

-11,00**

1,00■

461,99*

7,02

-13,00**

1,00■

543,82*

7,69

-14,00**

0,00■

505,13*

4,08

-10,00**

1,00■

483,29

6,67

-14,00

-1,00■

511,23*

6,45

-13,00**

SCORE■, ASA_H*, %RB

e Mor03e**

Page 99: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

99

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 13(continuação). Análise dos descritores SCORE, ASA_H, %RB e Mor03e

para os compostos selecionados na posição C9.

Composto Descritor Composto Descritor Descritor LogRA

1,00■

541,39*

7,35

-13,00**

-1,00■

418,89*

8,82

-17,00**

-2,00

290,72*

4,17

-10,00**

1,00■

475,43*

6,35

-12,00**

1,00■

568,80*

7,04

-13,00**

0,00

335,82*

6,00

-12,00**

-1,00■

418,49*

8,82

-17,00**

-1,00■

579,29*

7,04

-15,00**

-2,00

302,51*

2,17

-10,00**

SCORE■, ASA_H*, %RB

e MoR03e**

I. Descritor SCORE

Os análogos 1, 13, 17, 67, 83, 93 e 94 possuem cadeias flexíveis (Tabela 14) com

mais de um átomo de não-H e de tamanho moderado (M = 1); possuem substituinte na

Page 100: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

100

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

posição C9 (B = 0). O descritor SCORE é igual a 1 para todos os compostos que, exceto o

composto 67, são mais ativos ou têm atividade próxima da artemisinina.

Tabela 14. Análise de contribuições de diferentes substituintes no carbono C9 para o

descritor SCORE.

No. Y R D A B C N T H M O G F I P S

14 0,00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

1 0,86 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

13 -0,04 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

17 1,13 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

67 -0,55 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

83 1,02 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

93 -0,04 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

94 0,07 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

Com respeito aos compostos 58 (C3H5), 65 (Z- CH2CH = CHCH3) e 66 (E-

CH2CH = CHCH3), foram consideradas as seguintes características para a análise do descritor

SCORE (Tabela 15): i) o composto 58 possui substituinte em C9 (B = 0); ii) os isômeros 65 e

66 possuem o grupo substituinte na posição alfa do carbono C9 (A = - 2).

Com base nestas informações, pode-se observar que os valores dos descritor

SCORE indica o comportamento correto. A presença da dupla ligação afetou de forma

negativa a atividade biológica e os grupos substituintes na posição C9 contribuíram para

diminuir ainda mais a atividade desses análogos com SCORE = -2.

Tabela 15. Análise de contribuições de diferentes substituintes no carbono C9 para o

descritor SCORE.

No. Y R D A B C N T H M O G F I P S

14 0,00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

58 0,86 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

65 -1,14 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

66 -0,60 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

Page 101: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

101

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Os compostos 128, 129 e 130 possuem substituintes aromáticos. O descritor

SCORE (Tabela 16) desses compostos tem as seguintes contribuições: i) possuem anéis

aromáticos (B = 0) e cadeias flexíveis com mais de um átomo de não-H (M = 1), exceto para o

composto 128 que tem cadeia flexível pequena comparada ao anel aromático volumoso. Há

um aumento do número de átomos de carbono ligados ao anel aromático e, consequentemente,

um aumento da atividade. Em seguida ocorre uma ligeira diminuição da atividade, mesmo

aumentando o número de carbonos da cadeia. ii) O composto 144 tem substituinte na posição

alfa (A = -2) e difere do seu isômero 129 que apresenta o substituinte no carbono C9 (A = 0).

Com isto houve um pequeno decréscimo na atividade. Os compostos 146, 147, 148, 149 150 e

151 possuem: i) anéis aromáticos (B = 0); ii) cadeias flexíveis com mais de um átomo de não-

H e de tamanho moderado (M = 1). Os compostos 146 e 147 têm o mesmo valor de SCORE =

1 e que é igual ao do composto 144; a atividade dos três é diferente e verifica-se que a inserção

de grupos polares é prejudicial à atividade. O composto 149 difere do seu isômero 148 por

apresentar o substituinte em C9(A = -2). Esta diferença ocasionou um pequeno incremento

na atividade deste composto, mas um decréscimo no valor do descritor. Segundo o descritor

SCORE, o isômero 151 diferencia do 150 pela presença do grupo substituinte em C9 (A = -

2). Observa-se que a presença do substituinte em C9 contribuiu para o composto 151 tornar-

se menos ativo.

Tabela 16. Análise de contribuições de diferentes substituintes no carbono C9 para o

descritor SCORE.

No. Y R D A B C N T H M O G F I P S

14 0,00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

128 0,12 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

129 0,78 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

130 0,63 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

144 0,63 0 0 -2 0 0 0 0 0 1 0 0 0 0 0 -1

146 -0,14 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

147 0,49 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

148 -0,04 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

149 0,25 0 0 -2 0 0 0 0 0 1 0 0 0 0 0 -1

150 0,11 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

151 -0,63 0 0 -2 0 0 0 0 0 1 0 0 0 0 0 -1

Page 102: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

102

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Os compostos 173 e 177 são inativos (Tabela 17). Este fato pode ser justificado

pelo fato deles possuírem grupos substituintes altamente polares (B = -2). Outra característica

relevante está na não flexibilidade desses grupos substituintes. O composto176 (LogRA= -

0,03) possui instauração (B = 0) e é ligeiramente menos ativo que a artemisinina.

Tabela 17. Análise de contribuições de diferentes substituintes no carbono C9 para o

descritor SCORE.

No. Y R D A B C N T H M O G F I P S

14 0,00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

173 -1,79 0 0 0 -2 0 0 0 0 0 0 0 0 0 0 -2

176 -0,03 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

177 -1,59 0 0 0 -2 0 0 0 0 0 0 0 0 0 0 -2

II. Descritor ASA_H

Considerando os compostos da primeira parte da Tabela 13, todos os substituintes

são hidrofóbicos. Espera-se que ao aumentar a área superficial hidrofóbica do substituinte, o

valor do descritor deverá aumentar. Como esse descritor é proporcional à atividade biológica,

espera-se que aumentando a atividade, o valor do descritor aumente também. Em alguns casos

esta tendência é confirmada (como, por exemplo, nos n-alcanos) e em outros não. A presença

de substituintes ramificados aumenta o valor do descritor e no entanto, exceto para o

composto 67 que é inativo, os outros (13, 94 e 93) têm atividades semelhantes à da

artemisinina. Além disso, a presença de ligação dupla prejudica a atividade; no entanto, o

valor do descritor sofreu acréscimo (compostos 58, 65 e 66). O aumento do número de

átomos de carbono ligados ao anel benzênico contribui favoravelmente para o descritor e para

a atividade biológica de maneira geral (compostos 128, 129, 130 e 144).

A adição de grupos polares nos compostos 130 ou 144 aumenta ou decresce

ligeiramente o valor da área superficial hidrofóbica, mas estas adições são prejudiciais à

atividade (compostos 129, 144, 146, 148, 149, 150, 151). Os compostos 175 e 177 são os

menos ativos e os que têm os menores valores do descritor ASA_H. É interessante notar que

esse descritor distinguiu muito bem os isômeros cis e trans (compostos 65 e 66), e muito

discretamente substituintes nas posições alfa ou beta (129 e 144; 150 e 151).

Page 103: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

103

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

III. Descritor %RB

O composto 1 é o que tem o maior valor de %RB da Tabela 13, com um total de

60 ligações, das quais 5 são rotações livres. O valor do descritor %RB para esse composto é

8,33. O seu isômero (composto 93) é inativo, com 4 rotações livres e um valor de 6,67 para

%RB. É importante mencionar, que esse descritor não distingue isômeros em posições alfa e

beta como no caso dos compostos 129 e 144; 148 e 149; 150 e 151 que possuem os mesmos

valores numéricos para %RB, 6,45; 8,82 e 7,04. Ele não distingue também isômeros cis e

trans (compostos 65 e 66).

A Figura 26 mostra a tendência observada para o descritor e a atividade, LogRA.

Figura 26. Gráfico da relação entre o descritor %RB e LogRA.

De modo geral, compostos ativos têm valores de %RB mais altos. A tendência

descritor-atividade é visível nos compostos 148, 149, 150, 151, 173 e 177. Há uma tendência

dos compostos menos ativos apresentarem %RB menores (65, 66, 173 e 177).

Page 104: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

104

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

IV. Descritor Mor03e

A Figura 27 mostra as tendências observadas nos valores do descritor MoR03e e

de LogRA dos compostos em discussão, que estão na Tabela 13. A tendência esperada para os

compostos dessa série seria um decréscimo no valor do descritor (mais negativo) com o

aumento da atividade. Essa tendência é observada nos compostos 65, 66 e 67. Esse descritor,

como o anterior, também distinguiu isômeros do tipo cis-trans e compostos com substituintes

nas posições C9 e C9. Com o aumento do número de átomos da cadeia de n-alcanos foi

observada uma diminuição do valor numérico do descritor, bem como, uma diminuição

gradativa da atividade biológica ao contrário do esperado. Esse efeito é visível nos compostos

C3H7 (LogRA = 1,13), C5H11 (LogRA = 1,02) e C6H13 (LogRA = 0,86) com os seguintes

valores para Mor03e : -11,00, -13,00 e -14,00.

Compostos com substituintes ramificados apresentam valores numéricos para o

descritor Mor03e iguais ou um pouco maior que seus isômeros n-alcanos. Por exemplo, os

isômeros 1 e 93; 83 e 94 possuem os seguintes valores para Mor03e, respectivamente: -14,00,

-14,00, -13,00 e -12,00.

Quando o número de átomos de carbono ligados ao anel benzênico aumenta, o

valor numérico do descritor tende a diminuir. No entanto, a atividade biológica aumenta como

esperado, mas logo, há uma ligeira diminuição da mesma, por exemplo, os análogos 128

(LogRA= 01,2) , 129 (LogRA= 0,78), e 130 (LogRA= 0,63). Os valores do descritor Mor03e

para cada análogo estão na seguinte ordem: -12,00, -12,00, e -14,00. O composto144 tem o

valor numérico para o descritor menor que seu isômero 129, bem como a atividade. Os

isômeros 148 (LogRA= -0,04) e 149 (LogRA= 0,25) possuem os menores valores para

Mor03e. Isto pode ser sugerido pela presença de átomos de flúor que são muito

eletronegativos. O análogo 149 difere do 148 por apresentar o substituinte na posição C9,

favorecendo o aumento da atividade desse composto.

Os compostos 176 e 173 são os menos ativos e possuem valores altos (menos

negativos) para o descritor.

Page 105: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

105

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Figura 27. Gráfico da relação entre o descritor Mor03e e LogRA.

A seguir, serão discutidos os compostos listados na Tabela 18. Essa análise foi

feita fixando a carbonila do carbono C10, o substituinte C4H9 na posição C9, o hidrogênio na

posição C9 e modificando o substituinte em C3.

Page 106: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

106

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 18. Análise dos descritores SCORE, ASA_H, %RB e Mor03e para os

compostos selecionados com substituinte na posição C3, mantendo o substituinte em C9 fixo.

Composto Descritor Composto Descritor Composto Descritor

0,00■

326,96*

0,0

-9,00**

-1,00■

652,56*

10,81

-18,00**

1,00■

580,29*

12,12

-17,00**

-0,48

-1,00■

535,95*

9,52

-16,00**

638,55*

9,86

-16,00**

-1,00■

472,66*

7,02

-14,00**

SCORE ■

, ASA_H*, %RB

e Mor03e**

Comparando os compostos 10 e 15 da Tabela 10 com os compostos 13 e 159 da

Tabela 18 pode-se verificar que a introdução do substituinte em C9 causou acréscimo na

atividade. O contrário ocorreu para os compostos 60 e 91, comparados aos compostos 59 e 95

quando a introdução do substituinte C4H9 na posição C9 causou um decréscimo na atividade.

Na Tabela 18, somente os compostos 159 e 92 são mais ativos do que a artemisinina. O que

chama a atenção é o composto 92 que, comparado ao composto 115 da Tabela 10, sofreu um

aumento substancial na atividade biológica. O composto 115 teve a sua atividade aumentada

quando um grupo hidrofóbico de tamanho moderado foi inserido na posição beta do carbono

9. Esse fato pode ser explicado ao examinar a Figura 28 que mostra a interação desse

composto com o receptor.

Page 107: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

107

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Figura 28. Composto 92 (LogRA = 1,36) acoplado ao grupo com o heme. Análogo

com os substituintes C5H9O2, C4H9 e H nas posições C3, C9 e C9, respectivamente.

É visível a interação forte da carbonila do éster na posição C3 com o grupo heme.

Por outro lado, o grupo de tamanho moderado e flexível, C4H9, na posição C9 também pode

interagir com grupos hidrofóbicos do heme fazendo com que a atividade do composto 92

aumente significativamente.

I. Descritor SCORE

Os compostos 20, 60, 91 e 159 (Tabela 19) possuem substituintes hidrofóbicos em

C3 (C = 0) e duas cadeias laterais longas hidrofóbicas (≥ 2 sem átomos de H) em direções

opostas (T = -1). Por outro lado, o composto 92 possui substituinte anfifílico ou polar (pelo

menos dois heteroátomos, com boas propriedades de doador/aceptor) além de duas cadeias

laterais longas (≥ 2 sem átomos de H) em direções opostas (uma delas hidrofóbica) (T = 0).

Tais características aumentou, consideravelmente, a atividade deste análogo favorecendo,

assim, a interação ligante-receptor, como foi mostrado na Figura 28.

Page 108: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

108

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 19. Análise de contribuições de diferentes substituintes no carbono C3 para o

descritor SCORE.

No. Y R D A B C N T H M O G F I P S

14 0,00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

20 -0,48 0 0 0 0 0 0 -1 0 0 0 0 0 0 0 -1

60 -0,32 0 0 0 0 0 0 -1 0 0 0 0 0 0 0 -1

91 -0,28 0 0 0 0 0 0 -1 0 0 0 0 0 0 0 -1

92 1,36 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1

159 0,41 0 0 0 0 0 0 -1 0 0 0 0 0 0 0 -1

II. Descritor ASA_H

Todos os compostos apresentam área superficial acessível ao solvente com caráter

hidrofóbico bastante altos. O composto 159 possui na posição C3 um grupo etil, não tão

volumoso, ocasionando um aumento moderado na atividade. Por sua vez, o composto 92, o

mais ativo do grupo, possui um grupo substituinte hidrofílico na posição C3 (C2H4CO2C2H5)

acarretando um considerável aumento na atividade biológica, conforme discutido

anteriormente.

III. Descritor %RB

O gráfico de barras da Figura 29 mostra o comportamento do descritor %RB e de

LogRA para os compostos listados na Tabela 18. O composto 92, o mais ativo, tem um total

de 66 ligações sendo 8 rotações livres. O valor do descritor %RB para esse composto é o mais

alto. Pode-se observar que para os compostos ativos, o descritor %RB mantém a mesma

tendência de LogRA. Para os compostos com LogRA negativos, a tendência correta é

observada para os compostos 26 e 60.

Page 109: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

109

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Figura 29. Gráfico da relação entre o descritor %RB e LogRA.

IV. Descritor Mor03e

Participaram dessa análise os compostos 20, 60, 91, 92 e 159 que possuem os

respectivos valores para o descritor Mor03e: -16,00, -18,00, -16,00, -17,00,-14,00. Com base

na Figura 30, observa-se que para os compostos com LogRA negativo, a atividade e o

descritor Mor03e seguem uma tendência inversa (atividade aumenta e o valor do descritor

diminui, ficando mais negativo ou permanece igual). O mesmo vale para os dois compostos

mais ativos que a artemisinina.

Figura 30. Gráfico da relação entre o descritor Mor03e e LogRA.

Page 110: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

110

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

A análise dos compostos da Tabela 20 foi realizada para elucidar as

características de alguns compostos com pouca ou nenhuma atividade, i.e., todos eles

apresentam LogRA negativos. Os substituintes se encontram nas duas posições do carbono 9

e são duplas ligações ou cíclicos

Tabela 20. Análise dos descritores SCORE, ASA_H, %RB e Mor03e para os

compostos selecionados com substituições nas posições C9(e

Composto Descritor Composto Descritor Composto Descritor

0,00■

326,96*

0,00

-9,00**

-1,00■

304,73*

0,00

-7,00**

-1,00■

349,39*

0,00

-8,00**

-2,07

-0,94

-2,00■

304,36*

0,00

-8,00**

-2,00■

330,56*

0,00

-11,00**

-2,00■

332,72*

0,00

-9,00**

-2,09

573,93*

-2,00■

0,00

-8,00**

349,91*

-2,00■

0,00

-11,00**

SCORE ■

, ASA_H*, %RB

e Mor03e**

I. Descritor SCORE

Segundo o descritor SCORE os compostos da Tabela 20 possuem as seguintes

características (Tabela 21):

i. Os compostos 2 e 3 possuem uma dupla ligação ( D= -1) em C9 (B = 0);

Page 111: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

111

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

ii. Os compostos 48, 63, 109 e 170 não têm instauração (D = 0) mas, possuem

sistema de anéis (B = 0) em C9 (A =- 2) e C9.

Os valores de SCORE de todos os compostos da Tabela 20 são negativos. Como

esperado, um decréscimo na atividade causa um decréscimo no valor do descritor. Esta

análise não recomenda substituintes com instauração e nem a presença de anéis na posição

C9, pois são prejudiciais para a atividade.

Tabela 21. Análise de contribuições de diferentes substituintes na posição C9 ( e

para o descritor SCORE.

No. Y R D A B C N T H M O G F I P S

14 0,00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

2 -0,89 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 -1

3 -0,36 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 -1

48 -2,09 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

63 -2,70 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

109 -1,24 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

170 -2,09 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

II. Descritor ASA_H

O composto 109, com LogRA = - 1,24, possui a maior área superficial

hidrofóbica acessível ao solvente. Isto acarretou um maior valor numérico para o descritor

ASA_H. Todos os outros substituintes são bem pequenos e, portanto, possuem valores de

ASA_H próximos ao da artemisinina.

III. Descritor %RB

Os substituintes das posições C9 ( e dos compostos da Tabela 20 não são

flexíveis (%RB = 0 para todos eles). Por exemplo, o composto 48 possui no total 45 ligações,

mas nenhuma ligação com rotação livre. A falta de flexibilidade dos compostos contribui para

que não ocorra interação com o grupo heme, diminuindo drasticamente a atividade biológica.

Page 112: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

112

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

IV. Descritor Mor03e

A Figura 31 ilustra o comportamento desse descritor e da atividade biológica. Os

compostos 2 e 3 são os únicos com dupla ligação em C9 e C9. Um decréscimo no valor do

descritor é acompanhado de um acréscimo no valor de LogRA, como esperado. Todos os

outros compostos possuem substituintes cíclicos. Os compostos 63 e 170, os mais inativos da

Tabela 20, possuem dois átomos de nitrogênio e oxigênio, respectivamente, na posição C9.

Esses elementos de alta eletronegatividade acarretaram um aumento significativo no valor

numérico do descritor Mor03e desses compostos.

Figura 31. Gráfico da relação entre o descritor Mor03e e LogRA

A seguir, serão discutidos os compostos listados na Tabela 21. Essa análise foi

feita a partir das modificações realizadas na posição C10.

Page 113: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

113

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 22. Análise dos descritores SCORE, ASA_H, %RB e Mor03e para os

compostos selecionados na posição C10.

Composto Descritor Composto Descritor Composto Descritor

0,00■

326,96*

0,00

-9,00**

-2,00■

418,98*

3,70

-13,00**

0,00■

396,53*

2,00

-10,00**

0,00■

406,21*

5,36

-14,00**

-2,00■

422,92*

3,70

-12,00**

-1,00■

414,10*

4,00

-12,00**

0,00■

406,55*

3,85

-12,00**

1,00■

505,75*

6,78

-14,00**

1,00■

465,21*

5,36

-13,00**

-1,00■

312,74*

0,00

-7,00**

1,00■

480,28*

6,90

-14,00**

1,00■

381,97*

2,04

-12,00**

SCORE ■

, ASA_H*, %RB

e Mor03e**

Page 114: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

114

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 22(continuação). Análise dos descritores SCORE, ASA_H, %RB e Mor03e

para os compostos selecionados na posição C10.

Composto Descritor Composto Descritor Composto Descritor

0,00■

326,96*

0,00

-9,00**

1,00■

443,37*

5,45

-14,00**

1,00■

433,718*

5,36

-13,00**

1,00■

407,14*

3,85

-12,00**

0,00

482,28*

5,17

-14,00**

-1,00■

415,48*

3,70

-13,00**

0,00■

426,45*

5,77

-12,00**

0,00■

351,80*

2,17

-10,00**

1,00■

413,77*

3,70

-13,00**

0,00■

390,40*

4,08

-12,00**

0,00■

435,58*

3,77

-12,00**

-1,00■

308,32*

2,08

-8,00**

SCORE ■

, ASA_H*, %RB

e Mor03e**

Page 115: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

115

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 22(continuação). Análise dos descritores SCORE, ASA_H, %RB e Mor03e

para os compostos selecionados na posição C10.

Composto Descritor Composto Descritor Composto Descritor

0,00■

326,96*

0,00

-9,00**

-2,00■

311,26*

0,00

-11,00**

1,00■

497,12*

8,06

-13,00**

-1,00■

307,35*

2,08

-10,00**

-2,00■

331,22*

5,56

-14,00**

1,00■

501,68*

8,06

-13,00**

0,00■

349,90*

3,85

-13,00**

1,00■

413,39*

3,92

-9,00**

1,00■

488,80*

8,06

-15,00**

0,00■

396,58

3,64

-14,00

1,00■

497,38

8,06

-14,00

1,00■

392,77*

5,66

-13,00**

SCORE ■

, ASA_H*, %RB

e Mor03e**

Page 116: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

116

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 22(continuação). Análise dos descritores SCORE, ASA_H, %RB e Mor03e

para os compostos selecionados na posição C10.

SCORE ■

, ASA_H*, %RB

e Mor03e**

Composto Descritor Composto Descritor Composto Descritor

0,00■

326,96*

0,00

-9,00**

0,00■

328,55*

0,00

-10,00**

-1,00■

354,70*

0,00

-11,00**

1,00■

410,31*

3,77

-14,00**

0,00■

448,34*

3,77

-12,00**

-3,00■

357,80*

0,00

-9,00**

1,00■

463,34*

6,25

-12,00**

1,00■

419,38*

3,85

-11,00**

1,00■

630,39*

12,36

-17,00**

1,00■

546,58*

6,35

-14,00**

1,00■

400,45*

5,77

-12,00**

0,00■

491,50*

5,00

-13,00**

Page 117: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

117

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 22(continuação). Análise dos descritores SCORE, ASA_H, %RB e Mor03e

para os compostos selecionados na posição C10.

Composto Descritor Composto Descritor Composto Descritor

0,00■

326,96*

0,00

-9,00**

-1,00■

358,64*

0,00

-8,00**

-1,00■

448,01*

3,34

-10,00**

0,00■

519,50*

6,67

-13,00**

1,00■

456,19*

8,70

-

10,00**

1,00■

481,36*

8,47

-14,00**

1,00■

461,35*

9,09

-14,00**

0,00■

496,36*

3,90

-

15,00**

1,00■

557,02*

7,46

-13,00**

0,00■

357,26*

0,00

-11,00**

-1,00■

453,54*

3,39

-

11,00**

1,00■

516,66*

9,68

-14,00**

SCORE ■

, ASA_H*, %RB

e Mor03e**

Page 118: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

118

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 22 (continuação). Análise dos descritores SCORE, ASA_H, %RB e Mor03e

para os compostos selecionados na posição C10.

Composto Descritor Composto Descritor Composto Descritor

0,00■

326,96*

0,00

-9,00**

1,00■

618,82*

7,14

-15,00**

1,00■

545,43*

7,14

-11,00**

0,00■

533,60*

7,94

-15,00**

1,00■

623,12*

9,59

-16,00**

1,00■

479,16*

5,97

-11,00**

0,00■

590,97*

8,22

-14,00**

1,00■

623,72*

9,59

-14,00**

1,00■

481,64*

5,97

-12,00**

0,00■

601,78*

8,22

-15,00**

1,00■

542,92*

7,14

-12,00**

1,00■

596,67*

10,53

-16,00**

SCORE ■

, ASA_H*, %RB

e Mor03e**

Page 119: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

119

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 22(continuação). Análise dos descritores SCORE, ASA_H, %RB e Mor03e

para os compostos selecionados na posição C10.

SCORE ■

, ASA_H*, %RB

e Mor03e**

Composto Descritor Composto Descritor Composto Descritor

0,00■

326,96*

6,94

-14,00**

1,00■

403,05*

8,62

-12,00**

0,00■

310,96*

2,17

-7,00**

1,00■

467,38*

7,46

-13,00**

2,00■

411,27*

5,45

-13,00**

-2,00■

278,42*

0,00

-10,00**

1,00■

441,04*

10,94

-14,00**

1,00■

441,14*

3,57

-13,00**

-3,00■

399,01*

1,96

-9,00**

1,00■

492,72*

8,22

-13,00**

1,00■

555,50*

9,46

-14,00**

0,00■

328,55*

0,00

-9,00**

Page 120: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

120

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

I. Descritor SCORE

Primeiramente serão considerados os substituintes hidroxila ou peróxido na

posição C10.

De acordo com o descritor SCORE (Tabela 23), os análogos 6 e 166 apresentam

duplas ligações na posição C9 (D = -1). Já foi mencionado anteriormente que dupla ligação

nessa posição acarreta uma diminuição da atividade biológica. Os análogos 69, 70, 73 e 167

possuem substituinte na posição C9(A = -2), contribuindo para um decréscimo na

atividade. O análogo 36 é o único com substituinte de cadeia flexível com mais de um átomo

de não-H e tamanho moderado (M = 1) que já sabemos favorecer a atividade. Por sua vez, os

análogos 69,70, 106 e 166 têm substituinte no carbono C10, contendo cadeia flexível com

pelo menos dois heteroátomos em grupos com boas propriedades doador/aceptor (átomos de

O, S e N), (F = 1).

Comparando o composto 88 com a artemisinina (composto 14), vê-se que a

substituição da carbonila pela hidroxila aumentou a atividade. O mesmo pode ser dito para o

composto 4 que tem uma cadeia polar e flexível nessa posição e o composto 106 que tem uma

ligação peróxido com extremidade hidrofóbica.

Tabela 23. Análise de contribuições de diferentes substituintes no carbono C10 para o

descritor SCORE.

No. Y R D A B C N T H M O G F I P S

14 0,00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

4 0,78 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

6 -2,39 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 -1

36 0,96 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

69 -0,62 0 0 -2 0 0 0 0 0 0 0 0 1 0 0 -1

70 -0,57 0 0 -2 0 0 0 0 0 0 0 0 1 0 0 -1

73 -0,89 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

88 0,55 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

106 0,92 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

166 -0,74 0 -1 0 0 0 0 0 0 0 0 0 1 0 0 0

167 -0,72 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

Características como polaridade e flexibilidade colaboraram para o aumento na

atividade, visto que as partes polares e hidrofóbicas da artemisinina [37] estão,

respectivamente, direcionadas para as regiões polares (área central Fe-N) e hidrofóbicas do

grupo heme.

Page 121: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

121

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

A seguir, serão considerados os análogos que possuem átomos de hidrogênio na

posição C10 e que estão na Tabela 24: O composto 111 é o único que tem uma dupla ligação

(D = -1), o que prejudicou a atividade biológica.

Os análogos 5, 29 , 30, 34, 107, 108 e 132 não têm substituinte em C9 (B = -1).

O análogo 108 possui um substituinte anfifílico ou polar (C = 1) com dois heteroátomos, com

boas propriedades de doador/aceptor que já foi considerado anteriormente e se sabe que grupo

polar favorece a interação do ligante com o receptor (heme). Os compostos 5, 22, 26, 27, 29,

30, 31, 34, 87, 107, 108, 132 e 152 têm grupos substituintes de cadeia flexível (Tabela 24),

(M = 1). Ao comparar alguns análogos da Tabela 10 com os da Tabela 24, pode-se observar

que a substituição da carbonila por átomos de hidrogênio na posição C10 melhora a atividade

biológica de análogos com substituinte na posição C3. Isso ocorre para os compostos 5 e 68;

29 e 10; 107 e 95; 108 e 115; 132 e 59. A atividade dos compostos 30 e 19 não mudou. O

mesmo não pode ser concluído para compostos sem a carbonila em C10 e variações no

carbono C9. Comparando os seguintes compostos das Tabelas 24 e 13: compostos 22 e 83; 27

e 17; 150 e 152; observa-se que a substituição da carbonila por átomos de hidrogênio na

posição C10 causa um decréscimo quando há substituintes na posição C9. No análogo 99

ocorreu a inversão do X11 e H no C12 em relação à artemisinina (I = -2) e a inversão do

grupo peróxido em C3 e C12a em relação à artemisinina (P = -1). Do mesmo modo, o

composto 98 apresentou a inversão do grupo peróxido em C3 e C12a em relação à

artemisinina (P = -1). Estas características contribuíram para a baixíssima atividade do

análogo em relação à artemisinina, comprovando a importância do anel endoperóxido na

interação com o receptor (Fe-O1). Os compostos mais ativos são 31 e 87, com substituinte de

cadeia mais alongada e flexível em C9 e átomos de hidrogênio em C10. Estas características

são favoráveis para que haja a interação com o grupo heme.

Page 122: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

122

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 24. Análise de contribuições de diferentes substituintes no carbono C10 para o

descritor SCORE.

No. Y R D A B C N T H M O G F I P S

14 0,00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

5 0,40 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

22 0,16 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

26 0,67 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

27 0,74 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

29 0,75 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

30 0,84 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

31 1,32 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

34 -1,00 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

87 1,84 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

98 -0,24 0 0 0 0 0 0 0 0 0 0 0 0 0 -1 -1

99 -2,59 0 0 0 0 0 0 0 0 0 0 0 0 -2 -1 -3

107 -0,55 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

108 0,70 0 0 0 -1 1 0 0 0 1 0 0 0 0 0 1

111 -0,79 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 -1

132 0,58 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

152 0,01 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

A próxima análise (Tabela 25) foi realizada para os compostos com substituições

OCH3 e OC2H5 na posição C10.

Os análogos 7 e 9 possuem os seguintes grupos substituintes em C9(A = -2):

OH (polar) e CH3 (apolar). Grupos substituintes nessa posição geralmente prejudicam a

interação do análogo com o grupo heme. O análogo 24 é o único do grupo que não tem

substituinte em C9 (B = -1). O análogo 50 tem um heteroátomo na posição C5 do anel de 7

membros (H = -1) acarretando uma diminuição da atividade. Os análogos 21 e 25 têm

substituintes de cadeia flexível e de tamanho moderado (M = 1). Os isômeros 35 e 89

apresentam valores bem próximos de atividade e os valores de SCORE são os mesmos. Os

análogos 53, 78, 84, 85, 96 e 97 possuem substituintes contendo o oxigênio ou flúor na parte

superior do anel de 6 membros (posições C6 e C7) (O = 1). O análogo 157, o mais ativo,

possui substituintes em ambas posições (O = 2), sendo duas metilas com um átomo de flúor

em C7 e um átomo de oxigênio em C6. Ao comparar os compostos 158 e 157 nota-se que a

adição de uma carbonila na metila da posição C6 aumentou, consideravelmente, a atividade

Page 123: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

123

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

biológica. O estudo sugere a presença de um grupo polar nessa posição C6 para favorecer a

interação com o grupo heme.

Tabela 25. Análise de contribuições de diferentes substituintes no carbono C10 para o

descritor SCORE.

No. Y R D A B C N T H M O G F I P S

14 0,00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

7 -0,44 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

9 -1,13 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

21 -0,04 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

23 0,28 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

24 0,43 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 -1

25 0,50 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

35 0,34 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

50 -1,08 0 0 0 0 0 0 0 -1 0 0 0 0 0 0 -1

53 0,34 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1

78 -0,12 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1

84 0,41 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1

85 0,19 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1

89 0,32 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

96 0,16 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1

97 0,21 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1

157 1,62 0 0 0 0 0 0 0 0 0 2 0 0 0 0 2

158 -0,12 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1

A análise seguinte foi realizada para os compostos da Tabela 22 com substituintes

contendo átomos de flúor na posição C10 e as contribuições do descritor SCORE se

encontram na Tabela 26. Apenas o composto 75 possui grupo na posição C9 (A = -2)

prejudicando a interação entre o ligante e o receptor (heme). O composto 71 tem sua atividade

um pouco maior que artemisinina. Este efeito pode ser sugerido por apresentar um volume um

pouco menor na posição C10 em relação aos demais compostos. No composto 72, o átomo de

hidrogênio terminal foi substituído por uma metila, aumentando o volume nessa posição

ocasionando uma diminuição da atividade biológica.

Page 124: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

124

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 26. Análise de contribuições de diferentes substituintes no carbono C10 para o

descritor SCORE.

No. Y R D A B C N T H M O G F I P S

14 0,00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

71 0,11 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

72 -0,17 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

75 -0,70 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

O estudo seguinte foi feito para os compostos listados na Tabela 27. Todos os

substituintes em C10 contêm cadeia flexível com pelo menos dois heteroátomos (F = 1) e

excetuando os compostos 125 e 127, todos os outros são bastante ativos, sendo que o isômero

80 ((S) C5H9O3) é o que possui a maior atividade. Pode-se notar a importância de grupos de

boa propriedade doador/aceptor (átomos de O, S e N) para gerar uma conformação adequada

e, assim, favorecer a interação entre o ligante e o receptor.

Comparando os compostos 125 e 127, o composto 125 tem no grupo substituinte

uma metila a menos, o que ocasionou um incremento em sua atividade biológica.

Tabela 27. Análise de contribuições de diferentes substituintes no carbono C10 para o

descritor SCORE.

No. Y R D A B C N T H M O G F I P S

14 0,00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

79 1,79 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

80 2,25 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

81 0,87 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

82 1,70 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

125 0,10 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

127 -0,03 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

154 1,40 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

156 0,72 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

A análise seguinte foi realizada para compostos da Tabela 22 que apresentam

diferentes substituintes na posição C10. As contribuições do descritor SCORE estão na

Tabela 28. Os análogos 123 e 124 possuem substituintes na posição C9(A = -2). Excluindo

os análogos 133 e 134, todos eles contêm grupos substituintes de cadeia flexível com pelo

menos dois heteroátomos em grupos com boas propriedades doador/aceptor (F = 1). A

posição do anel aromático do composto 133 pode ter causado impedimento estérico na sua

Page 125: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

125

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

interação com o grupo heme, tornando-o menos ativo. O composto 155 é o mais ativo desse

conjunto e possui uma cadeia substituinte bastante polar e flexível. Comparando com o

composto 154, a introdução de um anel aromático, que causou um aumento no volume, não

afetou a atividade uma vez que a cadeia é muito flexível.

Tabela 28. Análise de contribuições de diferentes substituintes no carbono C10 para o

descritor SCORE.

No. Y R D A B C N T H M O G F I P S

14 0,00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

86 -0,15 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

112 0,10 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

123 0,79 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

124 -0,09 0 0 -2 0 0 0 0 0 0 0 0 1 0 0 -1

126 -0,07 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

133 -0,09 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

134 0,31 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

135 1,25 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

136 0,90 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

137 1,07 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

138 0,68 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

139 0,48 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

140 0,21 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

141 0,12 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

142 0,90 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

153 1,00 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

155 1,40 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

165 0,02 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

O estudo seguinte foi realizado a partir dos compostos da Tabela 29. O composto

100 é o único que tem grupo substituinte de cadeia flexível com pelo menos dois

heteroátomos (F = 1). O composto 33 possui um grupo hidrofóbico na posição C10 que

praticamente não alterou a atividade.

Os compostos 110 e 168 possuem substituintes com anéis. O composto 168, além

da presença do anel, a posição C10 não tem um átomo de hidrogênio (B = -3) e isto

prejudicou muito a atividade biológica do análogo (o que tem a menor atividade nesse

Page 126: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

126

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

conjunto). O análogo 180 tem atividade um pouco maior que a artemisinina. No entanto, não

possui na posição C10 grupo substituinte contendo cadeia flexível (F = 0).

Tabela 29. Análise de contribuições de diferentes substituintes no carbono C10 para o

descritor SCORE.

No. Y R D A B C N T H M O G F I P S

14 0,00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

33 0,06 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

100 0,89 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

110 0,23 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

119 0,28 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

168 -2,47 0 0 0 -3 0 0 0 0 0 0 0 0 0 0 -3

180 0,28 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

II. Descritor ASA_H

A medida que aumenta o valor da área superficial hidrofóbica para alguns

compostos a atividade biológica sofre um incremento. Para esta análise foram considerados os

compostos 24 (ASA_H = 414,10), 25 (ASA_H = 465,21), 21 (ASA_H = 505,75) que

possuem um grupo OC2H5 na posição C10. Além do átomo de hidrogênio e dos grupos etil e

propil, nesta ordem, na posição C9. Apesar do aumento da área superficial hidrofóbica com

aumento do número de átomos, ocorreu uma diminuição da atividade com a presença do

grupo propil. Para estes compostos, substituintes com três ou mais átomos de carbonos

ocasionam uma diminuição da atividade biológica. Para a próxima análise, foram

considerados os isômeros 79, 80, 81, 82 que possuem os seguintes grupos: (R) C5H9O3, (S)

C5H9O3, (R) C5H9O3, (S) C5H9O3). De um modo geral, grupos polares contribuem para o

aumento da atividade biológica. Isto ocorre porque as partes polares e hidrofóbicas da

artemisinina [37] estão, respectivamente, direcionadas para as regiões polares e hidrofóbicas

do receptor heme.

Page 127: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

127

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

III. Descritor %RB

Alguns compostos da Tabela 22 foram selecionados para ilustrar o descritor %RB.

Por exemplo, os compostos 4, 30, 31, 80 ,87, 135, 154 e 157 são ativos e possuem um total de

ligações igual a 56, 49, 55, 62, 63, 70, 64 e 55, respectivamente, das quais são livres 3, 2, 3 5,

4,5,7 e 3, respectivamente, com valores de %RB, na seguinte ordem: 5,36; 4,08; 5,45; 8,06;

6,35; 7,14; 10,94 e 5,45. Já os compostos inativos 6, 9, 50, 73,99 e 166 possuem um total de

ligações 45, 54, 51, 48, 48 e 47,das quais são livres 0, 2, 2, 0, 0 e 1, respectivamente, com

valores de %RB, na seguinte ordem: 0; 3,70; 3,70; 0, 0 e 2,17. Com base nos exemplos

citados, os maiores valores numéricos do descritor %RB foram observados para os compostos

ativos. Vale salientar que este descritor não reconheceu os isômeros 79, 80, 81 e 82, os quais

que possuem o valor de 8,06 para %RB.

IV. Descritor Mor03e

A partir da Tabela 22 pode-se observar que os compostos ativos como, por

exemplo, 4 (LogRA = 0,78, -14,00) , 31 (LogRA = 1,32, -14,00), 79 (LogRA = 1,79, -14,00) ,

80 (LogRA = 2,25, -13,00) , 82 (LogRA = 1,70, -15,00), 100 (LogRA = 0,89, 17,00), 106

(LogRA = 0,92, -13,00), 135 (LogRA = 1,25, -15,00), 136 (LogRA = 0,90, -16,00) e 154

(LogRA = 1,40, -14,00) possuem os menores valores para o descritor Mor03e. Enquanto que

os compostos mais inativos 6 (LogRA = -2,39, -7,00), 9 (LogRA= -1,13, -12,00), 34

(LogRA= -1,00,-10,00), 99 (LogRA= -2,59,-9,00), 111(LogRA = -0,79,-8,00), 166 (LogRA =

-0,74,-7,00), 167 (LogRA = -0,72,-10,00) e 168 (LogRA = -2,47,-9,00) têm os maiores

valores para o descritor.

A Tabela 30 mostra os derivados da secoartemisinina que foram estudados a

seguir. As contribuições do descritor SCORE para esses compostos se encontram na Tabela

31.

Page 128: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

128

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 30. Análise dos descritores SCORE, ASA_H, %RB e Mor03e para os

derivados da secoartemisinina.

Composto Descritor Composto Descritor Composto Descritor

0,00■

326,96*

0,00

-9,00**

-3,00■

380,85*

0,00

-8,00**

-2,00■

363,03*

0,00

-7,00**

-4,00■

363,14*

0,00

-5,00**

-3,00■

328,68*

0,00

-6,00**

-2,00■

363,14*

0,00

-9,00**

-2,00■

419,57*

6,12

-9,00**

-2,00■

376,05*

0,00

-8,00**

SCORE■, ASA_H*, %RB

e Mor03e**

Todos os compostos da Tabela 31 possuem seus anéis abertos (R = -2) e

apresentam grupos substituintes em C9, com exceção do composto 43. O composto 44 é o

único que possui um grupo substituinte com cadeia flexível (M = 1). Os compostos 43, 44, 45

e 47 não têm o substituinte metil na posição C6 (G = -1). A ausência das ligações C4-C5 e

C5-C5a foi a principal característica que afetou de forma negativa a atividade biológica

desses análogos, indicando que elas são essenciais para a interação com o receptor.

Page 129: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

129

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 31. Análise de contribuições de diferentes substituintes dos derivados da

secoartemisinina para o descritor SCORE.

No. Y R D A B C N T H M O G F I P S

14 0,00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

43 -2,37 -2 0 0 -1 0 0 0 0 0 0 -1 0 0 0 -4

44 -1,13 -2 0 0 0 0 0 0 0 1 0 -1 0 0 0 -2

45 -0,60 -2 0 0 0 0 0 0 0 0 0 -1 0 0 0 -3

47 -1,27 -2 0 0 0 0 0 0 0 0 0 -1 0 0 0 -3

56 -0,80 -2 0 0 0 0 0 0 0 0 0 0 0 0 0 -2

61 -0,86 -2 0 0 0 0 0 0 0 0 0 0 0 0 0 -2

172 -0,68 -2 0 0 0 0 0 0 0 0 0 0 0 0 0 -2

II. Descritores ASA_H, %RB e Mor03e

O descritor ASA_H apresenta valores abaixo do valor médio, condizente com o

esperado.

Como o composto 44 é o único com substituinte de cadeia flexível, é o único que

tem %RB diferente de zero.

Os valores do descritor Mor03e são, em geral, altos (menos negativos).

Na Tabela 32 estão inseridos os derivados da azaartemisinina que foram

separados de acordo com a posição dos substituintes em C9 e C9. Na primeira parte da

tabela estão os compostos que apresentam átomos de hidrogênio nas posições C9 e C9. Na

segunda parte da Tabela 32 estão os compostos que possuem uma metila na posição C9 e um

átomo de hidrogênio na posição C9

Page 130: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

130

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 32. Análise dos descritores SCORE, ASA_H, %RB e Mor03e para os

compostos selecionados do conjunto das azaartemisininas.

Composto Descritor Composto Descritor Composto Descritor

1,00■

452,71*

5,17

-13,00**

0,00■

442,06*

3,51

-10,00**

-1,00■

451,83*

5,26

-10,00**

1,00■

332,42*

0,00

-10,00**

1,00■

421,05*

3,64

-11,00**

-1,00■

304,93*

4,08

-9,00**

1,00■

406,18*

3,85

-11,00**

0,00■

513,47*

6,35

-12,00**

-1,00■

423,86*

9,84

-15,00**

1,00■

476,00*

6,90

-14,00**

0,00■

479,96*

5,00

-11,00**

0,00■

423,35*

3,51

-9,00**

0,00■

450,17*

5,17

-11,00**

SCORE■, ASA_H*, %RB

e Mor03e**

Page 131: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

131

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 32(continuação). Análise dos descritores SCORE, ASA_H, %RB e Mor03e

para os compostos selecionados do conjunto das azaartemisininas.

Composto Descritor Composto Descritor Composto Descritor

0,00■

326,96*

0,00

-9,00**

0,00■

425,91*

1,85

-10,00**

1,00■

463,82*

3,39

-14,00**

1,00■

366,74*

0,00

-11,00**

2,00■

454,68*

3,45

-12,00**

0,00■

326,06*

0,00

-9,00**

1,00■

410,68*

3,77

-12,00**

0,00■

355,60*

3,92

-11,00**

0,00■

440,77*

1,85

-11,00**

SCORE■, ASA_H*, %RB

e Mor03e**

Page 132: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

132

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

I. Descritor SCORE

A análise do descritor SCORE foi realizada com base na primeira parte da Tabela

32 e os resultados estão na Tabela 33. Seus compostos têm átomos de hidrogênio nas posições

C9 e C9.

Os análogos 8, 37, 38, 42, 103,104, 113, 114, 160, 161, 162 e 163 não têm grupo

substituinte em C9 (B = -1). Os análogos 8, 38, 42, 103, 104, 113, 114 e 160 têm

substituintes pequenos ou muito flexíveis (N = 1). Enquanto que os análogos 161, 162 e 163

têm substituinte muito polar na posição N11 (N = 0). Os compostos 8, 38 e 42 têm cadeias

flexíveis (M = 1). Os compostos 161, 162 e 163 apresentam os menores valores de LogRA e

têm valores negativos de SCORE. O composto 37 tem uma metila na posição N11, o que

conferiu ao composto a maior atividade deste grupo.

Tabela 33. Análise de contribuições de diferentes substituintes dos derivados da

azaartemizinina para o descritor SCORE contendo átomos de hidrogênio nas posições C9 e

C9.

A próxima análise do descritor SCORE foi realizada com base na segunda parte

da Tabela 32. Seus compostos têm um átomo de hidrogênio na posição C9 (CH3) e uma

metila na posição C9 (H).

No. Y R D A B C N T H M O G F I P S

8 -0,15 0 0 0 -1 0 1 0 0 1 0 0 0 0 0 1

37 0,70 0 0 0 -1 0 1 0 0 0 0 0 0 0 0 0

38 0,10 0 0 0 -1 0 1 0 0 1 0 0 0 0 0 1

42 -0,09 0 0 0 -1 0 1 0 0 1 0 0 0 0 0 1

103 0,34 0 0 0 -1 0 1 0 0 0 0 0 0 0 0 0

104 -0,16 0 0 0 -1 0 1 0 0 0 0 0 0 0 0 0

105 0,02 0 0 0 -1 0 1 0 0 1 0 0 0 0 0 1

113 0,02 0 0 0 -1 0 1 0 0 0 0 0 0 0 0 0

114 0,16 0 0 0 -1 0 1 0 0 0 0 0 0 0 0 0

160 0,17 0 0 0 -1 0 1 0 0 0 0 0 0 0 0 0

161 -0,43 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 -1

162 -1,22 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 -1

163 -0,92 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 -1

Page 133: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

133

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Todos os análogos da Tabela 34 têm substituintes em C9(B = 0). Os compostos

39, 101 ,102 e 121 têm substituintes pequenos ou muito flexíveis (N = 1). Enquanto, os

análogos 40, 41, 90 e 120 têm substituinte rígido na posição N11 (N = 0). Os compostos 41 e

101 têm cadeias flexíveis (M = 1).

Tabela 34. Análise de contribuições de diferentes substituintes dos derivados da

azaartemizinina para o descritor SCORE nas posições C9 (CH3) e C9 (H).

No. Y R D A B C N T H M O G F I P S

39 0,79 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1

40 -0,09 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

41 -0,07 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

90 0,11 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

101 1,03 0 0 0 0 0 1 0 0 1 0 0 0 0 0 2

102 -0,04 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1

120 0,17 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

121 1,46 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1

II. Descritor ASA_H

Ao analisar os derivados da azaartemisinina que apresentam átomos de hidrogênio

nas posições C9 e C9 pode-se notar que o aumento de volume na região de N11

desfavorece a atividade biológica. O composto 37 é o mais ativo desse grupo e possui uma

metila nessa região, enquanto que os compostos inativos possuem grupos mais volumosos.

Por exemplo, o composto 162 (LogRA = -1,22) possui um grupo carboxila muito volumoso

em N11.

O estudo seguinte foi realizado com base nos compostos que apresentam uma

metila na posição C9e um átomo de hidrogênio na posição C9. Foi observado que grupos

volumosos hidrofóbicos nessa região contribuem para o aumento da atividade biológica. Por

exemplo, o composto 40 que tem um átomo de hidrogênio em N11 possui a mesma atividade

do fármaco de referência (artemisinina). Ao substituir o átomo de hidrogênio por uma metila

(composto 39) a atividade biológica aumenta para 0,43. Ao comparar os análogos 41 e 121

pode observar que a presença de um átomo com elevada eletronegatividade foi essencial para

o aumento da atividade biológica. Como foi discutido anteriormente, as partes polares e

Page 134: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

134

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

hidrofóbicas (grupos metil) da artemisinina [37] estão, respectivamente, direcionadas para as

regiões polares (área central Fe-N) e hidrofóbicas (grupos metil e etil) do grupo heme.

III. Descritor %RB

Ao considerar os derivados da azaartemisinina que apresentam átomos de

hidrogênio nas posições C9 e C9 pode-se notar que os compostos mais ativos (37 e 103)

possuem os menores valores numéricos para o descritor %RB. Nesta posição o presente

estudo sugere grupos não flexíveis ou com baixa flexibilidade na posição N11 contribuem

para o aumento da atividade biológica.

Para os compostos que possuem uma metila na posição C9 e um átomo de

hidrogênio na posição C9 pode-se notar que os mais ativos (41, 101 e 121 ) apresentam os

maiores valores numéricos para o descritor %RB. Este estudo indica que grupos mais

flexíveis nesta região colaboram para o aumento da atividade biológica .

IV. Descritor Mor03e

O descritor Mor03e foi o único inversamente correlacionado com a atividade

biológica e isto pode ser observado nas Figuras 34 e 35.

Figura 32. Gráfico da relação entre o descritor Mor03e e LogRA para compostos com

átomos de hidrogênio nas posições C9 e C9.

Page 135: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

135

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Os análogos 37, 38, 103, 113, 114 e 160 seguem a tendência desejada (aumenta a

atividade e o valor do descritor decresce).

Figura 33. Gráfico da relação entre o descritor Mor03e e LogRA para compostos com

uma metila na posição C9 e um átomo de hidrogênio na posição C9.

Os análogos 39 e 41 seguem a tendência desejada (aumenta a atividade e o valor

do descritor decresce). O mesmo vale para os compostos 90 e 101 e para os compostos 120 e

121.

Avery e colaboradores [148] investigaram a presença do átomo de nitrogênio no

lugar do átomo de oxigênio (O11) com o objetivo de sugerir um tamanho ideal e uma

polaridade desejável para substituintes nessa posição (N11). Segundo os autores, o

comprimento da cadeia deve ser relativamente pequeno (1 a 3 átomos). Uma outra indicação é

um grupo fenil no final da cadeia para favorecer a atividade biológica.

O presente estudo sugere a presença de um átomo eletronegativo no anel

aromático para que haja um aumento da atividade biológica.

Page 136: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

136

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

4.1. Conclusões parciais para o estudo de QSAR-2D

Os parâmetros estatísticos obtidos para o modelo contendo 110 compostos, quatro

descritores e duas variáveis latentes (A = 2) se mostrou adequado quanto a todos os critérios

de validação.

Três dos descritores apresentaram coeficientes positivos, i. e., são linearmente

correlacionados com a atividade biológica (SCORE, ASA_H e %RB).

SCORE é um descritor proposto com base nas fórmulas moleculares dos

compostos e sua relação com a atividade biológica. Ele é constituído de várias contribuições

dos substituintes e do esqueleto da artemisinina. Nessas contribuições são considerados o

tamanho e a flexibilidade do substituinte, presença de inversão e impedimento estérico, dentre

outros efeitos.

O descritor ASA_H se relaciona à área superficial de todos os átomos

hidrofóbicos. Esse descritor depende da conformação e das cargas parciais na molécula,

fornecendo informações importantes uma vez que sugere a presença de interações

hidrofóbicas e/ou de van de Waals entre o ligante e o receptor.

O descritor %RB contém informação sobre a fração de ligações com rotações

livres na molécula. Um incremento no grupo substituinte aumenta o número total de ligações,

podendo aumentar o número de rotações livres.

O descritor Mor03e é o único que contribui negativamente a atividade biológica.

Ele pertence à serie dos descritores 3D-MORSE que normalmente são calculados com

diferentes pesos. Nesse trabalho, a eletronegatividade de Sanderson foi o fator de ponderação

utilizado.

Ao fixar átomos de hidrogênios na posição C9, a carbonila na posição C10 e

aumentar a cadeia de n-alcanos na posição C3, verifica-se que há uma tendência inicial em

aumentar a atividade biológica. Isto sugere que os substituintes devem ser relativamente

pequenos (de 1 a 3 átomos) uma vez que o sítio ativo é de tamanho e forma limitada. Grupos

aromáticos na posição C3 podem acarretar um incremento na atividade. Para estes compostos

quanto maior o número de átomos de carbono ligados ao anel benzênico maior será a

atividade do composto. A substituição de um grupo hidrofóbico por um grupo hidrofílico

favoreceu a atividade.

Page 137: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

137

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Ao fixar um grupo metil na posição C3, a carbonila na posição C10 e aumentar a

cadeia de n-alcanos na posição C9, nota-se que há uma propensão em aumentar a atividade

biológica. O aumento do número de átomos de carbono ligados ao anel benzênico aumenta a

hidrofobicidade do composto e favorece a atividade. Em geral, substituintes ramificados são

prejudiciais para a atividade biológica dos compostos estudados.

De um modo geral, grupos polares na posição C10 contribuem para o aumento da

atividade biológica. Este resultado está em concordância com os estudos realizados por Costa

et al em que as partes polares e hidrofóbicas da artemisinina estão, respectivamente,

direcionadas para as regiões polares.

Ligações duplas ou substituintes cíclicos no carbono 9 são prejudiciais à atividade

biológica.

Segundo Pinheiro et al, interações entre o ligante e o receptor ocorrem

principalmente por intermédio dos átomos de H ligados aos átomos de carbono C9, C8a, C5a,

C4 e C7 da artemisinina, além de um átomo de hidrogênio pertencente ao grupo metila ligado

a C3. A ausência da ligações C4-C5 e C5-C5a torna-se prejudicial para a atividade dos

compostos.

Ao analisar os derivados da azaartemisinina que apresentam átomos de hidrogênio

nas posições C9 e C9 pode-se notar que o aumento de volume na região de N11

desfavorece a atividade biológica. No entanto, grupos mais volumosos para compostos que

têm metila na posição C9 e um átomo de hidrogênio na posição C9 contribuem para o

aumento da atividade biológica.

Segundo o trabalho de Avery e colaboradores, o tamanho do grupo substituinte

ideal para a posição N11 deve conter de um a três átomos. Uma outra sugestão é a presença de

um grupo fenil no final da cadeia.

O presente estudo sugere a presença de um átomo eletronegativo no anel

aromático para a posição N11a fim de aumentar a atividade biológica.

Os novos compostos propostos serão discutidos juntamente com o estudo de

QSAR-4D na seção 4.3.

Page 138: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

138

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

4.2. Estudo de QSAR-4D

Além do estudo de QSAR-2D, foi realizado também um estudo de QSAR-4D

usando a metodologia LQTA-QSAR introduzida no capítulo 4. Para este estudo foram

selecionados 89 com uma ampla faixa de atividade biológica, como pode ser visto no

histograma da Figura 34. Nota-se que a classificação dos compostos de acordo com a

atividade é muito semelhante ao estudo de QSAR-2D. São considerados compostos inativos

aquele que possuem LogRA abaixo de -1,83. Os compostos com baixa atividade tem valores

de LogRA -1,83 LogRA < -0,39. Os compostos ativos -0,39 LogRA < 2,50. Os compostos

com alta atividade possuem valore de LogRA 2,50.

Figura 34. Histograma apresentando a distribuição dos valores de Log RA para 89

compostos.

Do mesmo modo que no estudo de QSAR-2D, diferentes grupos substituintes

entraram nas posições dos átomos de carbono C3, C9 e C10 para os análogos e derivados da

artemisinina. Esses compostos podem ser visualizados na Tabela 35.

Page 139: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

139

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 35. 89 compostos selecionados para o estudo de QSAR-4D.

Composto Composto Composto

Page 140: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

140

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 35 (continuação). 89 compostos selecionados para o estudo de QSAR-4D.

Composto Composto Composto

Page 141: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

141

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 35 (continuação). 89 compostos selecionados para o estudo de QSAR-4D.

Composto Composto Composto

Page 142: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

142

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 35 (continuação). 89 compostos selecionados para o estudo de QSAR-4D.

Composto Composto Composto

Page 143: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

143

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 35 (continuação). 89 compostos selecionados para o estudo de QSAR-4D.

Composto Composto Composto

Page 144: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

144

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 35 (continuação). 89 compostos selecionados para o estudo de QSAR-4D.

Composto Composto Composto

Page 145: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

145

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

As simulações de DM foram realizadas para os 89 compostos. Como mencionado

anteriormente, o sistema foi aquecido gradativamente, conforme o seguinte esquema: 50K, 100

K, 200 K e 350 K para simulações de DM de 20 ps, que corresponde a 20.000 passos, sendo

cada passo de 1 fs (0,001 ps). Posteriormente, o sistema foi resfriado a 310K para simulações

de DM de 500 ps (500.000 passos de 1 fs).

Para este estudo foi selecionado um alinhamento (Figura35) que considera o

farmacóforo, i.e., o anel endoperóxido (C3, O2, O1, C12a e C12). Após o alinhamento, os

perfis de conformações de cada ligante foram submetidos ao programa LQTAgrid a fim de

gerar os descritores de energia de interação molecular (descritores de Coulomb, C, e de

Lennard Jones, LJ). Foi utilizada uma caixa com as seguintes dimensões꞉ 31 Å x 24 Å x 31Å.

Foram calculados 51.200 descritores de campo utilizando como sonda o íon NH3+.

Figura 35. Estrutura molecular da artemisinina indicando a numeração dos átomos

selecionados para o alinhamento.

Uma vez gerados os descritores, procedeu-se à seleção para eliminar aqueles que

continham nenhuma ou pouca informação. A Figura 36 ilustra os pontos da grade após a

remoção dos descritores que possuíam variância inferior a 0,01.

No momento em que a sonda está numa posição da grade bem próxima a um dos

átomos da molécula, os valores de energia potencial adquirem valores positivos muito

elevados em função da expressão de potencial de Lennard Jones. Sendo assim, os descritores

LJ foram submetidos a um pré-tratamento (equação 19) com a finalidade de garantir que a

Page 146: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

146

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

informação dos pontos da grade próximos às moléculas alinhadas não sejam perdidas. Após

essa remoção, o número de descritores LJ foi reduzido a 11.863.

Figura 36. Descritores resultantes após o corte pela variância.

Na etapa seguinte, os descritores de Coulomb e Lennard-Jones foram submetidos

ao filtro CDDA [140]. Foram eliminados os descritores que têm baixa correlação com y

(coeficiente de correlação 3,0corte

r ) bem como aqueles que não apresentam uma

distribuição adequada (Descritores com 5,0je ) (ver metodologia, equação18). A aplicação

desse filtro (Tabela 36) possibilitou uma grande redução no número de descritores. A Figura

37 ilustra os descritores de campo resultantes da filtragem para os compostos 55 (LogRA=-

4,00) e 164 (LogRA=3,22).

Tabela 36. Número de descritores iniciais e após a filtragem para cada alinhamento.

89 Compostos Descritores

Iniciais

Corte pela

variância 3,0

corter

(Descritores com 5,0je )

Coulomb Lennard-Jones

Numero de variáveis 51.200 37.463 80 descritores 61 descritores

Page 147: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

147

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

(a)

(b)

Figura 37. Descritores de campo resultantes após o processo de filtragem Para os

compostos 55 (a). Composto 164 (b). As esferas com a cor cinza ilustram os descritores de

Coulomb e as esferas com a cor chumbo, os descritores de Lennard Jones.

A partir das estruturas 3D (Figura 37) destes compostos verifica-se que os

descritores de Coulomb estão em torno de regiões polares. Como o número de descritores,

141, ainda é bastante alto, foi feita uma nova seleção de variáveis com o uso do método OPS

Page 148: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

148

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

[141]. Dessa seleção, restaram 19 descritores. A última etapa do estudo foi a construção do

modelo de QSAR utilizando os 19 descritores. O gráfico da Figura 38 mostra a influência

versus resíduos de Student para os 89 compostos. Dois deles (150 e 151) apresentaram

influência muito acima do limite, indicando que eles estavam fora do domínio de

aplicabilidade e, portanto, foram excluídos. Esses dois compostos têm como substituinte o

grupo NH3+ que, provavelmente, foram mal descritos pela sonda utilizada que também é

NH3+.

Figura 38. Gráfico da influência versus Resíduos de Student para o conjunto de 89

compostos.

Além disso, os compostos 6, 57 e 164 apresentaram resíduos bastante altos, acima

do limite de 95% de confiança indicado pelo resíduo de Student. Como os compostos 57 e

164 têm atividades biológicas extremas, eles foram mantidos no modelo e somente o

composto 6 foi excluído. Com base na estrutura 2D (Figura 39) dos compostos eliminados

pode-se observar que꞉ i) o composto 6 possui uma insaturação nas posições C9 (e

simultaneamente, e uma hidroxila na posição C10; ii) O composto 150 possui uma

carbonila na posição C10 e C9um grupo substituinte contendo NH3+. O composto 151

Page 149: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

149

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

difere do composto 150 por ter um grupo substituinte contendo NH3+

na posição C9 ao invés

da posição C9.

Figura 39. Estrutura molecular 2D dos compostos eliminados no estudo de QSAR-

4D.

Uma nova visualização dos descritores foi feita e 7 deles foram eliminados

restando no modelo final apenas 12, dos quais 9 são de Coulomb e apenas 3 de Lennard

Jones. Eles foram designados como: + 1C, + 2C, + 3C, + 4C, - 5C, - 6C, - 7C, - 8C, - 9C, -

1L, - 2L e + 3L. Dos descritores de Coulomb, 4 deles têm sinal positivo (aumenta LogRA =>

aumenta o valor do descritor) e 5 são negativos (aumenta LogRA => diminui o valor do

descritor). Dos 3 descritores de Lennard Jones, dois deles também têm valores negativos e um

é positivo. O modelo de regressão foi construído com o método PLS usando duas variáveis

latentes (A = 2). O modelo final com 86 compostos e 12 descritores se encontra na equação

23

LogRA = + 0,10 1C + 0,13 2C + 0,16 3C+ 0,19 4C - 0,15 5C - 0,10 6C - 0,10 7C - 0,11

8C - 0,10 9C - 0,12 1L - 0,17 2L e + 0,13 3L

(23)

LogRA = 1,04 + 0,003 1C + 0,003 2C + 0,003 3C + 0,003 4C - 0,008 5C - 0,003 6C -

0,003 7C - 0,003 8C - 0,005 9C - 0,77 1L - 0,67 2L e + 0,007 3L

A equação superior contém os coeficientes de regressão autoescalados, quando

todos eles podem ser comparados entre si. Pode-se ver que todos eles têm praticamente a

mesma importância no modelo. Os coeficientes da equação inferior contém a contribuição de

Page 150: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

150

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

cada descritor nas devidas unidades, além do termo independente. O modelo foi construído

com 2 variáveis latentes e produziu os seguintes parâmetros estatísticos: R2 = 0,67; RMSEC =

0,695; Q2

LOO = 0,59; RMSECV = 0,775. Esse modelo foi totalmente validado segundo as

exigências da literatura e se mostrou adequado.

Gráficos dos valores experimentais de LogRA versus preditos pelo modelo e os

valores preditos da atividade versus resíduos são apresentados nas Figuras 40 e 41 para

confirmação da linearidade do modelo.

Figura 40. Gráfico dos valores experimentais versus os valores estimados de LogRA

para o modelo de regressão PLS construído com 2 fatores.

Figura 41. Gráfico dos valores previstos versus resíduos (LogRAexp - LogRAcal).

Page 151: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

151

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Alguns resultados dos testes de validação do modelo são apresentados a seguir e,

como já foram discutidos anteriormente para o estudo de QSAR-2D, são apresentados apenas

os resultados. Os resultados do teste de igualdade de sinais se encontra na Tabela 37.

Tabela 37. Análise dos sinais dos coeficientes de correlação descritor-atividade e dos

coeficientes de regressão.

Descritor Coef. Correl.

Desc./LogRA

Coef.

Regressão

1C +0,55 +0,10

2C +0,55 +0,13

3C +0,54 +0,16

4C +0,36 +0,19

5C -0,37 -0,15

6C -0,48 -0,10

7C -0,50 -0,10

8C -0,51 -0,11

9C -0,41 -0,10

1L -0,30 -0,12

2L -0,36 -0,17

3L +0,34 +0,13

Os resultados do teste de robustez excluindo N amostras para N variando de 1 a

50. Ele foi repetido 50 vezes e os valores médios e respectivos desvios-padrões são

apresentados na Figura 42. O valor crítico de N é igual 22, quando Q2

LNO se encontra no

intervalo 0,59 - 0,05 ≤ Q2

LNO ≤ 0,59 + 0,05. Pode-se ver que o modelo é robusto, e, portanto,

insensível à retirada simultânea de 25% das amostras.

Page 152: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

152

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Figura 42. Gráficos dos resultados obtidos para o teste de robustez a partir do método

LNO (N = 1 - 50).

Finalmente, o modelo foi testado para checar se não foi obtido ao acaso. Para tal,

foi aplicado o teste de aleatorização de y, com 50 repetições e os resultados estão nas Figuras

43 e 44.

Figura 43. Gráficos dos resultados obtidos no teste de aleatorização de y. (a) Q2 em

função do R2 para 50 randomizações.

Page 153: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

153

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

(a)

(b)

Figura 44. Gráficos do teste de aleatorização de y. (a) Coeficientes de correlação

absoluto entre y aleatorizado (yal) e os respectivos valores originais (y) versus R2. (b)

Coeficientes de correlação absoluto entre y aleatorizado (yal) e os valores originais (y) versus

Q2.

Nesse estudo, o conjunto de dados não foi dividido em dois (conjunto de

treinamento e de validação externa). O objetivo aqui foi explorar a metodologia 4D e

demonstrar a sua utilidade comparando os resultados com o estudo 2D.

Page 154: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

154

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Os descritores de Coulomb descrevem interações hidrofílicas entre regiões polares

do composto e do receptor (o grupo heme). Já os descritores de Lennard Jones estão

relacionados às interações hidrofóbicas. Os descritores selecionados pelo modelo podem ser

visualizados graficamente (esferas coloridas) e são indicados na Figura 45.

Figura 45. Visualização dos descritores 4D selecionados pelo melhor modelo de

QSAR para a artemisinina. Descritores de Lennard Jones estão em azul claro/escuro.

Descritores de Coulomb em rosa claro/escuro.

Os descritores selecionados pelo modelo são: de Lennard Jones, LJ positivo (3LJ

+) e negativos (1LJ - e 2LJ -), bem como os de Coulomb, C positivos (1C+, 2C+, 3C+ e 4C+)

e negativos (5C-, 6C-, 7C-, 8C- e 9C-). As contribuições favoráveis e desfavoráveis de

energia para a atividade biológica são mostradas por meio de esferas claras e escuras.

Adicionalmente, os descritores LJ são representados por esferas de cor azul, enquanto os

1LJ-

2LJ-

3LJ+

1C+

2C+

3C+

4C+

6C-

7C- 8C-

9C-

5C-

Page 155: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

155

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

descritores C por esferas de cor rosa. A interpretação dos descritores de campo será realizada

com base nas Figuras 46-53.

O descritor 9C- (Figura 46) está localizado próximo ao átomo de hidrogênio (do

C5. A análise desse descritor foi realizada com base nas estruturas 2D e 3D da artemisinina e

nos dois compostos selecionados, um ativo (92 (LogRA = 1,36)) e outro inativo (54 (LogRA =

-2,76)). Esses compostos possuem na posição C3 um grupo éster (C2H4CO2C2H5) e um átomo

de hidrogênio, respectivamente. Esses resultados indicam que um grupo substituinte na

posição C3 contribui para o aumento ou diminuição da densidade eletrônica próximo, ao

átomo de hidrogênio (do C5.

A Tabela 38 aponta os valores de densidade de carga para o átomo de carbono na

posição C5, assim como, os átomos de hidrogênio nas posições C5(H) e C5 (H), para os

compostos 92 e 54.

Figura 46. Análise do descritor 9C- com base nas estruturas 2D e 3D da artemisinina.

Page 156: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

156

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 38. Valores de densidade de carga para os compostos 92 e 54.

Composto Densidade de

Carga em C5

Densidade de

Carga em C5(H)

Densidade de

Carga em C5 (H)

0,143 -0,045 0,008

0,302 -0,073 -0,025

Pode-se observar que o valor de densidade de carga, na região do átomo de

hidrogênio (do C5, para o composto inativo (-0,025) é menor em relação ao composto

ativo (0,008). O presente estudo revela a importância de um grupo substituinte, na posição

C3, que aumente da densidade eletrônica na região do átomo de hidrogênio do C5

favorecendo, assim, a atividade biológica.

Os descritores 7C- e 8C- (Figura 47) estão posicionados em torno do átomo de

hidrogênio (do C7. A análise desses descritores foi baseada nas estruturas 2D e 3D da

artemisinina e nos compostos selecionados, um ativo (18 (LogRA = 1,40)) e outro inativo (52

(LogRA = -2,47)). Esses compostos possuem na posição C9 um grupo C2H5 e carbonila, nesta

ordem. O presente estudo permitiu observar que um grupo substituinte na posição C9 contribui

para o aumento ou diminuição da densidade eletrônica, em torno do átomo de hidrogênio

(do C7.

A Tabela 39 indica os valores de densidade de carga para os átomos de carbono

nas posições C7 e C9, bem como, os átomos de hidrogênio nas posições C7(H) e C7 (H),

para os compostos 18 e 52.

Page 157: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

157

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Figura 47. Análise dos descritores 7C- e 8C- com base nas estruturas 2D e 3D da

artemisinina.

Tabela 39. Valores de densidade de carga para os compostos 18 e 52.

Composto Densidade de

Carga em C9

Densidade de

Carga em C7

Densidade de

Carga em

C7(H)

Densidade

de Carga em

C7 (H))

-0,164 -0,287 0,0620 0,050

0,425 -0,091 0,032 0,017

A partir da Tabela 39 pode-se notar que o valor de densidade de carga para o

átomo de carbono na posição C9 é maior no composto inativo (0,425) do que no composto

ativo (-0,164). Esta análise está de acordo, com os estudo realizado por Pinheiro et al [49] em

O

O

O

H

OO

CH3

H

21

3

45

5a6 7

88a

910

11

1212a13

H3C

CH3

HH

7C-

8C-

Page 158: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

158

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

que grupos substituintes de alta densidade eletrônica em C9, em alguns casos, contriui para a

diminuição da atividade biológica do composto. Desse modo, prejudicando a interação do

ligante com o grupo heme. Por sua vez, o valor de densidade de carga, na região do átomo de

hidrogênio do C7, para o composto inativo (0,017) é menor em comparação com o

composto ativo (0,050). Assim sendo, os descritores -7C e 8C- sugerem que o aumento da

densidade eletrônica deve favorecer a interação entre o átomo de hidrogênio (do C7 e o

grupo heme.

O descritor 6C- (Figura 48) está localizado próximo ao átomo de hidrogênio (do

C8. Sua análise foi feita a partir das estruturas 2D e 3D da artemisinina e dos compostos

selecionados, um ativo (1 (LogRA = 0,86)) e outro inativo (65 (LogRA = -1,10)). O composto

1 possui na posição C9, um grupo C6H13 enquanto o composto 65 possui um grupo Z- CH2CH

= CHCH3, respectivamente. A partir desta análise pode-se observar que um grupo substituinte

na posição C9 contribui para o aumento ou diminuição da densidade eletrônica próximo, ao

átomo de hidrogênio (do C8.

Os valores de densidade de carga para o átomo de carbono na posição C8 e para os

átomos de hidrogênio nas posições C8(H) e C8 (H) dos compostos 1 e 69 podem ser

visualizados a partir da Tabela 40.

Figura 48. Análise do descritor 6C- com base nas estruturas 2D e 3D da artemisinina.

O

O

O

H

OO

CH3

H

21

3

45

5a6 7

88a

910

11

1212a13

H3C

CH3

HH

6C-

Page 159: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

159

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Tabela 40. Valores de densidade de carga para os compostos 1 e 65.

Composto Densidade de

Carga em C9

Densidade de

Carga em C8

Densidade de

Carga em C8(H)

Densidade de Carga

em C8 (H))

0,010 0,035 -0,022 0,067

0,116 0,021 -0,010 0,032

Assim como a análise anterior, o valor de densidade de carga para o átomo de

carbono na posição C9 é maior no composto inativo (0,116) do que no composto ativo (0,010).

O presente estudo está de acordo com o trabalho realizado por Pinheiro et al [49] em que

grupos substituintes de alta densidade eletrônica na posição C9, em alguns casos, leva à

diminuição da atividade biológica do composto prejudicando, assim, a sua interação com o

grupo heme. Pode-se, também, observar que o valor de densidade de carga na região do átomo

de hidrogênio (do C8, para o composto inativo (0,032) é menor em comparação ao

composto ativo (0,067). Portanto, o descritor -6C sugere que o aumento da densidade

eletrônica favorece a interação do átomo de hidrogênio (do C8 com grupo heme.

Para análise do descritor 5C- foi selecionado o composto 80 (LogRA = 2,25) que

pode ser visualizado em diferentes posições (Figura 49) em relação ao descritor 5C-. O

composto selecionado tem metila nas posições C3 e C9, átomo de hidrogênio em C9e

substituinte altamente polar ( (S) C5H9O3), na posição C10.

Page 160: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

160

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Figura 49. Análise do descritor 5C- com base nas estruturas 2D e 3D do composto 80.

A partir do gráfico de LogRA versus descritor de coulomb (Figura 50) pode-se

observar que 5C- descreve o compostos 80 e seus isômeros. Dessa forma, o presente estudo

sugere que um grupo substituinte altamente polar na posição C10 favorece a atividade

biológica.

Figura 50. Gráfico de LogRA versus Descritor de Coulomb, 5C-.

Os descritores 1C+, 2C+, 3C+ e 4C+ (Figura 51) foram analisados em conjunto

para os compostos 1 (LogRA = 0,86) e 178 (LogRA = -2,14). Ambos, com os seguintes

grupos substituintes em C9: C6H13 e C3H5O2, respectivamente. De acordo, com os

6C-

I

5C- II

III

Page 161: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

161

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

descritores selecionados pode-se notar que um grupo substituinte hidrofílico na posição C9

é prejudicial para a atividade.

(a)

(b)

Figura 51. Análise dos descritores 1C+, 2C+, 3C+ e 4C+ com base nas estruturas 2D

e 3D dos compostos (a) 1 e (b) 178.

O descritor 3LJ+ (Figura 52) será analisado a partir do composto 164 (LogRA =

3,22). O mesmo possui uma metila na posição C3, uma carbonila na posição C10, um átomo

de hidrogênio em C9e o grupo C14H29 na posição C9. Com base nos descritores acima

Page 162: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

162

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

pode-se observar que a presença de um substituinte hidrofóbico favorece a atividade biológica

nesta posição. O descritor de 3LJ+ sugere que o aumento do número de carbono do

substituinte n-alquila nesta região favorece a atividade biológica.

Figura 52. Análise do descritor 3LJ+ a partir do composto 164.

Vale salientar, que esta análise é condizente com o estudo de QSAR-2D. O

composto 164 possui uma cadeia longa, na posição C9O alto valor de sua atividade

biológica pode ser sugerido pela interação de van der Waals do grupo substituinte C14H29 com

algum resíduo de proteína próximo ao heme.

Em estudos recentes de docking molecular da artemisinina e derivados, [39, 57]

observou-se que a distância entre o Fe2+

e o átomo de oxigênio do anel trioxano é menor para

o átomo O1 do que para o átomo de O2. Este resultado confirma a teoria de que o Fe2+

do

heme se liga, preferencialmente, ao átomo de O1. Ficou claro nesses estudos que a distância

d(Fe-O1) varia para diferentes derivados, sendo que compostos que têm valores de atividade

maiores que a artemisinina apresentam, também, os maiores valores de distância.

Substituintes volumosos, certamente, na posição C9 provocam um efeito estérico, que os

impede de se aproximarem mais do heme.

Os descritores 1LJ- e 2LJ- da abordagem 4D indicam que um grupo substituinte

muito volumoso na posição C9 desfavorece a atividade biológica. Neste caso, o grupo

Page 163: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

163

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

volumoso ocasiona um impedimento estérico, o que prejudica a interação do ligante com o

receptor (grupo heme).

4.3. Proposição e predição possíveis candidatos a antimaláricos

A partir dos estudos de QSAR (2D e 4D) foram propostos dois possíveis

candidatos derivados (Figura 53) da artemisinina. A primeira molécula foi modificada com

base no composto 80 que apresenta uma boa atividade antimalárica, possui grupos metila nas

posições C3 e C9, um átomo de hidrogênio em C9e na posição C10 um substituinte

altamente polar ((S) C5H9O3. A estrutura molecular do composto proposto tem uma metila na

posição C3, uma etila na posição C9, um átomo de hidrogênio em C9e um substituinte

altamente polar ((S) C5H9O3), na posição C10. Os valores de LogRA calculados para este

composto com base nos modelos de QSAR (2D e 4D) são: 1,10 e 1,44, respectivamente.

A segunda molécula foi proposta com base na estrutura molecular do composto

83, que possui uma metila na posição C3, um grupo pentil na posição C9, um átomo de

hidrogênio em C9e carbonila na posição C10. O composto sugerido, além das

características acima, tem carbonila nas posições C6 e C7. O valor de LogRA para este

composto foi determinado apenas para abordagem 2D porque os compostos do conjunto de

treinamento do estudo 4D não possuem grupos substituintes posições C6 e C7. O valor de

LogRA calculado para o segundo composto proposto é 1,27, um pouco acima do valor de seu

precursor.

I II

O

O

O

H

OO

OO

H

H

O

OO

O

H

H

O

O

O

Figura 53. Derivados propostos a partir dos estudos de QSAR(2D e 4D).

Page 164: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

164

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

Pinheiro et al [49] propuseram uma série de possíveis candidatos a fármaco e

desse cnjunto foram selecionados dois compostos (26 e 29) para realizar as predições

utilizando os modelos de QSAR (2D e 4D). O compostos 26 tem na posição R o seguinte

grupo substituinte: C3H4O2. Por sua vez, o composto 29 tem nas posições R1 e R2: C=O e

C(H)C3H5O2, respectivamente. Ambos estão indicados na Figura 54. Os valores de LogRA

preditos com base nos modelos de QSAR (2D e 4D) para o compostos 26 são: 1,02 e 1,04,

respectivamente.

O composto 29 teve o valor de LogRA calculado apenas para abordagem 2D. De

acordo, com o estudo 4D um substituinte polar na posição C9 desfavorece a atividade

biológica do composto. Desse modo, o valor de LogRA para o composto 29 calculado com

base no modelo de QSAR-2D é: 1,16.

I

O

H

OO

OH

ORH

26

O

H

O

O

OH

OO

O

CH3

II

O

H

OO

OR

RH

21

29

O

H

OO

O

O

HO

O

Figura 54. Derivados selecionados para a predição a partir dos estudos de QSAR(2D e

4D).

Page 165: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

165

Capítulo 4 Resultados e discussão

Universidade Estadual de Campinas

4.4. Conclusões parciais para o estudo de QSAR-4D

Os parâmetros estatísticos obtidos para o modelo de QSAR-4D contendo 86

compostos, doze descritores e duas variáveis latentes (A = 2) se mostrou adequado quanto a

todos os critérios de validação.

Foram selecionados nove descritores de Coulomb e 3 de Lennard Jones. Dos

descritores de Coulomb 4 deles são favoráveis e 5 são desfavoráveis à atividade biológica.

Dois dos 3 descritores de Lennard Jones têm valores negativos e um é positivo.

Observou-se que um grupo substituinte na posição C3 contribui para o aumento ou

a diminuição da densidade eletrônica, próxima ao átomo de hidrogênio (do C5. O descritor

-9C indica que o aumento da densidade eletrônica nessa região favorece a atividade biológica.

Um grupo substituinte na posição C9 pode aumentar ou diminuir a densidade

eletrônica próxima ao átomo de hidrogênio (do C7. Sendo assim, os descritores -7C e 8C-

sugerem que o aumento da densidade eletrônica nessa região favorece a interação entre o

átomo de hidrogênio (do C7 e o grupo heme.

Do mesmo modo, um grupo substituinte na posição C9 ocasiona um aumento ou

uma diminuição da densidade eletrônica ao redor do átomo de hidrogênio (do C8. O

descritor -6C sugere que o aumento da densidade eletrônica favorece a interação do átomo de

hidrogênio (do C8 com grupo heme.

O descritor 5C- indica que um grupo substituinte altamente polar na posição C10

favorece a atividade biológica.

Conforme os descritores 1C+, 2C+, 3C+ e 4C+ selecionados na abordagem 4D,

um grupo substituinte hidrofílico na posição C9 causa um decréscimo na atividade

antimalárica.

O descritor de 3LJ+ sugere que o aumento no número de átomos de carbono do

substituinte n-alquila na posição C9 favorece a atividade biológica.

Os descritores 1LJ- e 2LJ- indicam que a presença de grupos substituintes muito

volumosos na posição C9 é prejudicial para a atividade antimalárica. Portanto, pode

acarretar um impedimento estérico interferindo na interação entre o ligante e o grupo heme.

Page 166: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

166

Capítulo 5 Conclusões

Universidade Estadual de Campinas

5. Conclusões Finais

Os parâmetros estatísticos obtidos para os modelos 2D e 4D estão de acordo com

os critérios de validação sugeridos na literatura. As duas abordagens podem fornecer

informações complementares.

Os resultados sugerem que ao fixar átomos de hidrogênio na posição C9, a

carbonila na posição C10 e aumentar a cadeia de n-alcanos na posição C3, há uma tendência

em aumentar a atividade biológica. Os substituintes devem ser relativamente pequenos.

Grupos aromáticos na posição C3 podem acarretar um incremento na atividade.

Para estes compostos quanto maior o número de átomos de carbono ligados ao anel benzênico

maior será a atividade do composto. A substituição de um grupo hidrofóbico por um grupo

hidrofílico favoreceu a atividade.

Em geral, grupos polares na posição C10 contribuem para o aumento da atividade

biológica. Ligações duplas ou substituintes cíclicos no carbono 9 são prejudiciais à atividade

biológica.

A ausência das ligações C4-C5 e C5-C5a desfavorece a atividade dos análogos da

secoartemisinina.

A inversão do X11 e H no C12 em relação à artemisinina e a inversão do grupo

peróxido em C3 e C12a em relação à artemisinina são características que contribuíram para a

baixíssima atividade de alguns análogos em relação à artemisinina.

Para os derivados da azaartemisinina que apresentam átomos de hidrogênio nas

posições C9 e C9 pode-se notar que o aumento de volume na região de N11 desfavorece a

atividade biológica. Os grupos mais volumosos para compostos que tem metila na posição

C9 e um átomo de hidrogênio na posição C9contribuem para o aumento da atividade

biológica.

O descritor 9C- indica que o aumento da densidade eletrônica próxima ao átomo

de hidrogênio (do C5 favoreceria a atividade biológica.

Os descritores 7C- e 8C- indicam que o aumento da densidade eletrônica na região,

perto do átomo de hidrogênio (do C7 favoreceria a interação entre o ligante e o grupo heme.

O descritor 6C- sugere que o aumento da densidade eletrônica favoreceria a

interação do ligante com o receptor (grupo heme).

O descritor 5C- sugere que um grupo substituinte altamente polar em C10

favorece a atividade biológica.

Page 167: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

167

Capítulo 5 Conclusões

Universidade Estadual de Campinas

Os descritores 1C+, 2C+, 3C+ e 4C+ indicam que um grupo substituinte

hidrofílico na posição C9 desfavoreceria a atividade antimalárica.

O descritor de 3LJ+ sugere que o incremento no número de carbono do

substituinte n-alquila em C9 favorece a atividade biológica.

Os descritores 1LJ- e 2LJ- indicam que a presença de grupos substituintes muito

volumoso na posição C9seria prejudicial para a atividade antimalárica.

Dois possíveis candidatos a derivados da artemisinina foram propostos com base

estudos de QSAR (2D e 4D). A estrutura molecular do primeiro composto proposto tem uma

metila na posição C3, uma etila na posição C9, um átomo de hidrogênio em C9e um

substituinte altamente polar ((S) C5H9O3), na posição C10. Seus valores de LogRA calculados

com base nos modelos de QSAR (2D e 4D) são: 1,10 e 1,44, respectivamente. A segunda

molécula proposta possui uma metila na posição C3, um grupo pentil na posição C9, um

átomo de hidrogênio em C9 e carbonila nas posições C6 , C7 e C10. O valor de LogRA

calculado segundo a abordagem 2D deste composto é 1,27.

Os compostos 26 e 29, já propostos anteriormente na literatura, foram

selecionados para realizar as predições com os modelos de QSAR (2D e 4D). O composto 26

tem na posição R o seguinte grupo substituinte: C3H4O2. Os valores de LogRA para este

composto com base nos modelos de QSAR (2D e 4D) são: 1,02 e 1,04, respectivamente. O

composto 29 possui nas posições R1 e R2: C=O e C(H)C3H5O2, respectivamente. Seu valor de

LogRA com base no modelo de QSAR-2D é: 1,16.

Page 168: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

168

Universidade Estadual de Campinas

Capítulo 6 Referências

1.http://www.infectologia.org.br/malaria/

(Acessado em 29/05/2016).

2. Capanna, E. Grassi versus Ross: who solved the riddle of malaria? International

Microbiology, 9, 69-74. 2006.

3. Lacerda-Queiroz, N.; Q. S., A.; Teixeira, A. L. As representações da malária na obra de

João Guimarães Rosa. Revista da Sociedade Brasileira de Medicina Tropical, 19, 475-490,

2012.

4. http://www.who.int/malaria/en/

(Acessado em 29/05/2016).

5. Brasil. Ministério da Saúde. Secretaria de Vigilância em Saúde. Departamento de

Vigilância Epidemiológica.Guia prático de tratamento da malária no Brasil / Ministério da

Saúde, Secretaria de Vigilância em Saúde,

Departamento de Vigilância Epidemiológica. – Brasília : Ministério da Saúde, 2010.

6. http://www.dec.ufcg.edu.br/biografias/CharLoui.html

(Acessado em 29 /05/ 2016).

7. http://www.cdc.gov/malaria/about/biology/mosquitoes/index.html

(Acessado em 29/05/2016).

8. Freitas, L. F.; Chaves, G. C.; Wannmacher, L.; Osorio-De-Castro, C. G. S. Malária não

complicada por Plasmodium vivax e Plasmodium falciparum no Brasil: evidências sobre

fármacos isolados e associações medicamentosas empregados em esquemas terapêuticos

recomendados pelo protocolo terapêutico oficial. Caderno de Saúde Pública, 23, 2285-2294,

2007.

Page 169: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

169

Universidade Estadual de Campinas

Capítulo 6 Referências

9. Glen, M. P.; Chang, S.Y.; Hornéy, C.; Rivas, K.; Yokoyama,K.; Pusateri, E. E.; Fletcher,

S.; Cummings, C. G.; Buckner, F. S.; Pendyala, P. R.; Chakrabarti, D.; Sebti, S. M.; Gelb,

M.; Voorhis, W. C. V.; Hamilton, A. structurally simple, potent, plasmodium selective

farnesyltransferase inhibitors that arrest the growth of malaria Parasites. Journal of Medicinal

Chemistry, 49, 5710-5727, 2006.

10. Posner, G. H.; O‘Neill, P. M. Knowledge of the proposed chemical mechanism of action

and cytochrome P450 metabolism of antimalarial trioxanes like artemisinina allows rational

design of new antimalarial peroxides. Account of Chemical Research, 37, 397-404, 2004.

11. White, N.J.; Pukrittayakamee, S.; Hien, T.T.; Faiz, M.A, Mokuolu, O.A; Dondorp, A.M.

Malaria. The Lancet, 383, 723-735, 2014.

12. Santos, R. M. Z.; Pinho, S. T. R.; Ferreira, C. P.; Silva, P. C. A. On the study of the

dynamical aspects of parasitemia in the cycle of malaria. The European Physical Journal

Special Topics, 143, 125-132, 2007.

13. Choumet, V., Carmi-Leroy, A.; Laurent, C.; Lenormand, P.; Rousselle, J.C.; Roth, C.;

Brey, P.T. The salivary glands and saliva of Anopheles gambiae as an essential step in the

plasmodium life cycle: a global proteomic study. Proteomics, 7, 3384-3394, 2007.

14. Rosenberg, R. Malaria: some considerations regarding parasite productivity. Trends in

parasitology, 24, 487-491, 2008.

15. Pongtavornpinyo, W.; Hastings, I.M.; Dondorp, A.; White ,L. J.; Maude, R.J.; Saralamba,

S.; Day, N.P.; White, N.J.; Boni, M.F. Probability of emergence of antimalarial resistance in

different stages of the parasite life cycle. Evolutionary Applications, 2, 52-61, 2009.

Page 170: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

170

Universidade Estadual de Campinas

Capítulo 6 Referências

16. Garcia, C. R. S. Desafios da fisiologia celular na era pós-genômica. Ciência e Cultura, 56,

4-5, 2004.

17. Francis, S. E.;Sullivan, D. J.; Goldberg, D. E. Hemoglobin metabolism in the malaria

parasite Plasmodium falciparum. Annual Review of Microbiology, 51, 97-123, 1997.

18. Franca, T. C. C.; Santos, M. G. ; Figueroa-Villar, J. D. Malária: aspectos históricos e

quimioterapia. Química Nova, 31, 1271-1278, 2008.

19. Pelletier, P. J. ;Caventou, J. B. Annales de Chimieet de Physique, 289- 318, 337-365,

1820.

20. Oliveira, A. R. M.; Szczerbowski, D. Quinina: 470 anos de história, controvérsias e

desenvolvimento. Química Nova, 32, 1971-1974, 2009.

21. Jensen, M.; Mehlhorn, H. Seventy-five years of resochin in the fight against malaria.

Parasitology Research, 105, 609–627, 2009.

22. Ursos, L.M.B.; Roepe, P.D. Chloroquine resistance in the malarial parasite, Plasmodium

falciparum. Medicinal Research Reviews, 22, 465-491, 2002.

23. Verdier, F.; Le Bras, J.; Clavier, F.; Hatin, I.; Blayo, M. C. Chloroquine uptake by

Plasmodium falciparum-infected human erythrocytes during in vitro culture and its

relationship to chloroquine resistance. Antimicrobial Agents and Chemotherapy, 27, 561-564,

1985.

24. Talisuna, A.O.; Bloland, P.; D'Alessandro, U. History, dynamics and public health

importance of malaria parasite resistance. Clinical Microbiology Reviews, 17, 235-254, 2004.

Page 171: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

171

Universidade Estadual de Campinas

Capítulo 6 Referências

25. Rang, H. P.; Dale, M. M.; Ritter, J. M.; Moore, P. K. Farmacologia. Rio de Janeiro,

Elsevier, 2004.

26. Willcox, M. Artemisia species: from traditional medicines to modern antimalarials—and

back again. The Journal of Alternative and Complementary Medicine, 15, 101-109, 2009.

27. Potawale, S.E.; Sadiq, M.W.M.; Mehta, U.K.; Dhalawat, H.J.; Luniya, K.P.; Mantri,

R,A.; Vetal, Y.D. Research and medicinal potential of Artemisia annua: a review.

Pharmacologyonline, 2, 220-235, 2008.

28. Hommel, M. The future of artemisinins: natural, synthetic or recombinant? Journal of

Biology, 7, 1-5, 2008.

29. Avery, M.A.; Gao,F.; Chong,W.K.M.; Mehrotra,S.; Milhous,W.K. Structure –activity

relationships of the antimalarial agent artemisinin. 1. Synthesis and comparative molecular

field analaysis of C-9 analogs of artemisinin and 10 –deoxoartemisinin. Journal of Medicinal

Chemistry, 36, 4264-4275, 1993.

30. TerKuile, F. O.; White, N. J.; Holloway, P. A.; Pasvol, G.; Krishna, S. Plasmodium

falciparum: in vitro studies of pharmacodynamic properties of antimalarial used for the

treatment of severe malaria. Experimental Parasitology, 76, 85-95, 1993.

31. Targett, G.; Drakeley, C .; Jawara, M .; von Seidlein, L .; Coleman, R .;Deen, J.; Pinder,

M.; Doherty, T.; Sutherland, C.; Walraven, G.; Milligan, P. Artesunate reduces but does not

Prevent posttreatment transmission of Plasmodium falciparum to Anopheles Gambiae.

Journal of Infectious Diseases, 183, 1254-1259, 2001.

32. Meshnick, S. R.; Thomas, A., Ranz, A.; Xu, C. M.; Pan, H. Z. Artemisinin (Qinghaosu):

the role of intracellular hemin in its mechanism of antimalarial action. Molecular and

Biochemical Parasitology, 49, 181-189, 1991.

Page 172: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

172

Universidade Estadual de Campinas

Capítulo 6 Referências

33. Rosenthal, P. J.; Meshnick, S. R. Hemoglobin catabolism and iron utilization by malaria

parasites. Molecular and Biochemical Parasitology, 83, 131-139, 1996.

34. Pandey, A. V.; Tekwani, B. L.; Singh, R. L.; Chauhan, V. S. Artemisin, an endoperoxide

antimalarial, disrupts the hemoglobin catabolism and heme detoxification systems in malarial

parasite. Journal of Biological Chemistry, 274, 19383-19388, 1999.

35. Jefford, C. W.; Vicente, M.G.H.; Jacquier, Y.; Favarger, F.; Mareda, J.; Millasson-

Schmidt, P.; Brunner, G.; Burger, U. The deoxynenation and isomerization of artemisinin and

artemether and their relevance to antimalarial action. Helvetica Chimica Acta, 79, 1475-1487,

1996.

36. Tonmunphean, S.; Parasuk, V.; Kokpol, S. Theoretical investigations on reaction

mechanisms of artemisinin compounds: effect of structure on kinetic energy profile and

antimalarial activity. Journal of Molecular Structure: THEOCHEM, 724, 99–105, 2005.

37. Costa, M. S.; Kiralj, R.; Ferreira, M.M.C. Estudo teórico existente entre a artemisinina e o

heme. Química Nova, 30, 25-31, 2007.

38. Srivastava,M.; Singh, H.; Naik, P.K. Molecular modeling evaluation of the antimalarial

activity of artemisinin analogues: molecular docking and rescoring using prime/MM-GBSA

approach. Current Research Journal of Biological Sciences , 2, 83-102, 2010.

39. Ferreira, J.E.V.; Figueiredo, A.F.; Barbosa, J.P.; Cristino, M.G.G.; Macedo, W.J.C.; Silva,

O. P. P.; Malheiros, B.V.; Serra, R.T.A.; Ciriaco-Pinheiro, J. A study of new antimalarial

artemisinins through molecular modeling and multivariate analysis. Journal of the Serbian

Chemical Society, 75, 1533-1548, 2010.

Page 173: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

173

Universidade Estadual de Campinas

Capítulo 6 Referências

40. Posner, G.H.; Oh,C.H.; Wang, D.; Gerena, L.; Milhous, W.K.; Meshnick, S. R.;

Asawamahasadka, W. Mechanism-based design, synthesis, and in vitro antimalarial testing of

new 4-methylated trioxanes structurally related to artemisinin: the importance of a carbon-

centered radical for antimalarial activity. Journal Medicinal Chemistry, 37, 1256-1258, 1994.

41. Tonmunphean ,S; Parasuk, V.; Kokpol, S. Effective discrimination of antimalarial

potencyof artemisinin compounds based on quantum chemical calculations of their reaction

mechanism. Bioorganic & Medicinal Chemistry, 14, 2082–2088, 2006.

42. Ooms, F. Molecular modeling and computer aided drug design. Examples of their

applications in medicinal chemistry. Current Medicinal Chemistry, 7, 141-158, 2000.

43. Ramanjaneyulu, M.; Silambujanaki, P.; Shubash, K.M. Novel drug design for glaucoma

and non-insulin dependent diabetes mellitus :a better lead design by binding free energy

calculations. Journal of Computer-Aided Molecular Design, 1, 73-87, 2011.

44. Kacker, P.; Masetti, M.; Mangold, M.; Bottegoni, G.; Cavalli, A. Combining dyad

protonation and active site plasticity in BACE-1 structure-based drug design. Journal of

Chemical Information and Modeling, 52, 1079−1085, 2012.

45. Ritchie1, T.J.; McLay, I. M. Should medicinal chemists do molecular modelling? Drug

Discovery Today, 17, 534–537, 2012.

46. Melagraki, G.; Afantitis, A. Ligand and structure based virtual screening strategies for hit-

finding and optimization of hepatitis C virus (HCV) inhibitors. Current Medicinal Chemistry,

18, 2612-2619, 2011.

47. Arroio, A.; Honorio, K. M.; Silva, A. B. F. Propriedades químico-quânticas empregadas

em estudos das relações estrutura-atividade. Química, 33,694-699, 2010.

Page 174: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

174

Universidade Estadual de Campinas

Capítulo 6 Referências

48. Avery, M. A.; Alvim-Gastom, M.; Rodrigues, C. R.; Barreiro, E. J.; Cohen, F. E.; Sabnis,

Y. A.; Woolfrey, J R. Structure-activity relationships of the antimalarial agent artemisinin. 6.

The development of predictive in vitro potency models using CoMFA and HQSAR

methodologies.Journal of Medicinal Chemistry, 45, 292-303, 2002.

49. Pinheiro, J. C.; Kiralj, R.; Ferreira, M. M. C.; Romero, O. A. S. Artemisinin derivatives

with antimalarial activity against plasmodium falciparum designed with the aid of quantum

chemical and partial least squares methods. QSAR & Combinatorial Science, 22, 830-842,

2003.

50. Srivastava, M.; Singh, H; . Naik. P. K. Quantitative structure–activity relationship

(QSAR) of artemisinin: the development of predictive in vivo antimalarial activity models.

Journal of Chemometrics, 23, 618–635, 2009.

51. Cardoso, F.J.B.; Costa, R.B.; Figueiredo, A.F.; Barbosa, J.P.; Nava , I. Jr., Pinheiro, J.P.;

Romero, O.A.S. Modeling artemisinin derivatives with potent activity against P. falciparum

malaria with ab initio and PLS methods. Internet Electronic Journal of Molecular Design, 6,

122–134, 2007.

52. Cardoso, F.J.; Figueiredo, A.F.; Lobato, S. M.; Miranda, R.M.; Almeida, R.C.O.;

Pinheiro, J.C. A study on antimalarial artemisinin derivatives using MEP maps and

multivariate QSAR. Journal of Molecular Modeling,14, 39-48, 2008.

53. Jamaludin, R.; Hasan, M.N. Quantitative structure-activity relationship for antimalarial

activity of artemisinin. Journal of Fundamental Sciences,6, 76-83, 2010.

Page 175: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

175

Universidade Estadual de Campinas

Capítulo 6 Referências

54. Ferreira, J.E. V; Figueiredo, A.F.; Barbosa, J.P., Cristino, M.G.G.; Macedo, W.J.C., Silva,

O.P.P.; Malheiros, B.V.; Serra, R.A.; Pinheiro, J.C. A study of new antimalarial artemisinins

through molecular modeling and multivariate analysis. Journal Serbian Chemical Society,

75, 1533–1548, 2010.

55. Teixeira, R. R. ; Carneiro, J. W. D. ; Araujo, M. T. ; Taranto, A. G. . A. A critical view on

antimalarial endoperoxide QSAR studies. Mini-Reviews in Medicinal Chemistry, 12, 562-572,

2012.

56. Cristino, M.G.G.; Meneses, C.C.F.; Soeiro, M.M.; Ferreira, J.E.V.; Figueiredo, .A.F.

Barbosa, J.P.; Almeida, R.O.; Pinheiro, J.C.; Pinheiro, A.L.R. Computational modeling of

antimalarial 10-substituted deoxoartemisinins. Journal of Theoretical and Computational

Chemistry, 11, 241-263, 2012.

57. Santos, C.B.R.; Vieira, J.B.; Lobato, C.C.; Hage-Melim, L.I.S.; Souto, R.N.P.; Lima, C.S.;

Costa, E.V.M.; Brasil, D.S.B.; Macêdo, W.J.C.; Carvalho, J.C.T. A SAR and QSAR study of

new artemisinin compounds with antimalarial activity. Molecules, 19, 367-399, 2014.

58. Santos, C.B.R.; Lobato, C.C.; Braga, F.S.; Costa, J.S.; Favacho, H.A.S.; Carvalho, J. C.T.;

Macedo, W. J.C.; Brasil, D.S.B.; Silva, C.H.T.P. Hage-Melim, L.I.S. Rational design of

antimalarial drugs using molecular modeling and statistical analysis. Current Pharmaceutical

Design, 21, 4112-4127, 2015.

59. Hansch, C.; Fujita, T. R-S-P- analysis: a method for the correlation of biological activity

and chemical structure. Journal of the American Chemical Society, 86, 1616-1626, 1964.

60. Free, S. M.; Wilson, J. W. A mathematical contribution to structure-activity studies.

Journal of Medicinal Chemistry, 7, 395-399, 1964.

Page 176: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

176

Universidade Estadual de Campinas

Capítulo 6 Referências

61. Cramer III, R. D.; Patterson, D. E.; Bunce, J. D. Comparative molecular field analysis

(COMFA). 1. Effect of shape on binding of steroids to carrier proteins. Journal of the

American Chemical Society, 110, 5959-5967, 1988.

62. Cramer III, R. D.; Priest, S. A.; Patterson; D. E.; Hecht, P. In3D QSAR in Drug Design,

H. Kubinyi. Ed. Leiden, 1993.

63. Hopfinger, A. J.; Wang, S.; Tokarski, J. S.; Jin, B.; Albuquerque, M.; Madhav, P. J.;

Duariswami, C. Construction of 3D-QSAR models using the 4D-QSAR analysis formalism.

Journal of the American Chemical Society, 119, 10509-10524, 1997.

64. Martins, J. P.; Barbosa E. G.; Pasqualoto, K. F. M.; Ferreira, M. M. C. LQTA-QSAR: a

new 4D-QSAR methodology. Journal of Chemical Information and Modeling, 49, 1428-

1436, 2009.

65. Consonni, V.; Todeschini, R. Methods and Principles of Medicinal Chemistry. In:

Mannhold, R.; Kubibyi, H. e Timmerman, H. Handbook of molecular descriptors, Wiley-

VCH publishers, 2000.

66. Mulliken, R.S. Electronic population analysis on LCAO-MO molecular wave functions I.

The Journal of Chemical Physics, 23, 1833-1840, 1955.

67. Breneman, C.M.; Wiberg, K.B. Determining atom-centered monopoles from molecular

electrostatic potentials. The need for high sampling density in formamide conformational

analysis. Journal of Computational Chemistry, 11, 361–373, 1990.

68. Ivanciuc, O.; Ivanciuc, T.; Carbol-Bass, D.; Balaban, A. T. Optimum structural

descriptors derived from Ivanciuc-Balaban operator. Internet Electronic Journal of Molecular

Design, 1, 319-331, 2002.

Page 177: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

177

Universidade Estadual de Campinas

Capítulo 6 Referências

69. Raychaudhury, C.; Ray, S. K.; Ghosh, J. J.; Roy, A. B. Basak, S. C. Discrimination of

isomeric structures using information-theoretic topological indices. Journal of Computational

Chemistry, 5, 581-588, 1984.

70. Trinajstić, N. Chemical Graph Theory, CRC: Boca Raton, FL, 1992.

71. Mihalic, Z.; Trinajstic, N. A graph-theoretical approach to structure-property

relationships. Journal of Chemical Education, 69, 701-712, 1992.

72. Labanowsky, J. K.; Motoc, I.; Dammkoehler, R. A. The physical meaning of topological

indices. Journal of Computational Chemistry, 15, 47-53, 1991.

73. Randic, M. Molecular shape profiles. Journal of Chemical Information and Computer

Sciences, 35, 373-382, 1995.

74. Consonni, V. ;Todeschini, R. Rational Approaches to Drug Design (Hottje, H.-D. &

Sippl.W., ed.), Prous Science, Barcelona (Spain), 235-240 ,2001.

75. Schuur, J., Gasteiger, J.,Software Development in Chemistry - Vol. 10 (Gasteiger, J., ed.),

Fachgruppe Chemie-lnformation-Computer (CIC), Frankfurt am Main, 1996.

76. Todeschini, R.; Gramatica,P. 3D-modelling and prediction by WHIM descriptors. Part 5.

Theory development and chemical meaning of the WHIM descriptors. Quantitative Structure-

Activity Relationships, 16, 113-119, 1997.

77. Todeschini, R.; Gramatica,P. 3D-modelling and prediction by WHIM descriptors.Part

6.Applications of WHIM descriptors in QSAR studies. Quantitative Structure-Activity

Relationships, 16, 120-125, 1997.

Page 178: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

178

Universidade Estadual de Campinas

Capítulo 6 Referências

78. Todeschini, R.; Gramatica, P. The WHIM theory: New 3D-molecular descriptors for

QSAR in environmental modelling. SAR and QSAR in Environmental Research, 7, 89-115,

1997.

79. (http://www.gromacs.org/ )

(Acessado em 31/07/2016).

80. Schuttelkopf , A.W.; van Aalten, D.M.F. PRODRG: A tool for high-throughput

crystallography of protein–ligand complexes. Acta Crystallographica D, 60, 1355-1363,

2004.

81. Lindahl, E.; Hess ,B.; van der Spoel, D. Gromacs 3.0: a package for molecules simulation

and trajectory analysis. Journal of the American Chemical Society, 7, 306-317, 2001.

82. (ChemAxon Inc.; http://www.chemaxom.com)

(Acessado em 31 /07/ 2016).

83. Tetko, I. V.; Gasteiger, J.; Todeschini, R.; Mauri, A.; Livingstone, D.; Ertl, P.; Palyulin,

V. A.; Radchenko, E. V.; Zefirov, N. S.; Makarenko, A. S.; Tanchuk, V. Y.; Prokopenko, V.

V. Virtual computational chemistry laboratory - design and description, Journal of Computer-

Aided Molecular Design, 19, 453-63, 2005. Tetko, I. V. Computing chemistry on the web.

Drug Discovery Today, 10, 1497-500, 2005.

84. Gaussian 03, Revision A.1, M. J. Frisch, G. W. Trucks, H. B. Schlegel, G. E. Scuseria, M.

A. Robb, J. R. Cheeseman, J. A. Montgomery, Jr., T. Vreven, K. N. Kudin, J. C. Burant, J. M.

Millam, S. S. Iyengar, J. Tomasi, V. Barone, B. Mennucci, M. Cossi, G. Scalmani, N. Rega,

G. A. Petersson, H. Nakatsuji, M. Hada, M. Ehara, K. Toyota, R. Fukuda, J. Hasegawa, M.

Ishida, T. Nakajima, Y. Honda, O. Kitao, H. Nakai, M. Klene, X. Li, J. E. Knox, H. P.

Hratchian, J. B. Cross, C. Adamo, J. Jaramillo, R. Gomperts, R. E. Stratmann, O. Yazyev, A.

J. Austin, R. Cammi, C. Pomelli, J. W. Ochterski, P. Y. Ayala, K. Morokuma, G. A. Voth, P.

Salvador, J. J. Dannenberg, V. G. Zakrzewski, S. Dapprich, A. D. Daniels, M. C. Strain, O.

Farkas, D. K. Malick, A. D. Rabuck, K. Raghavachari, J. B. Foresman, J. V. Ortiz, Q. Cui, A.

Page 179: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

179

Universidade Estadual de Campinas

Capítulo 6 Referências

G. Baboul, S. Clifford, J. Cioslowski, B. B. Stefanov, G. Liu, A. Liashenko, P. Piskorz, I.

Komaromi, R. L. Martin, D. J. Fox, T. Keith, M. A. Al-Laham, C. Y. Peng, A. Nanayakkara,

M. Challacombe, P. M. W. Gill, B. Johnson, W. Chen, M. W. Wong, C. Gonzalez, and J. A.

Pople, Gaussian, Inc., Pittsburgh PA, 2003.

85. Kiralj, R.; Ferreira, M. M. C. A priori molecular descriptors in QSAR: a case of HIV-1

protease inhibitors. I. The Chemometric approach. Journal of Molecular Graphics and

Modelling, 21, 435-448, 2003.

86. Szabo, A.; Ostlund, N. S. ―Modern Quantum Chemistry”, Ed. Dover, 1996.

87. Sadley, J. ―Semi-empirical Methods of Quantum Chemistry”, J. Wiley, New York, 1985.

88. Slater, J. C. ―Quantum Theory of Atomic Structure”, McGraw-Hill Book Company, 2,

1960.

89. Jensen, F.―Introduction to Computacional Chemistry”, Wiley, New York, 1999.

90. Cramer, C. J. “Essentials of Computacional Chemistry: Theory and Models”, Wiley, New

York, 2002.

91. Roothan, C. C. J. New developments in molecular orbital theory. Reviews of Modern

Physics, 23, 69-89, 1951.

92. Møller, Chr; Plesset, M.S. Note on an approximation treatment for many-electron

systems. Physical Review, 46, 618-622, 1934.

93. Hohenberg, P.; Kohn,W.Inhomogeneous electron gas. Physical Review B, 136, 864-871,

1964.

Page 180: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

180

Universidade Estadual de Campinas

Capítulo 6 Referências

94. Parr, R. G.; Yang, W. Density Functional Theory, Oxford University Press, 1989.

95. G. te Velde, Bickelhaupt , F. M.;. Baerends, E. J.; Fonseca Guerra, C.; van Gisbergen, S.

J. A.; Snijders, J. G.; Ziegler, T. Chemistry with ADF. Journal of Computational Chemistry,

9, 931-967, 2001.

96. Bento, A. P.; Sóla. M.; Bickelhaupt, F.M. Ab initio and DFT benchmark study for

nucleophilic substitution at carbon (SN2@C) and silicon (SN2@Si). Journal of

Computational Chemistry, 26, 1497-1504, 2005.

97. Morgon, N. H.; Custodio, R. Teoria do funcional de densidade. Química Nova, 18, 44-55,

1995.

98. Boys, S. F. Electronic Wave Functions. I. A General method of calculation for the

stationary states of any molecular system. Proceedings of the Royal Society (London) A, 200,

542-554, 1950.

99. Hehre, W. J.; Steward,R. E.; Pople. J. A. Self- consistent molecular orbitals method

IV.Use of Gaussian expansions of Slater-type atomic orbitals. Journal of Chemical

Physics,51, 2657–2664, 1969.

100. Hehre, W. J.; Ditchfield, R.; Pople, J. A.self - consistent molecular orbital methods. XII.

Further extensions of gaussian - type basis sets for use in molecular orbital studies of organic

molecules. Journal of Chemical Physics, 56, 2257-2261, 1972.

101. Rassolov, V. A.; Pople, J. A.; Ratner, M. A.; Windus, T. L. 6-31G* Basis Set for Atoms

K through Zn, Journal of Chemical Physics, 109, 1223-1229, 1998.

102. Random L. In Modern Theoretical Chemistry, H. F. Schaefer III, ed., Plenum Press, New

York, 1997.

Page 181: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

181

Universidade Estadual de Campinas

Capítulo 6 Referências

103. Simons, J. Theoretical studies of negative molecular ions. Annual Review of Physical

Chemistry, 28, 15-45, 1977.

104. Kowalski, B.R. Chemometrics: views and propositions. Journal of Chemical Information

and Computer Sciences, 15, 201–203, 1975.

105. Beebe, K.R.; Pell, R.J.; Seasholtz, M.B. Chemometrics: A Practical Guide. John Wiley

& Sons, INC.New York, 1998.

106. Vandeginste, B.G.M .Chemometrics - general introduction and historical development.

Topics in Current Chemistry, 141, 1-42, 1987.

107. Livingstone, D.J. Quantitative structure-activity relationships.In: King, F.D. (org.)

Medicinal Chemistry: Principles and Practice. 2ª ed. Cambridge: Royal Society of Chemistry,

2003.

108. Draper, N. R.; Smith, H. Applied Regression Analysis, 3rd ed.; Wiley, New York, 1998.

109. OECD-Organization for Economic Co-Operation and Development.Guidance Document

on the Validation of (Quantitative) Structure-Activity Relationship [(Q)SAR] Models. Paris:

OECD, 2007. Disponível em http://www.oecd.org/ehs. (Acessado em 31 /1207/ 2016).

110. Melo, E. B.; Martins, J. P. A.; Jorge, T. C. M.; Friozi, M. C.; Ferreira, M. M. C.

Mutivariate QSAR study on the antimutagenic activity of flavonoids against 3-NFA on

Salmonella typhimurium TA98. European Journal of Medicinal Chemistry, 45, 4562-4569,

2010.

111. .Rücker, C.; Rücker,G.; Meringer, M. y- Randomization and its variants in

QSPR/QSAR. Journal of Chemical Information and Modeling, 47, 2345-2357, 2007.

Page 182: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

182

Universidade Estadual de Campinas

Capítulo 6 Referências

112. Kiralj, R.; Ferreira, M. M. C. Simple quantitativestructure-property relationship (QSPR)

modeling of 17O carbonyl chemical shifts in substituted benzaldehy descompared to DFT and

empirical approaches. The Journal of Physical Chemistry A, 112, 6134-6149, 2008.

113. Ferreira, M.M.C.;Kiralj, R. Basic validation procedures for regression models in QSAR

and QSPR studies: theory and applications. Journal of Brazilian Chemical Society , 20, 770-

787, 2009.

114. Ferreira, M. M. C.; Antunes, A. M.; Melgo, M. S.; Volpe, P. L. O. Quimiometria I:

calibração multivariada, um tutorial. Química Nova, 22, 724-731, 1999.

115. Ferreira, M. M. C.Quimiometria: Conceitos, Métodos e Aplicações, UNICAMP,

Campinas, 2015.

116. Avery, M. A.; Mehrotra, S. ; Bonk, J.D. ; Vroman, J.A.; Goins, D.K.; Miller,R.

Structure-Activity Relationships of the Antimalarial Agent Artemisinin. 4. Effect of

Substitution at C-3 . Journal of Medicinal Chemistry, 39, 2900-2906, 1996.

117. Tonmunphean, S.; Parasuk, V.; Kokpol, S. QSAR study of antimalarial activities and

artemisinin-hemebinding properties obtained from docking calculations. Quantitative

Structure-Activity Relationships, 19, 475-483, 2000.

118. Avery, M. A.; Muraleedharan, K. M.; Desai, P. V.; Bandyopadhyaya, A. K.; Furtado, M.

M.; Tekwani, B. L. Structure-activity relationships of the antimalarial agent artemisinin. 8.

Design, synthesis, and CoMFA studies toward the development of artemisinin-based drugs

against leishmaniasis and malaria. Journal of Medicinal Chemistry, 46, 4244-4258, 2003.

Page 183: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

183

Universidade Estadual de Campinas

Capítulo 6 Referências

119. D. Chaturvedi, A. Goswami, P. P. Saikia, N. C. Barua, P. G. Rao. Artemisinin and its

derivatives: a novel class of anti-malarial and anti-cancer agents. Chemical Society Reviews,

39, 435-454, 2010.

120. Tonmunphean ,S.; Kokpol, S.; Parasuk, V.; Wolschann, P.; Winger, R. H.; Liedl, K. R.;

Rode, B. M. Comparative molecular field analysis of artemisinin derivatives: Ab initio versus

semiempirical optimized structures. Journal of Computer-Aided Molecular Design, 12, 397-

409, 1998.

121. Srivastava, M.; Singh, H; . Naik. P. K. Quantitative structure–activity relationship

(QSAR) of artemisinin: the development of predictive in vivo antimalarial activity models.

Journal of Chemometrics, 23, 618–635, 2009.

122. Lin, A. J.; Zikry, A. B.; Kyle, D. E. Antimalarial activity of new

dihydroartemisininderivatives. 7. 4-(p-Substituted phenyl)-4 (R or S)-[10(or )-

dihydroartemisininoxy] butyricacids. Journal of Medicinal Chemistry, 40, 1396-1400, 1997.

123. Avery, M. A.; Chong, W. K. M.; Bupp, J. Antimalarial analogs of artemisinin. WIPO

Patent WO 91/14689, filled March 20, 1991, and issued October 3, 1991. Geneva: World

Intellectual Property Organization, International Bureau. [Acessado em 31/07/2016:

http://www.wipo.int/pctdb/en/wo.jsp?WO=1991014689].

124. Han, J.; Lee, J. G.; Min, S. S.; Park, S. H.; Angerhofer, C. K. ;Cordell, G. A.; Kim, S. U.

Synthesis of new artemisinin analogues from artemisinicacid modified at C-3 and C-13 and

their antimalarial activity. Journal of Natural Products, 64, 1201-1205, 2001.

125. Ma ,J.; Katz, E.; Kyle, D. E.; Ziffer, H. Syntheses and antimalarial activities of 10-

substituted deoxoartemisinins. Journal of Medicinal Chemistry, 43, 4228-4232, 2000.

Page 184: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

184

Universidade Estadual de Campinas

Capítulo 6 Referências

126. The Cambridge Structural Database, Cambridge Crystallographic Data Centre,

University of Cambridge, Cambridge, UK.

127. Lisgarten, J. N.; Potter, B. S.; Bantuzeko, C.; Palmer, R. A. Structure, absolute

configuration, and conformation of the antimalarial Compound, artemisinin. Journal of

Chemical Crystallography, 28, 539-543, 1998.

128. Sadley J. Semi-empirical Methods of Quantum Chemistry ,Wiley J, New York, 1985.

129. Dewar, M. J. S.; Zoebish, E. G.; Healy, E. F.; Stewart, J. P. P. Development and use of

quantum mechanical molecular models. 76. AM1: a new general purpose quantum

mechanical molecular model. Journal of the American Chemical Society, 107, 3902-3909,

1985.

130. Roothaan, C. C. J. New developments in molecular orbital theory. Reviews of Modern

Physics, 23, 69-89, 1951.

131. HyperChem Program Release 6.0 for Windows. Hybercube, Inc., 1996.

132. Gasteiger, J.; Marsili, M. Iterative partial equalization of orbital electronegativity:- a

rapid access to atomic charges. Tetrahedron, 35, 3219−3222, 1980.

133. Morris, G. M.; Goodsell, D. S.; Halliday, R. S.; Huey, R.; Hart, W. E.; Belew, R. K.;

Olson, A.J. Automated docking using a Lamarckian genetic algorithm and an empirical

binding free energy function. Journal of Computational Chemistry, 19, 1219-1221, 1998.

134. Lindahl, E.; Hess, B.; van der Spoel, D.GROMACS 3.0: a package for molecular

simulation and trajectory analysis. Journal of Molecular Modeling, 7, 306-317, 2001.

Page 185: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

185

Universidade Estadual de Campinas

Capítulo 6 Referências

135. Berendsen, H. J. C.; Grigera, J. R.; Straatsma, T. P. The missing term in effective pair

potentials. Journal of Physical Chemistry, 91, 6269–6271, 1987.

136. Darden, T.; York, D.; Perdesen, L. Particle MeschEwald: an N [center-dot] log (N)

method for Ewald sums in large systems. Journal of Chemical Physics, 98, 10089-10092,

1993.

137. Berendsen, H. J. C.; Postma J. P. M.; van Gunsteren, W. F. ; DiNola, A.; Haak , J. R.

Molecular dynamics with Coupling to an external bath. Journal of Chemical Physics, 81,

3684-3690, 1984.

138. Parrinello, M. ; Rahman, A. Crystal structure and pair potentials: a molecular-dynamics

study. Physical Review Letters, 45, 1196-1199, 1980.

139. Kubinyi, H. QSAR and 3D QSAR in drug design. Part 1: methodology. Drug Discovery

Today, 2,457-467, 1997

140. Barbosa, E.G.; Ferreira, M.M.C. Digital filters for molecular interaction field descriptors.

Molecular Information, 31, 75-84 , 2012.

141. Teófilo, R.F.; Martins, J.P.A.; Ferreira, M.M.C. Sorting variables by using informative

vectors as a strategy for feature selection in multivariate regression. Journal of Chemometrics,

22, 1-17, 2008.

142. Salomão Dória, J.S.Planejamento, desenvolvimento e estudos de QSAR de derivados

benzofuroxânicos com atividade frente Staphylococcus aureus e Trypanosoma cruzi. 2011.

Tese (Doutorado em Tecnologia Químico-Farmacêutica) - Faculdade de Ciências

Farmacêuticas, Universidade de São Paulo, São Paulo, 2011. [Acessado em 06/05/2016:

http://www.teses.usp.br/teses/disponiveis/9/9135/tde-25062012-164359/]

Page 186: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

186

Universidade Estadual de Campinas

Capítulo 6 Referências

143. Tarko, L. Using the bond order calculated by quantum mechanicsto identify the rotatable

bonds. Revista de Chimie, 62, 135-138, 2011.

144. Gasteiger, J.; Sadowski, J.; Schuur, J.; Selzer, P. Steinhauer, L.; Steinhauer, V.

Chemical information in 3D space. Journal of Chemical Information and Computer Sciences,

36, 1030-1037, 1996.

145. Akbar, J.; Iqbal, S.; Batool, F.; Karim, A.; Chan,K.W. Predicting retention times of

naturally occurring phenolic compounds in reversed-phase liquid chromatography: a

quantitative structure-retention relationship (QSRR) approach. International Journal of

Molecular Sciences, 13, 15387-15400, 2012.

146 . Devinyak, O.; Havrylyuk,D.;Lesyk, R. 3D-MoRSE descriptors explained. Journal of

Molecular Graphics and Modelling, 54, 194–203, 2014.

147. Cheng, F.; Shen, J.; Luo, X.;Zhu,W.; Gu, J.; Ji, R.; Jiang, H.; Chen, K. Molecular

docking and 3-D-QSAR studies on the possible antimalarial mechanism of artemisinin

analogues. Bioorganic & Medicinal Chemistry, 10, 2883-2891, 2002.

148. Avery, M.A. ; M.A.; Bonk, J.D.; Chong, W.K.M.; Mehrotra, S.; Robert Miller, R.;

Milhous, W. ; Goins, D.K.; Venkatesan, S.; Christy Wyandt, C.; Khan, I.; Avery, B.A.

Structure-activity relationships of the antimalarial agent artemisinin. 2. Effect of heteroatom

substitution at 0-11: synthesis and bioassay of n-alkyl- 1 l-aza-9-desmethylartemisinins.

Journal of Medicinal Chemistry, 38, 5038-5044, 1995.

Page 187: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

187

Universidade Estadual de Campinas

ANEXOS

ANEXO 1

Valores dos componentesa do descritor SCORE (S) para os 180 compostos.

O valor final do descritor é a soma das contribuições. Y é a atividade biológica.

No. Y R D A B C N T H M O G F I P S

1 0,86 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

2 -0,89 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 -1

3 -0,36 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 -1

4 0,78 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

5 0,40 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

6 -2,39 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 -1

7 -0,44 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

8 -0,04 0 0 0 -1 0 1 0 0 1 0 0 0 0 0 1

9 -1,13 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

10 -0,74 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

11 0,17 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

12 -0,17 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

13 -0,04 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

14 0,00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

15 0,05 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

16 0,79 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 -1

17 1,13 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

18 1,40 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

19 0,83 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

20 -0,48 0 0 0 0 0 0 -1 0 0 0 0 0 0 0 -1

21 -0,04 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

22 0,16 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

23 0,28 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

24 0,43 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 -1

25 0,50 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

26 0,67 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

27 0,74 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

28 0,75 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

29 0,75 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

30 0,84 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

31 1,32 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

32 0,28 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 -1

Page 188: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

188

Universidade Estadual de Campinas

33 0,06 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

34 -1,00 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

35 0,34 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

36 0,96 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

37 0,70 0 0 0 -1 0 1 0 0 1 0 0 0 0 0 1

38 0,05 0 0 0 -1 0 1 0 0 1 0 0 0 0 0 1

39 0,43 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1

40 0,00 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1

41 1,47 0 0 0 0 0 1 0 0 1 0 0 0 0 0 2

42 -0,20 0 0 0 -1 0 1 0 0 1 0 0 0 0 0 1

43 -2,37 -2 0 0 -1 0 0 0 0 0 0 -1 0 0 0 -4

44 -1,13 -2 0 0 0 0 0 0 0 1 0 -1 0 0 0 -2

45 -0,60 -2 0 0 0 0 0 0 0 0 0 -1 0 0 0 -3

46 -0,15 -2 0 0 0 0 0 0 0 0 0 0 0 0 0 -2

47 -1,27 -2 0 0 0 0 0 0 0 0 0 -1 0 0 0 -3

48 -2,09 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

49 -1,79 -1 0 0 -1 0 0 0 0 0 0 -1 0 0 0 -3

50 -1,08 0 0 0 0 0 0 0 -1 0 0 0 0 0 0 -1

51 -1,64 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

52 -2,47 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 -1

53 0,34 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1

54 -2,76 0 0 0 -1 -1 0 0 0 0 0 0 0 0 0 -2

55 -4,00 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

56 -0,80 -2 0 0 0 0 0 0 0 0 0 0 0 0 0 -2

57 -4,00 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

58 -0,10 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

59 0,45 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

60 -0,32 0 0 0 0 0 0 -1 0 0 0 0 0 0 0 -1

61 -0,86 -2 0 0 0 0 0 0 0 0 0 0 0 0 0 -2

62 -0,26 -2 0 0 0 0 0 0 0 0 0 0 0 0 0 -2

63 -2,70 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

64 -0,94 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

65 -1,10 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

66 -0,60 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

67 -0,55 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

68 -0,35 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

69 -0,62 0 0 -2 0 0 0 0 0 0 0 0 1 0 0 -1

70 -0,57 0 0 -2 0 0 0 0 0 0 0 0 1 0 0 -1

71 0,11 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

72 -0,17 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

Page 189: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

189

Universidade Estadual de Campinas

73 -0,89 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

74 0,29 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

75 -0,70 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

76 0,78 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

77 -0,36 0 0 0 -1 0 0 0 0 0 0 -1 0 0 0 -2

78 -0,12 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1

79 1,79 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

80 2,25 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

81 0,87 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

82 1,70 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

83 1,02 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

84 0,41 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1

85 0,19 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1

86 -0,15 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

87 1,84 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

88 0,55 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

89 0,32 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

90 0,11 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1

91 -0,28 0 0 0 0 0 0 -1 0 0 0 0 0 0 0 -1

92 1,36 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1

93 -0,04 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

94 0,07 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

95 0,10 0 0 0 -1 0 0 0 0 1 0 0 0 0 0 0

96 0,16 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1

97 0,21 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1

98 -0,24 0 0 0 0 0 0 0 0 0 0 0 0 0 -1 -1

99 -2,59 0 0 0 0 0 0 0 0 0 0 0 0 -2 -1 -3

100 0,89 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

101 1,03 0 0 0 0 0 1 0 0 1 0 0 0 0 0 2

102 -0,04 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1

103 0,34 0 0 0 -1 0 1 0 0 0 0 0 0 0 0 0

104 -0,16 0 0 0 -1 0 1 0 0 0 0 0 0 0 0 0

105 0,02 0 0 0 -1 0 1 0 0 1 0 0 0 0 0 1

106 0,92 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

107 -0,55 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 -1

108 0,70 0 0 0 -1 1 0 0 0 1 0 0 0 0 0 1

109 -1,24 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

110 0,23 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

111 -0,79 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 -1

112 0,10 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

Page 190: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

190

Universidade Estadual de Campinas

113 0,02 0 0 0 -1 0 1 0 0 0 0 0 0 0 0 0

114 0,16 0 0 0 -1 0 1 0 0 0 0 0 0 0 0 0

115 0,37 0 0 0 -1 1 0 0 0 1 0 0 0 0 0 1

116 0,52 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

117 -2,00 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 -1

118 1,37 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

119 0,28 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

120 0,17 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

121 1,46 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

122 1,40 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

123 0,79 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

124 -0,09 0 0 -2 0 0 0 0 0 0 0 0 1 0 0 -1

125 0,10 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

126 -0,07 0 0 -2 0 0 0 0 0 0 0 0 1 0 0 -1

127 -0,03 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

128 0,12 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

129 0,78 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

130 0,63 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

131 -1,70 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 -1

132 0,58 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 -1

133 -0,09 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

134 0,31 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

135 1,25 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

136 0,90 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

137 1,07 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

138 0,68 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

139 0,48 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

140 0,21 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

141 0,12 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

142 0,90 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

143 -0,01 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

144 0,63 0 0 -2 0 0 0 0 0 1 0 0 0 0 0 -1

145 -0,54 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

146 -0,14 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

147 0,49 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1

148 -0,04 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

149 0,25 0 0 -2 0 0 0 0 0 1 0 0 0 0 0 -1

150 0,11 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

151 -0,63 0 0 -2 0 0 0 0 0 1 0 0 0 0 0 -1

152 0,01 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

Page 191: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

191

Universidade Estadual de Campinas

153 1,00 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

154 1,40 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

155 1,40 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

156 0,72 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

157 1,62 0 0 0 0 0 0 0 0 0 2 0 0 0 0 2

158 -0,12 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1

159 0,41 0 0 0 0 0 0 -1 0 0 0 0 0 0 0 -1

160 0,17 0 0 0 -1 0 1 0 0 0 0 0 0 0 0 0

161 -0,43 0 0 0 -1 0 1 0 0 0 0 0 0 0 0 0

162 -1,22 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 -1

163 -0,92 0 0 0 -1 0 1 0 0 0 0 0 0 0 0 0

164 3,22 0 0 0 1 0 0 0 0 2 0 0 0 0 0 3

165 0,02 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1

166 -0,74 0 -1 0 0 0 0 0 0 0 0 0 1 0 0 0

167 -0,72 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

168 -2,47 0 0 0 -3 0 0 0 0 0 0 0 0 0 0 -3

169 -0,36 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

170 -2,09 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

171 0,01 -2 0 0 0 0 0 0 0 0 0 0 0 0 0 -2

172 -0,68 -2 0 0 0 0 0 0 0 0 0 0 0 0 0 -2

173 -1,79 0 0 0 -2 0 0 0 0 0 0 0 0 0 0 -2

174 -1,06 0 0 -2 0 0 0 0 0 0 0 0 0 0 0 -2

175 -0,93 0 0 0 0 0 0 0 -1 0 0 0 0 0 0 -1

176 -0,03 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

177 -1,59 0 0 0 -2 0 0 0 0 0 0 0 0 0 0 -2

178 -2,14 0 0 0 -2 0 0 0 0 0 0 0 0 0 0 -2

179 -2,43 0 0 0 -2 0 0 0 0 0 0 0 0 0 0 -2

180 0,22 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 a R – anel de 7 membros: 0 se o anel é fechado; -1 se o anel é de 6 membros e -2 se o anel é

aberto.

D – ligação dupla no C9: -1 se ela está presente e 0 se ausente.

A – substituinte no C9-alfa: -2 se ele está presente e 0 se ausente.

B - substituinte no C9-beta: -1 se ele está ausente, 0 se ele está presente ou no caso de

sistemas que apresentem ligações duplas ou anéis; -2 se há substituinte altamente polar; 1

para os de cadeias longas e flexíveis; -2 para sistema de anel com ligação dupla em C10; -3

como no caso anterior, se C10-alfa não é H; -2 se há sistema , que contribui para o

impedimento estérico.

C - substituinte no C3: -1 se está ausente, 0 se presente (principalmente hidrofóbico) ou outro

caso especial, 1 se presente como substituinte anfifílico ou polar (pelo menos dois

heteroátomos, com boas propriedades de dador / aceptor).

N - substituinte N11: 0 se está ausente ou outro (rígido); 1 se presente (muito pequeno ou

muito flexível).

Page 192: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

192

Universidade Estadual de Campinas

T - duas cadeias laterais longas (2>= sem átomos de H): -1 se as direções são opostas (ambos

hidrofóbicos), 0 para a mesma direção ou outros casos (um é hidrofóbico).

H – heteroátomo (s) no anel de 7 membros: -1 se ele está presente e 0 se ausente;

M - Cadeias flexíveis com mais de um átomo de não-H, não considerando a posição C10 e

sistemas de ligação dupla (a menos que estas sejam partes de uma cadeia flexível): 0 se

ausente; 1 se presente e de tamanho moderado e 2 se presente e muito longa.

O - substituintes contendo o oxigênio ou flúor na parte superior do anel de 6 membros

(posições C4, C5, C6 e C7): 0 se ausente; 1 se presente e 2 para dois substituintes presentes;

G – grupo metil na posição C6: 0 para presente, -1 para ausente;

F – substituinte no C10, contendo cadeia flexível com pelo menos dois heteroátomos em

grupos com boas propriedades doador/aceptor (átomos de O, S e N): 0 para ausente, 1 para

presente;

I – inversão do X11 e H no C12 em relação à artemisinina: 0 se ausente ou outro (não é

contado se o anel de 7 membros é aberto) e -2 se presente.

P - inversão grupo peróxido em C3 e C12a em relação à artemisinina: 0 se ausente, -1 se

presente;

S – é o valor final do descritor, que corresponde à soma de todas as contribuições definidas

acima, para cada composto.

Page 193: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

193

Universidade Estadual de Campinas

ANEXO 2

Tabela 1. Valores de distância de ligação (em Å) da molécula de artemisinina

otimizada pelo método Hartree-Fock, com os diferentes conjuntos de base.

Exper.a

HF/6-31G HF/6-311G HF/6-31++G HF/6-311++G

O1-O2 1,469 1,447 1,430 1,440 1,428

O1-C9 1,416 1,435 1,433 1,436 1,433

O2-C11 1,461 1,469 1,464 1,469 1,464

O3-C9 1,445 1,435 1,434 1,435 1,433

O3-C10 1,379 1,403 1,402 1,403 1,401

O4-C10 1,445 1,428 1,427 1,428 1,427

C15-C19 1,536 1,536 1,534 1,535 1,534

C9-C20 1,516 1,507 1,505 1,507 1,506

C9-C8

1,510 1,535 1,532 1,534 1,533

C6-C7 1,527 1,547 1,545 1,547 1,545

C7-C8 1,520 1,538 1,536 1,538 1,537

C10-C11 1,523 1,533 1,530 1,532 1,531

C6-C11 1,534 1,543 1,542 1,543 1,542

C6-C15 1,540 1,550 1,548 1,549 1,548

C14-C15 1,519 1,538 1,536 1,538 1,536

C13-C14 1,524 1,532 1,530 1,532 1,530

C12-C13 1,520 1,535 1,534 1,535 1,534

C11-C12 1,524 1,533 1,532 1,532 1,531

C16-C17 1,519 1,511 1,506 1,510 1,507

aValores extraídos da referência 127.

Page 194: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

194

Universidade Estadual de Campinas

Tabela 1 (continuação). Valores de distância de ligação (em Å) da molécula de

artemisinina otimizada pelo método Hartree-Fock com diversos conjuntos de base.

Exper.a

HF/6-31G** HF/6-311G** HF/6-31++G** HF/6-311++G**

O1-O2 1,469 1,390 1,380 1,389 1,379

O1-C9 1,416 1,396 1,395 1,397 1,396

O2-C11 1,461 1,430 1,429 1,431 1,430

O3-C9 1,445 1,409 1,408 1,409 1,408

O3-C10 1,379 1,376 1,375 1,376 1,375

O4-C10 1,445 1,408 1,407 1,410 1,409

C15-C19 1,536 1,532 1,532 1,533 1,532

C9-C20 1,516 1,513 1,511 1,513 1,512

C9-C8

1,510 1,537 1,537 1,537 1,537

C6-C7 1,527 1,543 1,543 1,543 1,543

C7-C8 1,520 1,535 1,534 1,535 1,534

C10-C11 1,523 1,532 1,532 1,532 1,533

C6-C11 1,534 1,546 1,546 1,546 1,546

C6-C15 1,540 1,545 1,545 1,545 1,545

C14-C15 1,519 1,533 1,533 1,528 1,532

C13-C14 1,524 1,528 1,527 1,528 1,527

C12-C13 1,520 1,533 1,532 1,533 1,533

C11-C12 1,524 1,532 1,531 1,532 1,531

C16-C17 1,519 1,516 1,515 1,516 1,516

aValores extraídos da referência 127.

Page 195: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

195

Universidade Estadual de Campinas

Tabela 2. Valores de distância de ligação (em Å) da molécula de artemisinina

otimizada pelo método DFT/B3LYP, com os diferentes conjuntos de base.

Exper.a

B3LYP /6-

31G

B3LYP /

6-311G

B3LYP /

6-31++G

B3LYP /

6-311++G

O1-O2 1,469 1,525 1,516 1,521 1,513

O1-C9 1,416 1,453 1,456 1,458 1,458

O2-C11 1,461 1,499 1,501 1,503 1,502

O3-C9 1,445 1,473 1,475 1,475 1,474

O3-C10 1,379 1,426 1,426 1,427 1,426

O4-C10 1,445 1,465 1,467 1,469 1,468

C15-C19 1,536 1,536 1,540 1,542 1,540

C9-C20 1,516 1,507 1,513 1,516 1,513

C9-C8

1,510 1,544 1,541 1,543 1,541

C6-C7 1,527 1,547 1,551 1,552 1,550

C7-C8 1,520 1,539 1,543 1,545 1,543

C10-C11 1,523 1,538 1,536 1,537 1,536

C6-C11 1,534 1,543 1,552 1,537 1,552

C6-C15 1,540 1,553 1,558 1,560 1,558

C14-C15 1,519 1,546 1,544 1,545 1,543

C13-C14 1,524 1,539 1,537 1,539 1,537

C12-C13 1,520 1,543 1,542 1,544 1,542

C11-C12 1,524 1,543 1,541 1,542 1,540

C16-C17 1,519 1,521 1,517 1,520 1,516

aValores extraídos da referência 127.

Page 196: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

196

Universidade Estadual de Campinas

Tabela 2 (continuação). Valores de distância de ligação (em Å) da molécula de

artemisinina otimizada pelo método DFT/B3LYP com diversos conjuntos de base.

Exper.a

B3LYP

/6-31G**

B3LYP /

6-311G**

B3LYP /

6-31++G**

B3LYP /

6-311++G**

O1-O2 1,469 1,460 1,456 1,460 1,456

O1-C9 1,416 1,414 1,414 1,416 1,415

O2-C11 1,461 1,455 1,456 1,458 1,457

O3-C9 1,445 1,441 1,442 1,443 1,443

O3-C10 1,379 1,396 1,395 1,397 1,395

O4-C10 1,445 1,439 1,440 1,443 1,443

C15-C19 1,536 1,536 1,536 1,537 1,536

C9-C20 1,516 1,519 1,517 1,519 1,517

C9-C8

1,510 1,546 1,545 1,546 1,545

C6-C7 1,527 1,548 1,547 1,548 1,546

C7-C8 1,520 1,539 1,538 1,540 1,538

C10-C11 1,523 1,539 1,538 1,539 1,538

C6-C11 1,534 1,555 1,553 1,556 1,554

C6-C15 1,540 1,551 1,550 1,552 1,550

C14-C15 1,519 1,539 1,538 1,539 1,537

C13-C14 1,524 1,533 1,532 1,533 1,531

C12-C13 1,520 1,538 1,536 1,539 1,537

C11-C12 1,524 1,540 1,538 1,540 1,538

C16-C17 1,519 1,523 1,522 1,523 1,522

aValores extraídos da referência 127.

Page 197: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

197

Universidade Estadual de Campinas

Tabela 3. Valores de ângulos de ligação em graus da molécula de artemisinina

otimizada pelo método Hartree-Fock com diversos conjuntos de base.

Exper.a HF/6-31G HF/6-311G HF/6-31++G HF/6-311++G

C7-C6-C11 112,5 112,164 112,211 112,201 112,140

C7-C6-C15 111,6 111,799 111,852 111,753 111,829

C11-C6-C15 112,6 112,105 112,277 112,168 112,338

C6-C7-C8 116,6 116,891 117,005 117,057 117,050

C7-C8-C9 114,8 114,422 114,565 114,624 114,661

C8-C9-C20 115,4 115,520 115,440 115,394 115,319

C20-C9-O3 106,1 107,846 107,924 107,857 107,954

C8-C9-O1 112,9 110,673 110,647 110,792 110,727

O1-C9-O3 106,6 106,762 106,676 106,674 106,646

C20-C9-O1 104,9 105,967 106,107 105,975 106,041

O3-C10-O4 106,8 108,456 108,193 108,252 108,057

O3-C10-C11 114,5 112,280 112,365 112,423 112,503

O4-C10-C11 114,3 113,45 113,600 113,565 113,775

C6-C11-C10 111,0 111,589 111,499 111,609 111,464

C6-C11-C12 113,4 113,428 113,343 113,394 113,365

C10-C11-C12 110,1 111,070 110,905 111,000 110,883

C6-C11-O2 106,3 105,236 105,432 105,316 105,377

C10-C11-O2 110,7 110,914 110,769 110,871 110,863

C11-C12-C13 110,5 110,549 110,710 110,606 110,692

C12-C13-C14 110,2 110,361 110,499 110,368 110,467

C13-C14-C15 113,3 113,257 113,276 113,229 113,279

C6-C15-C14 112,5 111,245 111,189 111,258 111,247

C14-C15-C19 110,0 109,993 110,119 110,014 110,134

C6-C15-C19 110,6 111,826 111,906 111,792 111,890

C12-C16-C17 113,2 112,373 112,199 112,389 112,252

C16-C17-C18 110,6 111,183 111,343 111,274 111,379

O5-C17-C16 124,4 124,240 124,345 124,115 124,147

C9-O3-C10 114,2 117,299 116,967 117,273 117,026

O2-O1-C9 108,1 108,8024 109,2102 109,048 109,252

O1-O2-C11 111,2 113,239 113,361 113,382 113,395 aValores extraídos da referência 127.

Page 198: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

198

Universidade Estadual de Campinas

Tabela 3 (continuação). Valores de ângulos de ligação em graus da molécula de

artemisinina otimizada pelo método Hartree-Fock com diversos conjuntos de base.

Exper.a HF/6-31G** HF/6-311G** HF/6-31++G** HF/6-311++G**

C7-C6-C11 112,5 111,985 112,009 111,998 112,000

C7-C6-C15 111,6 112,023 112,032 111,990 111,994

C11-C6-C15 112,6 113,000 113,023 113,05 113,111

C6-C7-C8 116,6 116,511 116,576 116,599 116,596

C7-C8-C9 114,8 114,063 114,097 114,239 114,245

C8-C9-C20 115,4 114,169 114,111 114,091 113,999

C20-C9-O3 106,1 107,913 107,988 107,954 108,036

C8-C9-O1 112,9 111,249 111,165 111,280 111,218

O1-C9-O3 106,6 106,647 107,815 107,687 107,690

C20-C9-O1 104,9 105,820 105,930 105,903 105,964

O3-C10-O4 106,8 108,057 107,650 107,608 107,499

O3-C10-C11 114,5 112,503 112,266 112,354 112,380

O4-C10-C11 114,3 114,459 114,454 114,573 114,589

C6-C11-C10 111,0 111,559 111,5602 111,473 111,496

C6-C11-C12 113,4 112,799 112,798 112,811 112,796

C10-C11-C12 110,1 110,569 110,561 110,519 110,531

C6-C11-O2 106,3 105,570 105,590 105,605 105,614

C10-C11-O2 110,7 110,550 110,414 110,519 110,454

C11-C12-C13 110,5 111,317 111,341 111,331 111,375

C12-C13-C14 110,2 110,753 110,813 110,769 110,837

C13-C14-C15 113,3 113,086 113,063 113,065 113,008

C6-C15-C14 112,5 111,092 111,045 111,110 111,082

C14-C15-C19 110,0 110,109 110,126 110,111 110,156

C6-C15-C19 110,6 112,077 112,115 112,041 112,096

C12-C16-C17 113,2 112,252 112,660 112,574 112,437

C16-C17-C18 110,6 111,077 111,266 111,312 111,420

O5-C17-C16 124,4 123,577 123,791 123,565 123,769

C9-O3-C10 114,2 115,310 115,303 115,487 115,422

O2-O1-C9 108,1 109,252 109,456 109,581 109,791

O1-O2-C11 111,2 112,698 112,858 112,838 112,967 aValores extraídos da referência 127.

Page 199: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

199

Universidade Estadual de Campinas

Tabela 4. Valores de ângulos de ligação em graus da molécula de artemisinina

otimizada pelo método DFT/B3LYP com diversos conjuntos de base.

Exper.a B3LYP /

6-31G

B3LYP /

6-311G

B3LYP /

6-31++G

B3LYP /

6-311++G

C7-C6-C11 112,5 112,344 112,347 112,430 112,341

C7-C6-C15 111,6 111,621 111,753 111,532 111,671

C11-C6-C15 112,6 112,125 112,117 112,159 112,184

C6-C7-C8 116,6 116,866 116,955 116,987 117,038

C7-C8-C9 114,8 114,433 114,623 114,772 114,788

C8-C9-C20 115,4 115,570 115,846 115,537 115,705

C20-C9-O3 106,1 106,843 106,852 106,964 106,990

C8-C9-O1 112,9 111,667 111,496 111,621 111,521

O1-C9-O3 106,6 107,741 107,430 107,428 107,319

C20-C9-O1 104,9 105,094 105,208 105,139 105,166

O3-C10-O4 106,8 107,823 107,812 107,522 107,585

O3-C10-C11 114,5 113,645 113,609 113,847 113,788

O4-C10-C11 114,3 114,451 114,403 114,456 114,492

C6-C11-C10 111,0 111,386 111,366 111,418 111,343

C6-C11-C12 113,4 113,284 113,294 113,268 113,297

C10-C11-C12 110,1 111,067 111,070 111,057 111,053

C6-C11-O2 106,3 105,296 105,351 105,440 105,383

C10-C11-O2 110,7 111,752 111,740 111,662 111,740

C11-C12-C13 110,5 110,596 110,675 110,648 110,681

C12-C13-C14 110,2 110,535 110,561 110,561 110,587

C13-C14-C15 113,3 113,192 113,295 113,141 113,226

C6-C15-C14 112,5 111,380 111,340 111,379 111,366

C14-C15-C19 110,0 110,280 110,339 110,279 110,344

C6-C15-C19 110,6 111,870 111,884 111,818 111,854

C12-C16-C17 113,2 113,052 113,157 113,111 113,140

C16-C17-C18 110,6 110,992 111,138 111,217 111,287

O5-C17-C16 124,4 124,318 124,448 124,292 124,355

C9-O3-C10 114,2 114,991 115,182 115,249 115,299

O2-O1-C9 108,1 107,304 107,464 107,611 107,645

O1-O2-C11 111,2 111,406 111,584 111,701 111,731 aValores extraídos da referência 127.

Page 200: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

200

Universidade Estadual de Campinas

Tabela 4 (continuação). Valores de ângulos de ligação em graus da molécula de

artemisinina otimizada pelo método DFT/B3LYP com diversos conjuntos de base.

Exper.a B3LYP /

6-31G**

B3LYP /

6-311G**

B3LYP /

6-31++G**

B3LYP /

6-311++G**

C7-C6-C11 112,5 112,035 112,074 112,082 112,093

C7-C6-C15 111,6 111,946 111,949 111,855 111,850

C11-C6-C15 112,6 112,867 112,813 112,937 112,905

C6-C7-C8 116,6 116,605 116,678 116,730 116,719

C7-C8-C9 114,8 114,085 114,171 114,412 114,390

C8-C9-C20 115,4 114,496 114,599 114,426 114,409

C20-C9-O3 106,1 107,179 107,219 107,322 107,345

C8-C9-O1 112,9 111,856 111,741 111,840 111,797

O1-C9-O3 106,6 108,476 108,330 108,193 108,165

C20-C9-O1 104,9 105,113 105,194 105,201 105,269

O3-C10-O4 106,8 107,522 107,518 107,407 105,269

O3-C10-C11 114,5 113,257 113,240 113,401 113,394

O4-C10-C11 114,3 114,982 114,939 115,028 115,015

C6-C11-C10 111,0 111,160 111,191 111,130 111,117

C6-C11-C12 113,4 112,839 112,880 112,849 112,861

C10-C11-C12 110,1 110,542 110,559 110,519 110,531

C6-C11-O2 106,3 105,846 105,846 105,881 105,903

C10-C11-O2 110,7 111,328 111,252 111,354 111,289

C11-C12-C13 110,5 111,261 111,266 111,304 111,305

C12-C13-C14 110,2 110,796 110,825 110,862 110,864

C13-C14-C15 113,3 113,129 113,164 113,094 113,070

C6-C15-C14 112,5 111,326 111,300 111,328 111,323

C14-C15-C19 110,0 110,341 110,300 110,316 110,313

C6-C15-C19 110,6 112,110 112,084 112,067 112,058

C12-C16-C17 113,2 113,254 113,286 113,180 113,210

C16-C17-C18 110,6 110,933 111,130 111,327 111,375

O5-C17-C16 124,4 123,703 123,907 123,796 123,915

C9-O3-C10 114,2 114,092 114,305 114,477 114,520

O2-O1-C9 108,1 108,256 108,4211 108,508 108,577

O1-O2-C11 111,2 111,602 111,741 111,843 111,918 aValores extraídos da referência 127.

Page 201: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

201

Universidade Estadual de Campinas

Tabela 5 Valores de ângulos diedros (em graus) da molécula de artemisinina

otimizada através o método Hartree-Fock, com diversos conjuntos de base.

Exper,a HF/6-31G HF/6-311G HF/6-31++G HF/6-311++G

C6-C11-C12-C13 55,0 54,869 54,420 54,749 54,450

C11-C12-C13-C14 57,8 -56,472 -56,201 -56,480 -56,328

C12-C13-C14-C15 56,9 56,903 56,804 56,935 56,836

C13-C14-C15-C6 -50,8 -52,985 -53,002 -52,998 -52,857

C6-C7-C8-C9 56,7 57,231 56,609 56,542 56,372

C7-C8-C9-O3 24,9 23,651 24,144 24,280 24,506

C10-O3-C9-C8 86,9 -86,550 -86,829 -86,285 -86,362

C9-O3- C10- C11 25,3 25,318 25,380 24,643 24,528

C6-C11- C10-O3 66,5 67,578 67,607 67,942 68,176

C10-C11- C6- C7 -51,6 -51,700 -52,092 -51,686 -51,939

C11- C6- C7-C 8 -36,2 -37,342 -36,703 -37,063 -36,767

C10-C11- C6- C15 75,5 75,045 74,902 75,079 75,017

C12-C11- C6- C7 -176,1 -148,376 -178,084 -177,940 -177,891

C9-O1-O2 –C11 47,8 46,705 46,882 46,350 46,772

O1-O2 –C11-C10 12,7 12,512 12,477 12,743 12,345

O2 –C11-C10-O3 -51,3 -49,408 -49,473 -49,128 -48,874

C10-O3- C9- O1 36,0 33,390 33,018 33,787 33,622

O2-O1-C9-O3 -75,5 -71,845 -71,953 -71,820 -72,096

C6 -C11 -C10 -O4 -169,9 -169,008 -169,149 -168,717 -168,517

C11-C12-C16-C17 -51,0 -52,637 -53,006 -52,386 -52,909

O4-C17-C16-C12 28,1 32,946 34,473 32,278 33,454

C10-O4- C17- C16 -13,3 -18,575 -20,878 -17,593 -18,894

C12-C11- C10- O4 -43,5 -41,369 -41,825 -41,163 -41,208

C19-C15-C6-C11 169,4 172,515 172,743 172,486 172,557

C7-C8-C9-C20 145,1 145,734 146,254 146,343 146,653

O5-C17-C16-C12 -155,5 -150,167 -148,876 -150,627 -149,616 aValores extraídos da referência 127.

Page 202: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

202

Universidade Estadual de Campinas

Tabela 5 (continuação).Valores de ângulos diedros (em graus) da molécula de

artemisinina otimizada através o método Hartree-Fock, com diversos conjuntos de base.

Exper,a HF/6-

31G**

HF/6-

311G**

HF/6-

31++G**

HF/6-

311++G**

C6-C11-C12-C13 55,0 53,090 52,953 52,985 52,780

C11-C12-C13-C14 57,8 -55,853 -55,735 -55,856 -55,765

C12-C13-C14-C15 56,9 56,835 56,816 56,869 56,892

C13-C14-C15-C6 -50,8 -53,196 -53,268 -53,182 -53,261

C6-C7-C8-C9 56,7 55,097 54,773 54,794 54,628

C7-C8-C9-O3 24,9 26,329 26,587 26,548 26,776

C10-O3-C9-C8 86,9 -90,170 -90,274 -89,683 -89,768

C9-O3- C10- C11 25,3 27,387 27,344 26,652 26,590

C6-C11- C10-O3 66,5 67,027 67,076 67,513 67,546

C10-C11- C6- C7 -51,6 -52,645 -52,717 -52,642 -52,591

C11- C6- C7-C 8 -36,2 -35,353 -35,148 -35,243 -35,202

C10-C11- C6- C15 75,5 74,994 74,974 75,004 75,114

C12-C11- C6- C7 -176,1 -177,803 -177,866 -177,676 -177,648

C9-O1-O2 –C11 47,8 48,692 48,701 48,449 48,457

O1-O2 –C11-C10 12,7 10,904 10,865 10,983 10,936

O2 –C11-C10-O3 -51,3 -50,124 -50,014 -49,652 -49,560

C10-O3- C9- O1 36,0 31,067 30,838 31,541 31,392

O2-O1-C9-O3 -75,5 -73,388 -73,310 -73,327 -73,321

C6 -C11 -C10 -O4 -169,9 -169,868 -169,918 -169,278 -169,359

C11-C12-C16-C17 -51,0 -51,574 -52,148 -51,778 -52,303

O4-C17-C16-C12 28,1 34,777 36,593 34,648 36,499

C10-O4- C17- C16 -13,3 -23,052 -25,4536 -22,391 -24,885

C12-C11- C10- O4 -43,5 -43,479 -43,536 -42,976 -43,049

C19-C15-C6-C11 169,4 172,914 173,038 172,822 172,973

C7-C8-C9-C20 145,1 147,510 147,820 147,762 148,045

O5-C17-C16-C12 -155,5 -149,637 -147,878 -149,624 -147,941 aValores extraídos da referência 127.

Page 203: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

203

Universidade Estadual de Campinas

Tabela 6. Valores de ângulos diedros (em graus) da molécula de artemisinina

otimizada através o método DFT/B3LYP, com diversos conjuntos de base.

Exper,a B3LYP /

6-31G

B3LYP /

6-311G

B3LYP /

6-31++G

B3LYP /

6-311++G

C6-C11-C12-C13 55,0 54,711 54,628 54,576 54,510

C11-C12-C13-C14 57,8 -56,486 -56,262 -56,454 -56,333

C12-C13-C14-C15 56,9 56,840 56,657 56,870 56,755

C13-C14-C15-C6 -50,8 -52,893 -52,855 -52,959 -52,862

C6-C7-C8-C9 56,7 58,094 58,008 57,651 57,701

C7-C8-C9-O3 24,9 23,591 23,427 23,812 23,749

C10-O3-C9-C8 86,9 -86,669 -86,177 -85,736 -85,628

C9-O3- C10- C11 25,3 26,259 25,833 25,0711 24,944

C6-C11- C10-O3 66,5 66,266 66,569 66,8701 67,063

C10-C11- C6- C7 -51,6 -51,740 -51,966 -51,608 -51,774

C11- C6- C7-C 8 -36,2 -37,490 -37,309 -37,387 -37,334

C10-C11- C6- C15 75,5 74,926 74,874 75,019 75,005

C12-C11- C6- C7 -176,1 -177,812 -178,033 -177,680 -177,798

C9-O1-O2 –C11 47,8 46,885 46,906 46,142 46,473

O1-O2 –C11-C10 12,7 12,764 12,793 13,322 12,993

O2 –C11-C10-O3 -51,3 -51,204 -50,949 -50,744 -50,4811

C10-O3- C9- O1 36,0 34,981 35,105 35,784 35,690

O2-O1-C9-O3 -75,5 -73,461 -73,415 -73,221 -73,331

C6 -C11 -C10 -O4 -169,9 -169,254 -169,038 -168,890 -168,630

C11-C12-C16-C17 -51,0 -52,526 -52,475 -52,014 -52,354

O4-C17-C16-C12 28,1 32,477 31,777 31,269 31,450

C10-O4- C17- C16 -13,3 -17,589 -16,460 -16,092 -15,881

C12-C11- C10- O4 -43,5 -41,969 -41,753 -41,609 -41,380

C19-C15-C6-C11 169,4 172,993 173,098 172,986 173,014

C7-C8-C9-C20 145,1 144,286 144,364 144,796 144,867

O5-C17-C16-C12 -155,5 -151,546 -151,997 -152,478 -152,197 aValores extraídos da referência 127.

Page 204: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE ......biológica dos compostos. A falta das ligações C4-C5 e C5-C5a é prejudicial para a atividade dos análogos da secoartemisinina

204

Universidade Estadual de Campinas

Tabela 6 (continuação). Valores de ângulos diedros (em graus) da molécula de

artemisinina otimizada através o método DFT/B3LYP, com diversos conjuntos de base.

Exper,a B3LYP /6-

31G**

B3LYP /

6-311G**

B3LYP /

6-31++G**

B3LYP /

6-311++G**

C6-C11-C12-C13 55,0 53,090 53,170 52,956 52,939

C11-C12-C13-C14 57,8 -55,853 -55,838 -55,878 -55,873

C12-C13-C14-C15 56,9 56,835 56,684 56,787 56,821

C13-C14-C15-C6 -50,8 -53,196 -53,001 -53,007 -53,078

C6-C7-C8-C9 56,7 55,096 56,182 55,893 55,958

C7-C8-C9-O3 24,9 26,329 25,646 25,921 25,859

C10-O3-C9-C8 86,9 -90,170 -89,134 -88,485 -88,436

C9-O3- C10- C11 25,3 27,387 27,132 26,161 26,118

C6-C11- C10-O3 66,5 67,027 66,682 67,263 67,279

C10-C11- C6- C7 -51,6 -52,645 -52,606 -52,453 -52,423

C11- C6- C7-C 8 -36,2 -35,353 -35,868 -35,862 -35,938

C10-C11- C6- C15 75,5 74,994 74,851 74,984 74,992

C12-C11- C6- C7 -176,1 -177,803 -177,524 -177,246 -177,231

C9-O1-O2 –C11 47,8 48,692 47,734 47,307 47,259

O1-O2 –C11-C10 12,7 10,904 11,825 12,046 12,083

O2 –C11-C10-O3 -51,3 -50,124 -51,028 -50,517 -50,479

C10-O3- C9- O1 36,0 31,067 32,935 33,677 -50,479

O2-O1-C9-O3 -75,5 -73,388 -73,772 -73,711 -73,658

C6 -C11 -C10 -O4 -169,9 -169,868 -169,195 -168,556 -168,547

C11-C12-C16-C17 -51,0 -51,574 -51,970 -51,731 -52,040

O4-C17-C16-C12 28,1 34,777 33,122 32,260 32,950

C10-O4- C17- C16 -13,3 -23,052 -19,469 -18,120 -18,920

C12-C11- C10- O4 -43,5 -43,479 -42,983 -42,461 -42,437

C19-C15-C6-C11 169,4 172,914 173,091 173,014 173,051

C7-C8-C9-C20 145,1 147,510 146,116 146,476 146,432

O5-C17-C16-C12 -155,5 -149,637 -151,354 -152,242 -151,532 aValores extraídos da referência 127.