Desenvolvimento de função escore
para prever a constante de inibição a
partir da variação dos exponenciais
dos termos energéticos
Gabriela Bitencourt Ferreira
Pontifícia Universidade Católica do Rio Grande do Sul
Escola de Ciências da Saúde e da Vida
Trabalho de Conclusão de Curso
Introdução
?
Introdução
/
Introdução
Introdução
$
Docking
Docking
𝜌 =
𝑚=1
𝑀
𝑤𝑚𝑥𝑚
Funções Escores
o Modo de ligação e local do ligante
o Prever a afinidade
o Identificar potenciais fármacos
Funções Escores
o Modo de ligação e local do ligante
o Prever a afinidade
o Identificar potenciais fármacos
Funções Escores
o Modo de ligação e local do ligante
o Prever a afinidade
o Identificar potenciais fármacos
Funções Escores
o Modo de ligação e local do ligante
o Prever a afinidade
o Identificar potenciais fármacos
Funções Escores Clássicas
∆𝐺𝑏𝑖𝑛𝑑= 𝛾0 + 𝛾1∆𝐺vdW + 𝛾2∆𝐺HBonds +
𝛾3∆𝐺rotor + 𝛾4∆𝐺hydrophobic
Funções Escores Clássicas
∆𝐺𝑏𝑖𝑛𝑑= 𝛾0 + 𝛾1∆𝐺vdW + 𝛾2∆𝐺HBonds +
𝛾3∆𝐺rotor + 𝛾4∆𝐺hydrophobic
Funções Escores Clássicas
∆𝐺𝑏𝑖𝑛𝑑= 𝛾0 + 𝛾1∆𝐺vdW + 𝛾2∆𝐺HBonds +
𝛾3∆𝐺rotor + 𝛾4∆𝐺hydrophobic
Funções Escores Clássicas
∆𝐺𝑏𝑖𝑛𝑑= 𝛾0 + 𝛾1∆𝐺vdW + 𝛾2∆𝐺HBonds +
𝛾3∆𝐺rotor + 𝛾4∆𝐺hydrophobic
Funções Escores de Aprendizado de Máquina
X
∆𝐺𝑏𝑖𝑛𝑑= 𝛾0 + 𝛾1∆𝐺vdW + 𝛾2∆𝐺HBonds +
𝛾3∆𝐺rotor + 𝛾4∆𝐺hydrophobic
Funções Escores de Aprendizado de Máquina
ΔG
∆𝐺𝑏𝑖𝑛𝑑= 𝛾0 + 𝛾1∆𝐺vdW + 𝛾2∆𝐺HBonds +
𝛾3∆𝐺rotor + 𝛾4∆𝐺hydrophobic
Espaço de Funções Escore
Espaço de Proteínas
Smith JM. Natural selection and the concept of a
protein space. Nature. 1970; 225: 563–564.
Espaço Químico
Kirkpatrick P, Ellis C. Chemical Space. Nature.
2004; 432: 823
Espaço de Funções Escore
log 𝐼𝐶50 =
𝑖−0
𝑁
𝜔𝑖𝑥𝑖 +
𝑗=0
𝑁
𝛼𝑗 𝑥𝑗𝑖
∆𝐺 =
𝑖=0
𝑁
𝜔𝑖𝑥𝑖
∆𝑆 =∝𝑗 −𝑥𝑖
𝑖=1
𝑁
𝑥𝑖𝑦𝑗
log 𝐾𝐼 =
𝑖−0
𝑁
𝜔𝑖𝑥𝑖 +
𝑗=1
𝑀
𝑖=1
𝑁
λ
𝑓 =∝𝑗 𝛽𝑖 + 𝑥
log 𝐸𝐶50 = 𝑥𝑖 +
𝑗
𝑖
𝑥
𝑎2 + 𝑏2 = 𝑐2
𝐴 = 𝜋𝑟2
𝐸 𝐼
𝐸𝐼
𝑓 𝑥 = 𝑎0 +
𝑛=1
∞
𝑎𝑛 cos𝑛𝜋𝑥
𝐿+ 𝑏𝑛 sin
𝑛𝜋𝑥
𝐿
log 𝐼𝐶50 =
𝑖−0
𝑁
𝜔𝑖𝑥𝑖 +
𝑗=0
𝑁
𝛼𝑗 𝑥𝑗𝑖
∆𝐺 =
𝑖=0
𝑁
𝜔𝑖𝑥𝑖
∆𝑆 =∝𝑗 −𝑥𝑖
𝑖=1
𝑁
𝑥𝑖𝑦𝑗
log 𝐾𝐼 =
𝑖−0
𝑁
𝜔𝑖𝑥𝑖 +
𝑗=1
𝑀
𝑖=1
𝑁
λ
𝑓 =∝𝑗 𝛽𝑖 + 𝑥
𝐸 𝐼
𝐸𝐼
log 𝐼𝐶50 =
𝑖−0
𝑁
𝜔𝑖𝑥𝑖 +
𝑗=0
𝑁
𝛼𝑗 𝑥𝑗𝑖
∆𝐺 =
𝑖=0
𝑁
𝜔𝑖𝑥𝑖
∆𝑆 =∝𝑗 −𝑥𝑖
𝑖=1
𝑁
𝑥𝑖𝑦𝑗
𝑓 =
𝑖=1
𝑁
∝𝑖 𝑥𝑖 − 𝑥𝑗−3 +
𝑗=1
𝑀
𝑥
log 𝐾𝐼 =
𝑖−0
𝑁
𝜔𝑖𝑥𝑖 +
𝑗=1
𝑀
𝑖=1
𝑁
λ
𝑓 =∝𝑗 𝛽𝑖 + 𝑥
Espaço de Proteínas Espaço de Funções Escores
Espaço Químico
Introdução
SAnDReS SFSXplorer
?
Afinidade = 𝛾0 + 𝛾1𝑥1 + 𝛾2𝑥2 + 𝛾3𝑥3 + 𝛾4𝑥1𝑥2 +
𝛾5𝑥1𝑥3 + 𝛾6𝑥2𝑥3 + 𝛾7𝑥12 + 𝛾8𝑥2
2 + 𝛾9𝑥32
Xavier MM, Heck GS, de Avila MB, Levin NM, Pintro VO, Carvalho NL, et al.,
SAnDReS a computational tool for statistical analysis of docking results and
development of scoring functions. Comb. Chem. High. Throughput. Screen. 2016;
19: 801–812.
Afinidade = 𝛾0 + 𝛾1𝑥1 + 𝛾2𝑥2 + 𝛾3𝑥3 + 𝛾4𝑥1𝑥2 +
𝛾5𝑥1𝑥3 + 𝛾6𝑥2𝑥3 + 𝛾7𝑥12 + 𝛾8𝑥2
2 + 𝛾9𝑥32
Aprendizado de
Máquina
Afinidade = 𝛾0 + 𝛾1𝑥1 + 𝛾2𝑥2 + 𝛾3𝑥3 + 𝛾4𝑥1𝑥2 +
𝛾5𝑥1𝑥3 + 𝛾6𝑥2𝑥3 + 𝛾7𝑥12 + 𝛾8𝑥2
2 + 𝛾9𝑥32
MVD AD4 Vina
𝐴𝑓𝑖𝑛𝑖𝑑𝑎𝑑𝑒 = 𝛾0 + 𝛾1 𝑑𝑖,𝑗 − 𝑑0,𝐴𝑃1,𝐴𝐿12+ 𝛾2 𝑑𝑖,𝑗 − 𝑑0,𝐴𝑃2,𝐴𝐿2
2
+⋯+ 𝛾4 𝑑𝑖,𝑗 − 𝑑0,𝐴𝑃4,𝐴𝐿42
da Silva AD, Bitencourt-Ferreira G, de Azevedo WF Jr, Taba: A
Tool to Analyze the Binding Affinity. J. Comput. Chem. 2019.
doi.org/10.1002/jcc.26048.
Aprendizado de
Máquina
𝐴𝑓𝑖𝑛𝑖𝑑𝑎𝑑𝑒 = 𝛾0 + 𝛾1 𝑑𝑖,𝑗 − 𝑑0,𝐴𝑃1,𝐴𝐿12+ 𝛾2 𝑑𝑖,𝑗 − 𝑑0,𝐴𝑃2,𝐴𝐿2
2
+⋯+ 𝛾4 𝑑𝑖,𝑗 − 𝑑0,𝐴𝑃4,𝐴𝐿42
𝐴𝑓𝑖𝑛𝑖𝑑𝑎𝑑𝑒 = 𝛾0 + 𝛾1 𝑑𝑖,𝑗 − 𝑑0,𝐴𝑃1,𝐴𝐿12+ 𝛾2 𝑑𝑖,𝑗 − 𝑑0,𝐴𝑃2,𝐴𝐿2
2
+⋯+ 𝛾4 𝑑𝑖,𝑗 − 𝑑0,𝐴𝑃4,𝐴𝐿42
SFSXplorer
𝐴𝑓𝑖𝑛𝑖𝑑𝑎𝑑𝑒 = 𝛾𝑣𝑑𝑤𝑖,𝑗
𝐴𝑖𝑗
𝑟𝑖𝑗12 −
𝐵𝑖𝑗
𝑟𝑖𝑗6 +𝛾𝐻𝐵
𝑖,𝑗𝐸(𝑡)
𝐶𝑖𝑗
𝑟𝑖𝑗12 −
𝐷𝑖𝑗
𝑟𝑖𝑗10 +
𝛾𝑒𝑙𝑒𝑐𝑖,𝑗
𝑞𝑖𝑞𝑗𝜀(𝑟𝑖𝑗)𝑟𝑖𝑗
+ 𝛾𝑠𝑜𝑙𝑖,𝑗
𝑆𝑖𝑉𝑗 + 𝑆𝑗𝑉𝑖 𝑒− Τ𝑟𝑖𝑗
2 2𝜎2+ 𝛾𝑡𝑜𝑟𝑁𝑡𝑜𝑟
SFSXplorer
𝐴𝑓𝑖𝑛𝑖𝑑𝑎𝑑𝑒 = 𝛾𝑣𝑑𝑤𝑖,𝑗
𝐴𝑖𝑗
𝑟𝑖𝑗12 −
𝐵𝑖𝑗
𝑟𝑖𝑗6 +𝛾𝐻𝐵
𝑖,𝑗𝐸(𝑡)
𝐶𝑖𝑗
𝑟𝑖𝑗12 −
𝐷𝑖𝑗
𝑟𝑖𝑗10 +
𝛾𝑒𝑙𝑒𝑐𝑖,𝑗
𝑞𝑖𝑞𝑗𝜀(𝑟𝑖𝑗)𝑟𝑖𝑗
+ 𝛾𝑠𝑜𝑙𝑖,𝑗
𝑆𝑖𝑉𝑗 + 𝑆𝑗𝑉𝑖 𝑒− Τ𝑟𝑖𝑗
2 2𝜎2+ 𝛾𝑡𝑜𝑟𝑁𝑡𝑜𝑟
Aprendizado de
Máquina
SFSXplorer
𝐴𝑓𝑖𝑛𝑖𝑑𝑎𝑑𝑒 = 𝛾𝑣𝑑𝑤𝑖,𝑗
𝐴𝑖𝑗
𝑟𝑖𝑗12 −
𝐵𝑖𝑗
𝑟𝑖𝑗6 +𝛾𝐻𝐵
𝑖,𝑗𝐸(𝑡)
𝐶𝑖𝑗
𝑟𝑖𝑗12 −
𝐷𝑖𝑗
𝑟𝑖𝑗10 +⋯
Variação dos exponenciais dos
termos energéticos
SFSXplorer
𝑣𝑑𝑤𝐴𝑖𝑗
𝑟𝑖𝑗10 −
𝐵𝑖𝑗
𝑟𝑖𝑗5
𝐻𝐵𝑜𝑛𝑑𝐶𝑖𝑗
𝑟𝑖𝑗19 −
𝐷𝑖𝑗
𝑟𝑖𝑗3
SFSXplorer
𝑣𝑑𝑤𝐴𝑖𝑗
𝑟𝑖𝑗6 −
𝐵𝑖𝑗
𝑟𝑖𝑗2
𝐻𝐵𝑜𝑛𝑑𝐶𝑖𝑗
𝑟𝑖𝑗10 −
𝐷𝑖𝑗
𝑟𝑖𝑗8
Constante de Inibição
𝐾𝑖 =𝐸 𝐼
𝐸𝐼
o [E] = Concentração da enzima
o [I] = Concentração do inibidor
o [EI]= Concentração do complexo enzima-inibidor
Objetivo
Desenvolver uma função escore através do método de
variação dos exponenciais dos termos energéticos para
prever a afinidade Ki, entre proteínas resolvidas a alta
resolução cristalográfica e um determinado ligante
Objetivos específicos
o Teste o programa SFSXplorer
o Utilizar o método de variação dos exponenciais para desenvolver uma
função escore
o Avaliar o poder de previsão da função escore desenvolvida
Objetivos específicos
o Avaliar o poder de previsão das funções escores clássicas AD4, MVD e
Vina no Ki dataset
o Avaliar o poder de previsão das funções escore desenvolvidas pelo
método de aprendizado de máquina dos programas SAnDReS e Taba
no Ki dataset
o Comparar o poder de previsão da função escore
desenvolvida com as outras funções escores nas
estruturas do conjunto teste
Constante de
inibição (Ki)
Métodos
Métodos
Banco de Dados
Ki
<1,5 Å
Banco de Dados
Ki
<1,5 Å
550 PDBs
Filtragem
o Confirma:
o Informação de afinidade
o Ligante inserido
o Exclui estruturas:
o Com ligantes repetidos
o Sem molécula de água
Banco de Dados
550 PDBs 400 PDBs
Preparação
Ki
Preparação
Preparação
PDBQT
AutoDock Tools
Desenvolvimento função
Desenvolvimento função
Banco de Dados
Treino
Teste
70%
30%
Desenvolvimento Função
Treino
70%
927 vdw +
Hbond
ρ = 1 ou -1
• Melhor VDW
• Melhor Hbond
• Coulomb
• Solvatação
• Torções
Desenvolvimento função
𝑙𝑜𝑔 𝐾𝑖 = 𝛾𝑣𝑑𝑤𝐸𝑣𝑑𝑤 + 𝛾𝐻𝐵𝐸𝐻𝐵 +
𝛾𝑒𝑙𝑒𝑐𝐸𝑒𝑙𝑒𝑐 + 𝛾𝑠𝑜𝑙𝐸𝑠𝑜𝑙 + 𝛾𝑡𝑜𝑟𝐸𝑡𝑜𝑟
Desenvolvimento função
o Linear Regression
o Ridge
o Lasso
o ElasticNet
𝑙𝑜𝑔 𝐾𝑖 = 𝛾𝑣𝑑𝑤𝐸𝑣𝑑𝑤 + 𝛾𝐻𝐵𝐸𝐻𝐵 +
𝛾𝑒𝑙𝑒𝑐𝐸𝑒𝑙𝑒𝑐 + 𝛾𝑠𝑜𝑙𝐸𝑠𝑜𝑙 + 𝛾𝑡𝑜𝑟𝐸𝑡𝑜𝑟
Desenvolvimento Função
Treino
70%
o Linear Regression
o Ridge
o Lasso
o ElasticNet
Funções Escores
Funções Escores
PLANTS
Score
MolDocK
Score
MDO, MDSE,
IS, ISACO
Grid
Grid
Non - grid
Non - grid
D
W
D
W
D
W
D
W
Funções Escores
Funções Escores
Teste
30%MVD
SFSX
AD4 Vina
Análise Resultados
o Correlação de Spearman
o Correlação de Pearson
o p-value das duas correlações
Resultados Esperados
-9,0
-8,0
-7,0
-6,0
-5,0
-4,0
-3,0
-9,0 -8,0 -7,0 -6,0 -5,0 -4,0 -3,0
SF
SX
plo
rer
Experimental
ρ = 1,0
R2= 1
p-value < 0,05
Resultados Esperados
MVDSFSXplorer
AD4 Vina
>
Cronograma
AtividadesMês
1 2 3 4 5 6 7 8 9 10 11 12
Seleção arquivos PDB x
Preparação dos dados x
Conversão para PDBQT x x x
Desenvolvimento da função escore
(SFSXplorer)x x x
Avaliação da afinidade de ligação com
funções clássicas x x
Avaliação da afinidade de ligação com a
função escore do SAnDReSx x x x
Avaliação da afinidade de ligação com a
função escore do Tabax x x
Análise dos dados x
Escrita do artigo final x x
Orçamento
Materiais Quantidade Custo (R$)
PC AIO CoreI3, 4GB RAM, 1TB HD 2 5.180,00
Teclado e mouse 2 120,00
Software Windows 8 2 320,00
Licença Molegro Virtual Docker 1 6.100,00
Total do projeto 11.720,00
AGRADECIMENTOS
Desenvolvimento de função escore
para prever a constante de inibição a
partir da variação dos exponenciais
dos termos energéticos
Gabriela Bitencourt Ferreira
Pontifícia Universidade Católica do Rio Grande do Sul
Escola de Ciências da Saúde e da Vida
Trabalho de Conclusão de Curso