prediÇÃo de estruturas de proteÍnas e suas … · 7/12/2013 26 há duas premissas básicas no...
TRANSCRIPT
7/12/2013
1
PREDIÇÃO DE
ESTRUTURAS DE
PROTEÍNAS E SUAS
APLICAÇÕES
MARCOS TADEU GERALDO
POR QUE DETERMINAR A ESTRUTURA
DE UMA PROTEÍNA?
Obtenção de informações funcionais
Ponto de partida para um programa racional de experimentos
Determinação de alvos moleculares para desenvolvimento de
drogas e vacinas
7/12/2013
2
Definição
Folding adquirido
Alto grau de complexidade
Diversas funcionalidades
Proteínas fibrosas Enzimas
Proteínas regulatórias
Anticorpos
Inibidores
Motores moleculares
Proteínas de membrana
Receptores
7/12/2013
3
Estrutura primária
É a sequência de aminoácidos de uma proteína
7/12/2013
4
Propriedades dos aminoácidos
7/12/2013
5
7/12/2013
6
cadeia principal
cadeia lateral
Estrutura secundária
Principais conformações: α-hélices e folhas-β
7/12/2013
7
Alfa-hélices: estruturas cilíndricas estabilizadas por ligações de
hidrogênio no backbone
Folha-β
Paralelas ou Antiparalelas
7/12/2013
8
7/12/2013
9
Ângulos Phi e Psi no gráfico de Ramachandran
7/12/2013
10
http://bioinf.cs.ucl.ac.uk/psipred/
PSIPRED
JPRED
http://www.compbio.dundee.ac.uk/www-jpred/
(consensus secondary structure prediction)
http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_seccons.html
NPSA
ENTRE OUTROS... (buscar no http://www.expasy.org/)
7/12/2013
11
Estrutura terciária
Conformação de múltiplos elementos da estrutura
secundária
FOLDING
7/12/2013
12
FOLDING
Competição entre interações intramoleculares e com moléculas de água
FOLDING
7/12/2013
13
Modificações pós-traducionais e ligação de
cofatores também podem aumentar a
estabilidade da estrutura
7/12/2013
14
Estrutura quaternária
União de subunidades proteicas
BANCO DE
DADOS DE
ESTRUTURAS
7/12/2013
15
http://www.rcsb.org/pdb/home/home.do
x y z coordenadas
7/12/2013
16
MODELAGEM
MOLECULAR
Por que modelar uma estrutura?
A determinação da estrutura por métodos experimentais
ainda é um processo que consome muito tempo e tem
alto custo.
O número de sequências conhecidas é muito maior do que
o número de estruturas resolvidas.
A informação estrutural é essencial para a compreensão
da função.
7/12/2013
17
Métodos para determinação de
estrutura proteica
Cristalografia de raio-X
NMR (Nuclear magnetic resonance)
Microscopia crioeletrônica
Modelagem por homologia
Threading
Ab initio
Abordagens experimentais
Abordagens computacionais
(modelos teóricos)
Objetivo:
Ajudar no avanço dos métodos de identificação da
estrutura tridimensional de proteínas com base em
suas sequências de aminoácidos
7/12/2013
18
Homologia Threading
Ab initio
7/12/2013
19
MODELAGEM
MOLECULAR
POR
HOMOLOGIA
Modelagem por homologia
As estruturas se conservam mais durante a evolução do que a
estrutura primária das proteínas.
Na ausência de dados experimentais, a construção de modelos
baseados na estrutura tridimensional de proteínas homólogas é um
dos métodos mais confiáveis para a obtenção da informação
estrutural.
7/12/2013
20
Etapas para a modelagem
Busca por modelos experimentais similares (com base em
alinhamento de sequências e de estrutura secundária) em bancos
de dados de estruturas
Uso da estrutura com maior similaridade como template para a modelagem
Refinamento do modelo
Validação do modelo
7/12/2013
21
BUSCA POR TEMPLATES
HHpred
Busca por vários bancos de dados: PDB, SCOP, Pfam, SMART,
COGs and CDD
O scoring leva em consideração tanto o alinhamento como a
predição de estrutura secundária
http://toolkit.tuebingen.mpg.de/hhpred#
7/12/2013
22
Escolhido o template, segue-se para a etapa de geração
do modelo
Há vários programas que realizam modelagem por
homologia
http://salilab.org/modeller/
Exemplo:
7/12/2013
23
Modelos iniciais gerados (com base no template escolhido) são
submetidos a uma minimização de energia, seguida de uma
dinâmica molecular curta
A escolha do melhor modelo pode ser feita com base na energia
livre
melhor
modelo
menor
energia livre
7/12/2013
24
É avaliada principalmente a qualidade estereoquímica do modelo
http://molprobity.biochem.duke.edu/
http://mordred.bioc.cam.ac.uk/~rapper/rampage.php
https://prosa.services.came.sbg.ac.at/prosa.php
Ao final, é possível fazer um alinhamento estrutural do modelo gerado com o template utilizado
7/12/2013
25
THREADING
Forma intermediária entre o método de homologia e o ab initio
Opera através de um reconhecimento de fold (fold recognition)
Utilizado para sequências de proteínas que não possuem uma proteína
homóloga no banco de dados de estrutura
Lembre-se
Sequências diferentes podem gerar estruturas
semelhantes!
No método de threading, cada aminoácido da sequência a ser modelada é
posicionado (alinhado) à estrutura de um possível template
É avaliado o quão bem cada aminoácido “se encaixa” no template
Isto é feito até que o melhor template seja escolhido
7/12/2013
26
Há duas premissas básicas no método de threading
1 Número de folds diferentes na natureza é relativamente pequeno
Maioria das novas estruturas submetidas ao banco de dados
possuem estruturas similares àquelas já presentes no banco 2
CATH
1 Class the overall secondary-structure content of the
domain
2 Architecture high structural similarity but no evidence
of homology. Equivalent to a fold in SCOP
3 Topology a large-scale grouping of topologies which share
particular structural features
4 Homologous
superfamily
indicative of a demonstrable evolutionary
relationship. Equivalent to the superfamily level of
SCOP.
Semi-automatic hierarchical classification of protein domains
Fonte: wikipedia
7/12/2013
27
Structural Classification of Proteins (SCOP)
Manual classification of protein structural domains based on
similarities of their structures and amino acid sequences
Class: Types of folds, e.g., beta sheets.
Fold: The different shapes of domains within a class.
Superfamily: The domains in a fold are grouped into superfamilies, which
have at least a distant common ancestor.
Family: The domains in a superfamily are grouped into families, which have a
more recent common ancestor.
Protein domain: The domains in families are grouped into protein domains,
which are essentially the same protein.
Species: The domains in "protein domains" are grouped according to species.
Domain: part of a protein. For simple proteins, it can be the entire protein.
Fonte: wikipedia
7/12/2013
28
http://zhanglab.ccmb.med.umich.edu/I-TASSER/
7/12/2013
29
AB INITIO
Ab initio / de novo
Construção de modelos estruturais baseado nas
propriedades físicas dos aminoácidos (sem template!)
Método ainda em desenvolvimento (imprecisão)
Somente é possível modelar pequenos trechos de
sequências
É o método mais custoso computacionalmente
7/12/2013
30
7/12/2013
31
7/12/2013
32
Identificação/descrição de domínios funcionais
Com base em estruturas já conhecidas
Alinhamento estrutural facilita a identificação
Combinar os dados de pressão de seleção com a estrutura proteica
7/12/2013
33
Análise de Interações
Ligações de hidrogênio
Pontes salinas
Interações hidrofóbicas
http://www.ebi.ac.uk/thornton-srv/software/LIGPLOT/
http://www.ebi.ac.uk/msd-srv/prot_int/pistart.html
http://www.ks.uiuc.edu/Research/vmd/
http://www.cgl.ucsf.edu/chimera/
Visualização de estruturas
http://www.pymol.org/
http://rasmol.org/
http://www.ks.uiuc.edu/Research/vmd/
http://www.cgl.ucsf.edu/chimera/
7/12/2013
34
MAS A ESTRUTURA É ESTÁTICA...
É possível calcular a dinâmica da estrutura
Modelos tentam se aproximar da dinâmica funcional da proteína
no meio aquoso
MÉTODOS PARA ESTUDO DINÂMICO DE
PROTEÍNAS
Simulações de dinâmica molecular clássica
Análise de modos normais
QM/MM (quantum mechanics/molecular mechanics)
Modelos coarse-grained
7/12/2013
35
SIMULAÇÃO DE
DINÂMICA
MOLECULAR
SIMULAÇÃO DE DINÂMICA MOLECULAR
Simula as leis da mecânica de Newton
Calcula os movimentos dos átomos (da ordem de nano-segundos até micro-segundos)
mas o cálculo pode levar dias (até meses)
Muito custoso computacionalmente
Maior parte do movimento é térmico (baixa amplitude e alta frequência)
Montagem do sistema: caixa cúbica de moléculas de água (solvente explícito)
7/12/2013
36
Pacote versátil para realizar dinâmica
molecular
Elaborado principalmente para estudos de
movimento de moléculas como proteínas,
lipídeos e ácidos nucléicos
http://www.gromacs.org/
7/12/2013
37
ETAPAS PARA REALIZAR UMA
SIMULAÇÃO
PROTEÍNA EM SOLVENTE EXPLÍCITO
7/12/2013
38
EFEITO PERIÓDICO DE CONTORNO (PBE)
Vídeo de uma simulação
7/12/2013
39
http://www.bevanlab.biochem.vt.edu/Pages/Personal/justin/gmx-tutorials/index.html
OUTROS PROGRAMAS PARA SIMULAÇÃO
http://www.ks.uiuc.edu/Research/namd/
http://ambermd.org/
http://www.charmm.org/
7/12/2013
40
ANÁLISE DE
MODOS NORMAIS
Movimentos oscilatórios das moléculas
(tendências de movimentos)
Número de modos = 3 x número de átomos
Possibilita a análise de movimentos mais globais
(alta amplitude e baixa frequência)
ANÁLISE DE MODOS NORMAIS
7/12/2013
41
aproximação do potencial total por uma função harmônica em torno de uma (não necessariamente a) estrutura mínima de energia
Desvantagem
Vantagem Rapidez nos cálculos
Movimentos globais
ANÁLISE DE MODOS NORMAIS
Um bom programa para o cálculo de modos normais
7/12/2013
42
Vídeo de modos normais
7/12/2013
43