ffi0776 ‐‐ modelagem e alinhamento de sequências de … · aula 06 bacharelado em ciências...

15
FFI0776 FFI0776 Modelagem e Modelagem e Engenharia de Proteínas Engenharia de Proteínas Prof Rafael V C Guido Prof Rafael V C Guido Prof . Rafael V . C. Guido Prof . Rafael V . C. Guido [email protected] [email protected] Aula 06 Aula 06 Bacharelado em Ciências Físicas e Biomoleculares Bacharelado em Ciências Físicas e Biomoleculares Bacharelado em Ciências Físicas e Biomoleculares Bacharelado em Ciências Físicas e Biomoleculares Instituto de Física de São Carlos Instituto de Física de São Carlos USP USP Objetivos Objetivos Alinhamento de Sequências de Proteínas Determinação da sequência de aa Características do alinhamento de aa Modelagem por homologia Modelagem por homologia Estratégia/aplicação Etapas do processo Exemplo Exemplo Determinação da Sequências Determinação da Sequências de de Aminácidos Aminácidos/Nucleotídeos /Nucleotídeos N C Estrutura primária Estrutura primária Conjunto de letras em sequência que representa os aminoácidos constituintes de uma proteína; A sequência que estão arranjados os aminoácidos contém toda informação necessária para a estrutura e função da proteína; proteína ; A análise e comparação das sequências de aminoácidos de diferentes proteínas indicam diferentes proteínas indicam como essas biomoléculas id evoluíram e como a vida no planeta se desenvolveu N C N C Sequência de aminoácidos

Upload: dodung

Post on 20-Nov-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: FFI0776 ‐‐ Modelagem e Alinhamento de Sequências de … · Aula 06 Bacharelado em Ciências Físicas e Biomoleculares Instituto de Física de São Carlos ‐‐USP ... 5. Construção

FFI0776 FFI0776 ‐‐Modelagem e Modelagem e ggEngenharia de ProteínasEngenharia de Proteínas

Prof Rafael V C GuidoProf Rafael V C GuidoProf. Rafael V. C. GuidoProf. Rafael V. C. [email protected]@ifsc.usp.br

Aula 06Aula 06Bacharelado em Ciências Físicas e BiomolecularesBacharelado em Ciências Físicas e BiomolecularesBacharelado em Ciências Físicas e BiomolecularesBacharelado em Ciências Físicas e Biomoleculares

Instituto de Física de São Carlos Instituto de Física de São Carlos ‐‐ USPUSP

ObjetivosObjetivos

• Alinhamento de Sequências de Proteínas– Determinação da sequência de aaç q– Características do alinhamento de aa

• Modelagem por homologia• Modelagem por homologia• Estratégia/aplicação• Etapas do processo• Exemplo• Exemplo

Determinação da SequênciasDeterminação da Sequênciasde de AminácidosAminácidos/Nucleotídeos/Nucleotídeos

N C

Estrutura primária Estrutura primária 

• Conjunto de letras em sequência que representa os aminoácidos constituintes de uma proteína;

• A sequência que estão arranjados os aminoácidos contém q q jtoda informação necessária para a estrutura e função da proteína;proteína;

• A análise e comparação das sequências de aminoácidos de diferentes proteínas indicamdiferentes proteínas indicam como essas biomoléculas 

l í idevoluíram e como a vida no planeta se desenvolveu 

N CN C

Sequência de aminoácidos

Page 2: FFI0776 ‐‐ Modelagem e Alinhamento de Sequências de … · Aula 06 Bacharelado em Ciências Físicas e Biomoleculares Instituto de Física de São Carlos ‐‐USP ... 5. Construção

Estrutura e FunçãoEstrutura e Função

Estrutura primária

Estrutura secundária

Estrutura terciária

Estrutura quaternária

ÃFUNÇÃO

D b i f ã ti dDescobrir a função a partir do conhecimento da estrutura primária

Determinação da sequência de aminoácidosDeterminação da sequência de aminoácidos

• 1953 – Frederick Sanger– Determinação da primeira ç psequência de aminoácidos do hormônio insulina

Determinação da sequência de aminoácidosDeterminação da sequência de aminoácidos

• Degradação de EdmanDegradação de Edman– Procedimento que marca e remove somente o resíduo N terminal marcadoN‐terminal marcado

Determinação da sequência de aminoácidosDeterminação da sequência de aminoácidos

Page 3: FFI0776 ‐‐ Modelagem e Alinhamento de Sequências de … · Aula 06 Bacharelado em Ciências Físicas e Biomoleculares Instituto de Física de São Carlos ‐‐USP ... 5. Construção

Determinação da sequência de Determinação da sequência de aaaa –– exemplo exemplo  Determinação da sequência de aminoácidosDeterminação da sequência de aminoácidos

Etapas1 Hidrólise da proteína (mistura de aa)1. Hidrólise da proteína (mistura de aa)2. Marcação e separação dos aa da mistura3. Identificação e quantificação dos aa

Cloreto de dansil(fluorecentes)

Cloreto de dabsila(corante)

Determinação da sequência de nucleotídeosDeterminação da sequência de nucleotídeos

PCR

ddNTPs

Determinação da sequência de nucleotídeosDeterminação da sequência de nucleotídeos

Page 4: FFI0776 ‐‐ Modelagem e Alinhamento de Sequências de … · Aula 06 Bacharelado em Ciências Físicas e Biomoleculares Instituto de Física de São Carlos ‐‐USP ... 5. Construção

Determinação da sequência de nucleotídeosDeterminação da sequência de nucleotídeos

• Elucidação do código genético (genoma)d– Sequenciamento de DNA

– Isolamento de genesDedução da cadeia polipeptídica pela determinação da sequência de nucleotídeos no gene

Determinação da sequência de Determinação da sequência de aaaa

• Além de indicar a estrutura e função de uma proteína, o conhecimento da sequência de aa sugere:– localização celular 

(e.g., extracelular, intracelular, superfície celular)pontos de modificações– pontos de modificações pós‐traducionais(e.g., fosforilação, formação de pontes dissulfeto, glicosilação, sulfatação, metilação)l ã l ti t dif t– relação evolutiva entre as diferentes 

proteínas(e.g., proteínas com > 30% de identidade ( g , p %sequencial tem alta probabilidade de serem evolutivamente relacionadas)

Proteínas homólogasProteínas homólogas

Bi lé l l í d t l• Biomoléculas que evoluíram de um ancestral comum;• Sequência de aa entre duas proteínas homólogas pode ser:

– idêntica– similar (vários níveis)– diferente

• Similaridade sequencial entreSimilaridade sequencial entre proteínas homólogas é menos preservada que a similaridadepreservada que a similaridade estrutural

Estrutura 3D é fundamental para a– Estrutura 3D é fundamental para afunção específica da proteína

Proteínas homólogas Proteínas homólogas –– exemploexemplo

tripsina quimotripsina

Superfamília = tripsina similar serino‐proteasesId tid d i l 44%Identidade sequencial = 44%

Page 5: FFI0776 ‐‐ Modelagem e Alinhamento de Sequências de … · Aula 06 Bacharelado em Ciências Físicas e Biomoleculares Instituto de Física de São Carlos ‐‐USP ... 5. Construção

Proteínas homólogas Proteínas homólogas –– exemploexemplo

Superfamília = tripsina similar serino‐proteasesId tid d i l 44%

rmsd = 0,58 ÅIdentidade sequencial = 44%

Proteínas homólogas Proteínas homólogas –– subdivisãosubdivisão

P l O t lAlinhamento de SequênciasAlinhamento de Sequências

• ParalogosProteínas da mesma família 

• OrtologosProteínas da mesma família presentes 

de Proteínasde Proteínaspresentes na mesma espécie (homólogos na mesma espécie)

em espécies diferentes (homólogos em espécie diferentes)

tripsina e quimotripsina bovina GAPDH humana e de T. cruzi

Identificação de proteínas homólogasIdentificação de proteínas homólogas

• Alinhamento sequencialProcesso que compara duas (ou mais) sequências de aa de proteínas– Processo que compara duas (ou mais) sequências de aa de proteínas baseado nas características de similaridade (e.g., idênticos, similares e diferentes) entre os resíduos.

Q lid d d li h• Qualidade do alinhamento– Pontuação positiva é atribuída para cada posição onde os resíduos de aa

idênticos são alinhados– Gap = intervalo inserido entre segmentos de aa, pertencentes a mesma 

cadeia polipeptídica, para otimizar o alinhamento entre sequências homólogashomólogas

– Penalidades são atribuídas em função do número de “gaps” introduzidos • Alinhamento final 

– alinhamento que apresenta pontuação ótima determinada pelo equilíbrio entre o número máximo de resíduos de aa idênticos alinhados com o menor número de “gaps”g p

Matriz de alinhamentoMatriz de alinhamento

Matriz Dayhoff→ Desenvolvida Margaret Dayhoff em 1978 com base na investigação de 1.572 mutações observadas em 71 famílias de proteínas relacionadas evolutivamente

Valores > 0→ aa queValores > 0 → aa que substituem uns aos outroscom maior frequência, q ,portanto, indicam que os resíduos substituídossão funcionalmente equivalentes

Page 6: FFI0776 ‐‐ Modelagem e Alinhamento de Sequências de … · Aula 06 Bacharelado em Ciências Físicas e Biomoleculares Instituto de Física de São Carlos ‐‐USP ... 5. Construção

Matriz de alinhamentoMatriz de alinhamento

M t i PAM (P i t A t d M t ti )→ b dMatrizes PAM (Point Accepted Mutation) → baseadas na estimativa da taxa de mutação de aa entre proteínas relacionadas evolutivamente. São eficazes para ‘pontuação' de similaridade p p çentre sequências que divergiram ao longo da evolução

PAM250→ o número subsequente a matriz PAM indica a quantidade de dados de sequências de proteínas alinhadas  extrapoladas para um nível de 250 substituições de aminoácidosextrapoladas para um nível de 250 substituições de aminoácidos por 100 resíduos por 100 milhões de anos.

Matrizes PAM seguidas de um número elevado (e.g., PAM250, PAM200, PAM 160 ) é ideal para sequências mais divergentes, 

t t i PAM id d ú (enquanto as matrizes PAM seguidas de números menores (e.g., PAM30, PAM70) são mais apropriadas para avaliar sequências protéicas menos divergentes. p g

Matriz de alinhamentoMatriz de alinhamento

• Blosum (blocks substitutionmatrix)– Blosum45, Blosum50 → proteínas com ↓ iden dade sequencial (divergentes)– Blosum62, Blosum80 → proteínas com ↑ iden dade sequencial (homólogas)

Alinhamento sequencialAlinhamento sequencial

• Validação do alinhamento1. Permutação dos resíduos de aa→ Sequências aleatórias;ç q ;2. Sequências aleatórias são alinhadas com a sequência original;3 Pontuação do novo alinhamento (sequência aleatória/original)3. Pontuação do novo alinhamento (sequência aleatória/original).

• Parâmetro de avaliação– Pontuação do alinhamento original deve ser significativamente 

maior que a pontuação dos alinhamentos obtidos pelas sequências aleatórias 

Alinhamento sequencial Alinhamento sequencial –– Banco de dadosBanco de dados

Page 7: FFI0776 ‐‐ Modelagem e Alinhamento de Sequências de … · Aula 06 Bacharelado em Ciências Físicas e Biomoleculares Instituto de Física de São Carlos ‐‐USP ... 5. Construção

Alinhamento sequencial Alinhamento sequencial ‐‐ ExemploExemploModelagem por HomologiaModelagem por Homologia

Modelagem por homologia de proteínasModelagem por homologia de proteínas

P di t t i l d diProcedimento computacional capaz de predizer a estrutura de proteínas baseado em sequências de aa e nas coordenadas 3D de proteínas relacionadas (homólogas)• Modelagem por Homologia de ProteínasModelagem por Homologia de Proteínas(Homology Modeling of Proteins)M d l d P í B d• Modelagem de Proteínas Baseada no Conhecimento (Knowledge‐Based Protein Modeling)

• Modelagem Comparativa de ProteínasModelagem Comparativa de Proteínas(Comparative Modeling of Proteins)

Modelagem por homologia de proteínasModelagem por homologia de proteínas

• Estratégia– Utilizar o conhecimento disponível de estruturas 3D de 

proteínas homólogas para indicar a conformação de uma t í d i t j t t i d ã f i d t i dproteína de interesse cuja estrutura ainda não foi determinada 

por métodos experimentais.

l d í lh dEm geral, duas proteínas que compartilham 50% deidentidade sequencial podem ter os Cα da região central(“core”) sobrepostos com valor de RMDS ≤ 1,0 Å

• Aplicação– Identificação/alteração funcional– Identificação/alteração funcional– Predição dos efeitos de mutação– Planejamento de moléculas bioativasPlanejamento de moléculas bioativas– Desenvolvimento de vacinas– Predição de interações entre proteínasPredição de interações entre proteínas

Page 8: FFI0776 ‐‐ Modelagem e Alinhamento de Sequências de … · Aula 06 Bacharelado em Ciências Físicas e Biomoleculares Instituto de Física de São Carlos ‐‐USP ... 5. Construção

Programas (Programas (softwaressoftwares))• MODELLER

http://salilab org/modeller/– http://salilab.org/modeller/• SWISS‐MODEL

– http://swissmodel expasy org/workspace/http://swissmodel.expasy.org/workspace/• Sybyl

– http://tripos.com/p // p /• Prime

– http://www.schrodinger.com/• ICM

– http://www.molsoft.com/

Modelagem por homologia de proteínasModelagem por homologia de proteínas

• Etapas envolvidasp1. Determinação de proteínas relacionadas (homólogas)2. Alinhamento sequencial da proteína de interesse (target protein)2. Alinhamento sequencial da proteína de interesse (target protein) 

com as proteínas de referências (template proteins)3. Identificação de regiões estruturais conservadasç g

(SCR, structurally conserved regions) e regiões estruturais variáveis (SVR, structurally variable regions)

4. Construção das regiões estruturais conservadas da proteínas de interesse utilizando as coordenadas das proteínas de referência;

5. Construção das regiões estruturais variáveis6. Modelagem das cadeias laterais dos aa7. Refinamento estrutural 

• métodos de minimização de energia e dinâmica molecular

8. Validação do modelo construído

FluxogramaFluxograma

Identificação AlinhamentoIdentificação das Estruturas Relacionadas

Alinhamento Sequencial 

(prot. interesse/referências)

Alinhamento Estrutural (prot. interesse/referências)

Gaps amplos: identificação e inclusão de prot. de referência adicionais

Avaliação dosRefinamento Construção de Avaliação dos gaps na estrutura

Refinamento do modelo

Construção de cadeias laterais

Defeitos significantes: Reavaliação do alinhamento sequencial

Validação Defeitos  insignificantes: FINALIZADO

Defeitos moderados: modificação do protocolo de refinamento

1. Alinhamento sequencial 1. Alinhamento sequencial 

• Etapa fundamental da modelagem por homologia– Identificação de sequências relacionadas e 

regiões de estrutura conservadas (SCR)– Identidade sequencial ≥ 30%

Page 9: FFI0776 ‐‐ Modelagem e Alinhamento de Sequências de … · Aula 06 Bacharelado em Ciências Físicas e Biomoleculares Instituto de Física de São Carlos ‐‐USP ... 5. Construção

1. Alinhamento sequencial 1. Alinhamento sequencial 

A áli i i d li h d li d• A análise criteriosa do alinhamento deve ser realizada para evitar a construção de modelos improváveis 

i di é i l ã f á i– e.g., impedimentos estéricos, enovelamentos não favoráveis• Fatores importantes:

– Analisar os gaps (> 2‐3 aa)• Gaps < 1 aa em estruturas secundárias (folhas‐β e α‐hélices)

R íd d P li (P ) ê i d i t li h d– Resíduos de Prolina (Pro) na sequência de interesse alinhados em regiões de α‐hélices → interrupção de α‐hélices

– Deslocamento > 2 aa dos resíduos Cisteínas (Cys) em relação aDeslocamento > 2 aa dos resíduos Cisteínas (Cys) em relação a sequência referência → interrupção de pontes disulfetos

– Deslocamento > 2‐3 aa dos resíduos iônicos (Lys, Arg, Asp e Glu) em ( y , g, p )relação a sequência referência → interrupção de interações iônicas

– No caso de enzimas, analisar os resíduos que fazem parte do sítio iativo

Fatores importantesFatores importantesResíduos de Prolina (Pro) na sequência de interesse alinhados em regiões de 

Deslocamento > 2 aa dos resíduos Cisteínas (Cys) em relação a sequência referência → interrupção de pontes disulfetos

α‐hélices → interrupção de α‐hélices

Asp210

249

Asp

2,9 Å Deslocamento > 2‐3 aa dos resíduos Arg249

3,3 Å

iônicos (Lys, Arg, Asp e Glu) em relação a sequência referência → interrupção de interações iônicas

2. Alinhamento espacial e construção 2. Alinhamento espacial e construção preliminar (SCR)preliminar (SCR)preliminar (SCR)preliminar (SCR)

• Construção da cadeia principal• Construção do núcleo da proteínaConstrução do núcleo da proteína

– Região inacessível ao solventeEl t d t t dá i– Elementos de estrutura secundária

3. Modelagem das regiões variáveis (3. Modelagem das regiões variáveis (SVRsSVRs))

• Análise de segmentos que apresentam extensão equivalente em estruturas homólogas→ conformação similar (transferência das coordenadas 3D)homólogas → conformação similar (transferência das coordenadas 3D)• Busca de alças em banco de dados (PDB)• Construção por métodos de novo (e g ab initio)Construção por métodos de novo (e.g., ab initio)

Page 10: FFI0776 ‐‐ Modelagem e Alinhamento de Sequências de … · Aula 06 Bacharelado em Ciências Físicas e Biomoleculares Instituto de Física de São Carlos ‐‐USP ... 5. Construção

4. Construção das cadeias laterais 4. Construção das cadeias laterais 

• Construção da cadeia lateral dos aa• Os segmentos da cadeia polipetídica que apresentam resíduos 

de aa idênticos tem as coordenadas 3D das cadeias laterais desses aa da estrutura de referência transferidas para o modelo da estrutura de interesse 

5. Modelagem das cadeias laterais5. Modelagem das cadeias laterais

• Predição das conformações das cadeias laterais é a etapa mais difícil e desafiadora da modelagem por homologia;

• Cadeia lateral de diversos aa possuem um ou mais estados energéticos favoráveis (rotâmeros);g ( );

• Substituições conservativas (e.g., Ile/Val; Gln/Glu)Assume se que a cadeia lateral na proteína de interesse– Assume‐se que a cadeia lateral na proteína de interesse apresenta a mesma conformação que aquela observada na proteína de referênciaproteína de referência

Ile Val Gln Glu

5. Modelagem das cadeias laterais5. Modelagem das cadeias laterais• Substituições não‐conservativas (e.g., Lys/Val; Tyr/Glu)

l ã d b bl d â• Utilização de biblioteca de rotâmerosIle = 7 rotâmerosTyr = 4 rotâmeros Asp = 5 rotâmeros

5. Modelagem das cadeias laterais5. Modelagem das cadeias laterais

A 33 tâ L 24 tâArg = 33 rotâmeros Lys = 24 rotâmeros

Page 11: FFI0776 ‐‐ Modelagem e Alinhamento de Sequências de … · Aula 06 Bacharelado em Ciências Físicas e Biomoleculares Instituto de Física de São Carlos ‐‐USP ... 5. Construção

6. Refinamento6. Refinamento

• Refinamento– Frequentemente, segmentos onde regiões estruturais conservadas e variáveis são conectadas apresentam impedimentos estéricos ou conformações energeticamenteimpedimentos estéricos ou conformações energeticamente desfavoráveis;

– Minimização de energia é empregada para corrigir– Minimização de energia é empregada para corrigir imperfeições no modelo

7. Validação do modelo7. Validação do modelo

• Validação– Detecção de aspectos conformacionais que diferem dos parâmetros padrões 

• Distância de ligação• Ângulos torsionais• Ângulos torsionais• Contatos entre átomos

– Anolea• http://swissmodel.expasy.org/workspace/index.php?func=tools_structureassessment1

– Verify 3D• http://nihservermbi ucla edu/Verify 3D/• http://nihserver.mbi.ucla.edu/Verify_3D/

– EVA • http://cubic.bioc.columbia.edu/eva/

– PROCHECK • http://www.ebi.ac.uk/thornton‐srv/software/PROCHECK/

WHAT IF– WHAT IF• http://swift.cmbi.ru.nl/whatif/

– MOLPROBITY• http://molprobity.biochem.duke.edu/

Validação do modelo Validação do modelo ‐‐ Gráfico Gráfico RamachandranRamachandran Validação do modelo Validação do modelo ‐‐ Gráfico Gráfico RamachandranRamachandran

Modelo por homologia Modelo experimental

Page 12: FFI0776 ‐‐ Modelagem e Alinhamento de Sequências de … · Aula 06 Bacharelado em Ciências Físicas e Biomoleculares Instituto de Física de São Carlos ‐‐USP ... 5. Construção

Portal de Modelos por HomologiaPortal de Modelos por Homologia

http://sbkb.org/KB/modelshub.html

Portal de Modelos por HomologiaPortal de Modelos por Homologia

http://modbase.compbio.ucsf.edu/modbase‐cgi/index.cgi

Modelagem por HomologiaModelagem por Homologiade Proteínas de Proteínas ‐‐ ExemploExemplo

Modelagem por homologia Modelagem por homologia ‐‐ exemploexemplo

• Receptores acoplados a proteína G (GPCRs)– Receptores dopaminérgicos (D2)– Receptores serotonérgicos (5HT1,2),– Receptores histamínicos (H1)– Receptores muscarínicos (M1)

• Até 2007 somente uma estrutura disponível no PDB havia sido determinada em alta resolução –

Årodopsina bovina 2,80 Å (PDB ID, 1F88)• Recentemente:

– Receptor β2 adrenérgico humano (PDB ID, 2RH1)– Receptor de adenosina A2A humano (PDB ID, 3EML)– Receptor rodopsina de lula– Receptor β1 adrenérgico de peru– Receptor opsina bovina

Page 13: FFI0776 ‐‐ Modelagem e Alinhamento de Sequências de … · Aula 06 Bacharelado em Ciências Físicas e Biomoleculares Instituto de Física de São Carlos ‐‐USP ... 5. Construção

Modelagem por homologia Modelagem por homologia ‐‐ exemploexemplo Modelagem por homologia Modelagem por homologia ‐‐ exemploexemplo

• Programa = Prime 1.6 (Schrӧdinger)• Estrutura referência = Receptor β2 adrenérgico humano p β2 g

• PDB ID, 2RH1 ‐ resolução 2,40 Å

• Estruturas de interesse = Receptores acoplados a proteína G struturas de interesse Receptores acoplados a proteína G• D2, D3, D4, 5‐HT1B, 5‐HT2A, 5‐HT2B, 5‐HT2C, M1, H1, e A2A

• ValidaçãoValidação• Cadeias laterais =  ajustadas manualmente (biblioteca de rotâmeros)• MolProbity• PROCHECK

Modelagem por homologia Modelagem por homologia ‐‐ exemploexemplo Modelagem por homologia Modelagem por homologia ‐‐ exemploexemplo

5HT1B 5HT2A 5HT2B 5HT2C1B 2A 2B 2C

D2 D3 D4 H1 M1

Page 14: FFI0776 ‐‐ Modelagem e Alinhamento de Sequências de … · Aula 06 Bacharelado em Ciências Físicas e Biomoleculares Instituto de Física de São Carlos ‐‐USP ... 5. Construção

Modelagem por homologia Modelagem por homologia ‐‐ exemploexemplo Modelagem por homologia Modelagem por homologia ‐‐ exemploexemplo

Modelo 5HT2AT i i l li h idTriagem virtual com ligantes conhecidos1049 ligantes (49 compostos bioativos)

Docagem Molecular no Modelo 5HT2A2AIdentificou 29 dos 49 compostos bioativos

Modelagem por homologia Modelagem por homologia ‐‐ exemploexemplo Modelagem por homologia Modelagem por homologia ‐‐ exemploexemplo

Modelagem por homologia

Experimental (raios‐X)

rmsd = 2.2 Å 

Page 15: FFI0776 ‐‐ Modelagem e Alinhamento de Sequências de … · Aula 06 Bacharelado em Ciências Físicas e Biomoleculares Instituto de Física de São Carlos ‐‐USP ... 5. Construção

Próxima aula 02.10.12Próxima aula 02.10.12

Aula Prática de Modelagem por HomologiaLocal: Laboratório 205Local: Laboratório 205Horário: 10 – 12h