introdução ao curso - portal ifsc

25
introdução ao curso http://www.ifsc.usp.br/~rdemarco/FFI0760/FFI0760.htm

Upload: others

Post on 05-Nov-2021

8 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: introdução ao curso - Portal IFSC

introdução ao curso

http://www.ifsc.usp.br/~rdemarco/FFI0760/FFI0760.htm

Page 2: introdução ao curso - Portal IFSC

Cronograma aulas teóricas

• Aulas teóricas (Segundas-feiras - Sala 146)• 30/07-introdução ao curso.• 06/08-Busca em bancos de dados• 13/08- Alinhamento local• 20/08- Alinhamento local • 27/08-Domínios proteicos• 03/09- -Semana da pátria • 10/09- Alinhamento global• 17/09- Analise filogenética baseada em alinhamento de domínios• 24/09-Predição de estrutura proteica/modificações em proteínas • 01/10- Seqüenciamento de genomas/transcriptomas• 08/10- Anotação de genomas• 15/10 –Semana da graduação• 22/10- Previsão de vias metabólicas a partir do genoma (entrega das questões do trabalho aos alunos)• 29/10- Uso de microarrays para a medida de níveis relativos de transcrição • 05/11- RNAseq (entrega do trabalho ao professor)• 12/11-identificação de proteínas através de espectrometria de massa• 19/11- Prova 2• 26/11-Prova substitutiva

Page 3: introdução ao curso - Portal IFSC

Cronograma aulas praticas

• Aulas praticas (quartas-feiras Sala 206) • 01/08-processamento de cromatogramas- montagem de sequências• 08/08-busca em bancos de dados• 15/08-Feriado municipal• 22/08- Uso de BLAST como ferramenta de alinhamento local• 29/08- Busca no PFAM, CDD,SMART,Intrepro e COG• 05/09- Semana da pátria• 12/09-uso do CLUSTAL como ferramenta de alinhamento global • 19/09- Analise filogenética baseada em alinhamento de domínios• 26/09- Predição de estrutura proteica/modificações em proteínas • 03/10- Prova 1.• 10/10- Analise de ESTs e mapeamento de ESTs no genoma• 17/10- Semana da graduação• 24/10- Anotação de genomas • 31/10- Período para realização do trabalho.• 07/11- Analise de dados de expressão• 14/11-Identificação de proteínas através da analise de espectros de massa

Page 4: introdução ao curso - Portal IFSC

Avaliação

• Avaliação:- A nota final será calculada seguindo a seguinte formula:

(NP1+NP2+NT)/3)*0.9+R*0.1

Onde:

NP- notas das provas

NT- nota dos trabalho

R: relatórios da aula pratica

É exigida presença em 70% das aulas.

Page 5: introdução ao curso - Portal IFSC

Objetivos do curso

• Preparar o aluno para realizar analises de informações provenientes de moléculas de RNA, DNA e proteínas

• Ênfase no uso de ferramentas disponíveis para correlacionar esta informação com funções biológicas destas moléculas

Page 6: introdução ao curso - Portal IFSC

Objetivos do curso

• Qual a importância de processar e interpretar informações contidas em biomoléculas?

• Como realizar comparações entre biomoléculas provenientes de diferentes organismos?

• Como estas informações se correlacionam com as características de um organismo?

Page 7: introdução ao curso - Portal IFSC

Crescimento dos bancos de dados de moléculas biológicas

Qual a importância desta informação para justificar os bilhões de dólares investidos na produção desta informação?

O que ocorreu a partir de meados da década de 90 para justificar este aumento no numero de seqüência depositadas ?

http://www.ncbi.nlm.nih.gov/Genbank/index.html

Page 8: introdução ao curso - Portal IFSC

Avanços na clonagem e seqüenciamento de DNA

1944 - Avery fornece evidencia que o DNA carrega a informação genética

1953 - Watson e Crick propõem o modelo de dupla hélice para o DNA

1955 - Kornberg descobre a DNA polimerase.

1962- Arber fornece evidencia da existência de enzimas nucleases de restrição.

1967 -Gellert descobre a DNA ligase.

1972-1973 –técnicas de clonagem de DNA são desenvolvidas por Boyer, Cohen, Berg e colegas.

1975-1977 -Sanger e Barrell e Maxam e Gilbert desenvolvem métodos rápidos de seqüenciamento de

DNA

1985-Mullis e colegas inventam a reação em cadeia da polimerase (PCR).

1990 -Simon e colegas estudam como utilizar cromossomos artificiais de bacterias (BACs) para clonagem

de moleculas grandes de DNA de humano.

1991 -Hood and Hunkapillar introduzem uma nova tecnologia de seqüenciamento de DNA automatizado.

Page 9: introdução ao curso - Portal IFSC

Avanços no seqüenciamento de genomas

1995 -Venter e colegas seqüenciam o primeiro genoma completo, o da bactéria

Haemophilus influenzae.

1996 -Goffeau e um consorcio internacional anunciam a finalização da primeira

seqüência genômica de um eucarioto, a levedura Saccharomyces cerevisiae.

1998 -Sulston ,Waterston e colegas produzem o primeiro genoma completo de um

organismo multicelular, o verme nematodo Caenorhabditis elegans.

2000- Venter e colegas produzem o primeiro genoma de um organismo multicelular

utilizando a metodologia de “Whole Genome Shotgun”

2001 –Dois consórcios independentes anunciam a finalização de um esboço do genoma

humano

2007- Primeiro genoma diploide de um individuo (Venter) foi sequenciado

Page 10: introdução ao curso - Portal IFSC

Seqüenciamento manual de DNA utilizando a técnica de Sanger

Seqüenciamento pelo método de Sanger permite obter informações de algumas centenas de pares de bases a partir do inicio do seqüenciamento

Page 11: introdução ao curso - Portal IFSC

Seqüenciamento manual de DNA utilizando a técnica de Sanger

Utilização de autoradiografia para obtenção de resultados – Necessidade de utilizar nucleotídeos radioativos e esperar pela sensibilização do filme fotográfico

Leitura de bases realizada manualmente

Dificuldade em implementar procedimentos em larga escala com este tipo de abordagem

Page 12: introdução ao curso - Portal IFSC

Seqüenciamento automático de DNA utilizando a técnica de Sanger

Utilização de dideoxi-nucleotideos ligados a diferentes moléculas fluorescentes

Page 13: introdução ao curso - Portal IFSC

Seqüenciamento automático de DNA utilizando a técnica de Sanger

Cada faixa colorida representa uma seqüência que é automaticamente convertida em um cromatograma, que por sua vez é interpretado para a obtenção da seqüência de DNA

96 seqüência com algumas centenas de bases podem ser produzidas em algumas horas

Imagem virtual de um gel de seqüenciamento de DNA

Cromatograma com interpretação de seqüência

Page 14: introdução ao curso - Portal IFSC

Limitações da técnica de SangerUtilizando a técnica de Sanger só é possível seqüenciar algumas centenas de

bases por cada reação

O seqüenciamento sempre se inicia de um ponto arbitrário que tem que ter a

seqüência conhecida para o desenho do primer

Cada reação de seqüenciamento só pode conter moléculas com seqüência

idênticas ou há um embaralhamento de seqüências

A solução encontrada para seqüenciamento de moléculas desconhecidas é

clonar o DNA em um vetor e iniciar o seqüenciamento a partir da porção do

vetor adjacente ao DNA desconhecido

Page 15: introdução ao curso - Portal IFSC

Novas tecnologias de seqüenciamento

PCR em emulsão acoplado com pirosequenciamento

Geram-se 400.000 seqüências entre 200 a 300 bases em uma corrida de algumas horas

Page 16: introdução ao curso - Portal IFSC

Novas tecnologias de seqüenciamento

Page 17: introdução ao curso - Portal IFSC

Informação em moléculas biológicasTTGTTTGTTTGTTGTGTTTTCCCTGGCAAACAGCTGGAGAAAGAGCAGCTCATGGAGAGGCTGAGAGAAG

CGGTTTTCGCGTCCTACCCAAACTGGGAGAGTAACCTTCAGCAGCTGGACTCACCGATTGGTTTTCCTTC

ATTTTCAGTGAAATCCCATTCTCTGGCTGGAGACACAGATGGCCTCAAATGAGAGAGATGCTATATCGTG

GTACCAAAAGAAGATTGGAGCCTACGATCAGCAGATATGGGAAAAGTCAATCGAACAGACTCAGATTAAG

GGTTTGAAAAACAAACCGAAAAAGATGGGCCACATAAAGCCAGACTTGATTGACGTTGACTTAATCAGAG

GGTCAACATTTGCCAAAGCAAAACCTGAAATTCCATGGACATCTCTGACTCGGAAGGGGCTTGTTCGAGT

TGTATTTTTTCCATTGTTCAGCAATTGGTGGATTCAGGTTACCTCTTTAAGAATCTTTGTTTGGCTGTTA

CTACTTTATTTCATGCAAGTTATAGCAATTGTCTTATATTTGATGATGCCTATTGTGAACATAAGTGAAG

TACTTGGACCCTTGTGCCTTATGCTACTCATGGGAACTGTCCACTGTCAAATTGTGTCTACTCAGATAAC

AAGACCATCAGGAAACAATGGAAATCGAAGAAGAAGAAAATTACGAAAAACTGTAAATGGTGATGGGAGC

CGAGAAAATGGAAATAACTCCTCTGATAAAGTCAGAGGAATAGAAACTTTGGAATCTGTACCCATTATTG

GTGGTTTTTGGGAGACTATCTTTGGCAACAGGAGGCTTTTAGGCGTTTGGGTAATGGGGTGTCTGATGAC

CTGTCAAGTGAAGAAGATGGTGAAGCACGGACACAGATGATATTATTGCGTAGGAGTGTGGAAGGGGCCT

CAAGTGACAATGGTTGTGAAGTTAAGAATAGAAAATCAATACTTTCAAGGCACCTAAACTCTCAGGTAAA

GAAAACCACTACAAGGTGGTGTCATATTGTGCGGGATTCAGATAGTCTGGCTGAATCAGAATTTGAATCA

GCAGCCTTCAGCCAGGGCTCTAGATCGGGTGTGAGTGGTGGCTCTCGAAGCCTCAACATGTCAAGAAGAG

ACTCAGAAAGCACCCGCCATGACTCGGAGACTGAGGACATGTTATGGGACGACCTGCTACATGGCCCAGA

GTGCCGGTCATCTGTCACCAGTGACAGTGAGGGGGCCCATGTGAATACCCTTCACTCAGGGACCAAACGT

GACCCCAAAGAGGATGTTTTTCAGCAGAATCATTTATTCTGGCTTCAGAATTCAAGTCCTTCCTCTGATC

GAGTTAGTGCAATAATCTGGGAGGGGAATGAGTGCAAAAAGATGGATATGTCTGTGTTGGAAATAAGTGG

CATCATCATGAGCAGGGTCAATGCCTATCAGCAAGGAGTAGGTTATCAGATGCTGGGAAATGTTGTCACT

ATTGGATTAGCATTTTTTCCATTCTTACATCGACT

TGGGAATAGTCCTGACAACCCCTATTGCGATCAGCTCTTTTGCTTCTACCGAGACTTTATCGTTTACTCC

TGACAACATAAATGCGGACATTAGTCTTGGAACTCTGAGCGGAAAAACAAAAGAGCGTGTTTATCTAGCC

GAAGAAGGAGGCCGAAAGGTCAGTCAACTTGACTGGAAATTCAATAACGCTGCAATTATTAAAGGTGCAA

TTAATTGGGATTTGATGCCCCAGATATCTATCGGGGCTGCTGGCTGGACAACTCTCGGTAGCCGAGGTGG

CAATATGGTCGATCGGGACTGGATGGATTCCAGTAACCCCGGAACCTGGACGGATGAAAGTAGACACCCT

GATACACAACTCAATTATGCCAACGAATTTGATCTGAATATCAGAGGCTGGCTCCCCAACGAACCCAATT

ACCGCCTGGGACTCATGGCCGGATATCAGGAAAGCCGTTATAGCTTTACAGCCAGAGGGGGTTCCTATAT

CTACAGTTCTGAGGAGGGATTCAGAGATGATATCGGCTCCTTCCCGAATGGAGAAAGAGCAATCGGCTAC

AAACAACGTTTTAAAATGCCCTACATTGGCTTGACTGGAAGTTATCGTTATGAAGATTTTGAGCTAGGTG

GTACATTTAAATACAGCGGCTGGGTGGAAGCATTTGATAACGATGAACACTATGACCCAGGAAAAAGAAT

CACTTATCGCAGTAAAGTCAAAGACCAAAATTACTATTCTGTTGCAGTCAATGCAGGTTATTACGTAACG

CCTAATGCAAAAGTTTATATTGAAGGCGCATGGAATCGGGTTACGAATAAAAAAGGTGATACTTCACTTT

ATGATCACAATGATAACACTTCTGACTACAGCAAAAATGGTGCAGGCATAGAAAACTATAACTTCATCAC

TACTGCTGGTC

Seqüência DNA 1

Seqüência DNA 2

Qual a diferença entre estas duas moléculas?

Page 18: introdução ao curso - Portal IFSC

Informação em moléculas biológicasTTGTTTGTTTGTTGTGTTTTCCCTGGCAAACAGCTGGAGAAAGAGCAGCTCATGGAGAGGCTGAGAGAAG

CGGTTTTCGCGTCCTACCCAAACTGGGAGAGTAACCTTCAGCAGCTGGACTCACCGATTGGTTTTCCTTC

ATTTTCAGTGAAATCCCATTCTCTGGCTGGAGACACAGATGGCCTCAAATGAGAGAGATGCTATATCGTG

GTACCAAAAGAAGATTGGAGCCTACGATCAGCAGATATGGGAAAAGTCAATCGAACAGACTCAGATTAAG

GGTTTGAAAAACAAACCGAAAAAGATGGGCCACATAAAGCCAGACTTGATTGACGTTGACTTAATCAGAG

GGTCAACATTTGCCAAAGCAAAACCTGAAATTCCATGGACATCTCTGACTCGGAAGGGGCTTGTTCGAGT

TGTATTTTTTCCATTGTTCAGCAATTGGTGGATTCAGGTTACCTCTTTAAGAATCTTTGTTTGGCTGTTA

CTACTTTATTTCATGCAAGTTATAGCAATTGTCTTATATTTGATGATGCCTATTGTGAACATAAGTGAAG

TACTTGGACCCTTGTGCCTTATGCTACTCATGGGAACTGTCCACTGTCAAATTGTGTCTACTCAGATAAC

AAGACCATCAGGAAACAATGGAAATCGAAGAAGAAGAAAATTACGAAAAACTGTAAATGGTGATGGGAGC

CGAGAAAATGGAAATAACTCCTCTGATAAAGTCAGAGGAATAGAAACTTTGGAATCTGTACCCATTATTG

GTGGTTTTTGGGAGACTATCTTTGGCAACAGGAGGCTTTTAGGCGTTTGGGTAATGGGGTGTCTGATGAC

CTGTCAAGTGAAGAAGATGGTGAAGCACGGACACAGATGATATTATTGCGTAGGAGTGTGGAAGGGGCCT

CAAGTGACAATGGTTGTGAAGTTAAGAATAGAAAATCAATACTTTCAAGGCACCTAAACTCTCAGGTAAA

GAAAACCACTACAAGGTGGTGTCATATTGTGCGGGATTCAGATAGTCTGGCTGAATCAGAATTTGAATCA

GCAGCCTTCAGCCAGGGCTCTAGATCGGGTGTGAGTGGTGGCTCTCGAAGCCTCAACATGTCAAGAAGAG

ACTCAGAAAGCACCCGCCATGACTCGGAGACTGAGGACATGTTATGGGACGACCTGCTACATGGCCCAGA

GTGCCGGTCATCTGTCACCAGTGACAGTGAGGGGGCCCATGTGAATACCCTTCACTCAGGGACCAAACGT

GACCCCAAAGAGGATGTTTTTCAGCAGAATCATTTATTCTGGCTTCAGAATTCAAGTCCTTCCTCTGATC

GAGTTAGTGCAATAATCTGGGAGGGGAATGAGTGCAAAAAGATGGATATGTCTGTGTTGGAAATAAGTGG

CATCATCATGAGCAGGGTCAATGCCTATCAGCAAGGAGTAGGTTATCAGATGCTGGGAAATGTTGTCACT

ATTGGATTAGCATTTTTTCCATTCTTACATCGACT

TGGGAATAGTCCTGACAACCCCTATTGCGATCAGCTCTTTTGCTTCTACCGAGACTTTATCGTTTACTCC

TGACAACATAAATGCGGACATTAGTCTTGGAACTCTGAGCGGAAAAACAAAAGAGCGTGTTTATCTAGCC

GAAGAAGGAGGCCGAAAGGTCAGTCAACTTGACTGGAAATTCAATAACGCTGCAATTATTAAAGGTGCAA

TTAATTGGGATTTGATGCCCCAGATATCTATCGGGGCTGCTGGCTGGACAACTCTCGGTAGCCGAGGTGG

CAATATGGTCGATCGGGACTGGATGGATTCCAGTAACCCCGGAACCTGGACGGATGAAAGTAGACACCCT

GATACACAACTCAATTATGCCAACGAATTTGATCTGAATATCAGAGGCTGGCTCCCCAACGAACCCAATT

ACCGCCTGGGACTCATGGCCGGATATCAGGAAAGCCGTTATAGCTTTACAGCCAGAGGGGGTTCCTATAT

CTACAGTTCTGAGGAGGGATTCAGAGATGATATCGGCTCCTTCCCGAATGGAGAAAGAGCAATCGGCTAC

AAACAACGTTTTAAAATGCCCTACATTGGCTTGACTGGAAGTTATCGTTATGAAGATTTTGAGCTAGGTG

GTACATTTAAATACAGCGGCTGGGTGGAAGCATTTGATAACGATGAACACTATGACCCAGGAAAAAGAAT

CACTTATCGCAGTAAAGTCAAAGACCAAAATTACTATTCTGTTGCAGTCAATGCAGGTTATTACGTAACG

CCTAATGCAAAAGTTTATATTGAAGGCGCATGGAATCGGGTTACGAATAAAAAAGGTGATACTTCACTTT

ATGATCACAATGATAACACTTCTGACTACAGCAAAAATGGTGCAGGCATAGAAAACTATAACTTCATCAC

TACTGCTGGTC

Seqüência DNA Homo Sapienstranscription factor

Seqüência DNA Escherichia coliprotease T

Page 19: introdução ao curso - Portal IFSC

Informação em moléculas biológicas

-mRNA e proteínas são polímeros biológicos que contem informações complexas e cada organismo possui milhares de moléculas diferentes para cada um deste tipos de moléculas. DNA normalmente possui poucas moléculas diferentes mas estas são muito longas.

-A interpretação das informações contidas nestas moléculas biológicas não é trivial

-No caso de moléculas como RNA e proteínas existe uma variação do seu nível relativo de produção das diversas moléculas dependente do tipo de tecido, estagio de desenvolvimento, estímulos externos, etc.. Portanto a própria medida da abundancia destas moléculas representa uma importante informação

Page 20: introdução ao curso - Portal IFSC

Informação em moléculas biológicas

Genoma

Transcriptoma

Proteoma

Genoma e transcriptoma- informação pode ser obtida através de técnicas de seqüenciamento

Proteôma- Seqüenciamento de proteínas é muito ineficiente. Técnicas atuais permitem a

dedução de pequenos fragmentos

Page 21: introdução ao curso - Portal IFSC

Informação em moléculas biológicas

Maioria das informações obtidas é para as moléculas de DNA e RNA.

As proteínas são as moléculas efetoras da maioria de processos celulares e

portanto são as moléculas de maior interesse para entendimento de processos

biológicos

Devemos nos lembrar que a molécula de mRNA contém a informação para a

produção de uma proteína e é possível interpretá-la com o conhecimento do

código genético

A partir de uma seqüência de proteína não é possível, a principio, deduzir sua

função

Entretanto é possível prever que a proteína de interesse tenha função

semelhante àquela de uma proteína de função conhecida que tenha seqüência

similar

Page 22: introdução ao curso - Portal IFSC

Operações básicas no processamento de seqüências biologicas

-Tradução – RNA para proteína

-Complemento-reverso de fitas de DNA

-Calculo peso molecular-pI de uma proteína

Page 23: introdução ao curso - Portal IFSC

Predição de seqüência de proteínas a partir do cDNA

http://www.ncbi.nlm.nih.gov/gorf/gorf.html

Page 24: introdução ao curso - Portal IFSC

Predição de seqüência de proteínas a partir do cDNA

Page 25: introdução ao curso - Portal IFSC

Predição de seqüência de proteínas a partir do cDNA