introdução ao curso - portal ifscrdemarco/ffi0760/introducao.pdf · • 30/07-introdução ao...

introdução ao curso

http://www.ifsc.usp.br/~rdemarco/FFI0760/FFI0760.htm

Cronograma aulas teóricas

• Aulas teóricas (Segundas-feiras - Sala 146)• 30/07-introdução ao curso.• 06/08-Busca em bancos de dados• 13/08- Alinhamento local• 20/08- Alinhamento local • 27/08-Domínios proteicos• 03/09- -Semana da pátria • 10/09- Alinhamento global• 17/09- Analise filogenética baseada em alinhamento de domínios• 24/09-Predição de estrutura proteica/modificações em proteínas • 01/10- Seqüenciamento de genomas/transcriptomas• 08/10- Anotação de genomas• 15/10 –Semana da graduação• 22/10- Previsão de vias metabólicas a partir do genoma (entrega das questões do trabalho aos alunos)• 29/10- Uso de microarrays para a medida de níveis relativos de transcrição • 05/11- RNAseq (entrega do trabalho ao professor)• 12/11-identificação de proteínas através de espectrometria de massa• 19/11- Prova 2• 26/11-Prova substitutiva

Cronograma aulas praticas

• Aulas praticas (quartas-feiras Sala 206) • 01/08-processamento de cromatogramas- montagem de sequências• 08/08-busca em bancos de dados• 15/08-Feriado municipal• 22/08- Uso de BLAST como ferramenta de alinhamento local• 29/08- Busca no PFAM, CDD,SMART,Intrepro e COG• 05/09- Semana da pátria• 12/09-uso do CLUSTAL como ferramenta de alinhamento global • 19/09- Analise filogenética baseada em alinhamento de domínios• 26/09- Predição de estrutura proteica/modificações em proteínas • 03/10- Prova 1.• 10/10- Analise de ESTs e mapeamento de ESTs no genoma• 17/10- Semana da graduação• 24/10- Anotação de genomas • 31/10- Período para realização do trabalho.• 07/11- Analise de dados de expressão• 14/11-Identificação de proteínas através da analise de espectros de massa

Avaliação

• Avaliação:- A nota final será calculada seguindo a seguinte formula:

(NP1+NP2+NT)/3)*0.9+R*0.1

NP- notas das provas

NT- nota dos trabalho

R: relatórios da aula pratica

É exigida presença em 70% das aulas.

Objetivos do curso

• Preparar o aluno para realizar analises de informações provenientes de moléculas de RNA, DNA e proteínas

• Ênfase no uso de ferramentas disponíveis para correlacionar esta informação com funções biológicas destas moléculas

Objetivos do curso

• Qual a importância de processar e interpretar informações contidas em biomoléculas?

• Como realizar comparações entre biomoléculas provenientes de diferentes organismos?

• Como estas informações se correlacionam com as características de um organismo?

Crescimento dos bancos de dados de moléculas biológicas

Qual a importância desta informação para justificar os bilhões de dólares investidos na produção desta informação?

O que ocorreu a partir de meados da década de 90 para justificar este aumento no numero de seqüência depositadas ?

http://www.ncbi.nlm.nih.gov/Genbank/index.html

Avanços na clonagem e seqüenciamento de DNA

1944 - Avery fornece evidencia que o DNA carrega a informação genética

1953 - Watson e Crick propõem o modelo de dupla hélice para o DNA

1955 - Kornberg descobre a DNA polimerase.

1962- Arber fornece evidencia da existência de enzimas nucleases de restrição.

1967 -Gellert descobre a DNA ligase.

1972-1973 –técnicas de clonagem de DNA são desenvolvidas por Boyer, Cohen, Berg e colegas.

1975-1977 -Sanger e Barrell e Maxam e Gilbert desenvolvem métodos rápidos de seqüenciamento de

1985-Mullis e colegas inventam a reação em cadeia da polimerase (PCR).

1990 -Simon e colegas estudam como utilizar cromossomos artificiais de bacterias (BACs) para clonagem

de moleculas grandes de DNA de humano.

1991 -Hood and Hunkapillar introduzem uma nova tecnologia de seqüenciamento de DNA automatizado.

Avanços no seqüenciamento de genomas

1995 -Venter e colegas seqüenciam o primeiro genoma completo, o da bactéria

Haemophilus influenzae.

1996 -Goffeau e um consorcio internacional anunciam a finalização da primeira

seqüência genômica de um eucarioto, a levedura Saccharomyces cerevisiae.

1998 -Sulston ,Waterston e colegas produzem o primeiro genoma completo de um

organismo multicelular, o verme nematodo Caenorhabditis elegans.

2000- Venter e colegas produzem o primeiro genoma de um organismo multicelular

utilizando a metodologia de “Whole Genome Shotgun”

2001 –Dois consórcios independentes anunciam a finalização de um esboço do genoma

humano

2007- Primeiro genoma diploide de um individuo (Venter) foi sequenciado

Seqüenciamento manual de DNA utilizando a técnica de Sanger

Seqüenciamento pelo método de Sanger permite obter informações de algumas centenas de pares de bases a partir do inicio do seqüenciamento

Seqüenciamento manual de DNA utilizando a técnica de Sanger

Utilização de autoradiografia para obtenção de resultados – Necessidade de utilizar nucleotídeos radioativos e esperar pela sensibilização do filme fotográfico

Leitura de bases realizada manualmente

Dificuldade em implementar procedimentos em larga escala com este tipo de abordagem

Seqüenciamento automático de DNA utilizando a técnica de Sanger

Utilização de dideoxi-nucleotideos ligados a diferentes moléculas fluorescentes

Seqüenciamento automático de DNA utilizando a técnica de Sanger

Cada faixa colorida representa uma seqüência que é automaticamente convertida em um cromatograma, que por sua vez é interpretado para a obtenção da seqüência de DNA

96 seqüência com algumas centenas de bases podem ser produzidas em algumas horas

Imagem virtual de um gel de seqüenciamento de DNA

Cromatograma com interpretação de seqüência

Limitações da técnica de SangerUtilizando a técnica de Sanger só é possível seqüenciar algumas centenas de

bases por cada reação

O seqüenciamento sempre se inicia de um ponto arbitrário que tem que ter a

seqüência conhecida para o desenho do primer

Cada reação de seqüenciamento só pode conter moléculas com seqüência

idênticas ou há um embaralhamento de seqüências

A solução encontrada para seqüenciamento de moléculas desconhecidas é

clonar o DNA em um vetor e iniciar o seqüenciamento a partir da porção do

vetor adjacente ao DNA desconhecido

Novas tecnologias de seqüenciamento

PCR em emulsão acoplado com pirosequenciamento

Geram-se 400.000 seqüências entre 200 a 300 bases em uma corrida de algumas horas

Novas tecnologias de seqüenciamento

Informação em moléculas biológicasTTGTTTGTTTGTTGTGTTTTCCCTGGCAAACAGCTGGAGAAAGAGCAGCTCATGGAGAGGCTGAGAGAAG

CGGTTTTCGCGTCCTACCCAAACTGGGAGAGTAACCTTCAGCAGCTGGACTCACCGATTGGTTTTCCTTC

ATTTTCAGTGAAATCCCATTCTCTGGCTGGAGACACAGATGGCCTCAAATGAGAGAGATGCTATATCGTG

GTACCAAAAGAAGATTGGAGCCTACGATCAGCAGATATGGGAAAAGTCAATCGAACAGACTCAGATTAAG

GGTTTGAAAAACAAACCGAAAAAGATGGGCCACATAAAGCCAGACTTGATTGACGTTGACTTAATCAGAG

GGTCAACATTTGCCAAAGCAAAACCTGAAATTCCATGGACATCTCTGACTCGGAAGGGGCTTGTTCGAGT

TGTATTTTTTCCATTGTTCAGCAATTGGTGGATTCAGGTTACCTCTTTAAGAATCTTTGTTTGGCTGTTA

CTACTTTATTTCATGCAAGTTATAGCAATTGTCTTATATTTGATGATGCCTATTGTGAACATAAGTGAAG

TACTTGGACCCTTGTGCCTTATGCTACTCATGGGAACTGTCCACTGTCAAATTGTGTCTACTCAGATAAC

AAGACCATCAGGAAACAATGGAAATCGAAGAAGAAGAAAATTACGAAAAACTGTAAATGGTGATGGGAGC

CGAGAAAATGGAAATAACTCCTCTGATAAAGTCAGAGGAATAGAAACTTTGGAATCTGTACCCATTATTG

GTGGTTTTTGGGAGACTATCTTTGGCAACAGGAGGCTTTTAGGCGTTTGGGTAATGGGGTGTCTGATGAC

CTGTCAAGTGAAGAAGATGGTGAAGCACGGACACAGATGATATTATTGCGTAGGAGTGTGGAAGGGGCCT

CAAGTGACAATGGTTGTGAAGTTAAGAATAGAAAATCAATACTTTCAAGGCACCTAAACTCTCAGGTAAA

GAAAACCACTACAAGGTGGTGTCATATTGTGCGGGATTCAGATAGTCTGGCTGAATCAGAATTTGAATCA

GCAGCCTTCAGCCAGGGCTCTAGATCGGGTGTGAGTGGTGGCTCTCGAAGCCTCAACATGTCAAGAAGAG

ACTCAGAAAGCACCCGCCATGACTCGGAGACTGAGGACATGTTATGGGACGACCTGCTACATGGCCCAGA

GTGCCGGTCATCTGTCACCAGTGACAGTGAGGGGGCCCATGTGAATACCCTTCACTCAGGGACCAAACGT

GACCCCAAAGAGGATGTTTTTCAGCAGAATCATTTATTCTGGCTTCAGAATTCAAGTCCTTCCTCTGATC

GAGTTAGTGCAATAATCTGGGAGGGGAATGAGTGCAAAAAGATGGATATGTCTGTGTTGGAAATAAGTGG

CATCATCATGAGCAGGGTCAATGCCTATCAGCAAGGAGTAGGTTATCAGATGCTGGGAAATGTTGTCACT

ATTGGATTAGCATTTTTTCCATTCTTACATCGACT

TGGGAATAGTCCTGACAACCCCTATTGCGATCAGCTCTTTTGCTTCTACCGAGACTTTATCGTTTACTCC

TGACAACATAAATGCGGACATTAGTCTTGGAACTCTGAGCGGAAAAACAAAAGAGCGTGTTTATCTAGCC

GAAGAAGGAGGCCGAAAGGTCAGTCAACTTGACTGGAAATTCAATAACGCTGCAATTATTAAAGGTGCAA

TTAATTGGGATTTGATGCCCCAGATATCTATCGGGGCTGCTGGCTGGACAACTCTCGGTAGCCGAGGTGG

CAATATGGTCGATCGGGACTGGATGGATTCCAGTAACCCCGGAACCTGGACGGATGAAAGTAGACACCCT

GATACACAACTCAATTATGCCAACGAATTTGATCTGAATATCAGAGGCTGGCTCCCCAACGAACCCAATT

ACCGCCTGGGACTCATGGCCGGATATCAGGAAAGCCGTTATAGCTTTACAGCCAGAGGGGGTTCCTATAT

CTACAGTTCTGAGGAGGGATTCAGAGATGATATCGGCTCCTTCCCGAATGGAGAAAGAGCAATCGGCTAC

AAACAACGTTTTAAAATGCCCTACATTGGCTTGACTGGAAGTTATCGTTATGAAGATTTTGAGCTAGGTG

GTACATTTAAATACAGCGGCTGGGTGGAAGCATTTGATAACGATGAACACTATGACCCAGGAAAAAGAAT

CACTTATCGCAGTAAAGTCAAAGACCAAAATTACTATTCTGTTGCAGTCAATGCAGGTTATTACGTAACG

CCTAATGCAAAAGTTTATATTGAAGGCGCATGGAATCGGGTTACGAATAAAAAAGGTGATACTTCACTTT

ATGATCACAATGATAACACTTCTGACTACAGCAAAAATGGTGCAGGCATAGAAAACTATAACTTCATCAC

TACTGCTGGTC

Seqüência DNA 1

Seqüência DNA 2

Qual a diferença entre estas duas moléculas?