introdução ao curso - portal ifscrdemarco/ffi0760/introducao.pdf · • 30/07-introdução ao...
Post on 06-Dec-2018
246 Views
Preview:
TRANSCRIPT
Cronograma aulas teóricas
• Aulas teóricas (Segundas-feiras - Sala 146)• 30/07-introdução ao curso.• 06/08-Busca em bancos de dados• 13/08- Alinhamento local• 20/08- Alinhamento local • 27/08-Domínios proteicos• 03/09- -Semana da pátria • 10/09- Alinhamento global• 17/09- Analise filogenética baseada em alinhamento de domínios• 24/09-Predição de estrutura proteica/modificações em proteínas • 01/10- Seqüenciamento de genomas/transcriptomas• 08/10- Anotação de genomas• 15/10 –Semana da graduação• 22/10- Previsão de vias metabólicas a partir do genoma (entrega das questões do trabalho aos alunos)• 29/10- Uso de microarrays para a medida de níveis relativos de transcrição • 05/11- RNAseq (entrega do trabalho ao professor)• 12/11-identificação de proteínas através de espectrometria de massa• 19/11- Prova 2• 26/11-Prova substitutiva
Cronograma aulas praticas
• Aulas praticas (quartas-feiras Sala 206) • 01/08-processamento de cromatogramas- montagem de sequências• 08/08-busca em bancos de dados• 15/08-Feriado municipal• 22/08- Uso de BLAST como ferramenta de alinhamento local• 29/08- Busca no PFAM, CDD,SMART,Intrepro e COG• 05/09- Semana da pátria• 12/09-uso do CLUSTAL como ferramenta de alinhamento global • 19/09- Analise filogenética baseada em alinhamento de domínios• 26/09- Predição de estrutura proteica/modificações em proteínas • 03/10- Prova 1.• 10/10- Analise de ESTs e mapeamento de ESTs no genoma• 17/10- Semana da graduação• 24/10- Anotação de genomas • 31/10- Período para realização do trabalho.• 07/11- Analise de dados de expressão• 14/11-Identificação de proteínas através da analise de espectros de massa
Avaliação
• Avaliação:- A nota final será calculada seguindo a seguinte formula:
(NP1+NP2+NT)/3)*0.9+R*0.1
Onde:
NP- notas das provas
NT- nota dos trabalho
R: relatórios da aula pratica
É exigida presença em 70% das aulas.
Objetivos do curso
• Preparar o aluno para realizar analises de informações provenientes de moléculas de RNA, DNA e proteínas
• Ênfase no uso de ferramentas disponíveis para correlacionar esta informação com funções biológicas destas moléculas
Objetivos do curso
• Qual a importância de processar e interpretar informações contidas em biomoléculas?
• Como realizar comparações entre biomoléculas provenientes de diferentes organismos?
• Como estas informações se correlacionam com as características de um organismo?
Crescimento dos bancos de dados de moléculas biológicas
Qual a importância desta informação para justificar os bilhões de dólares investidos na produção desta informação?
O que ocorreu a partir de meados da década de 90 para justificar este aumento no numero de seqüência depositadas ?
http://www.ncbi.nlm.nih.gov/Genbank/index.html
Avanços na clonagem e seqüenciamento de DNA
1944 - Avery fornece evidencia que o DNA carrega a informação genética
1953 - Watson e Crick propõem o modelo de dupla hélice para o DNA
1955 - Kornberg descobre a DNA polimerase.
1962- Arber fornece evidencia da existência de enzimas nucleases de restrição.
1967 -Gellert descobre a DNA ligase.
1972-1973 –técnicas de clonagem de DNA são desenvolvidas por Boyer, Cohen, Berg e colegas.
1975-1977 -Sanger e Barrell e Maxam e Gilbert desenvolvem métodos rápidos de seqüenciamento de
DNA
1985-Mullis e colegas inventam a reação em cadeia da polimerase (PCR).
1990 -Simon e colegas estudam como utilizar cromossomos artificiais de bacterias (BACs) para clonagem
de moleculas grandes de DNA de humano.
1991 -Hood and Hunkapillar introduzem uma nova tecnologia de seqüenciamento de DNA automatizado.
Avanços no seqüenciamento de genomas
1995 -Venter e colegas seqüenciam o primeiro genoma completo, o da bactéria
Haemophilus influenzae.
1996 -Goffeau e um consorcio internacional anunciam a finalização da primeira
seqüência genômica de um eucarioto, a levedura Saccharomyces cerevisiae.
1998 -Sulston ,Waterston e colegas produzem o primeiro genoma completo de um
organismo multicelular, o verme nematodo Caenorhabditis elegans.
2000- Venter e colegas produzem o primeiro genoma de um organismo multicelular
utilizando a metodologia de “Whole Genome Shotgun”
2001 –Dois consórcios independentes anunciam a finalização de um esboço do genoma
humano
2007- Primeiro genoma diploide de um individuo (Venter) foi sequenciado
Seqüenciamento manual de DNA utilizando a técnica de Sanger
Seqüenciamento pelo método de Sanger permite obter informações de algumas centenas de pares de bases a partir do inicio do seqüenciamento
Seqüenciamento manual de DNA utilizando a técnica de Sanger
Utilização de autoradiografia para obtenção de resultados – Necessidade de utilizar nucleotídeos radioativos e esperar pela sensibilização do filme fotográfico
Leitura de bases realizada manualmente
Dificuldade em implementar procedimentos em larga escala com este tipo de abordagem
Seqüenciamento automático de DNA utilizando a técnica de Sanger
Utilização de dideoxi-nucleotideos ligados a diferentes moléculas fluorescentes
Seqüenciamento automático de DNA utilizando a técnica de Sanger
Cada faixa colorida representa uma seqüência que é automaticamente convertida em um cromatograma, que por sua vez é interpretado para a obtenção da seqüência de DNA
96 seqüência com algumas centenas de bases podem ser produzidas em algumas horas
Imagem virtual de um gel de seqüenciamento de DNA
Cromatograma com interpretação de seqüência
Limitações da técnica de SangerUtilizando a técnica de Sanger só é possível seqüenciar algumas centenas de
bases por cada reação
O seqüenciamento sempre se inicia de um ponto arbitrário que tem que ter a
seqüência conhecida para o desenho do primer
Cada reação de seqüenciamento só pode conter moléculas com seqüência
idênticas ou há um embaralhamento de seqüências
A solução encontrada para seqüenciamento de moléculas desconhecidas é
clonar o DNA em um vetor e iniciar o seqüenciamento a partir da porção do
vetor adjacente ao DNA desconhecido
Novas tecnologias de seqüenciamento
PCR em emulsão acoplado com pirosequenciamento
Geram-se 400.000 seqüências entre 200 a 300 bases em uma corrida de algumas horas
Informação em moléculas biológicasTTGTTTGTTTGTTGTGTTTTCCCTGGCAAACAGCTGGAGAAAGAGCAGCTCATGGAGAGGCTGAGAGAAG
CGGTTTTCGCGTCCTACCCAAACTGGGAGAGTAACCTTCAGCAGCTGGACTCACCGATTGGTTTTCCTTC
ATTTTCAGTGAAATCCCATTCTCTGGCTGGAGACACAGATGGCCTCAAATGAGAGAGATGCTATATCGTG
GTACCAAAAGAAGATTGGAGCCTACGATCAGCAGATATGGGAAAAGTCAATCGAACAGACTCAGATTAAG
GGTTTGAAAAACAAACCGAAAAAGATGGGCCACATAAAGCCAGACTTGATTGACGTTGACTTAATCAGAG
GGTCAACATTTGCCAAAGCAAAACCTGAAATTCCATGGACATCTCTGACTCGGAAGGGGCTTGTTCGAGT
TGTATTTTTTCCATTGTTCAGCAATTGGTGGATTCAGGTTACCTCTTTAAGAATCTTTGTTTGGCTGTTA
CTACTTTATTTCATGCAAGTTATAGCAATTGTCTTATATTTGATGATGCCTATTGTGAACATAAGTGAAG
TACTTGGACCCTTGTGCCTTATGCTACTCATGGGAACTGTCCACTGTCAAATTGTGTCTACTCAGATAAC
AAGACCATCAGGAAACAATGGAAATCGAAGAAGAAGAAAATTACGAAAAACTGTAAATGGTGATGGGAGC
CGAGAAAATGGAAATAACTCCTCTGATAAAGTCAGAGGAATAGAAACTTTGGAATCTGTACCCATTATTG
GTGGTTTTTGGGAGACTATCTTTGGCAACAGGAGGCTTTTAGGCGTTTGGGTAATGGGGTGTCTGATGAC
CTGTCAAGTGAAGAAGATGGTGAAGCACGGACACAGATGATATTATTGCGTAGGAGTGTGGAAGGGGCCT
CAAGTGACAATGGTTGTGAAGTTAAGAATAGAAAATCAATACTTTCAAGGCACCTAAACTCTCAGGTAAA
GAAAACCACTACAAGGTGGTGTCATATTGTGCGGGATTCAGATAGTCTGGCTGAATCAGAATTTGAATCA
GCAGCCTTCAGCCAGGGCTCTAGATCGGGTGTGAGTGGTGGCTCTCGAAGCCTCAACATGTCAAGAAGAG
ACTCAGAAAGCACCCGCCATGACTCGGAGACTGAGGACATGTTATGGGACGACCTGCTACATGGCCCAGA
GTGCCGGTCATCTGTCACCAGTGACAGTGAGGGGGCCCATGTGAATACCCTTCACTCAGGGACCAAACGT
GACCCCAAAGAGGATGTTTTTCAGCAGAATCATTTATTCTGGCTTCAGAATTCAAGTCCTTCCTCTGATC
GAGTTAGTGCAATAATCTGGGAGGGGAATGAGTGCAAAAAGATGGATATGTCTGTGTTGGAAATAAGTGG
CATCATCATGAGCAGGGTCAATGCCTATCAGCAAGGAGTAGGTTATCAGATGCTGGGAAATGTTGTCACT
ATTGGATTAGCATTTTTTCCATTCTTACATCGACT
TGGGAATAGTCCTGACAACCCCTATTGCGATCAGCTCTTTTGCTTCTACCGAGACTTTATCGTTTACTCC
TGACAACATAAATGCGGACATTAGTCTTGGAACTCTGAGCGGAAAAACAAAAGAGCGTGTTTATCTAGCC
GAAGAAGGAGGCCGAAAGGTCAGTCAACTTGACTGGAAATTCAATAACGCTGCAATTATTAAAGGTGCAA
TTAATTGGGATTTGATGCCCCAGATATCTATCGGGGCTGCTGGCTGGACAACTCTCGGTAGCCGAGGTGG
CAATATGGTCGATCGGGACTGGATGGATTCCAGTAACCCCGGAACCTGGACGGATGAAAGTAGACACCCT
GATACACAACTCAATTATGCCAACGAATTTGATCTGAATATCAGAGGCTGGCTCCCCAACGAACCCAATT
ACCGCCTGGGACTCATGGCCGGATATCAGGAAAGCCGTTATAGCTTTACAGCCAGAGGGGGTTCCTATAT
CTACAGTTCTGAGGAGGGATTCAGAGATGATATCGGCTCCTTCCCGAATGGAGAAAGAGCAATCGGCTAC
AAACAACGTTTTAAAATGCCCTACATTGGCTTGACTGGAAGTTATCGTTATGAAGATTTTGAGCTAGGTG
GTACATTTAAATACAGCGGCTGGGTGGAAGCATTTGATAACGATGAACACTATGACCCAGGAAAAAGAAT
CACTTATCGCAGTAAAGTCAAAGACCAAAATTACTATTCTGTTGCAGTCAATGCAGGTTATTACGTAACG
CCTAATGCAAAAGTTTATATTGAAGGCGCATGGAATCGGGTTACGAATAAAAAAGGTGATACTTCACTTT
ATGATCACAATGATAACACTTCTGACTACAGCAAAAATGGTGCAGGCATAGAAAACTATAACTTCATCAC
TACTGCTGGTC
Seqüência DNA 1
Seqüência DNA 2
Qual a diferença entre estas duas moléculas?
Informação em moléculas biológicasTTGTTTGTTTGTTGTGTTTTCCCTGGCAAACAGCTGGAGAAAGAGCAGCTCATGGAGAGGCTGAGAGAAG
CGGTTTTCGCGTCCTACCCAAACTGGGAGAGTAACCTTCAGCAGCTGGACTCACCGATTGGTTTTCCTTC
ATTTTCAGTGAAATCCCATTCTCTGGCTGGAGACACAGATGGCCTCAAATGAGAGAGATGCTATATCGTG
GTACCAAAAGAAGATTGGAGCCTACGATCAGCAGATATGGGAAAAGTCAATCGAACAGACTCAGATTAAG
GGTTTGAAAAACAAACCGAAAAAGATGGGCCACATAAAGCCAGACTTGATTGACGTTGACTTAATCAGAG
GGTCAACATTTGCCAAAGCAAAACCTGAAATTCCATGGACATCTCTGACTCGGAAGGGGCTTGTTCGAGT
TGTATTTTTTCCATTGTTCAGCAATTGGTGGATTCAGGTTACCTCTTTAAGAATCTTTGTTTGGCTGTTA
CTACTTTATTTCATGCAAGTTATAGCAATTGTCTTATATTTGATGATGCCTATTGTGAACATAAGTGAAG
TACTTGGACCCTTGTGCCTTATGCTACTCATGGGAACTGTCCACTGTCAAATTGTGTCTACTCAGATAAC
AAGACCATCAGGAAACAATGGAAATCGAAGAAGAAGAAAATTACGAAAAACTGTAAATGGTGATGGGAGC
CGAGAAAATGGAAATAACTCCTCTGATAAAGTCAGAGGAATAGAAACTTTGGAATCTGTACCCATTATTG
GTGGTTTTTGGGAGACTATCTTTGGCAACAGGAGGCTTTTAGGCGTTTGGGTAATGGGGTGTCTGATGAC
CTGTCAAGTGAAGAAGATGGTGAAGCACGGACACAGATGATATTATTGCGTAGGAGTGTGGAAGGGGCCT
CAAGTGACAATGGTTGTGAAGTTAAGAATAGAAAATCAATACTTTCAAGGCACCTAAACTCTCAGGTAAA
GAAAACCACTACAAGGTGGTGTCATATTGTGCGGGATTCAGATAGTCTGGCTGAATCAGAATTTGAATCA
GCAGCCTTCAGCCAGGGCTCTAGATCGGGTGTGAGTGGTGGCTCTCGAAGCCTCAACATGTCAAGAAGAG
ACTCAGAAAGCACCCGCCATGACTCGGAGACTGAGGACATGTTATGGGACGACCTGCTACATGGCCCAGA
GTGCCGGTCATCTGTCACCAGTGACAGTGAGGGGGCCCATGTGAATACCCTTCACTCAGGGACCAAACGT
GACCCCAAAGAGGATGTTTTTCAGCAGAATCATTTATTCTGGCTTCAGAATTCAAGTCCTTCCTCTGATC
GAGTTAGTGCAATAATCTGGGAGGGGAATGAGTGCAAAAAGATGGATATGTCTGTGTTGGAAATAAGTGG
CATCATCATGAGCAGGGTCAATGCCTATCAGCAAGGAGTAGGTTATCAGATGCTGGGAAATGTTGTCACT
ATTGGATTAGCATTTTTTCCATTCTTACATCGACT
TGGGAATAGTCCTGACAACCCCTATTGCGATCAGCTCTTTTGCTTCTACCGAGACTTTATCGTTTACTCC
TGACAACATAAATGCGGACATTAGTCTTGGAACTCTGAGCGGAAAAACAAAAGAGCGTGTTTATCTAGCC
GAAGAAGGAGGCCGAAAGGTCAGTCAACTTGACTGGAAATTCAATAACGCTGCAATTATTAAAGGTGCAA
TTAATTGGGATTTGATGCCCCAGATATCTATCGGGGCTGCTGGCTGGACAACTCTCGGTAGCCGAGGTGG
CAATATGGTCGATCGGGACTGGATGGATTCCAGTAACCCCGGAACCTGGACGGATGAAAGTAGACACCCT
GATACACAACTCAATTATGCCAACGAATTTGATCTGAATATCAGAGGCTGGCTCCCCAACGAACCCAATT
ACCGCCTGGGACTCATGGCCGGATATCAGGAAAGCCGTTATAGCTTTACAGCCAGAGGGGGTTCCTATAT
CTACAGTTCTGAGGAGGGATTCAGAGATGATATCGGCTCCTTCCCGAATGGAGAAAGAGCAATCGGCTAC
AAACAACGTTTTAAAATGCCCTACATTGGCTTGACTGGAAGTTATCGTTATGAAGATTTTGAGCTAGGTG
GTACATTTAAATACAGCGGCTGGGTGGAAGCATTTGATAACGATGAACACTATGACCCAGGAAAAAGAAT
CACTTATCGCAGTAAAGTCAAAGACCAAAATTACTATTCTGTTGCAGTCAATGCAGGTTATTACGTAACG
CCTAATGCAAAAGTTTATATTGAAGGCGCATGGAATCGGGTTACGAATAAAAAAGGTGATACTTCACTTT
ATGATCACAATGATAACACTTCTGACTACAGCAAAAATGGTGCAGGCATAGAAAACTATAACTTCATCAC
TACTGCTGGTC
Seqüência DNA Homo Sapienstranscription factor
Seqüência DNA Escherichia coliprotease T
Informação em moléculas biológicas
-mRNA e proteínas são polímeros biológicos que contem informações complexas e cada organismo possui milhares de moléculas diferentes para cada um deste tipos de moléculas. DNA normalmente possui poucas moléculas diferentes mas estas são muito longas.
-A interpretação das informações contidas nestas moléculas biológicas não é trivial
-No caso de moléculas como RNA e proteínas existe uma variação do seu nível relativo de produção das diversas moléculas dependente do tipo de tecido, estagio de desenvolvimento, estímulos externos, etc.. Portanto a própria medida da abundancia destas moléculas representa uma importante informação
Informação em moléculas biológicas
Genoma
Transcriptoma
Proteoma
Genoma e transcriptoma- informação pode ser obtida através de técnicas de seqüenciamento
Proteôma- Seqüenciamento de proteínas é muito ineficiente. Técnicas atuais permitem a
dedução de pequenos fragmentos
Informação em moléculas biológicas
Maioria das informações obtidas é para as moléculas de DNA e RNA.
As proteínas são as moléculas efetoras da maioria de processos celulares e
portanto são as moléculas de maior interesse para entendimento de processos
biológicos
Devemos nos lembrar que a molécula de mRNA contém a informação para a
produção de uma proteína e é possível interpretá-la com o conhecimento do
código genético
A partir de uma seqüência de proteína não é possível, a principio, deduzir sua
função
Entretanto é possível prever que a proteína de interesse tenha função
semelhante àquela de uma proteína de função conhecida que tenha seqüência
similar
Operações básicas no processamento de seqüências biologicas
-Tradução – RNA para proteína
-Complemento-reverso de fitas de DNA
-Calculo peso molecular-pI de uma proteína
top related