aula teórica de transcritômica

Post on 08-Jan-2017

254 Views

Category:

Documents

2 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Aula Biologia Molecular Computacional

Transcritômica

Julio Sosa - Lucas Silva

03/09/2015

..um pouco de história..

Sequenciamento Maxam-Gilbert (1976-77)

Matthews & van Holde. Bioquímica 2da ed. 1998

Sequenciamento Sanger (1977)

Next-Generation Sequencing Platforms. Elaine R. Mardis (2013)

..sempre da para melhorar..

Ventagens:

- Não há necessidade de radioatividade - Um câmera no final do gel monitora as sequências- Quatro reações numa “lane”

Novas tecnologías..

Novas tecnologías (omics)

R.Q. Wu et al. J DENT RES 2010;90:561-572

O transcriptoma é o conjunto completo de transcritos (RNAs) de uma célula, e as respectivas quantidades.

Porque é importante compreender o transcriptoma ?

● Interpretar os elementos funcionais do genoma

● Revelar os constituintes moleculares de células e tecidos nos diferentes estágios de desenvolvimento

● Compreender os elementos presentes no desenvolvimento de doenças.

..o que é Transcritoma..?

http://www.nature.com/nmeth/journal/v6/n11s/full/nmeth.f.268.html

● Métodos baseados em Hidridização (Microarrays)

..métodos de estudo..

● Métodos baseados em sequenciamento tradicional (Sanger)

● Métodos baseados em sequenciamento de nova geração (Next Generation Sequencing): RNA-Seq

..métodos de estudo..

● Métodos baseados em sequenciamento tradicional (Sanger)

● Métodos baseados em sequenciamento de nova geração (Next Generation Sequencing): RNA-Seq

..métodos de estudo..

GS FLX 454 HiSeq 2500 5500xl SOLiD(ROCHE) (ILLUMINA) (ABI)

Diferentes tecnologias (NGS)

GS FLX 454 HiSeq 2500 5500xl SOLiD(ROCHE) (ILLUMINA) (ABI)

GS FLX 454 HiSeq 2500 5500xl SOLiD(ROCHE) (ILLUMINA) (ABI)

Ion TORRENT Pacific Biosciences Oxford Nanopore

Diferentes tecnologias (NGS)

Sequenciamento NGS.. em maior detalhe

Secuenciamiento NGS.. en mayor detalle

Secuenciamiento NGS.. en mayor detalle

Secuenciamiento NGS.. en mayor detalle

Secuenciamiento NGS.. en mayor detalle

Illumina

454 (ROCHE)

NGS no mundohttp://omicsmaps.com/

Genômica na era NGS

Genome Research Limited

Ventagens:

- Construção librarias para sequenciamento

* Sem clonagem in vivo, transformação, etc

Ventagens:

- Construção livrarias para sequenciamento

* Sem clonagem in vivo, transformação, etc

- Sequenciamento “array-based”

* Maior grado de paralelismo que sequenciamento basado em capilaridade

• de novo sequencing• Whole genome re-sequencing• Targeted sequencing• Population genomics• Diagnostics• Cancer genomics• Ancient genomes• Metagenomics• RNA sequencing• Chip-seq• Genomic Epidemiology• anything with DNA

Aplicações

..novas tecnologias..

..novas tecnologias.. novos desafios..!

Image courtesy of Lincoln Stein

..novas tecnologias.. novos desafios..!

(Pennisi, Science 2011)

..novas tecnologias.. novos desafios..!

..novas tecnologias.. novos desafios..!

..dos desafios.. nace uma nova area.. a Bioinformática

Pipeline geralControle qualidade Montagem

de novoCom referência

Sequenciamento

de novoCon referencia

Haas and Zody, 2010 Nature Biotechnology 25, 421-423

Pipeline geralControle qualidade Montagem

de novoCom referência

Sequenciamento

de novoCon referencia

Pipeline geralControle qualidade Montagem

Sequenciamento

de novoCon referencia

Nossa referência!!

Pipeline geralControle qualidade Montagem

Sequenciamento

Pipeline geralControle qualidade Montagem

de novoCom referência

Sequenciamento

..quais são suas aplicações..?

Pipeline geralControle qualidade Montagem

de novoCom referência

Sequenciamento

- Identificação sitios splicing- Anotação ncRNAs- Análise expressão diferencial- Enriquecimiento gênico

RNA

Pipeline generalControl calidad Montaje

de novo Con referencia

- Identificação SNPs- CNVs- Indels

Secuenciamiento

DNA

- Identificação sitios splicing- Anotação ncRNAs- Análise expressão diferencial- Enriquecimiento gênico

RNA

Pipeline generalControl calidad Montaje

de novo Con referencia

- Identificação SNPs- CNVs- Indels

Secuenciamiento

DNA RB1 ZFP57

SMAD4 TP53 BRCA1

- Identificação sitios splicing- Anotação ncRNAs- Análise expressão diferencial- Enriquecimiento gênico

RNA

Pipeline generalControl calidad Montaje

de novo Con referencia

- Identificação SNPs- CNVs- Indels

Secuenciamiento

DNA RB1 ZFP57

SMAD4 TP53 BRCA1

- Identificação sitios splicing- Anotação ncRNAs- Análise expressão diferencial- Enriquecimiento gênico

RNA

Pipeline generalControl calidad Montaje

de novo Con referencia

- Identificação SNPs- CNVs- Indels

Secuenciamiento

DNA RB1 ZFP57

SMAD4 TP53 BRCA1

Biomarcadores molecularesDiagnósticoTerapia!!!

- Identificação sitios splicing- Anotação ncRNAs- Análise expressão diferencial- Enriquecimiento gênico

RNA

Pipeline generalControl calidad Montaje

de novo Con referencia

- Identificação SNPs- CNVs- Indels

Secuenciamiento

DNABiomarcadores molecularesDiagnósticoTerapia!!!

BIOINFORMÁTICA

RNA-SEQ Workflow.. ¿cadê a bioinformática?

..desde as sequências..

..como vem as sequências..?Formato FASTQ

Controle qualidade

Controle qualidade

Como encontrar genes diferencialmente expressos?

BWT-Burrows-Wheler Transform

-ORDENAÇÃO-APENAS 2X MAIS MEMÓRIA

Mapping

•Bowtie or Maq mapping identify transcribed known or novel exons•Longer (e,g. 100bp)paired-end libraries are better

Estrutura dos genes

CHR1.FASTA

Onde é o início do gene mesmo?

E o gene? Onde está?

GENE TRANSFER FORMAT (GTF)

Um gene no triste mundo real!

Montando genes utilizando dados de transcriptoma

cufflinks

pont

os in

tere

ssan

tes

Checando genes diferencialmente expressosTratamento gene A 10 FPKMControle gene A 1 FPKM

log2(tratamento/controle)

10 vezes maior! log2 = 3.32

UP

DOWN

Método simples! retirar valores que cruzam um cut-off X

Assumindo que o experimento de rna-seq segue uma normal. A probabilidade de uma medida divergir em mais que um desvio padrão é de mais de 68%! Isso em um caso IDEAL( ou um Chinês pipetando)

Distribuicao de poisson para "pobres" mortais

Poisson (média e desvio simétricos)

Variação em duas replicatas

microarray!

DEseq2 (ajustando variáveis (m, s) )

genesdiferencialmenteexpressos

Antes eu tinha um gene! E agora tenho 1000….

Busca por motivos

top related