the next generation sequencing - unesp · sequenciamento de próxima geração 1 - melhor...

26
9/7/2013 1 The next generation sequencing Cesar Martins ([email protected]) Departamento de Morfologia Instituto de Biociências , UNESP Universidade Estadual Paulista Botucatu, SP

Upload: votram

Post on 11-Nov-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

9/7/2013

1

The next generation sequencing

Cesar Martins ([email protected])Departamento de MorfologiaInstituto de Biociências , UNESP Universidade Estadual PaulistaBotucatu, SP

9/7/2013

2

Métodos AtuaisSequenciamento de próxima geração

1 - melhor custo-benefício para projetos de alta demanda de dados;

2 custo por bp muito menor;

3 sequenciamento muito mais rápido e eficiente (> 40 Gbase/corrida).

4 versatilidade Genomas, expressão gênica, diagnóstico, gen.

população, epigenética, metagenômica, entre outros

Análise genômica 2013

The next generation technologies

Roche 454

Solid

Illumina/Solexa

Ion Torrent

PacBio

Nanopore

Sequenciamento de segunda geração

Sequenciamento de terceira geração

Sequenciamento de quarta geração

Análise genômica 2013

9/7/2013

3

5.292,39

0,09

-500,00

500,00

1.500,00

2.500,00

3.500,00

4.500,00

5.500,00

Sep

tem

ber

-20

01

Mar

ch-2

00

2

Sep

tem

ber

-20

02

Mar

ch-2

00

3

Oct

ob

er-2

00

3

Jan

uar

y-2

00

4

Ap

ril-

20

04

July

-20

04

Oct

ob

er-2

00

4

Jan

uar

y-2

00

5

Ap

ril-

20

05

July

-20

05

Oct

ob

er-2

00

5

Jan

uar

y-2

00

6

Ap

ril-

20

06

July

-20

06

Oct

ob

er-2

00

6

Jan

uar

y-2

00

7

Ap

ril-

20

07

July

-20

07

Oct

ob

er-2

00

7

Jan

uar

y-2

00

8

Ap

ril-

20

08

July

-20

08

Oct

ob

er-2

00

8

Jan

uar

y-2

00

9

Ap

ril-

20

09

July

-20

09

Oct

ob

er-2

00

9

Jan

uar

y-2

01

0

Ap

ril-

20

10

July

-20

10

Oct

ob

er-2

01

0

Jan

uar

y-2

01

1

Ap

ril-

20

11

July

-20

11

Jan

-20

12

(EST

)

http://genome.gov/splash.htm

CUSTO DO SEQUENCIAMENTO POR BASE

Roche 454 Illumina

Solid e Helicos

Análise genômica 2013

95.263.072

7.950

0

10.000.000

20.000.000

30.000.000

40.000.000

50.000.000

60.000.000

70.000.000

80.000.000

90.000.000

100.000.000

Sep

tem

ber

-20

01

Mar

ch-2

00

2

Sep

tem

ber

-20

02

Mar

ch-2

00

3

Oct

ob

er-2

00

3

Jan

uar

y-2

00

4

Ap

ril-

20

04

July

-20

04

Oct

ob

er-2

00

4

Jan

uar

y-2

00

5

Ap

ril-

20

05

July

-20

05

Oct

ob

er-2

00

5

Jan

uar

y-2

00

6

Ap

ril-

20

06

July

-20

06

Oct

ob

er-2

00

6

Jan

uar

y-2

00

7

Ap

ril-

20

07

July

-20

07

Oct

ob

er-2

00

7

Jan

uar

y-2

00

8

Ap

ril-

20

08

July

-20

08

Oct

ob

er-2

00

8

Jan

uar

y-2

00

9

Ap

ril-

20

09

July

-20

09

Oct

ob

er-2

00

9

Jan

uar

y-2

01

0

Ap

ril-

20

10

July

-20

10

Oct

ob

er-2

01

0

Jan

uar

y-2

01

1

Ap

ril-

20

11

July

-20

11

Jan

-20

12

(EST

)

Genoma humano U$ 2 bi; ~3 bilhões bp; 11 anos; ~12X

Genoma U$ 2.500,00; ~1 bilhão bp; alguns dias; ~40X

CUSTO DO SEQUENCIAMENTO POR GENOMA

http://genome.gov/splash.htm

Roche 454 Illumina

Solid e Helicos

9/7/2013

4

e on DNA sequencing technology. Natur e, 2011.

sequ en cia men t o de DN A

Mardis. Science 2011

100 Gbase

Análise genômica 2013

Illumina HiSeq: 600 Gb

Análise genômica 2013

9/7/2013

5

Kahn SD. Science 2011

Análise genômica 2013

Genoma humano - ~3 bilhões x 1= ~800 Alberts, 10 anos

Genoma da tilápia- ~1 bilhão x 40= ~40 bilhões = ~10.600 Alberts, alguns

dias

Antes e hoje

Análise genômica 2013

9/7/2013

6

Objetivo rastrear as variações genéticas em populações humanas

Objetivo gerar conhecimento sobre o genoma de câncer com o intuito de

gerar tratamentos e diagnósticos

Hoje

Análise genômica 2013

Objetivo analisar o genoma de 10 mil espécies de vertebrados

Hoje

Objetivo analisar o genoma de 5 mil espécies de insetos e outros

artrópodos

Análise genômica 2013

9/7/2013

7

Maiores problemas dos sequenciamentos em

larga escala!!!

Estocagem

Montagem

Análise

Análise genômica 2013

454 Roche

Vídeohttp://www.wellcome.ac.uk/Education-resources/Teaching-and-education/Animations/DNA/WTX056046.htm

Illumina

Vídeohttp://www.wellcome.ac.uk/Education-resources/Teaching-and-education/Animations/DNA/WTX056051.htm

Análise genômica 2013

9/7/2013

8

Sequenciamento de segunda geração

Roche 454

Solid

Illumina/Solexa

Ion Torrent

Análise genômica 2013

Análise genômica 2013

2004-2005Roche 454 Life science

Utiliza tecnologia de pirosequenciamento - 1986

Roche 454 2nd generation

9/7/2013

9

Análise genômica 2013

Princípio

Mecanismo do Pirosequenciamento

ATP-sulfurilase Conversão PPi ATP

Luciferase Usa ATP p/ converter luciferina oxyluciferina = LUZApirase degrada os ATPs e nucleotideos livres

9/7/2013

10

Zhou et al., 2010. Protein Cell

http://www.youtube.com/watch?v=bFNjxKHP8Jchttp://www.youtube.com/watch?v=JNqXgLKOzKU

Biotin tag

Streptavidin

Análise genômica 2013

Análise genômica 2013

9/7/2013

11

Análise genômica 2013

Amplificação maciça utilizandouma emulsão com milhares de beads de agarose, com primers ancoradores aos adapt. A reaçãode PCR é realizada e o sequen. ocorre na placa PTP (picotiteplate).

Roche GS FLX System

Análise genômica 2013

9/7/2013

12

Análise genômica 2013

SOLiDLife Technologies

Emulsion PCR

132 Overview of Sequencing Technology Platforms

which the sequencing reactions begin. These high-throughput sequencing systems,

with the exception of PacBio RS, require cation of the sequencing library

DNA to form spatially distinct and detectable sequencing features (Fig. 2.3 ).

cation can be performed in situ, in emulsion or in solution to generate clus-

ters of clonal DNA copies. Sequencing is performed using either DNA polymerase

synthesis for uorescent nucleotides or the ligation of uorescent oligonucleotides

(Fig. 2.4 ).

The high-throughput sequencing platforms integrate a variety of uidic and optic

technologies to perform and monitor the molecular sequencing reactions. The uidics

systems that enable the parallelization of the sequencing reaction form the core of the

high-throughput sequencing platform. Micro-liter scale uidic devices support the

DNA immobilization and sequencing using automated liquid dispensing mecha-

nisms. These instruments enable the automated ow of reagents onto the immobilized

Fig. 2.3 Generation of sequencing features. High-throughput sequencing systems have taken

different approaches in the generation of the detectable sequencing features. ( a ) Emulsion PCR is

applied in the GS FLX and SOLiD systems. Single enrichment bead and sequencing library fragment

are ed inside an aqueous reaction bubble. PCR is then applied to populate the surface of

the bead by clonal copies of the template. Beads with immobilized clonal DNA collections are

deposited onto a Picotiter plate (GS FLX) or on a glass slide (SOLiD). ( b ) Bridge-PCR is used

to generate the in situ clusters of ed sequencing library fragments on a solid support.

Immobilized cation primers are used in the process. ( c ) Rolling circle cation is used

to generate long stretches of DNA that fold into nanoballs that are arrayed in the CGA technology.

( d ) Biotinylated DNA polymerase binds to bubble adapted template in the PacBio RS system.

Polymerase/template complex is immobilized on the bottom of a zero mode w ave guide (ZMW)

P1 and P2adaptors

http://gtc.soe.ucsc.edu/content/solid-technology-overview

SOLiDLife Technologies

Análise genômica 2013

9/7/2013

13

Análise genômica 2013

Análise genômica 2013

9/7/2013

14

Análise genômica 2013

Análise genômica 2013

9/7/2013

15

Análise genômica 2013

9/7/2013

16

Química da reação

9/7/2013

17

Comparando metodologias

454, Solid

Illumina

Análise genômica 2013

Análise genômica 2013

9/7/2013

19

1 dNTP de cada vezñ utiliza nucleotídeos modificados e cascatas enzimáticasñ utiliza detecção óptica (fluorescência e

quimioluminescência)

Chip: Array of microwells

DETECÇÃO DO SINAL

Chip: Array of microwells

Análise genômica 2013

9/7/2013

20

DETECÇÃO DO SINAL

ISFET Ion Sensitive Field-Effect Transistor

DETECÇÃO DO SINAL

Análise genômica 2013

9/7/2013

21

http://www.youtube.com/user/iontorrent

DETECÇÃO DO SINAL

Análise genômica 2013

PacBio RS sequencerSequenciamento de terceira geração

9/7/2013

22

NanoporeSequenciamento de quarta

geração

Análise genômica 2013

9/7/2013

23

Constituintes Principais

Camada lipídica

Análise genômica 2013

Constituintes Principais

Exonuclease

Análise genômica 2013

9/7/2013

24

Métodos do futuro próximo

Oxford NanoporeTechnologies, based in Oxford, UK expects to start selling its new machine in the second half of this year and also plans to launch the

sequencer the MinION which will retail for less than US$900.

Análise genômica 2013

Análise genômica 2013

9/7/2013

25

Comparação diferenttes plataformas

Plataf. Comp

(bp)

Tempo

de

corrida

(dias)

Gb por corrida Prós Contras

FLX

500-1kb 0,35 0,45 Reads longos;

agilidade

Alto custo dos

reagentes; alto erro

*Illumina 100-150 9 35 Plataforma mais

utilizada

Baixa capacidade

multiplexar

amostras

SOLiD 3 50 14 50 Sistema de correção

de erros

Demora na corrida

PacificBioscience 3-20kb ? ? Reads mais longos Alto erro

Nanopore 100kb 15 min ? Reads mais longos Alto erro

* HiSeq2000 gera um output com 600 Gb por corrida. Maior output atual.

Análise genômica 2013

...5ª geração, quando será que sai??!!

Sequenciamento de próxima geração, 2ª, 3ª, 4ª

geração!!!! AHHHHHH... Assim eu não aguento!!!

Análise genômica 2013

9/7/2013

26

Análise genômica 201308-11 de Julho de 2013

Instituto de Biociências, UNESP, Botucatu, SP

Curso de Férias