sequenciamento de nova geração (ngs) e …...sequenciamento de nova geração (ngs) e...

Post on 05-Jun-2020

2 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Sequenciamento de nova

geração (NGS) e

interpretação de variantes

Guilherme Lopes Yamamoto

2015

guilherme.yamamoto@usp.com.br

Por favor,

NÃO COLOCAR o arquivo powerpoint em locais públicos.

Não usar conteúdo da aula sem citar a fonte.

Até,

Guilherme

Tópicos da aula

Caso 1 e Objetivo da aula/curso

Tecnologia atual e habilidades

necessárias

A técnica em si

Investigando patogenicidade, Casos 1 – 5

Revisão dos aspectos éticos / legais

Conclusão

Tópicos da aula

Caso 1 e Objetivo da aula/curso

Tecnologia atual e habilidades

necessárias

A técnica em si

Investigando patogenicidade, Casos 1 – 5

Revisão dos aspectos éticos / legais

Conclusão

Caso 1

11 anos

Displasia esquelética espôndilometafisária

Objetivos da aula

Ao término da aula (ou estudo em casa),

habilidades conquistadas:

Entender as novas técnicas de genômica

Levantar os aspectos genômicos de

patologias humanas

Não cometer atrocidades na interpretação de

variantes

Diagnosticar doenças raras e identificar

genes novos

Tópicos da aula

Caso 1 e Objetivo da aula/curso

Tecnologia atual e habilidades

necessárias

A técnica em si

Investigando patogenicidade, Casos 1 – 5

Revisão dos aspectos éticos / legais

Conclusão

Tecnologia atual / Em que pé

estamos Eight years of work, thousands of researchers around

the world, $1 billion spent — and finally it was done.

On April 14, 2003, a decade ago this week, scientists

announced that they had completed the Human

Genome Project, compiling a list of the three billion

letters of genetic code that make up what they

considered to be a sort of everyperson’s DNA.

April 16, 2013, on page D3 of the New York Times with the headline:

Human Genome, Then and Now.

NGS

Time videos

• The Next Medical Revolution: One

Family's Story

• Exome Sequencing: A Medical Test

That May Reveal Too Much

• Beating Cancer from the Inside Out

http://www.time.com/time/video/search/0,32112,,00.html?cmd=tags&p=0&q=medici

ne&x=-752&y=-1406

Casos famosos

One In A Billion: A boy's life, a medical

mystery - 2011 Pulitzer Prize in Explanatory Reporting

2010

Nicholas Volker

XIAP gene

Apoptose e Sistema Imune alterados

>Doença intestinal inflamatória

Transplante de medula óssea

http://www.jsonline.com/features/health/111224104.html

Casos famosos

• Genetic Gamble New Approaches to

Fighting Cancer – 2012 The New York Times

2011

Dr. Lukas Wartman

LLA (Leucemia Linfoblástica Aguda)

FLT3 (FMS-RELATED TYROSINE KINASE 3) Gene hiperativado

Sunitinib (inibidor de receptor de tirosinas

quinases RTK)

http://www.nytimes.com/2012/07/08/health/in-gene-sequencing-

treatment-for-leukemia-glimpses-of-the-future.html

Habilidades necessárias

USO DO COMPUTADOR

Busca em banco de dados (ler e escrever em

inglês)

Interpretação crítica (conceito de risco – Filme

‘GATTACA’; Livro – ‘The drunkard’s walk’)

Acesso a laboratórios/testes de alta tecnologia

($$$)

Conceitos de genética básica bem

sedimentados

História clínica (Anamnese, Exame físico e

hipótese Dx) de qualidade

Tópicos da aula

Caso 1 e Objetivo da aula/curso

Tecnologia atual e habilidades

necessárias

A técnica em si

Investigando patogenicidade, Casos 1 – 5

Revisão dos aspectos éticos / legais

Conclusão

Sanger (Sequenciamento por

eletroforese em capilar) http://www.youtube.com/watch?v=6ldtdWjDwes&feature=player_detailpage

Sequência de 1 éxon de

1 gene (100-1000bp)

Leitura da fluorescência

em capilar

Incorporação de bases

fluorescentes

Extração do DNA

(tecido/organismo)

PCR com primers

específicos

Análise manual do

gráfico de cores

Illumina NGS http://www.youtube.com/watch?v=l99aKKHcxC4&feature=player_detailpage

A técnica em si

• Preparação da biblioteca

• Sequenciamento

• Análise bioinformática e biológica

Fragmentação

Quebrar o DNA aleatóriamente

A-T-G-T-C-C-T-G-A-T-C-G-A-A-A-T-G-A-C-A-G-C-A-G-C-A-G-C-A-G-T-A-A

T-A-C-A-G-G-A-C-T-A-G-C-T-T-T-A-C-T-G-T-C-G-T-C-G-T-C-G-T-C-A-T-T

T-C-C-T-G-A-T-C-G-A-A- C-T-G-T-C-G-T-C-G-T-C-G-

T-A-C-A-G-G-A-C-T C-T-G-A-T-C-G-A-A-A-T-G-A-C-A-G-C

Adaptadores+index

T-C-C-T-G-A-T-C-G-A-A

T-T-C-G-A-A-T-C-A-A-C-G-C-A-T-C-C-T-G-A-T-C-G-A-A-T-G-C-T-A-C-C-

G

C-T-G-T-C-G-T-C-G-T-C-G-

T-T-C-G-A-A-T-C-A-T-C-A-G-G-C-T-G-T-C-G-T-C-G-T-C-G-T-G-C-T-A-C-C-G

Captura

T-T-C-G-A-A-T-C-A-A-C-G-C-A-T-C-C-T-G-A-T-C-G-A-A-T-G-C-T-A-C-C-

G

T-A-G-C-T-BEAD_MAGNÉTICO

T-T-C-G-A-A-T-C-A-A-C-G-C-A-T-A-C-A-G-G-A-C-T-T-G-C-T-A-C-C-G

T-T-C-G-A-A-T-C-A-T-C-A-G-G-C-T-G-T-C-G-T-C-G-T-C-G-T-G-C-T-A-C-C-G

C-A-G-C-A-G-C-A-G-BEAD_MAGNÉTICO

C-A-G-C-A-G-C-A-G-BEAD_MAGNÉTICO !!!

Sequenciamento

T-T-C-G-A-A-T-C-A-A-C-G-C-A-T-C-C-T-G-A-T-C-G-A-A-T-G-C-T-A-C-C-G

Clusterização

Sequenciamento

Incorporação de bases fluorescentes e captura da imagem

G-C-T-T-A-G primer

de sequenciamento

Homo(hemi)zigoto

Heterozigoto

Análise - Hardware

• Servidores

• 2 servidores em paralelo com:

• 2x8cores = 16 núcleos físicos, 144Gb RAM,

600Gb HD – LINUX –

Armazenamento

• 2 servidores com 40Tb HD

Análise - Software

• 3 etapas:

• Alinhamento (Alignment) fastq->bam

• Diversos programas (BWA, bowtie2, novoalign) a

• Chamada de Variantes (variant call) bam->vcf

• Diversos programas (GATK, SAMTOOLS, etc) a

maioria gratuitos – 0USD

• Interpretação biológica bam + vcf -> LAUDO

• Diversos programas (ANNOVAR, SVA, IGV,

GeneSpring, etc)

• Total: ~20Gb por exoma

Análise

1- Alinhamento (.fastq -> .bam) BWA

C-T-G-T-C-G-T-C-G-T-C-G-

T-C-C-T-G-A-G-C-G-A-A

A-T-G-T-C-C-T-G-A-T-C-G-A-A-A-T-G-A-C-A-G-C-A-G-C-A-G-C-A-G-T-A-

T-C-G-T-G-A-G-C--A-T

T-C-C-T-G-A-T-C--A-A

T-C-C-T-G-A-T-C-G-A-A

Análise

2- Chamada variantes (.bam ->.vcf) GATK

T-C-C-T-G-A-G-C-G-A-A

A-T-G-T-C-C-T-G-A-T-C-G-A-A-A-T-G-A-C-A-G-C-A-G-C-A-G-C-A-G-T-A-

T-C-C-T-G-A-T-C--A-A

SNP (chr1:112455671 T / G)

INDEL (chr1:112455673 G / -)

Análise

3- Anotar variantes (.vcf -> table) ANNOVAR

T-C-C-T-G-A-G-C-G-A-A

A-T-G-T-C-C-T-G-A-T-C-G-A-A-A-T-G-A-C-A-G-C-A-G-C-A-G-C-A-G-T-A-

T-C-C-T-G-A-T-C--A-A

SNP (chr1:112455671 T / G)

INDEL (chr1:112455673 G / -)

• Exonica / Splicing, etc

• Gene: HTT

• AA: XXX do transcrito 1

• SIFT, PolyPhen, GERP

• 1000G, 6500ex, dbSNP

• Presente N amostras

• Hetero/Homozigose

Fragmentação aleatória

Sequência de 1 éxon de

1 gene (100-1000bp)

Sequência completa de

todo DNA/RNA (ou

regiões capturadas)

Captura de regiões de

interesse (ou não)

Leitura da fluorescência

em capilar

Individualização dos

fragmentos

Incorporação de bases

fluorescentes

Extração do DNA/RNA

(tecido/organismo)

Extração do DNA

(tecido/organismo)

PCR com primers

específicos

Alinhamento e variantes

por bioinformática

PCR de amplificação

inespecífica

Leitura de luz ou pH em

paralelo à incorporação

Análise manual do

gráfico de cores

Validação manual das

variantes encontradas

Biblioteca

Sequenciamento

Análise

Sanger NGS

Aplicações

• Re-sequencing (a partir de referência):

• Diagnóstico (ou screening) de doenças monogênicas

• Identificação de genes/mutações de risco (doenças

multifatoriais)

• Farmacogenética (escolha de droga e dose baseado

em informações genéticas do

paciente/tumor/parasita/etc)

• Aconselhamento de doenças recessivas

• NIPT (Non-Invasive Prenatal Test)

• Hereditariedade (paternidade, etc)

• “Trivialidades” (padrão de cera do ouvido, etc)

Aplicações

• De novo-sequencing:

• Identificação de nova espécie/cepa

• Validação de rearranjos (ex: câncer)

• RNA seq:

• Sequenciamento de transcriptoma

• Metagenômica:

• Sequenciamento de amostras com múltiplos

organismos para identificação dos presentes

• Outros

Custos privado Exoma

• First-Tier Exome Only: USD 5,800.00

• Brasil:

• R$ 7.500,00 - 11.900,00

Custos privado NIPT ou painel

de genes

• Brasil:

• R$ 1.500,00 – 3.000,00

Tópicos da aula

Caso 1 e Objetivo da aula/curso

Tecnologia atual e habilidades

necessárias

A técnica em si

Investigando patogenicidade, Casos 1 – 5

Revisão dos aspectos éticos / legais

Conclusão

Caso -2

Tronco curto

Platispondilia (vertebras

achatadas) – OMIM -

platyspondyly

Face normal, inteligência normal

Teste genético

Exoma completo

7-12000,00 reais

Painel de genes

1500,00-3000,00 reais

http://genoma.ib.usp.br/

F9182-1mutations.xlsx

Patogenicidade de Mutações

Ferramentas para interpretação de mutações

e seus possíveis efeitos fenotípicos

Mutação

A mutation is defined as any change in the

nucleotide sequence or arrangement of

DNA. (Thompson & Thompson Genetics in Medicine)

Importante lembrar:

Uma mudança de nucleotídeo pode não

mudar AA

Dup, del, inv, translocações são mutacões

Nem toda mutação gera fenótipo alterado!

(ou seja, nem toda mutação é patogênica)

Começar do começo

Paciente (s)

Hipótese clínica

Heredograma - padrão de herança?

Possível definir locus? - estudo de ligação, ligado ao

X, marcadores polimórficos, etc

Amostra:

Tecido? (sangue, pele, gônadas) – Mosaicismo?

Possibilidade de contaminação? - vilo coriônico,

sangue materno, etc

Mutações conhecidas

(danosas?)

OMIM (sempre desatualizado) http://www.ncbi.nlm.nih.gov/omim/

http://www.omim.org

HGMD (dados públicos < 75%) http://www.hgmd.cf.ac.uk/ac/index.php

Cosmic (câncer) http://cancer.sanger.ac.uk/cancergenome/projects/cosmic/

Decipher (CNV) http://decipher.sanger.ac.uk/

ClinVar, PUBMED, etc

Mutações conhecidas

(benignas?)

dbSNP

Cuidado deveria chamar dbSNV, existem

variantes <1% de frequência e/ou

patogênicas

1000 genomes / personal genomes

Certeza que os indivíduos não eram

doentes? Ou portadores?

6500 exomes (Washington University)

65000 exomas (Broad-Harvard exac)

HapMap

Região do DNA

Éxon

CDS / ORF

Splicing

Promotor

Enhancer

Metilação

RNA interferência

Etc

Conservação

Em geral quanto mais conservado nas espécies é o

nucleotídeo ou AA em questão, maior o risco de causar

fenótipo

GERP (Genomic Evolutionary Rate Profiling):

http://mendel.stanford.edu/sidowlab/downloads/gerp/index.html

PhyloP (PHAST)

http://compgen.bscb.cornell.edu/phast/faq.php

Predição de dano a proteína

Predições calculadas por computação são

chamadas in silico

SIFT

http://sift.jcvi.org/

PolyPhen

http://genetics.bwh.harvard.edu/pph2/

Mutation Taster

http://www.mutationtaster.org/

LRT (likelihood ratio test) – Usa conservação para

prever mutação deletéria

http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2752137/

Caso -2

FILTROS:

Frequência alélica < 0,01 em populações

controle não afetadas

No máximo 6 alelos em 48 pacientes

brasileiros do CEGH

Regiões exônicas ou de splicing

F9182-1_raras_AC6_exonic.xlsx

Caso -2

Braquiolmia autossômica recessiva – PAPSS2

heterozigoto composto

Tronco curto

Platispondilia (vertebras achatadas)

Face normal, inteligência normal

Dente normal

RISCO?

Caso -3

Fraqueza muscular com 8 anos

Dificuldade para levantar-se do chão

Hipertrofia de panturrilhas e atrofia das coxas

CPK 2550ng/mL (ref 30-120)

Caso -3

FILTROS:

Frequência alélica < 0,01 em populações

controle não afetadas

No máximo 6 alelos em 124 pacientes

brasileiros do CEGH

Regiões exônicas ou de splicing

chrX:32,215,533-32,240,930

C25881_raras_AC6_exonic.xlsx

Browsers

Em geral possuem quase tudo o que você

precisa e mais um pouco (além de uma

maneira de visualizar arquivos próprios)

UCSC Genome Browser

http://genome.ucsc.edu

Ensembl

http://www.ensembl.org/index.html

IGV

http://www.broadinstitute.org/software/igv/

Caso -4

C24034

Fraqueza muscular com 6 anos

Dificuldade para levantar-se do chão

Hipertrofia de panturrilhas e atrofia das coxas

CPK 2030ng/mL (ref 30-120)

Caso -4

FILTROS:

Frequência alélica < 0,01 em populações

controle não afetadas

No máximo 6 alelos em 124 pacientes

brasileiros do CEGH

Regiões exônicas ou de splicing

C24034_raras_AC6_exonic.xlsx

Caso -5

Displasia esqulética compatível com

‘Geleophysic dysplasia’ – Heterogeneidade

de loco com 2 padrões de herança: AR e AD

Frequência alélica < 0,01 em populações controle não afetadas

No máximo 6 alelos em 48 pacientes brasileiros do CEGH

Regiões exônicas ou de splicing

F9162-1_raras_AC6_exonic.xlsx

Voltando ao caso -1

F8123, 11 anos

Displasia esquelética

Voltando ao caso 1

Displasia esquelética de gene desconhecido,

MAS...

F1.1 F1.2

Voltando ao caso 1

Displasia espôndilometafisária com distrofia de

cones e bastonetes

Exoma completo em 4 pacientes

Family 1 Family 2

Number of variants in both individuals 20160 Number of variants in both individuals 17341

Number of homozygous variants 6873 Number of homozygous variants 5243

Rare (<0.01 allele freq. external controls) 307 Rare (<0.01 allele freq. external controls) 326

<0.05 allele freq. internal controls 18 <0.05 allele freq. internal controls 17

Gene Variant Mutation type dbSNP137 Gene Variant Mutation type dbSNP137

APOD NM_001647:c.383A>G:p.Y128C missense rs150664052 PNRC2 NM_017761:c.237A>C:p.S79S sense rs10493018

PCYT1A NM_005017:c.996C>G:p.P332P sense rs61737911 ATP13A5 NM_198505:c.1831G>A:p.A611T missense rs143477252

PCYT1A NM_005017:c.385G>A:p.E129K missense . ATP13A4 NM_032279:c.2895G>T:p.R965R sense rs150429290

FAM170A NM_001163991:c.665G>T:p.G222V missense rs200846075 MUC4 NM_018406:c.10220T>C:p.M3407T missense .

USP17L8 NM_001256872:c.534C>T:p.P178P sense . MUC4 NM_018406:c.8733G>C:p.T2911T sense rs28385894

USP17L8 NM_001256872:c.146T>A:p.V49D missense rs201927052 MUC4 NM_018406:c.8405C>T:p.P2802L missense .

IL33 NM_001199641:c.273C>T:p.F91F sense . MUC4 NM_018406:c.7320G>A:p.S2440S sense rs71321826

CCDC73 NM_001008391:c.3050T>A:p.I1017K missense rs199847743 MUC4 NM_018406:c.7313T>C:p.V2438A missense .

DACT1 NM_001079520:c.1193T>C:p.L398P missense rs114859205 MUC4 NM_018406:c.7312G>A:p.V2438I missense .

SYNE2 NM_015180:c.15021C>T:p.A5007A sense rs148113884 MUC4 NM_018406:c.7295G>C:p.R2432P missense .

PPP1R36 NM_172365:c.1016T>C:p.V339A missense rs149477152 MUC4 NM_018406:c.7275T>A:p.A2425A sense .

PPP1R36 NM_172365:c.1166T>C:p.F389S missense rs149234804 MUC4 NM_018406:c.6111T>C:p.D2037D sense rs199853476

PLEKHG3 NM_015549:c.461G>A:p.R154Q missense rs149822835 MUC4 NM_018406:c.6096G>T:p.P2032P sense .

PLEK2 NM_016445:c.588G>T:p.V196V sense . MUC4 NM_018406:c.6081T>A:p.T2027T sense .

ARG2 NM_001172:c.1051C>T:p.R351C missense rs112748595 PCYT1A NM_005017:c.968dupG:p.S323Rfs*38 frameshift insertion .

ZFYVE26 NM_015346:c.5799C>T:p.S1933S sense rs145858625 RNF168 NM_152617:c.1481C>T:p.P494L missense rs35132476

CBLN2 NM_182511:c.20G>A:p.G7E missense . POTEG NM_001005356:c.869T>A:p.F290Y missense rs200845849

Tópicos da aula

Caso 1 e Objetivo da aula/curso

Tecnologia atual e habilidades

necessárias

A técnica em si

Investigando patogenicidade, Casos 1 – 5

Revisão dos aspectos éticos / legais

Conclusão

Implicações

• Domínio da informação

– Ética, leis, familiares, médicos, seguro saúde

• Busca por saúde

– Todos somos doentes, basta procurar de perto

• Extrapolação célula-tecido-organismo-

população-etnia-espécie

– Risco cardio vascular x Filipinos

• Capacidade de entendimento do

pesquisador+médico+paciente de somatória de

riscos, variantes de significado incerto (VUS) e

erros possíveis no processo

Considerações

• Implantação acadêmica x indústria privada

– https://www.23andme.com/

• Custo x tempo x benefício

• Termo de consentimento livre e

esclarecido dinâmico e individual+familiar

• Políticas públicas

– Projeto varioma:

http://www.humanvariomeproject.org/

Tópicos da aula

Caso 1 e Objetivo da aula/curso

Tecnologia atual e habilidades

necessárias

A técnica em si

Investigando patogenicidade, Casos 1 – 5

Revisão dos aspectos éticos / legais

Conclusão

Conclusões guilherme.yamamoto@usp.com.br

•Uma técnica revolucionária que talvez será suficiente para identificar

mutações (variantes) tanto de ponto como estruturais

•A medicina vai ficar personalizada em torno das variantes de cada

paciente mas os bancos de dados populacionais são fundamentais para

o processo

•Genética humana (e não humana) não é mais apenas uma matéria

básica

•Genética humana não é mais apenas o estudo de doenças raras que

poucos entrarão em contato

•Mantenham-se atualizados sobre os aspectos genéticos de suas futuras

áreas de atuação

OBRIGADO

top related