sequenciamento de nova geração (ngs) e …...sequenciamento de nova geração (ngs) e...
Post on 05-Jun-2020
2 Views
Preview:
TRANSCRIPT
Sequenciamento de nova
geração (NGS) e
interpretação de variantes
Guilherme Lopes Yamamoto
2015
guilherme.yamamoto@usp.com.br
Por favor,
NÃO COLOCAR o arquivo powerpoint em locais públicos.
Não usar conteúdo da aula sem citar a fonte.
Até,
Guilherme
Tópicos da aula
Caso 1 e Objetivo da aula/curso
Tecnologia atual e habilidades
necessárias
A técnica em si
Investigando patogenicidade, Casos 1 – 5
Revisão dos aspectos éticos / legais
Conclusão
Tópicos da aula
Caso 1 e Objetivo da aula/curso
Tecnologia atual e habilidades
necessárias
A técnica em si
Investigando patogenicidade, Casos 1 – 5
Revisão dos aspectos éticos / legais
Conclusão
Caso 1
11 anos
Displasia esquelética espôndilometafisária
Objetivos da aula
Ao término da aula (ou estudo em casa),
habilidades conquistadas:
Entender as novas técnicas de genômica
Levantar os aspectos genômicos de
patologias humanas
Não cometer atrocidades na interpretação de
variantes
Diagnosticar doenças raras e identificar
genes novos
Tópicos da aula
Caso 1 e Objetivo da aula/curso
Tecnologia atual e habilidades
necessárias
A técnica em si
Investigando patogenicidade, Casos 1 – 5
Revisão dos aspectos éticos / legais
Conclusão
Tecnologia atual / Em que pé
estamos Eight years of work, thousands of researchers around
the world, $1 billion spent — and finally it was done.
On April 14, 2003, a decade ago this week, scientists
announced that they had completed the Human
Genome Project, compiling a list of the three billion
letters of genetic code that make up what they
considered to be a sort of everyperson’s DNA.
April 16, 2013, on page D3 of the New York Times with the headline:
Human Genome, Then and Now.
NGS
Time videos
• The Next Medical Revolution: One
Family's Story
• Exome Sequencing: A Medical Test
That May Reveal Too Much
• Beating Cancer from the Inside Out
http://www.time.com/time/video/search/0,32112,,00.html?cmd=tags&p=0&q=medici
ne&x=-752&y=-1406
Casos famosos
One In A Billion: A boy's life, a medical
mystery - 2011 Pulitzer Prize in Explanatory Reporting
2010
Nicholas Volker
XIAP gene
Apoptose e Sistema Imune alterados
>Doença intestinal inflamatória
Transplante de medula óssea
http://www.jsonline.com/features/health/111224104.html
Casos famosos
• Genetic Gamble New Approaches to
Fighting Cancer – 2012 The New York Times
2011
Dr. Lukas Wartman
LLA (Leucemia Linfoblástica Aguda)
FLT3 (FMS-RELATED TYROSINE KINASE 3) Gene hiperativado
Sunitinib (inibidor de receptor de tirosinas
quinases RTK)
http://www.nytimes.com/2012/07/08/health/in-gene-sequencing-
treatment-for-leukemia-glimpses-of-the-future.html
Habilidades necessárias
USO DO COMPUTADOR
Busca em banco de dados (ler e escrever em
inglês)
Interpretação crítica (conceito de risco – Filme
‘GATTACA’; Livro – ‘The drunkard’s walk’)
Acesso a laboratórios/testes de alta tecnologia
($$$)
Conceitos de genética básica bem
sedimentados
História clínica (Anamnese, Exame físico e
hipótese Dx) de qualidade
Tópicos da aula
Caso 1 e Objetivo da aula/curso
Tecnologia atual e habilidades
necessárias
A técnica em si
Investigando patogenicidade, Casos 1 – 5
Revisão dos aspectos éticos / legais
Conclusão
Sanger (Sequenciamento por
eletroforese em capilar) http://www.youtube.com/watch?v=6ldtdWjDwes&feature=player_detailpage
Sequência de 1 éxon de
1 gene (100-1000bp)
Leitura da fluorescência
em capilar
Incorporação de bases
fluorescentes
Extração do DNA
(tecido/organismo)
PCR com primers
específicos
Análise manual do
gráfico de cores
Illumina NGS http://www.youtube.com/watch?v=l99aKKHcxC4&feature=player_detailpage
A técnica em si
• Preparação da biblioteca
• Sequenciamento
• Análise bioinformática e biológica
Fragmentação
Quebrar o DNA aleatóriamente
A-T-G-T-C-C-T-G-A-T-C-G-A-A-A-T-G-A-C-A-G-C-A-G-C-A-G-C-A-G-T-A-A
T-A-C-A-G-G-A-C-T-A-G-C-T-T-T-A-C-T-G-T-C-G-T-C-G-T-C-G-T-C-A-T-T
T-C-C-T-G-A-T-C-G-A-A- C-T-G-T-C-G-T-C-G-T-C-G-
T-A-C-A-G-G-A-C-T C-T-G-A-T-C-G-A-A-A-T-G-A-C-A-G-C
Adaptadores+index
T-C-C-T-G-A-T-C-G-A-A
T-T-C-G-A-A-T-C-A-A-C-G-C-A-T-C-C-T-G-A-T-C-G-A-A-T-G-C-T-A-C-C-
G
C-T-G-T-C-G-T-C-G-T-C-G-
T-T-C-G-A-A-T-C-A-T-C-A-G-G-C-T-G-T-C-G-T-C-G-T-C-G-T-G-C-T-A-C-C-G
Captura
T-T-C-G-A-A-T-C-A-A-C-G-C-A-T-C-C-T-G-A-T-C-G-A-A-T-G-C-T-A-C-C-
G
T-A-G-C-T-BEAD_MAGNÉTICO
T-T-C-G-A-A-T-C-A-A-C-G-C-A-T-A-C-A-G-G-A-C-T-T-G-C-T-A-C-C-G
T-T-C-G-A-A-T-C-A-T-C-A-G-G-C-T-G-T-C-G-T-C-G-T-C-G-T-G-C-T-A-C-C-G
C-A-G-C-A-G-C-A-G-BEAD_MAGNÉTICO
C-A-G-C-A-G-C-A-G-BEAD_MAGNÉTICO !!!
Sequenciamento
T-T-C-G-A-A-T-C-A-A-C-G-C-A-T-C-C-T-G-A-T-C-G-A-A-T-G-C-T-A-C-C-G
Clusterização
Sequenciamento
Incorporação de bases fluorescentes e captura da imagem
G-C-T-T-A-G primer
de sequenciamento
Homo(hemi)zigoto
Heterozigoto
Análise - Hardware
• Servidores
• 2 servidores em paralelo com:
• 2x8cores = 16 núcleos físicos, 144Gb RAM,
600Gb HD – LINUX –
Armazenamento
• 2 servidores com 40Tb HD
Análise - Software
• 3 etapas:
• Alinhamento (Alignment) fastq->bam
• Diversos programas (BWA, bowtie2, novoalign) a
• Chamada de Variantes (variant call) bam->vcf
• Diversos programas (GATK, SAMTOOLS, etc) a
maioria gratuitos – 0USD
• Interpretação biológica bam + vcf -> LAUDO
• Diversos programas (ANNOVAR, SVA, IGV,
GeneSpring, etc)
• Total: ~20Gb por exoma
Análise
1- Alinhamento (.fastq -> .bam) BWA
C-T-G-T-C-G-T-C-G-T-C-G-
T-C-C-T-G-A-G-C-G-A-A
A-T-G-T-C-C-T-G-A-T-C-G-A-A-A-T-G-A-C-A-G-C-A-G-C-A-G-C-A-G-T-A-
T-C-G-T-G-A-G-C--A-T
T-C-C-T-G-A-T-C--A-A
T-C-C-T-G-A-T-C-G-A-A
Análise
2- Chamada variantes (.bam ->.vcf) GATK
T-C-C-T-G-A-G-C-G-A-A
A-T-G-T-C-C-T-G-A-T-C-G-A-A-A-T-G-A-C-A-G-C-A-G-C-A-G-C-A-G-T-A-
T-C-C-T-G-A-T-C--A-A
SNP (chr1:112455671 T / G)
INDEL (chr1:112455673 G / -)
Análise
3- Anotar variantes (.vcf -> table) ANNOVAR
T-C-C-T-G-A-G-C-G-A-A
A-T-G-T-C-C-T-G-A-T-C-G-A-A-A-T-G-A-C-A-G-C-A-G-C-A-G-C-A-G-T-A-
T-C-C-T-G-A-T-C--A-A
SNP (chr1:112455671 T / G)
INDEL (chr1:112455673 G / -)
• Exonica / Splicing, etc
• Gene: HTT
• AA: XXX do transcrito 1
• SIFT, PolyPhen, GERP
• 1000G, 6500ex, dbSNP
• Presente N amostras
• Hetero/Homozigose
Fragmentação aleatória
Sequência de 1 éxon de
1 gene (100-1000bp)
Sequência completa de
todo DNA/RNA (ou
regiões capturadas)
Captura de regiões de
interesse (ou não)
Leitura da fluorescência
em capilar
Individualização dos
fragmentos
Incorporação de bases
fluorescentes
Extração do DNA/RNA
(tecido/organismo)
Extração do DNA
(tecido/organismo)
PCR com primers
específicos
Alinhamento e variantes
por bioinformática
PCR de amplificação
inespecífica
Leitura de luz ou pH em
paralelo à incorporação
Análise manual do
gráfico de cores
Validação manual das
variantes encontradas
Biblioteca
Sequenciamento
Análise
Sanger NGS
Aplicações
• Re-sequencing (a partir de referência):
• Diagnóstico (ou screening) de doenças monogênicas
• Identificação de genes/mutações de risco (doenças
multifatoriais)
• Farmacogenética (escolha de droga e dose baseado
em informações genéticas do
paciente/tumor/parasita/etc)
• Aconselhamento de doenças recessivas
• NIPT (Non-Invasive Prenatal Test)
• Hereditariedade (paternidade, etc)
• “Trivialidades” (padrão de cera do ouvido, etc)
Aplicações
• De novo-sequencing:
• Identificação de nova espécie/cepa
• Validação de rearranjos (ex: câncer)
• RNA seq:
• Sequenciamento de transcriptoma
• Metagenômica:
• Sequenciamento de amostras com múltiplos
organismos para identificação dos presentes
• Outros
Custos privado Exoma
• First-Tier Exome Only: USD 5,800.00
• Brasil:
• R$ 7.500,00 - 11.900,00
Custos privado NIPT ou painel
de genes
• Brasil:
• R$ 1.500,00 – 3.000,00
Tópicos da aula
Caso 1 e Objetivo da aula/curso
Tecnologia atual e habilidades
necessárias
A técnica em si
Investigando patogenicidade, Casos 1 – 5
Revisão dos aspectos éticos / legais
Conclusão
Caso -2
Tronco curto
Platispondilia (vertebras
achatadas) – OMIM -
platyspondyly
Face normal, inteligência normal
Teste genético
Exoma completo
7-12000,00 reais
Painel de genes
1500,00-3000,00 reais
http://genoma.ib.usp.br/
F9182-1mutations.xlsx
Patogenicidade de Mutações
Ferramentas para interpretação de mutações
e seus possíveis efeitos fenotípicos
Mutação
A mutation is defined as any change in the
nucleotide sequence or arrangement of
DNA. (Thompson & Thompson Genetics in Medicine)
Importante lembrar:
Uma mudança de nucleotídeo pode não
mudar AA
Dup, del, inv, translocações são mutacões
Nem toda mutação gera fenótipo alterado!
(ou seja, nem toda mutação é patogênica)
Começar do começo
Paciente (s)
Hipótese clínica
Heredograma - padrão de herança?
Possível definir locus? - estudo de ligação, ligado ao
X, marcadores polimórficos, etc
Amostra:
Tecido? (sangue, pele, gônadas) – Mosaicismo?
Possibilidade de contaminação? - vilo coriônico,
sangue materno, etc
Mutações conhecidas
(danosas?)
OMIM (sempre desatualizado) http://www.ncbi.nlm.nih.gov/omim/
http://www.omim.org
HGMD (dados públicos < 75%) http://www.hgmd.cf.ac.uk/ac/index.php
Cosmic (câncer) http://cancer.sanger.ac.uk/cancergenome/projects/cosmic/
Decipher (CNV) http://decipher.sanger.ac.uk/
ClinVar, PUBMED, etc
Mutações conhecidas
(benignas?)
dbSNP
Cuidado deveria chamar dbSNV, existem
variantes <1% de frequência e/ou
patogênicas
1000 genomes / personal genomes
Certeza que os indivíduos não eram
doentes? Ou portadores?
6500 exomes (Washington University)
65000 exomas (Broad-Harvard exac)
HapMap
Região do DNA
Éxon
CDS / ORF
Splicing
Promotor
Enhancer
Metilação
RNA interferência
Etc
Conservação
Em geral quanto mais conservado nas espécies é o
nucleotídeo ou AA em questão, maior o risco de causar
fenótipo
GERP (Genomic Evolutionary Rate Profiling):
http://mendel.stanford.edu/sidowlab/downloads/gerp/index.html
PhyloP (PHAST)
http://compgen.bscb.cornell.edu/phast/faq.php
Predição de dano a proteína
Predições calculadas por computação são
chamadas in silico
SIFT
http://sift.jcvi.org/
PolyPhen
http://genetics.bwh.harvard.edu/pph2/
Mutation Taster
http://www.mutationtaster.org/
LRT (likelihood ratio test) – Usa conservação para
prever mutação deletéria
http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2752137/
Caso -2
FILTROS:
Frequência alélica < 0,01 em populações
controle não afetadas
No máximo 6 alelos em 48 pacientes
brasileiros do CEGH
Regiões exônicas ou de splicing
F9182-1_raras_AC6_exonic.xlsx
Caso -2
Braquiolmia autossômica recessiva – PAPSS2
heterozigoto composto
Tronco curto
Platispondilia (vertebras achatadas)
Face normal, inteligência normal
Dente normal
RISCO?
Caso -3
Fraqueza muscular com 8 anos
Dificuldade para levantar-se do chão
Hipertrofia de panturrilhas e atrofia das coxas
CPK 2550ng/mL (ref 30-120)
Caso -3
FILTROS:
Frequência alélica < 0,01 em populações
controle não afetadas
No máximo 6 alelos em 124 pacientes
brasileiros do CEGH
Regiões exônicas ou de splicing
chrX:32,215,533-32,240,930
C25881_raras_AC6_exonic.xlsx
Browsers
Em geral possuem quase tudo o que você
precisa e mais um pouco (além de uma
maneira de visualizar arquivos próprios)
UCSC Genome Browser
http://genome.ucsc.edu
Ensembl
http://www.ensembl.org/index.html
IGV
http://www.broadinstitute.org/software/igv/
Caso -4
C24034
Fraqueza muscular com 6 anos
Dificuldade para levantar-se do chão
Hipertrofia de panturrilhas e atrofia das coxas
CPK 2030ng/mL (ref 30-120)
Caso -4
FILTROS:
Frequência alélica < 0,01 em populações
controle não afetadas
No máximo 6 alelos em 124 pacientes
brasileiros do CEGH
Regiões exônicas ou de splicing
C24034_raras_AC6_exonic.xlsx
Caso -5
Displasia esqulética compatível com
‘Geleophysic dysplasia’ – Heterogeneidade
de loco com 2 padrões de herança: AR e AD
Frequência alélica < 0,01 em populações controle não afetadas
No máximo 6 alelos em 48 pacientes brasileiros do CEGH
Regiões exônicas ou de splicing
F9162-1_raras_AC6_exonic.xlsx
Voltando ao caso -1
F8123, 11 anos
Displasia esquelética
Voltando ao caso 1
Displasia esquelética de gene desconhecido,
MAS...
F1.1 F1.2
Voltando ao caso 1
Displasia espôndilometafisária com distrofia de
cones e bastonetes
Exoma completo em 4 pacientes
Family 1 Family 2
Number of variants in both individuals 20160 Number of variants in both individuals 17341
Number of homozygous variants 6873 Number of homozygous variants 5243
Rare (<0.01 allele freq. external controls) 307 Rare (<0.01 allele freq. external controls) 326
<0.05 allele freq. internal controls 18 <0.05 allele freq. internal controls 17
Gene Variant Mutation type dbSNP137 Gene Variant Mutation type dbSNP137
APOD NM_001647:c.383A>G:p.Y128C missense rs150664052 PNRC2 NM_017761:c.237A>C:p.S79S sense rs10493018
PCYT1A NM_005017:c.996C>G:p.P332P sense rs61737911 ATP13A5 NM_198505:c.1831G>A:p.A611T missense rs143477252
PCYT1A NM_005017:c.385G>A:p.E129K missense . ATP13A4 NM_032279:c.2895G>T:p.R965R sense rs150429290
FAM170A NM_001163991:c.665G>T:p.G222V missense rs200846075 MUC4 NM_018406:c.10220T>C:p.M3407T missense .
USP17L8 NM_001256872:c.534C>T:p.P178P sense . MUC4 NM_018406:c.8733G>C:p.T2911T sense rs28385894
USP17L8 NM_001256872:c.146T>A:p.V49D missense rs201927052 MUC4 NM_018406:c.8405C>T:p.P2802L missense .
IL33 NM_001199641:c.273C>T:p.F91F sense . MUC4 NM_018406:c.7320G>A:p.S2440S sense rs71321826
CCDC73 NM_001008391:c.3050T>A:p.I1017K missense rs199847743 MUC4 NM_018406:c.7313T>C:p.V2438A missense .
DACT1 NM_001079520:c.1193T>C:p.L398P missense rs114859205 MUC4 NM_018406:c.7312G>A:p.V2438I missense .
SYNE2 NM_015180:c.15021C>T:p.A5007A sense rs148113884 MUC4 NM_018406:c.7295G>C:p.R2432P missense .
PPP1R36 NM_172365:c.1016T>C:p.V339A missense rs149477152 MUC4 NM_018406:c.7275T>A:p.A2425A sense .
PPP1R36 NM_172365:c.1166T>C:p.F389S missense rs149234804 MUC4 NM_018406:c.6111T>C:p.D2037D sense rs199853476
PLEKHG3 NM_015549:c.461G>A:p.R154Q missense rs149822835 MUC4 NM_018406:c.6096G>T:p.P2032P sense .
PLEK2 NM_016445:c.588G>T:p.V196V sense . MUC4 NM_018406:c.6081T>A:p.T2027T sense .
ARG2 NM_001172:c.1051C>T:p.R351C missense rs112748595 PCYT1A NM_005017:c.968dupG:p.S323Rfs*38 frameshift insertion .
ZFYVE26 NM_015346:c.5799C>T:p.S1933S sense rs145858625 RNF168 NM_152617:c.1481C>T:p.P494L missense rs35132476
CBLN2 NM_182511:c.20G>A:p.G7E missense . POTEG NM_001005356:c.869T>A:p.F290Y missense rs200845849
Tópicos da aula
Caso 1 e Objetivo da aula/curso
Tecnologia atual e habilidades
necessárias
A técnica em si
Investigando patogenicidade, Casos 1 – 5
Revisão dos aspectos éticos / legais
Conclusão
Implicações
• Domínio da informação
– Ética, leis, familiares, médicos, seguro saúde
• Busca por saúde
– Todos somos doentes, basta procurar de perto
• Extrapolação célula-tecido-organismo-
população-etnia-espécie
– Risco cardio vascular x Filipinos
• Capacidade de entendimento do
pesquisador+médico+paciente de somatória de
riscos, variantes de significado incerto (VUS) e
erros possíveis no processo
Considerações
• Implantação acadêmica x indústria privada
– https://www.23andme.com/
• Custo x tempo x benefício
• Termo de consentimento livre e
esclarecido dinâmico e individual+familiar
• Políticas públicas
– Projeto varioma:
http://www.humanvariomeproject.org/
Tópicos da aula
Caso 1 e Objetivo da aula/curso
Tecnologia atual e habilidades
necessárias
A técnica em si
Investigando patogenicidade, Casos 1 – 5
Revisão dos aspectos éticos / legais
Conclusão
Conclusões guilherme.yamamoto@usp.com.br
•Uma técnica revolucionária que talvez será suficiente para identificar
mutações (variantes) tanto de ponto como estruturais
•A medicina vai ficar personalizada em torno das variantes de cada
paciente mas os bancos de dados populacionais são fundamentais para
o processo
•Genética humana (e não humana) não é mais apenas uma matéria
básica
•Genética humana não é mais apenas o estudo de doenças raras que
poucos entrarão em contato
•Mantenham-se atualizados sobre os aspectos genéticos de suas futuras
áreas de atuação
OBRIGADO
top related