sequenciamento e anÁlise filogenÉtica de

61
Pró-Reitoria Acadêmica Programa de Pós-Graduação Stricto Sensu em Ciências Genômicas e Biotecnologia Pró-Reitoria Acadêmica Programa de Pós-Graduação Stricto Sensu em Ciências Genômicas e Biotecnologia Pró-Reitoria Acadêmica Programa de Pós-Graduação Stricto Sensu em Ciências Genômicas e Biotecnologia SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE AMOSTRAS DE ZIKA VIRUS NO BRASIL Brasília - DF 2018 Autora: Carolina Rodrigues Chanes Orientador: Dr. Fabrício Falconi Costa Coorientador: Dr. Fernando Lucas Melo

Upload: others

Post on 17-Jul-2022

12 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

Pró-Reitoria Acadêmica

Programa de Pós-Graduação Stricto Sensu em Ciências Genômicas e Biotecnologia

Pró-Reitoria Acadêmica

Programa de Pós-Graduação Stricto Sensu em Ciências Genômicas e Biotecnologia

Pró-Reitoria Acadêmica

Programa de Pós-Graduação Stricto Sensu em Ciências

Genômicas e Biotecnologia

SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

AMOSTRAS DE ZIKA VIRUS NO BRASIL

Brasília - DF

2018

Autora: Carolina Rodrigues Chanes

Orientador: Dr. Fabrício Falconi Costa

Coorientador: Dr. Fernando Lucas Melo

Page 2: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

CAROLINA RODRIGUES CHANES

SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE AMOSTRAS DE ZIKA

VIRUS NO BRASIL

Dissertação apresentada ao Programa de pós-

graduação Stricto Sensu em Ciências

Genômicas e Biotecnologia da Universidade

Católica de Brasília, como requisito parcial

para obtenção do Título de Mestre em

Ciências genômicas e Biotecnologia.

Orientador: Dr. Fabrício Falconi Costa

Coorientador: Dr. Fernando Lucas Melo

Brasília

2018

Page 3: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

Ficha elaborada pelo Sistema de Bibliotecas da Universidade Católica de Brasília (SIBI/UCB)

C456s Chanes, Carolina Rodrigues.

Sequenciamento e análise filogenética de amostras de Zika virus no

Brasil / Carolina Rodrigues Chanes – 2018.

59 f.: il. ; 30 cm

Dissertação (Mestrado) – Universidade Católica de Brasília, 2018.

Orientação: Prof. Dr. Fabrício Falconi Costa

Coorientação: Prof. Dr. Fernando Lucas Melo

1. Zika virus. 2. Sequenciamento de genoma completo. 3. Epidemiologia. 4. Filogenética. I. Costa, Fabrício Falconi, orient. II. Melo, Fernando Lucas, coorient. III. Título.

CDU 606

Page 4: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE
Page 5: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

Dedico este trabalho a mim.

Só eu realmente sei como foi a jornada até chegar aqui.

Page 6: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

AGRADECIMENTOS

Agradeço a minha família pelo suporte a minha escolha de continuar sempre

estudando, aos meus orientadores pela motivação quando tudo parecia sem saída e pela

sinceridade de cada um, aos meus amigos que incansavelmente só ouviam sobre meu

mestrado e meus desesperos com o mesmo, principalmente a Jacqueline, que quando precisei

esteve prontamente a me ajudar, à minha irmã Isabel que sempre esteve comigo independente

do momento, ao meu namorado Hebertt que sabe de tudo que se passou e me deu apoio e

finalmente a minha psicóloga Gabriela que manteve minha sanidade mental no lugar.

Agradeço também àqueles que me auxiliaram no laboratório de alguma forma como o

Leonardo Assis da UnB, o Thiago e a Jacqueline.

Agradeço ao coordenador do Projeto “Zika, Dengue e Chikungunya: abordagem para

desenvolvimento de soluções aplicáveis em saúde pública”, ao qual estamos associados,

Professor Dr. Bergmann Morais da UnB, ao Paulo S. Prado do laboratório de virologia do

LACEN-DF, a Professora Lídia que sempre esteve ao meu lado desde o início da minha

jornada acadêmica e a CAPES pelo financiamento e possibilitar esse título.

Ao meu orientador Fabrício pelas suas conversas motivadoras e por se preocupar

comigo.

Um agradecimento especial ao meu coorientador Fernando porque, afinal, a gente sabe

como foi dura a jornada para ambos.

Page 7: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

RESUMO

CHANES, Carolina Rodrigues. Sequenciamento e análise filogenética de amostras de Zika

virus no Brasil. 2018. 59 folhas. Mestrado em Ciências Genômicas e Biotecnologia –

Universidade Católica de Brasília, Brasília, 2018.

Zika virus é um flavivírus emergente transmitido por mosquitos do gênero Aedes,

primeiramente isolado em 1947 de macacos sentinelas na floresta de Zika na África. O vírus

se espalhou para outros continentes até ser relacionado com síndromes neurológicas e

congênitas na América do Sul sendo taxado como um problema de saúde pública. O

sequenciamento genômico emergiu como uma ferramenta crucial de respostas em tempo real

a surtos de doenças infecciosas e tem ajudado a entender a filogenia, origem e delinear a

propagação do Zika virus. Este trabalho tem como objetivos obter a sequência completa do

Zika virus circulante em três diferentes estados do Brasil, DF, MT e TO, utilizando a técnica

de amplificação por PCR multiplex, a plataforma portátil MinION da Oxford Nanopore. Além

disto, tivemos como objetivo realizar a árvore filogenética por máxima verossimilhança a fim

de compreender melhor a origem, propagação e disseminação do vírus nestes estados e,

consequentemente, no Brasil. As sequências obtidas no presente trabalho apresentaram alta

cobertura, foi possível cobrir entre 94% e 100% dos genomas que se apresentaram em quatro

linhagens distintas e se associaram em dois clados diferentes relacionados as amostras do

Nordeste do Brasil. Finalmente, nosso estudo fornece novas sequências completas do Zika

virus no estado do Mato Grosso, demonstra a relação das sequencias do MT com as

sequências do Nordeste do Brasil e sugere duas possíveis entradas do Zika virus no estado do

MT.

Palavras Chaves: Zika virus. Sequenciamento de genoma completo. Epidemiologia.

Filogenética.

Page 8: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

ABSTRACT

Zika virus is an emergent flavivirus transmitted by mosquitos of Aedes genus, was first

isolated in 1947 from Zika forest in Africa of the sentinel’s monkeys. The virus spread to

other continents and was related with congenital and neurological syndromes in South

America and became a public health issue. The genomic sequencing arouses as a crucial tool

to obtain answers in real time about infections diseases outbreaks and has helped to

understand the origin, phylogeny and trace Zika virus propagation. The main goals of this

work are to obtain the complete Zika virus genome sequences that circulated in three different

states of Brazil, DF, MT and TO, using the amplification technic multiplex PCR, the MinION

portable platform of Oxford Nanopore. Besides that, we had the goal to generate the

phylogenetic tree by maximum likelihood to better understand the origin, propagation and

dissemination of the virus in these states, and consequentially, in Brazil. The sequences obtain

in this present work shown high coverage, 94% to 100% was the coverage of the

completeness of the genomes, that presented four distinct lineages, two different clades and

related with Northeast samples of Brazil. Finally, our study provides new complete genome

sequences of Zika virus in the state of Mato Grosso, demonstrate the relationship of the

genome sequences of MT with sequences of Northeast of Brazil and suggests two possible

entrances of Zika virus in the state of MT.

Keywords: Zika virus. Whole Genome Sequencing. Epidemiology. Phylogenetics.

Page 9: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

SUMÁRIO

1. INTRODUÇÃO ..................................................................................................................... 8

2. REVISÃO DA LITERATURA ............................................................................................. 9

2.1 ZIKA VIRUS ...................................................................................................................... 9

2.2 SEQUENCIAMENTO DE GENOMA COMPLETO .................................................... 14

2.3 SEQUENCIAMENTO VIA NANOPOROS .................................................................. 16

2.4 FILOGENIA MOLECULAR ......................................................................................... 17

3. OBJETIVOS ........................................................................................................................ 20

4. JUSTIFICATIVA ................................................................................................................ 21

5. METODOLOGIA ................................................................................................................ 24

5.1 AMOSTRAGEM ............................................................................................................ 24

5.2 EXTRAÇÃO DE RNA TOTAL, RT-PCR E PCR MULTIPLEX ................................. 24

5.3 PREPARO DA BIBLIOTECA ....................................................................................... 26

5.4 SEQUENCIAMENTO .................................................................................................... 28

5.5 ANÁLISE DE DADOS .................................................................................................. 28

5.6 ANÁLISE FILOGENÉTICA .......................................................................................... 29

6. RESULTADOS ................................................................................................................... 31

6.1 AMOSTRAS POR CT ..................................................................................................... 31

6.2 PCR MULTIPLEX ......................................................................................................... 31

7. DISCUSSÃO ....................................................................................................................... 40

8. CONCLUSÃO ..................................................................................................................... 43

REFERÊNCIAS BIBLIOGRÁFICAS ..................................................................................... 44

ANEXO I – CONJUNTO DE PRIMERS UTILIZADOS NA PCR MULTIPLEX ................. 49

ANEXO II – ARTIGO SUBMETIDO PARA A REVISTA ARCHIVES OF VIROLOGY

(ANNOTATED SEQUENCE) ................................................................................................. 50

Page 10: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

8

1. INTRODUÇÃO

Desde a sua descoberta, o Zika virus (ZIKV) tem demonstrado com clareza que está

seguindo o caminho do Dengue virus (DENV) e Chikungunya virus (CHIKV) se espalhando

por todos os países com a presença do mosquito do gênero Aedes, principalmente o A.

aegypti. O Brasil que já é endêmico para essas arboviroses, devido a presença do mosquito no

país, agora tem o ZIKV para acrescentar em sua lista de epidemias virais (MUSSO;

GUBLER, 2016).

O ZIKV é um arbovírus emergente que se tornou um problema de saúde pública ao

chegar às Américas causando transmissões autolimitadas em seres humanos. Apesar de sua

síndrome ser de caráter leve, este foi relacionado com síndromes neurológicas e materno

fetais especialmente no Brasil (PLOURDE; BLOCH, 2016).

Devido a sua importância crescente, o ZIKV demanda ações rápidas e inteligentes,

essas, demandam conhecimento, em alguns casos, da natureza molecular do vírus para serem

tomadas. Saber a sequência genômica do ZIKV auxilia na compreensão da filogenia, origem,

conexão com síndromes neurológicas e a propagação do vírus no país e no mundo (CUNHA

et al., 2016; NACCACHE et al., 2016; YUN et al., 2016).

A compreensão completa da disseminação do ZIKV no Brasil depende do estudo dos

casos, principalmente durante as epidemias, em todos os estados do país com números de

sequências representativas para ser possível traçar um estudo filogeográfico e entender o

caminho viral dentro do país.

Tendo em vista que ainda não existem estudos publicados sobre a filogenia do ZIKV

nos estados brasileiros de Tocantins (TO), Mato Grosso (MT) e no Distrito Federal (DF), o

presente estudo se propôs a melhorar a compreensão da disseminação deste vírus no Brasil a

partir de algumas sequências genômicas virais isoladas nestes estados supracitados.

Page 11: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

9

2. REVISÃO DA LITERATURA

2.1 ZIKA VIRUS

O ZIKV é um arbovírus membro da família Flaviviridae e pertencente ao gênero

Flavivirus. Este vírus foi isolado pela primeira vez de macacos sentinelas Rhesus em 1947 na

floresta de Zika localizada na Uganda durante uma pesquisa epidemiológica de febre amarela

e um ano depois identificado novamente na mesma floresta em mosquitos Aedes africanus

(DICK; KITCHEN; ADDOW, 1952).

Os primeiros casos registrados de doença em seres humanos pelo ZIKV ocorreram na

Nigéria em 1954 (MACNAMARA, 1954), apesar de já ter sido reconhecida a soroprevalência

de 6,1% de anticorpos contra esse vírus na população de Uganda, sugerindo infecções

humanas (DICK, 1952).

Estudos de soroprevalência e detecção de ZIKV em mosquitos continuaram

demonstrando a expansão do vírus no continente Africano: leste, central, oeste e sul

(MUSSO; GUBLER, 2016) e na Ásia incluindo Índia, Indonésia, Malásia e Paquistão

(KINDHAUSER et al., 2016).

O primeiro grande surto, documentado, relacionado ao ZIKV ocorreu nas Ilhas de Yap

localizada nos Estados Federados da Micronésia em 2007. A sintomatologia relacionada foi

de erupção cutânea maculopapular, artralgia, febre e conjuntivite não purulenta. Dados de

uma pesquisa em domicilio de sorovigilância na região estimaram que 73% da população de

6892 habitantes com três anos ou mais de idade foi infectada durante o surto (DUFFY et al.,

2009). Estas informações mostraram o potencial do ZIKV como um novo arbovírus

emergente (MUSSO; GUBLER, 2016).

Uma grande preocupação com o vírus veio à tona quando este foi relacionado com a

Síndrome de Guillain-Barré (SGB), uma neuropatia pós-infecciosa axonal motora aguda do

sistema nervoso sendo a principal causa de paralisia flácida aguda no mundo (VAN DOORN;

RUTS; JACOBS, 2008), e casos de síndromes congênitas durante um grande surto entre

outubro de 2013 e abril de 2014 na Polinésia Francesa, onde mais de 32 mil pacientes foram

avaliados com suspeita de infecção pelo ZIKV e o número de casos de SGB foi vinte vezes

maior do que o esperado para o ano (CAO-LORMEAU et al., 2016; MALLET; VIAL;

MUSSO, 2016).

Casos de SGB relacionados ao ZIKV também foram registrados nas Américas Central

e Latina, principalmente, no Brasil, Venezuela, Colômbia, República Dominicana, El

Salvador, Honduras e Suriname (DOS SANTOS et al., 2016; PARRA et al., 2016).

Page 12: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

10

No Brasil os primeiros casos da infecção pelo ZIKV apareceram em maio de 2015 no

estado da Bahia com um surto da doença autolimitada (CAMPOS; BANDEIRA; SARDI,

2015) e seu primeiro caso de transmissão autóctone (ZANLUCA et al., 2015). No início de

dezembro do mesmo ano, dezoito estados do Brasil já haviam reportado a circulação do vírus

e no final do mesmo mês o número de casos suspeitos da infecção foi de quatrocentos e

quarenta mil para um milhão e trezentos mil (HENNESSEY; FISCHER; STAPLES, 2016;

MUSSO; GUBLER, 2016).

Em outubro de 2015 no estado de Pernambuco, Nordeste, o ZIKV foi associado com o

aumento da ocorrência de casos de microcefalia (20x) (SAMPATHKUMAR; SANCHEZ,

2016). A microcefalia é definida pelo tamanho da circunferência do perímetro cefálico com

no mínimo dois desvios abaixo da média e está relacionada com malformações cerebrais

(PASSEMARD; KAINDL; VERLOES, 2013).

Diversas investigações demostraram a presença do vírus no tecido fetal, placenta

(MARTINES et al., 2016; MLAKAR et al., 2016) e no líquido amniótico (CALVET et al.,

2016), além de infecções de células neurais in vitro (TANG et al., 2015) suportando a

transmissão materno-fetal. A confirmação experimental da associação do ZIKV com a

microcefalia ocorreu em 2016 por um estudo publicado por Cugula et al. (2016) onde estes

autores descreveram diversas más-formações em fetos de camundongos após infecção

experimental da mãe durante a gravidez.

Recentemente, o estudo de Yuan et al (2017) ofereceu uma explicação para esse “link”

ZIKV - microcefalia, devido ao achado de uma mutação na proteína prM (proteína presente

na membrana viral), usando linhagens contemporâneas asiáticas (2015-2016), onde uma única

substituição de serina para asparagina (S139N) demonstrou, através de evidências

experimentais, o aumento da infectividade em células neuroprogenitoras tanto de humanos

quanto de ratos e conduziu a um fenótipo microcefálico mais severo em ratos quando

comparado a linhagem mais antiga da Camboja (2010). Este grupo especulou que esta

substituição estivesse relacionada com a maturação da partícula viral, em consequência com o

aumento da sua neurovirulência (YUAN et al., 2017).

A sintomatologia mais comum causada pelo ZIKV (Febre pelo ZIKV) é de erupção

cutânea, febre, artralgia, mialgia, fadiga, cefaleia, dor retro ocular e conjuntivite não

purulenta, sintomas de grande semelhança com Dengue e Chikungunya, arboviroses

endêmicas na maioria dos países que o ZIKV tem emergido, o que dificulta o diagnóstico

clínico e favorece a sua circulação por diversas décadas de forma silenciosa (KINDHAUSER

et al., 2016; PLOURDE; BLOCH, 2016).

Page 13: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

11

Outros motivos que favoreceram o ZIKV emergir como um problema de saúde pública

foram: doença de curso benigno ou assintomática, controle inefetivo do mosquito,

globalização, reações cruzadas no diagnóstico sorológico com outros Flavivirus, viremia

comumente baixa (dificultando isolamento e detecção do vírus) e modificações genéticas no

ZIKV, as quais podem aumentar o potencial virulento e epidêmico do vírus (BAUD et al.,

2017; PETERSEN et al., 2016).

Assim como outros flavivírus, o ZIKV é transmitido pela picada de mosquito,

principalmente o gênero Aedes (PLOURDE; BLOCH, 2016), porém, outras formas de

transmissão foram relatadas, como a sexual (FOY et al., 2011), congênita (CALVET et al.,

2016) e pela transfusão sanguínea (BESNARD et al., 2014; MUSSO et al., 2014).

O diagnóstico para ZIKV tem sido realizado pela RT-qPCR (PCR quantitativa), pois é

o método mais sensível de detecção e diversos fluidos têm sido reportados com a presença do

vírus, como sêmen, urina e sangue. O diagnóstico sorológico é complicado devido às reações

cruzadas com outros flavivírus e por isso não existe, até o momento, kits comerciais validados

de sorologia para ZIKV (MUSSO; GUBLER, 2016).

O tratamento é apenas sintomático tendo em vista que ainda não existem antivirais

para este vírus. Este consiste de antitérmicos, repouso, analgésicos e ingestão de fluidos. Os

anti-inflamatórios não são recomendados em caso de diagnóstico incerto e com a

possibilidade de infecção com o vírus da dengue. A prevenção é a principal medida na

maioria das arboviroses, evitando a picada de mosquitos, utilizando repelentes, telas de

proteção, roupas longas e a realização do controle da proliferação do mosquito (PLOURDE;

BLOCH, 2016).

O ZIKV tem as características do gênero Flavivirus, sendo envelopado, com a

partícula viral entre 40 e 50 nm de diâmetro, um genoma de RNA fita simples (Figura 1),

senso positivo, não segmentado, com 10794 nucleotídeos codificando uma única ORF (Open

Reading frame ou região de leitura aberta) que é flanqueada por duas regiões não traduzíveis

(5´-UTR e 3´-UTR) que estão envolvidas com a tradução, ciclização e estabilidade do

genoma, ORF é traduzida em uma única poliproteína que é clivada em sete proteínas não

estruturais (NS1, NS2a, NS2b, NS3, NS4a, NS4b e NS5) e três estruturais, proteína do

capsídeo (C), proteína de membrana ou pré-membrana (M e prM) e a proteína de envelope

(E) (Figura 2) (FAYE et al., 2014; MUSSO; CAO-LORMEAU; GUBLER, 2015).

Page 14: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

12

Figura 1 - Representação gráfica do vírion de Flavivirus.

Fonte: ViralZone (2017)

Figura 2 – Representação esquemática do genoma de Flavivirus com indicativo se potenciais sítios de clivagem enzimáticos.

Fonte: ViralZone (2017).

Filogeneticamente o ZIKV foi caracterizado em três linhagens distintas, porque

provavelmente teve sua origem no leste da África (grupo da Nigéria) e assim, se espalhou

para todo o oeste da África (grupo MR766, primeiro ZIKV isolado) e chegou ao sudeste da

Ásia e no Pacífico (genótipo Asiático). Todas as sequências de ZIKV identificadas nas

Américas, inclusive as do Brasil, são parte da linhagem asiática e tem maior similaridade com

aquelas encontradas nos surtos de Yap, Tailândia e Polinésia Francesa (FAYE et al., 2014;

LANCIOTTI et al., 2016).

Os primeiros estudos do ZIKV nas Américas através de análises filogenéticas e de

relógio molecular demonstraram que aconteceu uma única introdução do genótipo asiático no

final de 2013 nas Américas, aproximadamente um ano antes de sua detecção no Brasil,

sugerindo que esta linhagem ancestral pode ter existido primeiramente no Brasil, proveniente

da Polinésia Francesa (FARIA et al., 2016).

Page 15: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

13

Figura 3 – Árvore filogenética demonstrando as três linhagens distintas do ZIKV devido sua origem no Oeste da

África, Leste da África e Ásia.

Fonte: Lanciotti et al. (2016)

Considera-se a hipótese de que o Nordeste do Brasil é a região que recebeu a linhagem

fundadora do ZIKV nas Américas e possuiu maior importância no estabelecimento e

disseminação do vírus dentro do próprio Brasil, na América Central, Caribe e América do Sul,

entre julho de 2014 e abril de 2015. Estima-se que houve um movimento da linhagem do

vírus do nordeste para o sudeste do país na segunda metade de 2014 e levou a infecção para

os estados do Rio de Janeiro e São Paulo (FARIA et al., 2017a).

Os genomas encontrados na América do sul, principalmente na Colômbia, tem grande

similaridade com os do Brasil, sugerindo múltiplas introduções provenientes do Brasil

(METSKY et al., 2017).

O estudo sobre a introdução do ZIKV na América Central e México mostrou o

movimento das linhagens do Brasil para Honduras, entre julho e setembro de 2014, e de

Honduras para Guatemala, Nicarágua e o sul do México entre dezembro de 2014 e março de

2015. Algumas amostras do Panamá e do México foram exceções tendo sido introduzidas

nestes países provavelmente pela Colômbia ou pelo Caribe no segundo semestre de 2015.

(THÉZÉ et al., 2018).

Page 16: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

14

Nos Estados Unidos, as regiões do Texas e da Flórida são afetadas pelas populações

de Aedes aegypti sazonais, e devido a este fator, um surto na Flórida em 2016 teve 256 casos

confirmados da febre pelo ZIKV. A introdução do vírus no Estados Unidos foi provavelmente

o resultado de ao menos quatro introduções separadas e foi introduzido na Flórida

supostamente pelas ilhas do Caribe, informação sugerida por análises filogenéticas e pela alta

frequência de viagens entre essas localidades, principalmente em cruzeiros marítimos

(GRUBAUGH et al., 2017).

Análises de recombinação e mutações com o objetivo de entender o mecanismo

molecular relacionado ao aumento da patogenicidade do vírus foram realizadas. Faye et al.

(2014) propôs que o ZIKV sofreu diversos eventos de recombinação na natureza, porém é um

dado que necessita de estudos aprofundados, pois não existem demonstrações experimentais

de recombinações dentro dos flavivírus. Yokoyama e Starmer (2017) propuseram sete

mutações críticas na região 3´-UTR no vírus que circulou na Malásia (Aea-Malaysia) como

possíveis causadores dos problemas médicos atuais (relação com neuropatias e síndromes

congênitas). Yokoyama e Starmer (2017) defendem ainda que estas complicações podem ter

passado despercebidas (do surto da Malásia ao surto na Polinésia Francesa) devido a região

geográfica de circulação do ZIKV ser a mesma do Dengue virus e Chikungunya virus.

2.2 SEQUENCIAMENTO DE GENOMA COMPLETO

A possibilidade de sequenciar genomas completos de vários organismos, incluindo os

vírus, nos permitiu realizar análises de comparação e evolução em larga escala, identificação

de variantes raras, traços de base genética, aumento da virulência relacionada a mutações,

recombinações de patógenos e até a identificação de microrganismos não cultiváveis, ações

que eram inimagináveis alguns anos atrás (NG; KIRKNESS, 2010; YOKOYAMA;

STARMER, 2017).

Uma aplicação do sequenciamento de genoma completo (SGC) na virologia é a

vigilância epidemiológica, onde as sequências gênicas dos vírus envolvidos em epidemias

revelam informações sobre a natureza do microrganismo quando comparadas com sequências

existentes em bancos de dados. Com passar do tempo e o acúmulo das informações obtidas de

outras sequências relacionadas aos surtos sendo depositadas, as divergências nucleotídicas

podem ajudar a prever o curso da doença e estabelecer conclusões epidemiológicas

importantes, devido à evolução rápida dos patógenos, em questão de semanas e meses

(GARDY; LOMAN; RAMBAUT, 2015).

Page 17: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

15

O uso do SGC na virologia clínica também é de grande importância e pode ser usado

para detecção de variantes resistentes a drogas (HOULDCROFT; BEALE; BREUER, 2017).

Para sequenciar um genoma completo de vírus existem três abordagens mais

utilizadas, o sequenciamento por metagenômica, sequenciamento de amplicons de PCR e o

sequenciamento de enriquecimento alvo (Figura 4) (QUICK et al., 2017).

O sequenciamento por metagenômica tem a abordagem clássica de extrair o DNA e/ou

RNA total da amostra e a biblioteca ser realizada pela técnica de shotgun (DNA é quebrado

em pequenos fragmentos aleatoriamente). As desvantagens do método envolvem

contaminação de ácidos nucleicos de outros microrganismos, do próprio hospedeiro e

depende de uma alta concentração do vírus na amostra para que a proporção de reads

(fragmentos gerados no sequenciamento) seja suficiente para cobrir todo seu genoma. A

maior vantagem do método é no sequenciamento e identificação de novos vírus, sem a

necessidade de conhecimento prévio da sua sequência (HOULDCROFT; BEALE; BREUER,

2017).

O sequenciamento de amplicons de PCR é uma técnica que necessita do conhecimento

prévio da sequência, para que a amplificação de todo material genético viral, utilizando

primers específicos, seja o enriquecimento suficiente para o sequenciamento, principalmente

de vírus pequenos. A vantagem desse método é o custo e a sensibilidade. As desvantagens

incluem a grande diversidade viral, requerendo um número elevado de primers e dificuldades

de analisar novas variantes virais por bioinformática (HOULDCROFT; BEALE; BREUER,

2017; QUICK et al., 2017).

O sequenciamento de enriquecimento alvo é um método que envolve pequenas sondas

de DNA fixas em fase sólida (como beads magnéticos) que são complementares a sequência

completa do vírus de interesse, e estas irão hibridizar a sequência presente na amostra, a fase

sólida será capturada para que ocorra o sequenciamento apenas das sequências selecionadas.

Este método tem a vantagem de o genoma ser o mais representativo possível do vírus

analisado e reduz a quantidade de mutações possíveis quando se utiliza a PCR. As

desvantagens são o preço da biblioteca, a dependência da concentração inicial do vírus na

amostra e a necessidade do conhecimento anterior da sequência do vírus (HOULDCROFT;

BEALE; BREUER, 2017).

Page 18: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

16

Figura 4 – Principais abordagens de sequenciamento para obter o genoma completo de vírus diretamente de

amostras clínicas. Todas as técnicas partem de uma amostra com material genético alvo (em vermelho) e do

hospedeiro (em azul). Sequenciamento de metagenoma: preparo da biblioteca através do shotgun e

sequenciamento de todo DNA presente. Sequenciamento de amplicons de PCR: amplificações específicas para o

DNA alvo são realizadas gerando os amplicons que serão utilizados no preparo da biblioteca e sequenciamento.

Sequenciamento de enriquecimento alvo: Uma biblioteca com sondas específicas ao material genético alvo,

fixada a uma fase sólida (beads magnéticos), é preparada (chamada de biblioteca isca), onde ocorrerá a

hibridização com as sequencias de interesse e a fase sólida será capturada, consequentemente as sequencias alvo

hibridizadas e o sequenciamento apenas do DNA alvo será realizada.

Fonte: Houldcroft, Beale e Breuer (2017) [Modificado].

2.3 SEQUENCIAMENTO VIA NANOPOROS

Nanoporos foram demonstrados como ferramentas para detecção de moléculas de

DNA e RNA de fita simples, pela primeira vez, em 1996 com canal iônico de alfa hemolisina

de Staphylococcus aureus (KASIANOWICZ et al., 1996).

Desde então os nanoporos têm sido explorados na intenção de criar uma tecnologia de

sequenciamento de quarta geração (NGS – Next generation sequencing) mais barata, simples

e rápida (BRANTON et al., 2008; LOMAN; WATSON, 2015).

O funcionamento desta tecnologia é dado pelo bloqueio da corrente iônica dentro do

nanoporo e o tempo de bloqueio determina as bases que ali translocam (Figura 5). Cada

nanoporo é colocado em uma membrana, a membrana por sua vez está imersa em um

ambiente de solução salina, onde a amostra de DNA é administrada e um campo elétrico é

formado a partir da aplicação de uma corrente iônica perpendicular a membrana. A passagem

do DNA pelos nanoporos é devido a sua capacidade de tornar-se carregado negativamente

nessa situação, passando assim eletroforeticamente pelo nanoporo, este possui uma corrente

Page 19: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

17

iônica constante (linha de base) que é perturbada de acordo com o tempo e magnitude do que

ali passa (DE SOUZA, 2017; FYTA, 2015).

A duração do bloqueio da corrente indica o tempo de translocação que a molécula de

DNA leva para atravessar o poro. Um nanoporo grande o suficiente para caber um

nucleotídeo por vez que bloqueie a corrente durante a translocação é capaz de medir a

corrente iônica e dar um valor para cada base (FYTA, 2015).

Sequenciamento por nanoporos é uma tecnologia genômica que pode ser aplicada na

vigilância sanitária, no diagnóstico clínico e na investigação de surtos. Esta tecnologia gera a

detecção de moléculas únicas baseadas em nanoporos com vantagens de sequenciar reads

longos, não necessitar de amplificações, alta capacidade e ser livre de marcadores (FENG et

al., 2015; SHUKLA et al., 2016).

Uma desvantagem do método consiste na necessidade de leitura da mesma molécula

diversas vezes no mesmo poro ou cópias idênticas da molécula em poros paralelos para

diminuir a taxa de erro na leitura das amostras (O’DONNELL; WANG; DUNBAR, 2013).

Figura 5 – Sequenciamento pelo bloqueio de corrente iônica. Mostra-se na figura a linha de base quando o poro

está aberto e a corrente passa livremente, na parte superior da figura, e o poro bloqueado mostrando a queda

característica na corrente elétrica na parte inferior da figura.

Fonte: Branton et al. (2008) [Modificado].

2.4 FILOGENIA MOLECULAR

A filogenia tenta inferir os caminhos das mudanças evolutivas que produziram a

característica analisada, ou seja, descreve as relações evolutivas entre entidades. A forma mais

comum de representação dessa relação é através de diagramas de ramificações, ou árvores

filogenéticas, com ramificações unidas por nós levando a terminais nas pontas da árvore

(Figura 6) (BRUYN; MARTIN; LEFEUVRE, 2014).

Page 20: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

18

Os “nós” representam ancestrais comuns das quais duas ou mais linhagens são

descendentes, representando os eventos de especiação; os pontos terminais tipicamente

representam espécies individuais que podem ou não ser contemporâneas umas das outras; a

raiz indica o ultimo ancestral comum compartilhado por todo grupo de espécies; e os padrões

de ramificações, topologia da árvore, indicam as relações evolucionárias (GREGORY, 2008).

Figura 6 – Exemplo de uma de uma árvore filogenética enraizada com indicação da Raiz, Ramificação, Nó e

Terminais.

Fonte: Bruyn, Martin e Lefeuvre (2014) [Modificado].

O avanço da biologia molecular e das tecnologias de sequenciamento possibilitou uma

filogenia molecular, ou seja, o estudo de diferenças em sequências homólogas nucleotídicas

ou de aminoácidos, demonstrando as relações evolutivas destes organismos (ALMEIDA,

2014; ZUKERKANDL; PAULING, 1965).

Os métodos de análise podem ser caracterizados em dois grupos: os métodos baseados

em distância e métodos baseados em característica ou variabilidade. O método de distância

mais utilizado é o Neighbor-Joining (NJ) e os métodos de variabilidade são de máxima

parcimônia (MP), máxima verossimilhança (MV) e inferência Bayesiana (IB) (PAGE;

HOLMES, 1998).

O NJ é baseado no cálculo de distância genética entre cada par de sequências e agrupa

as sequências que são mais similares para formar a árvore. Este método tem melhor uso para

formação de árvores iniciais, pois, diversos sítios que sofreram mutações podem passar

despercebidos e não permitem uma análise de qual característica contribui para grupos

específicos (LANGDALE; HARRISON, 2006).

O método de MP assume que características compartilhadas entre diferentes

indivíduos resultam de um ancestral comum, onde a explicação mais simples com menor

Page 21: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

19

número de mudanças para a evolução é a correta. O que pode gerar múltiplas árvores devido

às várias características analisadas (LANGDALE; HARRISON, 2006).

A MV é um cálculo de probabilidade para saber se o conjunto de dados se adequa a

árvore com base em um modelo específico de evolução, considerando todos os sítios dos

dados de forma indistinta e sempre a árvore com a maior probabilidade será a mais verossímil

(NEI; KUMAR, 2000). A IB é muito semelhante ao método de MV, com distinção apenas na

especificação anterior da relação entre sequências e quantidade de dados que será inferida

(FELSENSTEIN, 2004).

A escolha do tipo de análise na filogenia molecular dependerá do rigor requerido no

experimento, principalmente a precisão da análise e o tempo do ensaio computacional. O uso

de mais de uma análise é o mais recomendado para uma maior precisão da filogenia

(LANGDALE; HARRISON, 2006).

Page 22: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

20

3. OBJETIVOS

Este trabalho tem como objetivo sequenciar o genoma completo e realizar a análise

filogenética do Zika virus diretamente de amostras de soro de pacientes com diagnóstico

positivo nos estados do DF, MT e TO do Brasil. A fim de gerar dados para a inferência da

disseminação da doença durante os surtos, conhecer as características de evolução molecular

do vírus, gerar sequencias completas virais e auxiliar nas investigações epidemiológicas

nestes locais.

3.1 OBJETIVOS ESPECÍFICOS

• Gerar sequências completas do ZIKV;

• Determinar as relações filogenéticas do ZIKV presentes nos estados do MT, TO e DF;

Page 23: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

21

4. JUSTIFICATIVA

Desde 2015 o Brasil foi acometido por uma epidemia de ZIKV com mais de trinta mil

casos notificados (FARIA et al., 2016). Em janeiro de 2016, a febre pelo ZIKV foi

determinada como de notificação compulsória e foi iniciada a produção de mais dados sobre a

presença crescente da doença no país. No primeiro semestre de 2016 foram registrados

174.003 casos prováveis (taxa de incidência de 85,1 casos/100 mil habitantes) de febre pelo

vírus Zika distribuídos em 2.251 municípios, tendo sido confirmados 78.421 casos

(MINISTÉRIO DA SAÚDE, 2016).

Sabe-se que a doença chegou no Brasil em 2015 e teve seus primeiros casos no

Nordeste do país, principalmente no estado da Bahia onde ocorreu também o primeiro caso de

transmissão autóctone do vírus (CAMPOS; BANDEIRA; SARDI, 2015).

Ao longo do ano de 2016 em relação a taxa de incidência, por regiões, da febre pelo

ZIKV no Brasil verificou-se que o centro-oeste foi o mais afetado com 172,7 casos/100 mil

habitantes. Estados com maior destaque na incidência foram Mato Grosso (610,8 casos/100

mil hab.), Bahia (315,8 casos/100 mil hab.), Rio de Janeiro (278,1 casos/100 mil hab.) e

Tocantins (166,1 casos/100 mil hab.), dados estes que podem ser observados na figura 7

abaixo (MINISTÉRIO DA SAÚDE, 2016).

Figura 7 - Taxa de incidência (/100 mil hab.) de febre pelo vírus Zika por município de notificação no Brasil no

ano de 2016. Destaque para os estados do Mato Grosso, Bahia, Rio de janeiro e Tocantins.

Fonte: Ministério da Saúde (2016).

Devido a sua associação com síndromes neurológicas como SGB e microcefalia o

ZIKV se tornou um vírus de impacto socioeconômico e uma ameaça global que a

Page 24: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

22

Organização Mundial da Saúde (OMS) declarou como uma emergência de saúde pública de

preocupação internacional no início do ano de 2016 (PAN AMERICAN HEALTH

ORGANISATION, 2015; YUAN et al., 2017).

Entre outubro de 2015 e dezembro de 2016 foram notificados 10.232 casos suspeitos

de recém-nascidos e crianças com alterações no crescimento e desenvolvimento relacionadas

à infecção pelo ZIKV e outras etiologias infecciosas, a maioria dos casos notificados

concentram-se na região Nordeste do país (65,7%), seguindo-se as regiões Sudeste (20,6%) e

Centro-Oeste (6,5%), principais regiões afetadas pela febre do Zika no país (MINISTÉRIO

DA SAÚDE, 2017).

A literatura ainda carece de dados do ZIKV, pois diversos estados do Brasil que

possuem casos confirmados ainda não detêm genomas completos publicados em bancos de

dados públicos, como é o caso do MT e DF, estados em estudo neste trabalho, e o TO possui

atualmente apenas 7 genomas publicados no GenBank (informação de 27/07/2018).

O estado do Mato Grosso (MT) possui cerca de 3 milhões de habitantes (IBGE,

2017a) está localizado no centro oeste do Brasil e foi afetado no surto em 2015 com a

notificação de 9.328 casos da febre pelo Zika e teve um aumento 163% do total anual de

notificações em 2016 com 24.563 casos. O pico de notificações ocorreu entre a primeira e a

decima primeira semana do ano de 2016 (SES-MT, 2016a). O estado não possui um

laboratório central capacitado para realização dos exames laboratoriais de detecção do ZIKV,

sendo necessário o envio das amostras a um laboratório de referência, o que atrasa e dificulta

o diagnóstico e as notificações de casos confirmados (MINISTÉRIO DA SAÚDE, 2015).

Em 2016, 347 casos de microcefalia (recém-nascido, natimorto, abortamento ou feto)

foram notificados no MT, sendo que 12 casos por amostra positiva de ZIKV e 9 desses em

Cuiabá (SES-MT, 2016b).

O Tocantins (TO) está localizado na região Norte do Brasil, possui cerca de 1,3 milhão

de habitantes (IBGE, 2017b) e teve 6.217 casos notificados de febre pelo Zika no ano de

2016, com picos entre a sexta semana e a decima terceira. Em 2016 foram notificados 200

casos prováveis de recém-nascidos e crianças com alterações no crescimento e

desenvolvimento possivelmente relacionadas à infecção pelo ZIKV e outras etiologias

infecciosas (MINISTÉRIO DA SAÚDE, 2017; SES-TO, 2017).

O Distrito Federal (DF) é uma unidade federativa do Brasil situada na região centro

oeste e possui cerca de 3 milhões de habitantes (IBGE, 2017c), a unidade notificou 868 casos

no ano de 2016 da febre do Zika e a maioria dos casos prováveis estão notificados nas RAs

Page 25: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

23

(Regiões administrativas) de Samambaia, Taguatinga, Gama, Planaltina, e Asa Sul (SES-DF,

2017).

A análise filogenética viral contém informações importantes a respeito da história

epidemiológica do microorganismo podendo ser usadas para determinar onde eles se

originaram, como se deu sua disseminação através das populações, prever o curso da doença,

identificar mutações relacionadas a distúrbios ou doenças e auxiliar na produção de vacinas

(CALDART, 2009).

No intuito de gerar dados para a análise filogenética viral, um sistema de

sequenciamento contínuo e integrado com dados de vigilância sanitária se faz necessário para

estabelecer conclusões epidemiológicas importantes contra o ZIKV e outras viroses no Brasil

e no mundo (FARIA et al., 2017a).

Page 26: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

24

5. METODOLOGIA

5.1 AMOSTRAGEM

Foram selecionadas 105 amostras de soro provenientes de gestantes sintomáticas com

diagnóstico positivo para ZIKV, realizado pelo Laboratório Central de Saúde Pública do

Distrito Federal (LACEN-DF), pela metodologia de RT-qPCR (reação de transcriptase

reversa seguida de reação em cadeia da polimerase quantitativa) (valores de Ct - Cycle

Threshold foram anotados) incluindo amostras do Distrito Federal (DF), Mato Grosso (MT) e

Tocantins (TO) com início da sintomatologia entre janeiro de 2016 e junho de 2016.

Este trabalho foi aprovado pelo Comitê de Ética e Pesquisa da Universidade Católica

de Brasília sob o número CAAE 56459616.5.0000.0029.

Figura 8 – Mapa do Estado do Mato Grosso, Brasil, discriminando os municípios aos quais as amostras foram

coletadas.

Fonte: O autor.

5.2 EXTRAÇÃO DE RNA TOTAL, RT-PCR E PCR MULTIPLEX

Para gerar sequências genômicas completas do ZIKV, o protocolo com a metodologia

de PCR multiplex (múltiplas reações em cadeia da polimerase) para sequenciamento com a

plataforma MinION de ZIKV diretamente de amostras clinicas foi seguido (Figura 9)

(QUICK et al., 2017). O mesmo será brevemente descrito abaixo com as devidas

modificações realizadas neste trabalho.

Page 27: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

25

Figura 9 – Fluxograma de trabalho para gerar amplicons pela técnica de “mosaico” a serem sequenciados pela

plataforma MinION.

Fonte: Quick et al. (2017) [Modificado].

As 105 amostras foram extraídas utilizando o QIAamp Viral RNA mini kit

(QUIAGEN) seguindo as instruções do fabricante. A etapa de RT-PCR (transcriptase reversa

e reação em cadeia da polimerase) para obtenção do cDNA foi realizada com a enzima

SuperScript IV (Invitrogen) seguindo o protocolo do fabricante com modificações nas

temperaturas de reação para um único ciclo no termociclador de 23ºC por 10 minutos, 50ºC

por 45 minutos, 55ºC por 15 minutos e 80ºC por 10 minutos. Após a RT-PCR foi adicionado

1µL de RNAse H por amostra para destruir o RNA dos híbridos RNA:DNA e incubado por

37º por 20min.

Para a PCR multiplex, foram utilizados dois conjuntos de primers (nomeados Pool 1 e

Pool 2) (Vide Anexo I) com uma metodologia de “mosaico” (Figura 10) onde dois conjuntos

de 35 pares de primers geram produtos que se sobrepõem em cerca de 100 nucleotídeos com

tamanho final de 400 pares de bases (pb) para cobrir o genoma do ZIKV (aproximadamente

11 kb) (QUICK et al., 2017).

Page 28: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

26

Figura 10 – Esquema demonstrando os amplicons esperados durante a PCR multiplex no Pool 1 e no Pool 2

gerando 400pb e suas devidas sobreposições no genoma completo do ZIKV.

Fonte: Quick et al. (2017).

As duas reações da PCR multiplex para cada amostra foram realizadas com a enzima

Q5 Polimerase de alta fidelidade (New England BioLabs) com as seguintes especificações:

5µL de tampão de reação 5X Q5, 1µL de 10Mm de dNTPs, 0,5µL de Q5 DNA polimerase,

15µL de água livre de nucleases, 1µL do primer Pool 1 ou Pool 2 e 2,5µL de cDNA ou água

livre de nucleases para os controles negativos com volume final de 25µL por reação. A

ciclagem utilizada foi de 98ºC por trinta segundos, 95ºC por 15 segundos, 65ºC por 5

minutos, repetindo os passos 2 e 3 por 35 ciclos.

A etapa de confirmação da PCR multiplex foi realizada por meio de eletroforese de gel

de agarose 1% onde 5µL de cada produto da PCR foram aplicados na corrida deste gel,

juntamente com o marcador 1kb plus DNA ladder (Invitrogen). A purificação foi realizada

com AMPure XP beads (Beckman Coulter Genomics) na proporção 1X de beads para 1X de

amostra e seguindo as orientações do fabricante. Em seguida, a quantificação das amostras foi

realizada com Kit Qubit DNA de alta sensibilidade (Invitrogen) com 1µL do produto de cada

reação, seguindo as recomendações do fabricante.

5.3 PREPARO DA BIBLIOTECA

O preparo da biblioteca e sequenciamento foram realizados na plataforma MinION

(Figura 11) utilizando os kits Ligation Sequencing Kit 1D SQK-LSK108 e Native Barcoding

Kit todos da Oxford Nanopore Technologies (Figura 12).

Inicialmente, o preparo da biblioteca começou com a escolha de 04 amostras e seus

pools foram preparados de forma a associar Pool 1 e Pool 2 da mesma amostra para obter

quantidades equimolares de ambos pools. Foram utilizados apenas 1 barcode por amostra

(NB01-NB04). O volume final de cada amostra foi de 30µL.

Page 29: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

27

O reparo das pontas e a adição dA na cauda foram realizadas com o NEB Next Ultra II

End-repair/dA-tailing module (New England BioLabs) adicionando 4,2µL do tampão Ultra II

End-Prep e 1,8µL da Ultra II End-Prep enzyme mix em cada amostra previamente preparada,

o tempo de reação foram de 5 minutos a 20ºC e 5 minutos a 65ºC.

Após a reação de reparo a purificação foi realizada com AMPure XP beads (Beckman

Coulter Genomics) na proporção 1X de beads para 1X de amostra e seguindo as orientações

do fabricante e as amostras eluídas em 15µL de água livre de nucleases.

A próxima etapa foi a ligação dos barcodes (Native Barcoding Kit - Oxford Nanopore

Technologies) na qual 5µL do barcode (NB01-NB12) foi, respectivamente, adicionado nas

amostras e 20µL de NEB Blunt/TA Ligase Master Mix (New England BioLabs) em cada

tudo. A reação foi incubada a temperatura ambiente por 10 minutos e em seguida aquecida a

65ºC por 10 minutos para garantir que na próxima etapa da biblioteca agrupada não aconteça

nenhuma ligação indesejada entre barcodes/amostras.

Em seguida as 04 amostras foram agrupadas em um único tudo para a purificação que

será realizada de acordo com as instruções do fabricante do AMPure XP beads (Beckman

Coulter Genomics) seguindo a razão de 1X de beads para 1X de amostra e a biblioteca será

eluída em 31µL de água livre de nucleases.

A quantificação das amostras foi realizada em seguida com o Kit Qubit DNA de alta

sensibilidade (Invitrogen) com 1µL da biblioteca, seguindo as recomendações do fabricante.

É esperada uma recuperação mínima 700ng.

A ligação dos adaptadores foi efetuada com 30µL da biblioteca, 20µL do adaptador

BAM 1D (Oxford Nanopore Technologies), 50µL de NEB Blunt/TA Ligase Master Mix

(New England BioLabs) e incubada por 10 minutos a temperatura ambiente.

A próxima reação foi uma purificação com o protocolo modificado apenas nas etapas:

adição de 40µL de AMPure XP beads (Beckman Coulter Genomics) na biblioteca que os

adaptadores foram previamente ligados, uso de 140µL do tampão ABB (Oxford Nanopore

Technologies) para realização das lavagens e eluição em 15µL de água livre de nucleases.

Após a etapa anterior a quantificação das amostras foi realizada com o Kit Qubit DNA

de alta sensibilidade (Invitrogen) com 1µL da biblioteca pronta, seguindo as recomendações

do fabricante. Esperava-se uma recuperação aproximada de 430ng nesta etapa.

Page 30: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

28

Figura 11 – Plataforma MinION da Oxford Nanopore Technologies.

Fonte: Oxford Nanopore Technologies (2018).

5.4 SEQUENCIAMENTO

O sequenciamento foi efetuado de acordo com o protocolo da Oxford Nanopore

Technologies 1D Lambda Control Experiment (SQK-LSK 108) descrito brevemente abaixo.

A SpotON Flow Cell (R9.4) foi encaixada no MiniION (já previamente conectado a

um computador pelo cabo USB), preparada retirando aproximadamente 20µL de tampão do

priming port, pipetados 800µL do priming mix (576µL do tampão RBF e 624µL de água livre

de nucleases), após 5 minutos a tampa do SpotON foi aberta e 200µL do priming mix foram

pipetados no priming port.

Apenas 12µL da biblioteca foram combinados com 35µL de RBF, 2,5µL de água livre

de nucleases e 25,5µL LLB (library loading beads). Os 75µL desta combinação foram

pipetados gota por gota na abertura do SpotON, em sequência as tampas do SpotON e

priming port foram fechadas, assim como a do MinION.

O início da corrida se deu utilizando o software MinKNOW (programa da Oxford

Nanopore Technologies) e o progresso pode ser observado em tempo real enquanto os

arquivos são salvos diretamente no computador utilizado.

5.5 ANÁLISE DE DADOS

O pipeline da análise de bioinformática para MinION utilizado nesse projeto está

disponível em https://bedford.io/projects/zika-seq em licença de código aberto.

Os reads gerados pelo sequenciamento no MinION são gravados em formato FAST5,

posteriormente processados e convertidos para o formato FASTQ com o programa Albacore

v1.2.1 da Oxford Nanopore Technologies. Os reads processados foram separados por

Page 31: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

29

bibliotecas com o programa porechop, gerando um arquivo FASTQ para cada biblioteca

(NB01, NB02, NB03 e NB04). Em seguida cada arquivo foi mapeado ao genoma de

referência (GenBank KJ776791.2) usando bwa mem, convertidos ao formato BAM usando

samtools view, os primers retirados e a cobertura normalizada utilizando align_trim.py. A

retirada dos primers é de grande importância para obtenção das sequências reais devido a

utilização da PCR multiplex anterior ao sequenciamento.

Utilizando o Nanopolish variants a sequência consenso foi calculada baseada na

detecção de SNPs (polimorfismos de base única) e INDELs (pequenas inserções e deleções)

nos reads brutos em comparação com a sequência de referência. Ao final as sequências de

baixa qualidade e as variantes de baixa cobertura são filtrados e as sequências finais geradas.

5.6 ANÁLISE FILOGENÉTICA

As quatro amostras do ZIKV sequenciadas neste trabalho foram utilizadas para as

análises filogenéticas, assim como 359 sequências encontradas em bancos de dados públicos,

incluindo sequências da Ásia, América do Norte, América Central e América do Sul.

O alinhamento das sequências foi realizado com o MAFFT v7.388, programa de

alinhamento de sequencias múltiplas, nos parâmetros padrões (KATOH; STANDLEY, 2013).

A reconstrução filogenética foi realizada utilizando método bayesiano implementado no

programa BEAST v1.10.1 (Bayesian Evolutionary Analysis Sampling Trees) (SUCHARD et

al., 2018). Foram realizadas 2 corridas independentes com 20 milhões de cadeias, com

amostragem a cada 2 mil cadeias. Com base em estudos anteriores sobre evolução de ZIKV

(FARIA et al., 2017b; GRUBAUGH et al., 2017; METSKY et al., 2017), foram utilizados os

modelos uncorrelated lognormal relaxed molecular clock (DRUMMOND et al., 2006) e

Bayesian skyline coalescent model (DRUMMOND et al., 2005). A convergência das análises

foi avaliada utilizando o programa TRACER (RAMBAUT et al., 2018) e árvore de máxima

credibilidade dos clados (maximum clade credibility tree, MCC tree) obtida com o programa

TreeAnnotator (http://www.beast2.org/treeannotator/) e visualizada com o programa FigTree

(http://tree.bio.ed.ac.uk/software/figtree/).

Page 32: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

30

Figura 12 – Fluxograma com as etapas para o preparo da biblioteca de cDNA com os respectivos Kits a serem

utilizados no processo.

Fonte: O autor.

Page 33: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

31

6. RESULTADOS

6.1 AMOSTRAS POR CT

O valor de Ct (Cycle Threshold) ou “limiar de detecção” é o valor utilizado na qPCR

para determinar o número de ciclos necessários para amplificação da sequência alvo e permite

a quantificação relativa de DNA presente em cada amostra.

A distribuição de Ct das amostras mostrou valores superiores a 30 em 88,5% dos

casos, a média dos Ct foi de 34,1 (n=105) e apenas 12 amostras apresentaram valores iguais

ou superiores ao Ct de 30. Valores podem ser observados na figura 13 abaixo.

Figura 13 – Distribuição do número de amostras por valores de Ct da RT-qPCR. Média observada dos Ct 34,1

(n=105).

Fonte: O autor

6.2 PCR MULTIPLEX

As reações de PCR multiplex foram realizadas como descrito na metodologia para 105

amostras e dois controles negativos do pool 1 e pool 2.

O produto destas reações foi aplicado em um gel de agarose em uma eletroforese

seguindo a metodologia descrita anteriormente. A figura 14 mostra o resultado das 20

primeiras amostras (1-20) do pool 1 e do pool 2, a figura 15 mostra o resultado das 50

próximas amostras (21-70) do pool 1, a figura 16 mostra o resultado das 50 amostras (21-70)

do pool 2, a figura 17 mostra o resultado das 35 amostras (71-105) do pool 1 e a figura 18 as

35 amostras restantes (71-105) do pool 2.

Os controles negativos do pool 1 e pool 2 estão na figura 19. Os controles negativos

têm grande importância no controle de contaminações das reações.

Page 34: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

32

Foram selecionadas as amostras que apresentaram bandas entre 400pb e 500pb (pares

de bases), em ambos os pools, devido as variações genéticas do ZIKV.

Figura 14 – Resultado da PCR multiplex do pool 1 e do pool 2 em eletroforese de gel de agarose 1%. M:

Marcador 1kb Plus DNA Ladder (Invitrogen). 1-20 esquerda: Amostras de 1 a 20 do pool 1. 1-20 direita:

Amostras 1-20 do pool 2. As setas indicam o tamanho de produto de PCR esperado.

Fonte: O autor.

Figura 15 – Resultado da PCR multiplex do pool 1 em eletroforese de gel de agarose 1%. M: Marcador 1kb Plus

DNA Ladder (Invitrogen). 21-70: Amostras de 21 a 70. As setas indicam o tamanho de produto de PCR

esperado.

Fonte: O autor.

Page 35: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

33

Figura 16 – Resultado da PCR multiplex do pool 2 em eletroforese de gel de agarose 1%. M: Marcador 1kb Plus

DNA Ladder (Invitrogen). 21-70: Amostras de 21 a 70. As setas indicam o tamanho de produto de PCR

esperado.

Fonte: O autor.

Figura 17 – Resultado da PCR multiplex do pool 1 em eletroforese de gel de agarose 1%. M: Marcador 1kb Plus

DNA Ladder (Invitrogen). 71-105: Amostras de 71 a 105. As setas indicam o tamanho de produto de PCR

esperado.

Fonte: O autor.

Page 36: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

34

Figura 18 – Resultado da PCR multiplex do pool 2 em eletroforese de gel de agarose 1%. M: Marcador 1kb Plus

DNA Ladder (Invitrogen). 71-105: Amostras de 71 a 105. As setas indicam o tamanho de produto de PCR

esperado.

Fonte: O autor.

Figura 19 – Resultado da PCR multiplex do C1: Controle negativo pool 1. C2: Controle negativo pool 2 em

eletroforese de gel de agarose 1%. M: Marcador 1kb (Ludwig Biotec).

Fonte: O autor.

As 45 amostras que amplificaram em ambos os pools (entre 400pb e 500pb) foram

todas do estado do Mato Grosso de nove municípios diferentes, e a sua numeração, município

de coleta e valor de Ct, estão especificados na Tabela 1 abaixo.

Page 37: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

35

Tabela 1 – Especificação do Ct (Cycle Threshold), Município do MT e numeração das 45 amostras que tiveram

amplificação positiva em ambos pools 1 e 2. Amostras sequenciadas aparecem com um asterisco (*).

Numeração Município Valor de Ct

1 Cuiabá 30

2 Tangará da Serra 37

3 Lucas do Rio Verde 32

4 Cuiabá 34

5 Marcelândia 33

6 Cuiabá 38

7 Lucas do Rio Verde 30

8 Várzea Grande 32

9 Várzea Grande 34

10 Várzea Grande 35

11 Várzea Grande 33

12 Cuiabá 36

13 Lucas do Rio Verde 37

14 Cuiabá 34

15 Cuiabá 33

16* Cuiabá 30

17 Cuiabá 32

18 Cuiabá 34

19 Cuiabá 34

20 Cuiabá 38

23 Sorriso 34

43* Juína 30

52 Lucas do Rio Verde 32

53 Marcelândia 33

55 Marcelândia 35

56 Marcelândia 37

57 Lucas do Rio Verde 32

58 Tangará da Serra 31

59 Tangará da Serra 31

60 Tangará da Serra 31

61 Lucas do Rio Verde 36

62 Cuiabá 35

63 Campo Verde 36

64 Lucas do Rio Verde 35

66 Lucas do Rio Verde 34

67 Lucas do Rio Verde 35

68 Lucas do Rio Verde 34

69 Lucas do Rio Verde 34

70 Cuiabá 38

Page 38: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

36

77* Marcelândia 26

92 Cuiabá 33

94 Cuiabá 37

97* Lucas do Rio Verde 29

98 Lucas do Rio Verde 38

103 Nova Olímpia (Zona Rural) 31

Fonte: O autor.

6.3 SEQUENCIAMENTO

Um teste inicial com doze amostras foi realizado este, porém não apresentou

resultados devido a erros nos processos, devido a isso outros testes com DNA conhecidos e

controles foram realizados. Em seguida as amostras 16, 43, 77 e 97 foram sequenciadas com a

plataforma MinION de acordo com o descrito na metodologia e o resultado do tamanho do

genoma gerado de cada amostra, número de reads por amostra, nível em porcentagem da

cobertura da poliproteína do ZIKV e valor de Ct estão apresentados na Tabela 2 abaixo.

Tabela 2 – Resultado do sequenciamento das amostras com MinION, especificando o número de reads, tamanho

dos genomas obtidos em números de nucleotídeos, cobertura da poliproteína obtida em porcentagem (%) e valor

de Ct.

Amostra Número de reads Tamanho do genoma Cobertura em % Valor de Ct

V1_97 20.894 10.385 99,03% 29

V2_77 16.586 10.388 100% 26

V3_16 3.160 10.388 94,56% 30

V4_43 10.959 10.389 100% 30

Fonte: O autor.

A cobertura (quantidade de vezes que cada base foi sequenciada) é apresentada na

figura 20 para cada uma das 4 amostras sequenciadas. V1 para amostra 97, V2 a 77, V3 a 16 e

V4 a 43. O eixo X apresenta a quantidade de vezes que os reads foram sequenciados, o eixo

Y por sua vez, apresenta a posição dos reads no genoma em pares de bases (pb). As

coberturas acima de 20X são consideradas suficientes para montagem do genoma.

A amostra V3 apresentou as menores coberturas, em algumas regiões abaixo de 20X,

em consequência, a mesma apresentou gaps (lacunas) no seu genoma.

O padrão de locais com menores coberturas (acima de 20X) podem ser observados em

todas as amostras nos 100pb, 1800pb, 4500pb, 5700pb, 6200pb, principalmente 8000pb e

10000pb devido a provável dificuldade de amplificação de alguns primers dessas regiões do

genoma.

Page 39: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

37

Figura 20 – Coberturas encontradas para as quatro amostras sequenciadas. Posição do genoma em pares de

bases. V1 amostra 97, V2 amostra 77, V3 amostra 16 e V4 amostra 43. O eixo X apresenta a quantidade de vezes

que os reads foram sequenciados. O eixo Y apresenta a posição dos reads no genoma em pares de bases (pb).

Fonte: O autor

Page 40: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

38

Figura 21 – Árvore de máxima credibilidade dos clados (MCC tree) estimada com o genoma completo de 363

sequências de ZIKV. (A) Visão geral da filogenia com as amostras obtidas neste trabalho destacadas pelas setas

vermelhas; (B) e (C) detalhamento dos clados com as sequências deste estudo. Os círculos pretos demarcam os

nós com probabilidade posterior > 0,9.

Fonte: O autor.

Page 41: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

39

A árvore filogenética de máxima credibilidade dos clados (MCC) está apresentada na

figura 21, foi estimada com 363 genomas, porém as sequências da linhagem Asiática foram

retiradas para melhor visualização.

As quatro amostras sequenciadas neste trabalho são indicadas pelas setas vermelhas

(Figura 21a) e formaram dois clados distintos: clado C com V1, V2 e V4 e clado B com V3,

sugerindo ao menos duas entradas do vírus no estado. As amostras V1, V2 e V4 foram

provenientes de cidades do interior do estado (Marcelândia, Lucas do Rio Verde e Juína,

respectivamente), enquanto que a amostra V3 é proveniente da capital do estado (Cuiabá).

O detalhamento do clado B é apresentado na figura 21b onde observa-se a relação da

amostra V3 com as amostras do Nordeste do Brasil.

O detalhamento do clado C está na figura 21c onde é possível ver a relação da

sequência V1 e V2 com amostras do Norte e Nordeste do Brasil, e da amostra V4 relacionada

com as amostras que foram exportadas para Ásia (China). É importante ressaltar que o suporte

para a separação das amostras V1, V2 e V4 não é alto, indicando que estas amostras formam

provavelmente um clado monofilético.

Page 42: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

40

7. DISCUSSÃO

Desde maio de 2015, o Brasil reporta casos da febre pelo ZIKV e dentre estes casos, a

associação com a microcefalia (THÉZÉ et al., 2018). Ainda assim, existem diversos estados

que não possuem sequências depositadas em bancos de dados mesmo com números altos de

notificações e pouco se sabe sobre a dinâmica do vírus dentro do país. Este caso se deve

provavelmente pela dificuldade de sequenciar amostras clínicas, devido aos desafios impostos

pelas baixas cargas virais encontradas e a manipulação das amostras não ser apropriada para o

sequenciamento, principalmente para vírus de RNA (METSKY et al., 2017).

As baixas cargas virais são refletidas nos altos Ct apresentados nos diagnósticos

laboratoriais pelo RT-qPCR, onde 88,5% das amostras analisadas neste trabalho apresentaram

Ct maiores que 30 com uma média de Ct 34,1, valores similares a estudos anteriores (FARIA

et al., 2017a; METSKY et al., 2017; THÉZÉ et al., 2018).

Estes valores tem associação com a cobertura e completude genômica onde Ct abaixo

de 33 apresentam tipicamente coberturas mais altas e aqueles iguais ou maiores a 33

coberturas variáveis (FARIA et al., 2017a). Resultados comparáveis com os obtidos, pois a

cobertura foi para todas as amostras acima de 94% e Ct abaixo ou igual a 30 das amostras

sequenciadas.

Neste trabalho, a técnica de PCR multiplex foi escolhida devido as dificuldades

impostas pelo método de sequenciamento por metagenômica citados acima e demonstrados na

literatura por Metsky et al. (2017) onde das 38 amostras analisadas neste método quase

nenhuma apresentou RNA de ZIKV suficiente para fechar o genoma, então, eles se voltarão

para duas técnicas de enriquecimento, sendo uma delas a PCR multiplex.

Nos achados da figura 20, pode-se analisar que os padrões de menor cobertura são nas

mesmas regiões entre as amostras sequenciadas sugerindo que a eficácia da amplificação

varia entre as combinações dos pares de primers, necessitando de atualização nestas

sequencias de primers. Achados parecidos também foram descritos por Faria et al. (2017).

A árvore de MCC apresentou resultados compatíveis com a literatura (FARIA et al.,

2016), demonstrou que amostras da Ásia ficaram próximas a raiz dividindo o ancestral

comum com todas amostras das Américas. Amostras da Polinésia Francesa do surto de 2013

dividem um ancestral comum com as do Brasil (Dados não mostrados).

Duas amostras do Haiti, sendo um caso importado nos Estados Unidos, revelam a

possibilidade do ancestral comum da linhagem das Américas ter estado no Caribe antes da

Page 43: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

41

chegada do ZIKV no Nordeste do Brasil, porém, estes dados devem ser analisados com

cautela tendo em vista o baixo número representativo de amostras.

Dados semelhantes foram encontrados por Faria et al (2017a) que inferiu a presença

do ancestral asiático ter chegado primeiramente no Brasil sem excluir a possibilidade (em

caso de novos dados serem apresentados) do Haiti ter sido intermediário para chegada e

estabelecimento do ZIKV no Brasil.

Campos et al. (2018) recentemente inferiu com essas mesmas duas amostras a

possibilidade de o ancestral comum ter estado no Caribe e entrado no Brasil posteriormente

por alguns militares brasileiros que estiveram em missão no Haiti em 2014 e importaram

casos de CHIKV e devido à grande migração de haitianos após o terremoto em 2010 para o

Brasil.

Assim como encontrado por Metsky et al. (2017) o Brasil possui sequências em todas

as bases dos clados (grupo de espécies com que tem um único ancestral comum) da árvore de

MCC originando os surtos nos estados do Brasil e distribuindo para as Américas, são

aproximadamente quatro grandes eventos de distribuições, dando suporte a teoria do surto ter

se originado no Brasil e sendo distribuído para outros países das Américas.

Nas árvores construídas verificamos que as quatro amostras do MT sequenciadas

geraram quatro linhagens distintas das quais três formaram um clado único (V1, V2 e V4)

chamado de clado C (Figura 21c). A amostra V1 possui seu ancestral comum mais próximo

com sequências do Pará, Paraíba, Bahia e Tocantins das regiões Nordeste e Norte do Brasil

respectivamente, sequências do surto no ano de 2015 e 2016, sendo provavelmente

introduzida no MT pelo Nordeste do país. A amostra V4 se relaciona com amostras que foram

exportadas para China no ano de 2016, porém, esse grupo não possui grande suporte devido

ao seu nó ter probabilidade posterior menor que 0,9. A amostra V3 apresentou uma linhagem

distinta presente no clado B (Figura 21b) possui ancestralidade comum com amostras de

Fortaleza e da Paraíba ambas do ano de 2015.

O fato das amostras se apresentarem em clados diferentes sugerem duas diferentes

entradas do vírus no estado do Mato Grosso. Semelhantemente, ocorreram quatro introduções

distintas no estado da Flórida nos Estados Unidos com a formação de quatro linhagens

distintas e dois clados (GRUBAUGH et al., 2017).

Atualmente, pouco se sabe sobre a filogeografia do ZIKV dentro do Brasil, porém,

sabemos da importância do Nordeste na distribuição do vírus para diversas outras regiões,

principalmente o Sudeste e Norte do país, e agora nossos achados corroboraram com essas

Page 44: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

42

afirmações acrescentando o estado do MT representando a região Centro-Oeste do país

devido sua relação próxima com as amostras do Nordeste.

São necessários mais estudos para uma melhor compreensão da dinâmica de

disseminação do vírus dentro do país e principalmente obter mais sequencias completas do

ZIKV por todas as regiões do Brasil afim de obter conclusões epidemiológicas da circulação

viral no Brasil.

Page 45: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

43

8. CONCLUSÃO

O presente trabalho colabora com a produção de sequencias genômicas do ZIKV no

Brasil principalmente por apresentar sequências do MT, estado que ainda não apresentava

nenhum genoma publicado apesar do surto que ocorreu no estado no ano de 2016, porém

ainda existe a necessidade do sequenciamento de mais genomas nesta região com um número

maior para melhor representatividade, assim como em diversos estados do Brasil que ainda

não apresentam sequencias depositadas.

Nosso trabalho demonstrou que o MT tem relação próxima com as amostras do

Nordeste do Brasil corroborando com a importância do mesmo na disseminação do ZIKV no

Brasil, porém, a compreensão da dinâmica de disseminação do ZIKV dentro do Brasil ainda é

incerta e a necessidade da produção de mais genomas e de análise dos mesmos ainda é

elevada.

Page 46: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

44

REFERÊNCIAS BIBLIOGRÁFICAS

ALMEIDA, R. V. M. Filogenia molecular das enzimas Isocitrato Liase e Malato Sintase e

sua evolução em Viridiplantae. [s.l.] Universidade Federal do Rio Grande do Norte, 2014.

BAUD, D. et al. An update on Zika virus infection. The Lancet, v. 0, n. 0, p. 1–11, jun. 2017.

BESNARD, M. et al. Evidence of perinatal transmission of zika virus, French Polynesia,

December 2013 and February 2014. Eurosurveillance, v. 19, n. 13, p. 1–4, 2014.

BRANTON, D. et al. The potential and challenges of nanopore sequencing. Nature

Biotechnology, v. 26, n. 10, p. 1146–1153, 2008.

BRUYN, A.; MARTIN, D. P.; LEFEUVRE, P. Phylogenetic Reconstruction Methods: An

Overview. In: BESSE, P. (Ed.). . Molecular Plant Taxonomy: Methods and Protocols,

Methods in Molecular Biology. 1115. ed. New York: Springer Science+Business Media,

2014. p. 256–277.

CALDART, E. T. Análise Filogenética: Conceitos Básicos E Suas Utilizações Como

Ferramenta Para a Epidemiologia Molecular De Doenças Virais. [s.l.] Universidade

Federal Do Rio Grande Do Sul, 2009.

CALVET, G. et al. Detection and sequencing of Zika virus from amniotic fluid of fetuses

with microcephaly in Brazil: a case study. The Lancet Infectious Diseases, v. 16, n. 6, p.

653–660, 2016.

CAMPOS, G.; BANDEIRA, A.; SARDI, S. Zika Virus Outbreak, Bahia Brazil. Emerging

Infectious Diseases, v. 21, n. 10, p. 1885–1886, 2015.

CAMPOS, T. D. L. et al. Revisiting Key Entry Routes of Human Epidemic Arboviruses into

the Mainland Americas through Large-Scale Phylogenomics. International Journal of

Genomics, 2018.

CAO-LORMEAU, V.-M. et al. Guillain-Barré Syndrome outbreak associated with Zika virus

infection in French Polynesia: a case-control study. The Lancet, v. 387, n. 1, p. 1531–1539,

2016.

CUGULA, F. R. et al. The Brazilian Zika virus strain causes birth defects in experimental

models. v. 534, n. 7606, p. 267–271, 2016.

CUNHA, M. S. et al. First complete genome sequence of the Zika virus released. Genome

Announcements, v. 4, n. 2, p. 1–2, 2016.

DE SOUZA, F. A. L. Detecção e Identificação Elétrica dos Nucleotídeos do DNA via

Nanoporo Híbrido de Grafeno e Nitreto de Boro Hexagonal: Um Estudo Teórico. [s.l.]

Universidade Federal do Espírito Santo, 2017.

DICK, G. W. A. Epidemiological Notes on Some Viruses Isolated in Uganda (Yellow fever,

Rift Valley fever, Bwamba fever, West Nile, Mengo, Semliki forest, Bunyamwera I Ntaya,

Uganda S and Zika viruses) BY. ROYAL SOCIETY OF TROPICAL MEDICINE AND

HYGIENE, v. 47, n. 1, p. 13–48, 1952.

DICK, G. W. A.; KITCHEN, S. F.; ADDOW, A. J. ZIKA VIRUS (I). ISOLATIONS AND

SEROLOGICAL SPECIFICITY. TRANSACTIONS OF THE ROYAL SOCIETY OF

TROPICAL MEDICINE AND HYGIENE, v. 46, n. 5, p. 509–520, 1952.

DOS SANTOS, T. et al. Zika Virus and the Guillain-Barre Syndrome - Case Series from

Page 47: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

45

Seven Countries. The New England Journal of Medicine, v. 375, n. 16, p. 1598–1601,

2016.

DUFFY, M. et al. Zika Virus Outbreak on Yap Island, Federated States of Micronesia. The

New England Journal of Medicine, v. 360, n. 24, p. 2536–2543, 2009.

FARIA, N. R. et al. Zika virus in the Americas: Early epidemiological and genetic findings.

Science, v. 1126, n. 5036, p. 1–10, 2016.

FARIA, N. R. et al. Establishment and cryptic transmission of Zika virus in Brazil and the

Americas. Nature, v. 546, n. 7658, p. 406–410, 2017a.

FARIA, N. R. et al. Epidemic establishment and cryptic transmission of Zika virus in Brazil

and the Americas. BioRxiv, p. 1–39, 2017b.

FAYE, O. et al. Molecular Evolution of Zika Virus during Its Emergence in the 20th Century.

PLoS Neglected Tropical Diseases, v. 8, n. 1, p. 36, 2014.

FELSENSTEIN, J. Inferring phylogenies. Sunderland: Sinauer Associates, 2004.

FENG, Y. et al. Nanopore-based fourth-generation DNA sequencing technology. Genomics,

Proteomics and Bioinformatics, v. 13, n. 1, p. 4–16, 2015.

FOY, B. D. et al. Probable Non-Vector-borne Transmission of Zika Virus, Colorado, USA.

Emerging Infectious Diseases, v. 17, n. 5, p. 880–882, 2011.

FYTA, M. Threading DNA through nanopores for biosensing applications. Journal of

Physics Condensed Matter, v. 27, n. 27, p. 1–18, 2015.

GARDY, J.; LOMAN, N. J.; RAMBAUT, A. Real-time digital pathogen surveillance — the

time is now. Genome Biology, v. 16, n. 1, p. 155, 2015.

GREGORY, T. R. Understanding Evolutionary Trees. Evolution: Education and Outreach,

v. 1, n. 2, p. 121–137, 2008.

GRUBAUGH, N. D. et al. Genomic epidemiology reveals multiple introductions of Zika

virus into the United States. Nature, v. 546, n. 7658, p. 401–405, 2017.

HENNESSEY, M.; FISCHER, M.; STAPLES, J. E. Zika Virus Spreads to New Areas —

Region of the Americas, May 2015–January 2016. MMWR. Morbidity and Mortality

Weekly Report, v. 65, n. 3, p. 1–4, 22 jan. 2016.

HOULDCROFT, C. J.; BEALE, M. A.; BREUER, J. Clinical and biological insights from

viral genome sequencing. Nature Reviews Microbiology, v. 15, n. 3, p. 183–192, 2017.

IBGE. Mato Grosso - Brasil. Disponível em:

<https://cidades.ibge.gov.br/brasil/mt/panorama>. Acesso em: 27 jul. 2018a.

IBGE. Tocantins - Brasil. Disponível em: <https://cidades.ibge.gov.br/brasil/to/panorama>.

Acesso em: 27 jul. 2018b.

IBGE. Distrito Federal - Brasil. Disponível em:

<https://cidades.ibge.gov.br/brasil/df/panorama>. Acesso em: 27 jul. 2018c.

KASIANOWICZ, J. J. et al. Characterization of individual polynucleotide molecules using a

membrane channel. Proc. Natl. Acad. Sci. U.S.A., v. 93, n. November, p. 13770–13773,

1996.

Page 48: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

46

KATOH, K.; STANDLEY, D. M. MAFFT multiple sequence alignment software version 7:

Improvements in performance and usability. Molecular Biology and Evolution, v. 30, n. 4,

p. 772–780, 2013.

KINDHAUSER, M. et al. Zika: the origin and spread of a mosquito-borne virus. Bull World

Health Organization, v. 94, n. 0, p. 675–686, 2016.

LANCIOTTI, R. S. et al. Phylogeny of zika virus in western Hemisphere, 2015. Emerging

Infectious Diseases, v. 22, n. 5, p. 933–935, 2016.

LANGDALE, J. A.; HARRISON, C. J. A step by step guide to phylogeny reconstruction.

The Plant Journal, v. 45, n. 0, p. 561–572, 2006.

LOMAN, N. J.; WATSON, M. Successful test launch for nanopore sequencing. Nature

Methods, v. 12, n. 4, p. 303–304, 2015.

MACNAMARA, F. N. Zika virus: A report on three cases of human infection during an

epidemic of jaundice in Nigeria. Transactions of the Royal Society of Tropical Medicine

and Hygiene, v. 48, n. 2, p. 139–145, 1954.

MALLET, H.-P.; VIAL, A. L.; MUSSO, D. Bilan de l’épidémie à virus Zika survenue en

Polynésie française entre octobre 2013 et mars 2014. De la descriotion de l’épidémie aux

connaissances acquises après l’évènement. Bulletin hebdomadaire epidemiologique 20-21,

v. 20–21, n. 0, p. 367–373, 2016.

MARTINES, R. B. et al. Notes from the Field: Evidence of Zika Virus Infection in Brain and

Placental Tissues from Two Congenitally Infected Newborns and Two Fetal Losses — Brazil,

2015. Morbidity and Mortality Weekly Report 1Infectious, v. 65, n. 6, p. 159–160, 2016.

METSKY, H. C. et al. Zika virus evolution and spread in the Americas. Nature, v. 546, n.

7658, p. 411–415, 2017.

MINISTÉRIO DA SAÚDE. Boletim Epidemiológico - Monitoramento dos casos de

microcefalia no Brasil até a Semana Epidemiológica 50. Disponível em:

<http://portalarquivos2.saude.gov.br/images/pdf/2015/dezembro/28/2015-boletim-

microcefalia-se50-vol46-n46.pdf>. Acesso em: 27 jul. 2018.

MINISTÉRIO DA SAÚDE. Boletim Epidemiológico. Monitoramento dos casos de

dengue, febre de chikungunya e febre pelo vírus Zika até a Semana Epidemiológica 27,

2016 Dengue. Disponível em:

<http://portalarquivos2.saude.gov.br/images/pdf/2016/agosto/10/2016-026--2-..pdf>. Acesso

em: 27 jul. 2018.

MINISTÉRIO DA SAÚDE. Boletim Epidemiológico - Monitoramento integrado de

alterações no crescimento e desenvolvimento relacionadas à infecção pelo vírus Zika e

outras etiologias infecciosas, da Semana Epidemiológica 45/2015 até a Semana

Epidemiológica 02/2017. Disponível em:

<http://portalarquivos2.saude.gov.br/images/pdf/2017/fevereiro/27/2017_003.pdf>. Acesso

em: 27 jul. 2018.

MLAKAR, J. et al. Zika Virus Associated with Microcephaly. New England Journal of

Medicine, v. 374, n. 10, p. 951–958, 2016.

MUSSO, D. et al. Potential for Zika virus transmission through blood transfusion

demonstrated during an outbreak in French Polynesia, November 2013 to February 2014.

Eurosurveillance, v. 19, n. 14, p. 1–3, 2014.

Page 49: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

47

MUSSO, D.; CAO-LORMEAU, V. M.; GUBLER, D. J. Zika virus: following the path of

dengue and chikungunya? The Lancet, v. 386, n. 9990, p. 243–244, 2015.

MUSSO, D.; GUBLER, D. J. Zika Virus. Clinical Microbiology Reviews, v. 29, n. 3, p.

487–524, 2016.

NACCACHE, S. N. et al. Distinct zika virus lineage in Salvador, Bahia, Brazil. Emerging

Infectious Diseases, v. 22, n. 10, p. 1788–1792, 2016.

NEI, M.; KUMAR, S. Molecular evolution and phylogenetics. New York, NY: Oxford

University Press, 2000.

NG, P. C.; KIRKNESS, E. F. Whole Genome Sequencing. Methods in Molecular Biology,

v. 628, n. 0, p. 215–226, 2010.

O’DONNELL, C. R.; WANG, H.; DUNBAR, W. B. Error analysis of idealized nanopore

sequencing. Electrophoresis, v. 34, n. 15, p. 2137–2144, 2013.

PAGE, R. D. M.; HOLMES, E. C. Molecular Evolution: A Phylogenetic Approach.

Malden, MA: Blackwell Publishing, 1998.

PAN AMERICAN HEALTH ORGANISATION. Neurological syndrome, congenital

malformations, and Zika virus infection. Implications for public health in the Americas. Pan

American Health Organization, p. 1–11, 2015.

PARRA, B. et al. Guillain–Barré Syndrome Associated with Zika Virus Infection in

Colombia. New England Journal of Medicine, v. 375, n. 16, p. 1513–1523, 2016.

PASSEMARD, S.; KAINDL, A. M.; VERLOES, A. Microcephaly. In: DULAC, O.;

LASSONDE, M.; SARNAT, H. B. (Eds.). . Handbook of Clinical Neurology. 3. ed. [s.l.]

Elsevier B.V., 2013. v. 111p. 129–141.

PETERSEN, L. R. et al. Zika Virus. New England Journal of Medicine, v. 374, n. 16, p.

1552–1563, 2016.

PLOURDE, A. R.; BLOCH, E. M. A Literature Review of Zika Virus. Emerging Infectious

Diseases, v. 22, n. 7, p. 1185–1192, 2016.

QUICK, J. et al. Multiplex PCR method for MinION and Illumina sequencing of Zika and

other virus genomes directly from clinical samples. NATURE PROTOCOLS, v. 12, n. 6, p.

1261–1276, 2017.

RAMBAUT, A. et al. Posterior Summarization in Bayesian Phylogenetics Using Tracer 1.7.

Systematic Biology, v. 00, n. 0, p. 1–3, 2018.

SAMPATHKUMAR, P.; SANCHEZ, J. L. Zika Virus in the Americas: A Review for

Clinicians. Mayo Clinic Proceedings, v. 91, n. 4, p. 514–521, 2016.

SES-DF. Informativo Epidemiológico Dengue, Chikungunya e Zika. Disponível em:

<http://www.saude.df.gov.br/wp-conteudo/uploads/2018/04/Informativo_n_01_2018.pdf>.

Acesso em: 27 jul. 2018.

SES-MT. Boletim Epidemiológico Dengue, Febre de Chikungunya e Febre pelo vírus

Zika. Disponível em: <http://www.saude.mt.gov.br/suvsa/arquivos/526/boletins-

epidemiologicos?p=ZIKA>. Acesso em: 27 jul. 2018.

SES-TO. Zika : Relatório do Monitoramento (1a a 52a semana epidemiológica de 2017).

Page 50: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

48

Disponível em: <https://central3.to.gov.br/arquivo/388001/>. Acesso em: 27 jul. 2018.

SHUKLA, S. et al. Rapid Detection Strategies for the Global Threat of Zika Virus: Current

State, New Hypotheses, and Limitations. Frontiers in Microbiology, v. 7, n. 1, p. 1–15,

2016.

SUCHARD, M. A. et al. Bayesian phylogenetic and phylodynamic data integration using

BEAST 1.10. Virus Evolution, v. 4, n. 1, p. 1–5, 2018.

TANG, H. et al. Zika Virus Infects Human Cortical Neural Precursors and Attenuates Their

Growth. Cell Stem Cell, v. 18, n. 5, p. 587–590, 2015.

THÉZÉ, J. et al. Genomic Epidemiology Reconstructs the Introduction and Spread of Zika

Virus in Central America and Mexico. Cell Host and Microbe, p. 855–864, 2018.

VAN DOORN, P. A.; RUTS, L.; JACOBS, B. C. Clinical features, pathogenesis, and

treatment of Guillain-Barré syndrome. The Lancet Neurology, v. 7, n. 10, p. 939–950, 2008.

VIRALZONE. Zika virus. Disponível em:

<http://viralzone.expasy.org/6756?outline=all_by_species>. Acesso em: 22 ago. 2017.

YOKOYAMA, S.; STARMER, W. T. Possible Roles of New Mutations Shared by Asian and

American Zika Viruses. Molecular Biology and Evolution, v. 34, n. 3, p. 525–534, 2017.

YUAN, L. et al. A single mutation in the prM protein of Zika virus contributes to fetal

microcephaly. Science, v. 7120, n. 1126, p. 1–8, 2017.

YUN, S.-I. et al. Complete Genome Sequences of Three Historically Important,

Spatiotemporally Distinct, and Genetically Divergent Strains of Zika Virus: MR-766, P6-740,

and PRVABC-59. Genome Announcements, v. 4, n. 4, p. e00800-16, 2016.

ZANLUCA, C. et al. First report of autochthonous transmission of Zika virus in Brazil.

Memorias do Instituto Oswaldo Cruz, v. 110, n. 4, p. 569–572, 2015.

ZUKERKANDL, E.; PAULING, L. Molecules as documents of evolutionary history.

Journal of Theoretical Biology, v. 8, n. 1, p. 357–366, 1965.

Page 51: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

49

ANEXO I – CONJUNTO DE PRIMERS UTILIZADOS NA PCR MULTIPLEX

Conjunto de Primers 1

Conjunto de Primers 2

Primers indicados com * (um asterisco) devem estar na concentração de 50µM e

Primers indicados com ** (dois asteriscos) devem estar na concentração de 100µM para

normalizar a cobertura do sequenciamento.

Page 52: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

50

ANEXO II – ARTIGO SUBMETIDO PARA A REVISTA ARCHIVES OF

VIROLOGY (ANNOTATED SEQUENCE)

Nanopore sequencing of a novel bipartite New World Begomovirus species infecting

cowpea (Vigna unguiculata)

Fernanda Y. B. Naito1; Fernando L. Melo1*; Maria Esther N. Fonseca2, Carlos A. F.

Santos3; Carolina R. Chanes4, Bergmann M. Ribeiro1, Robert L. Gilbertson5, Leonardo

S. Boiteux1,2 & Rita de Cássia Pereira-Carvalho1

1Universidade de Brasília (UnB), Brasília–DF, Brazil;

2National Center for Vegetable Crops Research (CNPH), Embrapa Vegetable Crops, Brasília–

DF, Brazil.

3Embrapa Semi-Arid, Petrolina–PE, Brazil.

4Universidade Católica de Brasília, Brasília–DF, Brazil.

5University of California, Davis, USA.

*Author for correspondence: [email protected]

Page 53: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

51

Abstract

A new bipartite Begomovirus species was detected on cowpea plants exhibiting leaves with

bright golden mosaic symptoms under field conditions in Brazil. Consensus sequences of the

complete DNA-A and DNA-B components of an isolate of the virus (PE–088) was obtained

by nanopore sequencing and confirmed by Sanger sequencing. The genome organization

displayed typical features of New World (NW) begomoviruses. Pairwise sequence

comparisons revealed low levels of identity with other Begomovirus species previously

reported infecting cowpea around the world. Phylogenetic analysis of the complete sequences

of DNA-A components from an array of closely related begomoviruses revealed that the

closest relatives of PE–088 (85-87% nucleotide sequence identities) were three legume-

infecting begomoviruses from Brazil: Bean golden mosaic virus, Macroptilium common

mosaic virus and Macroptilium yellow vein virus. According to the current classification

criteria, PE–088 represents a new species in the genus Begomovirus. We tentatively named

this species as Cowpea bright yellow mosaic virus (CoBYMV) to designate isolates that are

inducing bright golden leaf mosaic symptoms in cowpea across major producing areas of

Brazil.

Page 54: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

52

Whitefly-transmitted geminiviruses (family Geminiviridae genus Begomovirus) are of

great economic relevance in many tropical and subtropical regions [1]. In terms of legumes

and pulses, begomovirus diseases cause more often economic problems in common beans

(Phaseolus vulgaris L.) in the New World (NW) [2] and in mung beans (Vigna radiata L.

Wilkeezek) in the Old World (OW) [1]. However, to date, begomovirus-induced diseases

have not been a major problem in cowpea [Vigna unguiculata (L.) Walp.] crop worldwide.

Although at least eight begomoviruses have been characterized to various degrees in

association with cowpea, there is a need for further studies on the potential importance of

begomovirus diseases in this crop and to better understand their diversity across distinct

geographic areas. The need for further characterization is evidenced by the fact that a same

name – Cowpea golden mosaic virus (CGMV) has been given to unrelated viruses from India

(GenBank AY618902), from Nigeria (AF029217), and from a partially characterized

Brazilian isolate (AF188708). The isolate from India is actually Mungbean yellow mosaic

India virus (MYMIV), based on having 98% sequence identity to isolates of this virus.

Cowpea is the most important legume crop in the Brazilian semiarid region [3].

Cowpea yields in Brazil can be severely affected by a “golden leaf mosaic disease” associated

with a begomovirus that has not been fully characterized. Here, we describe a novel bipartite

Begomovirus species infecting cowpea in Brazil.

Cowpea leaf samples without and with conspicuous begomovirus-like symptoms

(bright yellow/golden mosaic) were collected in commercial fields in Petrolina in Pernambuco

State, Brazil (Latitude: 09º 23’ 55’’S / Longitude: 40º 30’03’’ W and 376 meters above sea

level) in 2011. The disease incidence in this area was about 30%. Total DNA was extracted

from single representative leaf samples (1g each) using 2X CTAB buffer followed by rolling

circle amplification (RCA) [4]. These DNA samples were used as templates in PCR assays

with the degenerate begomovirus primer pairs designed to direct the amplification of genomic

segments of the DNA-A and DNA-B components [5]. Amplicons of expected-size of DNA

fragments of 1.1 kb (DNA-A) and 0.5 kb (DNA-B) were observed in agarose gel

electrophoresis only in samples exhibiting bright yellow (golden) mosaic symptoms (Fig.

1A).

The complete genome of the PE–088 isolate was obtained by nanopore sequencing

with the Ligation Sequencing Kit 1D (Oxford Nanopore Technologies) following

manufacturer’s instructions. Briefly, the RCA product was mixed with the NEBNext® Ultra™

II End Repair/dA-Tailing Module (New England Biolabs) and incubated for 5 min at 20˚C for

end-repair reaction, and then 5 min at 65˚C for dA-tailing reaction, followed by purification

Page 55: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

53

with AMPure XP beads (Beckman Coulter) according to manufacturer’s instructions.

Blunt/TA Ligase Master Mix (New England Biolabs) was used to ligate native barcode

adapters (NB01) to end prepared DNA for 10 min at room temperature, and then purified

using AMPure XP beads. Four barcoded samples from diverse sources (insect and human

viruses) were pooled and the adapter ligation and tethering were then carried out with Adapter

Mix (Oxford Nanopore Technologies) and NEB Blunt/TA ligation Master Mix (New England

Biolabs). The adapter-ligated DNA library was then purified with AMPure beads, followed by

the addition of Adapter Bead binding buffer (Oxford Nanopore Technologies), and finally

eluted in Elution Buffer. Each R9 flow cell was primed with 1,000 µL of a mixture Running

Buffer with Fuel (RBF) and nuclease-free water. Then 12 µL of the library was diluted in 35

µL RBF, 25.5 µL of Library Loading Beads, and 2.5 μL nuclease-free water and loaded onto

a Spot-on flowcell (FLO-MIN106) (Oxford Nanopore Technologies) on a MinION Mk1B

(Oxford Nanopore Technologies). The raw FAST5 reads were uploaded to the online server

for base calling through the Metrichor EPI2ME platform. The basecalled MinION reads were

converted to FASTQ and assembled with Canu v1.7 [6]. The resulting assembly was polished

using Nanopolish v0.9.0 [7], to improve the accuracy of the consensus sequences. The

resulting contigs were translated and compared to the viral protein RefSeq database with

Blastx [8] implemented in Geneious version 9.1.2 [9]. The assembled contigs of the putative

complete DNA-A and DNA-B components (corresponding to a putative new species present

in our cowpea samples) were manually annotated and deposited in GenBank (accessions

MH469731 and MH469732). The complete DNA-A sequence was confirmed by Sanger

sequencing, as previously described [10].

The PE–088 DNA-A component is 2,632 nt and exhibited all major characteristics of

NW begomoviruses, including the virion-sense gene (AV1) and the five complementary sense

(AC1, AC2, AC3, AC4, and AC5) genes (Fig. 1B). The DNA-B genome is 2,593 nt and

harbored genes homologous to BV1 and BC1 (Fig. 1B). The common region (CR) was

identified by comparing the DNA-A and DNA-B sequences and it was 241 nt in size. The CR

possessed its functional elements, including the conserved hairpin containing stem-loop, the

conserved TAATATTAC nonanucleotide as well as repeated sequences (‘iterons”) (Fig. 1C

and 1D). Interestingly, the common region includes 93 nt of Rep coding region (Fig. 1B and

1C), which in DNA-B forms a small ORF (31 aa) encoding a Rep-like peptide with conserved

motif I of Rep proteins (Fig. 1D). Short Rep homologous sequences (sRepHS) were described

in some begomoviruses and could be involved in the posttranscriptional regulation of the

cognate viral Rep gene [11].

Page 56: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

54

The BLASTn analyses of the complete DNA-A sequence revealed 86% nt identity of

the isolate PE–088 with Macroptilium common mosaic virus (MacCMV) from North-East

Brazil. Moreover, a partial genomic sequence (1,365 bp encompassing the Rep associated

protein and CP genes) of a cowpea-infecting begomovirus isolate from Brazil (AF188708),

which was tentatively named CGMV, was 97% identical with that of PE–088 DNA-A.

Furthermore, these sequences of cowpea-infecting begomovirus from Brazil were genetically

distinct (57% nt sequence identity) from two other cowpea-infecting begomoviruses from the

OW: CGMV (AF029217) and MYMIV (AY618902). These results suggest that both

Brazilian isolates (PE-088 and AF188708) represent isolates or variants of a novel viral

species, which is distinct from CGMV and MYMIV.

The complete sequence of the PE–088 DNA-A component was aligned to other related

viral species available in GenBank with MAFFT [12]. A phylogenetic tree was inferred with

FastTree [13] and a pairwise comparison was performed using SDT [14]. The phylogenetic

tree and pairwise comparison heatmap were plotted together with Evolview v2 [15]. PE–088

grouped together with legume-infecting begomoviruses from Brazil: Macroptilium yellow

vein virus (MacCMV) and Bean golden mosaic virus (BGMV) with nucleotide sequence

identities ranging from 85 to 87% (Fig. 2). Bipartite tomato-infecting begomoviruses from the

NW formed a distinct group with a maximum identity of 81% with PE–088.

DNA-A genome pairwise identities of 91% and 94% are currently accepted as the

demarcation thresholds for distinct species and strains, respectively for members of the genus

Begomovirus [1]. Therefore, PE–088 is a new bipartite species for which was the name

Cowpea bright yellow mosaic virus (CoBYMV) is proposed. The characterization of this

novel cowpea-infecting begomovirus species is important for better understand the nature of

these viruses in Brazil. More nationwide surveys are needed in order to establish CoBYMV as

a major economic problem for the cowpea crop in Brazil as well as to guide resistance

breeding programs. For that will be necessary to fulfill Koch’s Postulates with the

development of infectious clones and an agroinoculation method for screening cowpea

germplasm collection in search for natural sources of genetic resistance to CoBYMV. Our

work also demonstrated, for the first time, that a portable nanopore sequencing device can be

an alternative tool for characterization of plant virus genomes in a very accurate and rapid

way.

Page 57: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

55

References

1. Brown JK, Zerbini FM, Navas-Castillo J, Moriones E, Ramos-Sobrinho R, Silva JCF,

Fiallo-Olivé E, Briddon RW, Hernández-Zepeda C, Idris A, Malathi VG, Martin DP, Rivera-

Bustamante R, Ueda S, Varsani A (2015) Revision of Begomovirus taxonomy based on

pairwise sequence comparisons. Arch Virol 160:1593–1619

2. Faria JC, Aragão FJL, Souza TLPO, Quintela ED, Kitajima EW, Ribeiro SG (2016).

Golden mosaic of common beans in Brazil: management with a transgenic approach. APS

Features. doi:10.1094/APSFeature-2016-10.

3. Santos CAF, Boiteux LS (2013) Breeding biofortified cowpea lines for semi-arid tropical

areas by combining higher seed protein and mineral levels. Gen Mol Res 12: 6782–6789

4. Inoue-Nagata AK, Albuquerque LC, Rocha WB, Nagata T (2004) A simple method for

cloning the complete begomovirus genome using the bacteriophage φ29 DNA polymerase. J.

Virol. Methods 116: 209–211

5. Rojas MR, Gilbertson RL, Russel DR, Maxwell DP (1993) Use of degenerate primers in

the polymerase chain reaction to detect whitefly-transmitted geminiviruses. Plant Dis 77:

340–334.

6. Koren S, Walenz BP, Berlin K, Miller JR, Bergman NH, Phillippy AM (2017) Canu:

scalable and accurate long-read assembly via adaptive k-mer weighting and repeat separation.

Genome research 27:722-736.

7. Loman NJ, Quick J, Simpson JT (2015) A complete bacterial genome assembled de novo

using only nanopore sequencing data. Nature Methods 12:733-735.

8. Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (1990) Basic Local Alignment

Search Tool. J. Mol. Biol. 215:403-410.

9. Kearse M, Moir R, Wilson W, Stones-Havas S, Cheung M, Sturrock S, Buxton S, Cooper

A, Markowitz S, Duran C, Thierer T, Ashton B, Meintjes P, Drummond A (2012) Geneious

Basic: An integrated and extendable desktop software platform for the organization and

analysis of sequence data. Bioinformatics 28:1647-1649.

10. Patel VP, Rojas MR, Paplomatas EJ, Gilbertson RL (1993) Cloning biologically active

geminivirus DNA using PCR and overlapping primers. Nuc. Acids Res. 21: 1325–1326.

11. Gregorio-Jorge J, Bernal-Alcocer A, Bañuelos-Hernández B, Alpuche-Solís AG,

Hernández-Zepeda C, Moreno-Valenzuela O, Frías-Treviño G, Argüello-Astorga GR (2010)

Analysis of a new strain of Euphorbia mosaic virus with distinct replication specificity

unveils a lineage of begomoviruses with short Rep sequences in the DNA-B intergenic region.

Virol. J. 7: 275.

12. Katoh K, Misawa K, Kuma K, Miyata T (2002) MAFFT: a novel method for rapid

multiple sequence alignment based on fast Fourier transform. Nucleic Acids Res. 30:3059–

3066.

13. Price MN, Dehal PS, Arkin AP (2009) FastTree: computing large minimum evolution

trees with profiles instead of a distance matrix. Mol. Biol. Evol. 26:1641–1650.

Page 58: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

56

14. Muhire BM, Varsani A, Martin DP (2014) SDT: A Virus Classification Tool Based on

Pairwise Sequence Alignment and Identity Calculation. PLoS One 9: e108277.

15. He Z, Zhang H, Gao S, Lercher MJ, Chen WH, Hu S (2016) Evolview v2: an online

visualization and management tool for customized and annotated phylogenetic trees. Nucleic

Acids Research. 44: W236-W241.

Page 59: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

57

Figure Legends

Fig. 1. (A) Symptoms of bright yellow mosaic in cowpea (Vigna unguiculata) in a

commercial field in Petrolina-PE, Brazil. (B) Cowpea bright yellow mosaic virus (PE-088)

genome organization, including the common region and the stem loop/. (C) DNA-A and

DNA-B common regions showing where the Rep ORF starts, the GGKGT core, TATA

region, stem loop and nonanucleotide. The asterisks show the differing nucleotides between

DNA-A and DNA-B. (D) Rep Iteron-Related domain showing motif I in the DNA-A and

DNA-B genomes.

Fig. 2. Maximum-likelihood tree and nucleotide pairwise identity comparison of CoBYMV

related begomoviruses. Both analyses were performed using DNA-A component. The tree is

midpoint rooted for clarity. The branch support was assessed by a Shimodaira-Hasegawa-like

test and values >90 are indicated by black dots.

Page 60: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

58

Figure 1

Page 61: SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE

59

Figure 2