pró-reitoria de graduação curso de biomedicina trabalho de conclusão de curso · 2017-01-17 ·...

34
Pró-Reitoria de Graduação Curso de Biomedicina Trabalho de Conclusão de Curso SEQUENCIAMENTO DO GENOMA COMPLETO DE UM ISOLADO DE SAPOVIRUS NO DISTRITO FEDERAL, BRASIL Autor: Karoline dos Anjos Orientador: Dr. PhD. Tatsuya Nagata Brasília - DF 2010

Upload: nguyenkien

Post on 11-Nov-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Pró-Reitoria de Graduação Curso de Biomedicina

Trabalho de Conclusão de Curso

SEQUENCIAMENTO DO GENOMA COMPLETO DE UM

ISOLADO DE SAPOVIRUS NO DISTRITO FEDERAL, BRASIL

Autor: Karoline dos Anjos Orientador: Dr. PhD. Tatsuya Nagata

Brasília - DF 2010

KAROLINE DOS ANJOS

SEQUENCIAMENTO DO GENOMA COMPLETO DE UM ISOLADO DE SAPOVIRUS NO DISTRITO FEDERAL, BRASIL

Projeto apresentado ao curso de

graduação em Biomedicina da

Universidade Católica de Brasília como

trabalho de conclusão de curso

apresentado à disciplina TCC II.

Orientador: Dr. PhD. Tatsuya Nagata.

Brasília 2010

Monografia de autoria de Karoline dos Anjos, intitulada “Sequenciamento do

genoma completo de um isolado de Sapovirus no Distrito Federal, Brasil”,

apresentado como requisito parcial para a obtenção do grau de Bacharel em

Biomedicina da Universidade Católica de Brasília, em 14 de junho de 2010,

aprovada pela banca examinadora abaixo assinada:

____________________________________________________

Prof. Dr. PhD Tatsuya Nagata

Orientador

Curso de Biologia Molecular – UnB

_____________________________________________________

Prof. Msc. Lidia Maria Pinto de Lima

Curso de Biomedicina – UCB

____________________________________________________

Prof. Dr.ª PhD Paula Andréia Silva

Curso de Biomedicina – UCB

Brasília

2010

ii

RESUMO

REFERÊNCIA: ANJOS, Karoline dos. Sequenciamento do genoma completo de um isolado de Sapovirus no Distrito Federal, Brasil. 2010. Trabalho de conclusão de curso de Bacharel em Biomedicina – Universidade Católica de Brasília, Brasília, 2010.

Sapporo virus é um membro do gênero Sapovirus da família Caliciviridae, é um agente causador de gastrenterite aguda. Seu genoma é linear, de senso positivo, ssRNA, com tamanho de cerca de 7,5 kb, poliadenilado na região terminal 3 '. Sapporo virus é dividido atualmente em cinco genogrupos (GI-GV), sendo que um genogrupo específico de suínos (GIII). No Brasil, sabe-se que os vírus que mais causam gastrenterites são os rotavírus e norovírus, ao passo que a ocorrência de sapovírus parece ser esporádica. No Distrito Federal, um sapovírus foi encontrado recentemente por RT-PCR de uma amostra fecal, visando amplificar parte do gene da proteína do capsídeo. A fim de identificar o genótipo do sapovírus isolado, o fragmento de DNA amplificado por RT-PCR foi sequenciado utilizando primers específicos para sapovírus na Plataforma de Sequenciamento da Universidade Católica de Brasília. O sapovírus isolado do DF foi identificado como genótipo 2 de genogrupo I. A análise filogenética foi realizada com esta região. Decidiu-se então sequenciar o genoma completo por clonagem dividindo em duas regiões genômicas. Primeiro a região 5’ e segundo a região 3’. Após o sequenciamento utilizando a técnica de primer walking, comparou-se os resultados com todas as sequências de genoma completo de Sapporo virus encontradas no GenBank, encontrando uma semelhança de 72% entre o sapovírus do DF com um sapovírus japonês (número de acesso HM002617). Palavras-chave: sapovírus, calicivírus, epidemiologia molecular.

iii

ABSTRACT

Sapporo virus is a member of the genus Sapovirus within Caliciviridae family, and a causative agent of acute gastroenteritis. The Sapporo virus genome is linear, positive-sense, single-strand RNA, of approximately 7,5kb that is polyadenylated at the 3’ terminus. Sapporo virus is divided in at least five genogroups, whereas GIII is a porcine infecting one. In Brazil it is known that the most causative gastroenteritis viruses are rotavirus and norovirus, whereas the occurrence of sapovirus seems sporadic. In the Federal District, a sapovirus was found recently by RT-PCR targeting partial capsid protein gene from stool sample. In order to identify the genotype of this sapovirus isolate, the amplified DNA fragment by RT-PCR was projected to direct-sequencing using specific primers to sapovirus at Sequence Platform of Catholic University of Brasília. The DF sapovirus isolate was identified as genotype 2 of Genogroup I. The phylogenetic analysis was done using this genomic region. Then it has been decided to sequence the complete genome by cloning in divided two genomic regions. First 5’ region and second 3’ region. After sequencing using primer walking the results were compared with all human Sapporo virus complete genome sequences deposited in GenBank, it has been founded 72% of similarity between DF sapovirus and one Japanese (access number HM002617). Key-words: sapovirus, calicivirus, molecular epidemiology.

iv

LISTA DE ILUSTRAÇÕES

Figura 1 – Partículas de sapovírus de extrato fecal. Evidência da conformação em estrela de Davi.

9

Figura 2 – Alinhamento múltiplo de genoma dos sapovírus e estratégia de escolha de sequenciamento de oligonucleotídeos.

15

Figura 3 – Árvore filogenética baseada na sequência da região do capsídeo de Sapovirus utilizando neighbor-joining, para a determinação do genogrupo encontrado no DF.

18

Figura 4 – Resultado da PCR da região 5’ do isolado de sapovírus encontrado no DF. O resultado da amplificação é de 3500pb.

19

Figura 5 – Resultado da PCR da região 3’ do isolado de sapovírus encontrado no DF. O resultado da amplificação é de 3900pb.

19

Figura 6 – Árvore filogenética comparando a sequência encontrada no Distrito Federal com onze sequências de genoma completo depositadas no GenBank seguidas de alinhamento pelo ClustalW Mega4.

21

Figura 7 – Análise entre as sequências utilizando o software RDP3Beta42, com o intuito de avaliar possíveis recombinações.

22

v

LISTA DE TABELAS

Tabela 1 – Análise de semelhança (distance pairwise) entre sequências de genoma completo de Sapovirus e o genoma sequenciado no Distrito Federal.

20

vi

SUMÁRIO

RESUMO ii

ABSTRACT iii

LISTA DE ILUSTRAÇÕES iv

LISTA DE TABELAS v

INTRODUÇÃO 7

JUSTIFICATIVA E PERSPECTIVAS 11

OBJETIVOS 13

Objetivos específicos 13

MATERIAL E MÉTODOS 14

Isolado 14

Genotipagem 14

RT-PCR para Sapovirus 15

Clonagem 16

Sequenciamento do genoma completo do Sapovirus 17

Análise do sequenciamento 17

RESULTADOS 18

DISCUSSÃO 23

CONCLUSÃO 24

PERSPECTIVA 24

REFERÊNCIAS BIBLIOGRÁFICAS 25

ANEXOS 27

7

INTRODUÇÃO

A diarréia é um dos sintomas mais comuns de doenças que acometem

crianças nos primeiros anos de vida, sendo causa significante de morbidade e

mortalidade infantil mundialmente [18, 19]. A diarréia em crianças com menos de

cinco anos pode ser considerada grave devido à possibilidade da perda de

fluídos e eletrólitos levá-las mais rapidamente a um estado de desidratação [10].

Mundialmente é estimado que doenças diarréicas resultem em

aproximadamente 1,87 milhões de mortes entre crianças menores de cinco

anos de idade. A maioria dessas mortes ocorre em países emergentes da

África e sudeste da Ásia[16]. A etiologia das diarréias pode envolver vários

agentes como vírus, bactérias e parasitas[7].

Recentemente com melhoria nas condições higiênicas, sanitárias e de

suprimento de água em países emergentes, tem havido uma redução

significativa no número de patógenos bacterianos, e um aumento proporcional

de diarréia em pacientes hospitalizados, que são atribuídas a agentes virais [16,

18].

No Brasil de acordo com o Ministério da Saúde houve óbito de 3,9% de

crianças menores de 5 anos que apresentavam doenças diarréicas no ano

2008, sendo no Distrito Federal a proporção de óbitos de 1,5% [3].

A morbidade associada à diarréia é importante devido ao fato de que

crianças apresentam entre 1 e 10 episódios de diarréia anualmente. Em países

desenvolvidos, assim como no Brasil, sua importância está relacionada ao

impacto da doença na população, traduzido pelos seus danos à saúde,

afetando o desenvolvimento infantil, bem como à sociedade pelos custos

gerados pela demanda aos serviços médicos, atendimento ambulatorial, pronto

atendimento, hospitalizações (custos diretos) e as perdas de dias de trabalho,

de escola, gastos com medicamentos, transportes, etc. (custos indiretos)[7].

Novos organismos têm sido identificados e associados com doenças

diarréicas e outras doenças do trato gastrintestinal. Entre os vírus o Sapovirus

tem sido reconhecido como agente causador desse tipo de patologia,

especialmente em crianças, assim como entre as bactérias, uma cepa

bacteriana de Clostridium difficille tem causado epidemias em diversos países

[18].

8

Os cinco gêneros virais entéricos mais comuns são o Rotavirus (Família

Reoviridae), Norovirus e Sapovirus (Família Caliciviridade), Mastadenovirus

(Adenoviridae) e Mamastrovirus (Astroviridae). Sendo o rotavírus descrito

mundialmente como o principal agente viral causador de gastrenterites [16].

Com o aprimoramento das técnicas de diagnóstico molecular, a

importância dos calicivírus humanos e outros patógenos não descritos

anteriormente, estão se tornando, aparentemente, um grande número de

agentes associados a gastrenterites [18].

Partindo desse ponto sabe-se que a primeira descrição dos calicivírus

entéricos surgiu em 1972, quando amostras envolvidas em surto de diarréia,

numa escola primária nos Estados Unidos foram analisadas em

Imunoeletromicroscopia. O primeiro agente viral isolado foi o Norwalk virus

(Gênero Norovirus). Em 1977, ocorreu outro surto de gastrenterite, porém na

cidade de Sapporo no Japão, onde foi demonstrada, também por microscopia

eletrônica a presença de um vírus morfologicamente semelhante ao Norwalk

virus, que foi denominada Sapporo virus (Gênero Sapovirus) [17].

Os calicivírus são vírus esféricos, pequenos, com um diâmetro de 27 a

40 nm. Seu capsídeo é composto por um único tipo de proteína, a qual exibe

uma simetria icosaédrica com 180 moléculas organizadas em 90 dímeros, que

formam dois domínios: o domínio S e o domínio P. O domínio S forma a parte

interna do capsídeo que envolve o genoma RNA; o domínio P, subdividido nos

domínios P1 e P2, assume, por intermédio deles, uma arquitetura

característica: é visto em forma de cálice pela microscopia eletrônica (ME).

Essa arquitetura é mais aparente nos Sapovirus, conferindo-lhes a aparência

de estrela-de-davi (Figura 1) [1].

9

Figura 1: Partículas de sapovírus de extrato fecal. Evidência da conformação em estrela de Davi

[4].

Os calicivírus são classificados em quatro principais gêneros, Sapovirus,

Norovirus, Lagovirus e Vesivirus, baseados na estrutura e diversidade do

genoma viral. A família Caliciviridae é formada por vírus não envelopados de

RNA, fita simples, senso-positivo, poliadenilados, de tamanho genômico de

aproximadamente 7,3 - 8,3 kb com duas ou três janelas de leitura abertas (ORF

– open reading frame) [14].

Uma importante característica do RNA genômico desses vírus é a

codificação da protease cisteína, “3C-like protease”, na ORF1. A protease é

inicialmente sintetizada como parte da ORF1 e cliva a poliproteína codificada

pela ORF em múltiplas proteínas não estruturais [14]. A proteólise da

poliproteína não estrutural dá origem a uma proteína associada ao genoma

(VPg), a uma helicase, a uma protease e a uma RNA polimerase RNA

dependente [17]. A proteína estrutural que forma o capsídeo é traduzida a partir

de um RNA mensageiro subgenômico codificada pela ORF2.

Dentre os quatro gêneros dos calicivírus, os sapovírus e norovírus, são

os agentes etiológicos de gastrenterites em humanos mais estudados [6].

10

Os norovírus são associados com gastrenterites em todas as idades,

com sazonalidade precisa ligada aos meses de inverno. A maioria dos surtos

de gastrenterites não bacterianas e não causados por rotavírus descritos são

causados por esse gênero [12]. As infecções por sapovírus, tanto em casos

epidêmicos como esporádicos, ocorrem menos frequentemente [16].

Os sapovírus infectam crianças e adultos, têm sido também encontrados

em surtos de gastrenterites em creches, hospitais e escolas primárias. As

informações sobre a epidemiologia e a variabilidade genética desses

patógenos são limitadas, no entanto, sabe-se que infecções por sapovírus em

humanos causam uma gastrenterite de período relativamente curto o que nos

leva a crer que pacientes com breve crise entérica não procuram por atenção

médica. Consequentemente, o estudo destas infecções não tem prioridade [8].

O genoma do sapovírus pode conter tanto duas como três ORFs. As

principais características funcionais da 2C-like NTPase (NTPase), VPg, 3C-like

protease (Pro), 3D-like RNA dependente de RNA polimerase, e a proteína do

capsídeo (VP1) são codificadas na ORF1, que posteriormente é clivada em

proteínas estruturais e não estruturais [13]. A ORF2 (VP2) e ORF3 codificam

proteínas de função ainda desconhecida. Com base na sequência de

nucleotídeos de VP1, os sapovírus foram divididos em cinco genogrupos (GI –

GV), sendo GI, GII, GIV e GV genogrupos que infectam humanos, enquanto

que GIII infecta espécies suínas [11, 20]. Esses genogrupos podem ainda se

subdividirem em genótipos. Recentemente foram identificados diversos

genótipos recombinantes [6]. Isso porque os sapovírus humanos são

geneticamente variáveis, tendo identificados pelo menos 13 “clusters”

genéticos ou genótipos (GI.1 a GI.5, GII.1 a GII.6, GIV.1 e GV.1)[11].

Os métodos de detecção incluem a transcrição reversa e a reação em

cadeia da polimerase (RT-PCR), RT-PCR em tempo real, ensaios

imunoenzimáticos e ELISA [6].

11

JUSTIFICATIVAS E PERSPECTIVAS

Doenças diarréicas são uma importante causa de morbidade e

mortalidade mundialmente, e ocorrem mais frequentemente em crianças

menores de cinco anos de idade. Patógenos virais são os causadores mais

comuns de gastrenterites em comunidades e outros locais, incluindo hospitais.

Os vírus associados a gastrenterites são o grupo rotativírus (espécie A),

calicivírus, astrovírus, e adenovírus. Estes vírus em sua maioria afetam

crianças nos primeiros anos de vida e têm sido descritos como causa comum

de gastrenterites, especialmente em países onde há grandes diferenças sociais

em termos de qualidade da água, higiene, comida e saneamento [20].

Os dois gêneros dos calicivírus, Norovirus e Sapovirus, são relevantes,

sendo o norovírus o segundo agente viral mais associado a gastrenterites

mundiais, e assim possui uma gama de estudos a seu respeito, incluindo a

tentativa ainda não bem sucedida de replicá-lo em células in vitro para o estudo

de seu mecanismo de infecção[5]. Em contrapartida o sapovírus por ser

observado em surtos de forma esporádica, principalmente, em países

desenvolvidos, possui pouca descrição científica a respeito de sua

fisiopatologia.

Atualmente a detecção de agentes virais realizadas no Laboratório

Central de Saúde Pública do Distrito Federal (LACEN-DF) ocorre por meio de

testes rápidos (ELISA) com pesquisa de antígenos em amostras fecais. No

entanto, o teste inserido no processamento de rotina dessas amostras é

específico, apenas, para a identificação de rotavírus.

Com o intuito de ampliar a identificação dos agentes virais causadores

de diarréias no Distrito Federal, foi estudada a possibilidade de inserir a técnica

de RT-PCR Multiplex como método diagnóstico na rotina laboratorial. Por meio

dessa técnica foi possível a detecção de um genótipo de sapovírus.

Após uma breve análise literária sobre o agente viral detectado concluiu-

se que não há estudos específicos na América Latina, ressaltando, assim, a

importância do achado. Partindo desse princípio a realização do

sequenciamento do genoma completo desse genótipo torna-se relevante

cientificamente, pois o conhecimento da mesma possibilitará a comparação

com os isolados dos demais continentes, e consequentemente a sugestão de

12

possíveis recombinações genômicas. O depósito dessa sequência no GenBank

pode ainda favorecer futuras pesquisas sobre a patogenia viral, e identificação

de trechos do genoma associados à antigenicidade, auxiliando no

desenvolvimento de vacinas e conjunto diagnósticos.

13

OBJETIVOS

O presente trabalho tem como objetivo principal o sequenciamento do

genoma completo do sorotipo do Sapporo virus identificado em uma amostra

de fezes diarréica.

Objetivos específicos

1. Desenhar oligonucleotídeos específicos para a amplificação das

regiões 5’ e 3’ do genoma.

2. Amplificar as duas regiões.

3. Ligar o inserto com vetor (pCR 4TOPO) e transformar em bactéria E.

coli (DH5α).

4. Clonar.

5. Confirmar o sequenciamento utilizando o sequenciador automático

ABI377 da Universidade Católica de Brasília.

6. Sequenciar o genoma completo usando a técnica de primer walking.

7. Alinhar a sequência com as demais sequências completas

depositadas no GenBank.

8. Construir árvore filogenética.

9. Analisar possível recombinação gênica.

14

MATERIAL E MÉTODOS

Isolado

Para a detecção da amostra de sapovirus descrita nesse estudo, foi

utilizado inicialmente um protocolo de RT-PCR Multiplex descrito por Yan et al.

(2003)[21], o qual utiliza amostras fecais diarréicas para a detecção de agentes

virais de gastroenterites.

Amostras fecais negativas para rotavírus selecionadas no Laboratório

Central de Saúde Pública do Distrito Federal (LACEN) foram testadas com o

protocolo de RT-PCR Multiplex, sendo uma amostra positiva para o Sapovirus.

Genotipagem

A amostra identificada como positiva para sapovírus foi tratada com

ExoSAP, 6µL do produto de PCR adicionado de 0,5µL de Exonuclease I

(Fermentas) (10U), 1µL Shrinp Alkaline Phosphatase (Fermentas) (1U).

Incubou-se a reação a 37°C 15min em seguida a 85°C 15min. A 2,5µL dessa

reação foi adicionado 1,5µL de oligonucleotídeo SAPO FOR (2µM) (5’-

CTCGCCACCTACRAWGCBTGGTT-3’) foi completado com água MiliQ para

um volume final de 8µL. Essa mistura foi submetida ao sequenciamento com kit

de sequenciamento DYEnamic DNA terminal sequencing kit (GE Lifesciences)

utilizando sequenciador automático de ABI377.

A análise da sequência obtida foi lançada no BLAST

(http://blast.ncbi.nlm.nih.gov/Blast.cgi). Vinte e cinco sequências 15 de

sapovírus foram utilizadas para o alinhamento da amostra detectada.

O resultado do sequenciamento foi analisado com os softwares Staden

Package (http://staden.sourceforge.net/), CLUSTAL-W (http://www.clustal.org/)

e MEGA4 (http://www.megasoftware.net/) com o método neighbor-joining.

15

RT-PCR para Sapovirus

Após essas análises, um novo RT-PCR foi realizado utilizando

oligonucleotídeos específicos para o sapovírus, para que desta forma fosse

sequenciado o genoma completo do vírus.

As sequências de genoma completo do sapovírus foram alinhadas com

o intuito de identificar as regiões mais conservadas. Baseados nesta análise,

oligonucleotídeos foram desenhados para recuperar o genoma inteiro do

sapovírus isolado no DF por RT-PCR.

3’-For 5'- TTT GAA ACT CCM AAC ATC AC -3' gi|51950963|ref|NC_006269.1| AGGGGACATTTGAAACTCCAAACATCACTGTGAATGGGTTCCATGTCAGA 3483

gi|51895344|gb|AY694184.2| AGGGGACATTTGAAACTCCAAACATCACTGTGAATGGGTTCCATGTCAGA 3483

gi|190634644|gb|AY237422.3| AGGGAACGTTTGAAACTCCAAACATCACTGTGAATGGGTTCCATGTCAGA 3483

gi|70799531|gb|DQ058829.1| AAGGAACATATGAAACACCCAACATCACAGTCCAGGGGTACCATCTCAGG 3490

* ** ** * ****** ** ******** ** * **** **** ****

gi|51950963|ref|NC_006269.1| ATAATGAATGGTTACCCAACCAAGAAAGGTGACTGCGGGCTGCCCTATTT 3533

gi|51895344|gb|AY694184.2| ATAATGAATGGTTACCCAACCAAGAAAGGTGACTGCGGGCTGCCCTATTT 3533

gi|190634644|gb|AY237422.3| ATTGTGAATGGTTACCCAACTAAGAAGGGAGACTGTGGACTGCCCTATTT 3533

gi|70799531|gb|DQ058829.1| ATCCTTAATGGTTACCCAACCAAGCGCGGGGATTGCGGGACGCCATATTT 3540

** * ************** *** ** ** ** ** *** *****

5’ Rev 5'- TTC TTR GTT GGG TAA CCA TT -3' gi|51950963|ref|NC_006269.1| CAATTCCAACCGCCAGTTAGTGGCGTTGCACGCCGGCACGGATACACAAG 3583

gi|51895344|gb|AY694184.2| CAATTCCAACCGCCAGTTAGTGGCGTTGCACGCCGGCACGGATACACAAG 3583

gi|190634644|gb|AY237422.3| CAACTCCAACCGCCAGTTGGTGGCGTTGCACGCCGGCACGGACACACAAG 3583

gi|70799531|gb|DQ058829.1| CGACGCCTGCCGCAGACTGGTGGGTTTGCACGCCGCGACTTCCACCAACG 3590

* * ** **** * **** ********** ** ** * *

Figura 2. Alinhamento múltiplo de genoma dos sapovírus e estratégia de escolha de sequenciamento de oligonucleotídeo.

Uma nova extração foi realizada seguida de uma RT para cada região a

ser amplificada. Para a amplificação da extremidade 3’ foram utilizados 10µL

de amostras mais 1µL de oligo DT50 e 1µL de dNTP. Para a extremidade 5’

foram utilizados 10µL de amostras mais 1µL de oligonucleotídeo Sapo 5’ Rev

(5’-TTCTTRGTTGGGTAACCATT-3’) e 1µL de dNTP. As reações foram

incubadas a 75°C 5min, seguidas da adição de 4µL de buffer 10x de

Superscrip III (Invitrogen), 2µL de DTT, 1µL de RNaseOut (Invitrogen) e 1µL de

Superscript III. Ambas as reações foram incubadas a 45°C 60min. Em seguida

foi acrescentado 1µL de RNase H (New England Biolabs, NEB) e novamente

37°C 20min seguida de uma incubação a 75°C 15min.

Para a execução da PCR cada produto de RT foi amplificado com um

par de oligonucleotídeos específicos. A extremidade 3’ foi amplificada utilizando

16

o par de oligonucleotídeos Sapo 3’ For (5'- CAG TGG TGA CTA TCA CGG

AAG -3') / M4. A extremidade 5’ foi amplificada utilizando-se o par de

oligonucleotídeos Sapo 5’ Rev / Sapo 5’ For (nomenclatura sugerida

independente da sequência de primers).

Os produto de RT para PCR foram utilizados da seguinte forma, 1µL de

cDNA, 5µL de buffer 5x LongAmp (NEB), 4µL dNTP 2,5mM, 1µL de cada

oligonucleotídeo (forward, Sapo 5’ For e Sapo 3’ For, e reverse, Sapo 5’ Rev e

M4), 1µL de LongAmp, e adição de água MiliQ para completar um volume final

de 25µL.

Os produtos de PCR foram confirmados com eletroforese em gel de

agarose a 1%, corado com brometo de etídio.

Clonagem

Com o objetivo de aumentar as moléculas do produto de PCR com “A-

overhang”, a cada produto de PCR foi adicionado 0,1µL de Taq Polimerase

(NEB) seguido de uma incubação a 70°C 30min. O volume total dessa reação

foi submetido a uma eletroforese em gel de agarose a 1%, corado com violeta

cristal (40µg/mL de água destilada) seguido de eluição e purificação das

bandas positivas presentes no gel.

A purificação do DNA foi realizada utilizando o conjunto comercial (GFX

PCR DNA and Gel Band Purification Kit – GE Healthcare). Em seguida foi feita

a ligação de cada inserto (3’ e 5’) no vetor pCR4 TOPO (Invitrogen). Após a

ligação os resultados da ligação foram transformados em células E. coli cepa

DH5α, por meio de eletroporação.

Foram plaqueados 200µL de cada transformado em meio LB Agar (uma

placa para cada ligação) com canamicina e IPTG. As placas foram incubadas a

37°C overnight.

Após a seleção de quatro clones de cada placa se realizou uma mini

preparação do DNA de acordo com o protocolo de coluna caseira descrito por

Borodina et al (2003)[2] (Anexo 1).

17

Sequenciamento do genoma completo do Sapovirus

Os clones selecionados foram enviados para o sequenciamento no

laboratório da Macrogen (Coreia do Sul).

As amostras enviadas eram o produto de uma mini-preparação por meio

de conjunto comercial (plasmidPrep Mini Spin Kit - GE Healthcare).

O sequenciamento foi realizado na Macrogen utilizando a técnica de

primer walking, na qual um par de oligonucleotídeos é desenhado de acordo

com o resultado da sequência específica do plasmídeo, nesse estudo, para que

dessa forma possa se amplificar regiões posteriores a sequência já

identificada.

Análise do sequenciamento

A análise do genoma completo do isolado de Sapovirus do Distrito

Federal foi realizada por meio de alinhamento múltiplo com doze sequências

depositadas no GenBank. Número de acesso das sequências entre parênteses

Thailand-NongKhai-24 (AY646856.2); Japan-C12 ( AY603425.1); Germany-

Dresden01 (AY694184.2); Thailand-Mc10 (NC_010624.1); Japan-Mc114

(AY237422.3); Japan-Ehime1107 (DQ058829.1); Thailand-SaKaeo-15

(AY646855.2); Thailand-Mc2 (AY237419.2); Japan-Hu1982 (HM002617);

China-Pig-Sav1 (FJ387164.1); Vietnan-norwalk (AF504671); Thailand

(AY237415.2); US-porcine (AF182760.1). Em seguida foi construída uma

árvore filogenética usando o método de neighbor-joinig e por fim uma análise

de recombinação e “distance plot” foi realizada utilizando o software

RDP3Beta42[12].

18

RESULTADOS

Genotipagem

O alinhamento da sequência de parte do gene do capsídeo (434pb) do

isolado de Sapovirus encontrado no Distrito Federal com 24 sequências da

região do capsídeo [15] demonstrou que o isolado pertence ao genogrupo I e

possui o genótipo tipo 2 (Figura 3).

Figura 3: Árvore filogenética baseada na sequência da região do capsídeo de Sapovirus

utilizando o método neighbor-joining, para a determinação do genogrupo encontrado no DF.

19

RT-PCR para Sapovirus

A amplificação de ambas as regiões 3’ e 5’, para a realização da

clonagem, apresentou os resultados de 3950pb e 3500pb, sendo notória a

presença de amplificações inespecíficas na PCR da região 5’, respectivamente

(Figuras 4 e 5).

Figura 4: Resultado da PCR da região 5’ do isolado de sapovírus encontrado no DF. O resultado da amplificação é de 3500pb.

Figura 5: Resultado da PCR da região 3’ do isolado de sapovírus encontrado no DF. O resultado da amplificação é de 3900pb.

20

Sequenciamento do genoma completo

Tabela 1: Análise de distância (distance pairwise) entre sequências de genoma completo de Sapovirus e o genoma sequenciado no Distrito Federal.

Sequências 1 2 3 4 5 6 7 8 9 10 11 1.HM002617

2.FJ387164 0.88480

3.AY646856 0.69666 0.86051

4.AY603425 0.56581 0.83338 0.72632

5.AF182760 0.89963 0.13638 0.87249 .085856

6.AY694184 0.08400 0.88570 0.69388 0.57392 0.90172

7.NC010624 0.57104 0.82436 0.71289 0.16696 0.85042 0.57366

8.AY237422 0.08984 0.88990 0.69542 0.56504 0.90039 0.09722 0.57122

9.DQ058829 0.58074 0.83646 0.71206 0.37192 0.86224 0.58232 0.37006 0.56954

10.AY646855 0.57458 0.83278 0.71793 0.24663 0.85555 0.58061 0.25696 0.58202 0.36840

11.AY237419 0.56903 0.83406 0.72763 0.31242 0.83423 0.57622 0.31642 0.57572 0.41849 0.32947

12.Sapo BR-

DF01

0.35963 0.86460 0.70924 0.59341 0.88836 0.36194 0.59135 0.36250 0.58357 0.59522 0.58825

Foram obtidos os resultados do sequenciamento completo da região 5’,

enquanto que da região 3’ houve amplificação de 3803pb, ou seja, não foi

obtida a sequência da extremidade 3’ somada a cauda adenilada do genoma.

Total de 7403 nt do isolado BR-DF01 foi sequenciado no trabalho. O genoma

possui dois quadros de leitura aberta (ORF) preditos. Uma ORF (ORF1) que

começa em posição 13nt e termina em 6882nt de acordo com a análise do

genoma completo utilizando o software ORF finder

(http://www.ncbi.nlm.nih.gov/projects/gorf/). A segunda ORF começa ainda

dentro de códon de terminação de ORF1 (em 6882nt) e termina 7371nt. Ainda

menos provável ORF (ORF3) também foi detectada no Frame 2 em posição

5180nt a 5669nt. Este sequenciamento obtido foi comparado com os genomas

completos depositados no GenBank, sendo encontradas 15 sequências de

genoma completo e utilizadas apenas onze pela avaliação de semelhança. A

21

partir do alinhamento múltiplo com essas novas sequências uma nova árvore

filogenética foi construída (Figura 6), sendo o Sapo BR-DF01 distante do

isolado HM002617 (Japonês) em 0.35963 (Tabela 1) e enquanto que do

isolado AY694184 (Alemão) em 0.36194. A identidade “pairwise” do isolado

brasileiro com o isolado japonês (HM002617) ou o alemão (AY694184)

mostrou-se em 72%. Entre os isolados HM002617 e AY694184 Há uma

identidade de 92%, o que demonstra que o isolado BR-DF01 é geneticamente

distante de outros.

Figura 6: Árvore filogenética comparando a sequência encontrada no Distrito Federal com doze sequências depositadas no GenBank seguidas de alinhamento pelo ClustalW Mega4.

Com o intuito de se avaliar possíveis recombinações foi utilizado o

software RDP3Beta42[12], utilizando também onze sequências de genoma

completo de Sapovirus e a sequência do Sapovirus isolado do DF com

ausência de 147pb finais da região 3’ (Figura 7). Nessa análise é possível

caracterizar a sequência do DF como similar as sequências japonesa e alemã

em quase toda a região genômica. Pelo padrão de gráfico, a possível

recombinação não foi detectada entre os isolados analisados utilizando o

programa RDP3 Beta42[12].

22

Figura 6: Análise entre as sequências utilizando o software RDP3Beta42, com o intuito de avaliar possíveis recombinações.

23

DISCUSSÃO

A classificação dos calicivírus foi baseada na sequência parcial ou

completa do gene do capsídeo, principalmente pela ausência de um sistema

celular capaz de isolar e diferenciá-los. Esta limitação no cultivo de calicivírus

tem dificultado os estudos sobre as estratégias de replicação desses

importantes patógenos humanos e animais. Uma abordagem alternativa aos

estudos baseados em células baseou-se na caracterização estrutural e

funcional in vitro das enzimas virais supostamente envolvidos na replicação,

como a polimerase, a protease, ou a NTPase viral[5].

Para que se obtenham as sequências específicas das enzimas virais, no

entanto, inicialmente, são necessários estudos básicos a partir da sequência do

genoma. Avaliando-se as ORFs e seu sistema de clivagem em proteínas

estruturais e não estruturais.

Sendo assim, o objetivo desse trabalho era realizar o sequenciamento

do genoma completo do Sapovirus isolado no Distrito Federal, com o intuito de

determinar o possível genogrupo circulante a partir de análises comparativas

com os demais genomas completos depositados no GenBank, e

posteriormente avaliar as regiões específicas deste.

A primeira análise realizada utilizou parte da sequência do gene do

capsídeo do isolado do DF (434pb), a comparação com 24 sequências desse

gene[15] deu origem a uma árvore filogenética (Figura 3) na qual se pode

observar o sapovírus do DF como pertencente ao genogrupo I (GI) genótipo 2,

e ainda pode se dizer que há uma proximidade entre esse isolado e um isolado

americano (número de acesso U73124).

Os resultados obtidos e descritos neste trabalho, quanto a análise

genômica, são referentes à sequência do genoma quase completo de 7403 nt,

com ausência apenas da região não traduzida (UTR) pela analogia com outras

sequências de genoma completo de sapovírus. De acordo com os resultados

obtidos a partir desta sequência (7403pb) pode se observar uma semelhança

com um isolado japonês e um isolado alemão, entretanto, a identidade com

estes dois isolados é apenas 71%. Isso mostra que o isolado BR-DF01 é

geneticamente muito diferente destes. Pela análise de genotipagem, estes dois

isolados pertencem ao genogrupo I e genótipo1. O isolado BR-DF01 pertence

24

ao GenogrupoI genótipo 2. Sendo essa a primeira sequência de genoma

completo deste genogrupo. A análise para detectar recombinação genômica

viral utilizando o programa RDP3Beta42 não mostrou sinal de existência de

recombinação entre as doze sequências analisadas. Entretanto com o

norovírus, a recombinação já foi demonstrada [9]. Com o aumento de

informação genômica de sapovírus, o possível evento de recombinação

poderia ser detectado.

Conclusão

O genoma quase completo de isolado brasiliense de sapovírus (BR-

DF01) foi sequenciado com tamanho de 7403nt. Esta sequência mostra duas

ORFs, que correspondem as ORF1 e ORF2 do sapovírus. O vírus pertence o

genogrupo I, genotipo2 e representa o primeiro sequenciamento de genoma

completo do sapovírus GI-2. Com a análise do genoma do sapovírus BR-DF01

pode se concluir uma identidade maior com as sequências japonesa e alemã,

porem num nível muito baixo de 72%.

Perspectiva

Espera-se com esse trabalho poder iniciar um estudo básico de

caracterização desse agente patogênico emergente no país, com o intuito

posterior de expressão de proteínas virais para o desenvolvimento de conjunto

diagnóstico para uso comercial em rotinas laboratoriais.

25

REFERÊNCIAS BIBLIOGRÁFICAS 1. Borges AMT, Cardoso DdDdP (2005) Calicivírus Humano. Revista de Patologia

Tropical 34: 10

2. Borodina TA, Lehrach H, Soldatov A (2003) DNA purification on homemade

silica spin-columns,. Analytical Biochemistry 321: 3

3. BRASIL (2008) Ministério da Saúde. Indicadores e Dados Básicos - Brasil.

DATASUS

4. Chiba S, Nakata S, Numata-Kinoshita K, Honma S (2000) Sapporo virus:

history and recent findings. The Journal of Infectious Diseases 181 Suppl 2:

S303-308-S303-308

5. Fullerton SWB, Blaschke M, Coutard B, Gebhardt J, Gorbalenya A, Canard B,

Tucker PA, Rohayem J (2007) Structural and functional characterization of

sapovirus RNA-dependent RNA polymerase. Journal of Virology 81: 1858-1871

6. Hansman GS, Oka T, Sakon N, Takeda N (2007) Antigenic diversity of human

sapoviruses. Emerg Infect Dis 13: 1519-1525

7. Instituto Adolf Lutz (2004) Diarréia e rotavírus. Rev Saúde Pública 38: 2

8. Johnsen CK, Midgley S, Böttiger B (2009) Genetic diversity of sapovirus

infections in Danish children 2005-2007. Journal of Clinical Virology: The

Official Publication of the Pan American Society for Clinical Virology 46: 265-

269

9. Katayama K, Shirato-Horikoshi H, Kojima S, Kageyama T, Oka T, Hoshino F,

Fukushi S, Shinohara M, Uchida K, Suzuki Y, Gojobori T, Takeda N (2002)

Phylogenetic analysis of the complete genome of 18 Norwalk-like viruses.

Virology 299: 225-239

10. Koletzko S, Osterrieder S (2009) Acute infectious diarrhea in children. Dtsch

Arztebl Int 106: 539-547; quiz 548

11. Martella V, Lorusso E, Banyai K, Decaro N, Corrente M, Elia G, Cavalli A,

Radogna A, Costantini V, Saif LJ, Lavazza A, Di Trani L, Buonavoglia C

(2008) Identification of a porcine calicivirus related genetically to human

sapoviruses. J Clin Microbiol 46: 1907-1913

12. Martin DP (2009) Recombination detection and analysis using RDP3. Methods

Mol Biol 537: 185-205

13. Oka T, Katayama K, Ogawa S, Hansman GS, Kageyama T, Ushijima H,

Miyamura T, Takeda N (2005) Proteolytic processing of sapovirus ORF1

polyprotein. Journal of Virology 79: 7283-7290

14. Oka T, Yokoyama M, Katayama K, Tsunemitsu H, Yamamoto M, Miyashita K,

Ogawa S, Motomura K, Mori H, Nakamura H, Wakita T, Takeda N, Sato H

(2009) Structural and biological constraints on diversity of regions immediately

upstream of cleavage sites in calicivirus precursor proteins. Virology 394: 119-

129

15. Okada M, Yamashita Y, Oseto M, Ogawa T, Kaiho I, Shinozaki K (2006)

Genetic variability in the sapovirus capsid protein. Virus Genes 33: 157-161

16. Ramani S, Kang G (2009) Viruses causing childhood diarrhoea in the

developing world. Curr Opin Infect Dis 22: 477-482

17. Santos NSO, Romanos MTV, WiGG MD (2002) Introdução à virologia humana.

Guanabara Koogan, Rio de Janeiro

18. Schlenker C, Surawicz CM (2009) Emerging infections of the gastrointestinal

tract. Best Practice & Research Clinical Gastroenterology 23: 89-99

26

19. Vernacchio L, Vezina RM, Mitchell AA, Lesko SM, Plaut AG, Acheson DWK

(2006) Diarrhea in American Infants and Young Children in the Community

Setting. The Pediatric Infectious Disease Journal 25: 2-7

20. Xavier MPTP, Oliveira SA, Ferreira MSR, Victoria M, Miranda V, Silva MFM,

Strina A, Barreto ML, Miagostovicht MP, Leite JPG (2009) Detection of

caliciviruses associated with acute infantile gastroenteritis in Salvador, an urban

center in Northeast Brazil. Brazilian Journal of Medical and Biological Research

= Revista Brasileira De Pesquisas Médicas E Biológicas / Sociedade Brasileira

De Biofísica [et Al 42: 438-444

21. Yan H, Yagyu F, Okitsu S, Nishio O, Ushijima H (2003) Detection of norovirus

(GI, GII), Sapovirus and astrovirus in fecal samples using reverse transcription

single-round multiplex PCR. Journal of Virological Methods 114: 37-44

27

Anexo I

Protocolo de Mini preparação caseira de coluna 1. Preparar o inóculo de bactéria com três ml de meio LB e antibiótico

especifico. 2. Repassar dois ml do inoculo para micro tubo. 3. Centrifugar a 12000 g por um minuto. Descartar sobrenadante. 4. Adicionar 150 µl de PB1 e ressuspender o pellet na estante ou

vórtex. PB1 – 50 mM glucose; 35 mM EDTA pH 8.0 (mantém a pressão osmótica da célula, evitando a lise no momento de ressuspender).

5. Adicionar 150 µl de PB2 e misturar invertendo de 5 a 10 vezes. PB2 – 0,2 M NaOH; SDS 1% (lisa a parede celular bacteriana, liberando o DNA).

6. Adicionar 210 µl de PB3 (preparado na hora) e misturar por um minuto invertendo o micro tubo. PB3 – 400 µl de guanidina (GuHCl) mais 100 µl de EDTA pH 8.0 (essa solução mantém as nucleases inativadas e equilibra o pH, fazendo com que o DNA se ligue à membrana da coluna).

7. Centrifugar a 12000 g por cinco minutos. 8. Transferir o sobrenadante para a coluna (confeccionada com fibra de

vidro Whatman) e incubar por um minuto em temperatura ambiente. 9. Centrifugar a 12000g por um minuto e descartar o sobrenadante. 10. Lavar a coluna com 400 µl de PB4. Centrifugar a 12000 g por um

minuto. PB4 – 5M de tiocianato de guanidina (GuSCN); 100 mM EDTA pH 8.0 (mantém o pH equilibrado e o DNA ligado a membrana).

11. Lavar duas vezes com 400 µl de tampão de lavagem e centrifugar a 12000 g por um minuto. Tampão de lavagem – 10 mM de Tris-HCl, pH7,5; etanol 80% (retira os sais da amostra).

12. Descartar o líquido e centrifugar novamente a 12000 g por dois minutos (para retirar completamente o tampão de lavagem). Transferir a coluna para um novo micro tubo.

13. Adicionar 50 µl de tampão de eluição e incubar por dois minutos em temperatura ambiente. Tampão de eluição – 10 mM Tris-HCl, pH 8,5 (retira o DNA da membrana).

14. Centrifugar a 12000 g por dois minutos. Guardar a amostra em freezer -20°C.

28

Anexo II

Normas de Referência Bibliográfica de acordo com a revista Archives of Virology

Citation

Reference citations in the text should be identified by numbers in square brackets. Some examples: 1. Negotiation research spans many disciplines [3]. 2. This result was later contradicted by Becker and Seligman [5]. 3. This effect has been widely studied [1-3, 7].

Reference list

The list of references should only include works that are cited in the text and that have been published or accepted for publication. Personal communications and unpublished works should only be mentioned in the text. Do not use footnotes or endnotes as a substitute for a reference list. The entries in the list should be numbered consecutively.

Journal article

Gamelin FX, Baquet G, Berthoin S, Thevenet D, Nourry C, Nottin S, Bosquet L (2009) Effect of high intensity intermittent training on heart rate variability in prepubescent children. Eur J Appl Physiol 105:731-738. doi: 10.1007/s00421-008-0955-8

Ideally, the names of all authors should be provided, but the usage of “et al” in long author lists will also be accepted:

Smith J, Jones M Jr, Houghton L et al (1999) Future of health insurance. N Engl J Med 965:325–329

Article by DOI

Slifka MK, Whitton JL (2000) Clinical implications of dysregulated cytokine production. J Mol Med. doi:10.1007/s001090000086

Book

South J, Blass B (2001) The future of modern genomics. Blackwell, London

Book chapter

Brown B, Aaron M (2001) The politics of nature. In: Smith J (ed) The rise of modern genomics, 3rd edn. Wiley, New York, pp 230-257

29

Online document

Cartwright J (2007) Big stars have weather too. IOP Publishing PhysicsWeb. http://physicsweb.org/articles/news/11/6/16/1. Accessed 26 June 2007

Dissertation

Trent JW (1975) Experimental acute renal failure. Dissertation, University of California

Always use the standard abbreviation of a journal’s name according to the ISSN List of Title Word Abbreviations, see

www.issn.org/2-22661-LTWA-online.php

30

Anexo III

Sequência do sapovírus BR-DF01

1 GTGATTGGTT AGATGGTTTC CAAGCCATAC AGGCCAATAT CCCTCGACCC

51 CACTTTCGAG TGGGTCGTTT TCCGTCGCTG CTACCTCAGG GTAGCACCTC

101 GGGAAACATT TGTAGAGGAT TTCAAAGAAT TAGAATATTA TTTCACCACG

151 CGCTTGTGCG CGTGGTTAAA GCGTGTCACT AGGACCCTCC CTAGGAGGGA

201 GTTTGTGGAG GAGGGTCTCC TTGACGCGTT TAACAGCAAG CCAGTGGTTG

251 AACCTAATGA GGACATTCTC TTTAGAGAAC TCTTTGGGGT GGACTTGCAG

301 GAACAGTTCC CAATGTCAAT TCACGACCTC GCCAAATTAC AAGGTGAGGC

351 GGTGGATGCC TTGCGTAATC CTGGACATCA ATTACGTAGG AAGTATACAA

401 CACAAACCCT AAAGAAACTG GTTACCAAAA TCACAAGGGT GGTACCTGTC

451 CAGGCCACCC TACAAGACAT GCATGAGCGG CGCGATTTTG AAAGGGAACG

501 TGCCGACTTG TTTAAAGAAC TACCCCTGTT AGATGAAGAG ATAACACAAA

551 AACCCAAGAC ATATTTTTAT TCAATGTGGC GTCAAGTTGT GAAGAAAGGT

601 AAGACCTACT TCATGCCACT CGTAAAGACA AATGGATGGG TTAGTAAAAT

651 CACAAAAATC ACTGACCCCA TCAAAGATTT CATCATAGCT TTTTGCCAGG

701 CAGTCCAACA AGAGATGGGG ACGGATCCAC GGTATTTGCA GCTGGCTTGG

751 ATTCAAAAGC TAAAGCCAAC CGTGCTCACC ATCATCCTAC AACAACACAA

801 AAACACCGTG TCAGGGTGGT TGGCGACACT AACAGCTCTA GTGGAAGTTT

851 ACTCCAACCT TTTTGATGAT TTGCGCAAGT CTGCCGTTAC CATCATATCG

901 GCACTAAGTG CTTTCTTCGA TGTGTGTAAA GACTTCATTG CTAGTGTTGT

951 TGACTTGATT AAAACCACAT TCACACCTCA GGGCCCCACT GATCTTGGAT

1001 GGACCGCAGT TGCGGCTGGA GCAGTCATGA TTCTACTAAA GGCTTCTGGT

1051 TGCCCTGGTG TGTCGGGCAT GTGGGGTAAA ATACTCAAGG TGTGCGGGGG

1101 CATTACAACC ATAACCGCTG CCATACGGGG TATCAAGTGG CTCAGAGAAC

1151 TGTATGAAGA GGCTGAAAGT AAAAGGCTCG CCAAGATGTA CATGGCTAGG

1201 GCAGCAGCCC TAATTGAGTT GGCAGCAAGC AGGGAAGTGA CTGGGGTTAA

1251 GGAACTGAAG GAGCTCCTCA GTTGCTTCAC CGTCCTCATA GAGGAGGGTG

1301 CTGAACTTCT ACAAAAGTTT GGCACAAGCC CCCTTTCTGG CCTCATACGC

1351 ACATATGTGT CAGAATTGGA AACCCAAGCA AACAACATCA GATCTACCAT

1401 CATGCTAGAC ACACCTCGTG AGGTTCCAGT AGTCATCATC TTGACTGGAC

1451 CACCAGGTAT TGGTAAGACA CGGTTGGCTC AGTTTATAGG GGAAAAATTT

1501 GGTAAAGTGT TCAACTTCAG TGTTGCAGTA GATCACCATG ATGGTTACAC

1551 AGGCAACCCA GTGTGCATAT GGGATGAGTT TGATGTGGAC GCAAAAGGTA

1601 GTTTCGTGGA AACAATGATT GGTATTGCCA ATACAGCACC GTTCCCACTT

1651 AATTGTGACC GTGTGGAGAA CAAAGGTAGG GTGTTTACTT CAAATTATGT

1701 TATTTGCACA TCAAACTACC CCACGTCTGT CATTCCAGAG AACCCACGTG

1751 CCCCAGCCTT TTACCGTCGA GTCATCATCT TGGATGTTTC ATCTCCAGAA

1801 CTTGATGAGT GGAAGAAGAA GAACCCTGGA AAGAAGCCCC CATCTGACTT

1851 GTATAAACAA GACTTTTCAC ACCTGAAGTT GATGCTCCGC CCCTACCTTG

1901 GGTACAATCC CGAAGGGGAC ACACTTGACG GCACTAGAGT CAAACCCACC

1951 CAGATATCCA TCCCAAGTTT GATCTCACTC ATGCAAAAGA GGTTTAAGGA

2001 GCAATCAGGG GAAAACCAGA ACCTATGGAT GCAAGTCCCT AGGGGAGCTG

2051 TTGATCAAGC ATCTAATATG ATAAAGACCT TTGTCTATGC TAACCGTGGT

2101 GTGTGTGACG TTCTCCCAAA CCCTGCCTCC CGTGACATCA CAGAGACATC

2151 TGTATCAAAA ATCTTTGTCT CCTCAACAGC CCCACCACCA GAGTTCTTAG

2201 GCCGCCATGT GATCATCACT GGGTTTGAAC TTGGGGATGC ATCCATAGCA

2251 AACTCTTTGT TATCCATGTT TTCCACAAGC ACACGTCTCA CTGCTGGTGC

2301 ACAGCGAGAG TATATGTATA GAATTTGGAA TCCCATCATC CACATCCAAG

2351 AGAGGTCCAT CAACACACAA AATCTGCCAT ATGTTAACCG CGTGATCCCA

2401 GTCACATCTC ACTGGGATTT CTTACGTGGT TTAAGACACC ACCTTGGTTT

2451 GGTGTCCATC CCTGGAATGT GGCGGGCTTT CCAGGGGTGG CGATCGTCCC

2501 AAGGTATCAT TGACTTTGTT GCAAATCACA TGAATGAAGT CACATTCCCC

31

2551 AGTAACCCAG AATGCACTGT CTTCCGCACT GGGGATGGGG ACGTTGTCTT

2601 TTACACGTAT GGGTCATACG CGTGCCTTGC GTCCCCTGCC CGCGTGCCCT

2651 ATGTTGGAAA TCCACCATCC ACCATCCATT CAAATGTCCC GAGATGCATG

2701 ACGTGGGGTG AAACCATTGG GTATCTTTGT GAGGTGGTGG CAGAATTTGC

2751 CCTACATTTT GGTCCATTAA TCTTGGCAGC AACCAACATA GCTTACCTGT

2801 GCTCAAGAGG CAATCGGGAT GAGGAAGCCA AAGGGAAGTC AAAACATGGC

2851 AGAGGAGCCA AACACGCACA TCGTGGCGGA ACCAGCCTGT CGGACGATGA

2901 GTATGATGAG TGGCGAGATC TTGTCCGCGA CTGGCGTAAA GACATGACAG

2951 TCAATGACTT CCTCATGCTA CGGGAGCGCA GCGCTCTCGG TACGGATGAC

3001 GAAGACGTGG CACGCTATAG AGCATGGCTA GAAATCCGTG CCATGCGGTT

3051 AGCAGGTGGT GCTTACACCC ACGCCACAGT AATCGGCAAA GGTGGTGTGC

3101 GAGAAGAGAT CATTAGAACA GCCCCTCGCC GTGCCCCCAT GAGTGCACGG

3151 CGCGCCAATT ATGAAGAGGA AGCCCCCACT GCCATTGTTG AGTTCACCCA

3201 TGAAGGCGAC CACATAGGGT ATGGAGTCCA TCTTGGCAAT GGTAGAGTGG

3251 TCACCGTCAC CCATGTAGCA TCATCATCAG ATAGTGTTGA GGGAGCACCT

3301 TTTAAGGTAC AAAGAACTGT TGGTGAAACC ACTTGGGTTG AAACACAGCT

3351 TCCCAACTAC CCCCATTTGC AAATTGGCTC AGGAAGGCCC GTGTATTACA

3401 CGATGCGATT GCATCCAGTG GTGACTATCA CGGAAGGCAC TTTTGAGACC

3451 CCAAATATCA CTGTTCATGG TTTCCATGTT CGCATCACAA ATGGGTACCA

3501 AACCAGGAAA GGTGATTGTG GATTGCCTTA CTTGAATGCC AACAGGCAGG

3551 TGGTGGGATT GCATGCTGGT ACCGATGTTC AAGGGGAAAC CAAATTGGCA

3601 CAGAAGGTAG TTAAAGAGCT GCCTGTGGAG AGTGAATTTC ACTGGAAGGG

3651 CCTCCCAGTT ATCAAATCTG ACCTGGATGT TGGGGGGATG CCAACCGGCA

3701 CACGGTACCA TCGATCACCT GCATGGCCAG AGCAACTCCC CGAGGAAACT

3751 TATGCCCCCG CCCCCTTTGG TGCCGGTGAC AAACGCTATC ACTTCACCCA

3801 GACTGAGATG TTAGTGAACG CCCTTAAGCC CTACACTGAG ACTACACCTG

3851 GCATCCCCCC TTCCTTGCTA TCACGGGCTA CAACTCACGT GCGTGCTTAC

3901 CTTGAAACAA TTATTGGTAC ACACCGTTCT CCTGTGCTCA CTTTCACCCA

3951 GGCAGTTGAG TTGCTTGAAA AATCCACCTC ATGTGGCCCG TTCATACAAG

4001 GACTAAAAGG AGACTATTGG GATGATGAAA CACAACAATA CACTGGGGCC

4051 CTACGTGAAC ATTTAGACAG AGCATGGGAT CATGCTGTCA GGGGCATTGC

4101 ACCAGGGAAC TCCTACAAAT TGGCACTTAA GGATGAACTC CGTCCTGAGG

4151 AAAAGAATAA AGAAGGGAAG AGGCGGCTGC TGTGGGGCTG TGACGCCGCA

4201 ACAACTCTAA TTGCAGTGGC GGCGTTTAAG CCAGTGGCCG CACGCTTACA

4251 AGTAGTGACA CCAATGACTC CAATTTCCGT TGGTATCAAC ATGGACTCAA

4301 TGCAAATGCA AGTGATGAAT GATTCTTTGA GGGGTGGTGT ACTTTACTGC

4351 CTAGACTACT CCAAATGGGA CTCCACACAA AACCCAGCTG TCACTGCAGC

4401 TAGCCTGTCC ATTTTAGAGA GATTTATGGA AAGCAGCCCA TTGGTGTCCT

4451 GTGCAATAGA GTCCCTGTCC TCACCAGCAA TTGGCTATCT CAATGACATT

4501 AAATTTGTAA CCAAAGGGGG TCTCCCATCA GGAATGCCCT TCACCTCAGT

4551 CATCAACTCG GTGAACCACA TGATATACTT TGCAGCGGGT GTGCTCAAAG

4601 CTTATGAGGA CCACCACGTC CCATACACTG GCAATGTATT TCAGATAGAG

4651 ACTGTCCACA CCTATGGTGA TGACTGTATT TATAGTGTTT GTCCTGCCAC

4701 CGCTTCTATC TTTGGTTCTG TTCTCGCCAA CCTGTCCTCC TTCGGTCTCA

4751 GGCCCACTGC CGCTGACAAA ACTGCAGAAA TCAAGCCCAC CCAAACACCA

4801 GTTTTTCTGA AAAGAACATT CACACAGACG CCCTATGGGG TGAGGGCACT

4851 ATTGGACATC AATTCCATCA TTCGGCAGTT CTACTGGGTT AAGGCGAACC

4901 GCACTAGTGA CCCATCTAGC CCCCCTGCAT TTGATCGCAC TGCCCGCAGT

4951 GCCCAGTTGG AAGCAGCCCT AGCCTATGCA TCACAACATG GACCTTTAGT

5001 GTTTGACAAG GTGCGTGACA TTGCCATCAA AACGGCCGAA GGAGAGGGTG

5051 TGGTGCTTGT GAATACAAAC TTTGATTTGG CCCTCGCCAC CTACAATGCC

5101 TGGTTCATAG GTGGTACAGC TCCAGATCCA GAGCGCCCCA CTGAAGGTGC

5151 ACCCAAATTA GTGTTTGAGA TGGAGGGCAA TGGCTCCCAG TTGCCAACCA

5201 ATCAAAATGG TGGCCATGTT GGCCAGGATG TTGACCCGCC TGGCGCGACT

5251 GGTCCGACCA CATCCCATGT TGTTGTGTCT AATCCAGAAC AACCCAATGG

5301 GCCCGCACAA CGCCTGGAAA TGGCTGTTGC TACTGGTTCC ATCCAATCAA

5351 ATGTCCCTGA AGCGATACGC AACTGCTTTG CAGTCTGTCG TACTTTTGCT

5401 TGGAATGACA GAATGCCCAC TGGAACTTTC CTGGGATCTT TATCGCTTCA

32

5451 TCCCAACATT AATCCATACA CATCCCATCT TTCAGGCATG TGGGCAGGGT

5501 GGGGAGGTAG CTTTGAGGCC CGCATCTCAA TTTCTGGGTC TGGCATGTTT

5551 GCTGGGAGGA TCATTGCTTC TGTCATACCA CCTGGGGTTG ACCCCACGTC

5601 GATCAGGGAT CCGGGCGTGC TCCCTCACGC TTTCGTTGAT GCTCGTATCA

5651 CTGATCCAGT ATCATTTATG ATCCCTGATG TGAGAAACGT TGATTACCAT

5701 AGGATGGACA TCACTGAACC CACTTGCTCC CTTGGATTCT GGGTCTATCA

5751 ACCACTGCTA AATCCATTTT CCACCACAGC AGTCACAACA TGCTGGGTAT

5801 CCATAGAAAC CAAGCCTGGT GGTGATTTTG ATTTTTGCCT CTTGAGGCCC

5851 CCTGGTCAAC AGATGGAGAA TGGTGTGTCA CCTGAGGGTC TCCTCCCACG

5901 CCGCTTGGGC TACACCCGGG GTAACCGGGT TGGGGGGTTA GTAGTTGGTA

5951 TGGTTTTGGT TGCTGACCAC CGCCAGGTGA ACAGGCACTT TAATGCACAG

6001 TCTATCACTT ATGGATGGTC TACTGCACCA GTCAACCCAA TGGCAGCGGC

6051 AATTCAAACA AATCATGTCC ACACTGGAAA CAACAATTCC AACAAAAGGA

6101 ACGCTTGGTT ATCACTTAGT GCAGAAAACA AGGGTCCACT GTTCCCAGGC

6151 ATCCCAAACC ACTTCCCCGA CTCCTGTGCT TCCACGGTAA TGGGCGCTAT

6201 GGACACAGAC CGCCACATGC CATCCACAGG AATCTGTGGC CCAGCAATTG

6251 GCTTCCAAAA CAATGGAGAT GCCTATGAAA ATGAGACTCC TGCAGTCATG

6301 TTTGCCACTC TAAACCCCCT GACTGGTGGT ACTAATGAGA ATCCTGTAGC

6351 CCTCTTTGGT TCAATCAATC TGGCCTCTTT AGCTGTGGTT CGCACTCAAC

6401 AGGATGTGGA CTTCACAACC ACCGGTTTTG CCAACAACAT GAACGTGGTT

6451 GTGGAAATGT CCTGGGAAAT GTACTCAGGA TCACAACAGA TACAGGGGCG

6501 TGTGACACCT ATGGATGGCA CTAACTTTGT TTTCACTTCT TCAGGCGCCA

6551 ACACCCTGGT GCTCTGGGAG GAGCAATTAC TCAGTTATGA TGGAACCCCA

6601 GCAATCTTGT ACTCATCTCA GTTGGAGCGC ACTGCGGAGT ACTTCCAAAA

6651 TGACAATGTC AACATACCCC CAGGTTCAAT GGCTGTTTTT AATGTTGAAA

6701 CAAATTCTGC CTCTTTCCAA GTTGGCATTC GGCATGATGG ATACGTGGTG

6751 ACTGGTGGTA CGGTTGGAAC TCATGTTGCT CTGGATGCGG AAACACGATT

6801 TCAATTTGTT GGTATTCTCC CCCTCACAGC CACACTGGCT GGGCCCAATG

6851 GGAACTCAGG AAGGGCCAGG CGTCTGTTCC AATGAGTTGG TTAGTTGGCG

6901 CCTTGCAGAC AACTGGGTCA CTCGTTGACC TTGCAGGAAC TGTTTCAGAT

6951 ATAGTTTACA AACAAAGGCA AGTGGCACAA CTGGAGAAAC AAAACCAGCT

7001 CATGGAGCAA TGGATGTACA AACAGGAAGC CTTGCAAAAG TCCCAAATGG

7051 ATCTCACACG TGACTTGGCA GTGAACACCC CTGTGTATCG TGTCCAGGCT

7101 GCACTAGATG CTGGGTTTGA CCCAATCAGC GCGCGACGCT TGGCTGGTTC

7151 CAGCGAGCGC GTTATCTATG GCAACTTGGA TAGACCAATA ATGCATGCAG

7201 GCACCATGGA AGGGATTAGG CAAACTAACC ACTTGAATGC CATCAGTTCA

7251 GCAATGGCTA CATTTAAGAA CGGTACACAA TTTGGAAAAC CAGCTCCTCC

7301 AAAAATTCAA ACTGGGACAC CAACCAAACC CTCAATCAAT CTTAATCACC

7351 AACCTGGATC ATCCAGTGCT TGATTCTAAA TTTTCTTTCA ATTTTCTTTT

7401 CTA