instituto nacional de pesquisas da amazÔnia –...

77
i INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA INPA Programa de Pós-Graduação em Genética, Conservação e Biologia Evolutiva/INPA Anotação do transcriptoma parcial de Anopheles (Nyssorhynchus) darlingi Root, 1926 GILSON MARTINS DE AZEVEDO JUNIOR Manaus, Amazonas maio, 2011

Upload: ngotram

Post on 01-Dec-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

i

INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPA

Programa de Pós-Graduação em

Genética, Conservação e Biologia Evolutiva/INPA

Anotação do transcriptoma parcial de Anopheles (Nyssorhynchus) darlingi

Root, 1926

GILSON MARTINS DE AZEVEDO JUNIOR

Manaus, Amazonas

maio, 2011

Page 2: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

ii

GILSON MARTINS DE AZEVEDO JUNIOR

Anotação do transcriptoma parcial de Anopheles (Nyssorhynchus) darlingi

Root, 1926

ORIENTADORA: Dra. Míriam Silva Rafael (INPA)

Co-orientador: Dr. Renato Vicentini (UNICAMP)

Manaus, Amazonas

maio, 2011

Dissertação apresentada ao Instituto Nacional de Pesquisas da Amazônia como parte dos requisitos para obtenção do título de Mestre em Genética,

Conservação e Biologia Evolutiva.

Page 3: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

iii

Ficha catalográfica

Sinopse:

Genes expressos de Anopheles darlingi, a partir da Bioinformática foram anotados, analisados e comparados entre genomas de mosquitos da família Culicidae, tais como Anopheles gambiae, Aedes aegypti e Culex quinquefasciatus. Palavras chave:

cDNA, Evolução, Anopheles darlingi, Anopheles gambiae, Aedes aegypti, Culex quinquefasciatus, Transcriptoma.

A994 Azevedo Junior, Gilson Martins de

Anotação do transcriptoma parcial de Anopheles (Nyssorhynchus) darlingi Root, 1926 / Gilson Martins de Azevedo Junior.--- Manaus :

[s.n.], 2011.

xi, 66 f. : il. color.

Dissertação (mestrado)-- INPA, Manaus, 2011 Orientador : Míriam Silva Rafael Co-orientador : Renato Vicentini

Área de concentração : Genética, Conservação e Biologia Evolutiva 1. cDNA. 2. Anopheles darlingi. 3. Anopheles gambiae. 4. Aedes aegypti. 5. Culex quinquefasciatus. 6. Transcriptoma. I. Título.

CDD 19. ed. 595.770415

Page 4: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

iv

Aos meus pais

Gilson e Maria Elzir

e ao Lucas, meu filho,

Dedico.

Page 5: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

v

Agradecimentos

Agradeço a Deus pelas energias que me foram dadas nos momentos de fraqueza,

pelas forças que não me deixaram desistir

Agradeço aos meus pais, Gilson e Maria Elzir, por serem meu porto seguro e pelos

ensinamentos de vida e aos meus irmãos, Juliano e Ana, pelo companheirismo e

incentivo. Minha vó Nelzi, tia Naná e tia Lúcia, enfim, a todos os meus familiares,

agradeço!

Ao Lucas, meu filho, que contribuiu muitíssimo para a conclusão dessa dissertação,

lembrando-me que eu não devo desistir.

À professora doutora Míriam Rafael, minha orientadora, por acreditar, confiar em

mim, pelos ensinamentos, que possibilitaram o desenvolvimento dessa dissertação.

Obrigado!

Ao professor doutor Renato Vicentini, pelos ensinamentos no aprendizado de

Bioinformática e análise de dados, pela amizade e por co-orientar esse trabalho de

dissertação.

Ao Programa Curso de Pós-Graduação em Genética, Conservação e Biologia

Evolutiva (GCBEv/INPA), Dr. Jorge Porto (Coordenador), Dra. Vera Scarpassa (ex-

Coordenadora), membros do Conselho que deram as condições necessárias para

a realização do meu mestrado; e ao corpo docente, pelo aprendizado recebido nas

disciplinas ministradas.

Ao Ministério da Ciência e Tecnologia (MCT)/Instituto Nacional de Pesquisas da

Amazônia (INPA), pela infra-estrutura e apoio técnico recebidos para o

desenvolvimento dessa dissertação

À Kelly pela compreensão, cumplicidade e palavras de apoio e incentivo durante a

redação dessa dissertação

Page 6: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

vi

Ao professor doutor Wanderli Pedro Tadei, pelo apoio e incentivo logístico que

foram decisivos no desenvolvimento deste trabalho.

À Giselle Guimarães, grande amiga e colega de trabalho que também contribuiu

com a sua experiência acerca do sequenciamento de ESts de An. darlingi.

Obrigado pela amizade e pelo apoio!

À Alessandra e Tamara, muito obrigado pela presteza nos trabalhos na Secretaria

do GCBEv.

À Kyara Formiga de Aquino e Jacqueline da Silva Batista pelos auxílios no

Laboratório Temático de Biologia Molecular-LTMB/INPA

Ao professores doutores Míriam Silva Rafael e Wanderli Pedro Tadei, Letícia Bridi

(MS.c), mestrandas Ketlen Nunes de Souza e Giselle Guimarães (Laboratório de

Malária e Dengue/INPA), Spártaco Astolfi Filho e Carlos Gustavo Nunes da Silva e

aos colegas Rogério Meireles, Enedina, Johnson (Laboratório de DNA do Centro

de Apoio Multidisciplinar-CAM/UFAM), Dra. Ildinete (UNB), CENARGEN, Drs.

Mauro Carneiro e Felipe da Silva, pela construção e sequenciamento das

bibliotecas de ESTs de larvas e adultos de A. darlingi.

À CAPES, pela disponibilização da bolsa de estudo para a realização desta

dissertação.

À colega e amiga Letícia pelas palavras amigas e por ter cedido gentilmente dados

sobre mapeamento in situ que foram necessários em análise de sintenia.

A todos os colegas de Laboratório, Mellina, Letícia, Giselle, Kethlen, Pedro, Sabrina

e Lumara pela cooperação e companheirismo.

A todos os técnicos do Laboratório de Vetores da Malária e Dengue, pelos auxílios

nas coletas e identificação de mosquitos. Ao Gláubio pelas ajudas e ensinamentos

sobre cuidados com os mosquitos.

Page 7: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

vii

Adelina, Maria e Zilá, muito obrigado pela amizade e apoio desde minha chegada a

Manaus.

Aos colegas da turma de Mestrado/2009, pelos momentos de solidariedade e

companheirismo durante os momentos de agonia. Obrigado pelo espírito de

coletividade de todos!

Aos companheiros de república, Chico Mário, Daniel Fagundes e Marcos Bento,

obrigado pela amizade.

E a todos que de alguma forma contribuíram, seja com palavras de incentivo,

palavras amigas e/ou conhecimentos específicos da área! Se eu fosse citar o nome

de todas as pessoas, eu precisaria de mais folhas! Obrigado a todos, mesmo!

Page 8: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

viii

RESUMO

Insetos transmissores de doenças têm sido estudados para caracterização de diversos aspectos biológicos e evolutivos. Sequenciamentos de genomas inteiros têm permitido comparações entre sequências gênicas de espécies diferentes, fornecendo dados moleculares. Citam-se os mosquitos Anopheles gambiae (subfamília Anophelinae), principal vetor da malária na África, cujo genoma contém 278.253.050 pares de bases (pb), o Aedes aegypti, transmissor do Dengue, com 1.310.090.344 pb e Culex quinquefasciatus, vetor de arboviroses, com 579.042.118 pb, ambos da (subfamília Culicinae). No Brasil, o Anopheles darlingi (subfamília Anophelinae) é o principal vetor da malária, cuja bibliotecas de ESTs (Expressed SequenceTags) parcial de adultos e larvas previamente obtidas foram analisadas no presente trabalho. Sequências gênicas de An. gambiae, Ae. aegypti e Cx. quinquefasciatus foram analisadas quanto a presença de genes em comum e genes ortólogos, nesses mosquitos em comparação com An. darlingi. ESTs (568 Unigenes) de An. darlingi foram mapeadas virtualmente em cromossômos de An. gambiae. Em seguida, foram realizadas análises de expressão diferencial gênica, o que permitiu quantificar estatisticamente os níveis de expressão de cada gene, no

transcriptoma de An. darlingi. As sequências de An. darlingi foram mapeadas nos termos ontológicos do Gene Ontology (GO) e as sequências diferencialmente expressas, com bons valores estatísticos que indicam ortologia, foram analisadas manualmente, segundo a literatura. Os resultados mostraram que, 61% das sequências de An. darlingi são ortólogas em An. gambiae e o mapeamento cromossômico in silico mostrou que os 568 Unigenes de An. darlingi estão representados em 793 regiões cromossômicas do An. gambiae, corroborando estudos evolutivos de que as duas espécies são próximas evolutivamente. As sequências de An. darlingi analisadas no programa GO foram associadas a 1.249 níveis e subníveis de ontologias que descrevem um gene de acordo com sua função e localização celular. Análises de expressão diferencial de alguns produtos gênicos mostraram-se mais intensas em larvas do que em adultos de An. darlingi. Realizaram-se, ainda, a análise filogenética do gene da Glutationa-S-Transferase (GST) de An. darlingi, um gene de resistência a inseticidas bem conservado em termos evolutivos em An. gambiae, Ae. aegypti e Cx. quinquefasciatus. A árvore filogenética agrupou o gene da GST de An. darlingi com An. gambiae como espécies irmãs, estando estas proximamente relacionadas evolutivamente do que em relação ao Ae. aegypti e Cx. quinquefasciatus. O Phlebotomus papatasi, constou como grupo externo, para enraizamento dessa árvore. A anotação manual de ESTs de An. darlingi auxiliou na compreensão da expressão gênica e aspectos evolutivos desse mosquito em relação ao An. gambiae, Ae. aegypti e Cx. quinquefasciatus, além de fornecer dados importantes para estudos posteriores sobre funções gênicas individuais de An. darlingi transmissor da malária no Brasil.

Page 9: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

ix

Abstract

Disease-transmitting insects have been studied to characterize several biological and evolutionary aspects. Whole Genome sequencing has been allowing comparisons between the gene sequences of different species, providing molecular data. The mosquitoes Anopheles gambiae (subfamily Anophelinae), the most important vector of malaria in Africa, whose genome contains 278.253.050 base pairs (bp), Aedes aegypti, transmitter of Dengue, with 1.310.090.344 bp and Culex quinquefasciatus, vector of arbovirus, with 579.042.118 bp, both of (subfamily Culicinae) are cited. In Brazil, the Anopheles darlingi (subfamily Anophelinae) is the most important malaria vector, whose partial EST (Expressed Sequences Tags) libraries of adults and larvae previously obtained were analyzed in this study. Genic sequences of An. gambiae, Ae. aegypti and Cx. quinquefasciatus were analyzed for the presence of orthologous genes, in these mosquitoes in comparison with An. darling. An. darlingi’s ESTs (568 Unigenes) were virtually mapped in An. gambiae’s chromosomes. After that, differential gene expressions were analyzed, which allowed to statistically quantify the levels of differential expression of each gene, in the transcriptome of An. darlingi. The An. darlingi sequences were mapped according to onthologic terms of Gene Ontology (GO) and the sequences differentially expressed, with good statistical value that indicates the orthology were manually analyzed, according to the literature.The studies showed that 61% of An. darlingi are orthologous in An. gambiae and the in silico chromosomal mapping showed that the An. darling’s 568 Unigenes are represented in 793 chromosomal regions of An. gambiae, corroborating with evolutionary studies that say that the two species are evolutionarily close. An. darlingi sequences mapped in GO were associated with 1249 ontholgy levels and sublevels that describe a gene according to its function and cellular location. Differential expression analysis of some gene products was found more intense in larvae than in An. darlingi adults. Phylogenetic analysis of the An. darlingi glutathione-s-transferase (GST) gene was also done, an insecticide resistance gene which is well conserved, evolutionarily speaking, in An. gambiae, Ae. aegypti and Cx. quinquefasciatus. The Phylogenetic tree grouped An. darlingi and An. gambiae as sister species, because they are more evolutionarily related than Ae. aegypti and Cx. quinquefasciatus. In this analyses, the Phlebotomus papatasi was used as an external group, as the root of the tree. The manual annotation of An. darlingi ESTs sequences helped to understand the gene expression and evolutionary aspects of this mosquito related with An. gambiae, Ae. aegypti and Cx. quinquefasciatus, and also provided important data for further studies about individual genes of this malaria-transmitting species in Brazil.

Page 10: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

x

SUMÁRIO

1. Introdução ................................................................................................................................... 1

1.1 Família Culicidae..................................................................................................................... 1

1.2 Gênero Anopheles .................................................................................................................. 1

1.3 Anopheles darlingi .................................................................................................................. 2

1.4 Malária e seus agente etiológicos ........................................................................................... 2

1.5 Caracterização de An. darlingi ................................................................................................ 3

1.6 Transcriptoma ....................................................................................................................... 4

1.7 Formato FASTA ....................................................................................................................... 5

1.8 Alinhamento de sequências e o algorítimo BLAST ................................................................... 6

1.8.1 Homologia, Similaridade e Identidade ............................................................................. 7

1.9 Inferência sobre funções gênicas ............................................................................................ 8

1.9.1 Genes expressos e suas funções biológicas ...................................................................... 8

1.9.2 Genômica comparativa .................................................................................................... 9

2. OBJETIVOS ................................................................................................................................. 12

2.1 Geral .................................................................................................................................... 12

2.2 Específicos ............................................................................................................................ 12

3. MATERIAL E MÉTODOS .............................................................................................................. 13

3.1 Mapa local de coletas ........................................................................................................... 13

3.2 Bibliotecas de ESTs de larvas e adultos de An. darlingi ......................................................... 13

3.3 Alinhamento de sequências .................................................................................................. 14

3.5 Mapeamento in silico de ESTs de An. darlingi nos cromossomos de An. gambiae ................ 16

3.6 Seleção de genes diferencialmente expressos ...................................................................... 16

3.7 Curadoria manual da anotação automática .......................................................................... 17

3.8 Filogenia da Glutationa -S Transferase (GST), classe Sigma ................................................... 18

4. Resultados e Discussão............................................................................................................... 19

4.1 Compartilhamento de sequências homólogas por espécies .................................................. 19

4.2 Mapeamento in silico de ESTs de An. darlingi em cromossomos de An. gambiae .................. 21

4.3 Mapeamento das sequências ESTs de An. darlingi pelo Gene Ontology ................................ 22

4.4 Expressão diferencial de genes em larvas e adultos de An. darlingi ....................................... 23

4.5 Avaliação manual de sequências expressas diferencialmente ............................................... 24

4.6 Inferências de funções de genes ortólogos ........................................................................... 30

Page 11: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

xi

4.7 Filogenia da Glutationa S Transferase, Classe Sigma ............................................................. 37

5. Conclusão .................................................................................................................................. 38

6. Referências Bibliográficas ........................................................................................................... 39

ANEXOS ......................................................................................................................................... 60

Tabela 1: Algorítmos derivados do programa BLAST ................................................................... 60

Tabela 2: Comparação da Glutathiona S-transferase (GST) entre sequências de An. darlingi e An.

gambiae, quanto ao mapeamento in silico. ................................................................................ 60

Tabela 3: Contigs diferencialmente expressos e seus respectivos valores normalizados em cada

biblioteca (larvas e adultos de An.darlingi). O valor de p-value indica a confiança estatística dos

dados amostrados e, valores maiores que 1 % foram rejeitados, por isso, estes não foram

inseridos nesta Tabela. ............................................................................................................... 61

Tabela 4: Contigs mais expressos em adultos de An. darlingi, que apresentaram HSP/HIT >=65%.

.................................................................................................................................................. 63

Tabela 5: Contigs mais expressos em larvas de An. darlingi que apresentaram HSP/HIT >=65%. 65

Page 12: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

1

1. Introdução

1.1 Família Culicidae

A família Culicidae pertence à ordem Diptera classe Insecta e, engloba algumas

espécies de interesse epidemiológico. Entre essas encontram-se os mosquitos

Culex quinquefasciatus, transmissor da filariose e vírus do oeste do Nilo e Aedes

aegypti, transmissor do vírus da febre amarela e dengue. Esses dois insetos

partilham hábitos comuns, como por exemplo, são cosmopolitas e suas larvas

apresentam uma estrutura morfológica denominada sifão respiratório que é

responsável pela respiração aérea, enquanto que as larvas de mosquitos da

subfamília Anophelinae realizam a respiração aérea através de placas espiraculadas

presentes no VIII segmento abdominal (Consoli e Oliveira, 1994). Os adultos estão

presentes em regiões temperadas e tropicais bem como no Círculo Polar Ártico, mas

são muito diversos em ambientes de florestas (Foley et al., 2007).

Na subfamília Anophelinae, encontram-se duas espécies, dentre outras, de

importância médica e de saúde pública mundial, Anopheles darlingi e Anopheles

gambiae transmissoras dos agentes etiológicos da malária no Brasil e África,

respectivamente. Mosquitos da família Culicidae apresentam algumas semelhanças

entre si, dentre elas o hábito hematófago entre as fêmeas, que necessitam da

alimentação sanguínea para a maturação de seus ovos, além de partilharem a

capacidade vetorial, que pode variar dependendo da região geográfica (Morse,

1995; Molyneux, 1997).

A família Culicidae teve uma origem ancestral, provavelmente no Jurássico

(Edwards 1932; Bertone et al., 2008), consistente com o registro fóssil de seu grupo

irmão, a família Chaoboridae (Borkent, 1993). Lucashevich (2008) mostrou

caracteres morfológicos de larvas da família Culicidae, corroborando o trabalho de

Kalugina (1977) que concluiu que “os Culicideos derivam dos Chaoboridae”. A

família Culicidae deu origem a duas subfamílias denominadas, Culicinae e

Anophelinae. Essa divergência ocorreu há aproximadamente 120 milhões de anos,

no início do Cretáceo (Moreno et al., 2010).

1.2 Gênero Anopheles

O gênero Anopheles Meigen 1818 compreende espécies transmissoras do

agente etiológico causador da malária. A radiação das espécies dentro do gênero se

deu há aproximadamente 79 milhões de anos, no final do Cretáceo (Moreno et al.,

2010), originando os dois maiores vetores da malária tropicais, o An. gambiae e An.

Page 13: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

2

darlingi, no velho mundo e novo mundo, respectivamente. Essas duas espécies

partilham aspectos e hábitos comuns, como a morfologia, a antropofilia das fêmeas

que é caracterizada pela preferência em alimentar-se de sangue humano

característica essencial a um vetor eficiente (Tadei et al., 1998), a preferência na

oviposição, estrutura dos ovos (Consoli e Oliveira, 1994), cariótipo (Rafael e Tadei,

1998), resistência a inseticidas (Soderlund e Knipple, 2003), além da capacidade de

transmitir o agente etiológico da malária de um ser humano a outro (Service, 1996),

e outras características biológicas do mosquito.

1.3 Anopheles darlingi

Há cerca de 500 espécies de mosquitos anofelinos e 70 transmitem parasitas

da malária e, cerca de 20 são importantes vetores da malária humana (Service,

1996). Para que um anofelino transmita a malária ao ser humano, é necessário que

a fêmea adulta se alimente de sangue humano e que o seu ciclo de vida

(sobrevivência e longevidade) seja compatível com o ciclo gametocítico do parasita.

Além disso, aspectos como a densidade populacional e a proporção de picadas do

mosquito em humanos são fatores importantes na determinação da sua capacidade

vetorial numa determinada região (Dye, 1986).

Na região neotropical, o An. darlingi é o vetor da malária mais eficaz (Mirabello

et al., 2008), e na Amazônia brasileira, é o vetor primário da doença (Deane, 1986;

Arruda et al., 1986; Tadei et al., 1998). Um dos principais fatores biológicos que

concorrem para que esta espécie seja a principal vetora da malária é a sua

acentuada preferência em alimentar-se com sangue humano (Tadei et al., 1998),

pois assim os ovos da fêmea entram em maturação e, também, a sua alta

susceptibilidade à infecção pelos Plasmodium falciparum e Plasmodium vivax

(Zimmermam 1992).

1.4 Malária e seus agente etiológicos

A malária é causada por espécies de protozoários do gênero Plasmodium,

que podem ser transmitidas ao hospedeiro vertebrado pela picada de alguns

mosquitos infectados do gênero Anopheles (Marrelli, 2000). A patologia é

caracterizada principalmente por febre intermitente, cefaléia, anemia e

Page 14: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

3

esplenomegalia. É causada pelo P. vivax, P. falciparum e Plasmodium malariae

(Rachou, 1958; Consoli e Oliveira, 1994) e Plasmodium ovale, sendo que este último

ocorre somente nos países africanos. Dentre estas espécies, P. falciparum pode

ocasionar malária grave e óbito (Sucen, 2006). Alguns mosquitos do gênero

Anopheles quando infectados, transmitem espécies de plasmódios a indivíduos que

além de infectar as suas células sanguíneas, infectam também as células hepáticas

(Marelli, 2000), onde se reproduzem assexuadamente levando as células ao

rompimento e liberando, quase que simultaneamente, compostos tóxicos, como a

hemozoína que é liberada pelo parasita da malária, causando picos de calafrios e

febre, característica da malária (Tortora et al., 2000). A malária ou paludismo é

considerada em muitos países um grave problema de saúde pública, onde cerca de

3,2 bilhões de pessoas (40% da população mundial) estão expostas ao risco de

contágio. A malária infecta de 350 a 500 milhões de pessoas anualmente levando a

óbito cerca de 1 milhão de pessoas (WHO, 2005). No Brasil, aproximadamente 99%

dos casos de malária se concentram na região da Amazônia legal (estados do Acre,

Amapá, Amazonas, Pará, Rondônia, Roraima e Tocantins, Maranhão e, Mato

Grosso). A região é considerada área endêmica do país para a malária (MS/SVS,

2005). Em 2010 foram notificados 316.355 casos da doença na Amazônia Legal

(MS/SVS, 2010).

1.5 Caracterização de An. darlingi

Considerando o transmissor da malária no Brasil, alguns estudos vêm sendo

feitos para a melhor compreensão de An. darlingi, como inversões em cromossomos

politênicos e cariótipo (Kreutzer et al., 1972; Tadei et al., 1982; Rafael et al., 1998;

Rafael et al., 2010), comportamento e DNA mitocondrial (Rosa-Freitas et al., 1992;

Freitas-Sibajev et al., 1995), RAPD-ITS2 (Manguin et al., 1999), DNA repetitivo e

genes de sequência única (Rafael et al, 2003, 2004, 2005), DNA microssatélites e

estrutura de população (Scarpassa e Conn, 2007; Mirabello et al., 2008; Lima et al.,

2010), transcriptoma da glândula salivar (Calvo et al., 2009), e mais recentemente o

sequenciamento parcial do transcriptoma de larvas e adultos de An. darlingi (Rafael

et al., 2005; 2008; Souza et al., 2007), os mapeamentos cromossômicos in situ e in

silico de ESTs (Expressed Sequences Tags) desse transcriptoma (Bridi, 2009).

Esses estudos têm auxiliado na caracterização genética e evolutiva de An. darlingi.

Page 15: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

4

1.6 Transcriptoma

O Transcriptoma compreende regiões do DNA que são transcritas em RNA

mensageiro e traduzidas em aminoácidos que formam as proteínas e/ou enzimas

que constituem o organismo. Em estudos de transcriptomas são construídas

bibliotecas de cDNA (DNA complementar). O cDNA é sintetizado a partir do RNA

mensageiro maduro, por meio da enzima transcriptase reversa, garantindo que o

DNA complementar tenha a cópia do gene transcrito. A molécula recém sintetizada é

inserida em um DNA plasmidial bacteriano, que por sua vez é inserido em bactérias.

Usam-se técnicas de engenharia genética, para a clonagem do DNA complementar

de interesse. No interior da bactéria, o plasmídeo recombinante se replica utilizando

a maquinaria celular, já que as bactérias, quando em ambiente adequado, se

multiplicam, replicando assim seu material genético. Após a replicação das

bactérias, os plasmídeos recombinantes são extraídos e tratados com uma reação

de sequenciamento, utilizando o método Dideoxi (Sanger et al., 1977), que consiste

na adição de ddNTPs (didesoxinucleotídeos), que não possuem o grupo hidroxila

(OH) no carbono 1’, o que impede a adição de outro nucleotídeo, interrompendo

assim o alongamento da molécula a ser sequenciada e isso irá originar moléculas

que diferem em tamanho por apenas um nucleotídeo. Esses ddNTPs são ligados a

uma molécula fluorescente e quando passam pelo capilar finíssimo do sequenciador,

um feixe de laser é acionado originando cores diferentes para cada uma das quatro

bases presentes na molécula de DNA. Além disso, o sequenciamento de bibliotecas

de cDNA, para gerar ESTs tem sido considerado uma abordagem versátil, rápida

e econômica, para a descoberta de genes, preferencialmente aqueles expressos

em certos tecidos ou células de organismos multicelulares (Adams et al., 1991;

Liew et al., 1994, Adams et al., 1995; MacCarter et al., 2003). As ESTs representam

cópias de sequências do cDNA oriundas de projetos transcriptomas e são

regularmente depositadas em bancos de dados, como o dbEST (The International

Expressed Sequence Tags Database: www.ncbi.nlm.nih.gov/dbEST), o maior banco

de dados de ESTs do mundo. Considerando os mosquitos vetores de importância

epidemiológica citados nessa dissertação, este banco conta, atualmente, com

68.068.662 ESTs, onde 153.293 são de An. gambiae, 301.596 de Ae. aegypti e

205.274 de Cx. quinquefasciatus contra apenas 2.576 de An. darlingi (dbEST, 2011).

Isso evidencia a necessidade de caracterizar mais sequências gênicas de An.

Page 16: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

5

darlingi, principal vetor da malária no Brasil.

Transcriptomas são sequências denominadas ESTs (Expressed Sequence

Tags), representativas de genes expressos em uma determinada etapa de

desenvolvimento do organismo, e possuem um tamanho médio entre 100-700pb

(Adams et al., 1991), e por apresentar sequências gênicas fragmentadas, elas

passam por um processo de agrupamento ou clusterização. Cada sequência de

cDNA gerado, também pode ser denominada reads, que é uma nomenclatura usual

em Bioinformática. Após o término de um projeto transcriptoma, os reads passam

por um processo de agrupamento, onde são sequenciados, alinhados e aquelas

sequências que se sobrepõem, são agrupadas em sequências maiores, formando

uma sequência consenso ou Contig, também denominadas de cluster gênico, e

sequências que não se agrupam em Contigs, chamadas de singlets (Huang e

Madan, 1999). Nesse processo de clusterização eliminam-se a redundância das

sequências, para posterior inferência de funções aos produtos gênicos.

Posteriormente, as sequências são submetidas ao programa ph2fasta, um software

acoplado ao sequenciador MegaBace1000, que faz a conversão dessas sequências

para um arquivo de computador no formato FASTA.

1.7 Formato FASTA

A sequência no formato FASTA é um requisito para diversos programas de

Bioinformática, como o programa de comparação entre sequências BLAST (Basic

Local Alingment Seach Tools) (Altschul et al., 1997), a ser discutido mais adiante. O

formato FASTA geralmente inclui três partes: (1) uma linha de comentário sobre a

sequência identificado pelo caracter “>” na primeira coluna, seguido pelo nome da

sequência e origem; (2) a sequência de aminoácido ou nucleotídica; (3) a sequência

pode vir com o caracter “*”, indicando o fim da sequência, o uso do asterisco é

opcional, alguns programas de bioinformática exigem essa formatação (Mount,

2001). O uso do caracter “*” é desnecessário nesse trabalho, conforme um exemplo

de arquivo de sequência no formato FASTA a seguir:

>Contig367; 424 1 618 LEN=736; translated (60s ribosomal protein L9)

PRVRLNVEVVLSDLIMRTINSNQTVTVPKGVAVKVHSRVVTVDGPRGRLIKNFRHLP

MDIYKVSKKKLRVEKWFGSKKEIAAVRTVCSHVENMIKGVTKGFQYKMRAVHAHFPI

Page 17: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

6

NCVISENNSLVEIRNFLGEKHIRRVKMQPGVTVVNSAKQKDELVLEGNDIEAVSLSA

ALIQQSTTVRNKDIRKFLDGLYVSEKTTVVQEEE

1.8 Alinhamento de sequências e o algorítimo BLAST

Após a clusterização e a conversão das sequências para o formato FASTA,

as sequências não redundantes geradas em projetos de sequenciamento em via de

regra são submetidas ao processo de alinhamento, por meio da inspeção visual dos

alinhamentos locais contra bancos de dados de nucleotídeos e proteínas, usando a

Ferramenta de Busca Básica de Alinhamento Local (Basic Local Alignment Search

Tools - BLAST) (Altschul et al., 1997). Alinhar sequências significa colocar duas ou

mais sequências lado a lado permitindo emparelhamento de resíduos idênticos

(matches) ou desemparelhamentos (mismatches) entre seus caracteres (bases

nitrogenadas), assim como a inclusão de espaços vazios, gaps (usualmente

representados por hífens) (Prosdocime et al., 2002). Matches, mismatches e gaps

gerados, são utilizados em análises estatísticas para gerar valores de qualidade ao

alinhamento das sequências, como valor de score e e-value (“Expectation value”),

os dois valores estatísticos mostram a qualidade do alinhamento. O primeiro valor,

quanto mais alto, melhor, pois representa um valor positivo. O valor de e-value

quanto mais próximo de “zero” indica o melhor alinhamento (Baxevanis e Oullette,

2001). O alinhamento pode ser global ou local. O alinhamento global é

frequentemente utilizado para determinar regiões mais conservadas de sequências

homólogas e em análises filogenéticas; o alinhamento local é geralmente utilizado

na procura por sequências similares e/ou idênticas para a busca de sequências

homólogas em banco de dados. Essas buscas podem ser entre nucleotídeos ou

entre peptídeos (proteínas).

O algorítimo BLAST é uma abordagem usual para busca de regiões de

similaridade entre sequências (Altschul et al., 1990). O programa BLAST compara

sequências nucleotídicas ou peptídeos fazendo comparações entre pares de

sequências, procurando por regiões de similaridade, além de calcular a significância

estatística dos matches (sequências alinhadas). A tecnologia BLAST pode ser usada

também para inferir relações evolutivas entre sequências bem como ajudar a

identificar membros de famílias gênicas (http://www.ncbi.nlm.nih.gov/BLAST).

Existem alguns tipos de algorítimos derivados da tecnologia BLAST e que são

usados para comparação entre tipos específicos de sequências, como mostra a

Page 18: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

7

Tabela 1 (anexo).

1.8.1 Homologia, Similaridade e Identidade

Uma abordagem utilizada pelo BLAST é o estudo da homologia entre

sequências de um determinado organismo contra outras sequências registradas em

bancos de dados públicos, importantes para identificar genes de diversos

organismos (Kanehisa, 2002). Em alinhamentos entre sequências, procura-se uma

relação de ancestralidade comum, que seja significativa, e essas sequências são

denominadas homólogas. Genes homólogos ou sequências homólogas são

produtos de duplicação gênica, cujo resultado evolutivo pode acumular mutações,

originando novos genes (Haldane, 1932; Muller, 1936). A duplicação gênica é uma

das principais causas da evolução e pode gerar divergência evolutiva. O termo

homologia é o mais importante em alinhamento e comparação de biossequências,

pois se refere à relação evolutiva entre as sequências, ou seja, se possuem ou não

ancestrais comuns. O aparecimento de novos genes por duplicação é muito comum,

principalmente em eucariontes. Esses genes, após a duplicação, seguem sem

pressão seletiva, até que por deriva genética adquirem nova função, ou qualquer

modificação que os torne positivamente selecionados, podendo ser fixados em

determinada espécie. Como consequência dessas duplicações, sequências

homólogas são classificadas em genes ortólogos e parálogos (Pearson, 2001).

Genes ortólogos, estão presentes em espécies diferentes, provavelmente, por

processos de especiação, e normalmente mantêm a mesma função biológica. Genes

parálogos são sequências geradas a partir de eventos de duplicação gênica, e estão

incluídas em um mesmo genoma e que não apresentam necessariamente a mesma

função. Esse processo pode levar à formação de famílias multigênicas, com alta

similaridade entre elas. Para que uma predição de sequência protéica seja confiável

é necessário inferir relações de ortologia entre genes de diferentes espécies

(Tatusov et al., 2000). A homologia é deduzida em função da similaridade e

identidade entre resíduos de aminoácidos ou nucleotídeos presentes em uma

molécula. Resíduos de aminoácidos são similares quando apresentam

características físico-químicas similares, o mesmo volume e caráter de proteínas

hidropáticas (que possuem regiões hidrofóbicas e hidrofílicas). Identidade entre

resíduos de aminoácidos ou nucleotídeos referem-se à porcentagem de resíduos

idênticos entre duas sequências. Identidade e similaridade são variáveis que podem

Page 19: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

8

ser medidas, ao contrário da homologia (Campos et al., 2008). Similaridade não se

aplica a nucleotídeos. No cálculo do valor de similaridade entre peptídeos,

consideram-se os resíduos idênticos e similares.

1.9 Inferência sobre funções gênicas

A busca por similaridade entre sequências em bancos de dados é um

procedimento útil, para inferência de funções biológicas de um gene ou seus

produtos. Genes derivados evoluíram de genes ancestrais, que devem ter função,

estrutura e sequências relacionadas, no caso de sequências homólogas de

organismos evolutivamente relacionados, que derivaram de sucessivas mutações,

de um ancestral comum (Bedell et al., 2003). Os genes ortólogos encontrados em

bancos de dados curados, em processo de anotação, podem fornecer dados sobre a

sequência gênica, tal como a função em que está inserida e até mesmo dados

estruturais. Bancos de dados curados ou secundários são websites, onde as

sequências passaram por anotação automática e manual, para agregar o máximo de

informações possíveis às sequências biológicas. Citam-se o banco de dados do

consórcio Gene Ontology (GO) (www.geneontology.org), que fornece informações

mais criteriosas sobre as sequências depositadas. Ao contrário dos bancos de dados

secundários, os bancos primários, como o GenBank não fornecem muitas

informações biológicas sobre as sequências depositadas.

1.9.1 Genes expressos e suas funções biológicas

A anotação de genes expressos consiste em um processo múltiplo, onde uma

ou mais sequências de DNA ou aminoácidos são analisadas para atribuir significado

biológico às sequências (Stein, 2001). As ESTs obtidas por sequenciamento devem

ser anotadas, por processo que nomeará e associará as sequências às suas

prováveis funções (Kanehisa, 2002). A predição da função, ou anotação, de uma

determinada sequência codificante de proteína é baseada em propriedades

bioquímicas, fisiológicas e físicas aliadas à bioinformática (Weir, 1996). Genes

ortólogos encontrados em bancos de dados públicos fornecem informações a serem

adicionadas às ESTs de vários organismos, cujas sequências derivam de um

ancestral comum e, portanto, têm a mesma função.

O consórcio GO permite a anotação das sequências ESTs obtidas em

projetos transcriptomas. No site http://www.geneontology.org/ encontram-se

Page 20: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

9

informações de produtos gênicos de diferentes organismos. Esta interface da

bioinformática teve início com bancos de dados de organismos como os genomas de

Drosophila melanogaster, Saccharomyces Genome Database (SGD) e genoma de

camundongo (MGD) em 1998. Desde então, o consórcio GO expandiu-se para

incluir bancos de dados de plantas, animais, genomas microbianos e outros. O GO

descreve produtos gênicos em três processos: processos biológicos associados,

componentes celulares e funções moleculares em uma dada espécie de maneira

independente. O primeiro, processo biológico, é uma série de eventos realizados por

um ou mais conjuntos ordenados de funções moleculares, são processos fisiológicos

ou celulares de transdução de sinal. O segundo, denominado de componentes

celulares, refere-se a componentes de uma célula, mas com a ressalva de que é

parte de algum objeto maior, o que pode ser uma estrutura anatômica (por exemplo,

núcleo ou o retículo endoplasmático rugoso) ou de um grupo de produtos de genes

(por exemplo, ribossomo, proteosoma ou um dímero de proteína). O terceiro,

funções moleculares, diz respeito às funções e atividades catalíticas ou obrigatórias

que ocorrem a nível molecular, podendo geralmente ser executadas por produtos de

genes individuais. Quando ocorrer a leitura equivocada do nome de um produto com

a sua função genética molecular, muitas funções moleculares são anotadas com a

palavra "atividade" (www.geneontology.org/cgi-bin/references.cgi).

1.9.2 Genômica comparativa

Os genomas de An. gambiae, Ae. aegypti e Cx.quinquefasciatus estão bem

caracterizados. Foram sequenciados os genomas do An. gambiae com cerca de

278.253.050 pares de bases (pb) (Holt et al., 2002), Ae. aegypti contendo

1.310.090.344 pb (Nene et al., 2007) e Cx. quinquefasciatus com 579,042,118

(http://cquinquefasciatus.vectorbase.org/Culex_quinquefasciatus/Info/Index). A

comparação dessas sequências, por meio de alinhamento local de sequências

contra as ESTs de An. darlingi, faz-se necessária uma vez que esses mosquitos são

de importância epidemiológica e partilham algumas características em comum além

de serem proximamente relacionados evolutivamente. O alinhamento entre

sequências gênicas de duas espécies pode ser feito, também, utilizando o Software

SIM4, que realiza o mapeamento de sequências ESTs em DNA genômico, de forma

que as sequências se alinhem com o máximo de identidade entre elas, delimitando a

posição cromossômica onde a sequência está localizada (Florea et al., 1998).

Page 21: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

10

Outra abordagem comparativa de ESTs vem sendo utilizada, por meio da

Citogenética, como em An. gambiae, cujo foto mapa dos cromossomos politênicos,

contendo 2 pares de autossomos e 1 par sexual foi útil para o mapeamento in silico

de ESTs de An. darlingi (196 sequências) (Bridi, 2009). Os dados gerados pela

autora forneceram algumas informações importantes sobre sintenia gênica entre as

duas espécies, considerando que dados do mapeamento in situ dos cromossomos

de An. darlingi ainda são escassos.

A geração de ESTs de tecidos específicos de mosquitos, incluindo estômago,

glândulas salivares, antenas e corpos gordurosos, de mosquitos anofelinos e

culicíneos, têm gerado centenas de ESTs, que em análises computacionais mostram

centenas de produtos protéicos específicos. Em fêmeas Ae. aegypti, sequenciaram

cerca de 456 clones de glândula salivar (Valenzuela et al., 2002). Cada clone

contém cópias idênticas do fragmento sequenciado, formando 238 clusters, sendo

que cada cluster ou Contig representa ESTs com alta identidade entre si, que foram

agrupadas gerando sequências consenso, com diferentes transcritos. Esses

transcritos codificaram para 118 proteínas de manutenção, 38 produtos secretados e

82 proteínas com função desconhecida. Em An. gambiae, o transcriptoma de

glândulas salivares gerou 691 ESTs (Francischetti et al., 2002), e o banco de ESTs

da glândula salivar de An. darlingi gerou 593 clones (Calvo et al., 2004), enquanto

que o transcriptoma da glândula salivar de Cx. quinquefasciatus, originou 503 clones

(Ribeiro et al., 2004). O trancriptoma da glândula salivar do An. darlingi foi

comparado com sequências da glândula salivar do An. gambiae. Os autores

mostraram significante divergência de proteínas salivares entre essas espécies

(Calvo et al., 2009). Vários produtos proteicos identificados nas glândulas salivares

desses mosquitos desempenham papéis importantes na alimentação sanguínea do

mosquito fêmea, como também, na transmissão dos plasmódios da malária (Ribeiro

e Francischetti, 2003). Considerando o transcriptoma da glândula salivar de An.

darlingi vários produtos gênicos foram identificados. Citam-se células com molécula

T, com função imunomodulatória; dentre os 288 clusters, a detecção de produtos

protéicos de genes com regiões conservadas ou similares a outros genes

conhecidos (putative proteins) foram classificadas em três categorias: (S) produtos

secretados (52,7%), (H) produtos de manutenção (25,1%) e (U) produto com local e

função desconhecida (22%). Dentre essas proteínas, foram anotadas as enzimas

secretoras relacionadas à alimentação com açúcar (alfa glucosidases e alfa

Page 22: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

11

amilases) e proteínas relacionadas ao metabolismo (Calvo et al., 2004). A

comparação entre as categorias das proteínas (S ) e (H) entre An. darlingi e An.

gambiae revelaram que as proteínas salivares são menos conservadas do que as

proteínas de manutenção (housekeeping), e que apresentam mudança evolutiva

com certa rapidez. Posteriormente, Calvo et al., (2009) confirmaram essa significante

divergência de proteínas salivares entre esses dois mosquitos, corroborando os

dados obtidos anteriormente. Dentre essas, apenas 53% de proteínas salivares são

conservadas, enquanto que 86% das proteínas de manutenção são idênticas.

É crescente o número de genomas funcional e estrutural de diversos insetos

disponíveis em bancos de dados, contendo caracterizações funcional, biológica e

evolutiva de sequências geradas e analisadas pela Bioinformática. Considerando

dados de alinhamentos globais, estes têm sido analisados por meio de abordagens

filogenéticas, para confirmação de resultados da bioinformática (Torres, 2006). Na

geração de árvores filogenéticas, destacam-se os métodos estatísticos de Máxima

Parsimônia, Matriz de Distâncias Genéticas e Máxima Verosimilhança. Análises

filogenéticas, a partir de alinhamentos globais entre genes têm estabelecido relações

evolutivas entre sequências gênicas (Torres, 2006). Porém, considerando a filogenia

do gene da Glutationa S Transferase (GST), classe Sigma, a partir de alinhamentos

globais, a literatura não registra estudos filogenéticos envolvendo essa classe de

GST em An. darlingi, An. gambiae, Cx. quinquefasciatus e Ae. aegypti.

Dados sobre genes expressos e seus produtos protéicos podem servir como

ferramentas úteis para pesquisas básicas, comparativas e estudos de

desenvolvimento biológico e evolutivo. Considerando o An. darlingi, há escassez de

transcritos e de genes anotados de An. darlingi, cerca de 2.500 ESTs depositadas

no NCBI (www.ncbi.nlm.nih.gov/dbEST). Por isso, foi realizado o sequenciamento

das moléculas de cDNAs das bibliotecas de larvas e adultos de An. darlingi (Rafael

et al., 2005; 2008; Souza et al., 2007). No presente trabalho, propõem-se a anotação

comparativa automática do transcriptoma parcial de An. darlingi contra sequências

de An. gambiae, Cx. quinquefasciatus e Ae. aegypti (Holt et al., 2002; Nene et al.,

2007), para o aumento do número de sequências caracterizadas e enriquecer

estudos sobre produtos gênicos e a biologia de An. darlingi.

Page 23: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

12

2. OBJETIVOS

2.1 Geral

Anotar e analisar o transcriptoma parcial de Anopheles darlingi.

2.2 Específicos

Fazer a anotação funcional de cerca de 1.360 reads de An. darlingi;

Realizar a análise comparativa do transcriptoma de An. darlingi contra

sequências de An. gambiae, Ae. aegypti e Cx. quinquefasciatus;

Montar uma árvore filogenética da Glutationa -S Transferase, classe Sigma, de

An. darlingi, comparando com a GST Sigma de An. gambiae, Ae. aegypti, Cx.

quinquefasciatus e, como grupo externo, o Phlebotomus papatasi;

Desenvolver um banco de dados e um Website, contendo a anotação

funcional de ESTs de An. darlingi e disponibilizá-lo para acesso pela

comunidade científica.

Page 24: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

13

3. MATERIAL E MÉTODOS

3.1 Mapa local de coletas

Figura 1. Local de coleta de amostras de An. darlingi, utilizadas para as bibliotecas de ESTs de larvas e adultos, município de Coari, AM (Rafael et al., 2005; 2008; Souza et al., 2007).

3.2 Bibliotecas de ESTs de larvas e adultos de An. darlingi

A partir de amostras de An. darlingi coletadas no município de Coari (4º6’S,

63º3’W), estado do Amazonas, conforme licença nº.17524 (IBAMA) foram

construídas bibliotecas de cDNA, utilizando-se 100 mg de larvas de 1º e 2º estádios

e 100 mg adultos de An. darlingi emergidos após 8 horas e não alimentados (Rafael

et al., 2005; 2008; Souza et al., 2007). Os clones foram sequenciados pelo método

Dideoxi (Sanger et al., 1977) e as sequências submetidas à anotação automática. As

estratégias utilizadas na bioinformática, para processar as ESTs, foram por trimagem

(limpeza de sequências contaminantes, como vetores, adaptadores) e clusterização

ou agrupamento de sequências. Após o processamento das ESTs pelos Programas

Phred (www.phrap.org) e phd2fasta (www.phrap.org) (Telles e Silva, 2001), a

anotação automática das ESTs para análise de qualidade e armazenamento das

sequências, clusterização ou agrupamento foi realizada no Laboratório Nacional de

Page 25: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

14

Ciências da Computação–LNCC (www.darlingi.lncc.br), Embrapa Recursos

Genéticos de Biotecnologia (https://valine.cenargen.embrapa.br) e Centro de

Biologia Molecular e Engenharia Genética- CBMEG/UNICAMP e Instituto Nacional

de Pesquisas da Amazônia- INPA.

Na anotação automática, cada grupo de sequências foi obtido pelo CAP3 e

analisado por outras ferramentas de anotação, tendo o programa BlastX como base

de análise. A análise de similaridade foi contra os bancos não redundantes do

GenBank, o Gene Ontology e o banco de nucleotídeos e peptídeos preditos no

genoma de An. gambiae (VectorBase). Cada grupo foi categorizado funcionalmente

mediante os resultados de maior significância estatística após a comparação das

sequências nos bancos de dados genômicos de An. gambiae, Ae. aegypti, Cx.

quinquefasciatus e outros organismos, para obtenção das possíveis funções dos

produtos de cada EST sequenciada.

3.3 Alinhamento de sequências

Considerando os alinhamentos entre sequências é mais seguro utilizar o

sistema operacional Linux para executar o BLAST, a fim de buscar sequências

homólogas, devido à rapidez dos alinhamentos e à confiabilidade dos dados,

evitando que sequências ainda não publicadas se tornem públicas, como por

exemplo, o alinhamento de sequências feitas pelo BLAST, usando o NCBI ou outros

programas do Windows. Assim, não é recomendado o alinhamento de sequências

usando Windows, se as sequências ainda não foram publicadas, como é o caso das

ESTs de An. darlingi. No presente estudo, utilizaram-se a linha de comando do

sistema Linux, para executar os alinhamentos de 568 Unigenes das bibliotecas de

cDNA de larvas e adultos de An. darlingi (Rafael et al., 2005; 2008; Souza et al.,

2007), pelo BLASTx, para buscar sequências homólogas em bancos de dados

genéticos do Centro de Biologia Molecular e Engenharia Genética (CBMEG), da

Universidade Estadual de Campinas (UNICAMP), Estado de São Paulo.

Os Unigenes são sequências referentes a um único gene e que foram

previamente agrupadas a partir de 1360 ESTs geradas nas bibliotecas de cDNA de

An. darlingi, pelo projeto transcriptoma de larvas e adultos (Rafael et al., 2005; 2008;

Souza et al., 2007). No presente estudo, os alinhamentos dessas sequências foram

executados em linha de comando do sistema Linux.

Page 26: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

15

3.4 Anotação e mapeamento de Unigenes pelo Gene Ontology

Os 568 Unigenes de An. darlingi, alinhados pelo programa BLASTx foram

submetidos ao programa Blast2go (Conesa et al., 2005), para a anotação e

mapeamento dos termos do vocabulário de ontologias do Gene Ontology (Processos

Biológicos, Função Biológica e Componentes Celulares). O mapeamento incluiu,

também, vias metabólicas disponíveis no programa KEGG (Kyoto Encyclopedia of

Genes and Genomes) (http://www.genome.jp/kegg/pathway.html) no caso de

sequências que codificam para enzimas. A Figura 2 mostra o Contig404 e o

mapeamento dos termos do consórcio GO, seguido do tamanho, número de hits

encontrados para cada gene e seus valores de e-value, bem como o endereço da

enzima referente ao gene. O Blast2go identificou, também, proteínas ortólogas por

meio de outro banco de dados chamado UNIPROT. O UNIPROT

(http://www.uniprot.org), contém sequências protéicas curadas e associadas aos

termos de ontologia atribuídos pelo programa Gene Ontology Annotation (GOA)

(Harris et al., 2004). No procedimento de anotação e mapeamento dos termos

ontológicos, o blast2go mostra o número de acesso dos produtos gênicos fazendo

link com o UNIPROT. Esse banco de dados é o resultado da união de esforços entre

os grupos responsáveis por PIR, Swiss-Prot e TrEMBL (Apweiler et al., 2004), que

conta com informações de todas as sequências protéicas sequenciadas no mundo.

O UNIPROT faz link com vários bancos curados manualmente (VectorBase, KEEG,

Gene Ontology, PFAM) e com bancos dados primários (EMBL e NCBI). As

informações coletadas nesses bancos podem ser encontradas na Website provisória

de An. darlingi: http://sysbiol.cbmeg.unicamp.br/adarlingi.

Page 27: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

16

Figura 2: Interface Blast2go, mostrando as sequências gênicas de An. darlingi e suas respectivas ontologias, a partir de alinhamentos do Blastx.

3.5 Mapeamento in silico de ESTs de An. darlingi nos cromossomos de An. gambiae

Foi realizado download de sequências do genoma de An. gambiae para o

servidor sysbiol, do CBMEG, UNICAMP. Em seguida os 568 Unigenes de An.

darlingi foram mapeados in silico nos cromossomos de An. gambiae, utilizando-se o

programa SIM4.

3.6 Seleção de genes diferencialmente expressos

Dos 568 Unigenes de An. darlingi, 347 Contigs foram selecionados e

analisados pelo programa Identification Differentially Expressed Genes (IDEG6), a

partir dos Contigs mais expressos e na contagem de ESTs das bibliotecas de larvas

e adultos, baseando-se nos valores do teste estatístico de Audic & Claverie

estabelecidos por essas contagens (Audic e Claverie, 1997), com correção de

Bonferroni (Bonferroni, 1936). O teste estatístico de Audic & Claverie é baseado na

comparação par a par de ESTs entre bibliotecas de cDNA. A necessidade do

emprego desse teste no presente estudo é porque as bibliotecas de An. darlingi

possuem tamanhos diferentes, sendo necessário normalizar esses dados antes de

se fazer as comparações estatísticas.

Page 28: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

17

3.7 Curadoria manual da anotação automática

Após o alinhamento de ESTs usando o BLASTx, os Contigs diferencialmente

expressos em larvas e adultos de An. darlingi, definidos pelo programa IDEG6,

passaram por um processo de inspeção visual para seleção de sequências com o

HSP/HIT (high scoring pair/HIT) com valores maiores ou iguais a 65%, a fim de

encontrar sequências protéicas completas e, portanto, mais significativas e

informativas. Sequências com valores menores que 65% foram armazenadas para

estudos posteriores, pois essas sequências representam apenas um fragmento

muito curto de genes encontrados em bancos de dados. Assim, isso pode gerar uma

falsa hipótese de gene a ser analisado. O valor de HSP/HIT quantifica o quanto a

sequência de consulta, nesse caso Unigenes de An. darlingi, cobre o gene ortólogo

encontrado em bancos de dados, denominado Hit ou subject (sequência consultada

em banco de dados). Dessa forma, cada sequência selecionada tem 65% a 100%

de sua extensão representada nos genes de An. darlingi.

Sequências com HSP/HIT maior ou igual a 65% e suas ORFs (Open

Reading Frame) foram confirmadas pelo programa ORF Finder para posterior

comparação das sequências de aminoácidos de An. darlingi contra sequências

peptídicas disponíveis no GenBank. Isso possibilitou a comparação de resíduos de

aminoácidos em quantidades entre as sequências de An. darlingi (query ou

sequência de consulta) e sequências de bancos de dados (subject), confirmando os

alinhamentos, e os domínios protéicos dessas moléculas, previamente gerados.

Após essa etapa, foram inferidas funções às sequências de An. darlingi, a partir de

genes ortólogos encontradas em bancos de dados. A Figura 3 mostra a interface do

consórcio GO (http://www.geneontology.org/), que associa termos ontológicos à

função protéica.

Page 29: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

18

Figura 3. Interface para busca de genes e suas funções ontológicas, estabelecidas pelo consórcio do Gene ontology.

3.8 Filogenia da Glutationa -S Transferase (GST), classe Sigma

Sequências do gene Glutationa -S Transferase (GST) foram comparadas pelo

programa ClustalW, por meio do alinhamento global entre as sequências homólogas

(Thompson et al., 1994). No presente estudo, construiram-se a árvore filogenética da

GST, classe Sigma, de An. darlingi, An. gambiae, Ae. aegypti, Cx. quinquefasciatus

e Phlebotomus papatasi. Esta última espécie foi utilizada para enraizamento da

árvore filogenética.

Foi utilizado método de Neighbor Joining que se baseia em métodos de

distâncias genéticas (Saitou e Nei, 1987), utilizando o Software Mega4.0 (Tamura et

al., 2007). Este último realiza análises de Bootstrap (Felsenstein, 1985) que são

valores estatísticos, que testam o grau de confiabilidade dos nós das árvores

geradas.

Page 30: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

19

4. Resultados e Discussão

4.1 Compartilhamento de sequências homólogas por espécies

O Blastx executado comparou a homologia das sequências de aminoácidos

traduzidas, a partir das bibliotecas de ESTs de larvas e adultos de An. darlingi contra

os bancos de dados de diversos organismos, incluindo o An. gambiae, Ae. aegypti,

Cx. quinquefasciatus, previamente acessadas no bancos de dados do CBMEG,

UNICAMP. Anopheles gambiae, Ae. aegypti, Cx. quinquefasciatus compartilharam

números significativos de sequências homólogas com An. darlingi. Outras espécies

não compartilharam mais que cinco biossequências, com An. darlingi (Figura 4).

0

50

100

150

200

250

300

350

Sequências

compartilhadas

Anop

hele

s gam

bia

e

Anop

hele

s darlin

gi

Aede

s aegy

pti

Cul

ex

quin

quefa

scia

tus

Outras

esp

éci

es

Espécies

Sequências Homólogas

Sequencias Homólogas

Figura 4. Compartilhamento de sequências homólogas de An. darlingi com An. gambiae,

Ae. aegypti, Cx. quinquefasciatus e outras espécies. Os nomes das espécies são mostradas no eixo x e o número de sequências homólogas, best hits, no eixo y.

Esses resultados mostram que dos 568 Unigenes de An. darlingi alinhados

pelo Blastx em bancos de dados, 61% das sequências (349 Unigenes) são mais

semelhantes às sequências de An. gambiae, 10% das sequências (55 Unigenes)

alinharam com sequências de An. darlingi, oriundas de outros projetos de

sequenciamento, 10% (55 genes) alinharam com sequências Ae. aegypti, 8% (49

Unigenes) alinharam com sequências de Cx. quinquefasciatus e 11% (55 Unigenes)

restantes mostraram alinhamento com outras espécies. Estas últimas não foram

discutidas neste trabalho por não apresentarem relação evolutiva recente com An.

Page 31: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

20

darlingi. Somente sequências com valor de corte do e-value igual ou maior que 10-5

foram analisadas.

Dos 568 Unigenes de An. darlingi, a detecção de 61% das sequências

compartilhadas com An. gambiae era esperado, considerando a ocorrência dessas

duas espécies no gênero Anopheles. O compartilhamento de 8% de sequências em

Ae. aegypti e 11 % em Cx. quinquefasciatus com An. darlingi sugerem uma relação

evolutiva mais distante, corroborando estudos de Reidenbach et al. (2009) e Moreno

et al. (2010), onde mostraram que o tempo de divergência entre anofelinos e

culicíneos data de 120 milhões de anos, no início do Cretáceo. No entanto, Moreno

et al. (2010) comparou o DNA mitocondrial de An. darlingi de duas localidades,

Manaus, Amazonas (America do Sul) e Belize, peníssula de Yucatán (America

Central) com An. gambiae, Anopheles funestus, Anopheles quadrimaculatus. Esses

autores mostraram que a radiação entre An. gambiae, Anopheles funestus,

Anopheles quadrimaculatus e An. darlingi data de aproximadamente 79 milhões de

anos atrás.

Registros fósseis da família Culicidae não são comuns, embora alguns

espécimens tenham sido encontrados preservados em âmbar (Zavortink e Poinar,

2000). Anopheles (Nyssorhynchus) dominicanus é o registro fóssil mais antigo da

subfamília Anophelinae, encontrado no novo mundo e sua idade é controversa,

sendo estabelecida entre 15 a 20 milhões de anos, baseando-se em marcadores de

resgistros fósseis, como indivíduos da ordem foraminífera (Iturralnde-Vincent e

MacPhee, 1996) e no âmbar de 30 a 45 milhões de anos (Schlee, 1990). Dessa

forma, as relações evolutivas entre esses mosquitos têm sido estabelecidas

baseando-se no tempo de divergência entre Anopheles e Drosophila que data de

259.9 milhões de anos (Gaunt e Miles, 2002). Nesse sentido, abordagens evolutivas

relacionando dados de DNA mitocondrial (Moreno et al., 2010) associado a estudos

de genes nucleares, podem futuramente ajudar na estimativa da real idade de

divergência entre espécies do gênero Anopheles, por exemplo, An. darlingi e An.

gambiae. Esses autores mencionaram a importância do genoma nuclear para

corroborar hipóteses evolutivas dessas espécies. Assim, a análise de sequências do

DNA nuclear de An. darlingi pode contribuir com a relação evolutiva entre An.

darlingi e An. gambiae.

Page 32: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

21

4.2 Mapeamento in silico de ESTs de An. darlingi em cromossomos de An. gambiae

O mapeamento in silico mostrou que as sequências de An. darlingi estão

representadas em 793 regiões dos cromossomos de An. gambiae, podendo uma

sequência ter hibridizado em mais de uma região cromossômica. A barra que

representa o cromossomo UNKN, provavelmente, são sequências de An. gambiae

que não tiveram suas regiões definidas dentro do genoma. Assim sendo, 91

sequências de An. darlingi alinharam com essas sequências desconhecidas de An.

gambiae (Figura 5). Esses dados, adicionados ao mapeamento físico e in silico de

ESTs de An. darlingi em cromossomos de An. gambiae (Bridi, 2009), futuramente,

podem ser úteis, para análises de sintenia entre os cromossomos de An. darlingi e

An. gambiae, mutações cromossômicas, translocações, outros rearranjos

cromossômicos e evolução desses anofelinos.

0

50

100

150

200

250

Br. 2L Br. 2R Br. 3L Br. 3R X Y UNKN

Cromossomos

Seq

uen

cia

s

Figura 5: Número de sequências ESTs de An. darlingi (eixo y) representadas em cromossomos de An. gambiae (eixo x).

A Tabela 2 (anexo) mostra uma comparação entre a localização do gene da

GST em cromossomos de An. darlingi e An. gambiae, que foram alinhadas pelo

programa SIM4 e o tamanho dessa sequência em nucleotídeos.

Bridi (2009) identificou por mapeamento in situ ESTs de An. darlingi, e

observou que o gene da GST hibridizou no braço esquerdo do cromossomo

politênico 2 de An. darlingi. No presente trabalho, a GST foi mapeada in silico no

braço esquerdo do cromossomo politênico 3, de An. gambiae. Esse resultado, pode

sugerir um rearranjo cromossômico nessas duas espécies. Inversões paracêntricas

têm sido extensivamente documentadas em algumas espécies de Anopheles por

Page 33: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

22

causa da existência de pontos de quebra em seus cromossômos politênicos (Dideco

et al., 1978; Suguna et al., 1981, 1994; Green et al., 1992; Subbarao et al., 1994,

2000; Poopittayasataporn e Baimai, 1995; Atrie et al., 1999; Pili e Marchi, 1999;

Cornel e Collins, 2000; Ramirez & Dessen, 2000a,b; Coluzzi et al., 2002; Michel et

al., 2005). Em An. gambiae, inversões paracêntricas podem ser um mecanismo de

diferenciação inter e intra específica (Coluzzi et al., 1979; Coluzzi et al., 1985). A

maioria das inversões polimórficas em An. gambiae é detectada nos braços

esquerdo e direito do cromossomo politênico 2 (Coluzzi et al., 2002).

4.3 Mapeamento das sequências ESTs de An. darlingi, pelo Gene Ontology

Os 568 Unigenes de An. darlingi foram mapeados segundo as ontologias do

Gene Ontology (Componente Celular, Função Molecular e Processos Biológicos),

utilizando o programa Blast2go, totalizando 1249 níveis de ontologias obtidas a partir

desses Unigenes. As sequências gênicas podem estar envolvidas em um ou em

mais níveis de ontologias do GO. O termo Função Molecular está associado a 39 %

(486) das sequências, seguido dos termos Processos Biológicos com 31% (382) das

sequências e Componente Celular, sendo representado por 30% (381) das

sequências. O número de sequências está bem distribuído nas três ontologias do

GO (Figura 6).

0

100

200

300

400

500

600

Compon

ente

Cel

ular

Funçã

o M

olec

ular

Proce

ssos

Bio

lógico

s

Ontologias GO

Seq

uen

cias

Figura 6: Distribuição das ESTs de An. darlingi em Componente Celular, Função Molecular e Processos Biológicos. O Eixo y representa o número de Unigenes de An. darlingi e o eixo x representa as ontologias do GO.

Page 34: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

23

O mapeamento de sequências gênicas utilizando-se ontologias associa os

termos do vocabulário do GO, que podem ser aplicados a vários organismos, para a

representação da descrição de genes e papéis de proteínas em células, além de

facilitar buscas futuras sobre o gene em questão (Sales et al., 2008). O

procedimento de se associar genes ortólogos às suas funções celulares é uma

etapa fundamental durante o processo de anotação funcional de genes (Gotz et al.,

2008). Na anotação funcional de genes da glândula salivar de Ae. aegypti,

Valenzuela et al., (2002) anotaram 238 clusters, identificando 118 proteínas de

manutenção; 38 produtos secretados e 82 proteínas com funções desconhecidas.

Em An. gambiae, o transcriptoma de glândulas salivares gerou 691 ESTs divididas

em 403 proteínas secretoras, 165 proteínas de manutenção e 123 com funções

desconhecidas (Francischetti et al., 2002). Em proteínas salivares de An. darlingi,

Calvo et al., (2009) analisaram 797 ESTs, onde 50% das sequências estão

associadas a proteínas secretoras, 34% correspondem a proteínas de manutanção e

16% são classes protéicas ainda desconhecidas. No presente estudo, os 568

Unigenes de An. darlingi estão associados às seguintes ontologias: função

molecular (39%), processos biológicos (31%) e componente celular (30%). Análises

de ontologias associadas a genes permitem a comparação entre classes gênicas,

como será abordado no 4.5

4.4 Expressão diferencial de genes em larvas e adultos de An. darlingi

A triagem de genes diferencialmente expressos foi feita usando somente 347

Contigs, onde 20 genes são mais expressos em adultos, 71 genes mais expressos

em larvas e 256 são expressos em ambas etapas do desenvolvimento de An.

darlingi (Figura 7).

Figura 7: Análises de expressão diferencial dos 347 Contigs de An. darlingi, pelo IDEG6. Em adultos (Ad) foram observados 20 Contigs mais expressos; em larvas (La) foram mais expressos 71 Contigs e, em adultos e larvas (Ad e La) foram mais expressos em comum 256 Contigs.

20 Ad

71 La

Ad 256 La

Page 35: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

24

Essa diferença entre os genes diferencialmente expressos em larvas e adultos

sugere que a atividade gênica na fase imatura é mais intensa que na fase alada do

mosquito. Durante o desenvolvimento das larvas, é maior a mudança de estrutura do

corpo em períodos curto de tempo e maior a produção de hormônios necessários

para ativação de genes específicos, como genes envolvidos na transcrição, tradução

e em estruturas ribossômicas (Lewin, 1994).

Genes diferencialmente expressos, seja em diferentes tecidos, ou durante

diferentes fases do desenvolvimento de um organismo, ou até mesmo durante

patologias específicas são o principal interesse em pesquisas básicas e

farmacêuticas (Audic e Claverie, 1997), e os dados da Figura 7 fornecem

informações em que fase do desenvolvimento do organismo, fica mais fácil se

localizar um determinado gene. Na Tabela 3 (anexo) estão representados os Contigs

diferencialmente expressos, seguidos do valor de suas bibliotecas normalizadas bem

como os valores estatísticos de p-value que quantificam o grau de confiabilidade das

análises de expressão diferencial.

4.5 Avaliação manual de sequências expressas diferencialmente

Entre as sequências diferencialmente expressas de larvas e adultos de An.

darlingi, 36 foram selecionadas em função de seu valor de HSP/HIT ser maior ou

igual a 65%. A Figura 8 mostra a distribuição das ontologias (Função Molecular,

Processo Biológico e Componente Celular) e os genes envolvidos nesses termos

ontológicos do GO. As sequências selecionadas de larvas e adultos de An. darlingi

estão distribuídas nessas ontologias, com suas respectivas funções. Em larvas,

35%, 33% e 32% dos genes estão envolvidos em Função Molecular, Processo

Biológico e Componente Celular , respectivamente (Figura 8). Em adultos, 35%, 26%

e 38% do genes estão envolvidos em Função Molecular, Processo Biológico e

Componente Celular, respectivamente (Figura 8).

Page 36: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

25

0

2

4

6

8

10

12

14

16

18

Pro

cess

o biológ

ico

Funçã

o m

olec

ular

Com

ponen

te celular

Seq

uen

cia

s

Adultos

Larvas

Figura 8: Distribuição das sequências por ontologias dos termos do Gene Ontology em larvas e adultos de An.darlingi. As sequências são observadas em uma ou nas três ontologias. Todas as sequências mostradas têm HSP/HIT >= 65%.

Comparações de genes e ontologias que descrevem a função do gene na

célula podem fornecer uma melhor compreensão das atividades gênicas nas etapas

do desenvolvimento do organismo. A comparação entre sequências de classes

protéicas, relacionadas a proteínas de manutenção e proteínas secretoras entre o

transcriptoma da glândula salivar de An. darlingi e An. gambiae mostrou que 53%

das proteínas salivares são idênticas, enquanto que 86% das proteínas de

manutenção são idênticas entre as duas espécies (Calvo et al., 2009). Porém, esses

autores inferiram que as proteínas de manutenção são mais conservadas em

relação a proteínas salivares. Na comparação de ontologias de larvas e adultos de

An. darlingi realizadas nesta dissertação, a ontologia Processo Biológico é mais

abundante em larvas (33%) em relação a mesma ontologia em adultos (26%). Em

adultos, a ontologia Componente Celular é mais abundante (38%) em relação a

mesma ontologia em larvas (32%). Os genes usados nessas análises são

específicos, nas fases de larva e adulto de An. darlingi e apresentam 65% ou mais

de cobertura contra as sequências alinhadas em bancos de dados, aumentando a

confiabilidade da anotação de genes completos. Todas as sequências, envolvidas

em ontologias possuem funções mais específicas, como mostram as figuras 9, 10,

11 representando as ontologias: Processo Biológico, Função Molecular e

Componente Celular, associadas às sequências de An. darlingi adulto. Esses genes

possuem HSP/HIT >=65%.

Page 37: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

26

Figura 9: Genes de An. darlingi adultos e subníveis da ontologia Processo Biológico (P).

Figura 10: Genes de An. darlingi adultos e subníveis da ontologia Função Molecular (F).

Page 38: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

27

Figura 11: Genes de An. darlingi adultos e subníveis da ontologia Componente Celular (C).

Os Contigs mais expressos em adultos e que possuem HSP/HIT >=65% são

mostrados na Tabela 3 (anexo), juntamente com o código de identificação do gene

ortólogo em banco de dados, código de acesso da proteína em banco de dados

UNIPROT, que possui sequências curadas, assim como seus respectivos valores

estatísticos (Score , E-value e HSP/HIT).

As mesmas análises foram realizadas, também, com os genes de An. darlingi

mais expressos em larvas classificando-os segundo as ontologias em que estão

inseridos. As Figuras 12, 13 e 14 representam as ontologias (Processos Biológicos;

Função Molecular e Componente Celular, respectivamente) e as subfunções nas

quais os produtos gênicos estão envolvidos.

Page 39: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

28

Figura 12: Genes de larvas de An. darlingi e subfunções da ontologia Processo Biológico (P).

Figura 13: Genes de larvas An. darlingi e subfunções da ontologia Função Molecular (F).

Page 40: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

29

Figura 14: Genes de larvas An. darlingi e subfunções da ontologia Componente Celular

(C).

Os Contigs mais expressos em larvas com o HSP/HIT >=65% são mostrados

na Tabela 4 (anexo), que incluem os códigos de identificação do gene ortólogo em

banco de dados e de acesso da proteína em banco de dados UNIPROT, que

possuem sequências curadas, assim como seus respectivos valores estatísticos

(Score, E-value e HSP/HIT).

É importante ressaltar que, considerando os genes expressos em adultos e

larvas mostrados nas Tabelas 3 e 4 (anexo), os maiores valores de e-value

encontrados foram os referentes aos hits dos Contigs 253 (1.732 e-7), 259 ( 1.080 e-

17) e Contig 75 (2.05 e-16), sendo que os dois primeiros são mais expressos em

larvas e o terceiro expresso em adulto. Excetuando-se esses valores, os cálculos de

e-value dos outros Contigs diferencialmente expressos variaram de e-31 a e= 0.0.

Os alinhamentos das sequências mostraram Hits (sequências homólogas)

com bons valores estatísticos, e a inspeção manual e escolha dos Hits com valores

de cobertura maior ou igual a 65%. Esses dados permitiram certa confiabilidade,

para a inferência de funções para as sequências com genes ortólogos, já que são

sequências peptídicas completas encontradas em outros organismos. Os valores

estatísticos e a localização desses genes estão nas Tabelas 4 e 5 (anexo).

Page 41: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

30

4.6 Inferências de funções de genes ortólogos

As funções de genes ortólogos diferencialmente expressos em larvas e

adultos de An. darlingi, com HSP/HIT >=65% foram pesquisadas na literatura, e

cada produto gênico pode estar inserido em uma ou mais das três ontologias

(Componente Celular, Processo Biológico, Função Molecular) do consórcio GO. As

informações sobre cada produto estão descritas a seguir.

Proteínas homólogas de membrana vitelínica (Vitelline membrane

protein homolog). O Contig253 de An. darlingi apresentou homologia com a

Vitelline membrane protein 15a-2 de Ae. aegypti, cuja proteína está bem

caracterizada, com 97 resíduos de aminoácidos. No mosquito Ae. aegypti, essa

molécula tem uma atividade oostática. É expressa no ovário, região anterior do

folículo celular (Borovsky et al., 1990; Borovsky, 2003) e, posteriormente, circula na

hemolinfa. Inibe a biossíntese da tripsina em células do epitélio intestinal que

indiretamente reduz a concentração da vitelogenina na hemolinfa resultando em

inibição do desenvolvimento do oocisto. Pertence à família das proteínas de

membrana. Na espécie An. darlingi essa proteína está associada à região

extracelular no termo Componente Celular (UNIPROT), conforme as ontologias do

GO.

Actina (Actin). Os Contigs 629 e 68 apresentaram homologia com An.

gambiae que possui cinco genes da actina (Salazar et al., 1994), Ae. aegypti, com

quatro genes bem caracterizados (Smartt e Erickson, 2008) e dois genes da actina

em Cx. pipiens L. (Kim et al., 2006). A Actina é o maior componente do

citoesqueleto em células eucarióticas. Apresenta papel estrutural e participa de

processos de mobilidade celular. É uma proteína abundante e altamente conservada

em células eucariotas (Sheterline et al., 1991). Os produtos protéicos de duplicação

dos genes de actina são tipicamente conservados ao nível de aminoácidos (Roper et

al., 2005). Filamentos de actina ativam a atividade miosina Mg2 + ATPase e o

movimento ao longo dos filamentos produz força para a contração muscular,

movimento celular e cromossômico, fagocitose e sinalização intracelular (Machesky

e Insall, 1999; deRouvroit e Goffinet, 2001; Pollard et al., 2000; Fox, 2001). Além

disso, a actina é importante nos processos biológicos, tais como o desenvolvimento

embrionário e na cicatrização.

Em contraste com a alta conservação de suas sequências de aminoácidos, a

actina tem um amplo espectro de funções. A função da actina na estrutura do

Page 42: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

31

citoesqueleto da célula inclui a determinação da forma celular, motilidade celular,

citocinese, transporte intracelular, e contratilidade muscular (Pollard et al., 1984).

Está presente, também, no sarcômero muscular participando da construção de

microfibrilas em células musculares (He e Haymer 1994) e nos estágios iniciais da

transcrição (Egly et al., 1984). No processo de anotação da actina em An. darlingi,

esse gene está descrito em Componente Celular, onde está representado no

citoplasma, citoesqueleto; e em Função Molecular participa das ligações da molécula

de ATP e de proteína ou complexo protéico.

Protease de Serina (Serine Protease). Os Contigs242 e 605 tiveram

homologia com Serina Protease de An. gambiae. Esta proteína é encontrada em

todos os reinos, incluindo vírus (Hedstrom, 2002). É um grupo de enzimas

proteolíticas importante, que cliva esqueletos de peptídeos usando a “Tríade

Catalítica” de histidina , serina e ácido aspártico, que são conservados entre os

membros da família (Pearson, 2001). Tem um importante papel em processos

biológicos, como sinalização celular, defesa e desenvolvimento (Zhao et al., 2010).

As proteases de serinas estão relacionadas à imunidade e têm sido investigadas

quanto em An. gambiae, onde ela pode estar envolvida na defesa contra o parasita

causador da malária (Christophides et al., 2002). O genoma de Ae. aegypti possui

369 genes similares à Protease de Serina, dos quais 66 são putative trypsin

(Venancio et al., 2009). Entretanto, somente cinco foram caracterizadas no intestino

de fêmeas adultas desse mosquito. Diversos fatores podem contribuir para essa

grande discrepância. As proteases de serinas são conhecidas como enzimas

importantes na digestão; estão envolvidas, também, em outros processos, como

imunidade, reprodução, desenvolvimento, sinal de transdução e cicatrização de

feridas (Barros et al., 1996; Coughlin, 2000; Hedstrom, 2002; Joseph et al., 2001;

LeMosy et al., 1999; Neurath, 1984).

Um pequeno grupo destas enzimas foi encontrado em glândulas salivares de

fêmeas adultas de An. gambiae, o que indica também um papel na alimentação

sanguínea, talvez ativando as vias antiinflamatórias (Ribeiro et al., 2007). Em An.

darlingi a Serina Protease está envolvida em Componente Celular, na região

extracelular e em Processo Biológico, onde atua em resposta à defesa a protozoário.

tpa_inf: hdc00331. O gene ortólogo ao Contig14 com o melhor hit a esse

Contig, é a proteína AGAP009526-PA de An. gambiae, localizada no braço direito,

do cromossomo 3, desse vetor da malária africana. Essa é uma proteína completa, e

Page 43: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

32

possui 74 resíduos de aminoácido, com massa molecular de 7.974,63, ponto

isoelétrico de 10.3028 e seu transcrito tem 569 pares de base. Está envolvida em

Componente Celular, participa da cadeia respiratória da mitocôndria, e em Função

Molecular, participa das atividades de transporte de elétrons (site Vector Base).

Receptor de rodopsina putativo 3 (putative rhodopsin receptor 3)

(AGAP001163-PA). Essa sequência, Contig16, é ortóloga em An. gambiae e está

localizada no braço direito do cromossomo 2. É uma proteína completa, com 370

resíduos de aminoácidos. A Rodopsina (Rhodopsin), da família das proteínas

Opsina, está presente nos olhos compostos de insetos; é um fotoreceptor e está

presente na célula da retínula (Spaethe e Briscoe, 2004). Apresenta o domínio

receptor transmembrana 7 (transmembrane receptor domain 7) e está representada

nas três ontologias do consórcio GO. Em An. darlingi, essa proteína está inserida em

Função Molecular, subfunções G-protein coupled receptor activity, receptores de

transdução de sinais extracelulares, através da membrana celular. No lado externo,

esses receptores recebem um ligante (um fóton), e no lado citosólico eles ativam um

nucleotídeo da proteína ligante de guanina (G). Tais receptores são proteínas

hidrofóbicas que atravessam a membrana por sete vezes. Na subfunção de

atividade fotoreceptora, atuam absorvendo e respondendo às radiações

eletromagnéticas incidentes, especialmente à luz visível. A resposta pode envolver

uma mudança de conformação da proteína. Está envolvida também em Processos

Biológicos, subfunção fototransdução, ocorre uma sequência de reações dentro de

uma célula necessária para converter os fótons absorvidos em um sinal molecular;

na subfunção proteína ligada a cromóforo (Protein-chromophore linkage), ocorre a

ligação covalente ou não covalente de um cromóforo (molécula que absorve e

transmite a energia da luz) a uma proteína; na subfunção percepção visual o

organismo recebe um estímulo visual, que é convertido em um sinal molecular,

reconhece e caracteriza o sinal. Estímulos visuais são recebidos em forma de fótons

e são processados para formar uma imagem. Está presente em Componente

Celular, subfunção membrana total, indica que a totalidade ou parte da sequência de

peptídeos é incorporada na membrana celular.

Proteína 30s unidade ribossomal 40s (40s ribosomal protein s30). O

Contig260 apresentou homologia a essa proteína. A proteína 30s unidade

ribossomal 40s foi alinhada a partir da fusão da proteína 30s da unidade ribossomal

40s com a proteína ubiquitina, cujas sequências tiveram origem da glândula salivar

Page 44: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

33

de An. darlingi (Calvo at al., 2009). A proteína completa possui 132 resíduos de

aminoácidos e está envolvida em Componente Celular, ribossomo, que é o sitio da

biossíntese de proteínas resultantes da tradução do RNA mensageiro (RNAm);

Função Celular, onde participa do componente estrutural do ribossomo; Processo

Biológico e tradução, que é um processo metabólico celular em que uma proteína é

formada, usando a sequência de uma molécula de RNAm maduro para especificar a

sequência de aminoácidos de uma cadeia polipeptídica. Detectada também na

glândula salivar de An. gambiae mostrou uma alta similaridade com a sequência

peptídica de An. darlingi, apresentando um e-value de 5.56346e-41. Em An. gambiae,

esta proteína esta localizada no cromossomo X. O endereço AD-239 é uma proteína

de manutenção (HouseKeeping protein), com 131 resíduos de aminoácidos (Calvo et

al., 2009), e tem um ponto isoelétrico de 10.7792 e sua massa molecular é igual a

14.256,33.

Miosina de Cadeia leve 2 (Myosin light chain 2). Em An. darlingi, o gene

ortólogo com o melhor hit ao Contig584 é o da Miosina de cadeia leve 2, de Cx.

quinquefasciatus, uma proteína completa, que possui 210 resíduos de aminoácidos,

tanto em An. darlingi como em Cx. quinquefasciatus, conforme visto nos resultados

do Blast2go. Em Cx. quinquefasciatus, essa proteína possui um ponto isoelétrico

igual a 4.3776 e sua massa molecular é de 22.852,17 (vectorbase). Filamentos de

actina ativam a atividade miosina Mg2 + ATPase e o movimento ao longo dos

filamentos produz força para a contração muscular, movimento celular e

cromossômico, fagocitose e sinalização intracelular (Machesky e Insall, 1999;

deRouvroit e Goffinet, 2001; Pollard et al., 2000; Fox, 2001). Em An. darlingi, esta

proteína está envolvida na ontologia Função Molecular, subfunção atividade motora

de microfilamento (microfilament motor activity), catálise de movimento ao longo de

um microfilamento, acoplado à hidrólise de um nucleosídeo trifosfato (ATP

normalmente); subfunção íon ligante de cácio (calcium ion binding), interação

seletiva, não covalente, com íons Ca2+.

Proteínas de choque ao calor (Heat Shock Proteins = HSPs). Em An.

darlingi, a sequência ADLSDA03024A08.g00 encontrou o melhor Hit com HSPs de

Ae. aegypti. As HSPs respondem a muitos tipos de estresse ambiental (Parsell e

Lindquist, 1993; Feder e Hofmann, 1999; Rinehart et al., 2007). Em estudos em An.

gambiae, Ae. aegypti e Cx. pipiens foi observado que proteínas de choque térmico

contribuem na tolerância à desidratação (Benoit et al., 2010). Os genes HSP60 e

Page 45: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

34

HSP90 foram nocauteados (knocked down) por RNA de interferência (RNAi) e as

amostras dos mosquitos submetidas à perda de água. Em seguida a comparação foi

feita com um grupo controle, verificando a taxa de mortalidade dos mosquitos sem

os genes HSP60 e HSP90. Avaliando-se as taxas de perda de água, esses autores

concluíram que Ae. aegypti é a espécie mais resistente à desidratação, seguida de

Cx. pipiens e o An. gambiae. Em An. darlingi, esta proteína esta inserida em Função

Molecular, em ligação ao ATP; participa também do Componente Celular,

diretamente no citoplasma; em Processo Biológico, participa em resposta ao

estresse celular e em processo de conformação de proteína celular.

Hexamerina (Hexamerin) ou arilforina (arylphorin-like protein). Em An.

darlingi, o Contig211 encontrou o melhor Hit com Hexamerina de An. gambiae.

Hexamerina é uma proteína de estoque de grande importânica para insetos

holometábulos; é sintetizada no corpo gorduroso primariamente no término do

estágio larval, e secretada na hemolinfa (Jinwal et al., 2006). Ao final do estágio

larval, a síntese protéica é interrompida abruptamente (Kanost et al.,1990; Telfer e

Kuntel., 1991), reaparecendo na fase adulta de An. gambiae, mas em níveis

menores (Zakharkin et al., 1997). Essa proteína é rica em aminoácidos aromáticos,

como a Fenilalanina (Phe) e a Tirosina (Try) (21% Phe + Tyr), servindo de reserva

de aminoácidos na pupa, fase em que ocorre a diapausa, acompanhada de

interrupção na alimentação desse imaturo (Jinwal et al., 2006). A Hexamerina tem

papel importante na maturação do sistema reprodutor de mosquitos, cuja falta reduz

significativamente a fertilidade de indivíduos adultos. Zakharkin et al. (1997)

mapearam o gene da Hexamerina de An. gambiae (AgHex-1.1), e o sinal da

hibridização in situ desse gene ocorreu na região cromossômica do braço 2L. Nesta

dissertação, o mapeamento in silico da Hexamerina em cromossomos de An.

gambiae mostrou-se compatível com o mapeamento in situ obtido por por Zakharkin

et al. (1997). Em resultados da Hexamerina de An. darlingi obtidos pelos Blast2go,

essa proteína está envolvida em Componente Celular, atuando especificamente na

matriz extracelular; Função Molecular, atuando no transporte de oxigênio e em

atividades de reservas de nutrientes.

Arrestina. Em An. darlingi, o Contig637 teve homologia com Arrestina de An.

gambiae. Essa proteina têm sido caracterizadas e divididas em duas grandes

categorias, que têm suas funções presumidas a partir de seus papéis funcionais

(Craft et al., 1995). A primeira, está relacionada às Arrestinas visuais, que têm

Page 46: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

35

apresentado expressão gênica quase exclusivamente em fotoreceptores, e

interagem com a rodopsina para o término do estímulo visual (Kiselev et al., 1997;

Gurevit, 1998). A segunda, compreende arrestinas não visuais, expressas em uma

variedade de tecidos (excluindo fotoreceptores), as quais podem interagir com

diversas proteínas receptoras de acoplamento (protein-coupled receptor-GPCRs-G)

(Gurevit et al., 1995). Merrill et al. (2001) isolaram a arrestina 1 de antenas de An.

gambiae (AgArr1), para estudar o seu potencial papel na regulação de sinais

olfatórios. Mas, o papel da Arrestina na regulação de sinais olfatórios em An.

gambiae não foi bem esclarecido. A expressão da arrestina em estágios iniciais de

larvas até a idade adulta de An. gambiae foi observada por Merril et al. (2001), que

sugeriram que este gene além de funcionar em vias sensoriais, pode atuar em

outras vias metabólicas, durante todo o ciclo de vida do mosquito. Em An. darlingi,

esta proteína participa do Processo Biológico diretamente em resposta a estímulos

químicos, percepção sensorial e transdução de sinal.

Genes de resistência a inseticidas. Estudos genéticos sobre resistência a

inseticidas têm indicado a existência de três grandes famílias de genes, que são

citocromo P450 (CYP), Glutationa S-transferase (GST) e carboxyl esterase (COE)

(Ranson et al., 2002).

Citocromo c oxidase. Citocromo c oxidase ou complexo IV é um amplo

complexo de proteínas transmembrana encontrado na mitocôndria e está envolvido

na cadeia transportadora de elétrons, onde tem importante papel na geração de ATP

durante a fosforilação oxidativa (Pridgeon et al., 2009). Em eucariotos, três

subunidades (i-iii) de citocromo c oxidase são codificadas no DNA mitocondrial,

formando o núcleo funcional da enzima citocromo c oxidase (Wikstrom e Casey,

1985). Esses autores estudaram os genes mitocondriais que codificam para o

citocromo oxidase subunidade c (cytochrome c subunit), citocromo oxidase

subunidade ii (cytochrome oxidase subunit ii), citocromo mitocondrial oxidase c

subunidade 5b, isoforma 1 (mitochondrial cytochrome c oxidase subunit 5b isoform

1), citocromo oxidase subunidade iii (cytochrome c oxidase subunit iii). No

transcriptoma de An. darlingi, a proteína está representada pelos Contigs 423, 439,

514, 589, respectivamente. Está envolvida nas ontologias Componente Celular,

especificamente na membrana interna da mitocondria, cadeia respiratória; Função

Molecular, atividade transportadora de elétrons; Processos Biológicos,

especificamente em transporte de elétrons na mitocondria.

Page 47: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

36

Glutathione S-transferase (GST), classe Sigma (GSTs). O Contig404 de An.

darlingi encontrou homologia com a GST Sigma de Ae. aegypti. A família das

enzimas GSTs consiste de 31 genes (Srivastava et al., 2010). É uma família de

enzimas multifuncionais e está presente unicamente em organismos aeróbicos,

plantas e animais (Wang et al., 2008). As GSTs catalizam compostos endógenos e

exógenos, sendo que suas principais funções são a síntese e degradação de

drogas, detoxificação de compostos xenobióticos, incluindo poluentes ambientais,

químicos e pesticidas (Ranson et al., 2005). Estão envolvidas, ainda, no combate ao

estresse oxidativo (Collins et al., 2004). São bem conhecidas por conferir resistência

ao inseticida DDT [1,1,1-trichloro-2,2-bis-(p-chlorophenyl) ethane] (Prapanthadara et

al., 1993). Seis classes de GSTs de insetos têm sido identificadas: classes Delta

(GSTd), Epsilon (GSTe), Ômega (GSTo), Sigma (GSTs), Theta (GSTt) e Zeta

(GSTz) (Tang e Tu, 1994; Huang et al., 1998; Ortelli et al., 2003). As classes Delta e

Epsilon são encontradas exclusivamente em insetos, e membros dessas duas

classes estão envolvidos na resistência aos inseticidas organofosforados,

organoclorados e piretróides (Fournier et al., 1992; Grant e Hammock, 1992;

Kostaropoulos et al., 2001; Vontas et al., 2001; Ranson et al., 2004).

Perfis de expressão de genes GSTs Epsilon indicam que cinco destes são

super expressos em linhagens de An. gambiae resistentes ao DDT. Entre eles, o

gene agGSTe2, presente na ontologia Função Molecular, participa da atividade

transferase da GST. Sua expressão ocorre em cerca de oito vezes e tem uma

comprovada capacidade de metabolização do DDT. Essa amostragem evidencia que

agGSTe2 é a enzima mais importante na desintoxicação do DDT, que no caso do

An. gambiae pode ser 350 vezes mais eficaz em relação ao gene agGST1-6, classe

delta (Wang et al., 2008). GSTd1 e GSTs1 (GSTs Delta e Sigma) são genes

ortólogos em An. gambiae e Ae. aegypti, cuja diferença ocorre em função de

variações no splicing alternativo. A conservação nos sítios de splicing sugere que o

splicing alternativo nestes genes tem ocorrido desde antes da divergência entre os

gêneros Aedes e Anopheles (Lumjuan et al., 2007). O papel da GSTs1 como

resistente à inseticida é desconhecido, mas essa classe exerce a função de a

detoxificar o estresse oxidativo, gerado pelos músculos de vôos dos insetos (Clayton

et al., 1998). GSTs Theta e Omega foram reportadas em An. gambiae (Ding et al.,

2003). Em Ae. aegypti GST Theta não está relacionada a resistência ao inseticida

DDT (Lumjuan et al., 2005). Em Drosophila essa classe foi associada a funções em

Page 48: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

37

respostas ao estresse oxidativo (Toung et al., 1993). No bicho da seda, a GST,

classe Theta também são associadas com mescanismos contra estresse oxidativo e,

ainda, a metabolismos de produtos da peroxidação de lipídeos (Yamamoto et al.,

2005). GSTs classe Omega são encontradas em Anopheles cracens, e estão

associadas ao estresse oxidativo (Wongtrakul et al., 2010).

Em An. darlingi, gene GST, classe Sigma, está representado na ontologia

Função Molecular na atividade transferase da GST. Os resultados deste trabalho

mostraram que, a homologia do Contig404 com a GST de Ae. aegypti apresenta um

e-value 3.90142 e-104; já An. gambiae esse gene apresenta um e-value 8.69147 e-103.

Esses valores de e-value mostram a alta similaridade que esses genes tem com o

Contig404 de An. darlingi. As análises feitas pelo alinhamento global e filogenia do

presente trabalho agrupou o Contig404 com a GST, classe Sigma, de An. gambiae

no mesmo ramo, mostrando que nessas espécies, as GSTs são mais relacionadas

evolutivamente, como será discutido no item a seguir.

4.7 Filogenia da Glutationa S Transferase, Classe Sigma

O gene da GST é encontrado na maioria dos insetos (Fournier et al., 1992;

Grant e Hammock, 1992; Kostaropoulos et al., 2001; Vontas et al., 2001; Ranson et

al., 2004), tal como em An. darlingi. Segundo os autores Petsko e Ringe ( 2003)

sequências da mesma proteína, mas de espécies diferentes podem ser comparadas

a fim de deduzir relações evolutivas. Aquelas sequências gênicas, que evoluíram

recentemente de um gene ancestral ainda terão relativa semelhança. Porém, genes

que têm um ancestral comum mais distante terão acumulado muito mais mutações,

e sua relação evolutiva será menos óbvia e difícil de deduzir somente através de

determinada sequência. Nesse sentido, compararam-se filogeneticamente a GST,

classe Sigma, de An. darlingi contra genes ortólogos, cujos valores de e-value foram

em An. gambiae (2.52 e-102), Ae. aegypti (8.9 e-103 e 3.9 e-103) e Cx. quinquefasciatus

(2.52 e-102), previamente confirmadas pelos alinhamentos do BlastX. A sequência

GST Sigma de Phlebotomus papatasi, que teve seu e-value igual a 7.39 e-86 foi

usada para enraizamento da árvore filogenética por não ser nem tão distante e nem

tão próxima evolutivamente da sequência GST de An. darlingi, visto que sequências

muito relacionadas não irão fornecer muita informação evolutiva e sequências muito

distantes podem fornecer dados evolutivos não muito confiáveis devido às múltiplas

mutações em um ou em vários sítios da molécula (Ridley, 2006). A árvore gerada é

mostrada na Figura 15.

Page 49: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

38

Figura 15: Análise filogenética do Gene Glutationa-STransferase, segundo o método

de Neighbor Joining - NJ (Saitou e Nei, 1987) e o software MEGA 4.0 (Tamura et al., 2007).

Nessa análise foram observados dois ramos. O primeiro formado por

Phlebotomus papatasi e o segundo por Cx. quinquefasciatus, An. darlingi, An.

gambiae e Ae. aegypti. As sequências de Ae. aegypti, An. gambiae e An. darlingi

tiveram um ancestral comum e a sequência de Cx. quinquefasciatus divergiu antes

dessas três espécies de mosquito. O gene mais relacionado evolutivamente com o

gene de An. darlingi é a GST de An. gambiae, que na análise acima estão

agrupadas em um mesmo ramo como espécies irmãs.

Os valores de Bootstrap (Felsenstein, 1985) igual ou maiores que 95 % mostram

o grau de confiança nos nós da árvore que conectam as OTUs (Unidades

taxonômicas operacionais), nesse caso, as sequências gênicas.

5. Conclusão

Dos 568 Unigenes de An. darlingi 61% tiveram homologia com sequências de

An. gambiae, mostrando que essas duas espécies estão mais próximas entre si,

evolutivamente, do que ao Ae. aegypti e Cx. quinquefasciatus.

Os 568 Unigenes de An. darlingi foram hibridizados in silico, em 793 regiões

cromossômicas, no cariótipo de An. gambiae disponível no banco de dados

vectorbase.

A anotação manual e análise dos genes diferencialmente expressos foi a partir

de 1.360 reads do banco de ESTs de An. darlingi. A expressão diferencial de ESTs

foi maior em larvas do que em adultos de An. darlingi, talvez em função das

transformações morfológicas e fisiológicas características dessa fase larvária. Esses

dados associados a bancos de ESTs e à literatura em geral são importantes, para a

Page 50: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

39

compreensão da expressão gênica e aspectos evolutivos do An. darlingi em relação

ao An.gambiae, Ae. aegypti e Cx. quinquefasciatus.

A análise filogenética do gene GST mostrou o agrupamento dessa sequência

gênica de An. darlingi com An. gambiae em um mesmo ramo, mostrando que a

sequência dessas duas espécies evoluíram a partir de um ancestral comum.

6. Referências Bibliográficas

Adams, M. D.; Kelley, J. M.; Gocayne, J. D.; Dubnick, M.; Polymeropoulos, M. H.;

Xiao, H.; Merril, C. R.; Wu, A.; Olde, B.; Moreno, R.; Kerlavage, A. R.;

McCombie, W. R.; Venter, J. C. 1991. Complementary DNA sequencing:

“expressed sequence tags” and the human genome project. Science, 252: 1651-

1656.

Adams, M. D.; Kerlavage, A. R.; Fleischmann, R. D.; Fuldner, R. A.; Bult, C. J.;

Lee, N. H.; Kirkness, E. F.; Weinstock, K. G.; Gocayne, J. D.; White, O. 1995.

Initial assessment of human gene diversity and expression patterns based upon

83 million nucleotides of cDNA sequence. Nature 377, (6547 Suppl) : 3-147.

Altschul, S. F.; Gish, W.; Miller, W.; Myers, E.W.; Lipman, D.J. 1990. Basic local

alignment search tool. Jour. Mol. Biol., 215 (3): 403-10.

Altschul, S. F.; Madden, T. L.; Schaffer, A. A.; Zhang, J.; Zhang, Z.; Miller , W. D. J.

1997. "Gapped BLAST and PSI-BLAST: a new generation of proteindatabase

search programs", Nucleic. Acids Res., 25:3389-3402.

Apweiler R., Bairoch A., Ferro S., Natale D. A., Yeh L.S. et al.. 2004. UNIPROT: the

Universal Protein Knowledgebase. Nucleic Acids Res. 32: D115-D119,

Arruda, M.; Carvalho, M. B.; Nussenzweig, R. S.; Maracic, M.; Ferreira, A. W.;

Cochrane, A. H. 1986. Potential vectors of malaria and their different

susceptibility to Plasmodium falciparum and Plasmodium vivax in Northern Brazil

identified by immunoassay. Am. J. Trop. Med. Hyg., 35 (5): 873-881.

Page 51: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

40

Atrie, B.; Subbarao, S. K.; Pillai, M. K. K.; Rao, S. R. V. and Sharma, V.P. 1999.

Population cytogenetic evidence for sibling species in Anopheles annularis

(Diptera : Culicidae). Ann Entomol Soc Am 92: 243–249.

Audic, S.; Claverie, J. M. 1997. The significance of digital gene expression profiles.

Genome Res., 7: 986-995

Barros, C.; Crosby, J. A.; Moreno, R. D. 1996. Early steps of sperm–egg interactions

during mammalian fertilization. Cell Biology International, 20: 33–39.

Baxevanis, D. A.; Ouellette, F. F. B. 2001. Bioinformatics. A Pratical Guide to the

analysis of Genes and Proteins. University of British Columbia, Canada.

Bedell, J.; Korf, I. e Yandell, M. 2003. BLAST. O’Reilly

Benoit, J. B.; Lopez-Martinez, G.; Phillips, Z. P.; Patrick, K. R.; Denlinger, D. L. 2010.

Heat shock proteins contribute to mosquito dehydration tolerance. Journal of

Insect Phisiology. 56: 151-156.

Bertone, M. A.; Courtney, G. W.; Wiegmann, B. M. 2008. Phylogenetics and temporal

diversification of the earliest true flies (Insecta: Diptera) based on multiple nuclear

genes. Syst Entomol. 33: 668-687.

Bonferroni, C. E. "Teoria statistica delle classi e calcolo delle probabilità."

Pubblicazioni del R Istituto Superiore di Scienze Economiche e Commerciali di

Firenze 8, 3-62, 1936.

Borkent, A. 1993. A world catalogue of fossil and extant Corethrellidae and

Chaoboridae (Diptera), with a listing of references to keys, bionomic information

and descriptions of each known life stage. Entomol Scand 24:1-24.

Borovsky, D.; Carlson, D. A.; Griffin, P. R.; Shabanowitz, J.; Hunt, D.F. 1990.

Mosquito oostatic factor: a novel decapeptide modulating trypsin-like enzyme

Page 52: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

41

biosynthesis in the midgut. FASEB, J. 4:3015-3020

Borovsky D. 2003. Trypsin-modulating oostatic factor: a potential new larvicide for

mosquito control. J. Exp. Biol. 206:3869-3875

Bridi, L. C. 2009. Mapeamento de genes expressos de Anopheles darlingi Root,

1926 e sua análise in silico em Anopheles gambiae Giles, 1902 (Diptera:

Culicidae). Dissertação apresentada ao Instituto Nacional de Pesquisas da

Amazônia para obtenção do titulo de mestre. Manaus. 99pp

Calvo, E.; Andersen, J.; Francischetti, I.M; Capurro, M. deL.; deBianchi, A.G.; James,

A.A.; Ribeiro, J.M.C.; Marinotti, O. 2004. The transcriptome of adult female

Anopheles darlingi salivary glands. Insect Molecular Biology. 13 (1): 73–88

Calvo, E.; Pham, V. M.; Marinotti, O.; Andersen, F. J.; Ribeiro, J. M. C. 2009. The

salivary gland transcriptome of the neotropical malaria vector Anopheles darlingi

reveals accelerated evotion of genes relevant to hematophagy. BMC Genomics.

10:57

Campos, M. A.; Silva, R. M. A.; Paiva, L. V.; Junior, A. C.; Lima, C. S. 2008.

Bioinformática: Do sequenciamento a função biológica. Universidade Federal de

Lavras, Minas Gerais, Brasil. 32pp.

Christophides, G. K.; Zdobnov, E.; Barillas-Mury, C.; Birney, E.; Blandin, S.; Blass,

C.; Brey, P. T.; Collins, F. H.; Danielli, A.; Dimopoulos, G. et al. 2002. Immunity-

related genes and gene families in Anopheles gambiae. Science. 298(5591):159-

165

Clayton, J.D.; Cripps, R.M.; Sparrow, J.C.; Bullard, B. 1998. Interaction of troponin-H

and glutathione S-transferase-2 in the indirect flight muscles of Drosophila

melanogaster. J Muscle Res Cell Motil. 19:117-27.

Collins, A.M.; Williams, V.; Evans,J.D. 2004. Sperm storage and antioxidative

enzyme expression in the honey bee, Apis mellifera. Insect Mol. Biol. 13 :141–

Page 53: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

42

146.

Coluzzi, M.; Sabatini, A.; Petrarca, V.; DiDeco, M. A. 1979. Chromosomal

differentiation and adaptation to human environments in the Anopheles gambiae

complex. Trans. Royal Soc. Trop. Med. Hyg. 73(5): 483-497.

Coluzzi, M.; Petrarca, V.; Di Deco M. A. 1985. Chromosomal inversion intergradation

and incipient speciation in Anopheles gambiae. Boll Zool 52: 45–63.

Coluzzi, M.; Sabatini, A.; dellaTorre, A.; DiDeco, M. A.; Petrarca, V. 2002. A polytene

chromosome analysis of the Anopheles gambiae species complex. Science 298:

1415–1418.

Conesa, A.; Götz, S.; García-Gómez, J.M.; Terol, J. Talón, M.; Robles. M. 2005.

Blast2GO: a universal tool for annotation, visualization and analysis in functional

genomics research. Bioinformatics Applications Note, 21(18): 3674–3676.

Consoli, R.; Oliveira, R. L. 1994. Principais mosquitos de importância sanitária no

Brasil. Ed. Fiocruz, 225p.

Consoli, R.; Oliveira, R. L. 1994. Principais mosquitos de importância sanitária no

Brasil. Universidade Federal de Minas Gerais. 33 pp.

Consoli, R.; Oliveira, L. R. 1994. Principais mosquitos de importância sanitária no

Brasil. Ed. Fiocruz, 225p.

Cornel, A..J.; Collins, F.H. 2000. Maintenance of chromosome arm integrity

between two Anopheles mosquito subgenera. J Hered 91: 364–370.

Coughlin, S.R. 2000. Thrombin signalling and protease-activated receptors. Nature

407, 258-264

Craft, C.M.; Whitmore, D.H. 1995. The arrestin superfamily: cone arrestins are a

fourth family.

Page 54: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

43

Deane, L. M. 1986. Malária vectors in Brazil. Memórias do Instituto Oswaldo Cruz,

81: 5-14.

deRouvroit, C. L.; Goffinet, A. M. 2001. Neuronal migration. Mechanisms of

Development 105: 47–56.

Dideco, M.; Cancrini, G.; Coluzzi, M.; Bullini, A. P. B.; Cianchi, R.; Bullini, L. 1978.

Linkage studies between chromosome inversions and enzyme loci in mosquito

Anopheles stephensi. Heredity 40: 457-458.

Ding, Y.; Ortelli, F.; Rossiter, L.C.; Hemingway, J.; Ranson, H. 2003. The Anopheles

gambiae glutathione transferase supergene family: annotation, phylogeny and

expression profiles. BMC Genomics 4: 35-50.

Dye, C. 1986.Vectorial capacity: Must be measured all its components? Parasitology

Today, 2:203-209

Egly, J. M. N. G.; Miyamoto, V.; Moncollin, P.; Chambon. 1984. Is actin a

transcription initiation factor for RNA polymerase B? EMBO J. 3: 2363-2371.

Edwards, F. W. 1932. Genera Insectorum. Diptera, Fam. Culicidae. Fascicle 194.

Desmet-Verteneuil, Brussels.

Feder, M. E.; Hofmann, G. E. 1999. Heat-shock proteins, molecular chaperones, and

the stress response: evolutionary and ecological physiology. Annual Review of

Physiology. 61: 243–282.

Felsenstein, J. 1985. Confidence limits on phylogenies: An approach using the

bootstrap. Evolution, 39.

Florea, L.; Hartzell, G.; Zhang, Z.; Rubin, G. M.; Miller, W. A. 1998. A computer

program for aligning a cDNA sequence with a genomic DNA sequence. Genome

Res. 8 (9): 967-74.

Page 55: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

44

Foley, D,H.; Rueda, L, M.; Wikerson, R,C. 2007. Insight into global mosquito

biogeography from country species records. J. Med. Entomol. 44:554-567.

Fournier, D.; Bride, J. M.; Hoffmann, F.; Karch, F. 1992. Acetylcholinesterase. Two

types of modifications confer resistance to insecticide. J. Biol. Chem. 267,

14270–14274.

Fox, J. E. 2001. Cytoskeletal proteins and platelet signalling. Journal of Thrombosis

and Haemostasis 86, 198–213.

Francischetti, I. M.; Valenzuela, J. G.; Pham, V. M.; Garfield, M. K.; Ribeiro, J. M.

2002. Toward a catalog for the transcripts and proteins (sialome) from the

salivary gland of the malaria vector Anopheles gambiae. J. Exp. Biol. 205: 2429-

2451.

Freitas-Sibajev, M. G. R.; Conn, J.; Mitchell, S. E.; Cockburn, A. F.; Seawright, J. A.;

Momen, H. 1995. Mitochondrial DNA and morphological analyses of Anopheles

darlingi populations from Brazil (Diptera: Culicidae). Mosq. Syst., 27(2): 78-99.

Gaunt, M.W.; Miles, M.A. 2002. An insect molecular clock dates the origin of the

insects and accords with palaeontological and biogeographic landmarks. Mol

Biol. Evol, 19:748-761.

Grant, D.F.; Hammock, B.D., 1992. Genetic and molecular evidence for a trans-

acting regulatory locus controlling glutathione S-transferase-2 expression in

Aedes aegypti. Mol. Gen. Genet. 234, 169–176.

Green, C.A.; Rattanarithikul, R.; Charoensub, A. 1992. Population genetic

confirmation of species status of the malaria vectors Anopheles willmori and An.

pseudowillmori in Thailand and chromosome phylogeny of the maculatus group

of mosquitos. Med. Vet. Entomol., 6: 335–341.

Gurevich, V.V.; Dion, S.B.; Onorato, J.J.; Ptasienski, L.; Kim, C.M.; Stene-Marr, R.;

Hosey, M.M.; Benovic, J.L. 1995. Arrestin interactions with G protein-coupled

Page 56: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

45

receptors. Journal Biology Chemistry. 270, 720–731

Gurevich, V.V. 1998. The selectivity of visual Arrestin for light-activated

phosphorhodopsin is controlled by multiple nonredundant mechanisms. Journal

of Biological Chemestry. 273(25) 15501-15506.

Haldane, J. B. S. 1932. The Causes of Evolution. Longmans, Green, New York.

60pp.

Harris M. A.; Clark J.; Ireland, A.; Lomax J.; Ashburner, M.; Wood, V.; White, R. et al;

2004. The Gene Ontology (GO) database and informatics resource”. Nucleic

Acids Res., D258-61,

He, M., and D. S. Haymer. 1994. The actin gene family in the oriental fruit fly

Bactrocera dorsalis. Muscle specific actins. Insect Biochem. Mol. Biol. 24: 891-

906.

Hedstrom, L., 2002. Serine protease mechanism and specificity. Chemical Reviews

102, 4501–4523

Holt, R. A.; Subramanian, G. M.; Halpern, A.; Sutton, G. G.; Charlab, R.; Nusskern,

D. R.; Wincker, P.; Clark, A. G.; Ribeiro, J. M.; Wides, R.; Salzberg, S. L.; Loftus,

B.; Yandell, M.; Majoros, W. H.; Rusch, D. B.; Lai, Z.; Kraft, C. L.; Abril, J. F.;

Anthouard, V.; Arensburger, P.; Atkinson, P. W.; Baden, H.; Berardinis, V.;

Baldwin, D.; Benes, V.; Biedler, J.; Blass, C.; Bolanos, B. D.; Barnstead, M.; Cai,

S.; Center, A.; Chatuverdi, K.; Christophides, G. K.; Chrystal, M. A.; Clamp, M.;

Cravchik, A.; Curwen, V.; Dana, A.; Delcher, A.; Dew, I.; Evans, C.A.; Flanigan,

M.; Grundschober-Freimoser, A.; Friedli, L.; Gu, Z.; Guan, P.; Guigo, R.;

Hillenmeyer, M. E.; Hladun, S. L.; Hogan, J. R.; Hong, Y. S.; Hoover, J.; Jaillon,

O.; Ke, Z.; Kodira, C.; Kokoza, E.; Koutsos, A.; Letunic, I.; Levitsky, A.; Liang, Y.;

Lin, J. J.; Lobo, N. F.; Lopez, J. R.; Malek, J. A.; McIntosh, T. C.; Meister, S.;

Miller, J.; Mobarry, C.; Mongin, E.; Murphy, S. D.; O'Brochta, D. A.; Pfannkoch,

C.; Qi, R.; Regier, M. A.; Remington, K.; Shao, H.; Sharakhova, M. V.; Sitter, C.

D.; Shetty, J.; Smith, T. J.; Strong, R.; Sun, J.; Thomasova, D.; Ton, L. Q.;

Page 57: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

46

Topalis, P.; Tu, Z.; Unger, M.F.; Walenz, B.; Wang, A.; Wang, J.; Wang, M.;

Wang, X.; Woodford, K. J.; Wortman, J. R.; Wu, M.; Yao, A.; Zdobnov, E. M.;

Zhang, H.; Zhao, Q.; Zhao, S.; Zhu, S.C.; Zhimulev, I.; Coluzzi, M.; Torre, D. A.;

Roth, C. W.; Louis, C.; Kalush, F.; Mural, R. J.; Myers, E. W.; Adams, M. D.;

Smith, H. O.; Broder, S.; Gardner, M. J.; Fraser, C. M.; Birne, E.; Bork, P.; Brey,

P. T.; Venter, J. C.; Weissenbach, J.; Kafatos, F. C.; Collins, F. H.; Hoffman, S.L.

2002. The genome sequence of the malaria mosquito Anopheles gambiae.

Science, 298: 129-149.

Huang, H. S.; Hu, N. T.; Yao, Y. E.; Wu, C. Y.; Chiang, S. W.; Sun, C. N. 1998.

Molecular cloning and heterologous expression of a glutathione S-transferase

involved in insecticide resistance from the diamondback moth Plutella xylostella.

Insect Biochem. Mol. Biol. 28, 651–658.

Huang e Madan, A. 1999. CAP3: A DNA sequence assembly program. Genome

Research. 9 (9) 868-877.

Iturralde-Vincent MA, MacPhee RDE: Age and paleogeographical origin of

Dominican amber. 1996. Science, 273:1850-1852.

Jinwal, U. K.; Zakharkin, S. O.; Litvinova, S.; J; Benes. 2006. Sex-, stage- and tissue-

specific regulation by a mosquito hexamerin promoter. Insect Molecular Biology.

15(3): 301-311.

Joseph, K.; Ghebrehiwet, B.; Kaplan, A. P. 2001. Activation of the kinin-forming

cascade on the surface of endothelial cells. Biological Chemistry 382, 71–75

Kalugina, N.S. 1977. The paleontological data and some problems of the evolution

of Culicoidea and Chironomoidea (Diptera). Taxonomy and evolution of dipteran

insects (Leningrad): 25–30.

Kanehisa, M. 2002. Post-Genome Informatics. Oxford University Press. 148p.

Kanost, M.; Kawooya, J.; Law, J.; Ryan, R.; VanHeusden, M.; Ziegler, R. 1990.

Page 58: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

47

Insect hemolymph proteins, Adv. Insect Physiol. 22, 298-396.

Kim, M.; Robich, R.M.; Rinehart, J.P.; Denlinger, D.L. 2006. Upregulation of two actin

genes and redistribution of actin during diapause and cold stress in the northern

mosquito, Culex pipiens. Journal of Insect Physiology 52, 1226–1233.

Kiselev, A.; Subramaniam, S. 1997. Studies of Rh1 motarhodopsin stabilization in

wild-type Drosophila and in mutants lacking one or both arrestins. biochimestry.

36, 2188-2196.

Kostaropoulos, I.; Papadopoulos, A.I.; Metaxakis, A.; Boukouvala, E.; Papadopoulou-

Mourkidou, E., 2001. Glutathione S-transferase in the defence against

pyrethroids in insects. Insect Biochem. Mol. Biol. 31, 313–319.

Kreutzer R. D.; Kitzmiller J. B.; Ferreira, E. 1972. Inversion polymorphism in the

salivary gland chromosomes of Anopheles darlingi Root. Mosq. News, 32:555–

565.

LeMosy, E.K.; Hong, C.C.; Hashimoto, C. 1999. Signal transduction by a protease

cascade. Trends in Cell Biology 9, 102–107.

Lewin, B. 1994. Genes V. Oxford University Press. 1260pp.

Li, J.; Riehle, M. M.; Zhang, Y.; Xu, J.; Oduol, F.; Gomez, M. S.; Eiglmeier, K.;

Ueberheide, M. B.; Shabanowitz, J.; Hunt, F. D.; Ribeiro, C. M. J.; Vernick, D. K.

2006. Anopheles gambiae genome reannotation through syntesis of ab initio and

comparative gene prediction algorithms. Genome biology, 7: R24 1-12.

Liew, C. C.; Hwang, D. M.; Fung, Y. U.; Laurenssen, C.; Cukerman, E.; Tsui, S.; Lee,

C. Y. 1994. Catologue of genes in the cardiovascular system as identified

by expressed sequence tags. Proc. Natl. Acad. Sci. U.S.A., 91 (22): 10645

– 10649.

Lima, G.N.; Batista, J.S.; Formiga, K.M.; Cidades, F.W.; Rafael, M.S.; Tadei, W.P.;

Page 59: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

48

Santos, J.M.M. 2010. New 24 polymorphic DNA microsatellite loci for the major

malaria vector Anopheles darlingi and transpecies amplification with another

anophelines. Conservation Genet Resour. DOI 10.1007/s12686-010-9237-y.

Lucashevich, D. E. 2008. Larvae – a key to evolution of Culicoidea (Diptera) in the

Mesozoic. Alavesia. 2: 59-72.

Lumjuan, N.; McCarroll, L.; Prapanthadara, L.; Hemingway, J.; Ranson, H. 2005.

Elevated activity of an epsilon class glutathione transferase confers DDT

resistance in the dengue vector, Aedes aegypti. Insect Biochem. Molec. Biol. 35:

861-871.

Lumjuan, N.; Stevenson, B.J.; Prapanthadarab, L. Somboon, P.; Brophy, P.M.;

Loftus, B.J.; Severson, D.W.; Ranson, H. 2007. The Aedes aegypti glutathione

transferase family. Insect Biochemistry and Molecular Biology 37: 1026–1035.

Manguin, S.; Wilkerson, R. C.; Conn, J. E.; Rubio-Palis, Y.; Danoff-Burg, J. A. &

Roberts, D. R. 1999. Population Structure of the primary malaria vector in South

America, Anopheles darlingi, using isozyme, random amplified polymorphic DNA,

internal transcribed spacer 2, and morphologicmarkers. American Journal of

Tropical Medicine and Hygiene, 60: 364-376.

Machesky, L. M., Insall, R. H. 1999. Signaling to actin dynamics. Journal of Cell

Biology 146, 267–272.

Marrelli, M. T. 2000. Anopheles oswaldoi (Díptera, Culicidae): Análise do segundo

espaçador interno transcrito (ITS2) do DNA ribossômico e da susceptibilidade à

infecção com Plasmodium vivax. Tese apresentada ao Instituto de Ciências

Biomédicas da Universidade de São Paulo para a obtenção do título de Doutor

em Ciências. São Paulo. 67pp.

McCarter J. P.; Mitreva, M. D.; Martin, J.; Dante, M.; Wylie, T.; Rao, U. 2003.

Analysis and functional classification of transcripts from the nematode

Meloidogyne incog-nita. Genome Biol;4:R26.

Page 60: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

49

Merril, C.E.; Riesgo-Escovar, J.; Pitts, R.J.; Kafatos, F.C.; Carlson, J.R.; Zwiebel, L.J.

2002. Visual arrestins in olfactory pathways of Drosophlila and the malaria vector

mosquito Anopheles gambiae. Neurobiology. 99(3): 1633-1638.

Michel, A.P., Guelbeogo, W.M., Grushko, O., Schemerhorn, B.J., Kern, M., Willard,

M.B. et al. (2005) Molecular differentiation between chromosomally defined

incipient species of Anopheles funestus. Insect Mol Biol 14: 375–387.

Mirabello, L.; Vineis, J. H.; Yanoviak, S. P.; Scarpassa, V. M.; Póvoa, M. M.; Padilla,

N.; Achee, N. L.; Conn, E. J. 2008. Microssatélite data suggest significante

population structure and differentiation within the malaria vector Anopheles

darlingi in Central and South America. BMC Ecology. 8:3.

Molyneux, D.H. Patterns of change in vector-borne diseases. 1997. Ann. Trop. Med.

& Parasitol., 91:827-39.

Morse, S.S. 1995. Factors in the emergence of infectious diseases. Emerg. Infect.

Dis., 1:7-15.

Moreno, M.; Marinotti, O.; Krzywinski, J.; Tadei, W. P.; James, A. A.; Achee, L. N.;

Conn, E. J. 2010. Complete mtDNA genomes of Anopheles darlingi and an

approach to anopheline divergence time. Malaria Journal, 9:27.

Mount, D. W. 2001. Bioinformátics: Sequence and Genome Analysis. University of

Arizona, Tucson. USA. 31-32pp.

MS/SVS. 2005. Guia de vigilância epdemiológica. Ministério da Saúde, Secretaria de

Vigilância em Saúde. (6) 521-540.

MS/SIVEP, 2010. SIVEP

(http://dw.saude.gov.br/portal/page/portal/sivep_malaria/TAB99449:tab_resumo_

n?Ano_n=2010) . Acesso: 27/02/2011.

Page 61: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

50

Muller, K.J. 1936. Bar duplication. Science 83: 528-530.

NCBI, 2011. dbEST (www.ncbi.nlm.nih.gov/dbEST/dbEST). Acesso: 04/02/2011.

Nene, V.; Wortman, J. R.; Lawson, D.; Haas, B.; Kodira, C.; Tu, Z. J.; Loftus, B.; Xi,

Z.; Megy, K.; Grabherr, M.; Ren, Q.; Zdobnov, E. M.; Lobo, N. F.; Campbell, K.

S.; Brown, S. E.; Bonaldo, M. F.; Zhu, J.; Sinkins, S. P.; Hogenkamp, D. G.;

Amedeo, P.; Arensburger, P.; Atkinson, P. W.; Bidwell, S.; Biedler, J.; Birney, E.;

Bruggner, R. V.; Costas, J.; Coy, M. R.; Crabtree, J.; Crawford, M.; DeBruyn, B.;

DeCaprio, D.; Eiglmeier, K.; Eisenstadt, E.; El-Dorry, H.; Gelbart, W. M.; Gomes,

S. L.; Hammond, M.; Hannick, L. I.; Hogan, J. R.; Holmes, M. H.; Jaffe, D.;

Johnston, J. S.; Kennedy, R. C.; Koo, H.; Kravitz, R.; Kriventseva, E. V.; Kulp, D.;

LaButti, K.; Lee, E.; Li, S.; Lovin, D. D.; Mao, C.; Mauceli, E.; Menck, C. F. M.;

Miller, J. R.; Montgomery, P.; Mori, A.; Nascimento, A. L.; Naveira, H.F.;

Nusbaum, C.; O’Leary, S.; Orvis, J.; Pertea, M.; Quesneville, H.; Reidenbach, K.

R.; Rogers, W. Y.; Roth, C. H.; Schneider, J. R.; Schatz, M.; Shumway, M.;

Stanke, M.; Stinson, E. O.; Tubio, J. M. C.; VanZee, J. P.; Verjovski-Almeida, S.;

Werner, D.; White, O.; Wyder, S.; Zeng, Q.; Zhao, Q.; Zhao, Y.; Hill, C. A.;

Raikhel, A. S.; Soares, M. B.; Knudson, D. L.; Lee, N. H.; Galagan, J.; Salzberg,

S. L.; Paulsen, I. T.; Dimopoulos, G.; Collins, F. H.; Birren, B.; Fraser-Liggett, C.

M.; Severson, D. W. 2007. Genome Sequence of Aedes aegypti, a Major

Arbovirus Vector. Science. 316: (5832) 1718 – 1723

Neurath, H., 1984. Evolution of proteolytic enzymes. Science 224, 350–357.

Ortelli, F., Rossiter, L.C., Vontas, J., Ranson, H., Hemingway, J., 2003. Heterologous

expression of four glutathione transferase genes genetically linked to a major

insecticide resistance locus, from the malaria vector Anopheles gambiae.

Biochem. J. 373, 957–963.

PAHO - Pan American Health Organization. 2005. Malaria: Step up the fight. PAHO

Today, Washington DC, p. 5.

Parsell, D. A.; Lindquist, S. 1993. The function of heat-shock proteins in stress

Page 62: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

51

tolerance: degradation and reactivation of damaged proteins. Annual Review of

Genetics 27, 437–496.

Pearson, W. R. 2001. Protein sequence comparison and Protein evolution. Tutorial-

ISMB2000, 1-53

Pearson, W. R. 2001. Training for bioinformatics and computational biology.

Editorial.Bioinf., 17(9): 761-762.

Petsko, G. A.; Ringe, D.; Protein Structure and Function. 2003.New Science Press

Ltd, Walthan, MA.

Pili, E. and Marchi, A. (1999) Chromosome evolution in treehole breeding Anopheles

(Diptera, Culicidae). Italian J Zool 66: 33–37.

Pollard, T. D., S. C. Selden, and P. Maupin. 1984. Interaction of actin filaments with

microtubules. J. Cell Biol. 99: 33s-37s.

Pollard, T.D., Blanchoin, L., Mullins, R.D., 2000. Molecular mechanisms controlling

actin filament dynamics in nonmuscle cells. Annual Review of Biophysics and

Biomolecular Structure 29, 545–576.

Poopittayasataporn, A. and Baimai, V. 1995. Polytene chromosome relationships of 5

species of the Anopheles dirus complex in Thailand. Genome 38: 426–434.

Prapanthadara, I.; Hemingway, J.; Ketterman, A, J.; 1993. Partial purification and

characterization of glutathione S transferase involved in DDT resistance from

mosquito Anopheles gambiae. Pest. Biochem. Physiol. 47: 119-133.

Pridgeon, W. J.; Becnel, J. J.; Clark, G. G.; Linthicum, J. K. 2009. Permethrin Induces

Overexpression of Cytochrome c Oxidase Subunit 3 in Aedes aegypti. J. Med.

Entomol. 46(4): 810-819.

Prosdocimi, F.; Cerqueira, C. G.; Binneck, E.; Silva, F. A.; Reis, N. A.; Junqueira, M.

Page 63: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

52

C. A.; Santos, F. C. A.; Junior, N. A.; Wust, I. C.; Filho, C. F.; Kessedjian, L. J.;

Petretiski, H. J.; Camargo, P. L.; Ferreira, M. G. R.; Lima, P. R.; Pereira, M. R.;

Jardim, S.; Sampaio, S. V.; Folgueras-Flatschart, V. A. 2002. Bioinformática:

Manual do usuário. Biotecnologia Ciência & Desensolvimento-nº 29: 12-25.

Rachou, R.G. 1958. Anofelinos do Brasil. Comportamento das espécies vetoras de

malária. Rev Bras Malariol Doenças Trop. 10: 145-181.

Rafael, M. S.; Tadei, W. P. 1998. Metaphase Karyotipes of Anopheles

(Nyssorhynchus) darlingi Root and A. (N) nuneztovari Galbadón (Diptera:

Culicidae). Genetics and Biology. 21(4): 351-354.

Rafael, M. S.; Tadei, W. P.; Recco-Pimentel, S. M. 2003. Ribosomal genes location

in chromosomes of Anopheles darlingi and A. nuneztovari (Diptera: Culicidae),

Amazônia, Brazil. Mem Inst Oswaldo Cruz, 98: 629-635.

Rafael, M. S.; Tadei, W. P.; Hunter, F. F. 2004. The physical gene Hsp70 map on

polytene chromosomes of Anopheles darlingi from the Brazilian Amazon.

Genetica. 121: 89-94.

Rafael, M. S.; Nunes-Silva, C. G.; Astolfi-Filho, S.; Tadei, W. P. 2005. Biblioteca de

cDNA DE Anopheles darlingi (Diptera; Culicidae). In: 51o Congresso Brasileiro

de Genética, 2005, Águas de Lindóia, SP. 51o Congresso Brasileiro de

Genética. Águas de Lindóia-SP: Zeppelini Editorial & Comunicação. v. CD. p.

145-145.

Rafael, M. S.; Nunes-Silva, C. G.; Azevedo Junior, G. M.; Guimarães, G. M.; Bridi,

L.C.; Assução, E. N.; Astolfi-Filho, S.; Tadei, W. P. 2008. Banco de Genes

Expressos de Anopheles darlingi adulto (Diptera; Culicidae), Coari, Amazonas.

In: 54o Congresso Brasileiro de Genética, 2008, Salvador. 54o Congresso

Brasileiro de Genética. Ribeirão Preto : Editora da SBG.

Rafael, M. S.; Rohde, C.; Bridi, L. C.; Valente Gaiesky, V. L. D. S.; Tadei, W. P.

2010. Salivary Polytene Chromosome Map of Anopheles darlingi, the Main

Page 64: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

53

Vector of Neotropical Malaria. The American Journal of Tropical Medicine and

Hygiene. 83: 241-249.

Ramirez, C.C.L. and Dessen, E.M.B. (2000a) Chromosomal evidence for sibling

species of the malaria vector Anopheles cruzii. Genome 43: 143–151.

Ramirez, C.C.L. and Dessen, E.M.B. (2000b) Chromosome differentiated populations

of Anopheles cruzii: evidence for a third sibling species. Genetica 108: 73–80.

Ranson, H.; Claudianos, C.; Ortelli, F.; Abgrall, C.; Hemingway, J.; Sharakhova, M.

V.; Unger, M. F.; Collins, F. H.; Feyereisen, R. 2002. Evolution of supergene

families associated with insecticide resistance. Science 298(5591):179-181.

Ranson, H., Paton, M.G., Jensen, B., McCarroll, L., Vaughan, A., Hogan, J.R.,

Hemingway, J., Collins, F.H., 2004. Genetic mapping of genes conferring

permethrin resistance in the malaria vector, Anopheles gambiae. Insect Mol.

Biol. 13, 379–386.

Ranson, H.; Hemingway, J. 2005. Glutathione transferases. In: Gilbert, L.I.; Iatrou, K.;

Gill, S.S. (Eds.), Comprehensive Molecular Insect Science. Elsevier, Oxford, pp.

383–402.

Reidenbach, K.R.; Cook, S.; Bertone, M.A.; Harbach, R. E.; Wiegmann, B. M.;

Besansky, N. J. 2009. Phylogenetic analysis and temporal diversification of

mosquitoes (Diptera: Culicidae) based on nuclear genes and morphology. BMC

Evol Biol, 9:298.

Ribeiro, J. M. C.; Francischetti, I. M. B. 2003. Role of arthropod salica in blood

feedings: Sialome an post-sialome perspectives. Annual Review of Entomology.

48: 73-88.

Ribeiro, J.M.C.; Topalis, P.; Louis, C. 2004. AnoXcel: an Anopheles gambiae protein

database. Insect Molecular Biology. 13: 449-457.

Page 65: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

54

Ribeiro, J. M. C .; Arcà, B.;Lombardo, Fabrizio.; Calvo, Eric.; Phan, V. M.; Chandra,

P. K.; Wikel, S. K. 2007. An annotated catalogue of salivary gland transcripts in

the adult female mosquito, Aedes aegypti. BMC Genomics. 8:6.

Ridley, M. 2004. Reconstuição da filogenia. In: Ferreira, H.B.; Passaglia, L.; Fischer,

Rivo. (Eds). Evolução. Universidade de Oxford, UK. p. 447-490.

Rinehart, J. P.; Li, A.; Yocum, G. D.; Robich, R. M.; Hayward, S.A.L.; Denlinger, D. L.

2007. Up-regulation of heat shock proteins is essential for cold survival during

insect diapause. Proceeding of the National Academy of Sciences of the United

States of America 104, 11130–11137.

Roberts, D. B.; Jowett, T.; Hughes, J.; Smith, D. F.; Glover, D. M. 1991. The major

serum protein of Drosophila larvae, larval serum protein 1, is dispensable, Eur: J.

Biochem. 195, 195-201.

Roper, K., Mao, Y.; Brown. N. H. 2005. Contribution of sequence variation in

Drosophila actins to their incorporation into actin-based structures in vivo. J. Cell

Sci. 118: 3937-3948.

Rosa-Freitas, M. G.; Broomfield, G.; Priestmann, A.; Milligan, P.; Momen, H.;

Molyneux, D. H. 1992. Studies on cuticular components, isoenzymes and

behaviour of 3 populations of Anopheles darlingi from Brazil. J. Am. Mosq.

Control Assoc., 8: 357-366.

Saitou, N., Nei, M. 1987. The neighbor-joining method: a new method for

reconstructing phylogenetic trees. Mol. Biol. Evol. 4, 406–425.

Scarpassa, V. M.; Conn, J. E. 2007. Population genetic structure of the major malaria

vector Anopheles darlingi (Diptera : Culicidae) from the Brazilian Amazon, using

microsatellite markers. Memórias do instituto Oswaldo Cruz. 319-327..

Salazar, C. E., D. M. Hamm, D. M. Wesson, C. B. Beard, V. Kumar, and F. H.

Collins. 1994. A cytoskeletal actin gene in the mosquito Anopheles gambiae.

Page 66: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

55

Insect Mol. Biol. 3: 1-13.

Sales, L. F.; Campos, M. L. A.; Gomes, H. E. 2008. Ontologias de domínio: Um

estudo das relações conceituais. Perspectivas em ciência da Informação . 3, 62-

76.

Sanger, F.; Nicklen, S.; Coulson, A. R. 1977. DNA sequencing with chain-

terminating inhibitors. Biochemistry, 74(12), 5463-5467.

Schlee D. 1990. Das Bernstein-Kabinett. Sttutg Beitr Naturk C, 28:100.

Service, M. W., 1996. Medical Entomology. First Edition. London: Chapman & Hall.

Scheneider, H. 2007. Métodos de análise filogenética. Edição Sociedade Brasileira

de Genética. 123pp.

Sheterline, P.; Handel, S. H.; Hendry, K. A. 1991. Reorganization and turnover of

actin filament architectures in cells. Biochem. Soc. Trans. 19: 1120-1124.

Smartt. C.T.; Erickson, J. 2008. CNAct-1 Is Differentially Expressed in the Subtropical

Mosquito Culex nigripalpus (Diptera: Culicidae), the Primary West Nile Virus

Vector in Florida. Journal Medical Entomology. 45(5): 877-884.

Soderlund, D.M.; Knipple, D.C. 2003. The molecular biology of knockdown resistance

to pyrethroid insecticides. Insect Biochem. Mol. Biol. 33:563-577.

Souza, K. C.; Silva, C. G. N.; Tadei, W. P.; Rafael, M. S. 2007. Sequenciamento de

genes expressos de larvas de 1º e 2º estádios de Anopheles darlingi (Diptera:

Culicidae), da Amazônia. In: As mudanças climáticas e o futuro da Amazônia,

2007, Manaus. XVI Jornada de Iniciação Científica PIBIC/CNPq/FAPEAM/INPA.

Manaus. v. 16. p. 273-274.

Spaethe, J.; Briscoe, A. D. 2004. Early Duplication and Functional Diversification of

the Opsin Gene Family in Insects. Mol. Biol. Evol. 21(8):1583–1594.

Page 67: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

56

Srivastava, H.; Sharma, M.; Dixit, J.; Das, A. 2010. Evolutionary insights into

insecticide resistance gene families of Anopheles gambiae. Infection, Genetics

and Evolution. 10: 620-628.

Stein, L. 2001. Genome annotation: from sequence to biology. Nat. Rev Genet. 2(7):

493-503.

Subbarao, S.K., Kumar, K.V., Nanda, N., Nagpal, B.N., Dev, V.; Sharma, V.P. 2000.

Cytotaxonomic evidence for the presence of Anopheles nivipes in India. J Am

Mosq Cont Assoc 16: 71–74.

Subbarao, S.K., Nanda, N., Vasantha, K., Dua, V.K., Malhotra, M.S., Yadav, R.S. et

al. 1994. Cytogenetic evidence for 3 sibling species in Anopheles fluviatilis

(Diptera, Culicidae). Ann Entomol Soc Am 87: 116–121.

Sucen, 2006. Superintendência de controle de endemias (www.sucen.sp.gov.br).

Acesso: 13/09/2009.

Suguna, S.G., Seawright, J.A., Joslyn, D.J.; Rabbani, M.G. 1981. Homozygous

pericentric inversions and other studies of inversions on chromosome-3 in the

mosquito Anopheles albimanus. Can J Genet Cytol 23: 57–64.

Suguna, S.G., Rathinam, K.G., Rajavel, A.R.; Dhanda, V. 1994. Morphological and

chromosomal descriptions of new species in the Anopheles subpictus complex.

Med Vet Entomol 8: 88–94.

Tadei, W. P.; Santos, J. M. M.; Rabbani, M. G. 1982. Biologia de anofelinos

amazônicos. V. Polimorfismo cromossômico de Anopheles darlingi Root

(Díptera: Culicidae). Acta Amaz, 12: 353-369.

Tadei, W. P.; Dutary-Thatcher, B.; Santos, J. M. M.; Scarpassa, V. M.; Rodrigues, I.

B.; Rafael, M. S. 1998. Ecologic observations on anopheline vectors of malaria in

the Brazilian Amazon. American Journal of Tropical Medicine and Hygiene,

Page 68: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

57

59:325-335.

Tang, A.H.; Tu, C.P. 1994. Biochemical characterization of Drosophila glutathione

Stransferases D1 and D21. J. Biol. Chem. 269, 27876–27884.

Tamura, K.; Dudley, J.; Nei, M.E.; Kumar, S. 2007. MEGA4: Molecular Evolutionary

Genetics Analysis (MEGA) software version 4.0. Molecular Biology and Evolution

24:1596-1599. (Publication PDF at http://www.kumarlab.net/publications).

Tatusov, R. L.; Galperin, M. Y.; Natale, D.A.; Koonin, E. V. 2000. The COG

database: a tool for genome-scale analysis of protein functions and

evolution. Nuc. Ac. Res, 28(1): 33-36.

Telles, G.P.; Silva, F.R. 2001. Triming and clustering sugarcane ESTs. Gen. Mol.

Biol.,24(14): 17-23.

Telfer, W. H.; Kunkel, J. G. 1991 The function and evolution of insect storage

hexarners, Annu. Rev. Entomol. 36, 205-228.

Thompson, J.D.; Higgins, D.G.; Gibson, T.J.; 1994. ClustalW-improving the sensitivity

of progressive multiple sequence alignment through sequence weighting,

position-specific gap penalties and weight matrix choice. Nucleic Acids Res.

22:4673–4680.

Torres, J.A. 2004. Protein Classification Tool: Uma ferramenta para anotação de

proteínas utilizando bases secundárias. Dissertação apresentada a Universidade

Federal de Minas Gerais. 86pp.

Tortora, G. J.; Funke, B. R.; Case, C. L. 2000. Microbiologia. Edição universitária.

620 pp.

Toung, Y.P.S.; Hsieh, T. S.; Tu, C.P.D. 1993. The glutathione S-transferase D genes.

A divergently organized, intronless gene family in Drosophila melanogaster. J.

Biol. Chem. 268: 9737-9746.

Page 69: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

58

Valenzuela, J. G.; Pham, V. M.; Garfield, M. K.; Francischetti, I. M.; Ribeiro, J. M. C.

2002. Toward a description of the sialome of the adult female mosquito Aedes

aegypti. Insect Biochem Mol. Biol. 32: 1101–1122.

Venancio, T.M., Cristofoletti, P.T., Ferreira, C., Verjovski-Almeida, S., Terra, W.R.

2009. The Aedes aegypti larval transcriptome: a comparative perspective with

emphasis on trypsins and the domain structure of peritrophins. Insect Molecular

Biology 18, 33–44.

Vontas, J.G.; Small, G.J.; Hemingway, J. 2001. Glutathione S-transferases as

antioxidant defence agents confer pyrethroid resistance in Nilaparvata lugens.

Biochem. J. 357, 65–72.

Wang, Y.; Qiu, L.; Ranson, Hilary.; Lumjuan, N.; Hemingway, J.; Setzer, W. N.;

Meehan, E. J.; Chen, L. 2008. Structure of an insect epsilon class glutathione S-

transferase from the malaria vector Anopheles gambiae provides an explanation

for the high DDT-detoxifying activity. Journal of Structural Biology 164: 228–235

Weir, B.S. 1996. Genetic Data Analysis II. Sinauer Associates Inc. Publishers.

Sunderland, Massachusetts. 445p.

WHO (WORLD HEALTH ORGANIZATION) World malária situations in 1994. 1997.

Parti I. Population at risk. Weekly Epidemiological Record, 72:269-274.

Who. 2005. World malaria report. 2005. World Health Organization UNICEF. Who

Library Cataloguing in Publication Date, Geneva, Switzerland. P. 294.

Wikstrom, M.; Casey, R. P. 1985. What is the essential proton-translocating

molecular machinery in cytochrome oxidase? J. Inorg. Biochem. 23: 327-334.

Wongtrakul, J.; Pongjaroenkit, S.; Leelapat, P.; Nachaiwieng, W.; Prapanthara, L.;

Ketterman, A. J. 2010. Expression and Characterization of Three New

Glutathione Transferases, an Epsilon (AcGSTE2-2), Omega (AcGSTO1-1), and

Page 70: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

59

Theta (AcGSTT1-1) From Anopheles cracens (Diptera: Culicidae), a Major Thai

Malaria Vector. J. Med. Entomol. 47(2): 162-171.

Yamamoto, K.; Zhang, P.; Miake, F.; Kashige, N.; Aso, Y.; Banno, Y.; Fujii, H. 2005.

Cloning, expression and characterization of theta-class glutathione S-transferase

from the silkworm, Bombyx mori. Comp. Biochem. Physiol. 141: 340-346.

Zakharkin, S. O.; Gordadze, A. V.; Korochkina, S. E.; Mathiopoulos, K. D.; Della

Torre, A.; Benes, H. 1997. Molecular cloning and expression of a hexamerin

cDNA from the malaria mosquito, Anopheles gambiae. Eur. J. Biochem. 246,

719-726.

Zavortink TJ, Poinar GO Jr. 2000. Anopheles (Nyssorhynchus) dominicanus sp. n.

(Diptera: Culicidae) from Dominican amber. Ann Entomol Soc Am

93:1230-1235.

Zhao, P.; Wang, Gen-Hong.; Dong, Zhao-Ming.; Duan, Jun.; Xu, Ping-Zhen.; Cheng,

Ting-Cai.; Xiang, Zhong-Huai.; Xia, Qing-You. 2010. Genome-wide identification

and expression analysis of serine proteases and homologs in the silkworm

Bombyx mori. BMC Genomics. 11:405.

Zimmerman, R. H. 1992. Ecology of malaria vectors in the Americas and future

direction. Mem Inst Oswaldo Cruz 87: 371-383.

Page 71: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

60

ANEXOS

Tabela 1: Algorítmos derivados do programa BLAST

Programa Descrição

Blastp Compara uma sequência (query) de aminoácidos contra um banco de

dados de sequências de proteínas

Blastn Compara uma sequência (query) de nucleotídeos contra um banco de

dados de sequências de nucleotídeos

Blastx

Compara uma sequência (query) de nucleotídeos traduzida em todas

as seis fases de leitura contra um banco de dados de sequências de

proteínas

Tblastn

Compara uma sequência (query) de proteína contra um banco de

dados de sequências de nucleotídeos dinamicamente traduzido em

todas as fases de leitura

Tblastx

Compara as traduções das seis fases de leitura de uma sequência

(query) de nucleotídeos contra as traduções das seis fases de leitura de

um banco de dados de sequências de nucleotídeo.

Tabela 2: Comparação da Glutathiona S-transferase (GST) entre sequências de An. darlingi e An. gambiae, quanto ao mapeamento in silico.

Sequências Tamanho (pares de

bases) Gene Cromossomo de An. gambiae

GST de An. darlingi 1060 Glutathione S-transferase

Braço esquerdo do cromossomo 3: 2781203- 2783301

GST de An. gambiae 1343 Glutathione S-transferase

Braço esquerdo do cromossomo 3: 2779188-2784335

Page 72: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

61

Tabela 3: Contigs diferencialmente expressos e seus respectivos valores normalizados em cada biblioteca (larvas e adultos de An.darlingi). O valor de p-value indica a confiança estatística dos dados amostrados e, valores maiores que 1 % foram rejeitados, por isso, estes não foram inseridos nesta Tabela.

Contigs (Número)

Biblioteca Larva

Biblioteca Adulto

Biblioteca larva normalizada

Biblioteca adulto normalizada

p-value

14 0 27 0 61.0 0.003289

16 0 28 0 63.3 0.002874

198 2 0 31.3 0 0.002020

201 2 0 31.3 0 0.002020

202 2 0 31.3 0 0.002020

203 4 0 62.5 0 0.000032

206 2 0 31.3 0 0.002020

207 2 0 31.3 0 0.002020

208 5 0 78.1 0 0.000004

209 2 0 31.3 0 0.002020

211 2 0 31.3 0 0.002020

212 2 0 31.3 0 0.002020

213 9 2 140.6 4.5 0.000000

216 5 0 78.1 0 0.000004

217 6 0 93.8 0 0.000001

221 2 0 31.3 0 0.002020

223 2 0 31.3 0 0.002020

225 7 0 109.4 0 0.000000

226 5 7 78.1 15.8 0.001255

228 2 0 31.3 0 0.002020

229 5 0 78.1 0 0.000004

230 2 0 31.3 0 0.002020

232 5 3 78.1 6.8 0.000152

233 2 0 31.3 0 0.002020

237 2 0 31.3 0 0.002020

238 2 1 31.3 2.3 0.005294

239 2 1 31.3 2.3 0.005294

240 4 0 62.5 0 0.000032

241 5 0 78.1 0 0.000004

242 3 0 46.9 0 0.000255

244 2 0 31.3 0 0.002020

245 2 0 31.3 0 0.002020

246 4 1 62.5 2.3 0.000141

251 3 0 46.9 0 0.000255

252 4 0 62.5 0 0.000032

Page 73: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

62

Contigs (Número)

Biblioteca Larva

Biblioteca Adulto

Biblioteca larva normalizada

Biblioteca adulto normalizada

p-value

253 3 0 46.9 0 0.000255

254 3 0 46.9 0 0.000255

255 3 0 46.9 0 0.000255

256 3 0 46.9 0 0.000255

258 5 0 78.1 0 0.000004

259 3 1 46.9 2.3 0.000892

260 3 4 46.9 9.0 0.005205

262 3 0 46.9 0 0.000255

264 3 0 46.9 0 0.000255

266 4 0 62.5 0 0.000032

267 3 0 46.9 0 0.000255

269 3 0 46.9 0 0.000255

270 3 0 46.9 0 0.000255

273 3 1 46.9 2.3 0.000892

275 3 0 46.9 0 0.000255

302 8 6 125 13.6 0.000011

32 0 20 0 45.2 0.008471

404 0 26 0 58.8 0.003765

423 0 20 0 45.2 0.008471

439 1 132 15.6 298.4 0.000000

46 2 2 31.3 4.5 0.009249

481 13 26 203.1 58.8 0.000064

514 0 27 0 61.0 0.003289

584 3 153 46.9 345.9 0.000000

587 1 84 15.6 189.9 0.000016

589 4 145 62.5 327.8 0.000002

606 5 12 78.1 27.1 0.004988

624 0 20 0 45.2 0.008471

627 3 1 46.9 2.3 0.000892

629 0 28 0 63.3 0.002874

630 3 0 46.9 0 0.000255

633 8 1 125 2.3 0.000000

634 3 0 46.9 0 0.000255

635 3 0 46.9 0 0.000255

636 3 0 46.9 0 0.000255

637 8 2 125 4.5 0.000000

638 3 0 46.9 0 0.000255

Page 74: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

63

Contigs (Número)

Biblioteca Larva

Biblioteca Adulto

Biblioteca larva normalizada

Biblioteca adulto normalizada

P-value

641 2 0 31.3 0 0.002020

642 2 0 31.3 0 0.002020

644 2 0 31.3 0 0.002020

646 2 1 31.3 2.3 0.005294

649 4 2 62.5 4.5 0.000369

650 4 0 62.5 0 0.000032

654 2 0 31.3 0 0.002020

655 2 1 31.3 2.3 0.005294

656 2 0 31.3 0 0.002020

658 2 0 31.3 0 0.002020

661 2 0 31.3 0 0.002020

662 2 0 31.3 0 0.002020

663 4 0 62.5 0 0.000032

664 2 0 31.3 0 0.002020

665 2 0 31.3 0 0.002020

68 0 42 0 94.10 0.000433

69 0 45 0 101.7 0.000289

75 0 22 0 49.7 0.006465

8 9 25 140.6 56.5 0.001863

Tabela 4: Contigs mais expressos em adultos de An. darlingi, que apresentaram HSP/HIT

>=65%.

Contigs An. darlingi

ID. Hits/Espécie

Score HSP/HIT

UNIPROT

e-value

Domínios

Contig14

XP_310165.4

EAA05894.4

An. gambiae

97%

93%

Q7QG65

3.91e-31

PF02238. COX7a.

Contig16

XP_001238570.2

EAU75740.2

An. gambiae

97%

89%

A0NH89

0.0

PF00001. 7tm_1.

Contig260

ACI30193.1

An. darlingi

90%

100%

B6DE46

6.98e-60

PF04758. Ribosomal_S30.

Contig404

XP_001661871.1

EAT36156.1

Ae. aegypti

96%

100%

Q16P78

3.90e-103

PF00043. GST_C.

PF02798. GST_N.

Contig423 XP_316821.4

EAA12143.4

97%

100%

Q7Q4V9

1.25e-57

PF02046. COX6A

Page 75: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

64

A. gambiae

Contigs

An. darlingi

ID. Hits/Espécie

Score

HSP/HIT

UNIPROT

e-value

Domínios

Contig439 AAX51251.1

AAX51252.1

AAX51253.1

ACC95833.1

An. tesselatus

88%

98%

Q58HN3

1.51e-99

PF00116. COX2. PF02790.

COX2_TM

Contig514 XP_314835.2

EAA10211.2

An. gambiae

100%

100%

Q7Q8A5

8.93e-66

PF01215. COX5B

Contig584 XP_001867790.1

EDS45595.1

Cx. quinquefasciatus

98%

69%

B0XDR8

2.12e-74

Não

Contig587 ACI30080.1

An. darlingi

77%

100%

B6DDU2

1.00e-84

PF00119. ATP-synt_A

Contig589 ACI30087.1

An. darlingi 86% 96%

B6DDU9

2.69e-103

PF00510. COX3

Contig606 ACI30104.1

An. darlingi

100%

85%

B6DDV8

1.91e-131

PF00327. Ribosomal_L30

PF08079. Ribosomal_L30_N

Contig624 XP_313357.3

EAA08884.3

An. gambiae

91%

100%

Q7QAP1

2.07e-96

PF00213. OSCP

Contig629 XP_315270.4

EAA10671.4

An. gambiae

97%

82%

Q7Q7K5

1.27e-160

PF00022. Actin

Contig68 XP_321420.4

CAJ14142.1

EAA00917.4

An. gambiae

97%

100%

Q7PXZ8

0.0

PF00022. Actin

Contig69 XP_001655930.1

EAT35633.1

Ae. aegypti

94%

100%

Q16MS5

6.02e-76

Não

Contig75 NP_008075.1

P34850.1

AAD12196.1

An. gambiae

53%

82%

P34850

2.05e-16

PF00507. Oxidored_q4

Contig8 ACI30080.1

An. darlingi

80%

100%

B6DDU2

3.19e-88 PF00119. ATP-synt_A

Page 76: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

65

Tabela 5: Contigs mais expressos em larvas de An. darlingi que apresentaram HSP/HIT

>=65%.

Contigs

An. darlingi

ID. Hits/Espécie Score HSP/HIT UNIPROT e-value Domínios

Contig213 ABD60748.1

An. funestus

72%

71%

Q1A732

6.93e-87

Contig230 XP_320958.3

EAA01028.3

An. gambiae

83%

100%

Q7PYS3

2.43e-67

Contig242 XP_319624.3

EAA14972.3

An. gambiae

73%

77%

Q7PWR2 1.01e-34

Contig253 P19425.2

AAB51283.1

Ae. aegypti

41% 109%

P19425

1.73e-7

Contig258 XP_001238545.2

EAU75715.2

An. gambiae

83% 92%

A0NH65

1.12e-70

PF08534.3 Redoxin

Contig259 XP_001238440.1

AAX86007.1

EAU75609.1

An. gambiae

90% 100%

Q52P91

1.08e-17

Contig269 XP_311967.3

Q7QD36.3

EAA07604.3

An. gambiae

90% 67%

Q7QD36

5.48e-94

PF01398 Mov34

Contig302 ACI30071.1

An. darlingi 70% 100%

B6DDT3

4.61e-34

PF00428 Ribosomal_60s

Contig627 XP_306771.3

EAA45915.3

An. gambiae 97% 81%

Q7PE12

2.39e-100

PF02807 ATP-

gua_PtransN

PF00217. ATP-

gua_Ptrans

Contig637 XP_319289.2

CAC39103.2

AAG54081.1

EAA13874.3

95% 98%

Q95NF3

0.0

PF02752. Arrestin_C.

PF00339. Arrestin_N.

Page 77: INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA – INPAbdtd.inpa.gov.br/bitstream/tede/2102/5/Dissertação_Gilson Martins... · 1.310.090.344 pb e Culex quinquefasciatus, vetor de

66

An. gambiae

Contigs

An. darlingi

ID. Hits/Espécie Score HSP/HIT UNIPROT e-value Domínios

Contig650 XP_311376.4

EAA07034.4

An. gambiae

85% 89%

Q7QE44

3.59e-74

PF03722. Hemocyanin_N

Contig655 XP_316939.3

EAA12863.3

87% 100%

Q7Q4N9

8.10e-58

PF04930. FUN14

Contig665 XP_318603.3

AAF68382.1

EAA14367.3

An. gambiae

82% 97%

Q9NGZ1

2.71e-38

PF00085. Thioredoxin