ministério da saúde instituto nacional de câncer ... · minha felicidade e tristezas as suas....
TRANSCRIPT
INSTITUTO NACIONAL DE CÂNCER PÓS-GRADUAÇÃO EM ONCOLOGIA
Isabel Maria Prellwitz
DETERMINAÇÃO DO ANTÍGENO LEUCOCITÁRIO HUMANO (HLA) A, B E C POR
SEQUENCIAMENTO DE NOVA GERAÇÃO EM INDIVÍDUOS INFECTADOS PELO
HIV-1 DOS SUBTIPOS B, C E RECOMBINANTES NO SUL DO BRASIL
Orientador (es): Dra. Esmeralda Augusta Jardim Machado Soares
Prof. Dr. Marcelo Alves Soares
RIO DE JANEIRO
2014
Ministério da Saúde Instituto Nacional de Câncer Coordenação de Pós-graduação Stricto sensu
ii
INSTITUTO NACIONAL DE CÂNCER Pós-Graduação em Oncologia
ISABEL MARIA PRELLWITZ
Determinação do Antígeno Leucocitário Humano (HLA) A, B e C por Sequenciamento de Nova Geração em indivíduos infectados pelo HIV-1 dos subtipos B, C e recombinantes no sul do Brasil
Dissertação apresentada ao Instituto Nacional de Câncer como parte dos requisitos para obtenção do título de Mestre em Oncologia
Orientador (es): Dra. Esmeralda Augusta Jardim Machado Soares
Prof. Dr. Marcelo Alves Soares
RIO DE JANEIRO
2014
Ministério da Saúde Instituto Nacional de Câncer Coordenação de Pós-graduação Stricto sensu
iii
INSTITUTO NACIONAL DE CÂNCER
Pós-Graduação em Oncologia
AUTOR: Isabel Maria Prellwitz
DETERMINAÇÃO DO ANTÍGENO LEUCOCITÁRIO HUMANO (HLA) A, B E C
POR SEQUENCIAMENTO DE NOVA GERAÇÃO EM INDIVÍDUOS IN FECTADOS
PELO HIV-1 DOS SUBTIPOS B, C E RECOMBINANTES NO SUL DO BRASIL
ORIENTADOR (ES): Dra. Esmeralda Augusta Jardim Mach ado Soares Prof. Dr. Marcelo Alves Soares Aprovada em: 27 / 03 / 2014 EXAMINADORES: Prof. Dr. Luiz Claudio Santos Thuler Prof. Dra. Mariza Gonçalvez Morgado Prof. Dr. Gonzalo José Bello Bentancor Prof. Dra. – Miriam Bianchi de Frontin Werneck Prof. Dra. – Elizabeth Machado
RIO DE JANEIRO
2014
Ministério da Saúde Instituto Nacional de Câncer Coordenação de Pós-graduação Stricto sensu
iv
DEDICATÓRIA
A amiga Juliana.
v
AGRADECIMENTOS
Aos pacientes que se prontificaram a participar do estudo.
À Dra. Esmeralda, pelo apoio, confiança, carinho e principalmente pela sua
orientação por todos esses anos. Essa oportunidade foi essencial para o meu
crescimento pessoal e profissional. Obrigada por acreditar que eu poderia ir tão
longe.
Ao Dr. Marcelo, por toda a ajuda e ensinamento. Sempre disposto a encontrar
um tempinho, nem que de madrugada, para corrigir e orientar. Obrigada pela
motivação, mesmo que em forma de bronca, que me fez querer fazer sempre
melhor.
À Brunna que mais uma vez dividiu cada momento comigo, cada PCR e
biblioteca. Divide comigo até hoje o dia a dia e uma amizade para a vida toda. Sou
imensamente grata por toda a ajuda e paciência, mas principalmente por aceitar
compartilhar comigo tantos projetos e tantos sonhos.
À Juliana, a quem dedico esta dissertação com muito orgulho e gratidão. O
seu papel na minha vida passa da dissertação, vai além de uma ajuda com as
dificuldades do projeto e com certeza não ficou apenas no trabalho. Seja como uma
irmã mais velha dando o bom exemplo, protegendo, dando puxão de orelha, mas
também como uma amiga leal e meiga, você foi a maior responsável pela minha
perseverança. Agradeço do fundo do meu coração por toda a sua dedicação e
amizade.
À Carol por ter me ensinado com toda a paciência do mundo e da forma mais
didática e criativa uma técnica nova e confusa para mim. Foi você quem ‘’illuminou’’
tudo nesse projeto! Não faltaram sorrisos juntos às explicações e auxílios aos meus
pedidos de socorro, e a isso eu só tenho a agradecer. Obrigada por todos os
ensinamentos e toda a boa vontade.
Às meninas do laboratório (Livinha, Mari, Adriana, Sabrina, Val e Fabi) que
riram comigo, conversaram e principalmente me apoiaram em todos os momentos
confusos e que só nós sabemos quantos momentos desses tivemos ao longo
desses dois anos. Mas o mais importante, tenho que agradecer a ajuda em todos os
experimentos, bibliotecas, géis e quantificações. O trabalho em equipe é tão
incrivelmente eficiente porque a equipe é composta por amigas, e vocês são as
melhores que alguém poderia ter.
vi
Ao Dr. Hector, pelo espaço cedido no laboratório e aos pesquisadores e
funcionários do laboratório de genética, por toda ajuda e pela manutenção da ordem
no laboratório.
Ao INCA, CNPq e à FAPERJ, pelo apoio financeiro.
Ao Francisco, meu potinho sem fim de amor e paciência. A essa altura já
sabe o que é um sequenciamento de nova geração e fica revoltado junto comigo
com as montagens de novo que não dão certo. E tudo isso porque você faz da
minha felicidade e tristezas as suas. Obrigada por me apoiar sempre.
À minha família enorme e unida que não me deixa desistir e sempre me
incentiva a querer fazer o melhor de mim e o melhor para mim. Dedico com muito
carinho mais uma etapa da minha vida na qual vocês participaram e me apoiaram.
vii
“O que faz andar o barco
não é a vela enfunada, mas
o vento que não se vê.”
Platão.
viii
DETERMINAÇÃO DO ANTÍGENO LEUCOCITÁRIO HUMANO (HLA) A, B E C POR SEQUENCIAMENTO DE NOVA GERAÇÃO EM INDIVÍDUOS IN FECTADOS
PELO HIV-1 DOS SUBTIPOS B, C E RECOMBINANTES NO SUL DO BRASIL
RESUMO DISSERTAÇÃO DE MESTRADO
Isabel Maria Prellwitz O sistema HLA (antígeno leucocitário humano) desempenha um importante papel
regulador da resposta imune. Os genes dos HLA clássicos A, B e C estão envolvidos na imunidade mediada por células T citotóxicas controlando a viremia do HIV-1. Estudos demonstram que alelos como B*35 e B*53 levam a um rápido desenvolvimento para a aids, enquanto que alelos “protetores” do hospedeiro como o HLA-B*27 e B*57 estão associados com o controle imune da infecção e progressão mais lenta. O sequenciamento de nova geração (NGS) possibilita resolver a ambiguidade de genótipos, causada pelo enorme número de polimorfismos existente, e alcançar uma tipagem de alta resolução. Existem poucos trabalhos publicados que abordam essa metodologia para tipagem do HLA, sendo que a análise e manipulação dos dados gerados por NGS ainda é bastante difícil. Logo, estudar características genéticas tanto virais quanto do hospedeiro na epidemiologia de HIV/aids no sul do Brasil é importante por ela ser diferenciada do resto do Brasil, com predomínio do subtipo C. Nosso projeto pretende determinar os alelos do HLA classe I (A, B e C) por NGS, avaliando diferentes metodologias de montagem e reconstrução de alelos, bem como associar com parâmetros epidemiológicos, clínicos e laboratoriais de pacientes HIV+ no sul do Brasil.Os pacientes que participam do estudo são HIV+ acompanhados no ambulatório de HIV/Aids do Hospital das Clínicas de Porto Alegre. O DNA genômico dos pacientes foi extraído e os genes de HLA-A, B e C foram amplificados por PCR. As bibliotecas foram feitas com kit Nextera DNA Sample Preparation e sequenciadas na plataforma Illumina HiSeq 2500. Os reads gerados foram analisados no programa FastQC e em seguida trimados no programa Sickle-Master. Foram testados diferentes programas baseados em diferentes algoritmos para a reconstrução e tipagem dos alelos. Já foram amplificados os HLA-A, B e C de 158 pacientes e desses, 86 (54%) já tiveram suas bibliotecas preparadas e sequenciadas. Oitenta e uma amostras tiveram seus dados analisados no programa FastQC e trimadas no programa Sickle-Master. Três amostras foram testadas para montagem de novo utilizando o programa Velvet e montagem com referência ao programa Bwa. Por outro lado, o programa Omixon Target foi utilizado para tipagem dos alelos com base no banco de dados IMGT/HLA. Com efeito, o alinhamento de novo realizado pelo programa Velvet não atingiu o objetivo de montagem de alelos de HLA-A, B e C. Nossos resultados de tipagem mostraram-se semelhantes à literatura, e os alelos mais frequentes foram os A*02:01:01, A*24:02:01:01, B*51:01:01, C*07:01:01:01 e C*02:02:02. Os dados de carga viral, antes e após o tratamento, relacionados aos alelos determinados para cada paciente, mostraram algumas associações estatisticamente significantes. Cabe destacar a associação do alelo B*51:01:01 e supertipo B62 com pacientes de menor carga viral, o que indica uma associação de proteção já relatada antes na literatura. Em conclusão à análise empreendida, é possível afirmar que os estudos dos alelos de HLA em pacientes infectados pelos subtipos B e C, levando-se em consideração o contexto étnico e genético como o da região sul do Brasil, são relevantes para o melhor entendimento dos fatores genéticos do hospedeiro que respondem à esta infecção viral.
Ministério da Saúde INSTITUTO NACIONAL DE CÂNCER COORDENAÇÃO DE PÓS-GRADUAÇÃO Stricto sensu
ix
DETERMINATION OF HUMAN LEUKOCYTE ANTIGEN (HLA) A, B AND C BY NEXT GENERATION SEQUENCING IN INDIVIDUALS INFECTED WITH HIV-1
SUBTYPES B, C AND RECOMBINANT BC IN SOUTHERN BRAZIL .
ABSTRACT DISSERTAÇÃO DE MESTRADO
Isabel Maria Prellwitz The HLA (human leukocyte antigen) system plays an important regulatory role in the
immune response. The classical HLA genes A, B and C, are involved in T cell mediated cytotoxic immunity controlling HIV-1 viremia. Studies show that alleles B*35 and B*53 lead to a rapid development to AIDS, whereas "protectors" alleles of the host as B*27 and B*57 are associated with immune control of infection and slower progression. The next-generation sequencing (NGS) enables resolve the ambiguity of genotypes caused by the large number of existing polymorphisms, and achieve a high-resolution typing. There are only few published studies addressing this methodology for HLA typing, and the analysis and manipulation of data generated by NGS is still quite difficult. Study genetic characteristics, both viral and the host, in the epidemiology of HIV/AIDS in southern Brazil is important for it to be differentiated from the rest of Brazil, with a predominance of subtype C. Our project aims to determine the alleles of HLA class I (A, B and C) by NGS, evaluating different methodologies for assembly and reconstruction of alleles, and associate with epidemiological, clinical and laboratory parameters of HIV+ patients in southern Brasil. The patients participating in the study are HIV+ followed in HIV/AIDS ambulatory at Hospital das Clínicas de Porto Alegre. The patients' genomic DNA was extracted and the genes HLA-A, B and C were amplified by PCR. The libraries were made with Sample Preparation Nextera DNA kit and sequenced in Illumina HiSeq 2500 platform. The reads generated were analyzed in FastQC program and then trimmed in Sickle -Master program. Different programs based on different algorithms for reconstruction and typing of alleles were tested. Have been amplified HLA-A, B and C of 158 patients and of these, 86 already had their libraries prepared and sequenced. Eighty-one samples had their data analyzed in FastQC program and trimmed in Sickle -Master program. Three samples were tested again for assembly using the assembly program Velvet, and with reference to BWA program. The Omixon-Target program was used for typing the alleles based on the IMGT/HLA database. The de novo assembly performed by Velvet has not reached the target alleles HLA-A, B and C. Our data results showed alleles typing similar to literature, and the most frequent alleles were A*02:01:01, A*24:02:01:01, B* 51:01:01, C*07:01:01:01 and C*02:02:02. The data for viral load counts before and after treatment, related to certain alleles for each patient showed some statistically significant associations. We highlight the association of patients allele B*51:01:01 and B62 supertype with lower viral load indicating a protective association that has been reported before in the literature. Studies of HLA in patients infected with subtypes B and C in an ethnic and genetic background as the southern region of Brazil, are relevant for a better understanding of host genetic factors that respond to this viral infection.
Ministério da Saúde Instituto Nacional de Câncer Coordenação de Pós-graduação Stricto sensu
x
SUMÁRIO
ÍNDICE DE FIGURAS...................................................................................... xii
ÍNDICE DE TABELAS.................................................................................... xiv
LISTA DE ABREVIATURAS ..........................................................................xv
1. INTRODUÇÃO.......................................................................................17
1.1 Epidemiologia da infecção pelo HIV e aids..............................................17
1.2 História natural da infecção pelo HIV.....................................................18
1.3 Partícula viral e estrutura genômica do HIV.............................................20
1.4 Ciclo replicativo do HIV e tratamento antirretroviral ................................21
1.5 Diversidade genética do HIV..................................................................23
1.6 O Complexo MHC e Sistema HLA.........................................................25
1.7 HLA classe I........................................................................................26
1.8 HLA classe II e III................................................................................29
1.9 Processamento e Apresentação de antígenos via HLA classe I...................30
1.10 Nomeclatura do sistema HLA.............................................................31
1.11 Polimorfismos do HLA......................................................................32
1.12 Função do HLA classe I e associação com sistema imune e doenças.......34
1.13 Papel do HLA na infecção pelo HIV....................................................35
1.14 Tipagem do HLA por sequenciamento de nova geração (NGS)...............38
2. JUSTIFICATIVA DO PROJETO..............................................................40
3. OBJETIVO .............................................................................................40
3.1 Objetivos específicos.............................................................................40
4. MATERIAL E MÉTODOS.......................................................................41
4.1 Casuística.............................................................................................41
4.2 Extração do DNA genômico...................................................................41
4.3 Amplificação de regiões do genoma viral do HIV-1..................................42
xi
4.4 Purificação dos produtos positivos..........................................................45
4.5 Sequenciamento de sanger.....................................................................46
4.6 Edição e alinhamento das sequencias......................................................47
4.7 Análises filogenéticas e classificação do subtipo viral ...............................47
4.8 Amplificação das regiões genômicas HLA-A, B e C.................................48
4.9 Quantificação e concentração.................................................................50
4.10 Preparação da biblioteca.....................................................................50
4.11 Controle de qualidade das bibliotecas..................................................52
4.12 Quantificação da biblioteca.................................................................53
4.13 Sequenciamento na plataforma ILLUMINA HISEQ 2500......................53
4.14 Análise da qualidade dos reads e filtragem...........................................54
4.15 Montagem de novo ............................................................................55
4.16 Montagem com referência..................................................................57
4.17 Tipagem dos alelos de HLA................................................................58
4.18 Análises estatísticas...........................................................................58
5 RESULTADOS...........................................................................................58
5.1 Construção das bibliotecas.....................................................................59
5.2 Análise por FASTQC e filtragem............................................................59
5.3 Montagem de novo................................................................................62
5.4 Montagem com referência......................................................................62
5.5 Tipagem do HLA pelo software Omixon-Target.......................................64
5.6 Prevalência dos subtipos e perfil epidemiológico dos pacientes HIV+ .........70
5.7 Correlação dos alelos do HLA com os dados clínicos e subtipos do HIV-1..71
6 DISCUSSÃO..............................................................................................78
7 CONCLUSÕES..........................................................................................89
8 REFERÊNCIAS BIBLIOGRÁFICAS...........................................................91
9 ANEXO ...................................................................................................106
xii
ÍNDICE DE FIGURAS
Figura 1.2.1 História natural da infecção pelo HIV em adultos...............................19
Figura 1.3.1. Partícula viral e organização genômica do HIV-1..............................21
Figura 1.4.1. Ciclo replicativo do HIV-1 e atuação das classes de inibidores............23
Figura 1.6.1. Mapa da região HLA, banda 6p21.3 do cromossomo 6.......................26
Figura 1.7.1. Fenda de ligação a peptídeo da molécula HLA classe I.......................27
Figura 1.7.2. Representação da fenda de ligação a peptídeo das moléculas de HLA
classe I........................................................................................................................28
Figura 1.8.1. Estrutura das moléculas de HLA classe I e II.....................................29
Figura 1.10.1. Nomeclatura do Sistema HLA.......................................................32
Figura 4.3.1. Representação dos esquemas de amplificação das regiões do genoma
viral do HIV-1.............................................................................................................43
Figura 4.8.1. Representação esquemática da posição dos iniciadores sentido senso e
antissenso utilizados para a amplificação no HLA-A, B e C.............................................48
Figura 4.10.1. Representação esquemática das etapas de preparação das bibliotecas de
DNA pelo kit Nextera DNA Sample Preparations ...........................................................51
Figura 5.2.1. Exemplo de gráfico de qualidade dos reads por posição nucleotídica
gerado pelo programa FastQC da amostra 349.................................................................61
Figura 5.4.1. Exemplo de reconstrução dos genes HLA-A, B e C da amostra 181.....63
Figura 5.5.1. Alelos de HLA-A encontrados na casuística......................................64
Figura 5.5.2. Alelos de HLA-B encontrados na casuística......................................65
Figura 5.5.3. Alelos de HLA-C encontrados na casuística......................................65
Figura 5.5.4. Proporção de heterozigotos e homozigotos encontrada.......................66
Figura 5.5.5. Prevalência dos supertipos do HLA-A na casuística estudada..............66
xiii
Figura 5.5.6. Prevalência dos supertipos do HLA-B na casuística estudada..............67
Figura 5.5.7. Alinhamento das amostras com dúvida entre os alelos A*:01:01:01 e
A*01:11N pelo programa Bwa e visualizado pelo IGV....................................................69
xiv
ÍNDICE DE TABELAS
Tabela 4.3.1. Iniciadores usados para amplificação e sequenciamento da região
genômica do HIV-1 analisada........................................................................................44
Tabela 4.8.1. Iniciadores para amplificação dos éxons 1 ao 6 dos HLA-A, B e C......49
Tabela 5.6.1. Dados clínico-epidemiológicos obtidos dos prontuários dos 81 pacientes
tipados para o HLA-A, B e C neste estudo......................................................................71
Tabela 5.7.1. Associações dos alelos de HLA-A, B e C com os dados de carga viral
dos pacientes, antes e após o início do tratamento............................................................73
Tabela 5.7.2. Associações dos alelos de HLA-A, B e C com os dados de contagem de
célula CD4 dos pacientes, antes e após o início do tratamento...........................................75
Tabela 5.7.3. Associações dos alelos de HLA-A, B e C com o subtipo B dos pacientes
infectados....................................................................................................................76
Tabela 5.7.4. Associações dos alelos de HLA-A, B e C com o subtipo C dos pacientes
infectados....................................................................................................................77
Tabela 5.7.5. Associações dos alelos de HLA-A, B e C com o recombinante BC dos
pacientes infectados.....................................................................................................77
xv
LISTA DE ABREVIATURAS
AC - Antagonista de CCR5 Aids - Síndrome da Imunodeficiência Adquirida B2m - β2-microglobulina CCR5 – Receptor de quimiocina tipo 5 CD4 – Do inglês cluster of differentiation 4 (Grupamento de diferenciação 4) CD8 – Do inglês cluster of differentiation 8 (Grupamento de diferenciação 8) CDC - Centro de Controle de Doenças dos Estados Unidos cDNA – DNA complementar CRF - Forma Recombinante Circulante CTLs - Linfócito T CD8+ citotóxico CWD – Do inglês common well-documented (alelos bem documentados) CXCR4 – Rreceptor de quimiocina tipo 4 DNA – Ácido desoxirribonucleico dNTP – Trifosfato de desoxiribonucleotídeo DST – Doença sexualmente transmitida ERAP1 – Aminopeptidase do Retículo Endoplasmático gp120 e gp41 – Glicoproteínas virais GzmB - Granzima B HCPA - Hospital de Clínicas de Porto Alegre HIV - Vírus da imunodeficiência humana HLA - Do inglês Human Leukocyte Antigen (Antígeno Leucocitário Humano) IF - Inibidores de fusão IGV – Do inglês Integrative Genomics Viewer IHIW - Do inglês International HLA and Immunogenetics Workshops (Workshops Internacionais de HLA e Imunogenética) II - Inibidores de integrase IMGT/HLA – Do ingles international ImMunoGeneTics information system IN – Inibidores de integrase INCA - Instituto Nacional de Câncer INNTR - Inibidores não-nucleosídicos da transcriptase reversa INTR - Inibidores nucleosídicos da transcriptase reversa IP - Inibidores de protease Kb – Quilobase LTRs - Repetições terminais longas M – Molar mAmp – Miliamperes MgCl2 – Cloreto de magnésio MHC – Do inglês Major Histocompatibility Complex (Complexo Maior/Principal de Histocompatibilidade) mM – Milimolar NaOH – Hidróxido de sódio NCBI – Do inglês National Center for Biotchenology Information
xvi
NGS – Do inglês Next Generation Sequencing (Sequenciamento de Nova Geração) NK - Células natural killer ŋg – Nanograma ºC – Graus Celsius OMS - Organização Mundial da Saúde Pb – Pares de base PCR - Reação em Cadeia da Polimerase PCR-SSO – Do inglês sequence-specific oligonucleotide probes PCR-SSP – Do inglês sequence-especific primers PR – Protease RE - Retículo Endoplasmático RNA – Ácido ribonucleico RNAm - RNA mensageiro rpm – Rotações por minuto RT - Transcriptase reversa SBT – Do inglês sequence-based typing (Sequenciamento de Sanger) SUS - Sistema Único de Saúde TAP - Proteína transportadora TCRs - Receptores das células T TM – Temperatura de anelamento Tregs - Linfócitos T reguladores U – Unidade UNAIDS –Do inglês, Joint United Nations Programme on HIV/AIDS (Programa das Nações Unidas para HIV/ AIDS) URF - Forma Recombinante Única µL – Microlitro ρmol – Picomolar
17
1. INTRODUÇÃO
1.1 EPIDEMIOLOGIA DA INFECÇÃO PELO HIV E AIDS
A Síndrome da Imunodeficiência Adquirida (AIDS), tem como agente
etiológico o vírus da imunodeficiência humana (HIV), descoberto em 1983 por
Françoise Barré-Sinousi, Luc Montagnier e colaboradores do Instituto Pasteur de
Paris a partir de linfonodos de um paciente com aids (BARRE-SINOUSSI et al.,
1983).
Atualmente, a aids é considerada uma das maiores pandemias já registrada
na história da humanidade. Segundo dados da UNAIDS, até o fim de 2011, 34
milhões de pessoas convivem com HIV no mundo. A prevalência de adultos
infectados no mundo, de 15 a 49 anos, é de 0,8%. Entretanto, o número de novas
infecções pelo vírus vem diminuindo desde a década de 90, sendo que apenas 2,5
milhões desses mencionados acima representam novos infectados – uma taxa 20%
menor do que a registrada em 2001. Em 39 países, a incidência do HIV teve uma
queda superior a 25% entre 2001 e 2011 (UNAIDS, 2013).
De acordo com o último Boletim Epidemiológico divulgado pelo Departamento
de DST/Aids do Ministério da Saúde (MINISTÉRIO DA SAÚDE, 2013), até o ano de
2012, foram registrados que 718 mil pessoas vivem com HIV/Aids no Brasil e a taxa
de incidência de aids foi de 20,2 casos por 100 mil habitantes. A Região Sul
destaca-se com a maior incidência nesse ano: 30,9/100.000 habitantes, seguida
pela Região Norte (21,0), Região Sudeste (20,1), Região Centro-Oeste (19,5) e
Região Nordeste (14,8). Dentre as Unidades da Federação, destacam-se as maiores
taxas de detecção de casos de aids no Rio Grande do sul (41,4), Santa Catarina
(33,5), Amazonas (29,2) e Rio de Janeiro (28,7). Entre as capitais brasileiras, Porto
Alegre continua liderando a classificação por taxa de detecção de casos de aids,
ocupando o primeiro lugar desde 2006. Em 2012, as taxas de casos de aids para
cada 100.000 habitantes foram de 93,7 para Porto Alegre e 57,0 para Florianópolis,
em segundo lugar na classificação.
O advento da terapia antirretroviral diminui o risco de transmissão do vírus,
contribuindo substancialmente para a melhoria na qualidade de vida dos pacientes
infectados. O Brasil é, portanto, referência na administração gratuita dos
18
antirretrovirais pelo Sistema Único de Saúde (SUS), no qual os brasileiros infectados
recebem o tratamento subsidiado pelo governo segundo orientações de tratamento
do Ministério da Saúde (MS).
1.2 HISTÓRIA NATURAL DA INFECÇÃO PELO HIV
O vírus pode ser encontrado em fluidos corporais, sendo transmitido
horizontalmente através da exposição da mucosa a fluidos contaminados
(hemoderivados ou esperma) ou por inoculação (drogas injetáveis) (SPIRA et al.,
1996). Já a transmissão vertical pode ocorrer durante a gestação, parto ou
aleitamento materno (COWAN et al., 1984). O HIV possuiu como células-alvo as que
expressam receptores CD4, como linfócitos T CD4+ do sistema imune do
hospedeiro, macrófagos e células dendríticas.
Após o estabelecimento da infecção, a progressão é caracterizada por três
fases: (i) aguda, (ii) assintomática e (iii) aids,o que pode ser observado na Fig. 1.2.1.
A fase aguda é caracterizada por um pico de viremia e queda drástica dos níveis de
células T CD4+, ocorrendo nas primeiras duas a quatro semanas após a infecção.
Essa fase é geralmente sintomática, porém com sintomas inespecíficos tais como
febre, dor de garganta, exantema, mialgia e mal estar.
Após o pico de viremia, inicia-se a resposta imune contra o vírus promovendo
um equilíbrio dinâmico da carga viral plasmática do HIV onde as taxas de produção
e eliminação viral são similares (HO, 1995). Esse período pode durar até dez anos
em média, porém a destruição progressiva dos tecidos linfóides leva a uma
disfunção imune de linfócitos T CD4+ caracterizando o estágio avançado da doença.
A queda acentuada dos níveis de células T CD4+ implica a susceptibilidade
do indivíduo a infecções oportunistas por bactérias, fungos, vírus, infecções por
protozoários e surgimento de neoplasias. Muitas dessas infecções tornam-se
mortais quando os níveis de células T CD4+ caem abaixo de 200 células por
milímetro cúbico de sangue, o que caracteriza a progressão para aids (SABIN e
LUNDGREN, 2013).
19
Figura 1.2 .1 História natural da infecção pelo HIV em adultos (extraída de
http://www.obrac.org/aids.htm).
As condições clínicas indicativas como típicas do estágio avançado da aids
foram definidas pelo Centro de Controle de Doenças dos Estados Unidos - CDC,
tendo como base critérios clínicos e imunológicos. Os estágios clínicos são definidos
em: A (assintomático, linfoadenopatia ou infecção aguda), B (sintomáticos –
candidíase, herpes e outros) e C (clínicos de aids – sarcoma de Kaposi, tuberculose
pulmonar e outros). Já os estágios imunológicos são definidos pela contagem de
células CD4+ por milímetro cúbico de sangue e classificados em: 1 (≥500 cel/mm3),
2 (499-200 cel/mm3) e 3 (<200 cel/mm3) (CDC, 1994).
Devido à variabilidade da duração da fase assintomática, vários grupos têm
sido descritos na literatura com características clínicas distintas como os
progressores rápidos, os progressores típicos, não progressores de longo termo e os
controladores de elite.
Os indivíduos considerados progressores rápidos são caracterizados por um
declínio drástico das células T CD4+ e uma evolução para a fase aids dentro de três
anos. Já os progressores típicos evoluem para aids dentro dos 10 anos seguintes à
infecção. Os indivíduos caracterizados como não-progressores de longo termo
desenvolvem uma lenta diminuição das células T CD4+ ao longo do tempo,
mantendo níveis normais por mais de 10 anos na ausência de terapia antirretroviral
(CASADO et al., 2010; PETRUCCI et al., 1997). Há ainda um grupo definido como
20
“controladores de elite”, caracterizado pela persistência de carga viral indetectável
independente do tempo de infecção (SAKSENA et al., 2007).
1.3 PARTÍCULA VIRAL E ESTRUTURA GENÔMICA DO HIV-1
O HIV é um retrovírus pertencente à família Retroviridae, caracterizada por
possuir a enzima transcriptase reversa que tem por finalidade a retrotranscrição do
RNA viral em uma dupla fita de cDNA, durante a entrada do vírus na célula
hospedeira, e ao gênero Lentivirus que apresentam progressão de sintomatologia
lenta (COFFIN et al., 1997).
A partícula viral do HIV-1 é uma estrutura esférica composta na sua camada
mais externa por um envelope de natureza glicolipoproteica, com origem na camada
bilipídica da célula hospedeira infectada, durante o brotamento do vírus (GOTO et
al., 1994). Nesta membrana externa são encontradas glicoproteínas virais inseridas
(gp120 e gp41) responsáveis pela ligação do receptor CD4 e correceptores (CCR5 e
CXCR4) presentes na superfície da célula a ser infectada e fusão entre o envelope
viral e a célula hospedeira (CLAPHAM e WEISS, 1997). Interno ao envelope
encontra-se a matriz e em seguida o capsídeo viral que possui no seu interior o
genoma do HIV-1 composto por duas cópias de RNA de polaridade positivas de
aproximadamente 9,5 kb de tamanho (DARLIX et al., 1990; FREED, 2001;
MASSIAH et al., 1996; WAIN-HOBSON et al., 1985).
O genoma é composto por três genes que codificam proteínas essenciais
gag, pol e env, comuns a todos os retrovírus; dois genes, tat e rev, que codificam
proteínas reguladoras; e quatro genes vif, vpr, vpu e nef que codificam proteínas
acessórias. Além disso, como característica comum a todos os retrovírus, o HIV–1
também tem o genoma flanqueado por repetições terminais longas (LTRs) que
constituem o local de iniciação transcricional (VARMUS, 1988).
Três enzimas virais também encontram-se dentro do capsídeo; são elas a
enzima protease (PR), a transcriptase reversa (RT) e a integrase (IN), ambas
codificadas pelo gene pol. Além dessas enzimas também existem proteínas
acessórias Nef, VIf e Vpr dentro do capsídeo, junto ao genoma viral (FRANKEL e
YOUNG, 1998). A organização do genoma e partícula viral podem ser observadas
na Fig. 1.3.1 abaixo.
21
Figura 1.3 .1. Partícula viral e organização genômica do HIV-1 (modificada de
http://www.liquidarea.com/2009/08/aids-decifrato-genoma-virus).
1.4 CICLO REPLICATIVO DO HIV E TRATAMENTO ANTIRRETROVIRAL
O HIV tem como célula hospedeira alvo aquelas que expressam o receptor
CD4 em sua superfície. O ciclo replicativo do HIV, exemplificado na Figura 1.4.1, se
inicia com a ligação específica da glicoproteina viral gp120 à molécula de CD4 da
célula alvo e a ligação aos co-receptores de quimiocina CCR5 e CXCR4
promovendo a adesão do vírus à superfície celular (BERGAMASCHI e PANCINO,
2010; DALGLEISH et al., 1984). Como consequência tem-se a internalização do
capsídeo viral no citoplasma celular e a liberação do material genético viral que se
direciona para o núcleo (NIE et al., 1998; STEIN et al., 1987). Durante esse
processo ocorre a transcrição reversa do RNA viral em uma fita dupla de DNA
complementar pela enzima RT. Uma vez terminada a transcrição reversa, ocorre a
integração do DNA proviral ao genoma do hospedeiro pela ação da proteína IN,
onde ele servirá de molde para a transcrição dos genes virais (BOWERMAN et al.,
1989).
22
Com o término dessa fase inicial do ciclo replicativo viral, inicia-se a fase
tardia com a transcrição do DNA viral integrado, originando os RNAs mensageiros.
São formadas pela tradução do RNAm no citoplasma as poliproteínas Gag, Gag-Pol
e Env e as proteínas acessórias Vif, Vpr, Vpu, Nef, Tat e Rev. Duas fitas de RNA
não processadas são transportadas para os sítios de montagem das partículas
virais, abaixo da superfície interna da membrana celular. Os vírions brotam da célula
carregando com ele uma bicamada lipídica da membrana celular da célula
hospedeira, que constituirá em seu envoltório. Após o brotamento, a protease cliva
as poliproteínas virais Gag e Gag-Pol dando origem às enzimas e proteínas
estruturais e finalmente tornando o vírus maduro e infectivo (CANN e KARN, 1989).
O controle efetivo da replicação viral é possível através de diferentes
medicamentos, que tem como alvo bloquear etapas importantes do ciclo replicativo
viral, a fim de suprimir a replicação viral a níveis indetectáveis pelos métodos mais
sensíveis e reduzir a mortalidade e a morbidade causadas pela aids. Existem seis
classes de drogas antirretrovirais: inibidores nucleosídicos da transcriptase reversa
(INTR), inibidores não-nucleosídicos da transcriptase reversa (INNTR), inibidores de
protease (IP), inibidores de fusão (IF), antagonista de CCR5 (AC) e inibidores de
integrase (II) (Fig. 1.4.1).
23
Figura 1.4 .1. Ciclo replicativo do HIV-1 e atuação das classes de inibidores no ciclo de vida do HIV
(modificada de SIMON e HO, 2003).
1.5 DIVERSIDADE GENÉTICA DO HIV
Devido à enorme variabilidade genética do HIV em humanos, ele pode ser
classificado em dois tipos: o tipo 1 (HIV-1), mais disseminado pelo mundo e
responsável pela pandemia da aids; e o tipo 2 (HIV-2), menos patogênico e
endêmico na África (HU et al., 1996). Atualmente, é possível classificar o HIV-1 em
quatro grupos filogenéticos distintos: M (do inglês Major), O (do inglês Outlier), N (do
inglês Non-O e Non-M) (ROBERTSON et al., 2000) e recentemente o grupo P
(PLANTIER et al., 2009).
O grupo M é o principal responsável pela pandem podendo ser dividido em
nove subtipos puros: A, B, C, D, F, G, H, J e K (ROBERTSON et al., 2000). A
recombinação entre vírus distintos pode gerar formas recombinantes formadas por
vírus mosaico com dois ou mais subtipos diferentes. Quando uma mesma variante
recombinante é encontrada em três ou mais indivíduos não relacionados
epidemiologicamente, esta variante é chamada de Forma Recombinante Circulante
24
(CRF). Se o vírus recombinante for encontrado em apenas um indivíduo, ele é
chamado de Forma Recombinante Única (URF). Até 2014, foram descritos 58 CRFs
diferentes de acordo com o Banco de Dados de Sequências de HIV de Los Alamos
(http://www.hiv.lanl.gov/content/sequence/HIV/CRFs/CRFs.html).
A distribuição do HIV-1 é heterogênea, sendo os subtipos C, seguido do A, os
mais prevalentes na epidemia mundial. O subtipo C responde por quase metade
(48%) de todas as infecções globais devido à sua presença na África, onde reside
grande parte da população infectada, na Índia e na China. O subtipo A apresenta
12% de prevalência mundial, estando amplamente difundido na Europa Oriental,
Ásia Central, além de países da África Central e Oriental. Em seguida, o subtipo B,
com 11% de prevalência, é o subtipo mais disseminado no mundo e predominante
nos países ricos, como Estados Unidos, Europa Ocidental, Japão e Austrália.
(HEMELAAR et al., 2011; SHAW e HUNTER, 2012; SKAR et al., 2011).
O Brasil responde por cerca de dois terços das infecções pelo HIV-1 no
continente Sul Americano e sua epidemiologia molecular se destaca com o subtipo B
apresentando maior circulação no país, seguido de outros subtipos, tais como F1, C,
e diversos recombinantes F/B e B/C (BONGERTZ et al., 2000; COUTO-
FERNANDEZ et al., 1999; MORGADO et al., 1994; SABINO et al., 1994; SANABANI
et al., 2010; SOARES et al., 2003a).
Com efeito, a região Sul do Brasil apresenta uma epidemiologia diferenciada
do restante do país devido a uma maior prevalência do subtipo C e recombinantes
B/C (BRINDEIRO et al., 2003; GRAF et al., 2011; PASSAES et al., 2009; SOARES
et al., 2005; SOARES et al., 2003a; SOARES et al., 2003b), observando-se a
presença do CRF 31_BC, provavelmente formado por cepas locais da cidade de
Porto Alegre (SANTOS et al., 2007; SANTOS et al., 2006).
A aparente segregação de subtipos ou recombinantes do HIV-1 em diferentes
regiões geográficas pode estar relacionada ao perfil imunogenético dos grupos
expostos. Frente a esse panorama apresentado vários estudos têm procurado
identificar determinantes genéticos de susceptibilidade e resistência, responsáveis
pela resposta imune ao HIV-1 para um maior entendimento da dinâmica da infecção
viral. E o principal determinante genético já observado é o Sistema HLA.
25
1.6 O COMPLEXO MHC E SISTEMA HLA
O Complexo Maior/Principal de Histocompatibilidade (MHC, do inglês Major
Histocompatibility Complex) foi descoberto em 1937 por Peter Gorer em estudos
com transplantes de camundongos (GORER e SCHUTZE, 1938). O MHC existe em
todos os vertebrados e é constituído por genes de importantes funções imunológicas
(BJORKMAN et al., 1987b). Mais tarde, em 1958, por meio de um estudo com
transfusões seriadas, Jean Dausset concluiu que pessoas submetidas a transfusões
sanguíneas são capazes de aglutinar leucócitos de outras pessoas, descobrindo
assim o primeiro antígeno humano, o HLA-A*02, na época denominado MAC
(DAUSSET, 1984). O sistema de Antígeno Leucocitário Humano (HLA, do inglês
Human Leukocyte Antigen) é o correspondente humano do MHC e tem como por
função expor epítopos que são reconhecidos por células T. Esses receptores das
células T (TCRs) reconhecem o contexto específico de ligação não-covalente de
peptídeos antigênicos a moléculas MHC (MCDEVITT, 2000).
O sistema HLA está localizado no braço curto do cromossomo 6 (6p21),
possui aproximadamente 3.600 kilobases de DNA e é constituído por 224 genes,
dos quais 128 são genes funcionais e 96 são pseudogenes. O sistema HLA é
subdividido em três regiões de acordo com a estrutura e função dos seus genes:
HLA de classe I, classe II e classe III como pode ser visto na Fig. 1.6.1 (THE MHC
SEQUENCING CONSORTIUM, 1999; APOSTOLOPOULOS et al., 2008; BECK e
TROWSDALE, 2000).
26
Figura 1.6 .1. Mapa da região HLA, banda 6p21.3 do cromossomo 6 (Retirada de http://e-
gastroped.com.br/jun05/cel02.jpg).
1.7 HLA CLASSE I
A região de classe I contém os genes clássicos (HLA-A, HLA-B e HLA-C) e
não clássicos (HLA-E, HLA-F e HLA-G), localizados na porção mais telomérica do
sistema HLA e expressos na superfície da maioria das células nucleadas. (CHOO,
2007). Esses genes codificam para a formação da cadeia polipeptídica pesada alfa
que está ligada não covalentemente na porção extracelular com β2-microglobulina
(B2m). Em humanos, B2m é invariável e seu gene está localizado no cromossomo
15 (BJORKMAN e PARHAM, 1990; THE MHC SEQUENCING CONSORTIUM,
1999).
A cadeia alfa das moléculas de classe I possui três domínios extracelulares
(a1, a2, a3), uma região transmembranar e um domínio citoplasmático que podem
ser exemplificados na Fig. 1.7.1 Por um lado, os domínios a1 e a2 contêm variações
na sequência de aminoácidos, sendo altamente polimórfica, e esses domínios
determinam a especificidade antigênica das moléculas de HLA classe I. O domínio
27
a3 é altamente conservado e sitio de ligação para o CD8. Os domínios a3 e B2m
juntos formam um domínio constante (BJORKMAN et al., 1987b). Por outro lado, o
domínio transmembranar é formado por aminoácidos hidrofóbicos e o domínio
citoplasmático contém sítios para fosforilação de proteínas e ligação com o
citoesqueleto celular (PARHAM, 1990).
Os domínios a1 e a2 da cadeia alfa formam uma estrutura única chamada
fenda de apresentação de peptídeo, que é o sítio de ligação para antígenos
peptídicos. Essa estrutura consiste em uma plataforma de oito folhas β-pregueadas
antiparalelas, formando o assoalho da fenda, e duas α-hélices paralelas opostas no
topo da plataforma que pode ser observada na Fig. 1.7.1. Na fenda se ligam
peptídeos processados de 8 a 10 resíduos de aminoácidos (BJORKMAN et al.,
1987a; KLEIN e SATO, 2000a).
Figura 1.7 .1. Fenda de ligação a peptídeo da molécula HLA classe I (Retirada de
http://www.ufpe.br/biolmol/Aula-Imunogenetica/aula-imuno-05.htm).
A fenda de ligação está estruturada em várias subcavidades denominadas
pockets (bolsos) que variam na sua constituição de aminoácidos, conferindo a
especificidade na ligação a diferentes peptídeos, como pode ser observado na
Figura 1.7.2. Dessa forma, diferentes peptídeos se ligam a diferentes moléculas de
HLA, desde que certos aminoácidos específicos estejam presentes por serem
28
necessários para a ancoragem na fenda. Os pockets B e F são os mais importantes,
pois interagem com as cadeias laterais dos resíduos P2 e P9 do peptídeo
funcionando como âncoras e determinando o tipo de peptídeo que se ligar à
molécula de HLA (KLEIN e SATO, 2000a).
Figura 1.7 .2. Representação da fenda de ligação a peptídeo das moléculas de HLA classe I
(Modificada de KLEIN e SATO, 2000a).
Os genes que codificam a cadeia alfa das moléculas HLA de classe I
apresentam uma estrutura característica, na qual cada éxon é responsável por
codificar cada um dos domínios do polipeptídeo. O peptídeo líder é codificado pelo
exon1, os domínios extracelulares a1, a2 e a3, são codificados pelos éxons 2 (343
pb), 3 (274 pb) e 4 (276 pb), respectivamente; o segmento transmembranar pelo
éxon 5 e a cauda citoplasmática pelos éxons 6 e 7. A região 3´ não traduzida faz
parte do éxon 8. A sequência total de éxons 1 a 8 consiste em 1089-1101
nucleotídeos, e codificam para um polipeptídio de 362 - 366 aminoácidos (MARSH,
2000).
29
1.8 HLA CLASSE II E III
A região de classe II consiste em uma série de subregiões (DR, DQ, DP, DM
e DO), cada uma contendo genes A e B que codificam cadeias alfa e beta
respectivamente (BJORKMAN e PARHAM, 1990). Os genes classe II localizam-se
na região mais centromérica do Sistema HLA e se expressam nas células
apresentadoras de antígenos (monócitos, macrófagos e células dendriticas),
linfócitos B e linfócitos T ativados (CHOO, 2007).
Estes receptores membranares são constituídos por uma porção extracelular,
uma região transmembranar e um segmento citoplasmático como pode ser
observada na Fig. 1.8.1 (DOHERTY e ZINKERNAGEL, 1975). A região extracelular
é formada pelos domínios a1 e b1, região altamente polimórfica de ligação de
peptídeos, e domínios a2 e b2, região altamente conservada de ligação ao CD4.
Diferentemente das moléculas de classe I, a fenda de ligação de peptídeos se
associa a peptídeos de 13-25 aminoácidos, sendo que alguns aminoácidos do
peptídeo podem se ligar a partes externas da fenda (GATTI e PIERRE, 2003; KLEIN
e SATO, 2000a).
Figura 1.8 .1. Estrutura das moléculas de HLA classe I e II (Retirada de
http://www.elsevierimages.com/image/25928.htm).
30
A região classe III do sistema HLA localiza-se entre os genes classe I e classe
II e, apesar de não ser tão polimórfico como estes últimos, constitui o segmento do
genoma humano com maior densidade de genes (XIE et al., 2003). Ao contrário da
região classe I e classe II onde existem dezenas de pseudogenes, a região classe III
possui apenas dois (THE MHC SEQUENCING CONSORTIUM, 1999). A região da
classe III não codifica moléculas de HLA, mas contém genes para componentes do
complemento (C2, C4, fator B), 21-hidroxilase, fator de necrose tumoral entre outros
(BECK e TROWSDALE, 2000). Os genes classes III do sistema HLA possuem várias
funções, destacando-se o seu papel na codificação de proteínas solúveis
importantes na modelação e regulação da resposta imunitária (XIE et al., 2003).
1.9 PROCESSAMENTO E APRESENTAÇÃO DE ANTÍGENOS VIA HLA
CLASSE I
O complexo peptídeo-HLA classe I da superfície celular é reconhecido por
receptores de linfócitos T CD8+, enquanto que o complexo peptídeo - HLA classe II
é reconhecido por receptores de linfócitos T CD4+ (PAMER e CRESSWELL, 1998).
A natureza e origem dos peptídeos que vão se ligar a moléculas de Classe I ou II
são diferentes (ENGELHARD, 1994). Moléculas HLA Classe I se associam a
antígenos endógenos sintetizados pela célula alvo (exemplo: proteínas celulares ou
induzidas por vírus), enquanto que HLA classe II à antígenos exógenos de
patógenos extracelulares (dentro de vesículas no citoplasma) (VYAS et al., 2008).
Peptídeos de proteínas próprias do hospedeiro e não-próprias podem se
associar às moléculas HLA, sendo que a natureza química da fenda de ligação a
peptídeo determinará quais peptídeos irão se ligar, devido à especificidade dos
aminoácidos dos sítios de ancoragem (VYAS et al., 2008).
A apresentação de antígenos via HLA classe I se inicia com a clivagem de
proteínas pelo proteassoma em fragmentos menores (peptídeos) que por sua vez
são transportados para o Retículo Endoplasmático (RE). O transporte dos peptídeos
para o interior do RE se dá através da proteína transportadora TAP, localizada na
membrana do RE. Após a internalização dos peptídeos, a aminopeptidase ERAP1
realiza uma checagem do tamanho dos peptídeos para garantir que eles poderão se
31
ligar na fenda de apresentação da molécula de HLA, caso tenham um tamanho
maior, eles serão clivados para 8 a 9 aminoácidos (NEEFJES et al., 2011).
Enquanto isso, a molécula de HLA está sendo produzida com o auxílio das
chaperonas calnexina, calreticulina e tapasina, que acompanham toda a síntese da
molécula e seleção de peptídeo impedindo que ela prossiga caso ocorra algum erro.
As chaperonas se associam a cadeia alfa da molécula de HLA, estabilizando-a até
que a cadeia b-microglobulina seja sintetizada e se ligue a molécula, e até que seja
feita a correta ligação com o peptídeo. Uma vez ligados, o complexo HLA associado
ao peptídeo é encaminhado para o Complexo de Golgi e transportado por vesículas
até a membrana celular para ser expresso na superfície celular e reconhecido por
receptores de células T CD8+ (NEEFJES et al., 2011; VYAS et al., 2008).
1.10 NOMECLATURA DO SISTEMA HLA
A existência da molécula HLA foi aceita muito antes de se conhecer sua
estrutura molecular ou de se compreender amplamente todas as suas funções
biológicas. Inicialmente, a nomeclatura do HLA foi estabelecida e padronizada nos
Workshops Internacionais de HLA e Imunogenética (International HLA and
Immunogenetics Workshops - IHIW) realizados desde 1964 para que os
pesquisadores pudessem comparar suas técnicas e resultados de tipagem de HLA e
comunicar novas descobertas.
Atualmente, ficou estabelecido que os alelos fossem distinguidos por quatro
dígitos, o que difere quanto ao nível proteico. Dígitos adicionais foram adicionados
para polimorfismos encontrados em outras regiões do gene, como regiões intronicas
e promotora, assim como sufixos como o N para alelos nulos, S para secretados e L
para os de baixa expressão (MARSH et al., 2010). A Fig. 1.10.1 exemplifica a
nomeclatura do sistema HLA.
32
Figura 1.10 .1. Nomeclatura do Sistema HLA (Modificada de hla.alleles.org).
O HLA-B é o alelo mais polimórfico entre os HLA classe I, com 3285 alelos
descritos, seguido do HLA-A com 2579 alelos e do HLA-C com 2133 alelos. Entre os
HLA classe II, o lócus DRB apresenta o maior número de alelos descrito, 1512
alelos, seguido do lócus DQB1 com 509 alelos e do DPB1 com 248 alelos
(IMGT/HLA http://www.ebi.ac.uk/ipd/imgt/hla/stats.html acessado 17/01/2014 as
11:45).
1.11 POLIMORFISMOS DO HLA
O Sistema HLA é conhecido por ser o mais polimórfico em humanos. Os
polimorfismos do HLA não são sempre espalhados pela molécula, mas localizam-se
essencialmente nos éxons 2 e 3, os quais codificam para as estruturas moleculares
do receptor onde se localiza o sítio de ligação a peptídeos (BJORKMAN e PARHAM,
1990; BJORKMAN et al., 1987a; KLEIN e SATO, 2000a; MALISSEN et al., 1982).
Esse número limitado de resíduos de aminoácidos é o responsável pela
especificidade de ligação das moléculas de HLA, uma vez que diferentes moléculas
de HLA apresentam padrões de aminoácidos distintos em sua sequência de ligação
a peptídeos (FALK et al., 1991; GARRETT et al., 1989). Cada molécula de HLA
33
pode se ligar a diferentes peptídeos através do conceito de ligação de peptídeos
“degenerada”.
Polimorfismos geram mudanças estruturais na fenda de ligação no domínio
extracelular da proteína de HLA classe I. Isso afeta a função biológica das moléculas
de HLA classe I de se ligar e apresentar peptídeos para o receptor antígeno-
específico do linfócito T CD8+ (CTLs) (STEPHENS, 2005). Além disso, existem
grupos de alelos chamados de supertipos, que compartilham preferências
especificas de ligação a pequenos peptídeos antigênicos com tamanho, carga e
composição de aminoácidos similares (SETTE e SIDNEY, 1999; SIDNEY et al.,
2008).
O polimorfismo no sistema HLA parece ter sido selecionado por pressões
evolutivas e muito dessa diversidade surgiu devido a pressões seletivas de
microorganismos. Alguns novos alelos podem se originar por mutações pontuais,
porém muitos são originados por recombinação ou conversão gênica, na qual uma
sequência é substituída em parte por outra de um gene homólogo. A recombinação
entre variantes alélicos de um lócus parece ter sido mais importante do que a
conversão gênica na geração de polimorfismo (PRUGNOLLE et al., 2005). Assim, os
polimorfismos extensos no sistema HLA podem ser considerados como uma marca
histórica da evolução no genoma humano, refletindo o processo de seleção natural
pelos microorganismos agindo no sistema imune adaptativo, levando à
sobrevivência, diversificação e expansão da espécie (STEPHENS, 2012).
Variações extensivas de alelos de HLA classe I e classe II ocorrem em
diferentes grupos étnicos, fazendo com que certos haplótipos sejam encontrados
mais frequentemente em uma população. Este fenômeno se dá devido ao
desequilíbrio de ligação entre os loci do HLA, possibilitando combinações estáveis
de alelos ou haplótipos, que também varia em composição e frequência entre
diferentes grupos étnicos (GONZALEZ-GALARZA et al., 2011; STEPHENS, 2005). O
desequilíbrio de ligação ocorre quando a frequência de dois alelos juntos em um
mesmo haplótipo excede o previsto. Por exemplo, o haplótipo HLA-A1, B8, DR17 é o
mais comum entre caucasianos, com uma frequência de 5% (CHOO, 2007).
34
1.12 FUNÇÃO DO HLA CLASSE I E ASSOCIAÇÃO COM SISTEMA IMUNE
E DOENÇAS
O HLA desempenha um importante papel na ativação e resposta do sistema
imune à substancias estranhas através da diferenciação entre próprio e não-próprio.
Os genes do HLA classe I estão envolvidos na imunidade mediada por células T
citotóxicas, que é conhecida por ser a resposta primaria contra células infectadas
por vírus (CARRINGTON e O'BRIEN, 2003).
A função do HLA classe I é de apresentar na superfície celular antígenos
próprios e não próprios como os produzidos no interior de células infectadas por
vírus ou oriundos de desenvolvimento tumoral. Essa apresentação alerta células T
CD8+ específicas para o reconhecimento do antígeno apresentado, desenvolvendo
então uma resposta imune adaptativa (ZINKERNAGEL, 1997).
A interação do complexo HLA classe I-antígeno com o receptor TCR da célula
T CD8+ induz a dois caminhos principais para a morte da célula infectada: resposta
independente de grânulos que envolve interação Fas/FasL (POONIA et al., 2009) ou
liberação de grânulos líticos como perforinas e granzima B (GzmB) (MIGUELES et
al., 2008). Essas moléculas alertam também células natural killer (NK) que possuem
uma habilidade inata de reconhecer e destruir células infectadas ou tumorais
(DOHERTY e ZINKERNAGEL, 1975; PARHAM, 2005; TRINCHIERI, 1989).
Células NK são conhecidas por reconhecer a perda de expressão de
moléculas de HLA classe I e destruir células com expressão diminuída de moléculas
de classe I assim como ocorre em tumores e células infectadas por vírus. Outras
células com expressão normal de MHC classe I ainda podem ser alvos de NK se
elas proverem sinais apropriados para ativação de seus receptores. Muitos
receptores de células NK foram identificados e a maioria dos seus ligantes são
moléculas de HLA classe I (CHOO, 2007).
Essa resposta imune gerada pela apresentação de antígenos pelo Sistema
HLA é de extrema importância para o transplante de órgãos e de células tronco
hematopoiéticas. A combinação de alelos de HLA entre doadores e receptores se
faz necessária a fim de evitar a rejeição e doença enxerto versus hospedeiro. Além
disso, a menor expressão de moléculas de HLA em células tumorais e
consequentemente menor apresentação de antígenos tumorais é uma das principais
35
hipóteses para se explicar a inabilidade do sistema imune de reconhecer as células
malignas, mostrando mais uma vez o importante papel da resposta imune mediada
por HLA classe I (APTSIAURI et al., 2007a; APTSIAURI et al., 2007b; DEL CAMPO
et al., 2012).
Diversos estudos têm relacionado os alelos de HLA a predisposição à
diversas doenças e a diversos desfechos diferentes. Dentre as mais proeminentes
associações estão a de maior predisposição a desenvolvimento de doenças
reumáticas autoimunes como artrite reumatóide com diferentes alelos de HLA-DRB1
e da espondilite anquilosante com o HLA-B*27. Outras doenças como esclerose
múltipla, psoríase, diabetes tipo 1, narcolepsia e alergias também são associadas a
diferentes alelos de HLA. Os genes do sistema HLA também apresentam uma
importância particular na progressão ou resistência a doenças infecciosas como, por
exemplo, a infecção pelo HIV-1 (KLEIN e SATO, 2000b).
1.13 PAPEL DO HLA NA INFECÇÃO PELO HIV-1
Sabe-se que 1 em 300 pessoas infectadas pelo HIV-1 mantém controle
espontâneo do vírus a níveis abaixo de 50 cópias de RNA por microlitros, valor
mínimo detectável (DEEKS e WALKER, 2007). Em alguns casos, pessoas
infectadas permanecem por mais de três décadas sem manifestar evidências
clínicas de progressão da doença, ou então progridem muito lentamente para a aids
(CARRINGTON e WALKER, 2012). Outro caso seria a existência de indivíduos que
foram expostos ao HIV, as vezes repetitivamente e por longos períodos de tempo, e
que permaneceram não infectados. Esses eventos indicam uma resposta natural à
infecção pelo HIV-1. Foram encontradas algumas mutações em comum em ambos
os grupos de pessoas exposto-não infectados e de progressores lentos, sugerindo
uma teoria de que traços do hospedeiro estariam impedindo ou dificultando a
entrada do vírus na célula e reduzindo a infecção, e se a infecção ocorre essas
mesmas características eliminariam ou retardariam a progressão da doença
(MARMOR et al., 2006).
As respostas celulares contra infecções são dependentes da constituição
imunogenética do indivíduo, e dentro do genoma nuclear humano, os genes de HLA
de classe I são os mais convincentes loci de traços quantitativos para o controle da
36
infecção pelo HIV-1 (BRUMME et al., 2012; CARLSON et al., 2012; CARRINGTON e
O'BRIEN, 2003; DALMASSO et al., 2008; FELLAY, 2009; FELLAY et al., 2009;
KAWASHIMA et al., 2009; MOORE et al., 2002; PELAK et al., 2010).
A diversidade genética do HLA influencia diferentes aspectos da infecção pelo
HIV e da aids como na transmissão viral, controle da dinâmica e progressão viral,
desenvolvimento de doenças oportunistas e até na resposta à terapia incluindo a
hipersensibilidade observada a drogas antivirais (KAUR e MEHRA, 2009a, b; SINGH
et al., 2008; STEPHENS, 2005). Além disso, a resposta imune restrita por HLA
classe I possui influência direta na diversidade, replicação e fitness evolutivo viral,
através das mutações de escape imune que surgem no genoma do HIV (SHARMA
et al., 2011).
De fato, os peptídeos virais apresentados por algumas moléculas HLA classe
I induzem fortes respostas contra o HIV a partir das células T CD8 específicas,
responsáveis pelo controle da replicação viral, e, consequentemente, bloqueiam a
depleção de linfócitos T CD4+ e a progressão da doença (LETVIN e WALKER, 2003;
MCMICHAEL e JONES, 2010; PEREYRA et al., 2010).
Diversos estudos vêm demonstrando que alelos “protetores” do hospedeiro
como o HLA-B*27:05, B*57:01 e B*14/C*08:02 estão associados com o controle
imune da infecção e com a progressão mais lenta, ao passo que alelos como B*07,
B*35 e B*53 levam a um rápido desenvolvimento para a aids (BANSAL et al., 2007;
CARRINGTON e O'BRIEN, 2003; MCMICHAEL e JONES, 2010; MIGUELES et al.,
2000; TANG e KASLOW, 2003).
Os alelos B*57:01 e B*27:05 são os mais bem descritos na literatura quanto à
associação com o controle da carga viral e progressão mais lenta para aids. Tem
sido proposto que os peptídeos virais apresentados por estas moléculas induzem
fortes respostas citotóxicas contra o HIV, que são responsáveis pelo controle viral
observado (MCMICHAEL e JONES, 2010; PEREYRA et al., 2010). Além disso,
estudos mostraram que células T CD8+ restritas pelos alelos HLA-B*27 e B*57 são
muito mais resistentes à supressão pela regulação de Tregs (linfócitos T
reguladores) do que células T CD8+ restritas por alelos não protetores da infecção
pelo HIV. A falta de supressão dessas células CTLs restritas por esses alelos,
permite que essas células continuem a proliferar e lisar os alvos infectados durante a
37
infecção crônica, o que pode gerar uma progressão mais lenta para a doença em
pessoas com esses alelos protetores (ELAHI et al., 2011).
Apesar da grande influência do HLA-B em haplótipos relacionados à proteção
contra a infecção pelo HIV, alguns haplótipos não podem ser explicados apenas pela
ligação ao HLA-B, evidenciando um efeito protetor interdependente entre os alelos.
Apesar do HLA-B ter um grande impacto, o controle do HIV é provavelmente
influenciado por efeitos aditivos de outros alelos de HLA presente, como no caso de
haplótipos Cw04:01-B*81:01, Cw12:03-B*39:10, A*74:01-B*57:03 e B*75:01-
Cw06:02 (LESLIE et al., 2010; MCMICHAEL e JONES, 2010; ZIPETO e BERETTA,
2012).
Estudos desenvolvidos por Carrignton e colaboradores mostraram que a
heterozigosidade de alelos de HLA classe I está associada com uma menor
progressão para aids em pacientes infectados pelo HIV e, por outro lado, a
homozigosidade está associada com a progressão mais rápida para a doença. Isso
pode ser resultante da diversidade de peptídeos de HIV apresentados para células T
devido a presença de uma maior diversidade alélica em heterozigotos. Portanto, se
demoraria mais para surgirem mutações de escape imune em heterozigotos
(CARRINGTON et al., 1999; CARRINGTON e O'BRIEN, 2003).
Outro dado interessante são estudos que demonstram a associação de alelos
de HLA classe I a subtipos específicos do HIV-1. Como exemplo nós temos estudos
que mostraram que os alelos B*15:16 e B*15:17 são associados com redução da
viremia do HIV-1 de subtipos B e C (FRAHM et al., 2005), mas não em paciente
infectados com subtipo A (FRAHM et al., 2005; LAZARYAN et al., 2006). O HLA-
B*15:03 se mostrou associado com redução da viremia em infecção pelo subtipo B
(FRAHM et al., 2006), mas não com subtipo C (KIEPIELA et al., 2004; LESLIE et al.,
2010). Ao contrário, B*18 foi demonstrado estar associado ao aumento da viremia
em infecções com subtipo C (KIEPIELA et al., 2004; LESLIE et al., 2010), mas não
com infecções de subtipo A e B (FARQUHAR et al., 2004; KASLOW et al., 1996).
Porém, os alelos de HLA que parecem ter uma associação única com subtipos
específicos do HIV são pouco frequentes nos grupos étnicos expostos a diferentes
subtipos de HIV para que os estudos possam alcançar poder estatístico nas
associações (STEPHENS, 2012).
38
1.14 TIPAGEM DO HLA POR SEQUENCIAMENTO DE NOVA GERAÇÃO
(NGS)
A tipagem do HLA é de grande importância para rotina clínica de procura de
doadores e receptores compatíveis para transplantes, associação a doenças
autoimune e reações adversas a drogas, desenhos de peptídeos imunogênicos para
vacinas antivirais e tratamento de câncer, estudos de genética populacional e
evolucionária, entre outros.
O processo de identificação dos alelos de HLA tem evoluído dos métodos
com base sorológica para os métodos mais recentes com base no DNA como, por
exemplo, PCR-SSO (sequence-specific oligonucleotide probes), PCR-SSP
(sequence-especific primers) e Sequenciamento de Sanger - SBT (sequence-based
typing), tendo o sequenciamento de DNA como o padrão ouro para tipagem de HLA
em todo o mundo (ERLICH, 2012; GRUMBT et al., 2013).
Atualmente já foram identificados mais de 10.533 alelos de HLA segundo o
bando de dados do IMGT/HLA, porém menos de 10% desses alelos possuem a
sequência completa, atendo-se apenas aos éxons mais polimórficos que codificam a
fenda de ligação a peptídeos, pois possuem mais relevância clínica em transplantes
de órgãos. Porém, até mesmo em transplantes entre indivíduos com alelos idênticos,
aproximadamente 30% dos receptores apresentam eventos adversos de rejeição
dentro de cinco anos (OTTINGER et al., 2003). Não se sabe se isso se dá devido a
fatores genéticos, como diferenças nucleotídicas em regiões não analisadas do HLA
ou se outros genes estariam envolvidos. Portanto, a relevância clínica dos outros
éxons não habitualmente tipados permanece desconhecida.
Outro dado muito importante é que apenas cerca de 30% desses alelos
descritos no banco de dados atendem aos critérios de alelos bem documentados
(CWD common well-documented) e mais de 40% desses foram reportados apenas
uma única vez (alelos raros) (CANO et al., 2007).
Tipagens ambíguas podem ocorrer devido a padrões de polimorfismos em
cis/trans de amostras heterozigotas ou devido a alguns alelos serem idênticos em
regiões comumente analisadas, levando a duas ou mais combinações de alelos
(BENTLEY et al., 2009; HOLCOMB et al., 2011; HOSOMICHI et al., 2013; LIND et
al., 2010). Uma maneira de resolver essas ambiguidades seria analisar exons
39
adicionais ou até mesmo todo o gene e determinar a fase dos polimorfismos.
Resolver essas ambiguidades necessita de técnicas onde seja possível separar os
haplótipos se constituindo de abordagens caras e de difícil execução (GRUMBT et
al., 2013; HOLCOMB et al., 2011). Porém com o surgimento de novas metodologias
de sequenciamento, conhecidas como Next Generation Sequencing (NGS), isso se
torna possível.
As vantagens da metodologia de sequenciamento por NGS são:
sequenciamento de grande número de bases por corrida, sequenciamento de
diversos alvos (genes ou genomas) em paralelo, sequenciamento de diversas
amostras ao mesmo tempo e grande volume de sequências geradas por corrida. As
metodologias de NGS mais utilizadas são as da plataforma Illumina (HiSeq e
MiSeq), 454/Roche e SOliD/Applied Biosystem. Apesar de diferirem em diversas
etapas, ambas as plataformas se baseiam no sequenciamento clonal onde é
produzindo uma população de fragmentos de DNA idênticos ao DNA a ser
sequenciado, gerando um número maciço de dados e permitindo assim o
sequenciamento de diversos polimorfismos, subclones, variantes e mutações
(GRUMBT et al., 2013; LIND et al., 2010).
Portanto, essas novas tecnologias de NGS, além de possibilitarem a
resolução de ambiguidades, permitem a tipagem de diversas amostras e diversos
genes do sistema HLA de uma única vez, e também a tipagem em alta resolução.
De acordo com Nunes e colaboradores, a tipagem de baixa resolução é aquela
equivalente à tipagem sorológica, definindo o alelo apenas a nível de família ou
antígeno. A tipagem intermediária envolve a análise de polimorfismos nos éxons 2 e
3 para HLA classe I e éxons 2 para classe II, enquanto que a tipagem de alta
resolução analisa polimorfismos em éxons adicionais (NUNES et al., 2011a; NUNES
et al., 2011b).
Frente a isso, a tipagem de toda a sequência do HLA sem ambiguidades
através de técnicas de NGS permite a caracterização completa em alta resolução de
novos e já existentes alelos, podendo ter implicações relevantes para o transplante
de células hematopoiéticas, assim como para diversas outras doenças associadas
ao sistema HLA, como no caso da infecção pelo HIV-1.
40
2. JUSTIFICATIVA DO PROJETO
Na presente proposta, seremos capazes de determinar a composição do alelo
HLA de classe I (lócus A, B e C) de indivíduos brasileiros HIV+ do Sul do Brasil
através de tipagem em alta resolução por NGS, um procedimento ainda não
realizado no Brasil. Isso nos permitirá um melhor entendimento dos fatores
genéticos do hospedeiro que respondem a esta infecção viral. A infecção do HIV no
Sul do Brasil por sua vez possui um panorama muito particular em relação ao
restante do país com altas taxas de detecção e grande presença do subtipo C e
recombinantes BC. Portanto esse estudo se mostra de grande importância em um
contexto étnico e genético como o da região Sul do Brasil.
3. OBJETIVOS
Determinar os alelos do HLA classe I (A, B e C) por seqüenciamento de nova
geração, avaliando diferentes metodologias de montagem e reconstrução de alelos,
e associar com parâmetros epidemiológicos, clínicos, laboratoriais de pacientes HIV+
no sul do Brasil acompanhados por mais de 15 anos e infectados pelos subtipos B,
C ou recombinantes BC do vírus.
3.1 OBETIVOS ESPECÍFICOS
• Caracterizar os subtipos do HIV-1 da coorte de pacientes HIV+ em
acompanhamento no Serviço de HIV/Aids do Hospital das Clínicas de Porto Alegre;
• Determinar os alelos de HLA nos loci A, B e C dos pacientes;
• Aplicar nova metodologia de tipagem do HLA com resolução ultraprofunda
através de sequenciamento de nova geração (NGS);
• Avaliar diferentes metodologias de tipagem de HLA e reconstrução de alelos
disponíveis para dados de NGS
• Descrição do perfil clínico e laboratorial dos pacientes estudados;
• Correlacionar parâmetros clínicos, laboratoriais e o subtipo infectante do HIV-
1 aos alelos de HLA encontrados.
41
4. MATERIAL E MÉTODOS
4.1 CASUÍSTICA
O presente estudo analisou uma coorte de pacientes HIV+ estabelecida desde
2002, acompanhada regularmente no Serviço de HIV/Aids do Hospital de Clínicas de
Porto Alegre (HCPA). Os pacientes foram convidados e aceitaram participar do
estudo. Todos os pacientes assinaram um Termo de Consentimento Livre e
Esclarecido concordando em participar da pesquisa, e a mesma foi também
aprovada pelo Comitê de Ética em Pesquisa do HCPA.
Uma amostra de sangue total foi colhida entre os anos de 2002 e 2003 e um
questionário preenchido com histórico de dados clínicos e laboratoriais conforme a
rotina do ambulatório. O questionário informativo continha as seguintes informações:
sexo, data de nascimento, data de diagnóstico para o HIV, trajetórias de carga viral
plasmática do HIV, trajetórias de contagens de linfócitos T CD4+ e CD8+,
classificação imunológica e clínica do CDC na época da coleta, histórico detalhado
de tratamento antirretrovial (quando era o caso), desenvolvimento de infecções
oportunistas, efeitos adversos da terapia antirretroviral, entre outras. As amostras
foram colhidas durante o agendamento regular do ambulatório. Somente foram
incluídos homens e mulheres maiores de 18 anos e diagnosticados positivos para
HIV.
As amostras foram enviadas para o Rio de Janeiro, ao Laboratório de
Virologia no Departamento de Genética da Universidade Federal do Rio de Janeiro,
onde foram submetidas à separação do plasma e células. Tanto o plasma quanto as
células foram estocados a -80°C, e estas últimas posteriormente tiveram seu DNA
genômico extraído. O presente estudo contemplou amostras de 253 pacientes.
Esta pesquisa foi conduzida no Programa de Genética do Centro de Pesquisa
no Instituto Nacional de Câncer José Alencar Gomes da Silva (INCA), no Rio de
Janeiro.
4.2 EXTRAÇÃO DO DNA GENÔMICO
A extração do DNA genômico foi realizada a partir da amostra de células
utilizando o kit Genomic DNA Extraction (Real Genomics, BioAmerica Inc., Miami,
42
EUA), em um fluxo laminar classe 2 (Trox Technik, Alemanha). Primeiramente foram
misturados 20 µL de proteinase K e 200 µL da amostra descongelada junto a 200 µL
do tampão AL. As amostras foram vigorosamente agitadas em Vortex® por 15
segundos, com uma posterior incubação em banho-maria a 56 ºC por 10 minutos.
Em seguida, após uma breve centrifugação, foram adicionados 200 µL de etanol
absoluto (Merck, Darmstadt, Alemanha) e as amostras foram agitadas no Vortex®
mais uma vez por 15 segundos, novamente centrifugando para recolher o material
espalhado pelo tubo. Essa mistura foi transferida para a coluna de extração, que
contêm uma membrana de sílica seletiva, e o tubo foi centrifugado por 1 minuto a
8.000 rpm.
Foram feitas duas etapas de lavagem com diferentes tampões. A primeira
lavagem foi feita com 500 µL de tampão AW1 seguida de uma centrifugação a 8.000
rpm por 1 minuto, onde o líquido centrifugado ao final foi descartado; a segunda
lavagem foi feita com 500 µL de tampão AW2 e centrifugação a 14.000 rpm por 3
minutos, também descartando-se o centrifugado ao final. O DNA genômico foi eluído
em 100 µL de tampão AE e previamente incubado a temperatura ambiente por 1
minuto. Por último, foi feita uma centrifugação a 8.000 rpm por 1 minuto, a coluna foi
descartada e a amostra eluída foi armazenada a -20 ºC.
4.3 AMPLIFICAÇÃO DE REGIÕES DO GENOMA VIRAL DO HIV-1
Foram estudadas por sequenciamento as regiões genômicas da protease
(PR) e transcriptase reversa (RT) incluindo o domínio polimerásico (DP), C-terminal,
conexão (CN) e RNase H (RH), totalizando 1750 pares de base. Através de Reação
em Cadeia da Polimerase (PCR) aninhada foram amplificados os fragmentos POL
(PR+DP) e CR (CN + RH), com aproximadamente 900 pb cada. Quando não, em
separado foram amplificadas as regiões PR (~ 300 pb), DP (~ 750 pb), CN (~ 650
pb) e RH (~ 400 pb), ilustrado na Fig. 4.3.1 Todas as reações foram realizadas com
iniciadores específicos descritos na Tabela 4.3.1 idealizados a partir do clone viral
de referência laboratorial, HXB2 (RATNER, 1987; número de acesso GenBank:
K03455).
43
Figura 4.3 .1. Representação dos esquemas de amplificação das regiões do genoma viral do HIV-1.
44
Tabela 4.3 .1. Iniciadores usados para amplificação e sequenciamento da região genômica do HIV-1
analisada.
Reg. Gen. Iniciadores Sequência Loc. No
HXB2* Orientação
TM
(°C)
DP16 CTCAAATCACTCTTTGGCAAC 2254-2274 Senso 54.5
DP11 CCTGGCTTTAATTTTACTGGTA 2593-2572 Antissenso 50.5 PR
MOPR2 AAATTTTCCCTTCCTTT 2691-2675 Antissenso 47.0
RT9 GTACAGTATTAGTAGGACCTACACCT
GTC 2470-2498 Senso 57.1
RT12 ATCAGGATGGAGTTCATAACCCATCC
A 3260-3234 Antissenso 59.3
RTint CCAGCAATATTCCAAAGTAGCATG 3018-3041 Antissenso 54.4
B2 GGGGATTTACCACACCAG 3184-3201 Senso 52.8
DP
K2 TCCCACTAACTTCTGTATGTCATTGA
C 3335-3309 Antissenso 56.3
CX1 TGGATGGGTTATGAACTCCATCCTG 3234-3258 Senso 58.4
POLM4 CTGTTAGCTGCCCCATCTACATA 3892-3870 Antissenso 56.2
RT20 CTGCCAGTTCTAGCTCTGCTTC 3462-3441 Antissenso 57.6
RT21 GCCCCTGCTTCTGTACTTCTGC 3549-3528 Antissenso 60.3
CN
CX2 ATACAGAAGTTAGTGGGAAAA 3318-3338 Senso 48.8
OUT3R CATTGCTCTCCAATTACTGTGATATTT 4295-4269 Antissenso 53.8
POLM8 GGTACCAGTTAGAGAAAGAACCCA 3826-3849 Senso 56.0
INTR-2 CCACTGGCTACATGA 4474-4460 Antissenso 43.0
INTR CAGTCTACTTGTCCATGCATGGCTTC 4396-4371 Antissenso 65.8 RH
POLM7 CTGAGTGGGAGGTTGTCAATACCCC
TCCCTTAGTGAAATTAT 3784-3825 Senso 56.0
Reg. Gen – região genômica; Loc. No HXB2 – localização no genoma do HXB2. * - A posição, relativa ao clone HXB2, foi obtida com a ferramenta HIV Sequence Locator (disponível em http://www.hiv.lanl.gov/content/sequence/LOCATE/locate.html) (Korberet al., 1998).
As reações para a PCR utilizaram os seguintes reagentes: 5 µL de tampão
10X, 1,5 µL de MgCl2 a 25 mM, 0,4 µL de dNTP mix a 25 mM, 0,5 µL de cada
iniciador a 25 ρmol/µL, 0,4 µL de Taq Platinum DNA polimerase a 5 U/µL (Life
Technologies, EUA), 100 ŋg/µL de DNA genômico e um valor de H2O livre de
nuclease para totalizar um volume final de 50 µL para cada reação. Para a reação
da PCR aninhada, foram escolhidos iniciadores internos e o DNA molde era o
45
produto da primeira etapa. A fim de monitorar as reações para identificar possíveis
contaminações foram feitos controles negativos contendo apenas os reagentes
usados para a PCR. Durante o processo de padronização das reações e para as
demais reações de rotina, foi utilizado um controle positivo, uma amostra clinica
previamente determinada.
As condições para a ciclagem no termociclador Veriti 96 well Thermal Cycler
(Life Technologies, EUA) para as reações da PCR de modo geral foram: ativação
inicial a 94ºC por 2 minutos, 35 ciclos com desnaturação a 94ºC por 30 segundos,
anelamento à temperatura específica para cada par de iniciadores e extensão a
72ºC a um minuto por kb e 10 minutos de extensão final do fragmento a 72ºC. Para
a etapa de anelamento foi utilizada a temperatura correspondente a média dos TM
dos dois iniciadores da reação
O resultado da amplificação foi observado em gel de agarose a 1% em
solução tampão de NaOH 1x (solução estoque a 20x: ácido bórico a 0,9 M e NaOH a
0,2 M; ambos da Merck, Darmstadt, Alemanha). Foram analisados 5 µL do produto
amplificado misturados com 1 µL do corante BlueGreen® (LGC Biotecnologia, SP,
Brasil) além de 2 µL do marcador de peso molecular 1 kb DNA Ladder (GE
Healthcare, São Paulo, Brasil) e submetidos à eletroforese (100 mAmp). O gel foi
visualizado em um transiluminador de luz ultravioleta (Bio-Rad, Japão) e fotografado
utilizando software Kodak Molecular Imaging Software (Eastman Kodak Company,
NY, EUA). O tamanho dos fragmentos desejados foi estimado comparando-se os
mesmos com o marcador de peso molecular. Os produtos da amplificação foram
armazenados a 4 ºC até serem purificados.
4.4 PURIFICAÇÃO DOS PRODUTOS POSITIVOS
Os produtos para a amplificação do fragmento de interesse foram purificados
com o conjunto de reagentes do kit Qiaquick PCR Purification (Qiagen, Chatsworth,
EUA), seguindo o protocolo do fabricante. Todo o volume da reação de PCR foi
misturado a 250 µL de tampão de ligação PB e transferido para uma membrana de
sílica. O material foi submetido a uma centrifugação de 13.000 rpm por 1 minuto
onde o DNA foi adsorvido seletivamente. Em seguida, foram adicionados 750 µL do
tampão de lavagem PE com a finalidade de remover as enzimas, tampões,
46
iniciadores e dNTPs, e a mistura foi centrifugada uma vez mais a 13.000 rpm por 1
minuto. Essa etapa foi repetida uma segunda vez para que a membrana ficasse bem
seca. Na etapa final, foram utilizados 50 µL do tampão EB para a eluição do DNA
adsorvido na membrana, centrifugando-se a 13.000 rpm por 2 minutos. As amostras
purificadas foram analisadas em gel de agarose a 1% e o DNA foi estocado em
freezer a -20 °C.
4.5 SEQUENCIAMENTO DE SANGER
A reação de sequenciamento foi realizada com os reagentes do Big Dye®
Terminator v3.1 Cycle Sequencing Kit (Life Technologies, EUA) seguindo o protocolo
do fabricante. A plataforma de sequenciamento automático utilizada foi a ABI Prism
3130XL Genetic Analyzer (Applied Biosystems/HITACHI, Japão). Foram usados 5 a
20 ng de DNA purificado, 5 ρmol/µL dos respectivos iniciadores internos (Tabela
4.3.1) e H2O livre de nuclease para completar um volume final de 7,5 µL por reação,
quando necessário. A cada reação foi adicionado 1 µL de BigDye (Life
Technologies) e 1,5 µL de tampão de sequenciamento 5x (Life Technologies),
totalizando 10 µL. A reação foi colocada no termociclador Veriti 96 well Thermal
Cycler (Life Technologies, EUA) e submetida a 40 ciclagens com desnaturação a 96
°C por 10 segundos, anelamento a 50 °C por 5 segundos e extensão a 60 °C por 4
minutos.
Para purificar o DNA e eliminar os demais componentes da reação de
sequenciamento como nucleotídeos livres, co-fatores, entre outros, foi feita a
precipitação por Etanol/Isopropanol. A reação foi feita adicionando-se 30 µL de
isopropanol a 75% (Merck, Alemanha) em cada amostra, misturou-se brevemente no
Vortex® seguido da incubação por 10 minutos a temperatura ambiente e posterior
centrifugação a 4.000 rpm por 45 minutos a 4 °C. O sobrenadante foi eliminado e foi
feita uma lavagem com 50 µL de etanol a 75% (Merck, Alemanha) e centrifugação
por 15 minutos a 4.000 rpm a 4 °C e o sobrenadante foi desprezado. As amostras
foram postas em um termociclador Veriti 96 well Thermal Cycler (Applied
Biosystems, EUA) e aquecida a 60 °C por 10 minutos para a evaporação do etanol
restante. Ao final foram armazenadas à –20 °C até o momento do sequenciamento
em que, por fim, ressuspendidas em 10 µL de formamida.
47
4.6 EDIÇÃO E ALINHAMENTO DAS SEQUENCIAS
Para a edição manual dos eletroferogramas obtidos de cada iniciador foi
utilizado o programa DNASTAR Lasergene7 (DNAstar, EUA), ferramenta SeqMan,
gerando uma sequência consenso. As sequências consenso de cada amostra foram
alinhadas no programa BioEdit v.7.0.9.0 (HALL, 1999) junto com as sequências
referência para todos os subtipos puros e CRFs do HIV-1, retiradas do banco de
dados do site de Los Alamos (http://www.hiv.lanl.gov/). O alinhamento foi salvo em
formato FASTA.
4.7 ANÁLISES FILOGENÉTICAS E CLASSIFICAÇÃO DO SUBTIPO VIRAL
Para determinar o melhor modelo a ser usado na análise filogenética, o
alinhamento contendo as amostras sequenciadas, referências e mais o grupo
externo escolhido, grupo O, foi submetido ao programa Model Generator (KEANE et
al., 2006). Foi usado o programa PhyML v.3.0 (GUINDON et al., 2010) para gerar
uma árvore filogenética de máxima verossimilhança com suporte em aLRT, acima de
0,70 (“Approximate Likelihood-Ratio Test”) com o modelo definido (ANISIMOVA e
GASCUEL, 2006). Para a visualização e edição das árvores foi utilizado o programa
FigTree versão 1.3.1 (disponível gratuitamente no website do “Institute of
Evolutionary Biology, University of Edinburgh”:
http://tree.bio.ed.ac.uk/programa/figtree/).
Também para as análises filogenéticas foram feitas árvores filogenéticas
realizadas no programa Mega 5 usando o método de distância de “Neighbor-Joining”
e o modelo de correção de dois parâmetros (KIMURA, 1977) utilizando 1.000
repetições de bootstrap. Foram consideradas por nós as clades que tiveram como
suporte o valor de bootstrap acima de 70%.
Amostras com classificação indeterminada, por não se agruparem com
confiança aos subtipos nas árvores filogenéticas analisadas, foram indicadas como
possíveis recombinantes e submetidas ao programa SimPlot v.3.5.1, utilizando como
parâmetros “janela: 200pb, passos: 20 pb, T/t:2,0, gastrip: on, replicas: 100, Kimura
48
2-parâmetros, Neighbor-Joining”, podendo então, definir os padrões de
recombinação.
4.8 AMPLIFICAÇÃO DAS REGIÕES GENÔMICAS HLA-A, B E C
Através de reação em cadeia da polimerase (PCR), foram amplificados
separadamente os fragmentos correspondentes aos éxons 1 ao 7 dos genes HLA-A,
B e C, com aproximadamente 2,726 pb, 2,677 pb, 3,339 pb respectivamente (Fig.
4.8.1). Todas as reações foram realizadas com iniciadores específicos descritos na
Tabela 4.8.1, de acordo com Wang e colaboradores (WANG et al., 2012).
Figura 4.8 .1. Representação esquemática da posição dos iniciadores sentido senso e antissenso
utilizados para a amplificação no HLA-A, B e C (modificada de WATANABE et al., 2001).
49
Tabela 4.8 .1. Iniciadores para amplificação dos éxons 1 ao 6 dos HLA-A, B e C.
Iniciadores Sequência 5´- 3´ Orientação Posição*
TCCCCAGACGCCGAGGATGGCC Senso 69-90
TCCCCAGACCCCGAGGATGGCC Senso 69-90 HLA-A CACATCAGAGCCCTGGGCACTGTC Antissenso 2.771-
2.794 CTCCTCAGACGCCGAGATGCTG Senso 39-60
CTCCTCAGACGCCAAGATGCTG Senso 39-60
CTCCTCAGACACCGAGATGCTG Senso 39-60
CTCCTCAGACGCCGAGATGCGG Senso 39-60
CTCCTCAGACGCCAAGATGCGG Senso 39-60
CTCCTCAGACACCGAGATGCGG Senso 39-60
HLA-B
CACATCAGAGCCCTGGGCACTGTC Antissenso 2.692-2.715
CTCCCCAGACGCCGAGATGCGG Senso 50-71
CTCCCCAGAGGCCGAGATGCGG Senso 50-71 HLA-C CTCATCAGAGCCCTGGGCACTGTT Antissenso 2.757-
2.780 *Posição relativa às sequências-referência de HLA-A (NG_029217.2), HLA-B (NG_023187.1) e HLA-C (NG_029422.2) disponíveis na base de dados do NCBI.
As reações para a PCR foram realizadas com as mesmas especificações
descritas para a amplificação de regiões do genoma HIV-1, com exceção da
utilização da enzima Taq High Fidelity DNA polimerase (Life Technologies, CA,
EUA). As condições de ciclagem das reações da PCR foram: ativação inicial a 94 ºC
por 3 minutos, 40 ciclos com desnaturação a 94 ºC por 30 segundos, anelamento
dos iniciadores a 63 ºC por 45 segundos e extensão a 68 ºC por 6 minutos, seguidos
de 10 minutos de extensão final dos fragmentos a 68 ºC. Para a etapa de
anelamento foi utilizada a temperatura correspondente à média dos TM dos
iniciadores da reação.
O resultado da amplificação foi observado em gel de agarose a 0,8% em
solução tampão de NaOH 1x como descrito anteriormente. O tamanho dos
fragmentos desejados foi estimado comparando-se os mesmos com o marcador de
peso molecular. Os produtos da amplificação foram armazenados a 4 ºC até serem
purificados seguindo os mesmo passos da purificação descrita anteriormente.
50
4.9 QUANTIFICAÇÃO E CONCENTRAÇÃO
As amostras foram quantificadas no espectrofotômetro NanoDrop ND 1000
(Thermo Scientific, MA, EUA) e diluídas em H2O a uma concentração de 2,5 ng/µL
de DNA amplificado. Em seguida, 10 µL de cada produto purificado referente aos
HLAs A, B e C de um mesmo paciente foram misturados em um único tubo
eppendorf.
4.10 PREPARAÇÃO DA BIBLIOTECA
As bibliotecas foram preparadas com o kit Nextera DNA Sample Preparation
(Illumina, CA, EUA) seguindo o protocolo do fabricante. A Fig. 4.6.1 mostra as
etapas da preparação da biblioteca. Para a primeira etapa, em que simultaneamente
são feitas a fragmentação do DNA e sua marcação com etiquetas (tags) específicas,
foram adicionados 20 µL do DNA a 2,5 ng/µL, 25 µL do tampão TD (Tagment DNA
Buffer) e 5 µL de TDE1 (Tagment DNA Enzyme). A reação foi colocada em
termociclador a 55 °C por 8 minutos. Nessa etapa, o DNA é fragmentado em regiões
aleatórias por transposons e juntamente com a quebra do DNA, são adicionados
duas sequências terminais (tags) de 14 pb.
51
Figura 4.10.1 . Representação esquemática das etapas de preparação das bibliotecas de DNA pelo
kit Nextera DNA Sample Preparations para o sequenciamento na plataforma Illumina HiSeq 2500
(modificado de http://core-genomics.blogspot.com.br/2012/07/illuminas-nextera-capture-is-this.html).
Na segunda etapa, as reações foram purificadas com o kit Qiaquick PCR
Purification (Qiagen), seguindo o protocolo do fabricante conforme descrito
anteriormente. Na etapa final de eluição, foram utilizados 25 µL do tampão RSB para
a eluição da biblioteca.
A terceira etapa, de enriquecimento dos fragmentos, se constitui em uma
reação de PCR com iniciadores complementares aos que foram adicionados
previamente e que possuem na sua extremidade uma cauda de sequência
adaptadora. Esses adaptadores (P5 e P7) são necessários para a etapa de
clusterização, uma vez que eles são complementares aos adaptadores presentes
naquela etapa. Além disso, esses adaptadores possuem uma sequencia variável de
52
nucleotídeos (índexes/barcodes) (i5 e i7), necessários à separação e identificação
futura dos fragmentos originados do sequenciamento da mesma amostra, já que no
sequenciamento todas serão misturadas em uma mesma reação (Fig. 4.6.1).
Primeiramente, foram adicionados 5 µL de cada índice, 15 µL de NPM (Nextera PCR
Master Mix) e 5 µL de PPC (PCR Primer Cocktail) aos 25 µL de fragmentos de DNA
purificados anteriormente. Em seguida, a placa foi selada e centrifugada
brevemente. A reação foi submetida a uma PCR em termociclador, a uma ciclagem
de 72 °C por 3 minutos, 98 °C por 30 segundos e 5 ciclos de 98 °C por 10 segundos,
63 °C por 30 segundos e 72 °C por 3 minutos.
A última etapa de purificação da biblioteca foi realizada com microesferas
magnéticas, que além de purificar a biblioteca também promovem uma seleção de
tamanho dos fragmentos, retirando os que são muito pequenos. As microesferas
magnéticas têm a capacidade de se ligar ao DNA, separando-o do restante da
solução. Foram adicionados 30 µL de AMPure XP beads em cada reação,
misturando-se até gerar uma solução homogênea, e após 5 minutos de incubação a
placa foi colocada sobre uma placa magnética para a precipitação das microesferas
ligadas ao DNA no fundo dos poços. Foram feitos dois processos de lavagem com
etanol a 80% (Merck) e, após a secagem, as microesferas contendo o DNA foram
ressuspensas em 32,5 µL de RSB. O RSB libera o DNA das microesferas. Após a
separação das microesferas do DNA, e este último em solução, a biblioteca era
armazenada a -20 °C.
4.11 CONTROLE DE QUALIDADE DAS BIBLIOTECAS
As bibliotecas foram analisadas quanto à distribuição de tamanho dos
fragmentos (pares de bases), sendo submetida a uma eletroforese em gel de
agarose a 0.8% junto ao marcador de peso molecular de 1 kb como comparador.
Após a visualização do gel, foi observado o tamanho médio dos fragmentos de DNA
da biblioteca.
53
4.12 QUANTIFICAÇÃO DA BIBLIOTECA
A quantificação da biblioteca foi realizada através da técnica de quantificação
absoluta por PCR em tempo real no sistema ECO (Illumina) utilizando-se o kit KAPA
Library Quantification (KAPA Biosystems, MA, EUA) conforme protocolo fornecido
pelo fabricante. Primeiramente, as bibliotecas foram diluídas 10.000 vezes em
solução contendo 0,1% de Tween 20 + 10 mM Tris-HCL a pH 8,5. As reações foram
preparadas em microplacas fornecidas com o kit. Como padrões para a
quantificação, foram utilizados seis padrões fornecidos no kit, com quantificações
conhecidas e de 20 pM, 2 pM, 0,2 pM, 0,02 pM, 0,002 pM e 0,0002 pM. Dois
microlitros da diluição da biblioteca foram adicionados a 6 µL de Master Mix e 2 µL
de H2O. Também foram feitos controles negativos onde eram adicionados 2 µL da
mesma solução de Tween descrita acima ao invés da biblioteca. Todas as reações,
tanto para os padrões quanto para cada biblioteca, foram feitas em triplicatas para
melhor confiabilidade da quantificação. A microplaca foi submetida a uma ciclagem
de 95 °C por 5 minutos, 35 ciclos de 95 °C por 30 segundos e 60 °C por 45
segundos, seguidos de 95 °C por 15 segundos, 55 °C por 15 segundos e 95 °C por
15 segundos.
Os dados gerados foram analisados em uma planilha Excel (Microsoft Corp.,
Seattle, EUA). A concentração das bibliotecas foi estimada através da equação da
reta f(x) = -b ln(x) + a, gerada a partir dos Ciclos de Quantificação (Cqs) dos
padrões, sendo que x corresponde à média do Cq de cada biblioteca. Essa
concentração foi normalizada pelo tamanho médio dos fragmentos obtidos pela
eletroforese e pela taxa da diluição, chegando-se a uma concentração final.
4.13 SEQUENCIAMENTO NA PLATAFORMA ILLUMINA HISEQ 2500
A metodologia de seqüenciamento por síntese da plataforma Illumina HiSeq
2500 se inicia com a amplificação de fragmentos de DNA (bibliotecas) ligados a
superfície de uma célula (flow cell) na forma de pontes através da enzima DNA
polimerase, que produz múltiplas cópias da seqüência original (clusters), se
assemelhando à técnica da clonagem.
54
As bibliotecas foram reunidas, desnaturadas e diluídas a 12 pM e submetidas
a clusterização em uma estação de cluster C-bot (Illumina, CA, EUA). A
clusterização se baseia na ligação dos adaptadores presentes nas extremidades dos
fragmentos das bibliotecas (P5 e P7), complementares aos que estão presentes na
superfície da célula. O fragmento irá se ligar em apenas uma extremidade, e
ocorrerá um processo de cópia deste. Essa dupla-fita de fragmento de DNA
(fragmento original + fragmento cópia) se ligará pela outra extremidade livre ao
adaptador complementar presente na superfície da célula, formando uma estrutura
de ponte. Essa ponta vai se soltar, separando os dois fragmentos idênticos que
serão novamente copiados repetidas vezes. Após a clusterização, a célula segue
para o sequenciamento por síntese.
Durante o sequenciamento das múltiplas cópias, são adicionados
oligonucleotídeos com a terminação OH bloqueada a fim de que seja adicionado
apenas um a cada etapa. Em seguida, uma excitação por feixe de luz faz com que
seja emitida uma fluorescência, que é diferente para cada oligonucleotídeo. A cada
adição de uma única base, a célula é escaneada e são feitas várias aquisições de
imagens. As imagens são interpretadas em atribuições de bases do DNA,
identificando o nucleotídeo adicionado pela sua cor emitida. A célula é lavada e
segue-se a seguinte adição de nucleotídeo. O ciclo de adição de nucleotídeo e
aquisição de imagem é repetido por 200 vezes, sendo sequenciados 100
nucleotídeos da extremidade do fragmento no sentido senso e 100 nucleotídeos no
sentido antissenso, caracterizando uma corrida com extremidades pareadas (paired
end) (2 x 100).
4.14 ANÁLISE DA QUALIDADE DOS READS E FILTRAGEM
As sequências geradas do sequenciamento se denominam reads. Esses
reads estão no formato FASTQ que contém a sequência de base nucleotídicas e a
qualidade correspondente a cada base em um único arquivo.
Primeiramente, os reads foram analisados no programa FastQC (Babraham
Bioinformatics, Cambridge, UK). O programa gera um relatório onde podemos
analisar a quantidade de reads gerados para cada biblioteca, a qualidade relativa a
cada base e a qualidade média da sequência, o tamanho médio de cada read e
55
diversas outras características. As bibliotecas foram então filtradas no programa
Sickle-Master (disponível em https://github.com/najoshi/sickle) para selecionar reads
com qualidade superior a 28 na escala de Phred e tamanho superior a 20 pb. A
escala de Phred é uma escala logarítmica ligada à probabilidade de erro de
determinação da base (base-calling) usada para caracterizar a qualidade da
sequência de DNA e pode ser usada também para comparar a eficácia entre
diferentes métodos de sequenciamento. Essa ferramenta de filtragem avalia a
qualidade da base e a retira se ela não for acima do limiar estabelecido pelo usuário.
Também descarta reads abaixo do limiar de tamanho definido. Após essa filtragem,
os reads foram submetidos novamente ao programa FastQC, gerando um relatório
que é comparado com o inicial para avaliar a quantidade de reads restantes e a
qualidade média.
Linha de comando:
> sickle pe –f input file –r input file –t sanger –o output file trimmed –p output
file trimmed –s output single file trimmed –q –l
Onde:
pe = paired end
-f = read F
-r = read R
-t = tipo de qualidade (illumina, sanger ou solexa)
-o = arquivo F gerado
-p = arquivo R gerado
-s = arquivo de single reads gerado
-q = qualidade mínima
-l = tamanho mínimo do reads (default 20 pb)
4.15 MONTAGEM DE NOVO
Para as montagens de novo dos alelos de HLA-A, B e C, ou seja, sem alinhar
os reads a uma sequência-referencia, foi utilizado o programa Velvet (ZERBINO e
BIRNEY, 2008). Velvet é um montador genômico de novo especialmente
desenvolvido para reads de pequeno tamanho (plataformas Illumina e 454) que
56
utiliza sequências filtradas em formato FASTQ. É uma ferramenta baseada no
gráfico de Bruijn, uma representação compacta baseada em pequenas palavras (k-
mers), ideal para alta cobertura e pequenos reads. Os reads são fragmentados de
acordo com um tamanho de k-mer predefinido (Velveth) e montados (Velvetg),
gerando contigs.
Os contigs gerados foram analisados na ferramenta QUAST (QUality
ASsessment Tool (GUREVICH et al., 2013), que avalia montagens genômicas
através de diversos parâmetros, como por exemplo tamanho dos contigs, N50
(tamanho do menor contig entre todos que cobre a metade do tamanho da
montagem) e quantidade de Ns.
Linhas de comando:
>velveth [new directory] [length_kmer] –fastq –shortPaired –separate
[reads1.fastq reads2.fastq]
Onde:
New directory = nome do diretório para o arquivo output
Lengthkmer = empírico, tentar diferentes números
Fastq = indicar o formato dos seus reads
shorPaired = paired end reads
Separate = indicar que são 2 arquivos separados
Reads = nome dos dois arquivos
>velvetg [directory] –ins_length –exp_cov –cov_cutoff –min_contig_lgth
Onde:
directory = nome do diretório onde esta o assembly
ins_length = tamanho esperado do inserto
exp_cov = cobertura media esperada
cov_cutoff = cobertura mínima necessária para assemblar
min_contig_lgth = tamanho mínimo dos contigs
57
4.16 MONTAGEM COM REFERÊNCIA
Outra metodologia utilizada para reconstrução dos alelos de HLA estudados
foi a de alinhamento dos reads a uma sequência-referência. Os reads foram
alinhados com referências obtidas no Genbank (RefSeqGene HLA-A: NG_029217.2;
HLA-B: NG_023187.1; HLA-C: NG_029422.2) através do programa BWA - Burrows-
Wheeler Aligner (LI e DURBIN, 2009). Esse software para mapeamento de reads em
um genoma de referência tem como base a transformação Burrow-Wheeler de
dados. O mapeamento é estruturado em três etapas, e se inicia na construção do
arquivo SAM (alinhamento de sequências/Mapa), seguido pela indexação do
genoma de referência (BWA index), realização dos alinhamentos (BWA aln) e por
fim geração do alinhamento no formato SAM (BWA sampe). Além do BWA, são
utilizadas outras ferramentas como o Samtools (LI et al., 2009) e Picard (disponível
em: http://picard.sourceforge.net) para manipulação de referências e formatos de
arquivo. Por fim, o alinhamento é visualizado no programa IGV (do inglês, Integrative
Genomics Viewer) (ROBINSON et al., 2011).
Linhas de comando:
>bwa índex –a is ref.fasta
Onde:
-a = algoritmo para construção do índice BWT
>samtools faidx ref.fa
>bwa aln –n 4 ref.fa sample_R1_trimmed.fq > sample_R1.sai
Onde:
-n = taxa de erro da diferença entre o read e à referencia (se for porcentagem,
utilizar ponto Ex 14% = 0.14)
>bwa sampe ref.fa sample_R1.sai sample_R2.sai sample_R1_trimmed.fq
sample_R2_trimmed.fq > sample.sam
>samtools view –t ref.fa.fai –T ref.fa –b arquivo.sam > arquivo.bam
58
>samtools sort arquivo.bam arquivo.sorted
>samtools index arquivo.sorted.bam
4.17 TIPAGEM DOS ALELOS DE HLA
A tipagem dos alelos foi realizada com o auxílio do programa Omixon-Target
(MAJOR et al., 2013), que possui um algoritmo para tipagem baseado no
alinhamento dos reads com as referências retiradas do banco de dados do
IMGT/HLA (http://www.ebi.ac.uk/ipd/imgt/hla/). Também foram utilizadas ferramentas
como BLAST para tipar os contigs gerados pela montagem de novo e os consensos
gerados pela montagem com referência.
O IMGT/HLA fornece um banco de dados especializados em sequência do
Complexo de Histocompatibilidade Humana (HLA) e inclui todas as sequências
oficiais do Comitê de Nomeclatura da WHO para fatores do Sistema HLA.
4.18 ANÁLISES ESTATÍSTICAS
Os alelos de HLA mais freqüentes foram correlacionados com a carga viral
antes e após o início do tratamento. Essa mesma associação foi feita para os alelos
de HLA dos pacientes infectados com diferentes subtipos do HIV. O teste exato de
Fisher foi usado para avaliar associações entre as variáveis categóricas. Um valor
de p < 0,05 foi considerado como estatisticamente significante. Variáveis com valor
de p ≥ 0,06 e ≤ 0,1 tiveram seus valores amostrais dobrados em um novo teste de
Fisher e os novos valores de p ≤ 0,05 foram consideradas como tendência de
associação.
5 RESULTADOS
Essa casuística já vem sendo estudada por muitos anos e a classificação dos
subtipos virais teve início no meu projeto de Monografia, sendo completada com os
dados desse estudo. Dos 253 pacientes, 187 amostras foram amplificadas e
sequenciadas para as regiões de interesse do HIV-1 (vide item 5.6 abaixo).
59
Das 187 amostras avaliadas nesse estudo, 158 amostras (84%) foram
amplificadas com sucesso para todos os três genes (HLA-A, B e C), totalizando 474
amplificações. Dessas amostras amplificadas, 81 (51%) foram quantificadas e
tiveram sua biblioteca preparada e sequenciada, e foram analisadas neste estudo.
As demais amostras não foram analisadas até o momento devido a limitações de
orçamento e operacionalização das corridas de seqüenciamento na plataforma
Ilumina HiSeq 2500. Todas as bibliotecas sequenciadas foram analisadas e tipadas
para os três genes.
Todas as análises seguintes foram realizadas para os pacientes que tiveram
tanto o subtipo do HIV quanto os alelos do HLA determinados (n = 81).
5.1 CONSTRUÇÃO DAS BIBLIOTECAS
As bibliotecas foram preparadas com sucesso, de acordo com as
especificações do fabricante dos reagentes, com exceção de uma variação na
primeira etapa, onde foi estabelecido um tempo maior, de 8 minutos, para a
fragmentação. Essa alteração foi estendida para todas as bibliotecas ao se observar
uma maior eficiência da fragmentação em nosso produto a ser sequenciado,
alcançando assim fragmentos menores. A média do tamanho das bibliotecas foi de
aproximadamente 1.000 pb e a média da concentração final foi de 2,88 nM.
5.2 ANÁLISE POR FASTQC E FILTRAGEM
Todas as amostras sequenciadas na plataforma Illumina HiSeq 2500 foram
submetidas à análise no programa FastQC antes e após a filtragem. A análise do
relatório gerado nos permitiu observar diversos parâmetros dos reads de cada
biblioteca sequenciada. O número médio de reads antes da filtragem foi de
2.773.135 reads (263.339 – 11.283.078), o tamanho médio foi de 99-mer (96 – 100)
e a qualidade média foi de aproximadamente 28 (20 – 32) na escala Phred. Apenas
duas amostras apresentaram presença de base indeterminada (N) em 10 a 20% do
read nas primeiras posições (entre os nucleotídeos 15 e 29). A inspeção visual de
cada gráfico de qualidade média gerado no relatório nos permitiu observar que 79%
(n = 64) das amostras apresentaram reads com pior qualidade nas últimas bases,
60
porém essa qualidade se mostrou em torno de 20 na escala Phred, que é
considerada uma qualidade entre intermediária e ruim.
De acordo com a qualidade média observada, a quantidade de reads gerados
no sequenciamento e o tamanho das sequências, foi realizada uma filtragem dos
reads no programa Sickle-Master. Foram filtrados os reads com qualidade acima de
28 para 91% (n = 74) das amostras e qualidade acima de 30 para o restante,
qualidades consideradas para uma acurácia próxima de 99,9% para a determinação
de base na escala Phred. Ambas as filtragens tiveram o limite mínimo do tamanho
do read em 20-mer. Esses reads filtrados foram utilizados nas análises posteriores, e
os demais que não alçaram os valores determinados para qualidade e tamanho
foram descartados pelo programa.
Após essa etapa, os reads filtrados foram submetidos novamente ao
programa FastQC e os resultados comparados com os anteriores. O número médio
de reads observado foi de 2.007.081 reads (49.138 – 7.337.120), o tamanho variou
de 20 a 100-mer e a qualidade média foi de 31 (28 – 32) na escala Phred. Abaixo,
na Fig.5.2.1, temos um exemplo de gráfico de qualidade média dos reads por
posição nucleotídica antes e após a filtragem.
61
Figura 5.2 .1. Exemplo de gráfico de qualidade dos reads por posição nucleotídica gerado pelo
programa FastQC da amostra 349. A – antes da filtragem; B – após a filtragem. Em ambos os
gráficos – as qualidades consideradas ruins estão em rosa, as intermediárias em amarelo e as
A
B
62
qualidades boas em verde. A linha azul corresponde à qualidade média de todos os reads por
posição nucleotídica.
5.3 MONTAGEM DE NOVO
A montagem de novo foi realizada com o auxílio do programa Velvet para três
amostras escolhidas de forma aleatória para assim reconstruir os alelos de HLA-A, B
e C sem o auxílio de uma sequência-referência. Foram feitas modificações em
alguns parâmetros na tentativa de se construir melhores contigs. Todas amostras
foram testadas com diferentes tamanhos de k-mers, variando de 90 a 30.
Para a amostra 181, como primeira tentativa foram feitos testes com todos os
parâmetros no modo padrão (cobertura esperada, tamanho do inserto, scaffolding),
porém foram gerados diversos contigs, sendo que na maioria dos casos menores
que 1000 pb. Na segunda bateria de testes, o tamanho mínimo do contig foi alterado
para 1000 pb, porém a maioria dos contigs gerados e observados no programa
Quast, possuía grande quantidade de Ns. Os contigs foram submetidos à ferramenta
Blast do banco de dados do NCBI (disponível em
http://blast.ncbi.nlm.nih.gov/Blast.cgi), e nenhum se assemelhou com genes do HLA.
Para as amostras 338 e 404, também foram testados os parâmetros de
tamanho de inserto de 800 pb e número mínimo de pares de reads de 20. Todos os
testes foram repetidos para os diversos k-mers, porém não foi gerado nenhum
contig.
5.4 MONTAGEM COM REFERÊNCIA
A montagem com referência foi realizada com o auxílio do programa Bwa
para as mesmas três amostras testadas na montagem de novo. Os parâmetros
modificados para os alinhamentos foi o valor de n de 5, 10, 0.08, 0.10 e 0.14 e
modificação das referências utilizadas, sozinhas ou concatenadas (sequência-
referência criada concatenando a referência HLA-A, seguida da referência HLA-B e
da HLA-C, formando apenas uma sequência no final). Nos alinhamentos podemos
observar os polimorfismos presentes nos alelos e a alta cobertura dos alinhamentos
(Fig. 5.4.1).
63
Figura 5.4 .1. Exemplo de reconstrução dos genes HLA-A, B e C da amostra 181, em ordem na figura, com o auxílio do programa Bwa e visualizado
no IGV. Os traços coloridos representam polimorfismos encontrados em relação a referência usada no alinhamento. A cobertura variou de 0-25998 reads. As
regiões sem cobertura correspondem a regiões dos genes que não são amplificadas pelo conjunto de iniciadores utilizados.
64
5.5 TIPAGEM DO HLA PELO SOFTWARE OMIXON-TARGET
Todas as 81 amostras foram tipadas com o auxílio do programa Omixon
Target, totalizando 162 alelos para cada lócus (HLA-A, B e C). A tipagem foi
realizada com os seguintes parâmetros de configuração do programa: tamanho do
inserto de 800 pb, até 1.000.000 de reads, ignorar crossmapping (reads que se
alinham em mais de uma posição diferente são retirados), tipagem de até 8 dígitos.
Análises de tipagem de amostras que falharam foram novamente submetidas ao
algoritmo, porém com quantidade máxima de reads de 100.000 reads. Os alelos
mais frequentes oriundos da tipagem das amostras podem ser visualizados nas
Figuras 5.5.1 a 5.5.3, e a proporção de heterozigotos e homozigotos encontrada
para cada lócus pode ser observada na Fig. 5.5.4.
Figura 5.5 .1. Alelos de HLA-A encontrados na casuística com frequência maior que 1%.
65
Figura 5.5 .2. Alelos de HLA-B encontrados na casuística com frequência maior que 1%.
Figura 5.5 .3. Alelos de HLA-C encontrados na casuística com freqüência maior que 1%.
66
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
HLA-A HLA-B HLA-C
Homozigoto
Heterozigoto
Figura 5.5 .4. Proporção de heterozigotos e homozigotos encontrada para cada lócus
analisado.
Os alelos do HLA-A e HLA-B foram agrupados em supertipos de acordo com
a classificação apresentada por Sidney e colaboradores (Fig. 5.5.5 e 5.5.6). Alelos
que não são classificados em supertipo não foram contabilizados, com isso apenas
155 alelos para HLA-A e 109 para HLA-B puderam ser classificados em supertipos.
Podemos notar uma maior prevalência dos supertipos A03 e B07 na casuística
estudada.
Figura 5.5 .5. Prevalência dos supertipos do HLA-A na casuística estudada.
67
Figura 5.5 .6. Prevalência dos supertipos do HLA-B na casuística estudada.
A taxa de detecção e a cobertura média determinada pelo programa durante a
tipagem dos alelos foi analisada para os três loci. Cerca de 72% dos alelos de HLA-
A, 80% dos alelos de HLA-C e 99% de HLA-B apresentaram uma taxa de detecção
entre 98 – 100%, o restante apresentou taxas entre 95 – 97%. A cobertura média
para os alelos determinados de HLA-A foi de aproximadamente 2462 reads (77,1 -
13100), para o HLA-B foi de 4210 reads (35,5 - 15100) e o HLA-C apresentou 3341
reads (42,3 - 23910).
Alguns alelos apresentaram discordância ou dúvidas em uma análise mais
aprofundada onde foram avaliados os valores de detecção e cobertura dos alelos
classificados como melhores candidatos e o alinhamento gerado pelo programa
entre os reads da amostra. O alelo HLA-C*04:09N não conseguiu ser distinguido do
alelo C*04:01:01, visto que em várias instâncias ambos foram considerados na
tipagem pelo programa como melhores candidatos. Outro problema parecido
ocorreu na amostra 423 para o HLA-B, onde foram considerados vários melhores
candidatos para o mesmo alelo. Além disso, o programa apresentou por vezes
alelos com taxa de detecção e cobertura muito próximas dos alelos definidos como
melhores candidatos, causando dúvida na tipagem.
Os casos acima foram submetidos ao alinhamento no programa Bwa com as
devidas referências dos alelos candidatos para a tentativa de se resolver as dúvidas
existentes. Como exemplo nós podemos apontar a dúvida entre A*01:01:01 e
68
A*01:11N para um dos alelos de HLA-A das amostras 377, 382, 391 e 404, onde o
alinhamento pelo Bwa mostrou que na posição discordante (nucleotídeo 1268) o
nucleotídeo que distingue o alelo A*01:11N do A*01:01:01 (timina ao invés de
guanina) não era observado dentre os reads (Fig. 5.5.7). Nestes casos, a tipagem
não resolvida com o programa Omixon Target foi resolvida com esta estratégia.
69
Figura 5.5 .7. Alinhamento das amostras com dúvida entre os alelos A*:01:01:01 e A*01:11N pelo programa Bwa e visualizado pelo IGV. A posição 1268 que distingue os dois alelos está realçada na figura onde podemos observar no quadrado azul a presença de 100% de guanina. Em colorido se encontram as trocas entre os reads da amostra e a referência.
70
5.6 PREVALÊNCIA DOS SUBTIPOS E PERFIL EPIDEMIOLÓGICO DOS
PACIENTES HIV+
A classificação viral dos pacientes contemplados nesse estudo e que tiveram
o HLA-A, B e C sequenciados e tipados (n = 81) mostrou que 46% dos pacientes
estavam infectados pelo subtipo B, 31% pelo subtipo C, 14% por recombinantes
únicos BC, 7% por recombinantes únicos BF e 2% por recombinantes únicos BCF.
Os dados clínico-epidemiológicos dos pacientes HIV+ estudados neste
trabalho obtidos a partir dos questionários preenchidos pelos clínicos locais foram
compilados e estão representados na Tabela 5.6.1.
Para os 81 pacientes analisados, a média de idade foi de aproximadamente
39 anos e 52% era do sexo feminino. A média do tempo de diagnóstico foi de 77
meses. A maior parte dos pacientes se encontrava em estágio CDC clínico A (46%)
e estágio CDC imunológico 3 (42%). Dentre os pacientes, 83% estavam em
tratamento antirretroviral e apenas 31 (38%) com carga viral indetectável. Foram
analisados também dados de carga viral e contagem de células CD4 anterior ao
início do tratamento de 31 pacientes. A mediana de carga viral antes do início do
tratamento foi de 30.000 cópias/µl, enquanto aquela após o início do tratamento foi
de 3.477,5 cópias/µl. A mediana da contagem de células CD4 antes do início do
tratamento foi de 226,5 células/mm3 de sangue, enquanto que após o tratamento foi
de 316 células/mm3.
71
Tabela 5.6 .1. Dados clínico-epidemiológicos obtidos dos prontuários dos 81 pacientes tipados para o
HLA-A, B e C neste estudo.
Dados N = 81 Sexo
Feminino 42 (52%)
Masculino 39 (48%)
Media de idade 39 anos Tempo médio de diagnóstico
77 meses
Estágio CDC clínico A 37 (46%) B 11 (14%) C 19 (23%) ND 14 (17%) Estágio CDC imunológico
1 2 (2%)
2 30 (37%) 3 34 (42%) ND 15 (19%) Status de tratamento Sim 67 (83%) Não 14 (17%) Mediana carga viral (AT)*
30.000 cópias/µl(80-4500000)
Mediana contagem CD4 (AT)* 226,5 células/mm3 (35-1081)
Mediana carga viral (T)** 3477,5 cópias/µl (50-278151)
Mediana contagem CD4 (T)** 316 células/mm3 (8–1171)
Carga viral indetectável (T)** 31 pacientes
* - AT= dados antes do início do tratamento (n=31) ** - T= dados após início do tratamento (n=81) ND= dado não disponível
5.7 CORRELAÇÃO DOS ALELOS DO HLA COM OS DADOS CLÍNICOS E
SUBTIPOS DO HIV-1
Os dados de carga viral, contagens de CD4, antes e após o tratamento, e
subtipos virais foram relacionados aos alelos determinados para cada paciente
através do teste exato de Fisher. Os resultados desta análise estão representados
nas Tabelas 5.7.1 a 5.7.5.
72
Com os dados de carga viral antes do início do tratamento (n = 31 pacientes/
62 alelos), foi encontrada uma maior frequência do alelo B*51:01:01 com pacientes
de carga viral abaixo de 100000 cópias/ µl de sangue total) (p = 0,02). Para os dados
de carga viral após o início do tratamento (n = 81 pacientes/ 162 alelos) foram
encontradas maiores frenquências dos alelos A*11:01:01, A*30:01:01,
C*04:09N/04:01:01:01, C*06:02:01:01 e supertipo B62 com pacientes de carga viral
indetectável (abaixo de 50 cópias/ µl de sangue total) (p = 0,04). Todos esses alelos
foram considerados como possíveis fatores protetores do hospedeiro contra a
progressão da doença causada pelo HIV (Tabela 5.7.1).
Foram encontradas algumas tendências de maior frequência com valores de
p menores que 0,1 e maiores que 0,05. Para estes casos, testes de Fisher foram
refeitos com os números de casos dobrados, e os valores encontrados atingiram
significância estatística (p ≤ 0,05). O alelo C*07:50 e o supertipo B07 foram mais
frequentes em pacientes de carga viral abaixo de 100000 cópias/ µl de sangue total
(dados de carga viral antes do tratamento), considerados como possíveis tendências
a alelos protetores. Para os dados de carga viral após tratamento, foi encontrada
uma possível tendência protetora do supertipo A01/A03. Já o alelo C*08:02:01:01 e
o supertipo B44 foram mais freqüentes em pacientes com carga viral acima de
100000 cópias/ µl de sangue total e carga viral detectável (acima de 50 cópias/ de
sangue), respectivamente, sendo considerados como possíveis alelos de maior risco
de progressão em pacientes HIV+ (Tabela 5.7.1).
73
Tabela 5.7 .1. Associações dos alelos de HLA-A, B e C com os dados de carga viral dos pacientes,
antes e após o início do tratamento.
Alelos Carga viral (CV) Valor de p Tendência 1
CV antes do tratamento
(n = 62)
CV<100000♪
(n=40)
CV>100000♪
(n=22)
B*51:01:01 11 (27%) 1 (4%) p=0,02
C*07:50 6 (15%) 0 p=0,06 p=0,003
Supertipo B07 ● 21 (68%) 4 (40%) p=0,09 p=0,019
Supertipo B44 ● 2 (6%) 3 (30%) p=0,07 p=0,01
CV depois do tratamento
(n = 162)
CV<50♪
(n=68)
CV>50♪
(n=94)
A*11:01:01 5 (7%) 1 (1%) p=0,04
A*30:01:01 5 (7%) 1 (1%) p=0,04
C*04:09N/04:01:01:01 9 (13%) 5 (5%) p=0,04
C*06:02:01:01 5 (7%) 1 (1%) p=0,04
C*08:02:01 2 (3%) 8 (8%) p=0,098 p=0,02
Supertipo B62 ♦ 5 (10%) 1 (2%) p=0,04
Supertipo A01/A03 ♥ 4 (8%) 1 (1%) p=0,07 p=0,01 1= Valores de p referentes ao teste de Fisher com os valores dobrados proporcionalmente. ♪= cópias/ml de plasma ●= n = 41 (CV < 50, n = 31; CV ≥ 50, n = 10) ♦= n = 105 (CV < 50, n = 45; CV ≥ 50, n = 60) ♥= n = 149 (CV < 50, n = 60; CV ≥ 50, n = 89)
Para a contagem de células CD4 antes do início do tratamento (n = 30
pacientes/ 60 alelos) encontramos uma maior frequência do alelo B*35:01:01 em
indivíduos com contagem de CD4 > 350 células/mm3 de sangue (p = 0,05),
indicando uma possível associação do alelo a uma progressão mais lenta da
doença. De forma oposta, o supertipo A03 foi relacionado à indivíduos com
contagem de CD4 < 350 células/mm3 (p = 0,01). Referente os dados posteriores ao
tratamento (n = 81 pacientes/ 162 alelos), encontramos maior frequência dos alelos
74
A*31:01:02, B*14:02:01 e C*08:02:01 e dos supertipos B27 e B44 em pacientes com
contagem de CD4 < 350 células/mm3 (p = 0,02; p = 0,009; p = 0,01; p = 0,009 e p =
0,05, respectivamente), indicando uma possível associação com pior desfecho
clínico. Já o alelo C*04:30 se mostrou mais freqüente em pacientes com contagem
de CD4 > 350 células/mm3 (p = 0,04), sugerindo este alelo como um provável fator
protetor do hospedeiro para uma progressão mais lenta da doença (Tabela 5.7.2).
Foram encontradas tendências de maior frequência do alelo A*02:01:01 e
supertipo A02 com contagem de CD4 < 350 células/mm3 de sangue, com dados
prévios ao início do tratamento. Com os dados de contagem de CD4 após o
tratamento, foram encontrados mais freqüentemente os alelos B*07:02:01,
B*49:01:01 e C*06:02:01:01 em pacientes com CD4 > 350 células/mm3 e o alelo
C*03:04:01 em pacientes com CD4 < 350 células/mm3 (Tabela 5.7.2).
75
Tabela 5.7 .2. Associações dos alelos de HLA-A, B e C com os dados de contagem de célula CD4 dos
pacientes, antes e após o início do tratamento.
Alelos Contagem CD4 Valor de p Tendência 1
CD4 antes do tratamento
(n=60)
CD4<350♪
(n=46)
CD4>350♪
(n=14)
B*35:01:01 0 2 (14%) p=0,05
Supertipo A03 ● 9 (20%) 7 (58%) p=0,01
A*02:01:01 14 (30%) 1 (7%) p=0,06 p=0,007
Supertipo A02 ● 14 (32%) 1 (8%) p=0,08 p=0,01
CD4 após o tratamento
(n=162)
CD4<350♪
(n=88)
CD4>350♪
(n=74)
A*31:01:02 10 (11%) 2 (3%) p=0,02
B*14:02:01 10 (11%) 1 (1%) p=0,009
C*08:02:01 9 (10%) 1 (1%) p=0,01
C*04:30 0 4 (5%) p=0,04
Supertipo B27 ♦ 15 (26%) 4 (8%) p=0,009
Supertipo B44 ♦ 11 (19%) 16 (31%) p=0,05
B*07:02:01 3 (3%) 7 (9%) p=0,07 p=0,01
B*49:01:01 3 (3%) 7 (9%) p=0,07 p=0,01
C*03:04:01 6 (7%) 1 (1%) p=0.07 p=0,01
C*06:02:01:01 1 (1%) 5 (7%) p=0,06 p=0,006 1 = Valores de p referentes ao teste de Fisher com os valores dobrados proporcionalmente. ♪ = células/mm3 de sangue ● = n = 56 (CD4 < 350 n = 44; CD4 > 350 n = 12) ♦ = n = 109 (CD4 < 350 n = 58; CD4 > 350 n = 51)
Os alelos de HLA determinados pela tipagem (n = 81 pacientes/ 162 alelos) e
os supertipos foram associados aos subtipos do HIV-1 infectante. Para isso os
pacientes foram divididos quantos a presença ou ausência do subtipo B, C ou
76
recombinante BC. Esses resultados podem ser visualizados nas Tabelas 5.7.3 a
5.7.5.
Para as análises relativas ao subtipo B foram encontradas maiores
frequências dos alelos A*02:01:01, B*50:01:01 e supertipo A02 em pacientes
infectados pelo subtipo B (p = 0,02; p = 0,03 e p = 0,03 respectivamente). Já os
supertipos A03 e B27 foram mais freqüentes em pacientes infectados por subtipo
não-B (p = 0,05 e p = 0,03 respectivamente). Também foram encontradas
tendências de possíveis associações do alelo C*04:09N/04:01:01:01 e do supertipo
A24 a infecção por subtipos não-B (Tabela 5.7.3).
Tabela 5.7 .3. Associações dos alelos de HLA-A, B e C com o subtipo B dos pacientes
infectados.
Alelos Subtipo B
(n = 74)
Subtipo ñ-B
(n = 88) Valor de p Tendência 1
A*02:01:01 23 (31%) 16 (18%) 0,02
B*50:01:01 6 (8%) 1 (1%) 0,03
Supertipo A02* 26 (37%) 19 (24%) 0,03
Supertipo A03* 18 (26%) 29 (38%) 0,05
Supertipo B27** 5 (10%) 14 (25%) 0,03
C04:09/04:01:01:01 4 (5%) 10 (11%) 0,09 0,03
Supertipo A24* 11 (16%) 18 (23%) 0,09 0,04 1 = Valores de p referentes ao teste de Fisher com os valores dobrados proporcionalmente. * - n = 149 (para subtipo B = 70; n para subtipo não-B = 79) ** - n = 105 (para subtipo B = 49; n para subtipo não-B = 56)
As análises dos alelos de HLA-A, B e C e supertipos mais frequentes
correlacionados a infecção pelo subtipo C mostraram maiores frequências dos alelos
A*23:01:01 (p = 0,04), B*49:01:01 (p = 0,04), C*07:50 (p = 0,05) e supertipos A24 (p
= 0,04) e B07 (p = 0,001) em pacientes infectados pelo subtipo C, ao passo que
apenas o supertipo A01 se mostrou mais frequente em pacientes infectados por
subtipo não-C (p = 0,04) (Tabela 5.7.4).
77
Tabela 5.7 .4. Associações dos alelos de HLA-A, B e C com o subtipo C dos pacientes
infectados.
Alelos Subtipo C
(n = 50)
Subtipo ñ-C
(n = 112) Valor de p
A*23:01:01 6 (12%) 4 (4%) 0,04
B*49:01:01 6 (12%) 4 (4%) 0,04
C*07:50 5 (10%) 3 (3%) 0,05
Supertipo A01* 4 (9%) 20 (20%) 0,04
Supertipo A24* 13 (28%) 16 (16%) 0,04
Supertipo B07** 18 (53%) 27 (23%) 0,001
* - n = 149 (para subtipo C = 47; n para subtipo não-C = 102) ** - n = 105 (para subtipo C = 34; n para subtipo não-B = 115)
Por último, as análises de associação dos alelos e supertipos ao
recombinante BC mostraram maiores frequências do alelo A*31:01:02 e supertipo
A01 com pacientes infectados por recombinante não-BC (p = 0,001 e p = 0,01
respectivamente). Já os supertipos B27 e A03 apresentaram uma maior frequência
em pacientes infectados por recombinante BC (Tabela 5.7.5).
Tabela 5.7 .5. Associações dos alelos de HLA-A, B e C com o recombinante BC dos pacientes
infectados.
Alelos
Recombinante
BC
(n = 22)
Recombinante
ñ-BC
(n = 140)
Valor
de p Tendência 1
A*31:01:02 6 (27%) 6 (43%) 0,001
Supertipo A01* 2 (9%) 43 (34%) 0,01
Supertipo B27** 5 (38%) 14 (10%) 0,01
Supertipo A03* 10 (45%) 37 (29%) 0,06 0,01 1 = Valores de p referentes ao teste de Fisher com os valores dobrados proporcionalmente. * - n = 149 (para recombinante BC = 22; n para recombinante não-BC = 12 ** - n = 105 (para recombinante BC = 13; n para recombinante não-BC = 136)
Foram feitas outras análises em que os pacientes foram divididos quanto ao
subtipo viral que os infectava e feitas associações dos alelos e supertipos mais
prevalentes para cada subtipo com a carga viral. Apenas os dados de carga viral
78
após o início do tratamento para os pacientes infectados pelos subtipos B ou C
mostraram resultados estatisticamente significantes. Para os pacientes infectados
pelo subtipo B, foram encontradas maiores frequências dos supertipos A03 (p =
0,001) e A24 (p = 0,02) em pacientes com carga viral acima de 50 cópias/µl de
plasma. Também foram encontradas tendências de possíveis associações do alelo
B*07:02:01 com carga viral indetectável e do supertipo B27 com carga viral acima de
50 cópias/µl. O subtipo C teve apenas uma tendência de associação do supertipo
B62 com carga viral indetectável.
6 DISCUSSÃO
A nova metodologia de sequenciamento por NGS traz grandes vantagens
para o sequenciamento completo e tipagem de HLA, uma vez que através de suas
técnicas é possível resolver as ambiguidades de tipagem desses haplótipos
compostos por genes altamente polimórficos, obter a sequência completa de HLA de
vários pacientes de uma única vez, além de reduzir o tempo de trabalho manual e o
custo.
Sequências completas de HLA são essenciais para estratégias que visam
minimizar o risco de doença enxerto versus hospedeiro em transplante
hematopoiético, dado que determinantes desconhecidos podem estar localizados ao
redor dos genes de HLA. Também foi relatado que níveis de expressão de HLA
estão relacionados a diferentes fenótipos de doenças. Portanto, variantes genéticos
em elementos regulatórios como íntrons e promotores devem ser analisados
(HOSOMICHI et al., 2013).
Apesar das técnicas de NGS terem se mostrado tecnologias de
sequenciamento mais baratas e altamente eficazes para a tipagem, sem
ambiguidades e de alta resolução da sequência completa de HLA, elas ainda são
pouco empregadas na rotina clínica e até mesmo na pesquisa científica devido à
difícil análise e manipulação dos dados gerados (DE SANTIS et al., 2013). Portanto,
se fazem necessários maiores estudos e desenvolvimento de metodologias e
programas de análise de dados para uma melhor tipagem dos alelos de HLA
oriundos de sequenciamento por NGS.
Erros de sequenciamento tendem a se acumular no fim das sequencias
geradas fazendo com que reads longos tenham vantagens em relação a reads
79
pequenos, uma vez que os primeiros podem ser filtrados nas suas extremidades,
minimizando possíveis erros (GRUMBT et al., 2013). Além disso, reads maiores
fornecem vantagens frente a mapeamentos incorretos devido à similaridade de
regiões ou pseudogenes.
A taxa de erro obtida pelo sequenciamento por NGS é maior do que a pelo
método de Sanger, sendo a plataforma Illumina aparentemente associada a uma
menor taxa de erro quando comparada com outras metodologias de tipagem como
454 ou Ion Torrent (DE SANTIS et al., 2013; GRUMBT et al., 2013). Sabe-se que as
taxas de erro são significativamente reduzidas ao se aumentar a profundidade de
cobertura do sequenciamento, porém ainda não existe um consenso definido sobre
a medida necessária de cobertura a ser atingida em sequenciamento de regiões
completas (GRUMBT et al., 2013).
As bibliotecas de HLA-A, B e C sequenciadas nesse estudo foram realizadas
com identificação dos reads por paciente, uma nova abordagem nunca feita antes
para esses genes. Todos os artigos publicados nesse tema utilizaram uma
identificação por gene, e não por paciente (no qual todos os três genes de um
mesmo paciente apresentam a mesma sequencia identificadora). O produto do
sequenciamento se mostrou com alta qualidade, como pode ser observado no
relatório do programa FastQC, o que minimiza a taxa de erro presente nas
sequências. Após a filtragem foram selecionados apenas os reads com melhor
qualidade, garantindo uma tipagem mais eficaz do HLA.
De todos os artigos publicados sobre sequenciamento de HLA por NGS,
apenas dois utilizaram as plataformas da Illumina HiSeq e MiSeq (HOSOMICHI et
al., 2013; WANG et al., 2012). A vantagem da plataforma MiSeq seria a produção de
reads maiores que 100 pb, taxa geralmente produzidas na plataforma HiSeq, porém
autores mostraram sucesso na tipagem de HLA também com o sequenciamento
nesta última plataforma (WANG et al., 2012). A grande vantagem de se obter reads
maiores se deve ao fato dos genes do HLA compartilharem muita similaridade entre
si e de muitos alelos se diferirem apenas por uma posição nucleotídica. Com reads
maiores a montagem se torna mais fácil, pois eles podem apresentar mais
nucleotídeos que possam ser característicos do alelo a ser reconstruído, evitando a
“contaminação” por reads de sequências parecidas. No entanto, com o
sequenciamento paired end, essa informação específica de pares de reads pode ser
80
usada para evitar os alinhamentos incorretos, na ausência de reads longos. Essas
“contaminações” de reads foram observadas também ao longo das nossas análises
e foram levadas em consideração na tipagem do alelo.
A montagem de novo realizada com auxílio do programa Velvet não atingiu o
objetivo de montagem de alelos de HLA-A, B e C sem o intermédio de uma
referência. Uma grande limitação pode ser a similaridade entre os loci e o fato deles
terem sido sequenciados juntos, com o mesmo barcode (identificação por paciente),
causando “contaminações” de reads de outro loci, como já discutido anteriormente.
Além disso, o grande número de polimorfismos presentes nesses genes também
contribui para dificultar a montagem de novo. Outras análises com modificações em
diferentes parâmetros ou tentativas com outros programas utilizando diferentes
algoritmos se fazem necessárias para a resolução desse problema.
Por outro lado, a reconstrução dos alelos pela montagem com referência no
programa Bwa foi promissora. Através da visualização do alinhamento fomos
capazes de observar que todos os éxons sequenciados atingiram alta cobertura de
reads e que vários polimorfismos foram apontados. Essas montagens foram feitas
tendo como base as referências de HLA-A, B e C do RefSeq disponíveis no
GenBank, que em tese seriam diferentes do alelo seqüenciado na maioria dos
casos. Portanto, os polimorfismos visualizados determinam as diferenças
encontradas entre a sequência-referência utilizada e o alelo referente a cada
amostra. Para se identificar e tipar os alelos são necessárias análises de
determinação de variantes onde cada polimorfismo é analisado e julgado quanto à
qualidade e frequência, para então gerar uma sequência-consenso da variante (duas
no caso de heterozigotos), e por fim realizar a classificação do alelo. Essas análises
não foram incluídas nesse estudo devido a limitações de tempo, porém já se
encontram em desenvolvimento.
Vários estudos de sequenciamento de HLA por NGS têm inerentes limitações
por realizaram sua determinação de alelos em programas que possuem
metodologias que se baseiam em alinhamento dos reads à sequencias-referência do
banco de dados do IMGT/HLA. Uma dessas limitações seria que a maioria dessas
sequências de HLA são incompletas (contendo apenas éxons) e que poucas
correspondem às especificações de alelos bem documentados (CWD), dificultando a
tipagem e aumentando as chances de uma tipagem errônea (BENTLEY et al., 2009;
81
GABRIEL et al., 2014; HOLCOMB et al., 2011; LIND et al., 2010). Além disso, essas
metodologias são limitadas para a descrição de alelos novos, uma vez que elas
buscam apenas alinhar os reads às sequencias-referência de alelos já descritos.
Apenas três estudos desenvolveram algoritmos ou pipelines próprios de
tipagem, porém os dois mais recentes não se encontram disponíveis para uso
público (HOSOMICHI et al., 2013; WANG et al., 2012) e o terceiro (ERLICH, 2012),
apesar de disponível, não se encontra mais sob desenvolvimento e suporte da
ferramenta GATK da Broad Institute, estando sujeito a erros e desatualizações. Os
outros estudos de tipagem de HLA por NGS fizeram uso de programas comerciais
desenvolvidos para a tipagem de HLA e que utilizam o banco de dados do
IMGT/HLA. Esses programas são comercializados no mundo todo e passaram por
extenso processo de validação, apesar de apresentarem limitações como as
destacadas acima. Nesse contexto de limitações, o programa Omixon-Target
apresentou resultados satisfatórios de tipagem em sua publicação com concordância
superior a 90% para reads maiores de 90 pb e alta cobertura (MAJOR et al., 2013).
Nossos reads se assemelham a essas características testadas e o programa foi
selecionado então para a tipagem dos alelos de HLA.
Uma vez que ainda não há um consenso sobre o valor ideal de cobertura,
diversos estudos estipularam diferentes valores de cobertura mínima ou média
necessária para fornecer resultados confiáveis de tipagem, como cobertura mínima
de 20 reads (ERLICH, 2012; WANG et al., 2012) ou cobertura média de 50
(GRUMBT et al., 2013). A tipagem pelo programa Omixon apresentou uma cobertura
média para os alelos de HLA-A de aproximadamente 2462 reads (77,1 - 13100),
para o HLA-B, de 4210 reads (35,5 - 15100) e para o HLA-C, de 3341 (42,3 -
23910). Todas as coberturas mínimas encontradas para os três loci foram superiores
a 20 reads e a cobertura média muito superior a 50. Porém esses valores são
altamente questionáveis, uma vez que variam dependendo da metodologia de
sequenciamento e tipagem.
Algumas dúvidas de tipagem pelo programa Omixon foram resolvidas através
de uma análise mais profunda do alinhamento gerado no programa ou através de
alinhamento obtido no programa Bwa, Nestes casos, a amostra era sujeita a todos
os alelos candidatos sugeridos pelo Omixon e os polimorfismos que os diferiam
eram analisados manualmente até se encontrar os alelos sem ambiguidade e com
82
alta cobertura. Como exemplos, nós podemos apontar os casos do alelo HLA-
C*04:09N, que o algoritmo não consegue distinguir do alelo C*04:01:01 na tipagem,
ambos sendo considerados como melhores candidatos para a amostra; e do alelo
HLA-A*01:01:01 que apresentou taxas de detecção e cobertura similares ao
A*01:11N. Nesse segundo caso, a resolução foi possível através do alinhamento
pelo Bwa, descartando o alelo nulo como candidato, porém o mesmo não foi
possível para o primeiro caso. Vários alelos de HLA não expressos possuem
polimorfismos fora da região que codifica a fenda de ligação a peptídeos e a
identificação desses alelos nulos é critica para transplantes de medula óssea, uma
vez que a confusão com um variante normalmente expresso pode resultar em
mismatching entre doador e receptor (GRUMBT et al., 2013; HOSOMICHI et al.,
2013). O potencial impacto clínico de mismatches fora da região de reconhecimento
de antígeno ainda deve ser investigado mais aprofundadamente.
Durante a análise dos casos de tipagem com múltiplos candidatos (três ou
mais) com o uso do programa Omixon-Target, podemos notar similaridade entre as
sequências dos três alelos considerados como candidatos, ou seja, um dos alelos
candidatos se assemelhava a um segundo alelo na sua primeira metade da
sequência e a um terceiro na sua metade restante. Esses três alelos candidatos
apresentaram taxa de detecção e cobertura parecidas, tornando a tipagem da
amostra impossível de ser resolvida. Como o programa utiliza as sequências do
banco de dados do IMGT/HLA que apresentam apenas os éxons, já que as
completas estão infinitamente em menor quantidade, sua tipagem está sujeita a
ambiguidades de tipagem como a descrita.
A taxa de detecção abaixo de 97% em mais de 20% dos alelos de HLA-A e C
apresentada pelo programa pode indicar a presença de variantes novos que
poderiam ser caracterizados em novos alelos, uma vez que basta um polimorfismo
ainda não descrito para se classificar um alelo novo. O programa não indica a
presença de novos alelos, mas ela pode ser inferida através dessa análise, tendo
em vista que os reads são comparados apenas a um banco de dados de
sequencias-referência de alelos já descritos e que essas sequências, muita delas
incompletas, também podem ser fruto de uma tipagem errônea devido à
inespecificidade da técnica utilizada. De forma interessante, cabe destacar que
apenas um alelo de HLA-B apresentou taxa de detecção próxima de 95%, porém
83
esse é o gene mais polimórfico dos três e o que possui um maior número de alelos
descritos.
A casuística estudada, formada por pacientes acompanhados
longitudinalmente por vários anos no Hospital das Clínicas de Porto Alegre,
apresentou em sua maioria pacientes com alta carga viral, baixa contagem de CD4 e
sob tratamento antirretroviral. Esse pacientes podem apresentar mutações de
resistência a drogas ou características genéticas do hospedeiro que contribuem para
a falha terapêutica e imunológica e consequente progressão para aids; ou
contrariamente, para o controle da viremia, como alguns alelos de HLA. Além disso,
muitas dessas mutações podem ter sido originadas na tentativa do vírus de escapar
do sistema imune restrito por alelos de HLA classe I, mostrando que o HIV-1 está
sendo constantemente moldado pelo sistema imune (STEPHENS, 2012).
Os alelos de HLA classe I (A e B) mais encontrados na população brasileira
são HLA-A*02, HLA-B*44, HLA-B*35, HLA-B*51 e HLA-B*07 (BRAUN-PRADO et al.,
2000; DONADI et al., 2000 POLIZEL et al., 2004). Em um estudo mais recente de
Bortolotto e colaboradores desenvolvido com 5000 doadores voluntários de medula
óssea de Porto Alegre, foram encontrados os alelos HLA-A*02, A*03, A*24, A*01
com frequência acima de 10%, enquanto para o HLA-B os alelos B*35, B*44, B*51 e
B*15 foram os mais comumente encontrados na casuística (BORTOLOTTO et al.,
2012). Nossos resultados se mostraram semelhantes, uma vez que os alelos mais
frequentes foram o A*02:01:01, A*24:02:01:01 e B*51:01:01, todos com frequência
acima de 10%. Porém, devido ao baixo número amostral e alta resolução de tipagem
que divide os alelos em mais grupos, as frequências encontradas se mostraram
abaixo de 5% para a grande maioria dos outros alelos encontrados. Estudos com
HLA-C no Brasil são ainda mais escassos, porém os alelos mais encontrados neste
trabalho (frequência > 7%), HLA-C*07:01:01:01, C*02:02:02, C*04 (C*04:09N ou
C*04:01:01:01) e C*12:03:01:01, foram também os mais encontrados em outros
estudos no Sul do Brasil em uma casuística HIV- (FRANCESCHI et al., 2011;
PORTELA et al., 2012).
Os alelos HLA-B*57 e B*27, mais bem caracterizados na literatura quanto à
sua associação com controle da carga viral do HIV e progressão lenta para aids, não
foram encontrados na casuística. Isso pode ser justificado pela maior presença no
nosso estudo de pacientes com prognóstico contrário aos efeitos desses alelos, ou
84
seja, pacientes com carga viral alta, baixa contagem de CD4 e que necessitam de
tratamento antirretroviral. A grande vantagem da ausência desses alelos seria que
as associações encontradas entre os alelos e baixa carga viral não serão
influenciados pela presença desses alelos protetores do hospedeiro.
Poucos trabalhos têm caracterizado a relação de alelos de HLA com a
modulação da infecção pelo HIV e a progressão da doença no Brasil. Um estudo em
São Paulo levantou possíveis associações entre alelos de HLA e a infecção pelo HIV
e o desenvolvimento de tuberculose em pacientes HIV+, encontrando diversos alelos
de classe I e II com diferenças significativas entre os grupos (FIGUEIREDO et al.,
2008). Outro estudo conduzido em usuários de drogas intravenosas do Rio de
Janeiro falhou em demonstrar prevalências de diferentes alelos HLA-B em pacientes
HIV+ comparados àqueles sem a infecção viral (TEIXEIRA et al., 2009). Um terceiro
estudo, desenvolvido no Nordeste do país, demonstrou que os alelos HLA-Bw4-B*57
e Cw*18 estavam associados com carga viral do HIV mais baixa na fase crônica da
infecção (SILVA et al., 2010). Mais recentemente, um estudo com pacientes HIV+ de
Recife e Pernambuco tratados com o antirretroviral abacavir, relatou uma frequência
significativa do HLA-B*57:01, alelo relacionado à hipersensibilidade à droga
(CROVELLA et al., 2011). Nenhum estudo avaliou a frequência de haplótipos de
HLA em pacientes HIV+ na região Sul do Brasil, uma área com características
genéticas e étnicas distintas do resto do país. Também vale destacar que nenhum
estudo no Brasil sequenciou o HLA-A, B e C por metodologias de sequenciamento
de nova geração.
A região Sul do Brasil é caracterizada por uma epidemia de HIV-1
diferenciada do resto do país. Dados do nosso grupo vêm demonstrando uma
predominância do subtipo C na última década, e o seu espalhamento para outras
regiões do Brasil e para os países do Cone Sul (SANTOS et al., 2007; SANTOS et
al., 2006; SOARES et al., 2005; SOARES et al., 2003a; SOARES et al., 2003b).
Nesse estudo, foi encontrada uma maior prevalência do subtipo B (46%), porém
também foi encontrado um número significativo do subtipo C (31%) e de
recombinantes BC (14%), demonstrando a evolução da prevalência do subtipo C no
sul do Brasil como já descrito na literatura (BRINDEIRO et al., 2003; SOARES et al.,
2005; SOARES et al., 2003a). É importante ressaltar que os pacientes aqui
analisados são pacientes com diagnóstico de infecção para o HIV mais antigo, já
85
tendo mais de 10 anos sob tratamento antirretroviral. Acreditamos que o perfil
epidemiológico-molecular do HIV deste grupo reflete as prevalências de subtipos da
época, quando o subtipo B ainda prevalecia no Sul do país.
A aparente segregação de subtipos ou recombinantes do HIV-1 em diferentes
regiões geográficas pode estar relacionada ao perfil imunogenético dos grupos
étnicos expostos (STEPHENS, 2012). Assim, o estudo dos haplótipos de HLA em
pacientes infectados pelos subtipos B, C e recombinantes BC, em um contexto
étnico e genético como o da região Sul do Brasil, se torna vital no melhor
entendimento dos fatores genéticos do hospedeiro que respondem a esta infecção
viral.
Frente a esse panorama, foram realizados testes estatísticos na busca de
associações entre os alelos de HLA-A, B e C mais prevalentes e o controle da
viremia do HIV, progressão para a doença e subtipo viral infectante, a fim de
esclarecer essas peculiaridades da infecção pelo HIV-1 no sul do Brasil. Porem, os
testes estatísticos realizados foram análises univariadas preliminares, sendo de
extrema importância a realização futura de testes multivariados de regressão
logística para validar as associações encontradas e excluir a influência de outros
fatores de confusão que poderiam estar mascarando o verdadeiro impacto de alelos
de HLA específicos na infecção pelo HIV. Esses fatores incluem o tempo de
infecção, a adesão a terapia antirretroviral, o(s) esquema(s) terapêutico(s)
administrados, mutações de resistência aos antirretrovirais, doenças oportunistas,
entre outros. Outro fator importante a se considerar nas análises estatísticas seria
que as análises de carga viral do HIV e contagens de CD4 foram realizadas levando
em consideração apenas um ponto de mensuração. Nestas circunstâncias, podemos
estar comparando indivíduos em diversos estágios diferentes da doença, o que
poderia explicar variações na carga viral e contagens de CD4 em detrimento do
efeito do alelo de HLA propriamente dito. Devido a tais limitações do estudo, serão
feitas análises com medidas de carga viral e contagens de CD4 considerando a
variação por um período de tempo, e análises de regressão logística para melhor
robustez dos resultados.
Os dados de carga viral e contagem de CD4, antes e após o tratamento,
relacionados a alelos determinados para cada paciente mostraram algumas
associações estatisticamente significativas, discutidas abaixo. Também cabe
86
destacar que alguns alelos apresentaram apenas uma tendência de associação por
não ter um número amostral suficiente para alcançar valor estatístico significativo.
Essas associações e tendências com suporte estatístico foram correlacionadas com
as relatadas na literatura.
Os alelos B*51:01:01, A*11:01:01, A*30:01:01 se mostraram mais freqüentes
em pacientes com carga viral abaixo de 100000 cópias/µl de plasma ou carga viral
indetectável (abaixo de 50 cópias/µl de plasma), ao passo que o supertipo A01/A03
mostrou uma tendência de maior freqüência em pacientes com carga viral > 50
cópias/µl. Essas possíveis associações de controle da viremia já foram descritas na
literatura para os dois primeiros alelos, onde foram demonstrados como alelos
protetores do hospedeiro contra a progressão da doença causada pelo HIV-1
(KAWASHIMA et al., 2010 KASLOW et al., 1996 TOMIYAMA et al., 1999; LI e
BOUVIER, 2004; ZHANG et al., 2011). Tais alelos são ditos protetores do
hospedeiro contra a progressão da doença por justamente controlar a infecção
(viremia) através da melhor apresentação de epítopos virais para os linfócitos T
CD8+, que por sua vez desenvolvem resposta citotóxica contra a célula infectada.
Porém, esta é a primeira vez que são descritas prováveis associações para os dois
últimos alelos, associados à carga viral detectável.
O alelo B*14:02:01 foi mais freqüente em pacientes que apresentaram
contagens de CD4 < 350 células/mm3 de sangue, assim como o alelo C*03:04:02,
que também mostrou tendência a tal associação. Apenas o grupo alélico HLA-B*14
já foi associada na literatura à progressão mais lenta pra doença em pacientes
infectados pelo subtipo B, e ao risco de infecção pelo HIV em uma coorte da China,
mostrando um papel contrário (LAZARYAN et al., 2011LI et al., 2007). Na possível
associação descrita neste trabalho, não houve discriminação por subtipo viral. Já os
alelos B*35:01:01 e C*04:30 foram mais frequentemente encontrados em pacientes
com contagens de CD4 > 350 células/mm3 de sangue. Os grupos alélicos B*35 e
C*04 também já foram associados à progressão mais rápida para doença e pior
desfecho clínico na literatura, mostrando um papel contrário ao encontrado por nós
(CARRINGTON et al., 1999). Vale ressaltar aqui que outros estudos mostraram que
dentre os alelos estudados (B*35:01, B*35:02 e B*35:03), o alelo B*35:01 apresenta
progressão mais lenta quando comparado aos demais (GAO et al., 2001). Além
disso, o fato da análise ter se baseado em apenas uma contagem pontual de CD4
87
pode não representar o quadro geral da progressão da doença nos pacientes
carreadores do alelo.
O alelo C*06:02:01 se mostrou mais freqüente em pacientes com carga viral
indetectável e apresentou tendência de maior freqüência em pacientes com
contagem de célula CD4 > 350 células/mm3 de sangue. Com papel ambíguo, já foi
demonstrada associação desse alelo com carga viral alta e rápida progressão da
infecção (STEPHENS, 2012) e com proteção contra a soroconversão em mulheres
de grupo de risco para infecção pelo HIV (PETERSON et al., 2013). O alelo
C*08:02:01 e o supertipo B44 se mostraram associados a contagens de CD4 > 350
células/mm3 de sangue, e com tendência de associação a carga viral de HIV >
100000 cópias/µl. Tais associações nunca foram demonstradas para o primeiro
alelo, mas já foram demonstradas para o supertipo B44, indicando um possível
papel de risco do hospedeiro para a progressão da infecção, e consequentemente
um pior desfecho da doença (LAZARYAN et al., 2010; LAZARYAN et al., 2011
SCHERER et al., 2004).
Os alelos de HLA mais prevalentes foram testados também para associações
com os subtipos virais encontrados na casuística (subtipo B, C e recombinantes BC).
Das associações encontradas, podemos destacar o alelo A*02:01:01 e o supertipo
A02, que se mostraram mais frequentes em infecção pelo subtipo B e que além
disso, tiveram tendência de maior frequência em pacientes com contagens de CD4 <
350 células/mm3 de sangue. Essa provável associação está sendo descrita pela
primeira vez para o alelo A*02:01:01, mas para o supertipo A02 já foi descrita uma
associação inversa à encontrada por nós, associado a progressão mais lenta da
doença em infectados pelos subtipos B e C (LAZARYAN et al., 2011; MACDONALD
et al., 2000). Aqui novamente, o agrupamento de diferentes alelos em um único
supertipo pode gerar resultados diferentes (até opostos) aos encontrados para alelos
individuais, em função do somatório dos efeitos de todos os alelos representados no
grupo.
O alelo C*07:50 e o supertipo B07 foram mais frequentes em pacientes de
carga viral abaixo de 100000 cópias/µl de plasma, considerados como possíveis
alelos controladores da viremia, mas também foram mais frequentes em pacientes
infectados pelo subtipo C. Porém o supertipo B07 está relatado na literatura como
associado ao risco de evolução mais rápida para aids em uma coorte infectada pelo
88
subtipo B (LAZARYAN et al., 2010 TRACHTENBERG et al., 2003). Outros fatores
podem estar relacionados com a associação à baixa carga viral, causando essa
dualidade de papeis dos alelos, sendo necessárias análises mais aprofundadas.
O supertipo B27, relacionado ao controle da carga viral do HIV de forma
estabelecida (LAZARYAN et al., 2011 STEPHENS, 2012 NOVITSKY et al., 2003),
apresentou maior freqüência em infecções por subtipo não-B, e contrariamente mais
frequente em pacientes com infecção por recombinantes BC e com contagens de
CD4 < 350 células/mm3. Levantamos a hipótese de que talvez esse supertipo possa
reconhecer melhor epítopos originados de vírus de subtipo B e não reconhecer tão
eficientemente epítopos de recombinantes BC devido a variações existentes entre
eles, o que explicaria as associações encontradas. Essas mesmas associações
também foram encontradas pela primeira vez para os supertipos A03, não havendo
nenhum comparativo na literatura.
Outra associação de maior frequência em infecção por subtipo não-B foi
encontrada para o supertipo A24, assim também como para o subtipo C. De forma
curiosa, Novitsky e colaboradores demonstraram que nativos africanos infectados
pelo subtipo C e com esse supertipo apresentam menores cargas virais e vigorosa
resposta CTL (NOVITSKY et al., 2003). Ressaltamos, portanto, que mais estudos
devem ser realizados para investigar tais associações, a fim de comprová-las com
maior robustez.
Pela primeira vez descrevemos uma relação do alelo B*50:01:01 com
pacientes infectados pelo subtipo B, e dos alelos A*23:01:01 e B*49:01:01 com
pacientes infectados pelo subtipo C. O alelo A*31:01:02 se mostrou protetor contra a
infecção por recombinantes BC, e o supertipo A01 contra o subtipo C e
recombinantes BC, ambos também sendo descritos também pela primeira vez.
Os pacientes foram divididos quanto ao subtipo viral que os infectava e foram
feitas associações dos alelos e supertipos mais prevalentes para cada subtipo com a
carga viral. Apenas os dados de carga viral após o início do tratamento para os
pacientes infectados pelos subtipos B ou C mostraram resultados significativos,
provavelmente devido ao maior número amostral.
O supertipo B62 que nas primeiras análises se mostrou mais freqüente em
pacientes com carga viral indetectável, também apresentou tendência de maior
frequência em pacientes com carga viral indetectável infectados pelo subtipo C,
89
podendo indicar um possível fator protetor em indivíduos infectados por esse
subtipo, talvez por uma melhor apresentação de epítopos comuns a esse subtipo em
especifico. Lazaryan e colaboradores já relataram que esse supertipo estaria ligado
a um maior controle da viremia em pacientes americanos HIV+ de origem africana,
ao passo que Scherer e colaboradores descreveram a associação deste supertipo a
uma resposta CTL mais vigorosa (LAZARYAN et al., 2011; SCHERER et al., 2004).
Por último, também foram encontradas tendências de maior frequência do
alelo B*07:02:01 em pacientes com carga viral indetectável. Curiosamente, tal
associação é descrita forma oposta na literatura, relacionando o alelo à rápida
progressão em pacientes infectados pelo subtipo B (KLOVERPRIS et al., 2013).
Mais uma vez essas associações necessitam de análises com maior robustez
estatística para serem comprovadas.
7 CONCLUSÕES
A nova metodologia de sequenciamento por NGS traz grandes vantagens
para o sequenciamento completo e tipagem sem ambiguidades do alelos de HLA-A,
B e C.
A montagem de novo realizada com o programa Velvet não atingiu o objetivo
de montagem de alelos de HLA-A, B e C. Outras análises com modificações em
diferentes parâmetros ou tentativas com outros programas utilizando diferentes
algoritmos se fazem necessárias para a resolução desse problema.
Por outro lado, a reconstrução dos alelos pela montagem com referência no
programa Bwa foi promissora, podendo ser observado no alinhamento que todos os
éxons sequenciados atingiram alta cobertura de reads e que vários polimorfismos
foram apontados. Para se identificar os alelos são necessárias análises de
determinação de variantes que se encontram em desenvolvimento.
Apesar das limitações referentes à tipagem tendo como base o banco de
dados do IMGT/HLA, o programa Omixon-Target foi capaz de tipar todas as
amostras do estudo. Algumas dúvidas foram resolvidas através de uma análise mais
detalhada do alinhamento gerado pelo programa ou através de outro alinhamento
pelo programa Bwa.
90
Os alelos mais frequentes foram o A*02:01:01, A*24:02:01:01, B*51:01:01
HLA-C*07:01:01:01 e C*02:02:02 corroborando aqueles encontrados em outros
estudos no Sul do Brasil.
A diversidade de subtipos do HIV-1 apontada no Hospital de Clínicas de Porto
Alegre permitiu identificar alta prevalência dos subtipos B, C e recombinantes BC,
além de formas recombinantes únicas, condizente com as prevalências descritas
naquele momento da epidemia.
Os dados de carga viral, contagens de CD4 e subtipo infectante, relacionados
aos alelos de cada paciente mostraram algumas associações de frequência
estatisticamente significativas indicando possíveis papeis de proteção ou risco para
infecção, controle da viremia ou progressão mais rápida para doença, algumas já
descritas na literatura e outras novas, nunca antes relatadas.
Alguns alelos apresentaram tendências de associação, limitadas pelo baixo
número amostral. São necessários mais estudos e análises estatísticas
multivariadas para comprovar a associação de alguns alelos encontrada neste
trabalho, avaliando o controle da infecção do HIV em uma população infectada por
diferentes subtipos.
Poucos trabalhos têm caracterizado a relação de alelos de HLA com a
modulação da infecção pelo HIV e a progressão da doença no Brasil. O estudo dos
haplótipos de HLA em pacientes infectados pelos subtipos B, C e recombinantes BC,
em um contexto étnico e genético como o da região Sul do Brasil, se torna vital no
melhor entendimento dos fatores genéticos do hospedeiro que respondem a esta
infecção viral. Portanto se fazem necessários maiores estudos e desenvolvimento de
novas metodologias e programas de análise de dados para uma melhor tipagem dos
alelos de HLA oriundos de sequenciamento por NGS.
91
8 REFERÊNCIAS BIBLIOGRÁFICAS
ANISIMOVA, M. e GASCUEL, O. Approximate likelihood-ratio test for branches:
A fast, accurate, and powerful alternative. Syst Biol 2006. 55 (4):539-552.
APOSTOLOPOULOS, V. et al. MHC and MHC-like molecules: structural
perspectives on the design of molecular vaccines. Hum Vaccin 2008. 4 (6):400-
409.
APTSIAURI, N. et al. MHC class I antigens and immune surveillance in
transformed cells. Int Rev Cytol 2007a. 256 139-189.
APTSIAURI, N. et al. Role of altered expression of HLA class I molecules in
cancer progression. Adv Exp Med Biol 2007b. 601 123-131.
BANSAL, A. et al. Immunological control of chronic HIV-1 infection: H LA-
mediated immune function and viral evolution in ado lescents. AIDS 2007. 21
(18):2387-2397.
BARRE-SINOUSSI, F. et al. Isolation of a T-lymphotropic retrovirus from a
patient at risk for acquired immune deficiency synd rome (AIDS). Science 1983.
220 (4599):868-871.
BECK, S. e TROWSDALE, J. The human major histocompatability complex:
lessons from the DNA sequence. Annu Rev Genomics Hum Genet 2000. 1 117-
137.
BENTLEY, G. et al. High-resolution, high-throughput HLA genotyping by next-
generation sequencing. Tissue Antigens 2009. 74 (5):393-403.
BERGAMASCHI, A. e PANCINO, G. Host hindrance to HIV-1 replication in
monocytes and macrophages. Retrovirology 2010. 7 31.
BJORKMAN, P. J. e PARHAM, P. Structure, function, and diversity of class I
major histocompatibility complex molecules. Annu Rev Biochem 1990. 59 253-
288.
92
BJORKMAN, P. J. et al. The foreign antigen binding site and T cell recogni tion
regions of class I histocompatibility antigens. Nature 1987a. 329 (6139):512-518.
BJORKMAN, P. J. et al. Structure of the human class I histocompatibility
antigen, HLA-A2. Nature 1987b. 329 (6139):506-512.
BONGERTZ, V. et al. HIV-1 diversity in Brazil: genetic, biologic, and
immunologic characterization of HIV-1 strains in th ree potential HIV vaccine
evaluation sites. Brazilian Network for HIV Isolati on and Characterization. J
Acquir Immune Defic Syndr 2000. 23 (2):184-193.
BORTOLOTTO, A. S. et al. HLA-A, -B, and -DRB1 allelic and haplotypic diversi ty
in a sample of bone marrow volunteer donors from Ri o Grande do Sul State,
Brazil. Hum Immunol 2012. 73 (2):180-185.
BOWERMAN, B. et al. A nucleoprotein complex mediates the integration of
retroviral DNA. Genes Dev 1989. 3 (4):469-478.
BRAUN-PRADO, K. et al. HLA class I polymorphism, as characterised by PCR-
SSOP, in a Brazilian exogamic population. Tissue Antigens 2000. 56 (5):417-427.
BRINDEIRO, R. M. et al. Brazilian Network for HIV Drug Resistance Surveilla nce
(HIV-BResNet): a survey of chronically infected ind ividuals. AIDS 2003. 17
(7):1063-1069.
BRUMME, Z. L. et al. Modulation of HIV reservoirs by host HLA: bridging the
gap between vaccine and cure. Curr Opin Virol 2012. 2 (5):599-605.
CANN, A. J. e KARN, J. Molecular biology of HIV: new insights into the vir us
life-cycle. AIDS 1989. 3 Suppl 1 S19-34.
CANO, P. et al. Common and well-documented HLA alleles: report of t he Ad-
Hoc committee of the american society for histocomp atiblity and
immunogenetics. Hum Immunol 2007. 68 (5):392-417.
CARLSON, J. M. et al. Widespread impact of HLA restriction on immune cont rol
and escape pathways of HIV-1. J Virol 2012. 86 (9):5230-5243.
93
CARRINGTON, M. et al. HLA and HIV-1: heterozygote advantage and B*35-
Cw*04 disadvantage. Science 1999. 283 (5408):1748-1752.
CARRINGTON, M. e O'BRIEN, S. J. The influence of HLA genotype on AIDS.
Annu Rev Med 2003. 54 535-551.
CARRINGTON, M. e WALKER, B. D. Immunogenetics of spontaneous control of
HIV. Annu Rev Med 2012. 63 131-145.
CASADO, C. et al. Host and viral genetic correlates of clinical defin itions of HIV-
1 disease progression. PLoS One 2010. 5 (6):e11079.
CDC 1993 revised classification system for HIV infectio n and expanded
surveillance case definition for AIDS among adolesc ents and adults. 1994
CHOO, S. Y. The HLA system: genetics, immunology, clinical test ing, and
clinical implications. Yonsei Med J 2007. 48 (1):11-23.
CLAPHAM, P. R. e WEISS, R. A. Immunodeficiency viruses. Spoilt for choice of
co-receptors. Nature 1997. 388 (6639):230-231.
COFFIN, J. M. et al. The Interactions of Retroviruses and their Hosts. 1997.
CONSORTIUM, T. M. S. Complete sequence and gene map of a human major
histocompatibility complex. The MHC sequencing cons ortium. Nature 1999. 401
(6756):921-923.
COUTO-FERNANDEZ, J. C. et al. HIV-1 subtyping in Salvador, Bahia, Brazil: a
city with African sociodemographic characteristics. J Acquir Immune Defic Syndr
1999. 22 (3):288-293.
COWAN, M. J. et al. Maternal transmission of acquired immune deficiency
syndrome. Pediatrics 1984. 73 (3):382-386.
CROVELLA, S. et al. Frequency of HLA B*5701 allele carriers in abacavir
treated-HIV infected patients and controls from nor theastern Brazil. Clinics (Sao
Paulo) 2011. 66 (8):1485-1488.
94
DALGLEISH, A. G. et al. The CD4 (T4) antigen is an essential component of t he
receptor for the AIDS retrovirus. Nature 1984. 312 (5996):763-767.
DALMASSO, C. et al. Distinct genetic loci control plasma HIV-RNA and ce llular
HIV-DNA levels in HIV-1 infection: the ANRS Genome Wide Association 01
study. PLoS One 2008. 3 (12):e3907.
DARLIX, J. L. et al. Cis elements and trans-acting factors involved in t he RNA
dimerization of the human immunodeficiency virus HI V-1. J Mol Biol 1990. 216
(3):689-699.
DAUSSET, J. The birth of MAC. Vox Sang 1984. 46 (4):235-237.
DE SANTIS, D. et al. 16(th) IHIW : review of HLA typing by NGS. Int J
Immunogenet 2013. 40 (1):72-76.
DEEKS, S. G. e WALKER, B. D. Human immunodeficiency virus controllers:
mechanisms of durable virus control in the absence of antiretroviral therapy.
Immunity 2007. 27 (3):406-416.
DEL CAMPO, A. B. et al. Targeting HLA class I expression to increase tumor
immunogenicity. Tissue Antigens 2012. 79 (3):147-154.
DOHERTY, P. C. e ZINKERNAGEL, R. M. A biological role for the major
histocompatibility antigens. Lancet 1975. 1 (7922):1406-1409.
DONADI, E. A. et al. HLA class I and class II profiles of patients prese nting with
Sydenham's chorea. J Neurol 2000. 247 (2):122-128.
ELAHI, S. et al. Protective HIV-specific CD8+ T cells evade Treg cel l
suppression. Nat Med 2011. 17 (8):989-995.
ENGELHARD, V. H. How cells process antigens. Sci Am 1994. 271 (2):54-61.
ERLICH, H. HLA DNA typing: past, present, and future. Tissue Antigens 2012. 80
(1):1-11.
95
FALK, K. et al. Allele-specific motifs revealed by sequencing of se lf-peptides
eluted from MHC molecules. Nature 1991. 351 (6324):290-296.
FARQUHAR, C. et al. Human leukocyte antigen (HLA) B*18 and protection
against mother-to-child HIV type 1 transmission. AIDS Res Hum Retroviruses
2004. 20 (7):692-697.
FELLAY, J. Host genetics influences on HIV type-1 disease. Antivir Ther 2009. 14
(6):731-738.
FELLAY, J. et al. Common genetic variation and the control of HIV-1 i n humans.
PLoS Genet 2009. 5 (12):e1000791.
FIGUEIREDO, J. F. et al. HLA profile in patients with AIDS and tuberculosis.
Braz J Infect Dis 2008. 12 (4):278-280.
FRAHM, N. et al. HLA-B63 presents HLA-B57/B58-restricted cytotoxic T -
lymphocyte epitopes and is associated with low huma n immunodeficiency
virus load. J Virol 2005. 79 (16):10218-10225.
FRAHM, N. et al. Control of human immunodeficiency virus replication by
cytotoxic T lymphocytes targeting subdominant epito pes. Nat Immunol 2006. 7
(2):173-178.
FRANCESCHI, D. S. et al. Class-I human leukocyte alleles in leprosy patients
from Southern Brazil. Rev Soc Bras Med Trop 2011. 44 (5):616-620.
FRANKEL, A. D. e YOUNG, J. A. HIV-1: fifteen proteins and an RNA. Annu Rev
Biochem 1998. 67 1-25.
FREED, E. O. HIV-1 replication. Somat Cell Mol Genet 2001. 26 (1-6):13-33.
GABRIEL, C. et al. HLA typing by next-generation sequencing - getting closer to
reality. Tissue Antigens 2014. 83 (2):65-75.
GAO, X. et al. Effect of a single amino acid change in MHC class I molecules on
the rate of progression to AIDS. N Engl J Med 2001. 344 (22):1668-1675.
96
GARRETT, T. P. et al. Structure/function studies of major histocompatibil ity
antigens. Transplant Proc 1989. 21 (1 Pt 1):588-590.
GATTI, E. e PIERRE, P. Understanding the cell biology of antigen presentat ion:
the dendritic cell contribution. Curr Opin Cell Biol 2003. 15 (4):468-473.
GONZALEZ-GALARZA, F. F. et al. Allele frequency net: a database and online
repository for immune gene frequencies in worldwide populations. Nucleic
Acids Res 2011. 39 (Database issue):D913-919.
GORER, P. A. e SCHUTZE, H. Genetical studies on immunity in mice: II.
Correlation between antibody formation and resistan ce. J Hyg (Lond) 1938. 38
(6):647-662.
GOTO, T. et al. Projection structures of human immunodeficiency vir us type 1
(HIV-1) observed with high resolution electron cryo -microscopy. J Electron
Microsc (Tokyo) 1994. 43 (1):16-19.
GRAF, T. et al. HIV-1 genetic diversity and drug resistance among t reatment
naive patients from Southern Brazil: an association of HIV-1 subtypes with
exposure categories. J Clin Virol 2011. 51 (3):186-191.
GRUMBT, B. et al. Diagnostic applications of next generation sequenci ng in
immunogenetics and molecular oncology. Transfus Med Hemother 2013. 40
(3):196-206.
GUINDON, S. et al. New algorithms and methods to estimate maximum-
likelihood phylogenies: assessing the performance o f PhyML 3.0. Syst Biol
2010. 59 (3):307-321.
GUREVICH, A. et al. QUAST: quality assessment tool for genome assemblie s.
Bioinformatics 2013. 29 (8):1072-1075.
HALL, T. A. BioEdit: a user-friendly biological sequence alignm ent editor and
analysis program for Windows 95/98/NT. Nucl Acids Symp Ser 1999. 41 95-98.
HEMELAAR, J. et al. Global trends in molecular epidemiology of HIV-1 du ring
2000-2007. AIDS 2011. 25 (5):679-689.
97
HO, D. D. HIV-1 dynamics in vivo. J Biol Regul Homeost Agents 1995. 9 (3):76-77.
HOLCOMB, C. L. et al. A multi-site study using high-resolution HLA genoty ping
by next generation sequencing. Tissue Antigens 2011. 77 (3):206-217.
HOSOMICHI, K. et al. Phase-defined complete sequencing of the HLA genes by
next-generation sequencing. BMC Genomics 2013. 14 355.
HU, D. J. et al. The emerging genetic diversity of HIV. The importan ce of global
surveillance for diagnostics, research, and prevent ion. JAMA 1996. 275 (3):210-
216.
KASLOW, R. A. et al. Influence of combinations of human major
histocompatibility complex genes on the course of H IV-1 infection. Nat Med
1996. 2 (4):405-411.
KAUR, G. e MEHRA, N. Genetic determinants of HIV-1 infection and progres sion
to AIDS: immune response genes. Tissue Antigens 2009a. 74 (5):373-385.
KAUR, G. e MEHRA, N. Genetic determinants of HIV-1 infection and progres sion
to AIDS: susceptibility to HIV infection. Tissue Antigens 2009b. 73 (4):289-301.
KAWASHIMA, Y. et al. Long-term control of HIV-1 in hemophiliacs carrying
slow-progressing allele HLA-B*5101. J Virol 2010. 84 (14):7151-7160.
KAWASHIMA, Y. et al. Adaptation of HIV-1 to human leukocyte antigen clas s I.
Nature 2009. 458 (7238):641-645.
KEANE, T. M. et al. Assessment of methods for amino acid matrix selecti on and
their use on empirical data shows that ad hoc assum ptions for choice of matrix
are not justified. BMC Evol Biol 2006. 6 29.
KIEPIELA, P. et al. Dominant influence of HLA-B in mediating the potent ial co-
evolution of HIV and HLA. Nature 2004. 432 (7018):769-775.
KIMURA, M. Preponderance of synonymous changes as evidence for the
neutral theory of molecular evolution. Nature 1977. 267 (5608):275-276.
98
KLEIN, J. e SATO, A. The HLA system. First of two parts. N Engl J Med 2000a.
343 (10):702-709.
KLEIN, J. e SATO, A. The HLA system. Second of two parts. N Engl J Med 2000b.
343 (11):782-786.
KLOVERPRIS, H. N. et al. HIV Subtype Influences HLA-B*07:02-Associated HIV
Disease Outcome. AIDS Res Hum Retroviruses 2013.
LAZARYAN, A. et al. Human leukocyte antigen B58 supertype and human
immunodeficiency virus type 1 infection in native A fricans. J Virol 2006. 80
(12):6056-6060.
LAZARYAN, A. et al. Human leukocyte antigen class I supertypes and HIV- 1
control in African Americans. J Virol 2010. 84 (5):2610-2617.
LAZARYAN, A. et al. The influence of human leukocyte antigen class I al leles
and their population frequencies on human immunodef iciency virus type 1
control among African Americans. Hum Immunol 2011. 72 (4):312-318.
LESLIE, A. et al. Additive contribution of HLA class I alleles in the immune
control of HIV-1 infection. J Virol 2010. 84 (19):9879-9888.
LETVIN, N. L. e WALKER, B. D. Immunopathogenesis and immunotherapy in
AIDS virus infections. Nat Med 2003. 9 (7):861-866.
LI, H. e DURBIN, R. Fast and accurate short read alignment with Burrows -
Wheeler transform. Bioinformatics 2009. 25 (14):1754-1760.
LI, H. et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics
2009. 25 (16):2078-2079.
LI, L. e BOUVIER, M. Structures of HLA-A*1101 complexed with
immunodominant nonamer and decamer HIV-1 epitopes c learly reveal the
presence of a middle, secondary anchor residue. J Immunol 2004. 172 (10):6175-
6184.
99
LI, S. et al. Human leukocyte antigen class I and class II allele frequencies and
HIV-1 infection associations in a Chinese cohort. J Acquir Immune Defic Syndr
2007. 44 (2):121-131.
LIND, C. et al. Next-generation sequencing: the solution for high-r esolution,
unambiguous human leukocyte antigen typing. Hum Immunol 2010. 71
(10):1033-1042.
MACDONALD, K. S. et al. Influence of HLA supertypes on susceptibility and
resistance to human immunodeficiency virus type 1 i nfection. J Infect Dis 2000.
181 (5):1581-1589.
MAJOR, E. et al. HLA typing from 1000 genomes whole genome and whole
exome illumina data. PLoS One 2013. 8 (11):e78410.
MALISSEN, M. et al. Exon/intron organization and complete nucleotide
sequence of an HLA gene. Proc Natl Acad Sci U S A 1982. 79 (3):893-897.
MARMOR, M. et al. Resistance to HIV infection. J Urban Health 2006. 83 (1):5-17.
MARSH, S. G. Nomenclature for factors of the HLA system, update September
2000. WHO Nomenclature Committee for Factors of the HLA System. Tissue
Antigens 2000. 56 (6):565-566.
MARSH, S. G. et al. Nomenclature for factors of the HLA system, 2010. Tissue
Antigens 2010. 75 (4):291-455.
MASSIAH, M. A. et al. Comparison of the NMR and X-ray structures of the H IV-1
matrix protein: evidence for conformational changes during viral assembly.
Protein Sci 1996. 5 (12):2391-2398.
MCDEVITT, H. O. Discovering the role of the major histocompatibilit y complex
in the immune response. Annu Rev Immunol 2000. 18 1-17.
MCMICHAEL, A. J. e JONES, E. Y. Genetics. First-class control of HIV-1. Science
2010. 330 (6010):1488-1490.
100
MIGUELES, S. A. et al. Lytic granule loading of CD8+ T cells is required f or HIV-
infected cell elimination associated with immune co ntrol. Immunity 2008. 29
(6):1009-1021.
MIGUELES, S. A. et al. HLA B*5701 is highly associated with restriction of virus
replication in a subgroup of HIV-infected long term nonprogressors. Proc Natl
Acad Sci U S A 2000. 97 (6):2709-2714.
MOORE, C. B. et al. Evidence of HIV-1 adaptation to HLA-restricted immu ne
responses at a population level. Science 2002. 296 (5572):1439-1443.
MORGADO, M. G. et al. V3 region polymorphisms in HIV-1 from Brazil:
prevalence of subtype B strains divergent from Nort h American/European
prototype and detection of subtype F. AIDS Res Hum Retroviruses 1994. 10
(5):569-576.
NEEFJES, J. et al. Towards a systems understanding of MHC class I and MHC
class II antigen presentation. Nat Rev Immunol 2011. 11 (12):823-836.
NIE, Z. et al. The putative alpha helix 2 of human immunodeficienc y virus type 1
Vpr contains a determinant which is responsible for the nuclear translocation
of proviral DNA in growth-arrested cells. J Virol 1998. 72 (5):4104-4115.
NOVITSKY, V. et al. Association between virus-specific T-cell responses and
plasma viral load in human immunodeficiency virus t ype 1 subtype C infection.
J Virol 2003. 77 (2):882-890.
NUNES, E. et al. Definitions of histocompatibility typing terms. Blood 2011a. 118
(23):e180-183.
NUNES, J. M. et al. Allele frequency estimation from ambiguous data: us ing
resampling schema in validating frequency estimates and in selective
neutrality testing. Hum Biol 2011b. 83 (3):437-447.
OTTINGER, H. D. et al. Hematopoietic stem cell transplantation: contrastin g the
outcome of transplantations from HLA-identical sibl ings, partially HLA-
101
mismatched related donors, and HLA-matched unrelate d donors. Blood 2003.
102 (3):1131-1137.
PAMER, E. e CRESSWELL, P. Mechanisms of MHC class I--restricted antigen
processing. Annu Rev Immunol 1998. 16 323-358.
PARHAM, P. Structure of class-I MHC molecules: HLA-B27 and dis ease. Scand
J Rheumatol Suppl 1990. 87 11-20.
PARHAM, P. MHC class I molecules and KIRs in human history, he alth and
survival. Nat Rev Immunol 2005. 5 (3):201-214.
PASSAES, C. P. et al. Genetic characterization of HIV-1 BC recombinants a nd
evolutionary history of the CRF31_BC in Southern Br azil. Infect Genet Evol
2009. 9 (4):474-482.
PELAK, K. et al. Host determinants of HIV-1 control in African Ameri cans. J
Infect Dis 2010. 201 (8):1141-1149.
PEREYRA, F. et al. The major genetic determinants of HIV-1 control aff ect HLA
class I peptide presentation. Science 2010. 330 (6010):1551-1557.
PETERSON, T. A. et al. HLA class I associations with rates of HIV-1
seroconversion and disease progression in the Pumwa ni Sex Worker Cohort.
Tissue Antigens 2013. 81 (2):93-107.
PETRUCCI, A. et al. How many HIV-infected individuals may be defined as long-
term nonprogressors? A report from the Italian Sero conversion Study. Italian
Seroconversion Study Group (ISS). J Acquir Immune Defic Syndr Hum Retrovirol
1997. 14 (3):243-248.
PLANTIER, J. C. et al. A new human immunodeficiency virus derived from
gorillas. Nat Med 2009. 15 (8):871-872.
POLIZEL, J. R. et al. Association of human leukocyte antigen DQ1 and deng ue
fever in a white Southern Brazilian population. Mem Inst Oswaldo Cruz 2004. 99
(6):559-562.
102
POONIA, B. et al. Role of the Fas/FasL pathway in HIV or SIV disease.
Retrovirology 2009. 6 91.
PORTELA, P. et al. Analysis of KIR gene frequencies and HLA class I ge notypes
in prostate cancer and control group. Int J Immunogenet 2012. 39 (5):423-428.
PRUGNOLLE, F. et al. Pathogen-driven selection and worldwide HLA class I
diversity. Curr Biol 2005. 15 (11):1022-1027.
RATNER, L. Complete nucleotide sequences of functional clones of the AIDS
virus. AIDS Res Hum Retroviruses 1987. 3 (1):57-69.
ROBERTSON, D. L. et al. HIV-1 nomenclature proposal. Science 2000. 288
(5463):55-56.
ROBINSON, J. T. et al. Integrative genomics viewer. Nat Biotechnol 2011. 29
(1):24-26.
SABIN, C. A. e LUNDGREN, J. D. The natural history of HIV infection. Curr Opin
HIV AIDS 2013. 8 (4):311-317.
SABINO, E. C. et al. Identification of human immunodeficiency virus type 1
envelope genes recombinant between subtypes B and F in two
epidemiologically linked individuals from Brazil. J Virol 1994. 68 (10):6340-6346.
SAKSENA, N. K. et al. Elite HIV controllers: myth or reality? AIDS Rev 2007. 9
(4):195-207.
SANABANI, S. S. et al. Characterization and frequency of a newly identifie d HIV-
1 BF1 intersubtype circulating recombinant form in Sao Paulo, Brazil. Virol J
2010. 7 74.
SANTOS, A. F. et al. Epidemiologic and evolutionary trends of HIV-1 CRF3 1_BC-
related strains in southern Brazil. J Acquir Immune Defic Syndr 2007. 45 (3):328-
333.
103
SANTOS, A. F. et al. Characterization of a new circulating recombinant f orm
comprising HIV-1 subtypes C and B in southern Brazi l. AIDS 2006. 20 (16):2011-
2019.
SAÚDE, M. D. Boletim Epidemiológico - Departamento de DST/Aids. 2013
SCHERER, A. et al. Quantifiable cytotoxic T lymphocyte responses and H LA-
related risk of progression to AIDS. Proc Natl Acad Sci U S A 2004. 101
(33):12266-12270.
SETTE, A. e SIDNEY, J. Nine major HLA class I supertypes account for the v ast
preponderance of HLA-A and -B polymorphism. Immunogenetics 1999. 50 (3-
4):201-212.
SHARMA, G. et al. Genetic correlates influencing immunopathogenesis o f HIV
infection. Indian J Med Res 2011. 134 (6):749-768.
SHAW, G. M. e HUNTER, E. HIV transmission. Cold Spring Harb Perspect Med
2012. 2 (11):
SIDNEY, J. et al. HLA class I supertypes: a revised and updated class ification.
BMC Immunol 2008. 9 1.
SILVA, E. M. et al. HLA-Bw4-B*57 and Cw*18 alleles are associated with plasma
viral load modulation in HIV-1 infected individuals in Salvador, Brazil. Braz J
Infect Dis 2010. 14 (5):468-475.
SIMON, V. e HO, D. D. HIV-1 dynamics in vivo: implications for therapy. Nat Rev
Microbiol 2003. 1 (3):181-190.
SINGH, P. et al. Immunogenetic basis of HIV-1 infection, transmissio n and
disease progression. Vaccine 2008. 26 (24):2966-2980.
SKAR, H. et al. Dynamics of two separate but linked HIV-1 CRF01_AE outbreaks
among injection drug users in Stockholm, Sweden, an d Helsinki, Finland. J
Virol 2011. 85 (1):510-518.
104
SOARES, E. A. et al. HIV-1 subtype C dissemination in southern Brazil. AIDS
2005. 19 Suppl 4 S81-86.
SOARES, E. A. et al. Epidemiologic and molecular characterization of hum an
immunodeficiency virus type 1 in southern Brazil. J Acquir Immune Defic Syndr
2003a. 34 (5):520-526.
SOARES, M. A. et al. A specific subtype C of human immunodeficiency viru s
type 1 circulates in Brazil. AIDS 2003b. 17 (1):11-21.
SPIRA, A. I. et al. Cellular targets of infection and route of viral di ssemination
after an intravaginal inoculation of simian immunod eficiency virus into rhesus
macaques. J Exp Med 1996. 183 (1):215-225.
STEIN, B. S. et al. pH-independent HIV entry into CD4-positive T cells via virus
envelope fusion to the plasma membrane. Cell 1987. 49 (5):659-668.
STEPHENS, H. A. HIV-1 diversity versus HLA class I polymorphism. Trends
Immunol 2005. 26 (1):41-47.
STEPHENS, H. A. Immunogenetic surveillance of HIV/AIDS. Infect Genet Evol
2012. 12 (7):1481-1491.
TANG, J. e KASLOW, R. A. The impact of host genetics on HIV infection and
disease progression in the era of highly active ant iretroviral therapy. AIDS
2003. 17 Suppl 4 S51-60.
TEIXEIRA, S. L. et al. Distribution of CCR5 genotypes and HLA Class I B al leles
in HIV-1 infected and uninfected injecting drug use rs from Rio de Janeiro,
Brazil. Infect Genet Evol 2009. 9 (4):638-642.
TOMIYAMA, H. et al. Identification of multiple HIV-1 CTL epitopes prese nted by
HLA-B*5101 molecules. Hum Immunol 1999. 60 (3):177-186.
TRACHTENBERG, E. et al. Advantage of rare HLA supertype in HIV disease
progression. Nat Med 2003. 9 (7):928-935.
TRINCHIERI, G. Biology of natural killer cells. Adv Immunol 1989. 47 187-376.
105
UNAIDS Global Reports - UNAIDS report on the global AIDS e pidemic 2013.
2013
VARMUS, H. Regulation of HIV and HTLV gene expression. Genes Dev 1988. 2
(9):1055-1062.
VYAS, J. M. et al. The known unknowns of antigen processing and
presentation. Nat Rev Immunol 2008. 8 (8):607-618.
WAIN-HOBSON, S. et al. Nucleotide sequence of the AIDS virus, LAV. Cell 1985.
40 (1):9-17.
WANG, C. et al. High-throughput, high-fidelity HLA genotyping with deep
sequencing. Proc Natl Acad Sci U S A 2012. 109 (22):8676-8681.
XIE, J. et al. Beta 2-microglobulin as a negative regulator of the immune
system: high concentrations of the protein inhibit in vitro generation of
functional dendritic cells. Blood 2003. 101 (10):4005-4012.
ZERBINO, D. R. e BIRNEY, E. Velvet: algorithms for de novo short read
assembly using de Bruijn graphs. Genome Res 2008. 18 (5):821-829.
ZHANG, S. et al. Structural basis of cross-allele presentation by HL A-A*0301
and HLA-A*1101 revealed by two HIV-derived peptide complexes. Mol Immunol
2011. 49 (1-2):395-401.
ZINKERNAGEL, R. M. Cellular immune recognition and the biological role of
major transplantation antigens. Biosci Rep 1997. 17 (2):91-111.
ZIPETO, D. e BERETTA, A. HLA-C and HIV-1: friends or foes? Retrovirology 2012.
9 39.
106
9 - ANEXO
107
108
109
110
111