ministério da saúde instituto nacional de câncer ... · minha felicidade e tristezas as suas....

111
INSTITUTO NACIONAL DE CÂNCER PÓS-GRADUAÇÃO EM ONCOLOGIA Isabel Maria Prellwitz DETERMINAÇÃO DO ANTÍGENO LEUCOCITÁRIO HUMANO (HLA) A, B E C POR SEQUENCIAMENTO DE NOVA GERAÇÃO EM INDIVÍDUOS INFECTADOS PELO HIV-1 DOS SUBTIPOS B, C E RECOMBINANTES NO SUL DO BRASIL Orientador (es): Dra. Esmeralda Augusta Jardim Machado Soares Prof. Dr. Marcelo Alves Soares RIO DE JANEIRO 2014 Ministério da Saúde Instituto Nacional de Câncer Coordenação de Pós-graduação Stricto sensu

Upload: vannhu

Post on 13-Jan-2019

218 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

INSTITUTO NACIONAL DE CÂNCER PÓS-GRADUAÇÃO EM ONCOLOGIA

Isabel Maria Prellwitz

DETERMINAÇÃO DO ANTÍGENO LEUCOCITÁRIO HUMANO (HLA) A, B E C POR

SEQUENCIAMENTO DE NOVA GERAÇÃO EM INDIVÍDUOS INFECTADOS PELO

HIV-1 DOS SUBTIPOS B, C E RECOMBINANTES NO SUL DO BRASIL

Orientador (es): Dra. Esmeralda Augusta Jardim Machado Soares

Prof. Dr. Marcelo Alves Soares

RIO DE JANEIRO

2014

Ministério da Saúde Instituto Nacional de Câncer Coordenação de Pós-graduação Stricto sensu

Page 2: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

ii

INSTITUTO NACIONAL DE CÂNCER Pós-Graduação em Oncologia

ISABEL MARIA PRELLWITZ

Determinação do Antígeno Leucocitário Humano (HLA) A, B e C por Sequenciamento de Nova Geração em indivíduos infectados pelo HIV-1 dos subtipos B, C e recombinantes no sul do Brasil

Dissertação apresentada ao Instituto Nacional de Câncer como parte dos requisitos para obtenção do título de Mestre em Oncologia

Orientador (es): Dra. Esmeralda Augusta Jardim Machado Soares

Prof. Dr. Marcelo Alves Soares

RIO DE JANEIRO

2014

Ministério da Saúde Instituto Nacional de Câncer Coordenação de Pós-graduação Stricto sensu

Page 3: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

iii

INSTITUTO NACIONAL DE CÂNCER

Pós-Graduação em Oncologia

AUTOR: Isabel Maria Prellwitz

DETERMINAÇÃO DO ANTÍGENO LEUCOCITÁRIO HUMANO (HLA) A, B E C

POR SEQUENCIAMENTO DE NOVA GERAÇÃO EM INDIVÍDUOS IN FECTADOS

PELO HIV-1 DOS SUBTIPOS B, C E RECOMBINANTES NO SUL DO BRASIL

ORIENTADOR (ES): Dra. Esmeralda Augusta Jardim Mach ado Soares Prof. Dr. Marcelo Alves Soares Aprovada em: 27 / 03 / 2014 EXAMINADORES: Prof. Dr. Luiz Claudio Santos Thuler Prof. Dra. Mariza Gonçalvez Morgado Prof. Dr. Gonzalo José Bello Bentancor Prof. Dra. – Miriam Bianchi de Frontin Werneck Prof. Dra. – Elizabeth Machado

RIO DE JANEIRO

2014

Ministério da Saúde Instituto Nacional de Câncer Coordenação de Pós-graduação Stricto sensu

Page 4: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

iv

DEDICATÓRIA

A amiga Juliana.

Page 5: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

v

AGRADECIMENTOS

Aos pacientes que se prontificaram a participar do estudo.

À Dra. Esmeralda, pelo apoio, confiança, carinho e principalmente pela sua

orientação por todos esses anos. Essa oportunidade foi essencial para o meu

crescimento pessoal e profissional. Obrigada por acreditar que eu poderia ir tão

longe.

Ao Dr. Marcelo, por toda a ajuda e ensinamento. Sempre disposto a encontrar

um tempinho, nem que de madrugada, para corrigir e orientar. Obrigada pela

motivação, mesmo que em forma de bronca, que me fez querer fazer sempre

melhor.

À Brunna que mais uma vez dividiu cada momento comigo, cada PCR e

biblioteca. Divide comigo até hoje o dia a dia e uma amizade para a vida toda. Sou

imensamente grata por toda a ajuda e paciência, mas principalmente por aceitar

compartilhar comigo tantos projetos e tantos sonhos.

À Juliana, a quem dedico esta dissertação com muito orgulho e gratidão. O

seu papel na minha vida passa da dissertação, vai além de uma ajuda com as

dificuldades do projeto e com certeza não ficou apenas no trabalho. Seja como uma

irmã mais velha dando o bom exemplo, protegendo, dando puxão de orelha, mas

também como uma amiga leal e meiga, você foi a maior responsável pela minha

perseverança. Agradeço do fundo do meu coração por toda a sua dedicação e

amizade.

À Carol por ter me ensinado com toda a paciência do mundo e da forma mais

didática e criativa uma técnica nova e confusa para mim. Foi você quem ‘’illuminou’’

tudo nesse projeto! Não faltaram sorrisos juntos às explicações e auxílios aos meus

pedidos de socorro, e a isso eu só tenho a agradecer. Obrigada por todos os

ensinamentos e toda a boa vontade.

Às meninas do laboratório (Livinha, Mari, Adriana, Sabrina, Val e Fabi) que

riram comigo, conversaram e principalmente me apoiaram em todos os momentos

confusos e que só nós sabemos quantos momentos desses tivemos ao longo

desses dois anos. Mas o mais importante, tenho que agradecer a ajuda em todos os

experimentos, bibliotecas, géis e quantificações. O trabalho em equipe é tão

incrivelmente eficiente porque a equipe é composta por amigas, e vocês são as

melhores que alguém poderia ter.

Page 6: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

vi

Ao Dr. Hector, pelo espaço cedido no laboratório e aos pesquisadores e

funcionários do laboratório de genética, por toda ajuda e pela manutenção da ordem

no laboratório.

Ao INCA, CNPq e à FAPERJ, pelo apoio financeiro.

Ao Francisco, meu potinho sem fim de amor e paciência. A essa altura já

sabe o que é um sequenciamento de nova geração e fica revoltado junto comigo

com as montagens de novo que não dão certo. E tudo isso porque você faz da

minha felicidade e tristezas as suas. Obrigada por me apoiar sempre.

À minha família enorme e unida que não me deixa desistir e sempre me

incentiva a querer fazer o melhor de mim e o melhor para mim. Dedico com muito

carinho mais uma etapa da minha vida na qual vocês participaram e me apoiaram.

Page 7: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

vii

“O que faz andar o barco

não é a vela enfunada, mas

o vento que não se vê.”

Platão.

Page 8: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

viii

DETERMINAÇÃO DO ANTÍGENO LEUCOCITÁRIO HUMANO (HLA) A, B E C POR SEQUENCIAMENTO DE NOVA GERAÇÃO EM INDIVÍDUOS IN FECTADOS

PELO HIV-1 DOS SUBTIPOS B, C E RECOMBINANTES NO SUL DO BRASIL

RESUMO DISSERTAÇÃO DE MESTRADO

Isabel Maria Prellwitz O sistema HLA (antígeno leucocitário humano) desempenha um importante papel

regulador da resposta imune. Os genes dos HLA clássicos A, B e C estão envolvidos na imunidade mediada por células T citotóxicas controlando a viremia do HIV-1. Estudos demonstram que alelos como B*35 e B*53 levam a um rápido desenvolvimento para a aids, enquanto que alelos “protetores” do hospedeiro como o HLA-B*27 e B*57 estão associados com o controle imune da infecção e progressão mais lenta. O sequenciamento de nova geração (NGS) possibilita resolver a ambiguidade de genótipos, causada pelo enorme número de polimorfismos existente, e alcançar uma tipagem de alta resolução. Existem poucos trabalhos publicados que abordam essa metodologia para tipagem do HLA, sendo que a análise e manipulação dos dados gerados por NGS ainda é bastante difícil. Logo, estudar características genéticas tanto virais quanto do hospedeiro na epidemiologia de HIV/aids no sul do Brasil é importante por ela ser diferenciada do resto do Brasil, com predomínio do subtipo C. Nosso projeto pretende determinar os alelos do HLA classe I (A, B e C) por NGS, avaliando diferentes metodologias de montagem e reconstrução de alelos, bem como associar com parâmetros epidemiológicos, clínicos e laboratoriais de pacientes HIV+ no sul do Brasil.Os pacientes que participam do estudo são HIV+ acompanhados no ambulatório de HIV/Aids do Hospital das Clínicas de Porto Alegre. O DNA genômico dos pacientes foi extraído e os genes de HLA-A, B e C foram amplificados por PCR. As bibliotecas foram feitas com kit Nextera DNA Sample Preparation e sequenciadas na plataforma Illumina HiSeq 2500. Os reads gerados foram analisados no programa FastQC e em seguida trimados no programa Sickle-Master. Foram testados diferentes programas baseados em diferentes algoritmos para a reconstrução e tipagem dos alelos. Já foram amplificados os HLA-A, B e C de 158 pacientes e desses, 86 (54%) já tiveram suas bibliotecas preparadas e sequenciadas. Oitenta e uma amostras tiveram seus dados analisados no programa FastQC e trimadas no programa Sickle-Master. Três amostras foram testadas para montagem de novo utilizando o programa Velvet e montagem com referência ao programa Bwa. Por outro lado, o programa Omixon Target foi utilizado para tipagem dos alelos com base no banco de dados IMGT/HLA. Com efeito, o alinhamento de novo realizado pelo programa Velvet não atingiu o objetivo de montagem de alelos de HLA-A, B e C. Nossos resultados de tipagem mostraram-se semelhantes à literatura, e os alelos mais frequentes foram os A*02:01:01, A*24:02:01:01, B*51:01:01, C*07:01:01:01 e C*02:02:02. Os dados de carga viral, antes e após o tratamento, relacionados aos alelos determinados para cada paciente, mostraram algumas associações estatisticamente significantes. Cabe destacar a associação do alelo B*51:01:01 e supertipo B62 com pacientes de menor carga viral, o que indica uma associação de proteção já relatada antes na literatura. Em conclusão à análise empreendida, é possível afirmar que os estudos dos alelos de HLA em pacientes infectados pelos subtipos B e C, levando-se em consideração o contexto étnico e genético como o da região sul do Brasil, são relevantes para o melhor entendimento dos fatores genéticos do hospedeiro que respondem à esta infecção viral.

Ministério da Saúde INSTITUTO NACIONAL DE CÂNCER COORDENAÇÃO DE PÓS-GRADUAÇÃO Stricto sensu

Page 9: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

ix

DETERMINATION OF HUMAN LEUKOCYTE ANTIGEN (HLA) A, B AND C BY NEXT GENERATION SEQUENCING IN INDIVIDUALS INFECTED WITH HIV-1

SUBTYPES B, C AND RECOMBINANT BC IN SOUTHERN BRAZIL .

ABSTRACT DISSERTAÇÃO DE MESTRADO

Isabel Maria Prellwitz The HLA (human leukocyte antigen) system plays an important regulatory role in the

immune response. The classical HLA genes A, B and C, are involved in T cell mediated cytotoxic immunity controlling HIV-1 viremia. Studies show that alleles B*35 and B*53 lead to a rapid development to AIDS, whereas "protectors" alleles of the host as B*27 and B*57 are associated with immune control of infection and slower progression. The next-generation sequencing (NGS) enables resolve the ambiguity of genotypes caused by the large number of existing polymorphisms, and achieve a high-resolution typing. There are only few published studies addressing this methodology for HLA typing, and the analysis and manipulation of data generated by NGS is still quite difficult. Study genetic characteristics, both viral and the host, in the epidemiology of HIV/AIDS in southern Brazil is important for it to be differentiated from the rest of Brazil, with a predominance of subtype C. Our project aims to determine the alleles of HLA class I (A, B and C) by NGS, evaluating different methodologies for assembly and reconstruction of alleles, and associate with epidemiological, clinical and laboratory parameters of HIV+ patients in southern Brasil. The patients participating in the study are HIV+ followed in HIV/AIDS ambulatory at Hospital das Clínicas de Porto Alegre. The patients' genomic DNA was extracted and the genes HLA-A, B and C were amplified by PCR. The libraries were made with Sample Preparation Nextera DNA kit and sequenced in Illumina HiSeq 2500 platform. The reads generated were analyzed in FastQC program and then trimmed in Sickle -Master program. Different programs based on different algorithms for reconstruction and typing of alleles were tested. Have been amplified HLA-A, B and C of 158 patients and of these, 86 already had their libraries prepared and sequenced. Eighty-one samples had their data analyzed in FastQC program and trimmed in Sickle -Master program. Three samples were tested again for assembly using the assembly program Velvet, and with reference to BWA program. The Omixon-Target program was used for typing the alleles based on the IMGT/HLA database. The de novo assembly performed by Velvet has not reached the target alleles HLA-A, B and C. Our data results showed alleles typing similar to literature, and the most frequent alleles were A*02:01:01, A*24:02:01:01, B* 51:01:01, C*07:01:01:01 and C*02:02:02. The data for viral load counts before and after treatment, related to certain alleles for each patient showed some statistically significant associations. We highlight the association of patients allele B*51:01:01 and B62 supertype with lower viral load indicating a protective association that has been reported before in the literature. Studies of HLA in patients infected with subtypes B and C in an ethnic and genetic background as the southern region of Brazil, are relevant for a better understanding of host genetic factors that respond to this viral infection.

Ministério da Saúde Instituto Nacional de Câncer Coordenação de Pós-graduação Stricto sensu

Page 10: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

x

SUMÁRIO

ÍNDICE DE FIGURAS...................................................................................... xii

ÍNDICE DE TABELAS.................................................................................... xiv

LISTA DE ABREVIATURAS ..........................................................................xv

1. INTRODUÇÃO.......................................................................................17

1.1 Epidemiologia da infecção pelo HIV e aids..............................................17

1.2 História natural da infecção pelo HIV.....................................................18

1.3 Partícula viral e estrutura genômica do HIV.............................................20

1.4 Ciclo replicativo do HIV e tratamento antirretroviral ................................21

1.5 Diversidade genética do HIV..................................................................23

1.6 O Complexo MHC e Sistema HLA.........................................................25

1.7 HLA classe I........................................................................................26

1.8 HLA classe II e III................................................................................29

1.9 Processamento e Apresentação de antígenos via HLA classe I...................30

1.10 Nomeclatura do sistema HLA.............................................................31

1.11 Polimorfismos do HLA......................................................................32

1.12 Função do HLA classe I e associação com sistema imune e doenças.......34

1.13 Papel do HLA na infecção pelo HIV....................................................35

1.14 Tipagem do HLA por sequenciamento de nova geração (NGS)...............38

2. JUSTIFICATIVA DO PROJETO..............................................................40

3. OBJETIVO .............................................................................................40

3.1 Objetivos específicos.............................................................................40

4. MATERIAL E MÉTODOS.......................................................................41

4.1 Casuística.............................................................................................41

4.2 Extração do DNA genômico...................................................................41

4.3 Amplificação de regiões do genoma viral do HIV-1..................................42

Page 11: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

xi

4.4 Purificação dos produtos positivos..........................................................45

4.5 Sequenciamento de sanger.....................................................................46

4.6 Edição e alinhamento das sequencias......................................................47

4.7 Análises filogenéticas e classificação do subtipo viral ...............................47

4.8 Amplificação das regiões genômicas HLA-A, B e C.................................48

4.9 Quantificação e concentração.................................................................50

4.10 Preparação da biblioteca.....................................................................50

4.11 Controle de qualidade das bibliotecas..................................................52

4.12 Quantificação da biblioteca.................................................................53

4.13 Sequenciamento na plataforma ILLUMINA HISEQ 2500......................53

4.14 Análise da qualidade dos reads e filtragem...........................................54

4.15 Montagem de novo ............................................................................55

4.16 Montagem com referência..................................................................57

4.17 Tipagem dos alelos de HLA................................................................58

4.18 Análises estatísticas...........................................................................58

5 RESULTADOS...........................................................................................58

5.1 Construção das bibliotecas.....................................................................59

5.2 Análise por FASTQC e filtragem............................................................59

5.3 Montagem de novo................................................................................62

5.4 Montagem com referência......................................................................62

5.5 Tipagem do HLA pelo software Omixon-Target.......................................64

5.6 Prevalência dos subtipos e perfil epidemiológico dos pacientes HIV+ .........70

5.7 Correlação dos alelos do HLA com os dados clínicos e subtipos do HIV-1..71

6 DISCUSSÃO..............................................................................................78

7 CONCLUSÕES..........................................................................................89

8 REFERÊNCIAS BIBLIOGRÁFICAS...........................................................91

9 ANEXO ...................................................................................................106

Page 12: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

xii

ÍNDICE DE FIGURAS

Figura 1.2.1 História natural da infecção pelo HIV em adultos...............................19

Figura 1.3.1. Partícula viral e organização genômica do HIV-1..............................21

Figura 1.4.1. Ciclo replicativo do HIV-1 e atuação das classes de inibidores............23

Figura 1.6.1. Mapa da região HLA, banda 6p21.3 do cromossomo 6.......................26

Figura 1.7.1. Fenda de ligação a peptídeo da molécula HLA classe I.......................27

Figura 1.7.2. Representação da fenda de ligação a peptídeo das moléculas de HLA

classe I........................................................................................................................28

Figura 1.8.1. Estrutura das moléculas de HLA classe I e II.....................................29

Figura 1.10.1. Nomeclatura do Sistema HLA.......................................................32

Figura 4.3.1. Representação dos esquemas de amplificação das regiões do genoma

viral do HIV-1.............................................................................................................43

Figura 4.8.1. Representação esquemática da posição dos iniciadores sentido senso e

antissenso utilizados para a amplificação no HLA-A, B e C.............................................48

Figura 4.10.1. Representação esquemática das etapas de preparação das bibliotecas de

DNA pelo kit Nextera DNA Sample Preparations ...........................................................51

Figura 5.2.1. Exemplo de gráfico de qualidade dos reads por posição nucleotídica

gerado pelo programa FastQC da amostra 349.................................................................61

Figura 5.4.1. Exemplo de reconstrução dos genes HLA-A, B e C da amostra 181.....63

Figura 5.5.1. Alelos de HLA-A encontrados na casuística......................................64

Figura 5.5.2. Alelos de HLA-B encontrados na casuística......................................65

Figura 5.5.3. Alelos de HLA-C encontrados na casuística......................................65

Figura 5.5.4. Proporção de heterozigotos e homozigotos encontrada.......................66

Figura 5.5.5. Prevalência dos supertipos do HLA-A na casuística estudada..............66

Page 13: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

xiii

Figura 5.5.6. Prevalência dos supertipos do HLA-B na casuística estudada..............67

Figura 5.5.7. Alinhamento das amostras com dúvida entre os alelos A*:01:01:01 e

A*01:11N pelo programa Bwa e visualizado pelo IGV....................................................69

Page 14: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

xiv

ÍNDICE DE TABELAS

Tabela 4.3.1. Iniciadores usados para amplificação e sequenciamento da região

genômica do HIV-1 analisada........................................................................................44

Tabela 4.8.1. Iniciadores para amplificação dos éxons 1 ao 6 dos HLA-A, B e C......49

Tabela 5.6.1. Dados clínico-epidemiológicos obtidos dos prontuários dos 81 pacientes

tipados para o HLA-A, B e C neste estudo......................................................................71

Tabela 5.7.1. Associações dos alelos de HLA-A, B e C com os dados de carga viral

dos pacientes, antes e após o início do tratamento............................................................73

Tabela 5.7.2. Associações dos alelos de HLA-A, B e C com os dados de contagem de

célula CD4 dos pacientes, antes e após o início do tratamento...........................................75

Tabela 5.7.3. Associações dos alelos de HLA-A, B e C com o subtipo B dos pacientes

infectados....................................................................................................................76

Tabela 5.7.4. Associações dos alelos de HLA-A, B e C com o subtipo C dos pacientes

infectados....................................................................................................................77

Tabela 5.7.5. Associações dos alelos de HLA-A, B e C com o recombinante BC dos

pacientes infectados.....................................................................................................77

Page 15: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

xv

LISTA DE ABREVIATURAS

AC - Antagonista de CCR5 Aids - Síndrome da Imunodeficiência Adquirida B2m - β2-microglobulina CCR5 – Receptor de quimiocina tipo 5 CD4 – Do inglês cluster of differentiation 4 (Grupamento de diferenciação 4) CD8 – Do inglês cluster of differentiation 8 (Grupamento de diferenciação 8) CDC - Centro de Controle de Doenças dos Estados Unidos cDNA – DNA complementar CRF - Forma Recombinante Circulante CTLs - Linfócito T CD8+ citotóxico CWD – Do inglês common well-documented (alelos bem documentados) CXCR4 – Rreceptor de quimiocina tipo 4 DNA – Ácido desoxirribonucleico dNTP – Trifosfato de desoxiribonucleotídeo DST – Doença sexualmente transmitida ERAP1 – Aminopeptidase do Retículo Endoplasmático gp120 e gp41 – Glicoproteínas virais GzmB - Granzima B HCPA - Hospital de Clínicas de Porto Alegre HIV - Vírus da imunodeficiência humana HLA - Do inglês Human Leukocyte Antigen (Antígeno Leucocitário Humano) IF - Inibidores de fusão IGV – Do inglês Integrative Genomics Viewer IHIW - Do inglês International HLA and Immunogenetics Workshops (Workshops Internacionais de HLA e Imunogenética) II - Inibidores de integrase IMGT/HLA – Do ingles international ImMunoGeneTics information system IN – Inibidores de integrase INCA - Instituto Nacional de Câncer INNTR - Inibidores não-nucleosídicos da transcriptase reversa INTR - Inibidores nucleosídicos da transcriptase reversa IP - Inibidores de protease Kb – Quilobase LTRs - Repetições terminais longas M – Molar mAmp – Miliamperes MgCl2 – Cloreto de magnésio MHC – Do inglês Major Histocompatibility Complex (Complexo Maior/Principal de Histocompatibilidade) mM – Milimolar NaOH – Hidróxido de sódio NCBI – Do inglês National Center for Biotchenology Information

Page 16: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

xvi

NGS – Do inglês Next Generation Sequencing (Sequenciamento de Nova Geração) NK - Células natural killer ŋg – Nanograma ºC – Graus Celsius OMS - Organização Mundial da Saúde Pb – Pares de base PCR - Reação em Cadeia da Polimerase PCR-SSO – Do inglês sequence-specific oligonucleotide probes PCR-SSP – Do inglês sequence-especific primers PR – Protease RE - Retículo Endoplasmático RNA – Ácido ribonucleico RNAm - RNA mensageiro rpm – Rotações por minuto RT - Transcriptase reversa SBT – Do inglês sequence-based typing (Sequenciamento de Sanger) SUS - Sistema Único de Saúde TAP - Proteína transportadora TCRs - Receptores das células T TM – Temperatura de anelamento Tregs - Linfócitos T reguladores U – Unidade UNAIDS –Do inglês, Joint United Nations Programme on HIV/AIDS (Programa das Nações Unidas para HIV/ AIDS) URF - Forma Recombinante Única µL – Microlitro ρmol – Picomolar

Page 17: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

17

1. INTRODUÇÃO

1.1 EPIDEMIOLOGIA DA INFECÇÃO PELO HIV E AIDS

A Síndrome da Imunodeficiência Adquirida (AIDS), tem como agente

etiológico o vírus da imunodeficiência humana (HIV), descoberto em 1983 por

Françoise Barré-Sinousi, Luc Montagnier e colaboradores do Instituto Pasteur de

Paris a partir de linfonodos de um paciente com aids (BARRE-SINOUSSI et al.,

1983).

Atualmente, a aids é considerada uma das maiores pandemias já registrada

na história da humanidade. Segundo dados da UNAIDS, até o fim de 2011, 34

milhões de pessoas convivem com HIV no mundo. A prevalência de adultos

infectados no mundo, de 15 a 49 anos, é de 0,8%. Entretanto, o número de novas

infecções pelo vírus vem diminuindo desde a década de 90, sendo que apenas 2,5

milhões desses mencionados acima representam novos infectados – uma taxa 20%

menor do que a registrada em 2001. Em 39 países, a incidência do HIV teve uma

queda superior a 25% entre 2001 e 2011 (UNAIDS, 2013).

De acordo com o último Boletim Epidemiológico divulgado pelo Departamento

de DST/Aids do Ministério da Saúde (MINISTÉRIO DA SAÚDE, 2013), até o ano de

2012, foram registrados que 718 mil pessoas vivem com HIV/Aids no Brasil e a taxa

de incidência de aids foi de 20,2 casos por 100 mil habitantes. A Região Sul

destaca-se com a maior incidência nesse ano: 30,9/100.000 habitantes, seguida

pela Região Norte (21,0), Região Sudeste (20,1), Região Centro-Oeste (19,5) e

Região Nordeste (14,8). Dentre as Unidades da Federação, destacam-se as maiores

taxas de detecção de casos de aids no Rio Grande do sul (41,4), Santa Catarina

(33,5), Amazonas (29,2) e Rio de Janeiro (28,7). Entre as capitais brasileiras, Porto

Alegre continua liderando a classificação por taxa de detecção de casos de aids,

ocupando o primeiro lugar desde 2006. Em 2012, as taxas de casos de aids para

cada 100.000 habitantes foram de 93,7 para Porto Alegre e 57,0 para Florianópolis,

em segundo lugar na classificação.

O advento da terapia antirretroviral diminui o risco de transmissão do vírus,

contribuindo substancialmente para a melhoria na qualidade de vida dos pacientes

infectados. O Brasil é, portanto, referência na administração gratuita dos

Page 18: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

18

antirretrovirais pelo Sistema Único de Saúde (SUS), no qual os brasileiros infectados

recebem o tratamento subsidiado pelo governo segundo orientações de tratamento

do Ministério da Saúde (MS).

1.2 HISTÓRIA NATURAL DA INFECÇÃO PELO HIV

O vírus pode ser encontrado em fluidos corporais, sendo transmitido

horizontalmente através da exposição da mucosa a fluidos contaminados

(hemoderivados ou esperma) ou por inoculação (drogas injetáveis) (SPIRA et al.,

1996). Já a transmissão vertical pode ocorrer durante a gestação, parto ou

aleitamento materno (COWAN et al., 1984). O HIV possuiu como células-alvo as que

expressam receptores CD4, como linfócitos T CD4+ do sistema imune do

hospedeiro, macrófagos e células dendríticas.

Após o estabelecimento da infecção, a progressão é caracterizada por três

fases: (i) aguda, (ii) assintomática e (iii) aids,o que pode ser observado na Fig. 1.2.1.

A fase aguda é caracterizada por um pico de viremia e queda drástica dos níveis de

células T CD4+, ocorrendo nas primeiras duas a quatro semanas após a infecção.

Essa fase é geralmente sintomática, porém com sintomas inespecíficos tais como

febre, dor de garganta, exantema, mialgia e mal estar.

Após o pico de viremia, inicia-se a resposta imune contra o vírus promovendo

um equilíbrio dinâmico da carga viral plasmática do HIV onde as taxas de produção

e eliminação viral são similares (HO, 1995). Esse período pode durar até dez anos

em média, porém a destruição progressiva dos tecidos linfóides leva a uma

disfunção imune de linfócitos T CD4+ caracterizando o estágio avançado da doença.

A queda acentuada dos níveis de células T CD4+ implica a susceptibilidade

do indivíduo a infecções oportunistas por bactérias, fungos, vírus, infecções por

protozoários e surgimento de neoplasias. Muitas dessas infecções tornam-se

mortais quando os níveis de células T CD4+ caem abaixo de 200 células por

milímetro cúbico de sangue, o que caracteriza a progressão para aids (SABIN e

LUNDGREN, 2013).

Page 19: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

19

Figura 1.2 .1 História natural da infecção pelo HIV em adultos (extraída de

http://www.obrac.org/aids.htm).

As condições clínicas indicativas como típicas do estágio avançado da aids

foram definidas pelo Centro de Controle de Doenças dos Estados Unidos - CDC,

tendo como base critérios clínicos e imunológicos. Os estágios clínicos são definidos

em: A (assintomático, linfoadenopatia ou infecção aguda), B (sintomáticos –

candidíase, herpes e outros) e C (clínicos de aids – sarcoma de Kaposi, tuberculose

pulmonar e outros). Já os estágios imunológicos são definidos pela contagem de

células CD4+ por milímetro cúbico de sangue e classificados em: 1 (≥500 cel/mm3),

2 (499-200 cel/mm3) e 3 (<200 cel/mm3) (CDC, 1994).

Devido à variabilidade da duração da fase assintomática, vários grupos têm

sido descritos na literatura com características clínicas distintas como os

progressores rápidos, os progressores típicos, não progressores de longo termo e os

controladores de elite.

Os indivíduos considerados progressores rápidos são caracterizados por um

declínio drástico das células T CD4+ e uma evolução para a fase aids dentro de três

anos. Já os progressores típicos evoluem para aids dentro dos 10 anos seguintes à

infecção. Os indivíduos caracterizados como não-progressores de longo termo

desenvolvem uma lenta diminuição das células T CD4+ ao longo do tempo,

mantendo níveis normais por mais de 10 anos na ausência de terapia antirretroviral

(CASADO et al., 2010; PETRUCCI et al., 1997). Há ainda um grupo definido como

Page 20: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

20

“controladores de elite”, caracterizado pela persistência de carga viral indetectável

independente do tempo de infecção (SAKSENA et al., 2007).

1.3 PARTÍCULA VIRAL E ESTRUTURA GENÔMICA DO HIV-1

O HIV é um retrovírus pertencente à família Retroviridae, caracterizada por

possuir a enzima transcriptase reversa que tem por finalidade a retrotranscrição do

RNA viral em uma dupla fita de cDNA, durante a entrada do vírus na célula

hospedeira, e ao gênero Lentivirus que apresentam progressão de sintomatologia

lenta (COFFIN et al., 1997).

A partícula viral do HIV-1 é uma estrutura esférica composta na sua camada

mais externa por um envelope de natureza glicolipoproteica, com origem na camada

bilipídica da célula hospedeira infectada, durante o brotamento do vírus (GOTO et

al., 1994). Nesta membrana externa são encontradas glicoproteínas virais inseridas

(gp120 e gp41) responsáveis pela ligação do receptor CD4 e correceptores (CCR5 e

CXCR4) presentes na superfície da célula a ser infectada e fusão entre o envelope

viral e a célula hospedeira (CLAPHAM e WEISS, 1997). Interno ao envelope

encontra-se a matriz e em seguida o capsídeo viral que possui no seu interior o

genoma do HIV-1 composto por duas cópias de RNA de polaridade positivas de

aproximadamente 9,5 kb de tamanho (DARLIX et al., 1990; FREED, 2001;

MASSIAH et al., 1996; WAIN-HOBSON et al., 1985).

O genoma é composto por três genes que codificam proteínas essenciais

gag, pol e env, comuns a todos os retrovírus; dois genes, tat e rev, que codificam

proteínas reguladoras; e quatro genes vif, vpr, vpu e nef que codificam proteínas

acessórias. Além disso, como característica comum a todos os retrovírus, o HIV–1

também tem o genoma flanqueado por repetições terminais longas (LTRs) que

constituem o local de iniciação transcricional (VARMUS, 1988).

Três enzimas virais também encontram-se dentro do capsídeo; são elas a

enzima protease (PR), a transcriptase reversa (RT) e a integrase (IN), ambas

codificadas pelo gene pol. Além dessas enzimas também existem proteínas

acessórias Nef, VIf e Vpr dentro do capsídeo, junto ao genoma viral (FRANKEL e

YOUNG, 1998). A organização do genoma e partícula viral podem ser observadas

na Fig. 1.3.1 abaixo.

Page 21: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

21

Figura 1.3 .1. Partícula viral e organização genômica do HIV-1 (modificada de

http://www.liquidarea.com/2009/08/aids-decifrato-genoma-virus).

1.4 CICLO REPLICATIVO DO HIV E TRATAMENTO ANTIRRETROVIRAL

O HIV tem como célula hospedeira alvo aquelas que expressam o receptor

CD4 em sua superfície. O ciclo replicativo do HIV, exemplificado na Figura 1.4.1, se

inicia com a ligação específica da glicoproteina viral gp120 à molécula de CD4 da

célula alvo e a ligação aos co-receptores de quimiocina CCR5 e CXCR4

promovendo a adesão do vírus à superfície celular (BERGAMASCHI e PANCINO,

2010; DALGLEISH et al., 1984). Como consequência tem-se a internalização do

capsídeo viral no citoplasma celular e a liberação do material genético viral que se

direciona para o núcleo (NIE et al., 1998; STEIN et al., 1987). Durante esse

processo ocorre a transcrição reversa do RNA viral em uma fita dupla de DNA

complementar pela enzima RT. Uma vez terminada a transcrição reversa, ocorre a

integração do DNA proviral ao genoma do hospedeiro pela ação da proteína IN,

onde ele servirá de molde para a transcrição dos genes virais (BOWERMAN et al.,

1989).

Page 22: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

22

Com o término dessa fase inicial do ciclo replicativo viral, inicia-se a fase

tardia com a transcrição do DNA viral integrado, originando os RNAs mensageiros.

São formadas pela tradução do RNAm no citoplasma as poliproteínas Gag, Gag-Pol

e Env e as proteínas acessórias Vif, Vpr, Vpu, Nef, Tat e Rev. Duas fitas de RNA

não processadas são transportadas para os sítios de montagem das partículas

virais, abaixo da superfície interna da membrana celular. Os vírions brotam da célula

carregando com ele uma bicamada lipídica da membrana celular da célula

hospedeira, que constituirá em seu envoltório. Após o brotamento, a protease cliva

as poliproteínas virais Gag e Gag-Pol dando origem às enzimas e proteínas

estruturais e finalmente tornando o vírus maduro e infectivo (CANN e KARN, 1989).

O controle efetivo da replicação viral é possível através de diferentes

medicamentos, que tem como alvo bloquear etapas importantes do ciclo replicativo

viral, a fim de suprimir a replicação viral a níveis indetectáveis pelos métodos mais

sensíveis e reduzir a mortalidade e a morbidade causadas pela aids. Existem seis

classes de drogas antirretrovirais: inibidores nucleosídicos da transcriptase reversa

(INTR), inibidores não-nucleosídicos da transcriptase reversa (INNTR), inibidores de

protease (IP), inibidores de fusão (IF), antagonista de CCR5 (AC) e inibidores de

integrase (II) (Fig. 1.4.1).

Page 23: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

23

Figura 1.4 .1. Ciclo replicativo do HIV-1 e atuação das classes de inibidores no ciclo de vida do HIV

(modificada de SIMON e HO, 2003).

1.5 DIVERSIDADE GENÉTICA DO HIV

Devido à enorme variabilidade genética do HIV em humanos, ele pode ser

classificado em dois tipos: o tipo 1 (HIV-1), mais disseminado pelo mundo e

responsável pela pandemia da aids; e o tipo 2 (HIV-2), menos patogênico e

endêmico na África (HU et al., 1996). Atualmente, é possível classificar o HIV-1 em

quatro grupos filogenéticos distintos: M (do inglês Major), O (do inglês Outlier), N (do

inglês Non-O e Non-M) (ROBERTSON et al., 2000) e recentemente o grupo P

(PLANTIER et al., 2009).

O grupo M é o principal responsável pela pandem podendo ser dividido em

nove subtipos puros: A, B, C, D, F, G, H, J e K (ROBERTSON et al., 2000). A

recombinação entre vírus distintos pode gerar formas recombinantes formadas por

vírus mosaico com dois ou mais subtipos diferentes. Quando uma mesma variante

recombinante é encontrada em três ou mais indivíduos não relacionados

epidemiologicamente, esta variante é chamada de Forma Recombinante Circulante

Page 24: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

24

(CRF). Se o vírus recombinante for encontrado em apenas um indivíduo, ele é

chamado de Forma Recombinante Única (URF). Até 2014, foram descritos 58 CRFs

diferentes de acordo com o Banco de Dados de Sequências de HIV de Los Alamos

(http://www.hiv.lanl.gov/content/sequence/HIV/CRFs/CRFs.html).

A distribuição do HIV-1 é heterogênea, sendo os subtipos C, seguido do A, os

mais prevalentes na epidemia mundial. O subtipo C responde por quase metade

(48%) de todas as infecções globais devido à sua presença na África, onde reside

grande parte da população infectada, na Índia e na China. O subtipo A apresenta

12% de prevalência mundial, estando amplamente difundido na Europa Oriental,

Ásia Central, além de países da África Central e Oriental. Em seguida, o subtipo B,

com 11% de prevalência, é o subtipo mais disseminado no mundo e predominante

nos países ricos, como Estados Unidos, Europa Ocidental, Japão e Austrália.

(HEMELAAR et al., 2011; SHAW e HUNTER, 2012; SKAR et al., 2011).

O Brasil responde por cerca de dois terços das infecções pelo HIV-1 no

continente Sul Americano e sua epidemiologia molecular se destaca com o subtipo B

apresentando maior circulação no país, seguido de outros subtipos, tais como F1, C,

e diversos recombinantes F/B e B/C (BONGERTZ et al., 2000; COUTO-

FERNANDEZ et al., 1999; MORGADO et al., 1994; SABINO et al., 1994; SANABANI

et al., 2010; SOARES et al., 2003a).

Com efeito, a região Sul do Brasil apresenta uma epidemiologia diferenciada

do restante do país devido a uma maior prevalência do subtipo C e recombinantes

B/C (BRINDEIRO et al., 2003; GRAF et al., 2011; PASSAES et al., 2009; SOARES

et al., 2005; SOARES et al., 2003a; SOARES et al., 2003b), observando-se a

presença do CRF 31_BC, provavelmente formado por cepas locais da cidade de

Porto Alegre (SANTOS et al., 2007; SANTOS et al., 2006).

A aparente segregação de subtipos ou recombinantes do HIV-1 em diferentes

regiões geográficas pode estar relacionada ao perfil imunogenético dos grupos

expostos. Frente a esse panorama apresentado vários estudos têm procurado

identificar determinantes genéticos de susceptibilidade e resistência, responsáveis

pela resposta imune ao HIV-1 para um maior entendimento da dinâmica da infecção

viral. E o principal determinante genético já observado é o Sistema HLA.

Page 25: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

25

1.6 O COMPLEXO MHC E SISTEMA HLA

O Complexo Maior/Principal de Histocompatibilidade (MHC, do inglês Major

Histocompatibility Complex) foi descoberto em 1937 por Peter Gorer em estudos

com transplantes de camundongos (GORER e SCHUTZE, 1938). O MHC existe em

todos os vertebrados e é constituído por genes de importantes funções imunológicas

(BJORKMAN et al., 1987b). Mais tarde, em 1958, por meio de um estudo com

transfusões seriadas, Jean Dausset concluiu que pessoas submetidas a transfusões

sanguíneas são capazes de aglutinar leucócitos de outras pessoas, descobrindo

assim o primeiro antígeno humano, o HLA-A*02, na época denominado MAC

(DAUSSET, 1984). O sistema de Antígeno Leucocitário Humano (HLA, do inglês

Human Leukocyte Antigen) é o correspondente humano do MHC e tem como por

função expor epítopos que são reconhecidos por células T. Esses receptores das

células T (TCRs) reconhecem o contexto específico de ligação não-covalente de

peptídeos antigênicos a moléculas MHC (MCDEVITT, 2000).

O sistema HLA está localizado no braço curto do cromossomo 6 (6p21),

possui aproximadamente 3.600 kilobases de DNA e é constituído por 224 genes,

dos quais 128 são genes funcionais e 96 são pseudogenes. O sistema HLA é

subdividido em três regiões de acordo com a estrutura e função dos seus genes:

HLA de classe I, classe II e classe III como pode ser visto na Fig. 1.6.1 (THE MHC

SEQUENCING CONSORTIUM, 1999; APOSTOLOPOULOS et al., 2008; BECK e

TROWSDALE, 2000).

Page 26: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

26

Figura 1.6 .1. Mapa da região HLA, banda 6p21.3 do cromossomo 6 (Retirada de http://e-

gastroped.com.br/jun05/cel02.jpg).

1.7 HLA CLASSE I

A região de classe I contém os genes clássicos (HLA-A, HLA-B e HLA-C) e

não clássicos (HLA-E, HLA-F e HLA-G), localizados na porção mais telomérica do

sistema HLA e expressos na superfície da maioria das células nucleadas. (CHOO,

2007). Esses genes codificam para a formação da cadeia polipeptídica pesada alfa

que está ligada não covalentemente na porção extracelular com β2-microglobulina

(B2m). Em humanos, B2m é invariável e seu gene está localizado no cromossomo

15 (BJORKMAN e PARHAM, 1990; THE MHC SEQUENCING CONSORTIUM,

1999).

A cadeia alfa das moléculas de classe I possui três domínios extracelulares

(a1, a2, a3), uma região transmembranar e um domínio citoplasmático que podem

ser exemplificados na Fig. 1.7.1 Por um lado, os domínios a1 e a2 contêm variações

na sequência de aminoácidos, sendo altamente polimórfica, e esses domínios

determinam a especificidade antigênica das moléculas de HLA classe I. O domínio

Page 27: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

27

a3 é altamente conservado e sitio de ligação para o CD8. Os domínios a3 e B2m

juntos formam um domínio constante (BJORKMAN et al., 1987b). Por outro lado, o

domínio transmembranar é formado por aminoácidos hidrofóbicos e o domínio

citoplasmático contém sítios para fosforilação de proteínas e ligação com o

citoesqueleto celular (PARHAM, 1990).

Os domínios a1 e a2 da cadeia alfa formam uma estrutura única chamada

fenda de apresentação de peptídeo, que é o sítio de ligação para antígenos

peptídicos. Essa estrutura consiste em uma plataforma de oito folhas β-pregueadas

antiparalelas, formando o assoalho da fenda, e duas α-hélices paralelas opostas no

topo da plataforma que pode ser observada na Fig. 1.7.1. Na fenda se ligam

peptídeos processados de 8 a 10 resíduos de aminoácidos (BJORKMAN et al.,

1987a; KLEIN e SATO, 2000a).

Figura 1.7 .1. Fenda de ligação a peptídeo da molécula HLA classe I (Retirada de

http://www.ufpe.br/biolmol/Aula-Imunogenetica/aula-imuno-05.htm).

A fenda de ligação está estruturada em várias subcavidades denominadas

pockets (bolsos) que variam na sua constituição de aminoácidos, conferindo a

especificidade na ligação a diferentes peptídeos, como pode ser observado na

Figura 1.7.2. Dessa forma, diferentes peptídeos se ligam a diferentes moléculas de

HLA, desde que certos aminoácidos específicos estejam presentes por serem

Page 28: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

28

necessários para a ancoragem na fenda. Os pockets B e F são os mais importantes,

pois interagem com as cadeias laterais dos resíduos P2 e P9 do peptídeo

funcionando como âncoras e determinando o tipo de peptídeo que se ligar à

molécula de HLA (KLEIN e SATO, 2000a).

Figura 1.7 .2. Representação da fenda de ligação a peptídeo das moléculas de HLA classe I

(Modificada de KLEIN e SATO, 2000a).

Os genes que codificam a cadeia alfa das moléculas HLA de classe I

apresentam uma estrutura característica, na qual cada éxon é responsável por

codificar cada um dos domínios do polipeptídeo. O peptídeo líder é codificado pelo

exon1, os domínios extracelulares a1, a2 e a3, são codificados pelos éxons 2 (343

pb), 3 (274 pb) e 4 (276 pb), respectivamente; o segmento transmembranar pelo

éxon 5 e a cauda citoplasmática pelos éxons 6 e 7. A região 3´ não traduzida faz

parte do éxon 8. A sequência total de éxons 1 a 8 consiste em 1089-1101

nucleotídeos, e codificam para um polipeptídio de 362 - 366 aminoácidos (MARSH,

2000).

Page 29: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

29

1.8 HLA CLASSE II E III

A região de classe II consiste em uma série de subregiões (DR, DQ, DP, DM

e DO), cada uma contendo genes A e B que codificam cadeias alfa e beta

respectivamente (BJORKMAN e PARHAM, 1990). Os genes classe II localizam-se

na região mais centromérica do Sistema HLA e se expressam nas células

apresentadoras de antígenos (monócitos, macrófagos e células dendriticas),

linfócitos B e linfócitos T ativados (CHOO, 2007).

Estes receptores membranares são constituídos por uma porção extracelular,

uma região transmembranar e um segmento citoplasmático como pode ser

observada na Fig. 1.8.1 (DOHERTY e ZINKERNAGEL, 1975). A região extracelular

é formada pelos domínios a1 e b1, região altamente polimórfica de ligação de

peptídeos, e domínios a2 e b2, região altamente conservada de ligação ao CD4.

Diferentemente das moléculas de classe I, a fenda de ligação de peptídeos se

associa a peptídeos de 13-25 aminoácidos, sendo que alguns aminoácidos do

peptídeo podem se ligar a partes externas da fenda (GATTI e PIERRE, 2003; KLEIN

e SATO, 2000a).

Figura 1.8 .1. Estrutura das moléculas de HLA classe I e II (Retirada de

http://www.elsevierimages.com/image/25928.htm).

Page 30: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

30

A região classe III do sistema HLA localiza-se entre os genes classe I e classe

II e, apesar de não ser tão polimórfico como estes últimos, constitui o segmento do

genoma humano com maior densidade de genes (XIE et al., 2003). Ao contrário da

região classe I e classe II onde existem dezenas de pseudogenes, a região classe III

possui apenas dois (THE MHC SEQUENCING CONSORTIUM, 1999). A região da

classe III não codifica moléculas de HLA, mas contém genes para componentes do

complemento (C2, C4, fator B), 21-hidroxilase, fator de necrose tumoral entre outros

(BECK e TROWSDALE, 2000). Os genes classes III do sistema HLA possuem várias

funções, destacando-se o seu papel na codificação de proteínas solúveis

importantes na modelação e regulação da resposta imunitária (XIE et al., 2003).

1.9 PROCESSAMENTO E APRESENTAÇÃO DE ANTÍGENOS VIA HLA

CLASSE I

O complexo peptídeo-HLA classe I da superfície celular é reconhecido por

receptores de linfócitos T CD8+, enquanto que o complexo peptídeo - HLA classe II

é reconhecido por receptores de linfócitos T CD4+ (PAMER e CRESSWELL, 1998).

A natureza e origem dos peptídeos que vão se ligar a moléculas de Classe I ou II

são diferentes (ENGELHARD, 1994). Moléculas HLA Classe I se associam a

antígenos endógenos sintetizados pela célula alvo (exemplo: proteínas celulares ou

induzidas por vírus), enquanto que HLA classe II à antígenos exógenos de

patógenos extracelulares (dentro de vesículas no citoplasma) (VYAS et al., 2008).

Peptídeos de proteínas próprias do hospedeiro e não-próprias podem se

associar às moléculas HLA, sendo que a natureza química da fenda de ligação a

peptídeo determinará quais peptídeos irão se ligar, devido à especificidade dos

aminoácidos dos sítios de ancoragem (VYAS et al., 2008).

A apresentação de antígenos via HLA classe I se inicia com a clivagem de

proteínas pelo proteassoma em fragmentos menores (peptídeos) que por sua vez

são transportados para o Retículo Endoplasmático (RE). O transporte dos peptídeos

para o interior do RE se dá através da proteína transportadora TAP, localizada na

membrana do RE. Após a internalização dos peptídeos, a aminopeptidase ERAP1

realiza uma checagem do tamanho dos peptídeos para garantir que eles poderão se

Page 31: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

31

ligar na fenda de apresentação da molécula de HLA, caso tenham um tamanho

maior, eles serão clivados para 8 a 9 aminoácidos (NEEFJES et al., 2011).

Enquanto isso, a molécula de HLA está sendo produzida com o auxílio das

chaperonas calnexina, calreticulina e tapasina, que acompanham toda a síntese da

molécula e seleção de peptídeo impedindo que ela prossiga caso ocorra algum erro.

As chaperonas se associam a cadeia alfa da molécula de HLA, estabilizando-a até

que a cadeia b-microglobulina seja sintetizada e se ligue a molécula, e até que seja

feita a correta ligação com o peptídeo. Uma vez ligados, o complexo HLA associado

ao peptídeo é encaminhado para o Complexo de Golgi e transportado por vesículas

até a membrana celular para ser expresso na superfície celular e reconhecido por

receptores de células T CD8+ (NEEFJES et al., 2011; VYAS et al., 2008).

1.10 NOMECLATURA DO SISTEMA HLA

A existência da molécula HLA foi aceita muito antes de se conhecer sua

estrutura molecular ou de se compreender amplamente todas as suas funções

biológicas. Inicialmente, a nomeclatura do HLA foi estabelecida e padronizada nos

Workshops Internacionais de HLA e Imunogenética (International HLA and

Immunogenetics Workshops - IHIW) realizados desde 1964 para que os

pesquisadores pudessem comparar suas técnicas e resultados de tipagem de HLA e

comunicar novas descobertas.

Atualmente, ficou estabelecido que os alelos fossem distinguidos por quatro

dígitos, o que difere quanto ao nível proteico. Dígitos adicionais foram adicionados

para polimorfismos encontrados em outras regiões do gene, como regiões intronicas

e promotora, assim como sufixos como o N para alelos nulos, S para secretados e L

para os de baixa expressão (MARSH et al., 2010). A Fig. 1.10.1 exemplifica a

nomeclatura do sistema HLA.

Page 32: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

32

Figura 1.10 .1. Nomeclatura do Sistema HLA (Modificada de hla.alleles.org).

O HLA-B é o alelo mais polimórfico entre os HLA classe I, com 3285 alelos

descritos, seguido do HLA-A com 2579 alelos e do HLA-C com 2133 alelos. Entre os

HLA classe II, o lócus DRB apresenta o maior número de alelos descrito, 1512

alelos, seguido do lócus DQB1 com 509 alelos e do DPB1 com 248 alelos

(IMGT/HLA http://www.ebi.ac.uk/ipd/imgt/hla/stats.html acessado 17/01/2014 as

11:45).

1.11 POLIMORFISMOS DO HLA

O Sistema HLA é conhecido por ser o mais polimórfico em humanos. Os

polimorfismos do HLA não são sempre espalhados pela molécula, mas localizam-se

essencialmente nos éxons 2 e 3, os quais codificam para as estruturas moleculares

do receptor onde se localiza o sítio de ligação a peptídeos (BJORKMAN e PARHAM,

1990; BJORKMAN et al., 1987a; KLEIN e SATO, 2000a; MALISSEN et al., 1982).

Esse número limitado de resíduos de aminoácidos é o responsável pela

especificidade de ligação das moléculas de HLA, uma vez que diferentes moléculas

de HLA apresentam padrões de aminoácidos distintos em sua sequência de ligação

a peptídeos (FALK et al., 1991; GARRETT et al., 1989). Cada molécula de HLA

Page 33: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

33

pode se ligar a diferentes peptídeos através do conceito de ligação de peptídeos

“degenerada”.

Polimorfismos geram mudanças estruturais na fenda de ligação no domínio

extracelular da proteína de HLA classe I. Isso afeta a função biológica das moléculas

de HLA classe I de se ligar e apresentar peptídeos para o receptor antígeno-

específico do linfócito T CD8+ (CTLs) (STEPHENS, 2005). Além disso, existem

grupos de alelos chamados de supertipos, que compartilham preferências

especificas de ligação a pequenos peptídeos antigênicos com tamanho, carga e

composição de aminoácidos similares (SETTE e SIDNEY, 1999; SIDNEY et al.,

2008).

O polimorfismo no sistema HLA parece ter sido selecionado por pressões

evolutivas e muito dessa diversidade surgiu devido a pressões seletivas de

microorganismos. Alguns novos alelos podem se originar por mutações pontuais,

porém muitos são originados por recombinação ou conversão gênica, na qual uma

sequência é substituída em parte por outra de um gene homólogo. A recombinação

entre variantes alélicos de um lócus parece ter sido mais importante do que a

conversão gênica na geração de polimorfismo (PRUGNOLLE et al., 2005). Assim, os

polimorfismos extensos no sistema HLA podem ser considerados como uma marca

histórica da evolução no genoma humano, refletindo o processo de seleção natural

pelos microorganismos agindo no sistema imune adaptativo, levando à

sobrevivência, diversificação e expansão da espécie (STEPHENS, 2012).

Variações extensivas de alelos de HLA classe I e classe II ocorrem em

diferentes grupos étnicos, fazendo com que certos haplótipos sejam encontrados

mais frequentemente em uma população. Este fenômeno se dá devido ao

desequilíbrio de ligação entre os loci do HLA, possibilitando combinações estáveis

de alelos ou haplótipos, que também varia em composição e frequência entre

diferentes grupos étnicos (GONZALEZ-GALARZA et al., 2011; STEPHENS, 2005). O

desequilíbrio de ligação ocorre quando a frequência de dois alelos juntos em um

mesmo haplótipo excede o previsto. Por exemplo, o haplótipo HLA-A1, B8, DR17 é o

mais comum entre caucasianos, com uma frequência de 5% (CHOO, 2007).

Page 34: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

34

1.12 FUNÇÃO DO HLA CLASSE I E ASSOCIAÇÃO COM SISTEMA IMUNE

E DOENÇAS

O HLA desempenha um importante papel na ativação e resposta do sistema

imune à substancias estranhas através da diferenciação entre próprio e não-próprio.

Os genes do HLA classe I estão envolvidos na imunidade mediada por células T

citotóxicas, que é conhecida por ser a resposta primaria contra células infectadas

por vírus (CARRINGTON e O'BRIEN, 2003).

A função do HLA classe I é de apresentar na superfície celular antígenos

próprios e não próprios como os produzidos no interior de células infectadas por

vírus ou oriundos de desenvolvimento tumoral. Essa apresentação alerta células T

CD8+ específicas para o reconhecimento do antígeno apresentado, desenvolvendo

então uma resposta imune adaptativa (ZINKERNAGEL, 1997).

A interação do complexo HLA classe I-antígeno com o receptor TCR da célula

T CD8+ induz a dois caminhos principais para a morte da célula infectada: resposta

independente de grânulos que envolve interação Fas/FasL (POONIA et al., 2009) ou

liberação de grânulos líticos como perforinas e granzima B (GzmB) (MIGUELES et

al., 2008). Essas moléculas alertam também células natural killer (NK) que possuem

uma habilidade inata de reconhecer e destruir células infectadas ou tumorais

(DOHERTY e ZINKERNAGEL, 1975; PARHAM, 2005; TRINCHIERI, 1989).

Células NK são conhecidas por reconhecer a perda de expressão de

moléculas de HLA classe I e destruir células com expressão diminuída de moléculas

de classe I assim como ocorre em tumores e células infectadas por vírus. Outras

células com expressão normal de MHC classe I ainda podem ser alvos de NK se

elas proverem sinais apropriados para ativação de seus receptores. Muitos

receptores de células NK foram identificados e a maioria dos seus ligantes são

moléculas de HLA classe I (CHOO, 2007).

Essa resposta imune gerada pela apresentação de antígenos pelo Sistema

HLA é de extrema importância para o transplante de órgãos e de células tronco

hematopoiéticas. A combinação de alelos de HLA entre doadores e receptores se

faz necessária a fim de evitar a rejeição e doença enxerto versus hospedeiro. Além

disso, a menor expressão de moléculas de HLA em células tumorais e

consequentemente menor apresentação de antígenos tumorais é uma das principais

Page 35: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

35

hipóteses para se explicar a inabilidade do sistema imune de reconhecer as células

malignas, mostrando mais uma vez o importante papel da resposta imune mediada

por HLA classe I (APTSIAURI et al., 2007a; APTSIAURI et al., 2007b; DEL CAMPO

et al., 2012).

Diversos estudos têm relacionado os alelos de HLA a predisposição à

diversas doenças e a diversos desfechos diferentes. Dentre as mais proeminentes

associações estão a de maior predisposição a desenvolvimento de doenças

reumáticas autoimunes como artrite reumatóide com diferentes alelos de HLA-DRB1

e da espondilite anquilosante com o HLA-B*27. Outras doenças como esclerose

múltipla, psoríase, diabetes tipo 1, narcolepsia e alergias também são associadas a

diferentes alelos de HLA. Os genes do sistema HLA também apresentam uma

importância particular na progressão ou resistência a doenças infecciosas como, por

exemplo, a infecção pelo HIV-1 (KLEIN e SATO, 2000b).

1.13 PAPEL DO HLA NA INFECÇÃO PELO HIV-1

Sabe-se que 1 em 300 pessoas infectadas pelo HIV-1 mantém controle

espontâneo do vírus a níveis abaixo de 50 cópias de RNA por microlitros, valor

mínimo detectável (DEEKS e WALKER, 2007). Em alguns casos, pessoas

infectadas permanecem por mais de três décadas sem manifestar evidências

clínicas de progressão da doença, ou então progridem muito lentamente para a aids

(CARRINGTON e WALKER, 2012). Outro caso seria a existência de indivíduos que

foram expostos ao HIV, as vezes repetitivamente e por longos períodos de tempo, e

que permaneceram não infectados. Esses eventos indicam uma resposta natural à

infecção pelo HIV-1. Foram encontradas algumas mutações em comum em ambos

os grupos de pessoas exposto-não infectados e de progressores lentos, sugerindo

uma teoria de que traços do hospedeiro estariam impedindo ou dificultando a

entrada do vírus na célula e reduzindo a infecção, e se a infecção ocorre essas

mesmas características eliminariam ou retardariam a progressão da doença

(MARMOR et al., 2006).

As respostas celulares contra infecções são dependentes da constituição

imunogenética do indivíduo, e dentro do genoma nuclear humano, os genes de HLA

de classe I são os mais convincentes loci de traços quantitativos para o controle da

Page 36: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

36

infecção pelo HIV-1 (BRUMME et al., 2012; CARLSON et al., 2012; CARRINGTON e

O'BRIEN, 2003; DALMASSO et al., 2008; FELLAY, 2009; FELLAY et al., 2009;

KAWASHIMA et al., 2009; MOORE et al., 2002; PELAK et al., 2010).

A diversidade genética do HLA influencia diferentes aspectos da infecção pelo

HIV e da aids como na transmissão viral, controle da dinâmica e progressão viral,

desenvolvimento de doenças oportunistas e até na resposta à terapia incluindo a

hipersensibilidade observada a drogas antivirais (KAUR e MEHRA, 2009a, b; SINGH

et al., 2008; STEPHENS, 2005). Além disso, a resposta imune restrita por HLA

classe I possui influência direta na diversidade, replicação e fitness evolutivo viral,

através das mutações de escape imune que surgem no genoma do HIV (SHARMA

et al., 2011).

De fato, os peptídeos virais apresentados por algumas moléculas HLA classe

I induzem fortes respostas contra o HIV a partir das células T CD8 específicas,

responsáveis pelo controle da replicação viral, e, consequentemente, bloqueiam a

depleção de linfócitos T CD4+ e a progressão da doença (LETVIN e WALKER, 2003;

MCMICHAEL e JONES, 2010; PEREYRA et al., 2010).

Diversos estudos vêm demonstrando que alelos “protetores” do hospedeiro

como o HLA-B*27:05, B*57:01 e B*14/C*08:02 estão associados com o controle

imune da infecção e com a progressão mais lenta, ao passo que alelos como B*07,

B*35 e B*53 levam a um rápido desenvolvimento para a aids (BANSAL et al., 2007;

CARRINGTON e O'BRIEN, 2003; MCMICHAEL e JONES, 2010; MIGUELES et al.,

2000; TANG e KASLOW, 2003).

Os alelos B*57:01 e B*27:05 são os mais bem descritos na literatura quanto à

associação com o controle da carga viral e progressão mais lenta para aids. Tem

sido proposto que os peptídeos virais apresentados por estas moléculas induzem

fortes respostas citotóxicas contra o HIV, que são responsáveis pelo controle viral

observado (MCMICHAEL e JONES, 2010; PEREYRA et al., 2010). Além disso,

estudos mostraram que células T CD8+ restritas pelos alelos HLA-B*27 e B*57 são

muito mais resistentes à supressão pela regulação de Tregs (linfócitos T

reguladores) do que células T CD8+ restritas por alelos não protetores da infecção

pelo HIV. A falta de supressão dessas células CTLs restritas por esses alelos,

permite que essas células continuem a proliferar e lisar os alvos infectados durante a

Page 37: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

37

infecção crônica, o que pode gerar uma progressão mais lenta para a doença em

pessoas com esses alelos protetores (ELAHI et al., 2011).

Apesar da grande influência do HLA-B em haplótipos relacionados à proteção

contra a infecção pelo HIV, alguns haplótipos não podem ser explicados apenas pela

ligação ao HLA-B, evidenciando um efeito protetor interdependente entre os alelos.

Apesar do HLA-B ter um grande impacto, o controle do HIV é provavelmente

influenciado por efeitos aditivos de outros alelos de HLA presente, como no caso de

haplótipos Cw04:01-B*81:01, Cw12:03-B*39:10, A*74:01-B*57:03 e B*75:01-

Cw06:02 (LESLIE et al., 2010; MCMICHAEL e JONES, 2010; ZIPETO e BERETTA,

2012).

Estudos desenvolvidos por Carrignton e colaboradores mostraram que a

heterozigosidade de alelos de HLA classe I está associada com uma menor

progressão para aids em pacientes infectados pelo HIV e, por outro lado, a

homozigosidade está associada com a progressão mais rápida para a doença. Isso

pode ser resultante da diversidade de peptídeos de HIV apresentados para células T

devido a presença de uma maior diversidade alélica em heterozigotos. Portanto, se

demoraria mais para surgirem mutações de escape imune em heterozigotos

(CARRINGTON et al., 1999; CARRINGTON e O'BRIEN, 2003).

Outro dado interessante são estudos que demonstram a associação de alelos

de HLA classe I a subtipos específicos do HIV-1. Como exemplo nós temos estudos

que mostraram que os alelos B*15:16 e B*15:17 são associados com redução da

viremia do HIV-1 de subtipos B e C (FRAHM et al., 2005), mas não em paciente

infectados com subtipo A (FRAHM et al., 2005; LAZARYAN et al., 2006). O HLA-

B*15:03 se mostrou associado com redução da viremia em infecção pelo subtipo B

(FRAHM et al., 2006), mas não com subtipo C (KIEPIELA et al., 2004; LESLIE et al.,

2010). Ao contrário, B*18 foi demonstrado estar associado ao aumento da viremia

em infecções com subtipo C (KIEPIELA et al., 2004; LESLIE et al., 2010), mas não

com infecções de subtipo A e B (FARQUHAR et al., 2004; KASLOW et al., 1996).

Porém, os alelos de HLA que parecem ter uma associação única com subtipos

específicos do HIV são pouco frequentes nos grupos étnicos expostos a diferentes

subtipos de HIV para que os estudos possam alcançar poder estatístico nas

associações (STEPHENS, 2012).

Page 38: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

38

1.14 TIPAGEM DO HLA POR SEQUENCIAMENTO DE NOVA GERAÇÃO

(NGS)

A tipagem do HLA é de grande importância para rotina clínica de procura de

doadores e receptores compatíveis para transplantes, associação a doenças

autoimune e reações adversas a drogas, desenhos de peptídeos imunogênicos para

vacinas antivirais e tratamento de câncer, estudos de genética populacional e

evolucionária, entre outros.

O processo de identificação dos alelos de HLA tem evoluído dos métodos

com base sorológica para os métodos mais recentes com base no DNA como, por

exemplo, PCR-SSO (sequence-specific oligonucleotide probes), PCR-SSP

(sequence-especific primers) e Sequenciamento de Sanger - SBT (sequence-based

typing), tendo o sequenciamento de DNA como o padrão ouro para tipagem de HLA

em todo o mundo (ERLICH, 2012; GRUMBT et al., 2013).

Atualmente já foram identificados mais de 10.533 alelos de HLA segundo o

bando de dados do IMGT/HLA, porém menos de 10% desses alelos possuem a

sequência completa, atendo-se apenas aos éxons mais polimórficos que codificam a

fenda de ligação a peptídeos, pois possuem mais relevância clínica em transplantes

de órgãos. Porém, até mesmo em transplantes entre indivíduos com alelos idênticos,

aproximadamente 30% dos receptores apresentam eventos adversos de rejeição

dentro de cinco anos (OTTINGER et al., 2003). Não se sabe se isso se dá devido a

fatores genéticos, como diferenças nucleotídicas em regiões não analisadas do HLA

ou se outros genes estariam envolvidos. Portanto, a relevância clínica dos outros

éxons não habitualmente tipados permanece desconhecida.

Outro dado muito importante é que apenas cerca de 30% desses alelos

descritos no banco de dados atendem aos critérios de alelos bem documentados

(CWD common well-documented) e mais de 40% desses foram reportados apenas

uma única vez (alelos raros) (CANO et al., 2007).

Tipagens ambíguas podem ocorrer devido a padrões de polimorfismos em

cis/trans de amostras heterozigotas ou devido a alguns alelos serem idênticos em

regiões comumente analisadas, levando a duas ou mais combinações de alelos

(BENTLEY et al., 2009; HOLCOMB et al., 2011; HOSOMICHI et al., 2013; LIND et

al., 2010). Uma maneira de resolver essas ambiguidades seria analisar exons

Page 39: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

39

adicionais ou até mesmo todo o gene e determinar a fase dos polimorfismos.

Resolver essas ambiguidades necessita de técnicas onde seja possível separar os

haplótipos se constituindo de abordagens caras e de difícil execução (GRUMBT et

al., 2013; HOLCOMB et al., 2011). Porém com o surgimento de novas metodologias

de sequenciamento, conhecidas como Next Generation Sequencing (NGS), isso se

torna possível.

As vantagens da metodologia de sequenciamento por NGS são:

sequenciamento de grande número de bases por corrida, sequenciamento de

diversos alvos (genes ou genomas) em paralelo, sequenciamento de diversas

amostras ao mesmo tempo e grande volume de sequências geradas por corrida. As

metodologias de NGS mais utilizadas são as da plataforma Illumina (HiSeq e

MiSeq), 454/Roche e SOliD/Applied Biosystem. Apesar de diferirem em diversas

etapas, ambas as plataformas se baseiam no sequenciamento clonal onde é

produzindo uma população de fragmentos de DNA idênticos ao DNA a ser

sequenciado, gerando um número maciço de dados e permitindo assim o

sequenciamento de diversos polimorfismos, subclones, variantes e mutações

(GRUMBT et al., 2013; LIND et al., 2010).

Portanto, essas novas tecnologias de NGS, além de possibilitarem a

resolução de ambiguidades, permitem a tipagem de diversas amostras e diversos

genes do sistema HLA de uma única vez, e também a tipagem em alta resolução.

De acordo com Nunes e colaboradores, a tipagem de baixa resolução é aquela

equivalente à tipagem sorológica, definindo o alelo apenas a nível de família ou

antígeno. A tipagem intermediária envolve a análise de polimorfismos nos éxons 2 e

3 para HLA classe I e éxons 2 para classe II, enquanto que a tipagem de alta

resolução analisa polimorfismos em éxons adicionais (NUNES et al., 2011a; NUNES

et al., 2011b).

Frente a isso, a tipagem de toda a sequência do HLA sem ambiguidades

através de técnicas de NGS permite a caracterização completa em alta resolução de

novos e já existentes alelos, podendo ter implicações relevantes para o transplante

de células hematopoiéticas, assim como para diversas outras doenças associadas

ao sistema HLA, como no caso da infecção pelo HIV-1.

Page 40: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

40

2. JUSTIFICATIVA DO PROJETO

Na presente proposta, seremos capazes de determinar a composição do alelo

HLA de classe I (lócus A, B e C) de indivíduos brasileiros HIV+ do Sul do Brasil

através de tipagem em alta resolução por NGS, um procedimento ainda não

realizado no Brasil. Isso nos permitirá um melhor entendimento dos fatores

genéticos do hospedeiro que respondem a esta infecção viral. A infecção do HIV no

Sul do Brasil por sua vez possui um panorama muito particular em relação ao

restante do país com altas taxas de detecção e grande presença do subtipo C e

recombinantes BC. Portanto esse estudo se mostra de grande importância em um

contexto étnico e genético como o da região Sul do Brasil.

3. OBJETIVOS

Determinar os alelos do HLA classe I (A, B e C) por seqüenciamento de nova

geração, avaliando diferentes metodologias de montagem e reconstrução de alelos,

e associar com parâmetros epidemiológicos, clínicos, laboratoriais de pacientes HIV+

no sul do Brasil acompanhados por mais de 15 anos e infectados pelos subtipos B,

C ou recombinantes BC do vírus.

3.1 OBETIVOS ESPECÍFICOS

• Caracterizar os subtipos do HIV-1 da coorte de pacientes HIV+ em

acompanhamento no Serviço de HIV/Aids do Hospital das Clínicas de Porto Alegre;

• Determinar os alelos de HLA nos loci A, B e C dos pacientes;

• Aplicar nova metodologia de tipagem do HLA com resolução ultraprofunda

através de sequenciamento de nova geração (NGS);

• Avaliar diferentes metodologias de tipagem de HLA e reconstrução de alelos

disponíveis para dados de NGS

• Descrição do perfil clínico e laboratorial dos pacientes estudados;

• Correlacionar parâmetros clínicos, laboratoriais e o subtipo infectante do HIV-

1 aos alelos de HLA encontrados.

Page 41: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

41

4. MATERIAL E MÉTODOS

4.1 CASUÍSTICA

O presente estudo analisou uma coorte de pacientes HIV+ estabelecida desde

2002, acompanhada regularmente no Serviço de HIV/Aids do Hospital de Clínicas de

Porto Alegre (HCPA). Os pacientes foram convidados e aceitaram participar do

estudo. Todos os pacientes assinaram um Termo de Consentimento Livre e

Esclarecido concordando em participar da pesquisa, e a mesma foi também

aprovada pelo Comitê de Ética em Pesquisa do HCPA.

Uma amostra de sangue total foi colhida entre os anos de 2002 e 2003 e um

questionário preenchido com histórico de dados clínicos e laboratoriais conforme a

rotina do ambulatório. O questionário informativo continha as seguintes informações:

sexo, data de nascimento, data de diagnóstico para o HIV, trajetórias de carga viral

plasmática do HIV, trajetórias de contagens de linfócitos T CD4+ e CD8+,

classificação imunológica e clínica do CDC na época da coleta, histórico detalhado

de tratamento antirretrovial (quando era o caso), desenvolvimento de infecções

oportunistas, efeitos adversos da terapia antirretroviral, entre outras. As amostras

foram colhidas durante o agendamento regular do ambulatório. Somente foram

incluídos homens e mulheres maiores de 18 anos e diagnosticados positivos para

HIV.

As amostras foram enviadas para o Rio de Janeiro, ao Laboratório de

Virologia no Departamento de Genética da Universidade Federal do Rio de Janeiro,

onde foram submetidas à separação do plasma e células. Tanto o plasma quanto as

células foram estocados a -80°C, e estas últimas posteriormente tiveram seu DNA

genômico extraído. O presente estudo contemplou amostras de 253 pacientes.

Esta pesquisa foi conduzida no Programa de Genética do Centro de Pesquisa

no Instituto Nacional de Câncer José Alencar Gomes da Silva (INCA), no Rio de

Janeiro.

4.2 EXTRAÇÃO DO DNA GENÔMICO

A extração do DNA genômico foi realizada a partir da amostra de células

utilizando o kit Genomic DNA Extraction (Real Genomics, BioAmerica Inc., Miami,

Page 42: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

42

EUA), em um fluxo laminar classe 2 (Trox Technik, Alemanha). Primeiramente foram

misturados 20 µL de proteinase K e 200 µL da amostra descongelada junto a 200 µL

do tampão AL. As amostras foram vigorosamente agitadas em Vortex® por 15

segundos, com uma posterior incubação em banho-maria a 56 ºC por 10 minutos.

Em seguida, após uma breve centrifugação, foram adicionados 200 µL de etanol

absoluto (Merck, Darmstadt, Alemanha) e as amostras foram agitadas no Vortex®

mais uma vez por 15 segundos, novamente centrifugando para recolher o material

espalhado pelo tubo. Essa mistura foi transferida para a coluna de extração, que

contêm uma membrana de sílica seletiva, e o tubo foi centrifugado por 1 minuto a

8.000 rpm.

Foram feitas duas etapas de lavagem com diferentes tampões. A primeira

lavagem foi feita com 500 µL de tampão AW1 seguida de uma centrifugação a 8.000

rpm por 1 minuto, onde o líquido centrifugado ao final foi descartado; a segunda

lavagem foi feita com 500 µL de tampão AW2 e centrifugação a 14.000 rpm por 3

minutos, também descartando-se o centrifugado ao final. O DNA genômico foi eluído

em 100 µL de tampão AE e previamente incubado a temperatura ambiente por 1

minuto. Por último, foi feita uma centrifugação a 8.000 rpm por 1 minuto, a coluna foi

descartada e a amostra eluída foi armazenada a -20 ºC.

4.3 AMPLIFICAÇÃO DE REGIÕES DO GENOMA VIRAL DO HIV-1

Foram estudadas por sequenciamento as regiões genômicas da protease

(PR) e transcriptase reversa (RT) incluindo o domínio polimerásico (DP), C-terminal,

conexão (CN) e RNase H (RH), totalizando 1750 pares de base. Através de Reação

em Cadeia da Polimerase (PCR) aninhada foram amplificados os fragmentos POL

(PR+DP) e CR (CN + RH), com aproximadamente 900 pb cada. Quando não, em

separado foram amplificadas as regiões PR (~ 300 pb), DP (~ 750 pb), CN (~ 650

pb) e RH (~ 400 pb), ilustrado na Fig. 4.3.1 Todas as reações foram realizadas com

iniciadores específicos descritos na Tabela 4.3.1 idealizados a partir do clone viral

de referência laboratorial, HXB2 (RATNER, 1987; número de acesso GenBank:

K03455).

Page 43: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

43

Figura 4.3 .1. Representação dos esquemas de amplificação das regiões do genoma viral do HIV-1.

Page 44: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

44

Tabela 4.3 .1. Iniciadores usados para amplificação e sequenciamento da região genômica do HIV-1

analisada.

Reg. Gen. Iniciadores Sequência Loc. No

HXB2* Orientação

TM

(°C)

DP16 CTCAAATCACTCTTTGGCAAC 2254-2274 Senso 54.5

DP11 CCTGGCTTTAATTTTACTGGTA 2593-2572 Antissenso 50.5 PR

MOPR2 AAATTTTCCCTTCCTTT 2691-2675 Antissenso 47.0

RT9 GTACAGTATTAGTAGGACCTACACCT

GTC 2470-2498 Senso 57.1

RT12 ATCAGGATGGAGTTCATAACCCATCC

A 3260-3234 Antissenso 59.3

RTint CCAGCAATATTCCAAAGTAGCATG 3018-3041 Antissenso 54.4

B2 GGGGATTTACCACACCAG 3184-3201 Senso 52.8

DP

K2 TCCCACTAACTTCTGTATGTCATTGA

C 3335-3309 Antissenso 56.3

CX1 TGGATGGGTTATGAACTCCATCCTG 3234-3258 Senso 58.4

POLM4 CTGTTAGCTGCCCCATCTACATA 3892-3870 Antissenso 56.2

RT20 CTGCCAGTTCTAGCTCTGCTTC 3462-3441 Antissenso 57.6

RT21 GCCCCTGCTTCTGTACTTCTGC 3549-3528 Antissenso 60.3

CN

CX2 ATACAGAAGTTAGTGGGAAAA 3318-3338 Senso 48.8

OUT3R CATTGCTCTCCAATTACTGTGATATTT 4295-4269 Antissenso 53.8

POLM8 GGTACCAGTTAGAGAAAGAACCCA 3826-3849 Senso 56.0

INTR-2 CCACTGGCTACATGA 4474-4460 Antissenso 43.0

INTR CAGTCTACTTGTCCATGCATGGCTTC 4396-4371 Antissenso 65.8 RH

POLM7 CTGAGTGGGAGGTTGTCAATACCCC

TCCCTTAGTGAAATTAT 3784-3825 Senso 56.0

Reg. Gen – região genômica; Loc. No HXB2 – localização no genoma do HXB2. * - A posição, relativa ao clone HXB2, foi obtida com a ferramenta HIV Sequence Locator (disponível em http://www.hiv.lanl.gov/content/sequence/LOCATE/locate.html) (Korberet al., 1998).

As reações para a PCR utilizaram os seguintes reagentes: 5 µL de tampão

10X, 1,5 µL de MgCl2 a 25 mM, 0,4 µL de dNTP mix a 25 mM, 0,5 µL de cada

iniciador a 25 ρmol/µL, 0,4 µL de Taq Platinum DNA polimerase a 5 U/µL (Life

Technologies, EUA), 100 ŋg/µL de DNA genômico e um valor de H2O livre de

nuclease para totalizar um volume final de 50 µL para cada reação. Para a reação

da PCR aninhada, foram escolhidos iniciadores internos e o DNA molde era o

Page 45: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

45

produto da primeira etapa. A fim de monitorar as reações para identificar possíveis

contaminações foram feitos controles negativos contendo apenas os reagentes

usados para a PCR. Durante o processo de padronização das reações e para as

demais reações de rotina, foi utilizado um controle positivo, uma amostra clinica

previamente determinada.

As condições para a ciclagem no termociclador Veriti 96 well Thermal Cycler

(Life Technologies, EUA) para as reações da PCR de modo geral foram: ativação

inicial a 94ºC por 2 minutos, 35 ciclos com desnaturação a 94ºC por 30 segundos,

anelamento à temperatura específica para cada par de iniciadores e extensão a

72ºC a um minuto por kb e 10 minutos de extensão final do fragmento a 72ºC. Para

a etapa de anelamento foi utilizada a temperatura correspondente a média dos TM

dos dois iniciadores da reação

O resultado da amplificação foi observado em gel de agarose a 1% em

solução tampão de NaOH 1x (solução estoque a 20x: ácido bórico a 0,9 M e NaOH a

0,2 M; ambos da Merck, Darmstadt, Alemanha). Foram analisados 5 µL do produto

amplificado misturados com 1 µL do corante BlueGreen® (LGC Biotecnologia, SP,

Brasil) além de 2 µL do marcador de peso molecular 1 kb DNA Ladder (GE

Healthcare, São Paulo, Brasil) e submetidos à eletroforese (100 mAmp). O gel foi

visualizado em um transiluminador de luz ultravioleta (Bio-Rad, Japão) e fotografado

utilizando software Kodak Molecular Imaging Software (Eastman Kodak Company,

NY, EUA). O tamanho dos fragmentos desejados foi estimado comparando-se os

mesmos com o marcador de peso molecular. Os produtos da amplificação foram

armazenados a 4 ºC até serem purificados.

4.4 PURIFICAÇÃO DOS PRODUTOS POSITIVOS

Os produtos para a amplificação do fragmento de interesse foram purificados

com o conjunto de reagentes do kit Qiaquick PCR Purification (Qiagen, Chatsworth,

EUA), seguindo o protocolo do fabricante. Todo o volume da reação de PCR foi

misturado a 250 µL de tampão de ligação PB e transferido para uma membrana de

sílica. O material foi submetido a uma centrifugação de 13.000 rpm por 1 minuto

onde o DNA foi adsorvido seletivamente. Em seguida, foram adicionados 750 µL do

tampão de lavagem PE com a finalidade de remover as enzimas, tampões,

Page 46: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

46

iniciadores e dNTPs, e a mistura foi centrifugada uma vez mais a 13.000 rpm por 1

minuto. Essa etapa foi repetida uma segunda vez para que a membrana ficasse bem

seca. Na etapa final, foram utilizados 50 µL do tampão EB para a eluição do DNA

adsorvido na membrana, centrifugando-se a 13.000 rpm por 2 minutos. As amostras

purificadas foram analisadas em gel de agarose a 1% e o DNA foi estocado em

freezer a -20 °C.

4.5 SEQUENCIAMENTO DE SANGER

A reação de sequenciamento foi realizada com os reagentes do Big Dye®

Terminator v3.1 Cycle Sequencing Kit (Life Technologies, EUA) seguindo o protocolo

do fabricante. A plataforma de sequenciamento automático utilizada foi a ABI Prism

3130XL Genetic Analyzer (Applied Biosystems/HITACHI, Japão). Foram usados 5 a

20 ng de DNA purificado, 5 ρmol/µL dos respectivos iniciadores internos (Tabela

4.3.1) e H2O livre de nuclease para completar um volume final de 7,5 µL por reação,

quando necessário. A cada reação foi adicionado 1 µL de BigDye (Life

Technologies) e 1,5 µL de tampão de sequenciamento 5x (Life Technologies),

totalizando 10 µL. A reação foi colocada no termociclador Veriti 96 well Thermal

Cycler (Life Technologies, EUA) e submetida a 40 ciclagens com desnaturação a 96

°C por 10 segundos, anelamento a 50 °C por 5 segundos e extensão a 60 °C por 4

minutos.

Para purificar o DNA e eliminar os demais componentes da reação de

sequenciamento como nucleotídeos livres, co-fatores, entre outros, foi feita a

precipitação por Etanol/Isopropanol. A reação foi feita adicionando-se 30 µL de

isopropanol a 75% (Merck, Alemanha) em cada amostra, misturou-se brevemente no

Vortex® seguido da incubação por 10 minutos a temperatura ambiente e posterior

centrifugação a 4.000 rpm por 45 minutos a 4 °C. O sobrenadante foi eliminado e foi

feita uma lavagem com 50 µL de etanol a 75% (Merck, Alemanha) e centrifugação

por 15 minutos a 4.000 rpm a 4 °C e o sobrenadante foi desprezado. As amostras

foram postas em um termociclador Veriti 96 well Thermal Cycler (Applied

Biosystems, EUA) e aquecida a 60 °C por 10 minutos para a evaporação do etanol

restante. Ao final foram armazenadas à –20 °C até o momento do sequenciamento

em que, por fim, ressuspendidas em 10 µL de formamida.

Page 47: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

47

4.6 EDIÇÃO E ALINHAMENTO DAS SEQUENCIAS

Para a edição manual dos eletroferogramas obtidos de cada iniciador foi

utilizado o programa DNASTAR Lasergene7 (DNAstar, EUA), ferramenta SeqMan,

gerando uma sequência consenso. As sequências consenso de cada amostra foram

alinhadas no programa BioEdit v.7.0.9.0 (HALL, 1999) junto com as sequências

referência para todos os subtipos puros e CRFs do HIV-1, retiradas do banco de

dados do site de Los Alamos (http://www.hiv.lanl.gov/). O alinhamento foi salvo em

formato FASTA.

4.7 ANÁLISES FILOGENÉTICAS E CLASSIFICAÇÃO DO SUBTIPO VIRAL

Para determinar o melhor modelo a ser usado na análise filogenética, o

alinhamento contendo as amostras sequenciadas, referências e mais o grupo

externo escolhido, grupo O, foi submetido ao programa Model Generator (KEANE et

al., 2006). Foi usado o programa PhyML v.3.0 (GUINDON et al., 2010) para gerar

uma árvore filogenética de máxima verossimilhança com suporte em aLRT, acima de

0,70 (“Approximate Likelihood-Ratio Test”) com o modelo definido (ANISIMOVA e

GASCUEL, 2006). Para a visualização e edição das árvores foi utilizado o programa

FigTree versão 1.3.1 (disponível gratuitamente no website do “Institute of

Evolutionary Biology, University of Edinburgh”:

http://tree.bio.ed.ac.uk/programa/figtree/).

Também para as análises filogenéticas foram feitas árvores filogenéticas

realizadas no programa Mega 5 usando o método de distância de “Neighbor-Joining”

e o modelo de correção de dois parâmetros (KIMURA, 1977) utilizando 1.000

repetições de bootstrap. Foram consideradas por nós as clades que tiveram como

suporte o valor de bootstrap acima de 70%.

Amostras com classificação indeterminada, por não se agruparem com

confiança aos subtipos nas árvores filogenéticas analisadas, foram indicadas como

possíveis recombinantes e submetidas ao programa SimPlot v.3.5.1, utilizando como

parâmetros “janela: 200pb, passos: 20 pb, T/t:2,0, gastrip: on, replicas: 100, Kimura

Page 48: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

48

2-parâmetros, Neighbor-Joining”, podendo então, definir os padrões de

recombinação.

4.8 AMPLIFICAÇÃO DAS REGIÕES GENÔMICAS HLA-A, B E C

Através de reação em cadeia da polimerase (PCR), foram amplificados

separadamente os fragmentos correspondentes aos éxons 1 ao 7 dos genes HLA-A,

B e C, com aproximadamente 2,726 pb, 2,677 pb, 3,339 pb respectivamente (Fig.

4.8.1). Todas as reações foram realizadas com iniciadores específicos descritos na

Tabela 4.8.1, de acordo com Wang e colaboradores (WANG et al., 2012).

Figura 4.8 .1. Representação esquemática da posição dos iniciadores sentido senso e antissenso

utilizados para a amplificação no HLA-A, B e C (modificada de WATANABE et al., 2001).

Page 49: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

49

Tabela 4.8 .1. Iniciadores para amplificação dos éxons 1 ao 6 dos HLA-A, B e C.

Iniciadores Sequência 5´- 3´ Orientação Posição*

TCCCCAGACGCCGAGGATGGCC Senso 69-90

TCCCCAGACCCCGAGGATGGCC Senso 69-90 HLA-A CACATCAGAGCCCTGGGCACTGTC Antissenso 2.771-

2.794 CTCCTCAGACGCCGAGATGCTG Senso 39-60

CTCCTCAGACGCCAAGATGCTG Senso 39-60

CTCCTCAGACACCGAGATGCTG Senso 39-60

CTCCTCAGACGCCGAGATGCGG Senso 39-60

CTCCTCAGACGCCAAGATGCGG Senso 39-60

CTCCTCAGACACCGAGATGCGG Senso 39-60

HLA-B

CACATCAGAGCCCTGGGCACTGTC Antissenso 2.692-2.715

CTCCCCAGACGCCGAGATGCGG Senso 50-71

CTCCCCAGAGGCCGAGATGCGG Senso 50-71 HLA-C CTCATCAGAGCCCTGGGCACTGTT Antissenso 2.757-

2.780 *Posição relativa às sequências-referência de HLA-A (NG_029217.2), HLA-B (NG_023187.1) e HLA-C (NG_029422.2) disponíveis na base de dados do NCBI.

As reações para a PCR foram realizadas com as mesmas especificações

descritas para a amplificação de regiões do genoma HIV-1, com exceção da

utilização da enzima Taq High Fidelity DNA polimerase (Life Technologies, CA,

EUA). As condições de ciclagem das reações da PCR foram: ativação inicial a 94 ºC

por 3 minutos, 40 ciclos com desnaturação a 94 ºC por 30 segundos, anelamento

dos iniciadores a 63 ºC por 45 segundos e extensão a 68 ºC por 6 minutos, seguidos

de 10 minutos de extensão final dos fragmentos a 68 ºC. Para a etapa de

anelamento foi utilizada a temperatura correspondente à média dos TM dos

iniciadores da reação.

O resultado da amplificação foi observado em gel de agarose a 0,8% em

solução tampão de NaOH 1x como descrito anteriormente. O tamanho dos

fragmentos desejados foi estimado comparando-se os mesmos com o marcador de

peso molecular. Os produtos da amplificação foram armazenados a 4 ºC até serem

purificados seguindo os mesmo passos da purificação descrita anteriormente.

Page 50: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

50

4.9 QUANTIFICAÇÃO E CONCENTRAÇÃO

As amostras foram quantificadas no espectrofotômetro NanoDrop ND 1000

(Thermo Scientific, MA, EUA) e diluídas em H2O a uma concentração de 2,5 ng/µL

de DNA amplificado. Em seguida, 10 µL de cada produto purificado referente aos

HLAs A, B e C de um mesmo paciente foram misturados em um único tubo

eppendorf.

4.10 PREPARAÇÃO DA BIBLIOTECA

As bibliotecas foram preparadas com o kit Nextera DNA Sample Preparation

(Illumina, CA, EUA) seguindo o protocolo do fabricante. A Fig. 4.6.1 mostra as

etapas da preparação da biblioteca. Para a primeira etapa, em que simultaneamente

são feitas a fragmentação do DNA e sua marcação com etiquetas (tags) específicas,

foram adicionados 20 µL do DNA a 2,5 ng/µL, 25 µL do tampão TD (Tagment DNA

Buffer) e 5 µL de TDE1 (Tagment DNA Enzyme). A reação foi colocada em

termociclador a 55 °C por 8 minutos. Nessa etapa, o DNA é fragmentado em regiões

aleatórias por transposons e juntamente com a quebra do DNA, são adicionados

duas sequências terminais (tags) de 14 pb.

Page 51: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

51

Figura 4.10.1 . Representação esquemática das etapas de preparação das bibliotecas de DNA pelo

kit Nextera DNA Sample Preparations para o sequenciamento na plataforma Illumina HiSeq 2500

(modificado de http://core-genomics.blogspot.com.br/2012/07/illuminas-nextera-capture-is-this.html).

Na segunda etapa, as reações foram purificadas com o kit Qiaquick PCR

Purification (Qiagen), seguindo o protocolo do fabricante conforme descrito

anteriormente. Na etapa final de eluição, foram utilizados 25 µL do tampão RSB para

a eluição da biblioteca.

A terceira etapa, de enriquecimento dos fragmentos, se constitui em uma

reação de PCR com iniciadores complementares aos que foram adicionados

previamente e que possuem na sua extremidade uma cauda de sequência

adaptadora. Esses adaptadores (P5 e P7) são necessários para a etapa de

clusterização, uma vez que eles são complementares aos adaptadores presentes

naquela etapa. Além disso, esses adaptadores possuem uma sequencia variável de

Page 52: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

52

nucleotídeos (índexes/barcodes) (i5 e i7), necessários à separação e identificação

futura dos fragmentos originados do sequenciamento da mesma amostra, já que no

sequenciamento todas serão misturadas em uma mesma reação (Fig. 4.6.1).

Primeiramente, foram adicionados 5 µL de cada índice, 15 µL de NPM (Nextera PCR

Master Mix) e 5 µL de PPC (PCR Primer Cocktail) aos 25 µL de fragmentos de DNA

purificados anteriormente. Em seguida, a placa foi selada e centrifugada

brevemente. A reação foi submetida a uma PCR em termociclador, a uma ciclagem

de 72 °C por 3 minutos, 98 °C por 30 segundos e 5 ciclos de 98 °C por 10 segundos,

63 °C por 30 segundos e 72 °C por 3 minutos.

A última etapa de purificação da biblioteca foi realizada com microesferas

magnéticas, que além de purificar a biblioteca também promovem uma seleção de

tamanho dos fragmentos, retirando os que são muito pequenos. As microesferas

magnéticas têm a capacidade de se ligar ao DNA, separando-o do restante da

solução. Foram adicionados 30 µL de AMPure XP beads em cada reação,

misturando-se até gerar uma solução homogênea, e após 5 minutos de incubação a

placa foi colocada sobre uma placa magnética para a precipitação das microesferas

ligadas ao DNA no fundo dos poços. Foram feitos dois processos de lavagem com

etanol a 80% (Merck) e, após a secagem, as microesferas contendo o DNA foram

ressuspensas em 32,5 µL de RSB. O RSB libera o DNA das microesferas. Após a

separação das microesferas do DNA, e este último em solução, a biblioteca era

armazenada a -20 °C.

4.11 CONTROLE DE QUALIDADE DAS BIBLIOTECAS

As bibliotecas foram analisadas quanto à distribuição de tamanho dos

fragmentos (pares de bases), sendo submetida a uma eletroforese em gel de

agarose a 0.8% junto ao marcador de peso molecular de 1 kb como comparador.

Após a visualização do gel, foi observado o tamanho médio dos fragmentos de DNA

da biblioteca.

Page 53: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

53

4.12 QUANTIFICAÇÃO DA BIBLIOTECA

A quantificação da biblioteca foi realizada através da técnica de quantificação

absoluta por PCR em tempo real no sistema ECO (Illumina) utilizando-se o kit KAPA

Library Quantification (KAPA Biosystems, MA, EUA) conforme protocolo fornecido

pelo fabricante. Primeiramente, as bibliotecas foram diluídas 10.000 vezes em

solução contendo 0,1% de Tween 20 + 10 mM Tris-HCL a pH 8,5. As reações foram

preparadas em microplacas fornecidas com o kit. Como padrões para a

quantificação, foram utilizados seis padrões fornecidos no kit, com quantificações

conhecidas e de 20 pM, 2 pM, 0,2 pM, 0,02 pM, 0,002 pM e 0,0002 pM. Dois

microlitros da diluição da biblioteca foram adicionados a 6 µL de Master Mix e 2 µL

de H2O. Também foram feitos controles negativos onde eram adicionados 2 µL da

mesma solução de Tween descrita acima ao invés da biblioteca. Todas as reações,

tanto para os padrões quanto para cada biblioteca, foram feitas em triplicatas para

melhor confiabilidade da quantificação. A microplaca foi submetida a uma ciclagem

de 95 °C por 5 minutos, 35 ciclos de 95 °C por 30 segundos e 60 °C por 45

segundos, seguidos de 95 °C por 15 segundos, 55 °C por 15 segundos e 95 °C por

15 segundos.

Os dados gerados foram analisados em uma planilha Excel (Microsoft Corp.,

Seattle, EUA). A concentração das bibliotecas foi estimada através da equação da

reta f(x) = -b ln(x) + a, gerada a partir dos Ciclos de Quantificação (Cqs) dos

padrões, sendo que x corresponde à média do Cq de cada biblioteca. Essa

concentração foi normalizada pelo tamanho médio dos fragmentos obtidos pela

eletroforese e pela taxa da diluição, chegando-se a uma concentração final.

4.13 SEQUENCIAMENTO NA PLATAFORMA ILLUMINA HISEQ 2500

A metodologia de seqüenciamento por síntese da plataforma Illumina HiSeq

2500 se inicia com a amplificação de fragmentos de DNA (bibliotecas) ligados a

superfície de uma célula (flow cell) na forma de pontes através da enzima DNA

polimerase, que produz múltiplas cópias da seqüência original (clusters), se

assemelhando à técnica da clonagem.

Page 54: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

54

As bibliotecas foram reunidas, desnaturadas e diluídas a 12 pM e submetidas

a clusterização em uma estação de cluster C-bot (Illumina, CA, EUA). A

clusterização se baseia na ligação dos adaptadores presentes nas extremidades dos

fragmentos das bibliotecas (P5 e P7), complementares aos que estão presentes na

superfície da célula. O fragmento irá se ligar em apenas uma extremidade, e

ocorrerá um processo de cópia deste. Essa dupla-fita de fragmento de DNA

(fragmento original + fragmento cópia) se ligará pela outra extremidade livre ao

adaptador complementar presente na superfície da célula, formando uma estrutura

de ponte. Essa ponta vai se soltar, separando os dois fragmentos idênticos que

serão novamente copiados repetidas vezes. Após a clusterização, a célula segue

para o sequenciamento por síntese.

Durante o sequenciamento das múltiplas cópias, são adicionados

oligonucleotídeos com a terminação OH bloqueada a fim de que seja adicionado

apenas um a cada etapa. Em seguida, uma excitação por feixe de luz faz com que

seja emitida uma fluorescência, que é diferente para cada oligonucleotídeo. A cada

adição de uma única base, a célula é escaneada e são feitas várias aquisições de

imagens. As imagens são interpretadas em atribuições de bases do DNA,

identificando o nucleotídeo adicionado pela sua cor emitida. A célula é lavada e

segue-se a seguinte adição de nucleotídeo. O ciclo de adição de nucleotídeo e

aquisição de imagem é repetido por 200 vezes, sendo sequenciados 100

nucleotídeos da extremidade do fragmento no sentido senso e 100 nucleotídeos no

sentido antissenso, caracterizando uma corrida com extremidades pareadas (paired

end) (2 x 100).

4.14 ANÁLISE DA QUALIDADE DOS READS E FILTRAGEM

As sequências geradas do sequenciamento se denominam reads. Esses

reads estão no formato FASTQ que contém a sequência de base nucleotídicas e a

qualidade correspondente a cada base em um único arquivo.

Primeiramente, os reads foram analisados no programa FastQC (Babraham

Bioinformatics, Cambridge, UK). O programa gera um relatório onde podemos

analisar a quantidade de reads gerados para cada biblioteca, a qualidade relativa a

cada base e a qualidade média da sequência, o tamanho médio de cada read e

Page 55: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

55

diversas outras características. As bibliotecas foram então filtradas no programa

Sickle-Master (disponível em https://github.com/najoshi/sickle) para selecionar reads

com qualidade superior a 28 na escala de Phred e tamanho superior a 20 pb. A

escala de Phred é uma escala logarítmica ligada à probabilidade de erro de

determinação da base (base-calling) usada para caracterizar a qualidade da

sequência de DNA e pode ser usada também para comparar a eficácia entre

diferentes métodos de sequenciamento. Essa ferramenta de filtragem avalia a

qualidade da base e a retira se ela não for acima do limiar estabelecido pelo usuário.

Também descarta reads abaixo do limiar de tamanho definido. Após essa filtragem,

os reads foram submetidos novamente ao programa FastQC, gerando um relatório

que é comparado com o inicial para avaliar a quantidade de reads restantes e a

qualidade média.

Linha de comando:

> sickle pe –f input file –r input file –t sanger –o output file trimmed –p output

file trimmed –s output single file trimmed –q –l

Onde:

pe = paired end

-f = read F

-r = read R

-t = tipo de qualidade (illumina, sanger ou solexa)

-o = arquivo F gerado

-p = arquivo R gerado

-s = arquivo de single reads gerado

-q = qualidade mínima

-l = tamanho mínimo do reads (default 20 pb)

4.15 MONTAGEM DE NOVO

Para as montagens de novo dos alelos de HLA-A, B e C, ou seja, sem alinhar

os reads a uma sequência-referencia, foi utilizado o programa Velvet (ZERBINO e

BIRNEY, 2008). Velvet é um montador genômico de novo especialmente

desenvolvido para reads de pequeno tamanho (plataformas Illumina e 454) que

Page 56: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

56

utiliza sequências filtradas em formato FASTQ. É uma ferramenta baseada no

gráfico de Bruijn, uma representação compacta baseada em pequenas palavras (k-

mers), ideal para alta cobertura e pequenos reads. Os reads são fragmentados de

acordo com um tamanho de k-mer predefinido (Velveth) e montados (Velvetg),

gerando contigs.

Os contigs gerados foram analisados na ferramenta QUAST (QUality

ASsessment Tool (GUREVICH et al., 2013), que avalia montagens genômicas

através de diversos parâmetros, como por exemplo tamanho dos contigs, N50

(tamanho do menor contig entre todos que cobre a metade do tamanho da

montagem) e quantidade de Ns.

Linhas de comando:

>velveth [new directory] [length_kmer] –fastq –shortPaired –separate

[reads1.fastq reads2.fastq]

Onde:

New directory = nome do diretório para o arquivo output

Lengthkmer = empírico, tentar diferentes números

Fastq = indicar o formato dos seus reads

shorPaired = paired end reads

Separate = indicar que são 2 arquivos separados

Reads = nome dos dois arquivos

>velvetg [directory] –ins_length –exp_cov –cov_cutoff –min_contig_lgth

Onde:

directory = nome do diretório onde esta o assembly

ins_length = tamanho esperado do inserto

exp_cov = cobertura media esperada

cov_cutoff = cobertura mínima necessária para assemblar

min_contig_lgth = tamanho mínimo dos contigs

Page 57: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

57

4.16 MONTAGEM COM REFERÊNCIA

Outra metodologia utilizada para reconstrução dos alelos de HLA estudados

foi a de alinhamento dos reads a uma sequência-referência. Os reads foram

alinhados com referências obtidas no Genbank (RefSeqGene HLA-A: NG_029217.2;

HLA-B: NG_023187.1; HLA-C: NG_029422.2) através do programa BWA - Burrows-

Wheeler Aligner (LI e DURBIN, 2009). Esse software para mapeamento de reads em

um genoma de referência tem como base a transformação Burrow-Wheeler de

dados. O mapeamento é estruturado em três etapas, e se inicia na construção do

arquivo SAM (alinhamento de sequências/Mapa), seguido pela indexação do

genoma de referência (BWA index), realização dos alinhamentos (BWA aln) e por

fim geração do alinhamento no formato SAM (BWA sampe). Além do BWA, são

utilizadas outras ferramentas como o Samtools (LI et al., 2009) e Picard (disponível

em: http://picard.sourceforge.net) para manipulação de referências e formatos de

arquivo. Por fim, o alinhamento é visualizado no programa IGV (do inglês, Integrative

Genomics Viewer) (ROBINSON et al., 2011).

Linhas de comando:

>bwa índex –a is ref.fasta

Onde:

-a = algoritmo para construção do índice BWT

>samtools faidx ref.fa

>bwa aln –n 4 ref.fa sample_R1_trimmed.fq > sample_R1.sai

Onde:

-n = taxa de erro da diferença entre o read e à referencia (se for porcentagem,

utilizar ponto Ex 14% = 0.14)

>bwa sampe ref.fa sample_R1.sai sample_R2.sai sample_R1_trimmed.fq

sample_R2_trimmed.fq > sample.sam

>samtools view –t ref.fa.fai –T ref.fa –b arquivo.sam > arquivo.bam

Page 58: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

58

>samtools sort arquivo.bam arquivo.sorted

>samtools index arquivo.sorted.bam

4.17 TIPAGEM DOS ALELOS DE HLA

A tipagem dos alelos foi realizada com o auxílio do programa Omixon-Target

(MAJOR et al., 2013), que possui um algoritmo para tipagem baseado no

alinhamento dos reads com as referências retiradas do banco de dados do

IMGT/HLA (http://www.ebi.ac.uk/ipd/imgt/hla/). Também foram utilizadas ferramentas

como BLAST para tipar os contigs gerados pela montagem de novo e os consensos

gerados pela montagem com referência.

O IMGT/HLA fornece um banco de dados especializados em sequência do

Complexo de Histocompatibilidade Humana (HLA) e inclui todas as sequências

oficiais do Comitê de Nomeclatura da WHO para fatores do Sistema HLA.

4.18 ANÁLISES ESTATÍSTICAS

Os alelos de HLA mais freqüentes foram correlacionados com a carga viral

antes e após o início do tratamento. Essa mesma associação foi feita para os alelos

de HLA dos pacientes infectados com diferentes subtipos do HIV. O teste exato de

Fisher foi usado para avaliar associações entre as variáveis categóricas. Um valor

de p < 0,05 foi considerado como estatisticamente significante. Variáveis com valor

de p ≥ 0,06 e ≤ 0,1 tiveram seus valores amostrais dobrados em um novo teste de

Fisher e os novos valores de p ≤ 0,05 foram consideradas como tendência de

associação.

5 RESULTADOS

Essa casuística já vem sendo estudada por muitos anos e a classificação dos

subtipos virais teve início no meu projeto de Monografia, sendo completada com os

dados desse estudo. Dos 253 pacientes, 187 amostras foram amplificadas e

sequenciadas para as regiões de interesse do HIV-1 (vide item 5.6 abaixo).

Page 59: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

59

Das 187 amostras avaliadas nesse estudo, 158 amostras (84%) foram

amplificadas com sucesso para todos os três genes (HLA-A, B e C), totalizando 474

amplificações. Dessas amostras amplificadas, 81 (51%) foram quantificadas e

tiveram sua biblioteca preparada e sequenciada, e foram analisadas neste estudo.

As demais amostras não foram analisadas até o momento devido a limitações de

orçamento e operacionalização das corridas de seqüenciamento na plataforma

Ilumina HiSeq 2500. Todas as bibliotecas sequenciadas foram analisadas e tipadas

para os três genes.

Todas as análises seguintes foram realizadas para os pacientes que tiveram

tanto o subtipo do HIV quanto os alelos do HLA determinados (n = 81).

5.1 CONSTRUÇÃO DAS BIBLIOTECAS

As bibliotecas foram preparadas com sucesso, de acordo com as

especificações do fabricante dos reagentes, com exceção de uma variação na

primeira etapa, onde foi estabelecido um tempo maior, de 8 minutos, para a

fragmentação. Essa alteração foi estendida para todas as bibliotecas ao se observar

uma maior eficiência da fragmentação em nosso produto a ser sequenciado,

alcançando assim fragmentos menores. A média do tamanho das bibliotecas foi de

aproximadamente 1.000 pb e a média da concentração final foi de 2,88 nM.

5.2 ANÁLISE POR FASTQC E FILTRAGEM

Todas as amostras sequenciadas na plataforma Illumina HiSeq 2500 foram

submetidas à análise no programa FastQC antes e após a filtragem. A análise do

relatório gerado nos permitiu observar diversos parâmetros dos reads de cada

biblioteca sequenciada. O número médio de reads antes da filtragem foi de

2.773.135 reads (263.339 – 11.283.078), o tamanho médio foi de 99-mer (96 – 100)

e a qualidade média foi de aproximadamente 28 (20 – 32) na escala Phred. Apenas

duas amostras apresentaram presença de base indeterminada (N) em 10 a 20% do

read nas primeiras posições (entre os nucleotídeos 15 e 29). A inspeção visual de

cada gráfico de qualidade média gerado no relatório nos permitiu observar que 79%

(n = 64) das amostras apresentaram reads com pior qualidade nas últimas bases,

Page 60: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

60

porém essa qualidade se mostrou em torno de 20 na escala Phred, que é

considerada uma qualidade entre intermediária e ruim.

De acordo com a qualidade média observada, a quantidade de reads gerados

no sequenciamento e o tamanho das sequências, foi realizada uma filtragem dos

reads no programa Sickle-Master. Foram filtrados os reads com qualidade acima de

28 para 91% (n = 74) das amostras e qualidade acima de 30 para o restante,

qualidades consideradas para uma acurácia próxima de 99,9% para a determinação

de base na escala Phred. Ambas as filtragens tiveram o limite mínimo do tamanho

do read em 20-mer. Esses reads filtrados foram utilizados nas análises posteriores, e

os demais que não alçaram os valores determinados para qualidade e tamanho

foram descartados pelo programa.

Após essa etapa, os reads filtrados foram submetidos novamente ao

programa FastQC e os resultados comparados com os anteriores. O número médio

de reads observado foi de 2.007.081 reads (49.138 – 7.337.120), o tamanho variou

de 20 a 100-mer e a qualidade média foi de 31 (28 – 32) na escala Phred. Abaixo,

na Fig.5.2.1, temos um exemplo de gráfico de qualidade média dos reads por

posição nucleotídica antes e após a filtragem.

Page 61: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

61

Figura 5.2 .1. Exemplo de gráfico de qualidade dos reads por posição nucleotídica gerado pelo

programa FastQC da amostra 349. A – antes da filtragem; B – após a filtragem. Em ambos os

gráficos – as qualidades consideradas ruins estão em rosa, as intermediárias em amarelo e as

A

B

Page 62: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

62

qualidades boas em verde. A linha azul corresponde à qualidade média de todos os reads por

posição nucleotídica.

5.3 MONTAGEM DE NOVO

A montagem de novo foi realizada com o auxílio do programa Velvet para três

amostras escolhidas de forma aleatória para assim reconstruir os alelos de HLA-A, B

e C sem o auxílio de uma sequência-referência. Foram feitas modificações em

alguns parâmetros na tentativa de se construir melhores contigs. Todas amostras

foram testadas com diferentes tamanhos de k-mers, variando de 90 a 30.

Para a amostra 181, como primeira tentativa foram feitos testes com todos os

parâmetros no modo padrão (cobertura esperada, tamanho do inserto, scaffolding),

porém foram gerados diversos contigs, sendo que na maioria dos casos menores

que 1000 pb. Na segunda bateria de testes, o tamanho mínimo do contig foi alterado

para 1000 pb, porém a maioria dos contigs gerados e observados no programa

Quast, possuía grande quantidade de Ns. Os contigs foram submetidos à ferramenta

Blast do banco de dados do NCBI (disponível em

http://blast.ncbi.nlm.nih.gov/Blast.cgi), e nenhum se assemelhou com genes do HLA.

Para as amostras 338 e 404, também foram testados os parâmetros de

tamanho de inserto de 800 pb e número mínimo de pares de reads de 20. Todos os

testes foram repetidos para os diversos k-mers, porém não foi gerado nenhum

contig.

5.4 MONTAGEM COM REFERÊNCIA

A montagem com referência foi realizada com o auxílio do programa Bwa

para as mesmas três amostras testadas na montagem de novo. Os parâmetros

modificados para os alinhamentos foi o valor de n de 5, 10, 0.08, 0.10 e 0.14 e

modificação das referências utilizadas, sozinhas ou concatenadas (sequência-

referência criada concatenando a referência HLA-A, seguida da referência HLA-B e

da HLA-C, formando apenas uma sequência no final). Nos alinhamentos podemos

observar os polimorfismos presentes nos alelos e a alta cobertura dos alinhamentos

(Fig. 5.4.1).

Page 63: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

63

Figura 5.4 .1. Exemplo de reconstrução dos genes HLA-A, B e C da amostra 181, em ordem na figura, com o auxílio do programa Bwa e visualizado

no IGV. Os traços coloridos representam polimorfismos encontrados em relação a referência usada no alinhamento. A cobertura variou de 0-25998 reads. As

regiões sem cobertura correspondem a regiões dos genes que não são amplificadas pelo conjunto de iniciadores utilizados.

Page 64: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

64

5.5 TIPAGEM DO HLA PELO SOFTWARE OMIXON-TARGET

Todas as 81 amostras foram tipadas com o auxílio do programa Omixon

Target, totalizando 162 alelos para cada lócus (HLA-A, B e C). A tipagem foi

realizada com os seguintes parâmetros de configuração do programa: tamanho do

inserto de 800 pb, até 1.000.000 de reads, ignorar crossmapping (reads que se

alinham em mais de uma posição diferente são retirados), tipagem de até 8 dígitos.

Análises de tipagem de amostras que falharam foram novamente submetidas ao

algoritmo, porém com quantidade máxima de reads de 100.000 reads. Os alelos

mais frequentes oriundos da tipagem das amostras podem ser visualizados nas

Figuras 5.5.1 a 5.5.3, e a proporção de heterozigotos e homozigotos encontrada

para cada lócus pode ser observada na Fig. 5.5.4.

Figura 5.5 .1. Alelos de HLA-A encontrados na casuística com frequência maior que 1%.

Page 65: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

65

Figura 5.5 .2. Alelos de HLA-B encontrados na casuística com frequência maior que 1%.

Figura 5.5 .3. Alelos de HLA-C encontrados na casuística com freqüência maior que 1%.

Page 66: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

66

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

HLA-A HLA-B HLA-C

Homozigoto

Heterozigoto

Figura 5.5 .4. Proporção de heterozigotos e homozigotos encontrada para cada lócus

analisado.

Os alelos do HLA-A e HLA-B foram agrupados em supertipos de acordo com

a classificação apresentada por Sidney e colaboradores (Fig. 5.5.5 e 5.5.6). Alelos

que não são classificados em supertipo não foram contabilizados, com isso apenas

155 alelos para HLA-A e 109 para HLA-B puderam ser classificados em supertipos.

Podemos notar uma maior prevalência dos supertipos A03 e B07 na casuística

estudada.

Figura 5.5 .5. Prevalência dos supertipos do HLA-A na casuística estudada.

Page 67: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

67

Figura 5.5 .6. Prevalência dos supertipos do HLA-B na casuística estudada.

A taxa de detecção e a cobertura média determinada pelo programa durante a

tipagem dos alelos foi analisada para os três loci. Cerca de 72% dos alelos de HLA-

A, 80% dos alelos de HLA-C e 99% de HLA-B apresentaram uma taxa de detecção

entre 98 – 100%, o restante apresentou taxas entre 95 – 97%. A cobertura média

para os alelos determinados de HLA-A foi de aproximadamente 2462 reads (77,1 -

13100), para o HLA-B foi de 4210 reads (35,5 - 15100) e o HLA-C apresentou 3341

reads (42,3 - 23910).

Alguns alelos apresentaram discordância ou dúvidas em uma análise mais

aprofundada onde foram avaliados os valores de detecção e cobertura dos alelos

classificados como melhores candidatos e o alinhamento gerado pelo programa

entre os reads da amostra. O alelo HLA-C*04:09N não conseguiu ser distinguido do

alelo C*04:01:01, visto que em várias instâncias ambos foram considerados na

tipagem pelo programa como melhores candidatos. Outro problema parecido

ocorreu na amostra 423 para o HLA-B, onde foram considerados vários melhores

candidatos para o mesmo alelo. Além disso, o programa apresentou por vezes

alelos com taxa de detecção e cobertura muito próximas dos alelos definidos como

melhores candidatos, causando dúvida na tipagem.

Os casos acima foram submetidos ao alinhamento no programa Bwa com as

devidas referências dos alelos candidatos para a tentativa de se resolver as dúvidas

existentes. Como exemplo nós podemos apontar a dúvida entre A*01:01:01 e

Page 68: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

68

A*01:11N para um dos alelos de HLA-A das amostras 377, 382, 391 e 404, onde o

alinhamento pelo Bwa mostrou que na posição discordante (nucleotídeo 1268) o

nucleotídeo que distingue o alelo A*01:11N do A*01:01:01 (timina ao invés de

guanina) não era observado dentre os reads (Fig. 5.5.7). Nestes casos, a tipagem

não resolvida com o programa Omixon Target foi resolvida com esta estratégia.

Page 69: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

69

Figura 5.5 .7. Alinhamento das amostras com dúvida entre os alelos A*:01:01:01 e A*01:11N pelo programa Bwa e visualizado pelo IGV. A posição 1268 que distingue os dois alelos está realçada na figura onde podemos observar no quadrado azul a presença de 100% de guanina. Em colorido se encontram as trocas entre os reads da amostra e a referência.

Page 70: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

70

5.6 PREVALÊNCIA DOS SUBTIPOS E PERFIL EPIDEMIOLÓGICO DOS

PACIENTES HIV+

A classificação viral dos pacientes contemplados nesse estudo e que tiveram

o HLA-A, B e C sequenciados e tipados (n = 81) mostrou que 46% dos pacientes

estavam infectados pelo subtipo B, 31% pelo subtipo C, 14% por recombinantes

únicos BC, 7% por recombinantes únicos BF e 2% por recombinantes únicos BCF.

Os dados clínico-epidemiológicos dos pacientes HIV+ estudados neste

trabalho obtidos a partir dos questionários preenchidos pelos clínicos locais foram

compilados e estão representados na Tabela 5.6.1.

Para os 81 pacientes analisados, a média de idade foi de aproximadamente

39 anos e 52% era do sexo feminino. A média do tempo de diagnóstico foi de 77

meses. A maior parte dos pacientes se encontrava em estágio CDC clínico A (46%)

e estágio CDC imunológico 3 (42%). Dentre os pacientes, 83% estavam em

tratamento antirretroviral e apenas 31 (38%) com carga viral indetectável. Foram

analisados também dados de carga viral e contagem de células CD4 anterior ao

início do tratamento de 31 pacientes. A mediana de carga viral antes do início do

tratamento foi de 30.000 cópias/µl, enquanto aquela após o início do tratamento foi

de 3.477,5 cópias/µl. A mediana da contagem de células CD4 antes do início do

tratamento foi de 226,5 células/mm3 de sangue, enquanto que após o tratamento foi

de 316 células/mm3.

Page 71: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

71

Tabela 5.6 .1. Dados clínico-epidemiológicos obtidos dos prontuários dos 81 pacientes tipados para o

HLA-A, B e C neste estudo.

Dados N = 81 Sexo

Feminino 42 (52%)

Masculino 39 (48%)

Media de idade 39 anos Tempo médio de diagnóstico

77 meses

Estágio CDC clínico A 37 (46%) B 11 (14%) C 19 (23%) ND 14 (17%) Estágio CDC imunológico

1 2 (2%)

2 30 (37%) 3 34 (42%) ND 15 (19%) Status de tratamento Sim 67 (83%) Não 14 (17%) Mediana carga viral (AT)*

30.000 cópias/µl(80-4500000)

Mediana contagem CD4 (AT)* 226,5 células/mm3 (35-1081)

Mediana carga viral (T)** 3477,5 cópias/µl (50-278151)

Mediana contagem CD4 (T)** 316 células/mm3 (8–1171)

Carga viral indetectável (T)** 31 pacientes

* - AT= dados antes do início do tratamento (n=31) ** - T= dados após início do tratamento (n=81) ND= dado não disponível

5.7 CORRELAÇÃO DOS ALELOS DO HLA COM OS DADOS CLÍNICOS E

SUBTIPOS DO HIV-1

Os dados de carga viral, contagens de CD4, antes e após o tratamento, e

subtipos virais foram relacionados aos alelos determinados para cada paciente

através do teste exato de Fisher. Os resultados desta análise estão representados

nas Tabelas 5.7.1 a 5.7.5.

Page 72: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

72

Com os dados de carga viral antes do início do tratamento (n = 31 pacientes/

62 alelos), foi encontrada uma maior frequência do alelo B*51:01:01 com pacientes

de carga viral abaixo de 100000 cópias/ µl de sangue total) (p = 0,02). Para os dados

de carga viral após o início do tratamento (n = 81 pacientes/ 162 alelos) foram

encontradas maiores frenquências dos alelos A*11:01:01, A*30:01:01,

C*04:09N/04:01:01:01, C*06:02:01:01 e supertipo B62 com pacientes de carga viral

indetectável (abaixo de 50 cópias/ µl de sangue total) (p = 0,04). Todos esses alelos

foram considerados como possíveis fatores protetores do hospedeiro contra a

progressão da doença causada pelo HIV (Tabela 5.7.1).

Foram encontradas algumas tendências de maior frequência com valores de

p menores que 0,1 e maiores que 0,05. Para estes casos, testes de Fisher foram

refeitos com os números de casos dobrados, e os valores encontrados atingiram

significância estatística (p ≤ 0,05). O alelo C*07:50 e o supertipo B07 foram mais

frequentes em pacientes de carga viral abaixo de 100000 cópias/ µl de sangue total

(dados de carga viral antes do tratamento), considerados como possíveis tendências

a alelos protetores. Para os dados de carga viral após tratamento, foi encontrada

uma possível tendência protetora do supertipo A01/A03. Já o alelo C*08:02:01:01 e

o supertipo B44 foram mais freqüentes em pacientes com carga viral acima de

100000 cópias/ µl de sangue total e carga viral detectável (acima de 50 cópias/ de

sangue), respectivamente, sendo considerados como possíveis alelos de maior risco

de progressão em pacientes HIV+ (Tabela 5.7.1).

Page 73: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

73

Tabela 5.7 .1. Associações dos alelos de HLA-A, B e C com os dados de carga viral dos pacientes,

antes e após o início do tratamento.

Alelos Carga viral (CV) Valor de p Tendência 1

CV antes do tratamento

(n = 62)

CV<100000♪

(n=40)

CV>100000♪

(n=22)

B*51:01:01 11 (27%) 1 (4%) p=0,02

C*07:50 6 (15%) 0 p=0,06 p=0,003

Supertipo B07 ● 21 (68%) 4 (40%) p=0,09 p=0,019

Supertipo B44 ● 2 (6%) 3 (30%) p=0,07 p=0,01

CV depois do tratamento

(n = 162)

CV<50♪

(n=68)

CV>50♪

(n=94)

A*11:01:01 5 (7%) 1 (1%) p=0,04

A*30:01:01 5 (7%) 1 (1%) p=0,04

C*04:09N/04:01:01:01 9 (13%) 5 (5%) p=0,04

C*06:02:01:01 5 (7%) 1 (1%) p=0,04

C*08:02:01 2 (3%) 8 (8%) p=0,098 p=0,02

Supertipo B62 ♦ 5 (10%) 1 (2%) p=0,04

Supertipo A01/A03 ♥ 4 (8%) 1 (1%) p=0,07 p=0,01 1= Valores de p referentes ao teste de Fisher com os valores dobrados proporcionalmente. ♪= cópias/ml de plasma ●= n = 41 (CV < 50, n = 31; CV ≥ 50, n = 10) ♦= n = 105 (CV < 50, n = 45; CV ≥ 50, n = 60) ♥= n = 149 (CV < 50, n = 60; CV ≥ 50, n = 89)

Para a contagem de células CD4 antes do início do tratamento (n = 30

pacientes/ 60 alelos) encontramos uma maior frequência do alelo B*35:01:01 em

indivíduos com contagem de CD4 > 350 células/mm3 de sangue (p = 0,05),

indicando uma possível associação do alelo a uma progressão mais lenta da

doença. De forma oposta, o supertipo A03 foi relacionado à indivíduos com

contagem de CD4 < 350 células/mm3 (p = 0,01). Referente os dados posteriores ao

tratamento (n = 81 pacientes/ 162 alelos), encontramos maior frequência dos alelos

Page 74: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

74

A*31:01:02, B*14:02:01 e C*08:02:01 e dos supertipos B27 e B44 em pacientes com

contagem de CD4 < 350 células/mm3 (p = 0,02; p = 0,009; p = 0,01; p = 0,009 e p =

0,05, respectivamente), indicando uma possível associação com pior desfecho

clínico. Já o alelo C*04:30 se mostrou mais freqüente em pacientes com contagem

de CD4 > 350 células/mm3 (p = 0,04), sugerindo este alelo como um provável fator

protetor do hospedeiro para uma progressão mais lenta da doença (Tabela 5.7.2).

Foram encontradas tendências de maior frequência do alelo A*02:01:01 e

supertipo A02 com contagem de CD4 < 350 células/mm3 de sangue, com dados

prévios ao início do tratamento. Com os dados de contagem de CD4 após o

tratamento, foram encontrados mais freqüentemente os alelos B*07:02:01,

B*49:01:01 e C*06:02:01:01 em pacientes com CD4 > 350 células/mm3 e o alelo

C*03:04:01 em pacientes com CD4 < 350 células/mm3 (Tabela 5.7.2).

Page 75: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

75

Tabela 5.7 .2. Associações dos alelos de HLA-A, B e C com os dados de contagem de célula CD4 dos

pacientes, antes e após o início do tratamento.

Alelos Contagem CD4 Valor de p Tendência 1

CD4 antes do tratamento

(n=60)

CD4<350♪

(n=46)

CD4>350♪

(n=14)

B*35:01:01 0 2 (14%) p=0,05

Supertipo A03 ● 9 (20%) 7 (58%) p=0,01

A*02:01:01 14 (30%) 1 (7%) p=0,06 p=0,007

Supertipo A02 ● 14 (32%) 1 (8%) p=0,08 p=0,01

CD4 após o tratamento

(n=162)

CD4<350♪

(n=88)

CD4>350♪

(n=74)

A*31:01:02 10 (11%) 2 (3%) p=0,02

B*14:02:01 10 (11%) 1 (1%) p=0,009

C*08:02:01 9 (10%) 1 (1%) p=0,01

C*04:30 0 4 (5%) p=0,04

Supertipo B27 ♦ 15 (26%) 4 (8%) p=0,009

Supertipo B44 ♦ 11 (19%) 16 (31%) p=0,05

B*07:02:01 3 (3%) 7 (9%) p=0,07 p=0,01

B*49:01:01 3 (3%) 7 (9%) p=0,07 p=0,01

C*03:04:01 6 (7%) 1 (1%) p=0.07 p=0,01

C*06:02:01:01 1 (1%) 5 (7%) p=0,06 p=0,006 1 = Valores de p referentes ao teste de Fisher com os valores dobrados proporcionalmente. ♪ = células/mm3 de sangue ● = n = 56 (CD4 < 350 n = 44; CD4 > 350 n = 12) ♦ = n = 109 (CD4 < 350 n = 58; CD4 > 350 n = 51)

Os alelos de HLA determinados pela tipagem (n = 81 pacientes/ 162 alelos) e

os supertipos foram associados aos subtipos do HIV-1 infectante. Para isso os

pacientes foram divididos quantos a presença ou ausência do subtipo B, C ou

Page 76: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

76

recombinante BC. Esses resultados podem ser visualizados nas Tabelas 5.7.3 a

5.7.5.

Para as análises relativas ao subtipo B foram encontradas maiores

frequências dos alelos A*02:01:01, B*50:01:01 e supertipo A02 em pacientes

infectados pelo subtipo B (p = 0,02; p = 0,03 e p = 0,03 respectivamente). Já os

supertipos A03 e B27 foram mais freqüentes em pacientes infectados por subtipo

não-B (p = 0,05 e p = 0,03 respectivamente). Também foram encontradas

tendências de possíveis associações do alelo C*04:09N/04:01:01:01 e do supertipo

A24 a infecção por subtipos não-B (Tabela 5.7.3).

Tabela 5.7 .3. Associações dos alelos de HLA-A, B e C com o subtipo B dos pacientes

infectados.

Alelos Subtipo B

(n = 74)

Subtipo ñ-B

(n = 88) Valor de p Tendência 1

A*02:01:01 23 (31%) 16 (18%) 0,02

B*50:01:01 6 (8%) 1 (1%) 0,03

Supertipo A02* 26 (37%) 19 (24%) 0,03

Supertipo A03* 18 (26%) 29 (38%) 0,05

Supertipo B27** 5 (10%) 14 (25%) 0,03

C04:09/04:01:01:01 4 (5%) 10 (11%) 0,09 0,03

Supertipo A24* 11 (16%) 18 (23%) 0,09 0,04 1 = Valores de p referentes ao teste de Fisher com os valores dobrados proporcionalmente. * - n = 149 (para subtipo B = 70; n para subtipo não-B = 79) ** - n = 105 (para subtipo B = 49; n para subtipo não-B = 56)

As análises dos alelos de HLA-A, B e C e supertipos mais frequentes

correlacionados a infecção pelo subtipo C mostraram maiores frequências dos alelos

A*23:01:01 (p = 0,04), B*49:01:01 (p = 0,04), C*07:50 (p = 0,05) e supertipos A24 (p

= 0,04) e B07 (p = 0,001) em pacientes infectados pelo subtipo C, ao passo que

apenas o supertipo A01 se mostrou mais frequente em pacientes infectados por

subtipo não-C (p = 0,04) (Tabela 5.7.4).

Page 77: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

77

Tabela 5.7 .4. Associações dos alelos de HLA-A, B e C com o subtipo C dos pacientes

infectados.

Alelos Subtipo C

(n = 50)

Subtipo ñ-C

(n = 112) Valor de p

A*23:01:01 6 (12%) 4 (4%) 0,04

B*49:01:01 6 (12%) 4 (4%) 0,04

C*07:50 5 (10%) 3 (3%) 0,05

Supertipo A01* 4 (9%) 20 (20%) 0,04

Supertipo A24* 13 (28%) 16 (16%) 0,04

Supertipo B07** 18 (53%) 27 (23%) 0,001

* - n = 149 (para subtipo C = 47; n para subtipo não-C = 102) ** - n = 105 (para subtipo C = 34; n para subtipo não-B = 115)

Por último, as análises de associação dos alelos e supertipos ao

recombinante BC mostraram maiores frequências do alelo A*31:01:02 e supertipo

A01 com pacientes infectados por recombinante não-BC (p = 0,001 e p = 0,01

respectivamente). Já os supertipos B27 e A03 apresentaram uma maior frequência

em pacientes infectados por recombinante BC (Tabela 5.7.5).

Tabela 5.7 .5. Associações dos alelos de HLA-A, B e C com o recombinante BC dos pacientes

infectados.

Alelos

Recombinante

BC

(n = 22)

Recombinante

ñ-BC

(n = 140)

Valor

de p Tendência 1

A*31:01:02 6 (27%) 6 (43%) 0,001

Supertipo A01* 2 (9%) 43 (34%) 0,01

Supertipo B27** 5 (38%) 14 (10%) 0,01

Supertipo A03* 10 (45%) 37 (29%) 0,06 0,01 1 = Valores de p referentes ao teste de Fisher com os valores dobrados proporcionalmente. * - n = 149 (para recombinante BC = 22; n para recombinante não-BC = 12 ** - n = 105 (para recombinante BC = 13; n para recombinante não-BC = 136)

Foram feitas outras análises em que os pacientes foram divididos quanto ao

subtipo viral que os infectava e feitas associações dos alelos e supertipos mais

prevalentes para cada subtipo com a carga viral. Apenas os dados de carga viral

Page 78: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

78

após o início do tratamento para os pacientes infectados pelos subtipos B ou C

mostraram resultados estatisticamente significantes. Para os pacientes infectados

pelo subtipo B, foram encontradas maiores frequências dos supertipos A03 (p =

0,001) e A24 (p = 0,02) em pacientes com carga viral acima de 50 cópias/µl de

plasma. Também foram encontradas tendências de possíveis associações do alelo

B*07:02:01 com carga viral indetectável e do supertipo B27 com carga viral acima de

50 cópias/µl. O subtipo C teve apenas uma tendência de associação do supertipo

B62 com carga viral indetectável.

6 DISCUSSÃO

A nova metodologia de sequenciamento por NGS traz grandes vantagens

para o sequenciamento completo e tipagem de HLA, uma vez que através de suas

técnicas é possível resolver as ambiguidades de tipagem desses haplótipos

compostos por genes altamente polimórficos, obter a sequência completa de HLA de

vários pacientes de uma única vez, além de reduzir o tempo de trabalho manual e o

custo.

Sequências completas de HLA são essenciais para estratégias que visam

minimizar o risco de doença enxerto versus hospedeiro em transplante

hematopoiético, dado que determinantes desconhecidos podem estar localizados ao

redor dos genes de HLA. Também foi relatado que níveis de expressão de HLA

estão relacionados a diferentes fenótipos de doenças. Portanto, variantes genéticos

em elementos regulatórios como íntrons e promotores devem ser analisados

(HOSOMICHI et al., 2013).

Apesar das técnicas de NGS terem se mostrado tecnologias de

sequenciamento mais baratas e altamente eficazes para a tipagem, sem

ambiguidades e de alta resolução da sequência completa de HLA, elas ainda são

pouco empregadas na rotina clínica e até mesmo na pesquisa científica devido à

difícil análise e manipulação dos dados gerados (DE SANTIS et al., 2013). Portanto,

se fazem necessários maiores estudos e desenvolvimento de metodologias e

programas de análise de dados para uma melhor tipagem dos alelos de HLA

oriundos de sequenciamento por NGS.

Erros de sequenciamento tendem a se acumular no fim das sequencias

geradas fazendo com que reads longos tenham vantagens em relação a reads

Page 79: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

79

pequenos, uma vez que os primeiros podem ser filtrados nas suas extremidades,

minimizando possíveis erros (GRUMBT et al., 2013). Além disso, reads maiores

fornecem vantagens frente a mapeamentos incorretos devido à similaridade de

regiões ou pseudogenes.

A taxa de erro obtida pelo sequenciamento por NGS é maior do que a pelo

método de Sanger, sendo a plataforma Illumina aparentemente associada a uma

menor taxa de erro quando comparada com outras metodologias de tipagem como

454 ou Ion Torrent (DE SANTIS et al., 2013; GRUMBT et al., 2013). Sabe-se que as

taxas de erro são significativamente reduzidas ao se aumentar a profundidade de

cobertura do sequenciamento, porém ainda não existe um consenso definido sobre

a medida necessária de cobertura a ser atingida em sequenciamento de regiões

completas (GRUMBT et al., 2013).

As bibliotecas de HLA-A, B e C sequenciadas nesse estudo foram realizadas

com identificação dos reads por paciente, uma nova abordagem nunca feita antes

para esses genes. Todos os artigos publicados nesse tema utilizaram uma

identificação por gene, e não por paciente (no qual todos os três genes de um

mesmo paciente apresentam a mesma sequencia identificadora). O produto do

sequenciamento se mostrou com alta qualidade, como pode ser observado no

relatório do programa FastQC, o que minimiza a taxa de erro presente nas

sequências. Após a filtragem foram selecionados apenas os reads com melhor

qualidade, garantindo uma tipagem mais eficaz do HLA.

De todos os artigos publicados sobre sequenciamento de HLA por NGS,

apenas dois utilizaram as plataformas da Illumina HiSeq e MiSeq (HOSOMICHI et

al., 2013; WANG et al., 2012). A vantagem da plataforma MiSeq seria a produção de

reads maiores que 100 pb, taxa geralmente produzidas na plataforma HiSeq, porém

autores mostraram sucesso na tipagem de HLA também com o sequenciamento

nesta última plataforma (WANG et al., 2012). A grande vantagem de se obter reads

maiores se deve ao fato dos genes do HLA compartilharem muita similaridade entre

si e de muitos alelos se diferirem apenas por uma posição nucleotídica. Com reads

maiores a montagem se torna mais fácil, pois eles podem apresentar mais

nucleotídeos que possam ser característicos do alelo a ser reconstruído, evitando a

“contaminação” por reads de sequências parecidas. No entanto, com o

sequenciamento paired end, essa informação específica de pares de reads pode ser

Page 80: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

80

usada para evitar os alinhamentos incorretos, na ausência de reads longos. Essas

“contaminações” de reads foram observadas também ao longo das nossas análises

e foram levadas em consideração na tipagem do alelo.

A montagem de novo realizada com auxílio do programa Velvet não atingiu o

objetivo de montagem de alelos de HLA-A, B e C sem o intermédio de uma

referência. Uma grande limitação pode ser a similaridade entre os loci e o fato deles

terem sido sequenciados juntos, com o mesmo barcode (identificação por paciente),

causando “contaminações” de reads de outro loci, como já discutido anteriormente.

Além disso, o grande número de polimorfismos presentes nesses genes também

contribui para dificultar a montagem de novo. Outras análises com modificações em

diferentes parâmetros ou tentativas com outros programas utilizando diferentes

algoritmos se fazem necessárias para a resolução desse problema.

Por outro lado, a reconstrução dos alelos pela montagem com referência no

programa Bwa foi promissora. Através da visualização do alinhamento fomos

capazes de observar que todos os éxons sequenciados atingiram alta cobertura de

reads e que vários polimorfismos foram apontados. Essas montagens foram feitas

tendo como base as referências de HLA-A, B e C do RefSeq disponíveis no

GenBank, que em tese seriam diferentes do alelo seqüenciado na maioria dos

casos. Portanto, os polimorfismos visualizados determinam as diferenças

encontradas entre a sequência-referência utilizada e o alelo referente a cada

amostra. Para se identificar e tipar os alelos são necessárias análises de

determinação de variantes onde cada polimorfismo é analisado e julgado quanto à

qualidade e frequência, para então gerar uma sequência-consenso da variante (duas

no caso de heterozigotos), e por fim realizar a classificação do alelo. Essas análises

não foram incluídas nesse estudo devido a limitações de tempo, porém já se

encontram em desenvolvimento.

Vários estudos de sequenciamento de HLA por NGS têm inerentes limitações

por realizaram sua determinação de alelos em programas que possuem

metodologias que se baseiam em alinhamento dos reads à sequencias-referência do

banco de dados do IMGT/HLA. Uma dessas limitações seria que a maioria dessas

sequências de HLA são incompletas (contendo apenas éxons) e que poucas

correspondem às especificações de alelos bem documentados (CWD), dificultando a

tipagem e aumentando as chances de uma tipagem errônea (BENTLEY et al., 2009;

Page 81: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

81

GABRIEL et al., 2014; HOLCOMB et al., 2011; LIND et al., 2010). Além disso, essas

metodologias são limitadas para a descrição de alelos novos, uma vez que elas

buscam apenas alinhar os reads às sequencias-referência de alelos já descritos.

Apenas três estudos desenvolveram algoritmos ou pipelines próprios de

tipagem, porém os dois mais recentes não se encontram disponíveis para uso

público (HOSOMICHI et al., 2013; WANG et al., 2012) e o terceiro (ERLICH, 2012),

apesar de disponível, não se encontra mais sob desenvolvimento e suporte da

ferramenta GATK da Broad Institute, estando sujeito a erros e desatualizações. Os

outros estudos de tipagem de HLA por NGS fizeram uso de programas comerciais

desenvolvidos para a tipagem de HLA e que utilizam o banco de dados do

IMGT/HLA. Esses programas são comercializados no mundo todo e passaram por

extenso processo de validação, apesar de apresentarem limitações como as

destacadas acima. Nesse contexto de limitações, o programa Omixon-Target

apresentou resultados satisfatórios de tipagem em sua publicação com concordância

superior a 90% para reads maiores de 90 pb e alta cobertura (MAJOR et al., 2013).

Nossos reads se assemelham a essas características testadas e o programa foi

selecionado então para a tipagem dos alelos de HLA.

Uma vez que ainda não há um consenso sobre o valor ideal de cobertura,

diversos estudos estipularam diferentes valores de cobertura mínima ou média

necessária para fornecer resultados confiáveis de tipagem, como cobertura mínima

de 20 reads (ERLICH, 2012; WANG et al., 2012) ou cobertura média de 50

(GRUMBT et al., 2013). A tipagem pelo programa Omixon apresentou uma cobertura

média para os alelos de HLA-A de aproximadamente 2462 reads (77,1 - 13100),

para o HLA-B, de 4210 reads (35,5 - 15100) e para o HLA-C, de 3341 (42,3 -

23910). Todas as coberturas mínimas encontradas para os três loci foram superiores

a 20 reads e a cobertura média muito superior a 50. Porém esses valores são

altamente questionáveis, uma vez que variam dependendo da metodologia de

sequenciamento e tipagem.

Algumas dúvidas de tipagem pelo programa Omixon foram resolvidas através

de uma análise mais profunda do alinhamento gerado no programa ou através de

alinhamento obtido no programa Bwa, Nestes casos, a amostra era sujeita a todos

os alelos candidatos sugeridos pelo Omixon e os polimorfismos que os diferiam

eram analisados manualmente até se encontrar os alelos sem ambiguidade e com

Page 82: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

82

alta cobertura. Como exemplos, nós podemos apontar os casos do alelo HLA-

C*04:09N, que o algoritmo não consegue distinguir do alelo C*04:01:01 na tipagem,

ambos sendo considerados como melhores candidatos para a amostra; e do alelo

HLA-A*01:01:01 que apresentou taxas de detecção e cobertura similares ao

A*01:11N. Nesse segundo caso, a resolução foi possível através do alinhamento

pelo Bwa, descartando o alelo nulo como candidato, porém o mesmo não foi

possível para o primeiro caso. Vários alelos de HLA não expressos possuem

polimorfismos fora da região que codifica a fenda de ligação a peptídeos e a

identificação desses alelos nulos é critica para transplantes de medula óssea, uma

vez que a confusão com um variante normalmente expresso pode resultar em

mismatching entre doador e receptor (GRUMBT et al., 2013; HOSOMICHI et al.,

2013). O potencial impacto clínico de mismatches fora da região de reconhecimento

de antígeno ainda deve ser investigado mais aprofundadamente.

Durante a análise dos casos de tipagem com múltiplos candidatos (três ou

mais) com o uso do programa Omixon-Target, podemos notar similaridade entre as

sequências dos três alelos considerados como candidatos, ou seja, um dos alelos

candidatos se assemelhava a um segundo alelo na sua primeira metade da

sequência e a um terceiro na sua metade restante. Esses três alelos candidatos

apresentaram taxa de detecção e cobertura parecidas, tornando a tipagem da

amostra impossível de ser resolvida. Como o programa utiliza as sequências do

banco de dados do IMGT/HLA que apresentam apenas os éxons, já que as

completas estão infinitamente em menor quantidade, sua tipagem está sujeita a

ambiguidades de tipagem como a descrita.

A taxa de detecção abaixo de 97% em mais de 20% dos alelos de HLA-A e C

apresentada pelo programa pode indicar a presença de variantes novos que

poderiam ser caracterizados em novos alelos, uma vez que basta um polimorfismo

ainda não descrito para se classificar um alelo novo. O programa não indica a

presença de novos alelos, mas ela pode ser inferida através dessa análise, tendo

em vista que os reads são comparados apenas a um banco de dados de

sequencias-referência de alelos já descritos e que essas sequências, muita delas

incompletas, também podem ser fruto de uma tipagem errônea devido à

inespecificidade da técnica utilizada. De forma interessante, cabe destacar que

apenas um alelo de HLA-B apresentou taxa de detecção próxima de 95%, porém

Page 83: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

83

esse é o gene mais polimórfico dos três e o que possui um maior número de alelos

descritos.

A casuística estudada, formada por pacientes acompanhados

longitudinalmente por vários anos no Hospital das Clínicas de Porto Alegre,

apresentou em sua maioria pacientes com alta carga viral, baixa contagem de CD4 e

sob tratamento antirretroviral. Esse pacientes podem apresentar mutações de

resistência a drogas ou características genéticas do hospedeiro que contribuem para

a falha terapêutica e imunológica e consequente progressão para aids; ou

contrariamente, para o controle da viremia, como alguns alelos de HLA. Além disso,

muitas dessas mutações podem ter sido originadas na tentativa do vírus de escapar

do sistema imune restrito por alelos de HLA classe I, mostrando que o HIV-1 está

sendo constantemente moldado pelo sistema imune (STEPHENS, 2012).

Os alelos de HLA classe I (A e B) mais encontrados na população brasileira

são HLA-A*02, HLA-B*44, HLA-B*35, HLA-B*51 e HLA-B*07 (BRAUN-PRADO et al.,

2000; DONADI et al., 2000 POLIZEL et al., 2004). Em um estudo mais recente de

Bortolotto e colaboradores desenvolvido com 5000 doadores voluntários de medula

óssea de Porto Alegre, foram encontrados os alelos HLA-A*02, A*03, A*24, A*01

com frequência acima de 10%, enquanto para o HLA-B os alelos B*35, B*44, B*51 e

B*15 foram os mais comumente encontrados na casuística (BORTOLOTTO et al.,

2012). Nossos resultados se mostraram semelhantes, uma vez que os alelos mais

frequentes foram o A*02:01:01, A*24:02:01:01 e B*51:01:01, todos com frequência

acima de 10%. Porém, devido ao baixo número amostral e alta resolução de tipagem

que divide os alelos em mais grupos, as frequências encontradas se mostraram

abaixo de 5% para a grande maioria dos outros alelos encontrados. Estudos com

HLA-C no Brasil são ainda mais escassos, porém os alelos mais encontrados neste

trabalho (frequência > 7%), HLA-C*07:01:01:01, C*02:02:02, C*04 (C*04:09N ou

C*04:01:01:01) e C*12:03:01:01, foram também os mais encontrados em outros

estudos no Sul do Brasil em uma casuística HIV- (FRANCESCHI et al., 2011;

PORTELA et al., 2012).

Os alelos HLA-B*57 e B*27, mais bem caracterizados na literatura quanto à

sua associação com controle da carga viral do HIV e progressão lenta para aids, não

foram encontrados na casuística. Isso pode ser justificado pela maior presença no

nosso estudo de pacientes com prognóstico contrário aos efeitos desses alelos, ou

Page 84: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

84

seja, pacientes com carga viral alta, baixa contagem de CD4 e que necessitam de

tratamento antirretroviral. A grande vantagem da ausência desses alelos seria que

as associações encontradas entre os alelos e baixa carga viral não serão

influenciados pela presença desses alelos protetores do hospedeiro.

Poucos trabalhos têm caracterizado a relação de alelos de HLA com a

modulação da infecção pelo HIV e a progressão da doença no Brasil. Um estudo em

São Paulo levantou possíveis associações entre alelos de HLA e a infecção pelo HIV

e o desenvolvimento de tuberculose em pacientes HIV+, encontrando diversos alelos

de classe I e II com diferenças significativas entre os grupos (FIGUEIREDO et al.,

2008). Outro estudo conduzido em usuários de drogas intravenosas do Rio de

Janeiro falhou em demonstrar prevalências de diferentes alelos HLA-B em pacientes

HIV+ comparados àqueles sem a infecção viral (TEIXEIRA et al., 2009). Um terceiro

estudo, desenvolvido no Nordeste do país, demonstrou que os alelos HLA-Bw4-B*57

e Cw*18 estavam associados com carga viral do HIV mais baixa na fase crônica da

infecção (SILVA et al., 2010). Mais recentemente, um estudo com pacientes HIV+ de

Recife e Pernambuco tratados com o antirretroviral abacavir, relatou uma frequência

significativa do HLA-B*57:01, alelo relacionado à hipersensibilidade à droga

(CROVELLA et al., 2011). Nenhum estudo avaliou a frequência de haplótipos de

HLA em pacientes HIV+ na região Sul do Brasil, uma área com características

genéticas e étnicas distintas do resto do país. Também vale destacar que nenhum

estudo no Brasil sequenciou o HLA-A, B e C por metodologias de sequenciamento

de nova geração.

A região Sul do Brasil é caracterizada por uma epidemia de HIV-1

diferenciada do resto do país. Dados do nosso grupo vêm demonstrando uma

predominância do subtipo C na última década, e o seu espalhamento para outras

regiões do Brasil e para os países do Cone Sul (SANTOS et al., 2007; SANTOS et

al., 2006; SOARES et al., 2005; SOARES et al., 2003a; SOARES et al., 2003b).

Nesse estudo, foi encontrada uma maior prevalência do subtipo B (46%), porém

também foi encontrado um número significativo do subtipo C (31%) e de

recombinantes BC (14%), demonstrando a evolução da prevalência do subtipo C no

sul do Brasil como já descrito na literatura (BRINDEIRO et al., 2003; SOARES et al.,

2005; SOARES et al., 2003a). É importante ressaltar que os pacientes aqui

analisados são pacientes com diagnóstico de infecção para o HIV mais antigo, já

Page 85: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

85

tendo mais de 10 anos sob tratamento antirretroviral. Acreditamos que o perfil

epidemiológico-molecular do HIV deste grupo reflete as prevalências de subtipos da

época, quando o subtipo B ainda prevalecia no Sul do país.

A aparente segregação de subtipos ou recombinantes do HIV-1 em diferentes

regiões geográficas pode estar relacionada ao perfil imunogenético dos grupos

étnicos expostos (STEPHENS, 2012). Assim, o estudo dos haplótipos de HLA em

pacientes infectados pelos subtipos B, C e recombinantes BC, em um contexto

étnico e genético como o da região Sul do Brasil, se torna vital no melhor

entendimento dos fatores genéticos do hospedeiro que respondem a esta infecção

viral.

Frente a esse panorama, foram realizados testes estatísticos na busca de

associações entre os alelos de HLA-A, B e C mais prevalentes e o controle da

viremia do HIV, progressão para a doença e subtipo viral infectante, a fim de

esclarecer essas peculiaridades da infecção pelo HIV-1 no sul do Brasil. Porem, os

testes estatísticos realizados foram análises univariadas preliminares, sendo de

extrema importância a realização futura de testes multivariados de regressão

logística para validar as associações encontradas e excluir a influência de outros

fatores de confusão que poderiam estar mascarando o verdadeiro impacto de alelos

de HLA específicos na infecção pelo HIV. Esses fatores incluem o tempo de

infecção, a adesão a terapia antirretroviral, o(s) esquema(s) terapêutico(s)

administrados, mutações de resistência aos antirretrovirais, doenças oportunistas,

entre outros. Outro fator importante a se considerar nas análises estatísticas seria

que as análises de carga viral do HIV e contagens de CD4 foram realizadas levando

em consideração apenas um ponto de mensuração. Nestas circunstâncias, podemos

estar comparando indivíduos em diversos estágios diferentes da doença, o que

poderia explicar variações na carga viral e contagens de CD4 em detrimento do

efeito do alelo de HLA propriamente dito. Devido a tais limitações do estudo, serão

feitas análises com medidas de carga viral e contagens de CD4 considerando a

variação por um período de tempo, e análises de regressão logística para melhor

robustez dos resultados.

Os dados de carga viral e contagem de CD4, antes e após o tratamento,

relacionados a alelos determinados para cada paciente mostraram algumas

associações estatisticamente significativas, discutidas abaixo. Também cabe

Page 86: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

86

destacar que alguns alelos apresentaram apenas uma tendência de associação por

não ter um número amostral suficiente para alcançar valor estatístico significativo.

Essas associações e tendências com suporte estatístico foram correlacionadas com

as relatadas na literatura.

Os alelos B*51:01:01, A*11:01:01, A*30:01:01 se mostraram mais freqüentes

em pacientes com carga viral abaixo de 100000 cópias/µl de plasma ou carga viral

indetectável (abaixo de 50 cópias/µl de plasma), ao passo que o supertipo A01/A03

mostrou uma tendência de maior freqüência em pacientes com carga viral > 50

cópias/µl. Essas possíveis associações de controle da viremia já foram descritas na

literatura para os dois primeiros alelos, onde foram demonstrados como alelos

protetores do hospedeiro contra a progressão da doença causada pelo HIV-1

(KAWASHIMA et al., 2010 KASLOW et al., 1996 TOMIYAMA et al., 1999; LI e

BOUVIER, 2004; ZHANG et al., 2011). Tais alelos são ditos protetores do

hospedeiro contra a progressão da doença por justamente controlar a infecção

(viremia) através da melhor apresentação de epítopos virais para os linfócitos T

CD8+, que por sua vez desenvolvem resposta citotóxica contra a célula infectada.

Porém, esta é a primeira vez que são descritas prováveis associações para os dois

últimos alelos, associados à carga viral detectável.

O alelo B*14:02:01 foi mais freqüente em pacientes que apresentaram

contagens de CD4 < 350 células/mm3 de sangue, assim como o alelo C*03:04:02,

que também mostrou tendência a tal associação. Apenas o grupo alélico HLA-B*14

já foi associada na literatura à progressão mais lenta pra doença em pacientes

infectados pelo subtipo B, e ao risco de infecção pelo HIV em uma coorte da China,

mostrando um papel contrário (LAZARYAN et al., 2011LI et al., 2007). Na possível

associação descrita neste trabalho, não houve discriminação por subtipo viral. Já os

alelos B*35:01:01 e C*04:30 foram mais frequentemente encontrados em pacientes

com contagens de CD4 > 350 células/mm3 de sangue. Os grupos alélicos B*35 e

C*04 também já foram associados à progressão mais rápida para doença e pior

desfecho clínico na literatura, mostrando um papel contrário ao encontrado por nós

(CARRINGTON et al., 1999). Vale ressaltar aqui que outros estudos mostraram que

dentre os alelos estudados (B*35:01, B*35:02 e B*35:03), o alelo B*35:01 apresenta

progressão mais lenta quando comparado aos demais (GAO et al., 2001). Além

disso, o fato da análise ter se baseado em apenas uma contagem pontual de CD4

Page 87: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

87

pode não representar o quadro geral da progressão da doença nos pacientes

carreadores do alelo.

O alelo C*06:02:01 se mostrou mais freqüente em pacientes com carga viral

indetectável e apresentou tendência de maior freqüência em pacientes com

contagem de célula CD4 > 350 células/mm3 de sangue. Com papel ambíguo, já foi

demonstrada associação desse alelo com carga viral alta e rápida progressão da

infecção (STEPHENS, 2012) e com proteção contra a soroconversão em mulheres

de grupo de risco para infecção pelo HIV (PETERSON et al., 2013). O alelo

C*08:02:01 e o supertipo B44 se mostraram associados a contagens de CD4 > 350

células/mm3 de sangue, e com tendência de associação a carga viral de HIV >

100000 cópias/µl. Tais associações nunca foram demonstradas para o primeiro

alelo, mas já foram demonstradas para o supertipo B44, indicando um possível

papel de risco do hospedeiro para a progressão da infecção, e consequentemente

um pior desfecho da doença (LAZARYAN et al., 2010; LAZARYAN et al., 2011

SCHERER et al., 2004).

Os alelos de HLA mais prevalentes foram testados também para associações

com os subtipos virais encontrados na casuística (subtipo B, C e recombinantes BC).

Das associações encontradas, podemos destacar o alelo A*02:01:01 e o supertipo

A02, que se mostraram mais frequentes em infecção pelo subtipo B e que além

disso, tiveram tendência de maior frequência em pacientes com contagens de CD4 <

350 células/mm3 de sangue. Essa provável associação está sendo descrita pela

primeira vez para o alelo A*02:01:01, mas para o supertipo A02 já foi descrita uma

associação inversa à encontrada por nós, associado a progressão mais lenta da

doença em infectados pelos subtipos B e C (LAZARYAN et al., 2011; MACDONALD

et al., 2000). Aqui novamente, o agrupamento de diferentes alelos em um único

supertipo pode gerar resultados diferentes (até opostos) aos encontrados para alelos

individuais, em função do somatório dos efeitos de todos os alelos representados no

grupo.

O alelo C*07:50 e o supertipo B07 foram mais frequentes em pacientes de

carga viral abaixo de 100000 cópias/µl de plasma, considerados como possíveis

alelos controladores da viremia, mas também foram mais frequentes em pacientes

infectados pelo subtipo C. Porém o supertipo B07 está relatado na literatura como

associado ao risco de evolução mais rápida para aids em uma coorte infectada pelo

Page 88: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

88

subtipo B (LAZARYAN et al., 2010 TRACHTENBERG et al., 2003). Outros fatores

podem estar relacionados com a associação à baixa carga viral, causando essa

dualidade de papeis dos alelos, sendo necessárias análises mais aprofundadas.

O supertipo B27, relacionado ao controle da carga viral do HIV de forma

estabelecida (LAZARYAN et al., 2011 STEPHENS, 2012 NOVITSKY et al., 2003),

apresentou maior freqüência em infecções por subtipo não-B, e contrariamente mais

frequente em pacientes com infecção por recombinantes BC e com contagens de

CD4 < 350 células/mm3. Levantamos a hipótese de que talvez esse supertipo possa

reconhecer melhor epítopos originados de vírus de subtipo B e não reconhecer tão

eficientemente epítopos de recombinantes BC devido a variações existentes entre

eles, o que explicaria as associações encontradas. Essas mesmas associações

também foram encontradas pela primeira vez para os supertipos A03, não havendo

nenhum comparativo na literatura.

Outra associação de maior frequência em infecção por subtipo não-B foi

encontrada para o supertipo A24, assim também como para o subtipo C. De forma

curiosa, Novitsky e colaboradores demonstraram que nativos africanos infectados

pelo subtipo C e com esse supertipo apresentam menores cargas virais e vigorosa

resposta CTL (NOVITSKY et al., 2003). Ressaltamos, portanto, que mais estudos

devem ser realizados para investigar tais associações, a fim de comprová-las com

maior robustez.

Pela primeira vez descrevemos uma relação do alelo B*50:01:01 com

pacientes infectados pelo subtipo B, e dos alelos A*23:01:01 e B*49:01:01 com

pacientes infectados pelo subtipo C. O alelo A*31:01:02 se mostrou protetor contra a

infecção por recombinantes BC, e o supertipo A01 contra o subtipo C e

recombinantes BC, ambos também sendo descritos também pela primeira vez.

Os pacientes foram divididos quanto ao subtipo viral que os infectava e foram

feitas associações dos alelos e supertipos mais prevalentes para cada subtipo com a

carga viral. Apenas os dados de carga viral após o início do tratamento para os

pacientes infectados pelos subtipos B ou C mostraram resultados significativos,

provavelmente devido ao maior número amostral.

O supertipo B62 que nas primeiras análises se mostrou mais freqüente em

pacientes com carga viral indetectável, também apresentou tendência de maior

frequência em pacientes com carga viral indetectável infectados pelo subtipo C,

Page 89: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

89

podendo indicar um possível fator protetor em indivíduos infectados por esse

subtipo, talvez por uma melhor apresentação de epítopos comuns a esse subtipo em

especifico. Lazaryan e colaboradores já relataram que esse supertipo estaria ligado

a um maior controle da viremia em pacientes americanos HIV+ de origem africana,

ao passo que Scherer e colaboradores descreveram a associação deste supertipo a

uma resposta CTL mais vigorosa (LAZARYAN et al., 2011; SCHERER et al., 2004).

Por último, também foram encontradas tendências de maior frequência do

alelo B*07:02:01 em pacientes com carga viral indetectável. Curiosamente, tal

associação é descrita forma oposta na literatura, relacionando o alelo à rápida

progressão em pacientes infectados pelo subtipo B (KLOVERPRIS et al., 2013).

Mais uma vez essas associações necessitam de análises com maior robustez

estatística para serem comprovadas.

7 CONCLUSÕES

A nova metodologia de sequenciamento por NGS traz grandes vantagens

para o sequenciamento completo e tipagem sem ambiguidades do alelos de HLA-A,

B e C.

A montagem de novo realizada com o programa Velvet não atingiu o objetivo

de montagem de alelos de HLA-A, B e C. Outras análises com modificações em

diferentes parâmetros ou tentativas com outros programas utilizando diferentes

algoritmos se fazem necessárias para a resolução desse problema.

Por outro lado, a reconstrução dos alelos pela montagem com referência no

programa Bwa foi promissora, podendo ser observado no alinhamento que todos os

éxons sequenciados atingiram alta cobertura de reads e que vários polimorfismos

foram apontados. Para se identificar os alelos são necessárias análises de

determinação de variantes que se encontram em desenvolvimento.

Apesar das limitações referentes à tipagem tendo como base o banco de

dados do IMGT/HLA, o programa Omixon-Target foi capaz de tipar todas as

amostras do estudo. Algumas dúvidas foram resolvidas através de uma análise mais

detalhada do alinhamento gerado pelo programa ou através de outro alinhamento

pelo programa Bwa.

Page 90: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

90

Os alelos mais frequentes foram o A*02:01:01, A*24:02:01:01, B*51:01:01

HLA-C*07:01:01:01 e C*02:02:02 corroborando aqueles encontrados em outros

estudos no Sul do Brasil.

A diversidade de subtipos do HIV-1 apontada no Hospital de Clínicas de Porto

Alegre permitiu identificar alta prevalência dos subtipos B, C e recombinantes BC,

além de formas recombinantes únicas, condizente com as prevalências descritas

naquele momento da epidemia.

Os dados de carga viral, contagens de CD4 e subtipo infectante, relacionados

aos alelos de cada paciente mostraram algumas associações de frequência

estatisticamente significativas indicando possíveis papeis de proteção ou risco para

infecção, controle da viremia ou progressão mais rápida para doença, algumas já

descritas na literatura e outras novas, nunca antes relatadas.

Alguns alelos apresentaram tendências de associação, limitadas pelo baixo

número amostral. São necessários mais estudos e análises estatísticas

multivariadas para comprovar a associação de alguns alelos encontrada neste

trabalho, avaliando o controle da infecção do HIV em uma população infectada por

diferentes subtipos.

Poucos trabalhos têm caracterizado a relação de alelos de HLA com a

modulação da infecção pelo HIV e a progressão da doença no Brasil. O estudo dos

haplótipos de HLA em pacientes infectados pelos subtipos B, C e recombinantes BC,

em um contexto étnico e genético como o da região Sul do Brasil, se torna vital no

melhor entendimento dos fatores genéticos do hospedeiro que respondem a esta

infecção viral. Portanto se fazem necessários maiores estudos e desenvolvimento de

novas metodologias e programas de análise de dados para uma melhor tipagem dos

alelos de HLA oriundos de sequenciamento por NGS.

Page 91: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

91

8 REFERÊNCIAS BIBLIOGRÁFICAS

ANISIMOVA, M. e GASCUEL, O. Approximate likelihood-ratio test for branches:

A fast, accurate, and powerful alternative. Syst Biol 2006. 55 (4):539-552.

APOSTOLOPOULOS, V. et al. MHC and MHC-like molecules: structural

perspectives on the design of molecular vaccines. Hum Vaccin 2008. 4 (6):400-

409.

APTSIAURI, N. et al. MHC class I antigens and immune surveillance in

transformed cells. Int Rev Cytol 2007a. 256 139-189.

APTSIAURI, N. et al. Role of altered expression of HLA class I molecules in

cancer progression. Adv Exp Med Biol 2007b. 601 123-131.

BANSAL, A. et al. Immunological control of chronic HIV-1 infection: H LA-

mediated immune function and viral evolution in ado lescents. AIDS 2007. 21

(18):2387-2397.

BARRE-SINOUSSI, F. et al. Isolation of a T-lymphotropic retrovirus from a

patient at risk for acquired immune deficiency synd rome (AIDS). Science 1983.

220 (4599):868-871.

BECK, S. e TROWSDALE, J. The human major histocompatability complex:

lessons from the DNA sequence. Annu Rev Genomics Hum Genet 2000. 1 117-

137.

BENTLEY, G. et al. High-resolution, high-throughput HLA genotyping by next-

generation sequencing. Tissue Antigens 2009. 74 (5):393-403.

BERGAMASCHI, A. e PANCINO, G. Host hindrance to HIV-1 replication in

monocytes and macrophages. Retrovirology 2010. 7 31.

BJORKMAN, P. J. e PARHAM, P. Structure, function, and diversity of class I

major histocompatibility complex molecules. Annu Rev Biochem 1990. 59 253-

288.

Page 92: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

92

BJORKMAN, P. J. et al. The foreign antigen binding site and T cell recogni tion

regions of class I histocompatibility antigens. Nature 1987a. 329 (6139):512-518.

BJORKMAN, P. J. et al. Structure of the human class I histocompatibility

antigen, HLA-A2. Nature 1987b. 329 (6139):506-512.

BONGERTZ, V. et al. HIV-1 diversity in Brazil: genetic, biologic, and

immunologic characterization of HIV-1 strains in th ree potential HIV vaccine

evaluation sites. Brazilian Network for HIV Isolati on and Characterization. J

Acquir Immune Defic Syndr 2000. 23 (2):184-193.

BORTOLOTTO, A. S. et al. HLA-A, -B, and -DRB1 allelic and haplotypic diversi ty

in a sample of bone marrow volunteer donors from Ri o Grande do Sul State,

Brazil. Hum Immunol 2012. 73 (2):180-185.

BOWERMAN, B. et al. A nucleoprotein complex mediates the integration of

retroviral DNA. Genes Dev 1989. 3 (4):469-478.

BRAUN-PRADO, K. et al. HLA class I polymorphism, as characterised by PCR-

SSOP, in a Brazilian exogamic population. Tissue Antigens 2000. 56 (5):417-427.

BRINDEIRO, R. M. et al. Brazilian Network for HIV Drug Resistance Surveilla nce

(HIV-BResNet): a survey of chronically infected ind ividuals. AIDS 2003. 17

(7):1063-1069.

BRUMME, Z. L. et al. Modulation of HIV reservoirs by host HLA: bridging the

gap between vaccine and cure. Curr Opin Virol 2012. 2 (5):599-605.

CANN, A. J. e KARN, J. Molecular biology of HIV: new insights into the vir us

life-cycle. AIDS 1989. 3 Suppl 1 S19-34.

CANO, P. et al. Common and well-documented HLA alleles: report of t he Ad-

Hoc committee of the american society for histocomp atiblity and

immunogenetics. Hum Immunol 2007. 68 (5):392-417.

CARLSON, J. M. et al. Widespread impact of HLA restriction on immune cont rol

and escape pathways of HIV-1. J Virol 2012. 86 (9):5230-5243.

Page 93: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

93

CARRINGTON, M. et al. HLA and HIV-1: heterozygote advantage and B*35-

Cw*04 disadvantage. Science 1999. 283 (5408):1748-1752.

CARRINGTON, M. e O'BRIEN, S. J. The influence of HLA genotype on AIDS.

Annu Rev Med 2003. 54 535-551.

CARRINGTON, M. e WALKER, B. D. Immunogenetics of spontaneous control of

HIV. Annu Rev Med 2012. 63 131-145.

CASADO, C. et al. Host and viral genetic correlates of clinical defin itions of HIV-

1 disease progression. PLoS One 2010. 5 (6):e11079.

CDC 1993 revised classification system for HIV infectio n and expanded

surveillance case definition for AIDS among adolesc ents and adults. 1994

CHOO, S. Y. The HLA system: genetics, immunology, clinical test ing, and

clinical implications. Yonsei Med J 2007. 48 (1):11-23.

CLAPHAM, P. R. e WEISS, R. A. Immunodeficiency viruses. Spoilt for choice of

co-receptors. Nature 1997. 388 (6639):230-231.

COFFIN, J. M. et al. The Interactions of Retroviruses and their Hosts. 1997.

CONSORTIUM, T. M. S. Complete sequence and gene map of a human major

histocompatibility complex. The MHC sequencing cons ortium. Nature 1999. 401

(6756):921-923.

COUTO-FERNANDEZ, J. C. et al. HIV-1 subtyping in Salvador, Bahia, Brazil: a

city with African sociodemographic characteristics. J Acquir Immune Defic Syndr

1999. 22 (3):288-293.

COWAN, M. J. et al. Maternal transmission of acquired immune deficiency

syndrome. Pediatrics 1984. 73 (3):382-386.

CROVELLA, S. et al. Frequency of HLA B*5701 allele carriers in abacavir

treated-HIV infected patients and controls from nor theastern Brazil. Clinics (Sao

Paulo) 2011. 66 (8):1485-1488.

Page 94: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

94

DALGLEISH, A. G. et al. The CD4 (T4) antigen is an essential component of t he

receptor for the AIDS retrovirus. Nature 1984. 312 (5996):763-767.

DALMASSO, C. et al. Distinct genetic loci control plasma HIV-RNA and ce llular

HIV-DNA levels in HIV-1 infection: the ANRS Genome Wide Association 01

study. PLoS One 2008. 3 (12):e3907.

DARLIX, J. L. et al. Cis elements and trans-acting factors involved in t he RNA

dimerization of the human immunodeficiency virus HI V-1. J Mol Biol 1990. 216

(3):689-699.

DAUSSET, J. The birth of MAC. Vox Sang 1984. 46 (4):235-237.

DE SANTIS, D. et al. 16(th) IHIW : review of HLA typing by NGS. Int J

Immunogenet 2013. 40 (1):72-76.

DEEKS, S. G. e WALKER, B. D. Human immunodeficiency virus controllers:

mechanisms of durable virus control in the absence of antiretroviral therapy.

Immunity 2007. 27 (3):406-416.

DEL CAMPO, A. B. et al. Targeting HLA class I expression to increase tumor

immunogenicity. Tissue Antigens 2012. 79 (3):147-154.

DOHERTY, P. C. e ZINKERNAGEL, R. M. A biological role for the major

histocompatibility antigens. Lancet 1975. 1 (7922):1406-1409.

DONADI, E. A. et al. HLA class I and class II profiles of patients prese nting with

Sydenham's chorea. J Neurol 2000. 247 (2):122-128.

ELAHI, S. et al. Protective HIV-specific CD8+ T cells evade Treg cel l

suppression. Nat Med 2011. 17 (8):989-995.

ENGELHARD, V. H. How cells process antigens. Sci Am 1994. 271 (2):54-61.

ERLICH, H. HLA DNA typing: past, present, and future. Tissue Antigens 2012. 80

(1):1-11.

Page 95: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

95

FALK, K. et al. Allele-specific motifs revealed by sequencing of se lf-peptides

eluted from MHC molecules. Nature 1991. 351 (6324):290-296.

FARQUHAR, C. et al. Human leukocyte antigen (HLA) B*18 and protection

against mother-to-child HIV type 1 transmission. AIDS Res Hum Retroviruses

2004. 20 (7):692-697.

FELLAY, J. Host genetics influences on HIV type-1 disease. Antivir Ther 2009. 14

(6):731-738.

FELLAY, J. et al. Common genetic variation and the control of HIV-1 i n humans.

PLoS Genet 2009. 5 (12):e1000791.

FIGUEIREDO, J. F. et al. HLA profile in patients with AIDS and tuberculosis.

Braz J Infect Dis 2008. 12 (4):278-280.

FRAHM, N. et al. HLA-B63 presents HLA-B57/B58-restricted cytotoxic T -

lymphocyte epitopes and is associated with low huma n immunodeficiency

virus load. J Virol 2005. 79 (16):10218-10225.

FRAHM, N. et al. Control of human immunodeficiency virus replication by

cytotoxic T lymphocytes targeting subdominant epito pes. Nat Immunol 2006. 7

(2):173-178.

FRANCESCHI, D. S. et al. Class-I human leukocyte alleles in leprosy patients

from Southern Brazil. Rev Soc Bras Med Trop 2011. 44 (5):616-620.

FRANKEL, A. D. e YOUNG, J. A. HIV-1: fifteen proteins and an RNA. Annu Rev

Biochem 1998. 67 1-25.

FREED, E. O. HIV-1 replication. Somat Cell Mol Genet 2001. 26 (1-6):13-33.

GABRIEL, C. et al. HLA typing by next-generation sequencing - getting closer to

reality. Tissue Antigens 2014. 83 (2):65-75.

GAO, X. et al. Effect of a single amino acid change in MHC class I molecules on

the rate of progression to AIDS. N Engl J Med 2001. 344 (22):1668-1675.

Page 96: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

96

GARRETT, T. P. et al. Structure/function studies of major histocompatibil ity

antigens. Transplant Proc 1989. 21 (1 Pt 1):588-590.

GATTI, E. e PIERRE, P. Understanding the cell biology of antigen presentat ion:

the dendritic cell contribution. Curr Opin Cell Biol 2003. 15 (4):468-473.

GONZALEZ-GALARZA, F. F. et al. Allele frequency net: a database and online

repository for immune gene frequencies in worldwide populations. Nucleic

Acids Res 2011. 39 (Database issue):D913-919.

GORER, P. A. e SCHUTZE, H. Genetical studies on immunity in mice: II.

Correlation between antibody formation and resistan ce. J Hyg (Lond) 1938. 38

(6):647-662.

GOTO, T. et al. Projection structures of human immunodeficiency vir us type 1

(HIV-1) observed with high resolution electron cryo -microscopy. J Electron

Microsc (Tokyo) 1994. 43 (1):16-19.

GRAF, T. et al. HIV-1 genetic diversity and drug resistance among t reatment

naive patients from Southern Brazil: an association of HIV-1 subtypes with

exposure categories. J Clin Virol 2011. 51 (3):186-191.

GRUMBT, B. et al. Diagnostic applications of next generation sequenci ng in

immunogenetics and molecular oncology. Transfus Med Hemother 2013. 40

(3):196-206.

GUINDON, S. et al. New algorithms and methods to estimate maximum-

likelihood phylogenies: assessing the performance o f PhyML 3.0. Syst Biol

2010. 59 (3):307-321.

GUREVICH, A. et al. QUAST: quality assessment tool for genome assemblie s.

Bioinformatics 2013. 29 (8):1072-1075.

HALL, T. A. BioEdit: a user-friendly biological sequence alignm ent editor and

analysis program for Windows 95/98/NT. Nucl Acids Symp Ser 1999. 41 95-98.

HEMELAAR, J. et al. Global trends in molecular epidemiology of HIV-1 du ring

2000-2007. AIDS 2011. 25 (5):679-689.

Page 97: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

97

HO, D. D. HIV-1 dynamics in vivo. J Biol Regul Homeost Agents 1995. 9 (3):76-77.

HOLCOMB, C. L. et al. A multi-site study using high-resolution HLA genoty ping

by next generation sequencing. Tissue Antigens 2011. 77 (3):206-217.

HOSOMICHI, K. et al. Phase-defined complete sequencing of the HLA genes by

next-generation sequencing. BMC Genomics 2013. 14 355.

HU, D. J. et al. The emerging genetic diversity of HIV. The importan ce of global

surveillance for diagnostics, research, and prevent ion. JAMA 1996. 275 (3):210-

216.

KASLOW, R. A. et al. Influence of combinations of human major

histocompatibility complex genes on the course of H IV-1 infection. Nat Med

1996. 2 (4):405-411.

KAUR, G. e MEHRA, N. Genetic determinants of HIV-1 infection and progres sion

to AIDS: immune response genes. Tissue Antigens 2009a. 74 (5):373-385.

KAUR, G. e MEHRA, N. Genetic determinants of HIV-1 infection and progres sion

to AIDS: susceptibility to HIV infection. Tissue Antigens 2009b. 73 (4):289-301.

KAWASHIMA, Y. et al. Long-term control of HIV-1 in hemophiliacs carrying

slow-progressing allele HLA-B*5101. J Virol 2010. 84 (14):7151-7160.

KAWASHIMA, Y. et al. Adaptation of HIV-1 to human leukocyte antigen clas s I.

Nature 2009. 458 (7238):641-645.

KEANE, T. M. et al. Assessment of methods for amino acid matrix selecti on and

their use on empirical data shows that ad hoc assum ptions for choice of matrix

are not justified. BMC Evol Biol 2006. 6 29.

KIEPIELA, P. et al. Dominant influence of HLA-B in mediating the potent ial co-

evolution of HIV and HLA. Nature 2004. 432 (7018):769-775.

KIMURA, M. Preponderance of synonymous changes as evidence for the

neutral theory of molecular evolution. Nature 1977. 267 (5608):275-276.

Page 98: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

98

KLEIN, J. e SATO, A. The HLA system. First of two parts. N Engl J Med 2000a.

343 (10):702-709.

KLEIN, J. e SATO, A. The HLA system. Second of two parts. N Engl J Med 2000b.

343 (11):782-786.

KLOVERPRIS, H. N. et al. HIV Subtype Influences HLA-B*07:02-Associated HIV

Disease Outcome. AIDS Res Hum Retroviruses 2013.

LAZARYAN, A. et al. Human leukocyte antigen B58 supertype and human

immunodeficiency virus type 1 infection in native A fricans. J Virol 2006. 80

(12):6056-6060.

LAZARYAN, A. et al. Human leukocyte antigen class I supertypes and HIV- 1

control in African Americans. J Virol 2010. 84 (5):2610-2617.

LAZARYAN, A. et al. The influence of human leukocyte antigen class I al leles

and their population frequencies on human immunodef iciency virus type 1

control among African Americans. Hum Immunol 2011. 72 (4):312-318.

LESLIE, A. et al. Additive contribution of HLA class I alleles in the immune

control of HIV-1 infection. J Virol 2010. 84 (19):9879-9888.

LETVIN, N. L. e WALKER, B. D. Immunopathogenesis and immunotherapy in

AIDS virus infections. Nat Med 2003. 9 (7):861-866.

LI, H. e DURBIN, R. Fast and accurate short read alignment with Burrows -

Wheeler transform. Bioinformatics 2009. 25 (14):1754-1760.

LI, H. et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics

2009. 25 (16):2078-2079.

LI, L. e BOUVIER, M. Structures of HLA-A*1101 complexed with

immunodominant nonamer and decamer HIV-1 epitopes c learly reveal the

presence of a middle, secondary anchor residue. J Immunol 2004. 172 (10):6175-

6184.

Page 99: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

99

LI, S. et al. Human leukocyte antigen class I and class II allele frequencies and

HIV-1 infection associations in a Chinese cohort. J Acquir Immune Defic Syndr

2007. 44 (2):121-131.

LIND, C. et al. Next-generation sequencing: the solution for high-r esolution,

unambiguous human leukocyte antigen typing. Hum Immunol 2010. 71

(10):1033-1042.

MACDONALD, K. S. et al. Influence of HLA supertypes on susceptibility and

resistance to human immunodeficiency virus type 1 i nfection. J Infect Dis 2000.

181 (5):1581-1589.

MAJOR, E. et al. HLA typing from 1000 genomes whole genome and whole

exome illumina data. PLoS One 2013. 8 (11):e78410.

MALISSEN, M. et al. Exon/intron organization and complete nucleotide

sequence of an HLA gene. Proc Natl Acad Sci U S A 1982. 79 (3):893-897.

MARMOR, M. et al. Resistance to HIV infection. J Urban Health 2006. 83 (1):5-17.

MARSH, S. G. Nomenclature for factors of the HLA system, update September

2000. WHO Nomenclature Committee for Factors of the HLA System. Tissue

Antigens 2000. 56 (6):565-566.

MARSH, S. G. et al. Nomenclature for factors of the HLA system, 2010. Tissue

Antigens 2010. 75 (4):291-455.

MASSIAH, M. A. et al. Comparison of the NMR and X-ray structures of the H IV-1

matrix protein: evidence for conformational changes during viral assembly.

Protein Sci 1996. 5 (12):2391-2398.

MCDEVITT, H. O. Discovering the role of the major histocompatibilit y complex

in the immune response. Annu Rev Immunol 2000. 18 1-17.

MCMICHAEL, A. J. e JONES, E. Y. Genetics. First-class control of HIV-1. Science

2010. 330 (6010):1488-1490.

Page 100: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

100

MIGUELES, S. A. et al. Lytic granule loading of CD8+ T cells is required f or HIV-

infected cell elimination associated with immune co ntrol. Immunity 2008. 29

(6):1009-1021.

MIGUELES, S. A. et al. HLA B*5701 is highly associated with restriction of virus

replication in a subgroup of HIV-infected long term nonprogressors. Proc Natl

Acad Sci U S A 2000. 97 (6):2709-2714.

MOORE, C. B. et al. Evidence of HIV-1 adaptation to HLA-restricted immu ne

responses at a population level. Science 2002. 296 (5572):1439-1443.

MORGADO, M. G. et al. V3 region polymorphisms in HIV-1 from Brazil:

prevalence of subtype B strains divergent from Nort h American/European

prototype and detection of subtype F. AIDS Res Hum Retroviruses 1994. 10

(5):569-576.

NEEFJES, J. et al. Towards a systems understanding of MHC class I and MHC

class II antigen presentation. Nat Rev Immunol 2011. 11 (12):823-836.

NIE, Z. et al. The putative alpha helix 2 of human immunodeficienc y virus type 1

Vpr contains a determinant which is responsible for the nuclear translocation

of proviral DNA in growth-arrested cells. J Virol 1998. 72 (5):4104-4115.

NOVITSKY, V. et al. Association between virus-specific T-cell responses and

plasma viral load in human immunodeficiency virus t ype 1 subtype C infection.

J Virol 2003. 77 (2):882-890.

NUNES, E. et al. Definitions of histocompatibility typing terms. Blood 2011a. 118

(23):e180-183.

NUNES, J. M. et al. Allele frequency estimation from ambiguous data: us ing

resampling schema in validating frequency estimates and in selective

neutrality testing. Hum Biol 2011b. 83 (3):437-447.

OTTINGER, H. D. et al. Hematopoietic stem cell transplantation: contrastin g the

outcome of transplantations from HLA-identical sibl ings, partially HLA-

Page 101: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

101

mismatched related donors, and HLA-matched unrelate d donors. Blood 2003.

102 (3):1131-1137.

PAMER, E. e CRESSWELL, P. Mechanisms of MHC class I--restricted antigen

processing. Annu Rev Immunol 1998. 16 323-358.

PARHAM, P. Structure of class-I MHC molecules: HLA-B27 and dis ease. Scand

J Rheumatol Suppl 1990. 87 11-20.

PARHAM, P. MHC class I molecules and KIRs in human history, he alth and

survival. Nat Rev Immunol 2005. 5 (3):201-214.

PASSAES, C. P. et al. Genetic characterization of HIV-1 BC recombinants a nd

evolutionary history of the CRF31_BC in Southern Br azil. Infect Genet Evol

2009. 9 (4):474-482.

PELAK, K. et al. Host determinants of HIV-1 control in African Ameri cans. J

Infect Dis 2010. 201 (8):1141-1149.

PEREYRA, F. et al. The major genetic determinants of HIV-1 control aff ect HLA

class I peptide presentation. Science 2010. 330 (6010):1551-1557.

PETERSON, T. A. et al. HLA class I associations with rates of HIV-1

seroconversion and disease progression in the Pumwa ni Sex Worker Cohort.

Tissue Antigens 2013. 81 (2):93-107.

PETRUCCI, A. et al. How many HIV-infected individuals may be defined as long-

term nonprogressors? A report from the Italian Sero conversion Study. Italian

Seroconversion Study Group (ISS). J Acquir Immune Defic Syndr Hum Retrovirol

1997. 14 (3):243-248.

PLANTIER, J. C. et al. A new human immunodeficiency virus derived from

gorillas. Nat Med 2009. 15 (8):871-872.

POLIZEL, J. R. et al. Association of human leukocyte antigen DQ1 and deng ue

fever in a white Southern Brazilian population. Mem Inst Oswaldo Cruz 2004. 99

(6):559-562.

Page 102: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

102

POONIA, B. et al. Role of the Fas/FasL pathway in HIV or SIV disease.

Retrovirology 2009. 6 91.

PORTELA, P. et al. Analysis of KIR gene frequencies and HLA class I ge notypes

in prostate cancer and control group. Int J Immunogenet 2012. 39 (5):423-428.

PRUGNOLLE, F. et al. Pathogen-driven selection and worldwide HLA class I

diversity. Curr Biol 2005. 15 (11):1022-1027.

RATNER, L. Complete nucleotide sequences of functional clones of the AIDS

virus. AIDS Res Hum Retroviruses 1987. 3 (1):57-69.

ROBERTSON, D. L. et al. HIV-1 nomenclature proposal. Science 2000. 288

(5463):55-56.

ROBINSON, J. T. et al. Integrative genomics viewer. Nat Biotechnol 2011. 29

(1):24-26.

SABIN, C. A. e LUNDGREN, J. D. The natural history of HIV infection. Curr Opin

HIV AIDS 2013. 8 (4):311-317.

SABINO, E. C. et al. Identification of human immunodeficiency virus type 1

envelope genes recombinant between subtypes B and F in two

epidemiologically linked individuals from Brazil. J Virol 1994. 68 (10):6340-6346.

SAKSENA, N. K. et al. Elite HIV controllers: myth or reality? AIDS Rev 2007. 9

(4):195-207.

SANABANI, S. S. et al. Characterization and frequency of a newly identifie d HIV-

1 BF1 intersubtype circulating recombinant form in Sao Paulo, Brazil. Virol J

2010. 7 74.

SANTOS, A. F. et al. Epidemiologic and evolutionary trends of HIV-1 CRF3 1_BC-

related strains in southern Brazil. J Acquir Immune Defic Syndr 2007. 45 (3):328-

333.

Page 103: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

103

SANTOS, A. F. et al. Characterization of a new circulating recombinant f orm

comprising HIV-1 subtypes C and B in southern Brazi l. AIDS 2006. 20 (16):2011-

2019.

SAÚDE, M. D. Boletim Epidemiológico - Departamento de DST/Aids. 2013

SCHERER, A. et al. Quantifiable cytotoxic T lymphocyte responses and H LA-

related risk of progression to AIDS. Proc Natl Acad Sci U S A 2004. 101

(33):12266-12270.

SETTE, A. e SIDNEY, J. Nine major HLA class I supertypes account for the v ast

preponderance of HLA-A and -B polymorphism. Immunogenetics 1999. 50 (3-

4):201-212.

SHARMA, G. et al. Genetic correlates influencing immunopathogenesis o f HIV

infection. Indian J Med Res 2011. 134 (6):749-768.

SHAW, G. M. e HUNTER, E. HIV transmission. Cold Spring Harb Perspect Med

2012. 2 (11):

SIDNEY, J. et al. HLA class I supertypes: a revised and updated class ification.

BMC Immunol 2008. 9 1.

SILVA, E. M. et al. HLA-Bw4-B*57 and Cw*18 alleles are associated with plasma

viral load modulation in HIV-1 infected individuals in Salvador, Brazil. Braz J

Infect Dis 2010. 14 (5):468-475.

SIMON, V. e HO, D. D. HIV-1 dynamics in vivo: implications for therapy. Nat Rev

Microbiol 2003. 1 (3):181-190.

SINGH, P. et al. Immunogenetic basis of HIV-1 infection, transmissio n and

disease progression. Vaccine 2008. 26 (24):2966-2980.

SKAR, H. et al. Dynamics of two separate but linked HIV-1 CRF01_AE outbreaks

among injection drug users in Stockholm, Sweden, an d Helsinki, Finland. J

Virol 2011. 85 (1):510-518.

Page 104: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

104

SOARES, E. A. et al. HIV-1 subtype C dissemination in southern Brazil. AIDS

2005. 19 Suppl 4 S81-86.

SOARES, E. A. et al. Epidemiologic and molecular characterization of hum an

immunodeficiency virus type 1 in southern Brazil. J Acquir Immune Defic Syndr

2003a. 34 (5):520-526.

SOARES, M. A. et al. A specific subtype C of human immunodeficiency viru s

type 1 circulates in Brazil. AIDS 2003b. 17 (1):11-21.

SPIRA, A. I. et al. Cellular targets of infection and route of viral di ssemination

after an intravaginal inoculation of simian immunod eficiency virus into rhesus

macaques. J Exp Med 1996. 183 (1):215-225.

STEIN, B. S. et al. pH-independent HIV entry into CD4-positive T cells via virus

envelope fusion to the plasma membrane. Cell 1987. 49 (5):659-668.

STEPHENS, H. A. HIV-1 diversity versus HLA class I polymorphism. Trends

Immunol 2005. 26 (1):41-47.

STEPHENS, H. A. Immunogenetic surveillance of HIV/AIDS. Infect Genet Evol

2012. 12 (7):1481-1491.

TANG, J. e KASLOW, R. A. The impact of host genetics on HIV infection and

disease progression in the era of highly active ant iretroviral therapy. AIDS

2003. 17 Suppl 4 S51-60.

TEIXEIRA, S. L. et al. Distribution of CCR5 genotypes and HLA Class I B al leles

in HIV-1 infected and uninfected injecting drug use rs from Rio de Janeiro,

Brazil. Infect Genet Evol 2009. 9 (4):638-642.

TOMIYAMA, H. et al. Identification of multiple HIV-1 CTL epitopes prese nted by

HLA-B*5101 molecules. Hum Immunol 1999. 60 (3):177-186.

TRACHTENBERG, E. et al. Advantage of rare HLA supertype in HIV disease

progression. Nat Med 2003. 9 (7):928-935.

TRINCHIERI, G. Biology of natural killer cells. Adv Immunol 1989. 47 187-376.

Page 105: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

105

UNAIDS Global Reports - UNAIDS report on the global AIDS e pidemic 2013.

2013

VARMUS, H. Regulation of HIV and HTLV gene expression. Genes Dev 1988. 2

(9):1055-1062.

VYAS, J. M. et al. The known unknowns of antigen processing and

presentation. Nat Rev Immunol 2008. 8 (8):607-618.

WAIN-HOBSON, S. et al. Nucleotide sequence of the AIDS virus, LAV. Cell 1985.

40 (1):9-17.

WANG, C. et al. High-throughput, high-fidelity HLA genotyping with deep

sequencing. Proc Natl Acad Sci U S A 2012. 109 (22):8676-8681.

XIE, J. et al. Beta 2-microglobulin as a negative regulator of the immune

system: high concentrations of the protein inhibit in vitro generation of

functional dendritic cells. Blood 2003. 101 (10):4005-4012.

ZERBINO, D. R. e BIRNEY, E. Velvet: algorithms for de novo short read

assembly using de Bruijn graphs. Genome Res 2008. 18 (5):821-829.

ZHANG, S. et al. Structural basis of cross-allele presentation by HL A-A*0301

and HLA-A*1101 revealed by two HIV-derived peptide complexes. Mol Immunol

2011. 49 (1-2):395-401.

ZINKERNAGEL, R. M. Cellular immune recognition and the biological role of

major transplantation antigens. Biosci Rep 1997. 17 (2):91-111.

ZIPETO, D. e BERETTA, A. HLA-C and HIV-1: friends or foes? Retrovirology 2012.

9 39.

Page 106: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

106

9 - ANEXO

Page 107: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

107

Page 108: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

108

Page 109: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

109

Page 110: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

110

Page 111: Ministério da Saúde Instituto Nacional de Câncer ... · minha felicidade e tristezas as suas. Obrigada por me apoiar sempre. ... DNA kit and sequenced in Illumina HiSeq 2500 platform

111