eng genetica

Upload: flavio-oliveira

Post on 11-Jul-2015

245 views

Category:

Documents


3 download

TRANSCRIPT

E N G E N H A R I A G E N T I CA

Alfredo J. M. Cravador

E N G E N H A R I A G E N T I CA E TECNOLOGIA DE DNA RECOMBINANTE

Alfredo J. M. Cravador

FARO 2011

PREMBULO

O estudo da base molecular da vida s muito lentamente pde progredir comparativamente ao das outras cincias, devido, por um lado, ausncia ou imperfeio das tcnicas de anlise e de medida, mas fundamentalmente complexidade dos sistemas biolgicos. No ser todavia por isso que o progressivo desvendar dos mecanismos que regem a organizao mxima da matria deixa de ser um dos captulos mais apaixonantes da Histria da Cincia moderna. Foi h cerca de 50 anos que WATSON e CRICK dobraram um dos cabos mais decisivos da histria da cincia moderna, ao publicarem a estrutura do cido desoxirribonucleico (DNA). Desde ento, milhares de cientistas e investigadores tm-se interessado pelos diferentes aspectos da estrutura e da funo do DNA, com o fim de compreenderem como a informao gentica est contida na molcula de DNA, e como ela tratada de maneira to ordenada e precisa durante os processos biolgicos. A conjugao de todos estes trabalhos de pesquisa levou acumulao de um volume enorme de informaes e de conhecimentos em gentica molecular e ao desenvolvimento de uma metodologia nova, a engenharia gentica. A engenharia gentica ou seja, a pesquisa sobre o DNA recombinante baseia-se num conjunto de tcnicas que conferem a possibilidade, at h pouco apangio exclusivo da qumica relativamente a pequenas molculas, de romper e formar ligaes covalentes de maneira especfica e controlada em molculas de DNA. O material gentico pode hoje ser modificado, mutado, transferido, detectado ou sintetizado com as finalidades mais diversas tanto aplicadas como fundamentais. A possibilidade de criar combinaes novas, no naturais, a partir de material gentico de diferentes origens e de as introduzir em organismos hospedeiros que as perpetuam e multiplicam, deu uma dimenso nova biotecnologia, dotou-a do refinamento prprio engenharia gentica. explorao emprica dos fenmenos biolgicos contrape-se, hoje, a construo racional de sistemas biolgicos artificiais elaborados por manipulao gentica no laboratrio de investigao, antes de serem explorados industrialmente ou na produo agrcola. neste contexto que deve ser considerada a engenharia gentica, no como uma nova disciplina em si, mas antes como um instrumento de investigao poderoso que tem contribudo para um melhor conhecimento e aprofundamento do conceito de gene. Esta disciplina no s permite compreender melhor os mecanismos fundamentais da vida, mas tambm, pela manipulao dos organismos mais diversos, produzir substncias teis para a medicina, a agricultura e a indstria em geral. de salientar que os extraordinrios progressos realizados em engenharia gentica s foram possveis graas aos resultados da investigao fundamental obtidos nos campos da gentica, da biologiai

celular, da enzimologia, da virologia, da imunologia, da qumica dos cidos nucleicos e das protenas, da cristalografia e que s a interaco das diferentes competncias no seio desta rea multidisciplinar permite abordar nas melhores condies a tecnologia da clonagem de genes. A racionalidade e os conhecimentos humanos tendo os seus limites, a nova era industrial e agrcola em que entrmos no destituda da ameaas e s poder beneficiar as populaes humanas a longo termo se a explorao dos recursos biolgicos respeitar os grandes equilbrios naturais, os ciclos biolgicos e preservar a riqueza do patrimnio biolgico terrestre j amplamente enfraquecidos. O mecanismo que o homem agora capaz de manipular o estado superior da complexidade da matria e tambm o mais frgil. Como corolrio, o impacto da aco do homem na natureza passou a ser directo e profundo. As consequncias podero ser catastrficas ou positivas e s dependem de ns. As cincias da vida ao desembocarem no domnio das aplicaes, a pequena ou a grande escala, tocaram a ecologia e a tica, dimenses que no podem deixar de estar intimamente associadas formao cientfica que tm por misso ministrar.

ii

NDICE1.OS INSTRUMENTOS DE BASE 1.a.As enzimas, suas actividades e utilizaes Endonucleases de restrio e metilases Outras endonucleases Exonucleases e polimerases Fosfatases Ligao de fragmentos de DNA 1.b.A sequenciao de DNA 1. Mtodo qumico ou de Maxam & Gilbert 2. Mtodo de terminao de cadeia ou de Sanger 3. Utilizao da PCR em sequenciao 4. Sequenciao "automtica" 1.c.Sntese qumica de DNA I. Princpios da sntese qumica de DNA 1) Preparao dos blocos de base para a sntese 2) Desproteco selectiva 3) Reaces de condensao 4) Construo da cadeia oligodesoxinucleotdica 5) Desproteco Rendimentos 6) Isolamento, purificao e caracterizao 2.VECTORES DE CLONAGEM a. Os plasmdeos Concepo de um vector plasmdico b. Bacterifagos Empacotamento in vitro c. Cosmdeos d. O fago M13 Concluses 3. MUTAGNESE DIRIGIDA Eliminaes Inseres Substituies Mutagnese dirigida com oligonucleotdeos sintticos Seleco e identificao dos mutantes Aplicaes da mutagnese dirigida 4. A TRANSFORMAO BACTERIANA 5. BANCO DE CLONES DE cDNA Esquema de construo de um banco de clones de cDNA 6. BANCOS GENMICOS 7. MTODOS DE DETECO E DE ANLISE DE CLONES a) Hibridao in situ entre o DNA dos clones recombinantes e uma sonda de DNA radioactiva b) Carta de restrio c) Sequenciao dos nucleotdeos do inserto nos clones positivos por hibridao d) Seleco do mensageiro especfico por hibridao com o DNA recombinante e traduo in vitro e) Southern blotting f) Escolha das sondas de DNA sintticas Uso da tcnica de Real Time PCR para a quantificao rpida e precisa de RNA e DNA iii 2 2 2 8 9 12 13 15 15 17 22 24 27 28 28 34 36 37 40 42 43 44 44 45 48 50 51 51 53 54 54 55 56 57 60 61 63 63 64 68 67 67 67 68 68 68 68

8. A SNTESE QUMICA DE GENES Sntese de genes por sntese qumica conjugada com PCR 9. SISTEMAS DE EXPRESSO: ORGANISMOS HOSPEDEIROS - VECTORES a. Expresso em E. coli Vectores de expresso em E. coli 1) Construo de vectores de expresso 2) Vectores baseados no promotor PL de 3) gt11 - vector de expresso derivado do fago Identificao das placas produtoras Limitaes da produo na bactria Produo da hormona de crescimento humana (hGH) Hormonas de crescimento animais Produo de insulina humana b. Expresso na levedura Os vectores de expresso de S. cerevisiae Exemplos de vectores de expresso para produo de protenas exgenas em leveduras 1) A integrao dirigida 2) O isolamento de alelos mutantes 3) Regulao da expresso dos genes na levedura 4) Um intro codifica para uma protena reguladora 5) Estrutura do gene da ferromona de levedura (MF) c. Expresso em clulas de mamferos Transferncia de genes nas clulas de mamferos (transfeco) Co-transformao Micro-injeco Isolamento dos genes transferidos Clonagem de oncogenes humanos Vectores virais utilizados para transfectar as clulas de mamferos Vector SV40 a) Substituio da regio tardia de SV40 b) Substituio da regio precoce de SV40 Vector vaivm derivado de SV40 Vector BPV (Bovine Papilloma Virus) Vectores derivados de retrovrus d. Expresso em clulas de insectos Construo dum vector de transferncia do baculovrus Actividade biolgica das protenas recombinantes e. Introduo de genes estrangeiros em vulos fertilizados. Animais transgnicos Expresso do DNA estrangeiro nos animais transgnicos A utilizao dos retrovrus Concluses e resumo 10. ENGENHARIA GENTICA DE PLANTAS Agrobacterium tumefaciens O plasmdeo Ti como vector Expresso controlada pela luz e especfica de rgo, dum gene de trigo em plantas de tabaco Plantas transgnicas a) Resistncia a herbicidas b) Resistncia a insectos c) Resistncia a vrus d) Produtoras de pptidos As plantas monocotiledneas Outros mtodos de transformao Insero do transgene no genoma do cloroplasto DA SEQUENCIAO DO GENOMA FUNO DO GENE Preparao de microarrays de oligonucleotdeos e de cDNA iv

71 72 73 73 73 75 76 77 78 79 80 83 84 85 86 88 90 91 91 92 93 94 96 97 97 98 99 99 100 100 100 101 101 101 103 105 107 108 109 110 111 112 120 114 117 118 118 119 121 124 125 125 126

Utilizao de microarrays para estudar transcriptomas de diferentes origens e condies 11. O DNA RECOMBINANTE E O DIAGNSTICO EM MEDICINA a. Alteraes cromossmicas b. Cartografia dos cromossomas humanos c. Mapeamento do genoma humano por RFLP d. Anomalias monognicas e multifactoriais e. O diagnstico de defeitos genticos 1) RFLP (Restriction Fragment Length Polymorphism) 2) Diagnstico de mutaes identificadas -talassemias a) Mutaes sem sentido e frame shift b) Mutaes que afectam a transcrio c) Mutaes que afectam a maturao do RNA d) Utilizao dos oligonucleotdeos sintticos e) Anemia falciforme A deficincia hereditria de 1-antitripsina f. Deteco de mutaes somticas g. Amplificao enzimtica de DNA (PCR) 1) Deteco da anemia falciforme e da hemoglobina C por PCR 2) Deteco de doenas infecciosas por PCR Deteco de HPVs Deteco de HIV 127 136 137 139 141 142 143 144 144 145 145 146 146 148 148 150 152 154 155 156 158

v

METODOLOGIA DO DNA RECOMBINANTE A tecnologia do DNA recombinante representa na realidade, um ramo da engenharia gentica considerada no seu sentido lato. Ela diz respeito recombinao in vitro do material gentico por meio de enzimas. Estas manipulaes in vitro s adquirem realmente um sentido quando o DNA recombinante introduzido num hospedeiro biolgico, onde pode ser mantido e propagado indefinidamente. Uma experincia tpica de clonagem requer no mnimo a) b) c) d) e) um DNA objecto duma pesquisa; um vector de clonagem; enzimas de restrio; DNA ligase; clulas procariotas ou eucariotas que servem de hospedeiro biolgico

(Fig. 1.II.). Depois da introduo no hospedeiro, as molculas recombinantes tm que ser isoladas e caracterizadas. Foi atravs deste processo de caracterizao, que o conhecimento do gene foi progredindo. O processo de clonagem em si, s fornece um meio de isolar e de identificar rapidamente os genes de interesse. Neste captulo passaremos em revista os diversos mtodos utilizados para clonar um gene.

1

1.

OS INSTRUMENTOS DE BASE 1.a.As enzimas, suas actividades e utilizaes Endonucleases de restrio e metilases Sempre que um bacterifago se desenvolve numa estirpe de Escherichia coli C, os fagos resultantes da lise deste hospedeiro multiplicam-se muito mal noutra estirpe, de tipo K. Diz-se que o fago "restrito" pela segunda estirpe bacteriana. Por outro lado, os fagos que escaparam restrio so capazes de crescer normalmente se forem utilizados para reinfectarem a estirpe K. No entanto, se estes mesmos fagos passarem primeiro por E. coli C, ficam de novo restritos por E. coli K (Fig. 2.II). Portanto, a eficcia com a qual um fago se multiplica num hospedeiro depende da estirpe na qual ele se multiplicou anteriormente. Esta modificao no hereditria, conferida ao fago pela segunda estirpe (K) e que lhe permite voltar a multiplicar-se nesta estirpe sem ser de novo restrito, chama-se modificao. Os fagos restritos adsorvem-se sobre os hospedeiros restritores e injectam o seu DNA normalmente. No entanto, este DNA rapidamente degradado depois da injeco. A enzima responsvel por esta degradao uma endonuclease, tambm chamada endonuclease de restrio ou enzima de restrio. O hospedeiro restritor tem evidentemente que proteger o seu DNA dos efeitos das enzimas de restrio que ele prprio contm; esta proteco assegurada pela modificao do DNA. Mais precisamente, as modificaes resultam da metilao (por metilases) de certas bases num nmero reduzido de locais do DNA, que constituem as sequncias de reconhecimento para a enzima de restrio. , pois, compreensvel a razo pela qual um fago que escapa restrio num dado hospedeiro, pode em seguida re-infectar eficazmente o mesmo hospedeiro: o DNA do fago ter-se- replicado em presena da metilase de modificao e ser protegido, assim como o DNA do hospedeiro, contra os efeitos de restrio. Os processos de restrio e de modificao existem em todos os sistemas nos quais o DNA transferido duma bactria para outra. A conjugao, a transformao, a transduo e a transfeco esto todas submetidas ao sistema de restrio-modificao. Os genes que especificam os sistemas res-mod podem residir no cromossoma do hospedeiro, ou podem estar localizados num plasmdeo ou num profago.

As endonucleases de restrio classificam-se em 3 categorias. As pertencentes classe I so constitudas por 3 subunidades e requerem como cofactores ATP, Mg2+ e Sadenosilmetionina. Possuem simultaneamente actividades de endonuclease e de metilase situadas em subunidades diferentes. Os stios especficos de reconhecimento, longos de 152

pares de base, so complexos, situando-se a cerca de 1000 pares de bases de distncia do stio de clivagem ou de metilao. Esta categoria pouco interessante em tecnologia gentica porque o local de clivagem no especfico. As endonucleases de restrio de classe III, constitudas por 2 subunidades tm ATP e Mg2+ como cofactores obrigatrios, mas no necessariamente a S-adenosilometionina. A regio de clivagem situa-se de 5 a 10 ou de 25 a 27 pares de bases a jusante do stio de reconhecimento. As do primeiro tipo clivam em geral sequncias no palindrmicas, dando origem a populaes heterogneas com extremidades 5' protuberantes, enquanto que as do segundo tipo clivam o DNA em stios fixos. As endonucleases de restrio de classe II so constitudas por uma nica subunidade activa e requerem unicamente Mg2+ como cofactor. Os locais de clivagem situam-se em geral dentro das sequncias de reconhecimento compostas de 4 a 8 bases. A clivagem d origem a extremidades 5' ou 3' protuberantes ou a extremidades rombas ("blunt-end"). Estas enzimas foram isoladas a partir de mais de 200 estirpes bacterianas representando quase todos os grupos de procariotas. Esta diversidade de enzimas torna indispensvel a utilizao duma nomenclatura apropriada. Cada enzima representada por um cdigo de 3 letras derivado do nome do gnero e da espcie da bactria donde a enzima foi isolada. Hae por exemplo, significa que a enzima foi isolada de Haemophilus aegyptiens. A maioria das sequncias de reconhecimento conhecidas palindrmica, i.., possui um eixo de simetria de rotao. Por exemplo a sequncia de reconhecimento de EcoRI 5'-GAATTC-3' 3'-CTTAAG-5' l-se da mesma maneira nas duas direces sobre as cadeias opostas. O arranjo simtrico dos locais de clivagem tem duas consequncias importantes: 1) os cortes em posies desviadas em relao a cada uma das cadeias produzem extremidades monocatenrias que so complementares em orientao anti-paralela, mas idnticas em orientao paralela; 2) as extremidades de uma molcula de DNA criadas por uma enzima dada, com uma dada sequncia de reconhecimento, podem formar pares de bases complementares com qualquer outra molcula de DNA que possua extremidades idnticas:

3

5'...G pApApTpTp C...3 ' EcoRI 5'... GOH3' + 5'pApApTpTpC... 3' 3'...C pTpTpApAp G...5' 3'... CpTpTpApAp5' 3'HOG 5'

fragmento A (corte 1)

5'... GOH 3'... CpTpTpApAp B 5'... GOHpA p A p T p T p C... 3' 3'... C p T p T p A p Ap HOG....5' A pApApTpTpC... 3'HOG...5'

fragmento B (corte 2) Esta associao entre bases complementares pode ser completamente estabilizada, pela formao das ligaes covalentes entre as extremidades 3'OH e 5'-fosfato de cada uma das cadeias de DNA. Esta reaco de ligao realizada com uma enzima especfica, uma ligase, que tem, como veremos mais adiante, uma utilizao importante em metodologia de DNA recombinante. Deve ser, no entanto, referido que nem todas as sequncias reconhecidas so simtricas. Devido existncia de ambiguidades nos seus locais de reconhecimento, vrias enzimas reconhecem at 4 sequncias alvo diferentes. A digesto duma molcula de DNA com este tipo de enzima, pode originar extremidades no idnticas que no podem ser recombinadas ao acaso. Por exemplo, EcoRII reconhece as sequncias seguintes:

CCAGG GGTCC

e

CCTGG GGACC

4

Vrias enzimas denominadas isoesquizmeras possuem stios de reconhecimento idnticos. HindIII e HsuI por exemplo, partilham as mesmas sequncias de reconhecimento e de clivagem AAGCTT. Outras isoesquizmeras tais como SmaI (CCCGGG) e Xma I (CCCGGG) possuem a mesma sequncia de reconhecimento mas clivam em stios diferentes indicados por .Outras enzimas, denominadas isocaudmeras, podem diferir pelo seu stio de reconhecimento, mas originar extremidades complementares. Por exemplo, as digestes por BamHI (GGATCC), BglII (AGATCT), Bc1I (TGATCA) e Sau3A ( GATC) conduzem s extremidades coesivas 5'-GATC-3'. Todos os fragmentos de DNA formados por clivagem com qualquer combinao destas enzimas, recombinam-se entre eles. Assim, os fragmentos formados por digesto BamHI e BglII podem recombinar-se entre eles, mas neste caso a sequncia recombinante 5'-GGATCT-3' resistente digesto por qualquer destas duas enzimas porque as bases externas da sequncia hexanucleotdica de reconhecimento de BamHI e de BglII diferem (G/C e T/A respectivamente). BamHI 5'... G 3'... CCTAG Bg II GATCT...3' A...5'

5'...GGATCT...3' 3'...CCTAGA...5' no reconhecida por BamHI nem por BglII mas sim por MboI/Sau3A/DpnI

No entanto, as molculas originais e as recombinantes podem ser clivadas por outras enzimas tais como DpnI, Sau3A e MboI e podem ser facilmente distinguidas. Estas enzimas reconhecem a sequncia tetranucleotdica 5'-GATC-3' central e no so influenciadas pelas bases que a ladeiam. As endonucleases de restrio tm certas propriedades particulares: 1) Actividade parasita conhecida por "star" que uma alterao na especificidade da sequncia reconhecida, em condies de pH ou inicas particulares. Por exemplo, um aumento do pH, um abaixamento da concentrao em NaCl, ou a substituio do Mg por Mn alteram a especificidade de EcoRI que passa a reconhecer a sequncia tetranucleotdica 5'AATT-3' que ocorre mais frequentemente. Esta nova especificidade denominada EcoRI* (Eco star).5

2) Sequncias na vizinhana de sequncias de reconhecimento podem influenciar a actividade duma enzima, privilegiando a clivagem de certos stios em relao a outros de mesma especificidade. Por exemplo, a actividade de EcoRI pode variar no plasmdeo pBR322 ao ponto de atingir diferenas de velocidade de 56x, em funo da localizao do stio em relao a certas sequncias. 3) A temperatura outro factor que influencia o desenrolar da clivagem. Certos pequenos fragmentos oligonucleotdicos desnaturam-se quando a temperatura da reaco enzimtica superior sua temperatura de dissociao. Certas enzimas tm a sua actividade ptima de funcionamento a temperaturas elevadas (65-79C), tais como TaqI, Tth111I, Tth111II isoladas de organismos termfilos. 4) Quando o stio de reconhecimento de certas enzimas se situa perto de uma extremidade da molcula de DNA a actividade diminui. Quando dois stios idnticos ficam demasiados prximos s um deles clivado, porque aps a primeira clivagem o segundo stio fica perto duma extremidade da molcula. Esta propriedade est relacionada com o fenmeno de dissociao mencionado em 3). 5) A probabilidade de uma sequncia de restrio estar representada num local com n pares de bases, numa molcula de DNA, composta de 50 % de AT e de 50 % de CG P = 1 n 4

em que n o nmero de bases que comporta o stio. Uma sequncia tetranucleotdica dada aparecer num DNA em mdia cada 44=256 pares de base e uma hexanucleotdica cada 46=4096 pares de base. Se for conhecida a composio em GC de um DNA e o seu comprimento, possvel prever o nmero de vezes que uma sequncia de restrio, de composio e comprimento dados, aparece representada. Os diferentes fragmentos formados por digesto com uma enzima de restrio podem ser separados por electroforese em gel de agarose ou de poliacrilamida (Fig. 3.II.). Os fragmentos correm no gel em funo do comprimento e podem ser visualizados por colorao com o brometo de etdio, que se intercala entre as duas cadeias do DNA. A utilizao de vrias enzimas isoladamente, ou em combinao, permite estabelecer a carta de restrio duma molcula de DNA (Fig.4.II. e 5.II.). A carta indica as posies em que uma enzima particular cliva o DNA. A distncia entre os locais de clivagem expressa-se em pares de bases (medida em relao a um padro de referncia).6

As metilases, ou enzimas de modificao, protegem o DNA de um organismo da actividade endonuclesica ao nvel das sequncias reconhecidas pela(s) enzima(s) de restrio prpria(s) ao organismo. Estas enzimas, que possuem actividades de metilase e ausncia de actividade de restrio, so a dam metilase, e a dcm metilase que fixam o grupo CH3 (m de metilo) em posio N6 da adenina e em posio C5 da citosina respectivamente, no interior dos stios de restrio. Dam-DNA adenina metilase GAmTC Dcm-DNA citosina metilase CCm A/TGG

NHCH3 N N N N O N

NH2 CH3 N

N6-metiladenina

C5-metilcitosina

Enquanto que certas enzimas de restrio reconhecem unicamente sequncias alvo no metiladas, os seus isoesquizmeros clivam tanto os stios metilados como os no metilados. HpaII (C/CGG), por exemplo, cliva o tetranucleotdeo no metilado, enquanto que o isoesquizmero MspI cliva a mesma sequncia no metilada ou metilada (CCmGG). As clulas de eucariotas contm habitualmente citosinas metiladas em proporo que pode atingir 10 %. Se bem que de menor importncia que no DNA de eucariotas, a metilao da adenina altamente relevante no DNA dos procariotas. A metilao dos resduos adenina pode ser testada por enzimas, tais como Sau3A ( GATC), MboI ( GATC) e DpnI (GATC). Enquanto que Sau3A cliva tanto 5'-GATC-3' como 5'-GAmTC-3', MboI cliva unicamente a sequncia no metilada e DpnI cliva exclusivamente 5'-GAmTC-3'. Uma sequncia hemimetilada, i.. uma sequncia metilada s numa cadeia resistente DpnI. Sempre que for necessrio clivar DNA de procariotas em qualquer local possvel, este DNA tem que ser preparado a partir de estirpes de E.coli que so dam-. Se bem que a maior parte das estirpes de E.coli possua actividades de restrio e de metilao, certas estirpes utilizadas em engenharia gentica possuem uma, ou outra, ou nenhuma destas actividades. Ex.: EcoK12 possui actividades de metilase e de restrio7

MM294 possui modificao mas no restrio RRI no possui nem uma nem outra

Outras endonucleases [para alm das que possuem outra(s) actividade(s)] ) Desoxi- (Fig. 6.II.) Desoxirribonuclease I (DNase I) (pncreas bovino). Actividade: endonuclease, cadeia dupla ou cadeia simples. Com Mg++ ataca cada cadeia independentemente e no gera obrigatoriamente extremidades rombas. Com Mn++ cliva as duas cadeias no mesmo stio e gera fragmentos com extremidades rombas ou s com um ou dois nucleotdeos protuberantes. Utilizao: - na introduo de nicks ao acaso em DNA bicatenrio a fim de o preparar para a marcao radioactiva por nick translation; - na introduo dum nick em DNA circular a fim de o preparar para a mutagnese mediada por bissulfito (seco 3); - na criao de clones ao acaso para sequenciao em vectores de bacterifago M13; - na anlise de complexos protena-DNA. ) Ribonucleases Ribonuclease A (pncreas bovino)(Fig. 7.II.). Actividade: endonuclease - ataca o RNA em 3' de bases pirimidnicas e cliva o fosfato em 5' do nucleotdeo adjacente. D origem formao de nucleotdeos pirimidnicos-3'P e de oligonucleotdeos com pirimidinas-3'P. Utilizao: - na remoo de regies no hibridadas de RNA nos hbridos DNA-RNA; - no mapeamento de mutaes singulares em DNA ou em RNA (desemparelhamentos de um par de bases entre RNA e DNA so reconhecidos e clivados pela RNase A). Ribonuclease T1 (Aspergillus oryzae)(Fig. 8.II.) Actividade: endonuclease - ataca o RNA em 3' da guanosina e cliva o 5'-fosfato do nucleotdeo adjacente. D origem a guanosinas ou a oligonucleotdeos com guanosina-3'P. Utilizao: - na remoo de regies no hibridadas de RNA em hbridos DNA-RNA.

8

Exonucleases e polimerases ) DNA polimerase I (E. coli) (Fig. 9.II.) Actividades: exonuclease 5' 3' e 3 ' 5' polimerase 5' 3' reaco de troca Utilizao: - marcao de DNA por nick-translation. - Na marcao de DNA com extremidades 3' protuberantes. ) Fragmento de Klenow da DNA polimerase de E.coli (Fig. 10.II. e Fig. 4.16) Actividades: exonuclease 3' 5' polimerase 5' 3' reaco de troca Utilizao: - preenchimento das extremidades 3' retradas formadas por digesto de DNA com enzimas de restrio; - marcao de DNA por preenchimento das extremidades 3' retradas, com nucleotdeos trifosfatos 32P; - marcao terminal de DNA com extremidades 3' protuberantes; - sntese da segunda cadeia de cDNA em clonagem de cDNA; - sntese da segunda cadeia de DNA a partir de matrizes monocatenrias em mutagnese in vitro; - sequenciao de DNA pelo mtodo dos didesoxinucleotdeos (terminao de cadeia). ) T4 DNA polimerase (Fig. 11.II.) Actividades: exonuclease 3' 5' polimerase 5' 3' Utilizao: - como o fragmento de Klenow, utilizada na marcao de DNA por preenchimento de extremidades 3' retradas; - na marcao das extremidades de fragmentos de DNA, rombas ou protuberantes em 3' (reaco de troca);

9

- na marcao de fragmentos de DNA para uso como sondas de hibridao por digesto parcial de DNA bicatenrio utilizando actividade exonuclease 3'5' seguida por reaco de preenchimento, utilizando a actividade polimersica e [32P]dNTP; - na converso de extremidades protuberantes (5' ou 3') de DNA bicatenrio, em extremidades rombas; - na extenso do iniciador (primer) oligonucletdico mutagnico hibridado matriz de DNA monocatenrio, em mutagnese in vitro. ) Taq polimerase (Thermus aquaticus)(Fig. 12.II) Actividade: polimerase 5' 3' Utilizao: - na amplificao in vitro de sequncias especficas de DNA por reaco em cadeia (Polymerase Chain Reaction-PCR); - na sequenciao de DNA ) RNA polimerases dependentes de DNA de bacterifagos SP6, T3 e T7 (Fig. 13.II) Actividade : RNA polimerase 5' 3' Utilizao: - na sntese de RNA monocatenrio para utilizao como sondas de hibridao, como mRNAs funcionais em sistemas de traduo in vitro, ou como substratos em reaces de splicing in vitro. Cada uma destas trs polimerases possui um grau elevado de especificidade para com o seu promotor. - No caso do sistema de transcrio do bacterifago T7, para expresso de genes clonados em bactrias. ) Poli(A) polimerase (Fig. 14.II) Actividade: polimerisa AMP (derivado de ATP) na extremidade 3'-OH livre do RNA. Utilizao: - preparao de poli (A)- RNA para clonagem; - marcao da extremidade 3' de RNA com [-32P]ATP para preparar sondas de hibridao. ) Reverse transcriptase (transcritase reversa) (Fig. 15.II.) (vrus aviano de mieloblastose) Actividades : polimerase 5' 3' DNA. A matriz tanto pode ser o DNA como o RNA. Exorribonuclease 5' 3' e 3' 5' (RNase H) Degrada especificamente o RNA em hbridos DNA-RNA.10

Utilizao: - sntese de cDNA para clonagem (1a e 2a cadeia) ou para sondas de hibridao; - marcao de extremidades de fragmentos de DNA protuberantes em 5' (reaco de preenchimento). - Tambm pode ser utilizada em sequenciao de DNA pelo mtodo de terminao de cadeia com os didesoxirribonucleotdeos. ) Nuclease Bal 31 (Fig. 16.II.) Actividades: exo e endonuclease 5' 3' e 3' 5' Utilizao: - remoo de nucleotdeos das extremidades de DNA bicatenrio de maneira controlada. O DNA encurtado pode ser ligado a adaptadores (linkers) ou a vectores com T4 ligase; - construo de mapas de stios de restrio; - mapeamento de estruturas secundrias do DNA, por exemplo junes entre B-DNA e Z-DNA, ou stios de modificao em DNA bicatenrio; - remoo de nucleotdeos de RNA bicatenrio para preparao de RNAs recombinantes. ) Nuclease S1 (Fig. 17.II.) Actividade: nuclease especfica de DNA monocatenrio ou RNA; utilizao: - anlise de estrutura de hbridos DNA-RNA; - remoo de extremidades livres (tails) de fragmentos de DNA para produzir extremidades rombas; - abertura do gancho formado durante a sntese de cDNA bicatenrio; - na anlise da estrutura dos hbridos RNA-DNA. ) Mung-bean nuclease Actividade : nuclease especfica de cadeia simples semelhante nuclease S1 mas mais suave. Utilizao: - converter extremidades protuberantes de DNA em extremidades rombas. ) Exonuclease VII (Fig. 18.II.) Actividades: exonuclesica sobre cadeia simples de DNA, 3' 5' e 5' 3'; dispensa Mg++ e trabalha em presena de EDTA. Utilizao: - recuperao de cDNA inserido em vectores plasmdicos por "tailing" dAdT;11

- construo de mapas dos intres e dos exes. ) Exonuclease III (Fig. 19.II.) Actividades: exonuclease 3' 5' de DNA bicatenrio com extremidades 3'OH retradas. -3' fosfatase. Utilizao: - Preparao de DNA linear como molde para a DNA polimerase (p.ex. na sequenciao pelo mtodo dos didesoxi; vd. seco sequenciao); -preparao de sondas especficas de uma cadeia; -remoo de sequncias das extremidades de fragmentos de DNA, criando eliminaes unidireccionais a partir da extremidade 3'OH retrada; -degradao preferencial da cadeia parental no tiofosfatada, no mtodo de mutagnese especfica pontual que recorre a derivados tiofosfato (vd. seco 3) ) Exonuclease (Fig. 20.II) Actividade: exonuclease 5' 3' em cadeia dupla de DNA com um fosfato em 5'. Utilizao: -na modificao da extremidade 5'-fosfato dos DNAs substratos ulteriores doutras enzimas (ex.: remoo da extremidade 5'-protuberante do DNA antes do "tailing" com a terminal transferase).

Fosfatases Fosfatase alcalina - CAP (intestino de vitela), BAP (bactria) (Fig. 21.II.) Actividades: catalisa a remoo dos fosfatos em 5' do DNA bicatenrio ou monocatenrio, do RNA e de trifosfatos dos desoxirribonucleotdeos e dos ribonucleotdeos. Utilizao: -eliminao dos grupos fosfato em 5' do DNA ou do RNA para permitir a marcao com 32P em 5' pela T4 polinucleotdeo kinase e [32P]ATP, numa reaco de troca; - remoo do fosfato em 5' do DNA a fim de impedir a auto ligao (Fig. 24 e Fig. 4.9). T4 polinucleotdeo Kinase (Fig. 22.II.) Actividades: catalisa a transferncia de fosfato de ATP para a extremidade 5'OH do DNA mono ou bicatenrio e do RNA por reaco de fosforilao de 5'OH ou de troca com 5'P. Utilizao: - marcao da extremidade 5' do DNA para a sequenciao pela tcnica de Maxam-Gilbert;12

- fosforilao de oligonucleotdeos sintticos, ou de outro DNA, para ligao; - marcao de oligonucleotdeos para serem utilizados como sondas de hibridao;

Ligao de fragmentos de DNA Existem dois mtodos que permitem estabelecer ligaes covalentes de DNA in vitro. O primeiro utiliza uma enzima que intervm na replicao do DNA, a que j nos referimos anteriormente, a DNA ligase (extrada de E.coli ou de clulas infectadas pelo fago T4). A enzima derivada do fago T4 at capaz de realizar a ligao entre molculas de DNA com extremidades rombas, reaco que estimulada pela RNA ligase de T4. T4 DNA ligase (Fig. 23.II.) Actividade: ligao de extremidades coesivas e de extremidades rombas. Utilizao: -catalisa a ligao covalente de molculas de DNA com extremidades coesivas complementares; - ligao covalente de extremidades rombas em molculas de DNA bicatenrio, umas com as outras, ou com adaptadores ("linkers") sintticos (observao: a T4 ligase mais eficaz nas ligaes de extremidades rombas). T4 RNA ligase (Fig. 24.II) Actividade: catalisa a ligao covalente de extremidades 5' fosforiladas de DNA monocatenrio ou de RNA, a extremidades 3'OH de DNA monocatenrio ou de RNA. Utilizao: -marcao radioactiva das extremidades 3' de RNA (pequenas molculas tais como os pNps so substratos eficazes); - sntese de oligodesoxirribonucleotdeos.

O segundo mtodo utiliza uma enzima que capaz de adicionar extremidades coesivas aos fragmentos de DNA. Quando por vezes necessrio ligar fragmentos de DNA desprovidos de extremidades coesivas complementares, recorre-se a uma enzima que permite adicionar, in vitro, sequncias homopolimricas complementares, aos fragmentos de DNA. O mtodo baseia-se na utilizao duma enzima isolada de timo de vitelo, a terminal desoxirribonucleotidiltransferase (terminal transferase). Em presena de um nucleotdeo trifosfato, a enzima adiciona este nucleotdeo de maneira repetida s extremidades 3' do DNA.

13

Pode-se, por exemplo, adicionar extremidades poli (A) em 3' dum fragmento de DNA e extremidades poli (T) em 3' dum outro fragmento de DNA. Ao misturarem-se, estes dois fragmentos hibridar-se-o por emparelhamento entre bases complementares A/T e a juno covalente dos fragmentos emparelhados pode ser efectuada pela enzima DNA ligase. Terminal desoxirribonucleotidiltransferase (timo de vitelo) (Fig. 25.II. e Fig. 5-9) Actividade: catalisa a adio de desoxirribonucleotdeos s extremidades 3'-OH das molculas de DNA monocatenrias ou 3' protuberantes (Mg++), ou s extremidades rombas ou 3'OH recessivas (Co++). Utilizao: -adio de caudas (tailing) homopolimricas complementares a vectores e a cDNA; -marcao das extremidades 3'OH de DNA com [-32P]-3'-desoxirribonucleosdeo ou com 3'-ribonucleosdeo. A marcao com ribonucleosdeos realiza-se polimerizando com [32P]rNTP em presena de Co++ efectuando em seguida um tratamento alcalino (Fig. 2.4-4).

14

1.b.A sequenciao de DNA Dois grandes mtodos baseados em princpios inteiramente diferentes foram desenvolvidos para sequenciar longos fragmentos de DNA. Os pequenos fragmentos oligonucleotdicos so um caso particular que ser tratado separadamente. Um destes mtodos baseado num processo de clivagem qumica especfica e controlada e o outro na sntese enzimtica de fragmentos de DNA interrompidos pela adio controlada de anlogos dos desoxirribonucleotdeos trifosfatos (dNTP), as cordicepinas ou didesoxirribonucleotdeos. O primeiro mtodo conhecido pelo nome dos seus autores, Maxam & Gilbert, ou mtodo qumico, e o segundo por mtodo dos didesoxi, ou de terminao de cadeia, ou ainda de Sanger, nome do seu autor.

1. Mtodo qumico ou de Maxam & Gilbert O princpio do mtodo qumico, de Maxam & Gilbert, baseia-se na clivagem duma cadeia de DNA, induzida por uma reaco qumica de modificao, especfica de cada uma das 4 bases. Trs etapas sucessivas esto implicadas na clivagem especfica ao nvel de uma, ou duas das 4 bases (Fig. 26.II.): 1) Modificao da base 2) Remoo da base modificada do ciclo furansico 3) Clivagem da cadeia de DNA ao nvel deste acar. As etapas 2 e 3 tm a propriedade de serem dependentes da etapa precedente, i.., o DNA s ser clivado ao nvel dum acar desprovido da base e somente uma base modificada de maneira adequada poder ser removida do ciclo furansico que lhe corresponde. A especificidade reside na primeira reaco. As reaces seguintes tm que ser quantitativas. Por consequncia, os reagentes de modificao que reagem com as bases so absolutamente fundamentais, porque so eles que determinam o stio de clivagem do DNA. O sulfato de dimetilo e a hidrazina so dois reagentes que correspondem aos critrios exigidos e conhecidos desde h muito tempo pelas suas propriedades de modificao e de abertura dos ciclos das bases, tornando o DNA vulnervel clivagem. As Fig. 27.II. e Fig. 28.II. detalham estas reaces. A primeira exemplifica as reaces da guanina: metilao do azoto 7 com o sulfato de dimetilo, que introduz uma carga positiva na parte N7-C8-N9 imidazlica do ciclo prico. Quando C8 atacado por NaOH, a ligao C8-N9 rompe-se. Em seguida a piperidina remove o ciclo aberto da 7-metilguanina e catalisa a eliminao dos dois fosfatos do acar. Um mecanismo semelhante passa-se com a adenina.15

A segunda figura exemplifica as reaces duma timina. A hidrazina ataca a timina nos C4 e C6 abrindo o ciclo pirimidnico e ciclisando com C4-C5-C6 para formar um ciclo de 5 membros. A continuao da reaco com a hidrazina remove este novo ciclo pirazolona e o fragmento ureico N1-C2-N3 da timina, enquanto que os acares do esqueleto do DNA ganham a forma de hidrazona. Em seguida, a piperidina reage com todos estes glicosdeos e como precedentemente catalisa a eliminao dos 2 fosfatos do acar. A citosina reage de maneira semelhante. Modulando estas reaces pela natureza e concentrao da base, o pH, a temperatura, possvel favorecer a clivagem no stio de uma ou outra base prica, ou de uma ou outra base pirimidnica. Consideremos por exemplo, um fragmento de DNA marcado em 5' com 32P e submetido s reaces que conduzem clivagem, parcial mas especfica, ao nvel das guaninas. As condies experimentais sero escolhidas de maneira a que cada molcula de DNA no sofra mais duma clivagem. Neste caso, os fragmentos indicados na Fig. 29.II., marcados em 5' com 32P sero formados em propores idnticas. Se o fragmento de DNA for submetido separadamente a 4 sries de reaces, cada uma especfica de uma base e as 4 sries de fragmentos forem analisadas em paralelo num gel de electroforese e este for em seguida submetido a uma autorradiografia, a sua sequncia pode ser lida seguindo o "padro" das bandas na pelcula (Fig. 30.II.). Uma caracterstica essencial deste mtodo a necessidade de se dispor de um fragmento de DNA especificamente marcado numa das suas extremidades, 5' ou 3'. Em geral estes fragmentos so formados por clivagem com endonucleases de restrio e preenchimento das extremidades protuberantes com uma polimerase e 32P-ATP. Antes de sequenciar o fragmento de DNA, necessrio separar as duas extremidades marcadas. Uma maneira de proceder consiste em digerir o fragmento com uma endonuclease de restrio, que d origem formao de dois fragmentos bicatenrios de comprimento diferente que possam ser separados num gel de electroforese (Fig. 31.II.). A quantidade de DNA que deve ser utilizada depende do comprimento do fragmento e do nmero de reaces que se pretende efectuar, assim que da habilidade do experimentador. necessrio pelo menos 1 picomole para a marcao. Por exemplo, no caso do pBR322 linearizado, de peso molecular de 2.6106 Da, 1 picomole corresponde a 2,6 g de DNA. Se a actividade especfica de 32P-dNTP utilizada na marcao for de 1000 Ci/mmol, 1 mci (+ 106 cpm) poder ser teoricamente incorporada por nucleotdeo adicionado. Depois das etapas de precipitao sobejaro 105 cpm para colocar no PAGE (PAGE-polyacrilamide gel eletrophoresis) de separao. A resoluo do gel, a sua capacidade para separar fragmentos de comprimento N dos de comprimento N + 1 depende da natureza do gel, do seu comprimento e composio. Um gel convencional composto de 8 % de acrilamida, 8M de16

ureia, tem 0,2-0,3 mm de espessura e 40 cm de comprimento. Obtm-se uma resoluo satisfatria de 200 nucleotdeos (Fig. 30.II.) Se no se puderem separar 200 nucleotdeos numa corrida nica aplicam-se alquotas das 4 reaces de clivagem (ou mais) a tempos diferentes. Na figura, as mesmas amostras aplicadas nos corredores da esquerda (I) foram aplicadas no gel 2 horas mais tarde, direita. As molculas mais pequenas separam-se nos corredores contendo as ltimas alquotas a serem aplicadas e que correram durante menos tempo. Comea-se a leitura nos corredores de direita. Na figura, as setas indicam os pontos que delimitam a zona de sobreposio. Existe equipamento que permite realizar gis mais compridos e ler um maior nmero de bases duma vez. A utilizao de dNTP marcados com 35S melhora, por sua vez, notavelmente a resoluo. A Fig. 5.3 (Sequenciao de DNA, mtodo de Maxam and Gilbert) ilustra e resume o princpio do mtodo.

2. Mtodo de terminao de cadeia ou de Sanger Neste mtodo, comea-se por hibridar um iniciador (primer) oligonucleotdico, complementar do DNA numa regio prxima da que se pretende sequenciar. O iniciador , em seguida, prolongado (em presena de dNTPs, um dos quais est marcado em posio com 32P, ou com 35S) com uma polimerase que utiliza o DNA alvo da sequenciao como molde. A cada uma das quatro misturas de reaco realizadas em paralelo, adiciona-se um didesoxirribonucleotdeo trifosfato correspondente a cada uma das quatro bases, em concentraes e propores bem definidas em relao aos dNTP. Obtm-se assim 4 populaes de fragmentos, tendo todos a mesma extremidade 5' e terminando com um didesoxirribonucleotdeo idntico, no seio de cada populao: ddA, ddT, ddC ou ddG (Fig. 32.II.). Os didesoxirribonucleotdeos no possuem os grupos hidroxlicos em 3' e em 2'.

O O

O

O O O B

P O P O P O O O

H

H

17 Estrutura geral dum ddNTP

Como o grupo 3'OH necessrio para a formao de ligaes fosfodister, a presena de ddNTPs provoca a terminao da cadeia. As reaces de sntese so paradas adicionando formamida que impede as cadeias de DNA de se hibridarem. Antigamente recorria-se a uma digesto por uma endonuclease que cortasse num stio dando origem a fragmentos mais curtos, que serviam de iniciadores. De cerca de 250 em 250 nucleotdeos era necessrio recorrer a um novo iniciador. Esta condio obrigatria, e a necessidade de dispor de DNA monocatenrio, eram considerados nos tempos da infncia do mtodo, como inconvenientes srios. Hoje, se bem que o princpio na base do mtodo no tenha mudado, a estratgia de clonagem do DNA que se pretende sequenciar, no fago M13, de DNA circular monocatenrio ou em derivados e a possibilidade de recorrer facilmente, graas aos progressos realizados na sntese qumica de DNA, a iniciadores oligonucleotdicos sintticos, levou adopo generalizada deste mtodo. A Fig. 5.4 (Sequenciao de DNA, mtodo d Sanger) ilustra e resume o princpio do mtodo. Com a finalidade de o tornar de utilizao mais prtica, o M13 foi modificado em vrias etapas a partir da sua forma replicativa bicatenria (RF) (Fig. 33.II.). O primeiro derivado o mp1, que possui na regio intergnica no essencial, representada a preto, uma insero composta da regio do gene lacI que codifica a poro C-terminal do repressor, a regio reguladora completa promotor-operador e os codes correspondentes aos primeiros 146 aminocidos da regio N-terminal do gene da -galactosidase, lac Z. O derivado mp2 resulta duma simples substituio dum dG em dA, com o fim de criar um stio EcoRI (Fig. 34.II.). Esta substituio, que converte o 5o codo do cido asprtico em codo de asparagina no tem consequncias na actividade do pptido que assegurada pelos primeiros 146 aminocidos da -galactosidase. Para tornar o vector mais prtico, inseriu-se no stio EcoRI um poli adaptador comportando vrios stios de restrio, nas duas orientaes possveis. Estas construes correspondem aos vectores M13mp8 e M13mp9. A introduo de aminocidos suplementares, resultante desta insero, no interfere com a actividade complementar que o pptido assegura a uma -galactosidase enzimaticamente inactiva, produzida por um epissoma F do hospedeiro E. coli Lac- (o epissoma comporta o opero lac com uma eliminao M15 no gene de lac Z, correspondente aos aminocidos 11-41). Esta complementao pode ser detectada por um teste corado, que se baseia na hidrlise do 5bromo-4-cloro-3-indolil--D-galactosdeo (Xgal) pela -galactosidase, produzindo o 5bromo-4-cloro-indigo azul, visvel nas placas de agar contendo Xgal, em que forem cultivadas as bactrias infectadas pelo fago em presena de isopropiltiogalactosdeo (IPTG), indutor gratuito do opero lactose.18

HO

CH 2OH OH O S H OH IPTG Cl

CH 3 CH CH 3 HO

CH 2OH OH O O H OH

Cl Br

N H Xgal

O O

Cl Br N

Br N H

H

5',5'-dibromo-4,4'-dicloroindigo

A perda da complementao , depois da clonagem do DNA estrangeiro no seio do polilinker, serve para identificar rapidamente as bactrias que produzem o vector recombinante. Isto no tem, no entanto, valor absoluto, porque podem existir situaes em que a clonagem no anula a produo de um pptido que complemente a -galactosidase inactiva. S as inseres do DNA estrangeiro, que destruam a fase de leitura aberta do pptido , ou que introduzam codes de fim de leitura, conduzem sempre formao de placas brancas. Tm sido bastante utilizados os vectores M13mp18 e M13mp19, que provm de construes realizadas para aumentar o nmero de stios de restrio utilizveis. O iniciador utilizado na sequenciao universal; a sua extremidade 3' est situada na vizinhana da insero CTGGCC..... As duas cadeias dum inserto, com extremidades coesivas diferentes, podem ser sequenciadas, uma no mp18 e outra no mp19, pois estas construes contm o polilinker em sentidos opostos. Se o fragmento inserido tem extremidades idnticas, obtm-se as duas orientaes no mesmo vector. Insertos maiores que 300 a 400 nucleotdeos dificilmente podem ser sequenciados com um s iniciador. No entanto, a informao obtida sobre a sequncia lida o mais longe19

possvel no inserto, permitir deduzir a sequncia de um segundo iniciador, que servir para sequenciar uma nova srie de 300 nucleotdeos. Esta estratgia permite a sequenciao de insertos de mais de 2000 nucleotdeos, graas sntese qumica rpida dos iniciadores oligonucleotdicos. Insertos muito maiores conduzem a um crescimento muito reduzido das clulas infectadas. O DNA de grande comprimento, como por exemplo DNA de vrus de 8000 pares de bases pode ser sequenciado por este mtodo, utilizando a tcnica do shot-gun. Fragmentos de restrio do DNA so clonados ao acaso nos vectores M13, sem controlo da sua orientao no genoma. Os fragmentos clonados so sequenciados a partir do iniciador universal e a informao reunida em seguida processada num programa computorizado, a fim de identificar as sequncias que se sobrepem. Para preencher as lacunas preciso recorrer a estratgias de sub-clonagem no aleatrias (Fig. 35A.II.). O fragmento de DNA a sub-clonar para ser sequenciado subsequentemente, clonado num vector M13mp. O DNA com o inserto em ambas as orientaes tratado com DNAseI em condies que provocam linearizao em posies ao acaso. A fim de obter uma srie de fragmentos contendo o DNA de M13 intacto (necessrio para haver transformao e formar placas de lise), mas comportando insertos de comprimento varivel, estendendo-se do stio Z at ao stio Y do outro lado do inserto, a mistura de fragmentos linearizados digerida com a enzima X. Aps tratamento com polietilenoglicol (PGE), que precipita unicamente grandes fragmentos de DNA, estes fragmentos so de novo suspendidos e ligados, para formarem molculas circulares de DNA. Entre estas molculas encontram-se as que foram cortadas com DNAseI dentro do inserto e que perderam o stio Y (1, 2 e 3). As que no foram cortadas inicialmente com DNAseI (esquema de reaco esquerda na figura 35A.II.), ou que foram cortadas dentro do segmento de DNA de M13 (molcula 4 na via reaccional da direita), ainda contm o stio Y. Aps digesto da mistura de reaco total com a enzima Y, estas ltimas molculas sero linearizadas, enquanto que as primeiras, com a srie de insertos comeando no stio Z, permanecero circulares. A eficcia da transformao, ou transfeco, com o DNA linear baixa, comparada com a do DNA circular. Assim, unicamente as molculas de interesse formaro placas aps transformao. Como todos os insertos possuem uma terminao comum (Z), a sequenciao dos diferentes clones, a partir dum iniciador da sntese (polimerizao) no stio X, deve eventualmente cobrir todo o inserto. Outra abordagem para sequenciar um longo fragmento de DNA consiste em criar uma famlia de clones M13, contendo cada um, um sub-fragmento do gene. Isto pode ser realizado preparando eliminaes ordenadas, como ilustrado na Fig. 35B.II. A cadeia de DNA bicatenria, comportando o inserto completo aberta numa extremidade deste, com uma enzima de restrio. O inserto em seguida digerido com uma exonuclease. Pores da mistura de reaco de digesto so removidas a diferentes tempos, antes da ligao ser20

completa, de maneira a parar a reaco. Formam-se populaes de molculas com comprimentos diminuindo progressivamente. As molculas com eliminaes so de novo circularizadas com DNA ligase, colocando o stio de ligao perto do iniciador universal (USP, Universal Sequencing Primer), que fica adjacente da nova extremidade criada pela digesto pela exonuclease. Otm-se uma coleco de clones, nos quais a regio de hibridao do iniciador universal est bem situada para sequenciar diferentes pores do inserto. Ao sequenciar esta coleco de clones com um nico iniciador pode-se obter um elevado nmero de sequncias que se sobrepem e assim determinar a sequncia total do gene. Existe uma variante em fase slida do mtodo de sequenciao de Sanger, que se baseia na imobilizao de um plasmdeo contendo o inserto que se quer sequenciar (Fig. 36.II.). Este linearizado com uma enzima de restrio A, e as extremidades protuberantes so preenchidas por uma polimerase com os 4 nucleotdeos trifosfatos, dos quais um um derivado contendo biotina, por exemplo a 11-bio-dUTP comercial. Depois de uma segunda digesto com uma outra enzima de restrio B, a mistura passada numa coluna de avidinaagarose. A avidina, ao complexar fortemente a biotina, assegura a imobilizao do DNA biotinilado. As cadeias no biotiniladas so em seguida eliminadas por desnaturao e lavagem. O DNA biotinilado monocatenrio imobilizado servir de molde para a hibridao com um iniciador de sequenciao e para as reaces de polimerizao. Os oligmeros so eliminados, depois de desnaturados, deixando as cadeias matrizes disponveis para a reaco de sequenciao seguinte. O mtodo de sequenciao de terminao de cadeia pode ser aplicado sequenciao de DNA bicatenrio, clonado por exemplo, no pBR322 ou em derivados da famlia pUC (vd. seco 9.). Na prtica, as molculas recombinantes na forma circular fechada so completamente desnaturadas a pH fortemente bsico (NaOH). A re-naturao em estrutura inicial difcil a este pH (>12); forma-se uma rede de molculas hbridas que expem uma proporo suficiente de DNA monocatenrio. A utilizao da sequenase (variante gentica da DNA polimerase do bacterifago T7), em vez do fragmento de Klenow da DNA polimerase I, foi, sem dvida, um factor de sucesso na sequenciao de DNA pelo mtodo dos didesoxi, incluindo o bicatenrio. A actividade exonuclesica 3'5' da forma nativa foi removida por manipulao gentica in vitro. A enzima possui elevada processividade e actividade especfica, e uma boa estabilidade. Certas sequncias de DNA, em particular as que contm pares de dG e dC simtricos, no so completamente desnaturadas durante a electroforese. Sempre que este fenmeno ocorre, o padro da separao dos fragmentos de DNA interrompido; as bandas apresentam-se menos espaadas que normalmente (fenmeno de compresso) e a informao sobre a sequncia , por consequncia, perdida. Uma maneira de eliminar este artefacto21

recorre incorporao dos anlogos da dGTP, o trifosfato de 7-desaza-2'-desoxiguanosina (7desaza-dGTP), ou o trifosfato de desoxiinosina (dITP), que formam estruturas secundrias mais fceis de desnaturar. Ambos so reconhecidos pela sequenase.O N P O O N N H N NH 2 P O O N N N

OH

OH

7-desaza-dGTP

dITP

3. Utilizao da PCR em sequenciao Um progresso importante foi realizado nesta rea com a introduo da tcnica da amplificao enzimtica pela reaco de polimerizao em cadeia (Polymerase Chain Reaction, PCR), para a sequenciao de DNA. Este mtodo permite amplificar in vitro, fragmentos especficos de DNA, facilitando a acumulao da informao para a sequenciao de DNA. baseado na utilizao de dois oligonucleotdeos iniciadores da polimerizao catalisada pela DNA polimerase, sobre as cadeias complementares de DNA, dentro da regio compreendida entre os dois oligonucleotdeos (vd. seco 11.g para mais detalhes). Efectuando ciclos repetidos de desnaturao das cadeias complementares de DNA, de annealing dos iniciadores oligonucleotdicos com as referidas cadeias e de sntese de DNA com a polimerase, obtm-se um incremento exponencial dum fragmento discreto de DNA (Fig. 37.II.A e precedente, Fig. 6-3). Um inconveniente do mtodo inicial da PCR era a limitao dos fragmentos amplificados regio confinada entre os dois iniciadores. Existe actualmente uma variante (PCR invertida), em que os oligonucleotdeos so iniciadores da sntese de DNA em direces que divergem da regio compreendida entre eles. Aps digesto por uma enzima de restrio, auto-recircularizao e ligao com uma ligase do fragmento de DNA alvo, a PCR com iniciadores invertidos dar origem a um fragmento linear contendo regies de sequncias desconhecidas divergindo dos iniciadores. A utilizao mais evidente da PCR em sequenciao, na preparao das matrizes de DNA; existe uma variedade grande de mtodos para diferentes aplicaes. No entanto, a Taq22

polimerase utilizada na reaco de amplificao uma enzima ideal para sequenciao, que pode assim ser efectuada directamente subsequentemente amplificao, sem que sejam necessrias modificaes significativas em relao aos componentes reaccionais. Habitualmente, a quantidade de matriz de DNA necessria para sequenciao obtm-se inserindo o DNA alvo em vectores bacterianos ou virais e multiplicando os insertos em clulas hospedeiras. Todavia, as matrizes para sequenciao podem-se obter mais eficazmente que com os mtodos dependentes de clulas, a partir de alvos genmicos ou de insertos de DNA clonados em vectores bacterianos ou virais, recorrendo amplificao por PCR dos insertos clonados. Mesmo a partir de sequncias completamente desconhecidas possvel recorrer amplificao, utilizando oligonucleotdeos iniciadores, no interior, ou prximos, do poli-linker do vector de clonagem. Desta maneira no necessrio fazer culturas repetidas e purificaes das matrizes de sequenciao a partir de bactrias ou de vrus. Um problema inerente sequenciao directa pelo mtodo da PCR resulta da reassociao rpida das duas cadeias de DNA linear amplificadas, aps desnaturao, que bloqueia a extenso do complexo iniciador oligonucleotdeo-matriz de DNA, ou impede o annealing desta com o oligonucleotdeo. Vrios mtodos podem ser utilizados para contornar este inconveniente e obter preferencialmente uma mono cadeia matriz para sequenciao. 1) O DNA bicatenrio gerado por PCR utilizado como matriz de sequenciao directamente, ou aps separao por electroforese e purificao a partir do gel, a fim de remover o DNA no amplificado, os iniciadores e os dNTPs. Em seguida, um dos oligonucleotdeos iniciadores utilizado para iniciar a reaco de sequenciao. O DNA desnaturado pode ser arrefecido rapidamente em neve carbnica, a fim de retardar a reassociao das cadeias. 2) Quando os produtos da PCR so de comprimento superior a 500 pb, o DNA bicatenrio pode ser desnaturado e as cadeias monocatenrias separadas por electroforese. Este mtodo apropriado para DNA de grande comprimento, cujas cadeias monocatenrias so difceis de obter por outros mtodos. 3) O DNA monocatenrio pode ser produzido directamente por PCR utilizando uma proporo molar assimtrica dos dois iniciadores oligonucleotdicos, ou ainda recorrendo a uma segunda reaco de PCR utilizando um excesso dum dos iniciadores e um fragmento alvo, proveniente duma PCR simtrica, separado por electroforese e purificado a partir de gel electrofortico (Fig. 37.II.B). 4) Uma alternativa para produzir DNA monocatenrio por PCR sem diminuir a eficcia da amplificao, (como pode ser o caso do mtodo assimtrico), recorre ao bloqueamento dum dos iniciadores da PCR. Um excesso de um terceiro oligonucleotdeo complementar de23

um dos iniciadores da PCR adicionado durante a reaco de amplificao. O terceiro oligonucleotdeo retira da competio as molculas duma das cadeias acabada de ser sintetizada, impedindo-as de se complexarem com o iniciador bloqueado. A PCR assim transformada a dada altura numa reaco de extenso de mono cadeia (Fig. 37.II.C). 5) Uma abordagem completamente diferente recorre combinao da PCR com a transcrio reversa, utilizando uma sequncia promotora de fago, especfica da enzima, ligada a um dos iniciadores da PCR. Inicialmente a PCR efectuada de maneira equilibrada, simtrica, a fim de produzir DNA bicatenrio. A reaco de transcrio efectuada num segundo tempo e dar origem a um incremento suplementar do nmero de cpias da cadeia monocatenria desejada (RNA), devido ao reconhecimento especfico da sequncia promotora pela transcritase do fago. Este transcrito em seguida sequenciado recorrendo transcritase reversa (Fig. 37.II.D). A Taq polimerase uma enzima adequada para a sequenciao de DNA porque possui uma elevada processividade e incorpora em proporo excelente; alm disso incorpora o anlogo 7-desazaguanosina, utilizado para resolver a compresso das sequncias de DNA ricas em C-G. Para alm destas propriedades, que compartilha com a T7 DNA polimerase, funciona a 55-75C, condio que pode ser til para resolver estruturas secundrias eventualmente presentes no DNA e que podem dificultar a aquisio da informao de sequenciao.

4. Sequenciao "automtica" O princpio utilizado nos sistemas ditos "automticos", actualmente disponveis no mercado o do mtodo de terminao de cadeia de Sanger. As suas caractersticas principais so o sistema de deteco no radioactivo e o processamento da informao, que automatizado. Foram desenvolvidos dois sistemas que se baseiam na derivatizao qumica de desoxirribonucleotdeos, modificados por grupos fluorescentes que so incorporados nos fragmentos de DNA sintetizados pela polimerase. Cada um deles recorre a uma srie particular de 4 grupos fluorescentes. Num dos sistemas, os grupos fluorescentes so a fluorescena, o nitrobenzoxadiazolo, a tetrametilrodamina e o Texas Red (Fig. 38.II.). Os espectros destes compostos apresentam mximos de absorvncia a comprimentos de onda diferentes. Cada um destes grupos fluorescentes est ligado quimicamente ao nucleotdeo modificado em 5' do iniciador universal. Obtm-se 4 iniciadores que diferem unicamente pela natureza da entidade qumica fluorescente fixa na sua extremidade 5'. Se se utilizar cada um destes iniciadores em cada24

uma

das

reaces

de

polimerizao

em

que

intervm

um

dos

quatro

didesoxirribonucleotdeos, associa-se um grupo fluorescente a um terminador de cadeia. A mistura dos produtos das 4 reaces separada por electroforese, num corredor nico duma coluna de gel de poliacrilamida, ou num gel com vrios corredores. As bandas fluorescentes so excitadas por um laser e detectadas perto da base do gel durante a electroforese. A informao transferida directamente para um computador, que identifica cada uma das bandas coradas, em tempo real, medida que elas passam, em funo do comprimento de onda do mximo de absorvncia. A sequncia temporal dos diferentes grupos fluorescentes representa a sequncia do DNA (Fig. 39.II.). Os dados sobre os comprimentos de onda so continuamente recolhidos e armazenados num computador, durante a corrida electrofortica e, em seguida, analisados para fornecerem a sequncia final. No segundo sistema os grupos fluorescentes esto ligados parte bsica dos trifosfatos dos derivados didesoxirribonucleotdeos (Fig. 40.II.). Os grupos trifosfatos asseguram a incorporao, sem que o grupo fluorescente impea aparentemente o reconhecimento da base complementar e o reconhecimento pela polimerase; a ausncia de grupo hidroxlico em 3' termina a polimerizao. Cada um dos quatro didesoxirribonucleotdeos modificado com um grupo fluorescente absorvendo a um comprimento de onda diferente, permitindo, como no primeiro sistema, uma deteco diferencial. O laser necessrio como fonte de excitao, a fim de se obter uma sensibilidade mxima a partir de cada banda de DNA. A figura 41.II mostra a informao bruta, a informao processada e um detalhe ampliado, entre os nucleotdeos 89 e 110 de um grfico de anlise. Este processamento da informao, que torna a diagrama mais claro e de mais fcil interpretao, de momento indispensvel, por 3 razes fundamentais: 1) Os espectros de emisso dos diferentes corantes sobrepem-se parcialmente. Os picos correspondendo presena de um s corante so, por isso, detectados por mais de um canal. , portanto, necessrio determinar as diferentes propores dos 4 grupos fluorescentes presentes no gel a cada instante. 2) Uma segunda complicao provm do facto de os grupos fluorescentes influenciarem a mobilidade dos fragmentos de DNA. Por exemplo, a fluorescena e a rodamina diminuem a mobilidade dos fragmentos de DNA de uma base e o Texas Red de 1 base e 1/4. , portanto, necessrio fazer a correco.

25

3) Uma terceira complicao inerente ao mtodo enzimtico, que d por vezes origem a variaes de intensidade das bandas ou a regies de leitura difcil, devido existncia de estruturas secundrias no seio do DNA. Foram desenvolvidos trs outros sistemas que utilizam cada um, um s marcador fluorescente e quatro corredores electroforticos. Esta modificao evita os problemas associados mobilidade diferencial dos fragmentos, causada pelos 4 diferentes marcadores qumicos e a sobreposio dos espectros de emisso dos mltiplos grupos fluorescentes. Qualquer deles l a sequncia em bases de DNA de maneira contnua e em tempo real, e possui uma sensibilidade entre 1 e 50 10-18 moles por banda, prxima da obtida com a autorradiografia convencional. Os marcadores qumicos fluorescentes encontram-se no iniciador do M13, utilizado na sequenciao pelo mtodo dos didesoxirribonucleotdeos. Num dos sistemas o marcador introduzido na extremidade 5' dum derivado sulfdrico do iniciador, por reaco com a iodoacetamida fluorescena de estrutura representada na figura 42.A.II. O feixe de excitao laser atravessa o interior do gel em linha recta, no sentido da largura (lateralmente), controlando continuamente os quatro corredores (disposio que elimina a necessidade de movimentos de "scanner" e aumenta a sensibilidade). Um gel de 20 a 30 cm de comprimento suficiente para efectuar a leitura de 300-400 bases em 5 horas. Nos dois outros sistemas, os iniciadores so marcados com o isotiocianato de fluorescena (FITC), introduzido em 5'-OH, ou num fosfato internucleotdico (Fig. 42.B.II), ou em posio C5 da base desoxiuridina, segundo o caso, por reaco com derivados oligonucleotdicos alquilaminados nas posies referidas. Num dos sistemas, dois grupos fluorescentes foram introduzidos no mesmo iniciador utilizando os derivados aminados em C5 de duas desoxiuridinas diferentes, com a finalidade de aumentar a sensibilidade da deteco e sem que haja interferncias com a actividade biolgica (Fig. 42.C.II.). As Fig. 43.II. e 44.II. ilustram esquematicamente a disposio da aparelhagem de irradiao de excitao laser, de filtrao, de irradiao emitida e de anlise computorizada dos dados. A irradiao de excitao lateral num dos sistemas (Fig. 43.II.) e orientada num ngulo, que minimiza os reflexos do vidro do gel e optimiza a energia transmitida s bandas, no sistema que utiliza a bi-marcao fluorescente (Fig. 44.II.). Este ltimo processo introduz uma focalizao do feixe laser que aumenta a resoluo das bandas separadas por espaos muito curtos e um sistema de scanning horizontal do gel que permite a criao duma imagem bidimensional (Fig. 45.II.). Este sistema permite sequenciar com ptima resoluo 500-600 bases duma nica aplicao, em gel de 30 cm correndo 4 amostras (16 poos) simultaneamente, com uma percentagem mdia de erro de 0,83 %.26

1.c.Sntese qumica de DNA H cerca de 25 anos, a sntese qumica de pequenos fragmentos de DNA (oligonucleotdeos) era um domnio esotrico, apangio de alguns qumicos especializados. Calculava-se, em 1975, que seriam necessrios 20 anos para sintetizar um gene de 100 nucleotdeos segundo um esquema optimizado por computador. Actualmente, possvel realizar este trabalho em algumas horas. Esta proeza tcnica, s possvel graas ao desenvolvimento acelerado das tcnicas de sntese qumica, catalisado pelo advento das tcnicas da Engenharia Gentica. O alargamento contnuo do campo de aplicao dos fragmentos sintticos de DNA, assim como o aspecto fundamental do estudo estrutural de certas sequncias particulares, constituram estmulos poderosos para os qumicos orgnicos, cujos esforos conduziram ao ajustamento e ao aperfeioamento das tcnicas de sntese. O domnio das aplicaes dos oligonucleotdeos sintticos, ou de anlogos, pode ser assim resumido:

Sntese total ou parcial de genes Construes (adaptadores, mutagnese...) Iniciadores para polimerases e transcritases DNA Sondas de hibridao para escrutinar RNA (ex., diagnstico..)

(ex., Northern...) bancos genmicos bancos de cDNA

Mutagnese dirigida localisada Determinao de estruturas de DNA e de RNA Mecanismos de interaco DNA-protena

Inibio de

traduo transcrio

Apresentamos neste sub captulo um resumo histrico geral da qumica que esteve, ou est na base da sntese de DNA.27

I.

Princpios da sntese qumica de DNA A sntese qumica em soluo de um oligodesoxinucleotdeo comporta as seguintes

etapas: 1) Preparao dos quatro desoxinucleotdeos: timidina, desoxicitidina, desoxiadenosina e desoxiguanosina, completamente protegidos. Estes so os blocos fundamentais para a sntese. 2) Desproteco selectiva de dois desoxinucleotdeos a condensar, de maneira a libertar em cada um dos blocos, unicamente as funes implicadas na formao da ligao internucleotdica. 3) Condensao dos compostos assim gerados para formar um dmero inteiramente protegido. 4) Extenso da cadeia de DNA repetindo as reaces das etapas 2 e 3 at obteno de um oligodesoxirribonucleotdeo completamente protegido. 5) Desproteco sequencial e controlada do oligodesoxirribonucleotdeo. 6) Isolamento, purificao e caracterizao. Quando a extenso da cadeia desoxirribonucleotdica realizada em fase slida, so necessrias algumas etapas suplementares: i) funcionalizao de um polmero insolvel; do primeiro desoxirribonucleotdeo protegido da cadeia

ii) fixao

oligodesoxirribonucleotdica a sintetizar, sobre a funo do suporte slido; iii) clivagem da cadeia de DNA do suporte slido. 1) Preparao dos blocos de base para a sntese As substncias de base na sntese de DNA so os quatro desoxirribonucleosdeos: timidina, desoxicitidina, desoxiadenosina e desoxiguanosina; (obtidos por degradao de ADN de origem natural) (Fig. 56.II.). Na molcula desoxinucleosdica podem-se distinguir trs centros que vo ser objecto de trs transformaes distintas: as bases e as funes hidroxlicas, em posio 5' e em posio 3'. a) Proteco das funes aminas exocclicas As bases que possuem funes aminas primrias (a timidina no possui) tm que ser protegidas. Esta proteco permanente, visto que o centro aminado no est implicado nas reaces de extenso oligomrica. Portanto, os grupos protectores devem ser estveis ao longo de todas as etapas de sntese. No entanto, eles devem poder ser retirados no fim da28

sntese em condies que preservem a integridade da molcula final. Os grupos que, nas estratgias de sntese mais utilizadas, melhor satisfizeram estas condies, so o grupo benzoilo para a desoxicitidina e a desoxiadenosina e o grupo isobutanoilo para a desoxiguanosina. A sua introduo tem de ser selectiva, a fim de no bloquear os grupos hidroxlicos do ciclo desoxirribofuranosilo. Estes grupos so objecto de uma proteco transitria, que pode ser especificamente removida aps acilao dos grupos aminados (ex., Fig. 57.II.). Uma proteco suplementar original foi introduzida por vrias equipas, destinada a proteger a funo lactmica da desoxiguanosina, fonte de reaces secundrias durante as reaces de condensao e de fosforilao.O NH HO5' 4' 1' ' 2' 3

NH2 N HO5' 4'

O

N

O

O

3'

1' 2'

N

O

OH Timidina

OH Desoxicitidina

NH2 N HO5' 4'

O N HO5' 4'

NH N NH2

O

3'

1' 2'

N

N

O

3'

1' 2'

N

OH Desoxiadenosina

OH Desoxiguanosina

Fig. 56.II

29

NH2 N HO5' 1' 4' 3' 2'

NH2 N O ClSi(CH3)3 Si O5' 4'

O

N

O

3'

1' 2'

N

O

OH Desoxicitidina

O Si O Cl

O HN N HO5' 4'

O HN N O NH4OH dil. Si O5' 4' 1' ' 2' 3

O

3'

1' 2'

N

O

N

O

O H

O Si

Fig. 57.II

b) Transformao dos grupos hidroxlicos Das funes hidroxlicas em posio 5' e 3', uma tem de ser protegida por um grupo protector transitrio, a outra fosforilada. A escolha do centro a fosforilar depende da estratgia adoptada. A estratgia que consiste em fosforilar a posio 3' deu os melhores resultados e tem sido utilizada nos mtodos gerais de fosfatotrister e de fosfitotrister. ) A proteco do grupo hidroxlico em posio 5' tem de ser temporria. Ela tem de ser removida antes de cada etapa de condensao, durante a extenso da cadeia desoxirribonucleotdica. O grupo protector deve neste caso possuir as propriedades seguintes: i) ii) poder ser introduzido selectivamente em posio 5' deixando intacta a funo poder ser retirado em condies suaves que no dem lugar a nenhuma reaco hidroxlica em posio 3'; secundria;30

iii) ser estvel em todas as etapas de sntese, de desproteco e de purificao que se seguem sua introduo; iv) eventualmente, facilitar, pela sua introduo, a purificao dos intermedirios de sntese. Entre outros grupos introduzidos com bons resultados o 4,4'-dimetoxitritilo um dos mais correntemente adoptados. introduzido atravs do seu cloreto, tirando-se beneficio da sua selectividade pela posio 5', devido a factores estricos. (ex., Fig. 58.II.).

O HN N HO5'

O OCH3 OCH3 N + HN

1' 4' ' 2' 3

O

N

N

C

Cl

C

O

5' 4'

O

3'

1' 2'

N

N

OH Desoxiadenosina protegida na base

OCH3

OCH3

OH

Fig. 58.II

O grupo 4,4-dimetoxitritilo pode ser quantitativa e rapidamente retirado em condies de baixa acidez (ex., cido dicloroactico, brometo de zinco) sem ruptura, ou com ruptura insignificante da ligao glicosdica; esta reaco conduz formao do catio dimetoxitritilo de cor laranja, cuja absorvncia pode ser medida espectrofotometricamente. Esta medida particularmente til na sntese em fase slida, pois ela a nica indicao da eficcia das reaces de condensao durante a construo da cadeia oligonucleotdica. ) A fosforilao em posio 3' dos nucleosdeos protegidos na bases e no grupo hidroxlico em 5' pode conduzir, segundo a estratgia escolhida, a um bloco completamente protegido, ou a uma espcie fosforilada activa, capaz de reagir directamente com outro bloco desoxinucleotdico desprotegido em posio 5' para formar a ligao internucleotdica. Numerosos agentes de fosforilao tm sido utilizados em sntese de oligodesoxirribonucleotdeos, sobretudo na metodologia do fosfatotrister (Fig. 59.II.).

31

DMTO

5'

1' 4' 3' 2'

O

Bp + R1Y

X P O X

DMTO

5'

1' 4' 3' 2'

O

Bp

R2Z

DMTO

5' 4'

O

1' 2'

Bp

3'

OH

O R1Y P O5' 4'

O X R1Y P O ZR 2

HO

O

3'

1' 2'

Bp

Bp = base protegida DMT = Dimetoxitritilo Z,Y = N, O, S R1 = arilo, 2-etiloarilo, 2-etilotoarilo, arilo substitudo R2 = alquilo, alquilo substitudo... X = triazolo, oxibenzotriazolo, cloro...

OR5' 4'

DMTO

O

1' 2'

Bp

3'

O R1Y P O O5' 4'

O

1' 2'

Bp

3'

OR

Fig. 59.II

Um dos substituintes do tomo de fsforo protege de maneira permanente o anio fosfato, responsvel pelos fracos rendimentos das reaces de condensao, assim como das dificuldades crescentes de purificao e de solubilidade com o comprimento dos oligmeros, surgidas na metodologia inicial dos fosfatodister. O outro substituinte tem um papel de proteco temporria destinada a ser substituda pela ligao fosfato internucleotdica. O grupo protector permanente deve possuir uma estabilidade total durante as reaces de remoo dos grupos protectores temporrios e durante as reaces de condensao. No deve interferir negativamente com o rendimento e a eficcia destas ltimas. Ele tem, no entanto, que ser retirado especificamente no fim da sntese sem provocar a ruptura concorrente das ligaes internucleotdicas. O grupo protector transitrio deve ser suficientemente estvel para permitir o isolamento, a purificao e o armazenamento dos blocos desoxinucleotdicos completamente protegidos. A sua remoo deve ser especfica e rpida em condies que preservem os grupos protectores permanentes e o grupo protector temporrio em posio 5'.32

Os grupos ortoclorofenilo (R = o-ClC6H4 com Y = O) permanente e o cianoetilo (R = CH2CH2CN com Z = O) temporrio (Fig. 59.II.) so exemplos de grupos muito utilizados na metodologia do fosfatotrister (ex., Fig. 60.II.).

O NH DMTO5' 4'

O N N + Cl O N P O O Et3N H 2O O NH Cl N N N DMTO5' 4'

NH O1' 2'

O

3'

1' 2'

N

O

N

O

3'

OH

O P O HOCH2CH2CN O NH DMTO5' 4'

N N N

DMTO

5' 4'

1' ' 2' 3

O

N

O

O

3'

1' 2'

N

O

O O Cl P O O-H+ Et3N Cl O

O P O OCH2CH2CN

Fig. 60.II

O grupo protector permanente na metodologia do fosfitotrister , actualmente, o cianoetilo, que veio substituir o grupo metilo, inicialmente utilizado. O terceiro substituinte do tomo do fsforo um grupo azodialquilo, introduzido em substituio de um tomo de cloro, o qual confere uma reactividade particularmente forte ao intermedirio fosfocloridrito (utilizado durante o desenvolvimento inicial do mtodo), que o torna instvel e de emprego pouco cmodo. Os compostos clorodiisopropilaminofosforoamidito (ou morfolino, entre parnteses) possuem um bom compromisso de reactividade-estabilidade (Fig. 61.II.).33

O N DMTO5' 4'

O NH N O N H C Cl+

NH N N H

O

1' 2'

N

N

DMTO N

5' 4'

O C

O

3'

P NCCH2CH2O

3'

1' 2'

N

OH

N

O NCCH2CH2O

O P N

N

O

Fig. 61.II

O mtodo do fostitotrister o correntemente utilizado em sntese em fase slida, em rotina, num processo inteiramente automatizado de elongao da cadeia oligonucleotdica. importante sublinhar que o sucesso da sntese qumica de DNA se baseia sobretudo na preparao destes blocos de base, isto , na escolha dos diferentes grupos protectores, no rendimento das diferentes reaces e na pureza dos desoxinucleotdeos completamente protegidos. 2) Desproteco selectiva Para poder condensar dois desoxinucleotdeos pelo mtodo do fosfatotrister, necessrio libertar separadamente, por um lado a funo fosfato e por outro o grupo hidroxlico 5', das suas proteces temporrias. Por exemplo, o grupo dimetoxitritilo retirado em condies cidas suaves e o grupo cianoetilo em condies bsicas suaves (Fig. 62.II.).

34

DMTO

5' 4'

O

1' 2'

Bp

3'

O O Cl P O OCH2CH2CN

Base (Et3N) DMTO5' 4'

cido (TCA, ZnBr) O Bp HO5' 4'

1' ' 2' 3

O

1' 2'

Bp

3'

O O Cl P O O HNEt3 Cl O

O P O OCH2CH2CN

O S O N N N NO2 (MSNT)

DMTO

5' 4'

O

3'

1' 2'

Bp

O O Cl P O O5' 4'

O

3'

1' 2'

Bp

O O Fig 62.II Cl 35 P O OCH2CH2CN

3) Reaces de condensao A reaco de condensao necessita evidentemente da formao de espcies activas, capazes de reagir com bons rendimentos, sem formao de produtos secundrios. A activao do fosfatodister frequentemente realizada pela aco conjugada de um cloreto de arilosulfonilo e de uma amina heterocclica, ou de uma sulfonamida (p ex., o mesitilenonitrotriazolo-MSNT), preparada antecipadamente a partir deste tipo de compostos (Fig. 62.II.). A activao dos fosforoamiditos realizada por um agente de protonao, cido fraco (ex.: tetrazolo pKa = 4,9) que acelera a ruptura da ligao do grupo dialquilamina e favorece o ataque pela funo hidroxlica que vai estabelecer a ligao internucleotdica. No , por isso, possvel, dentro desta metodologia, eliminar o grupo dimetoxitritilo em presena do grupo fosforoamidito. A reaco de condensao tem que ser seguida, neste mtodo, pela oxidao do fosfito trister em fosfato, o que se realiza correntemente pelo iodo aquoso (Fig. 63.II.).5' 4' 5'

DMTO

1' ' 2' 3

O

Bp +

HO

1' 4' 3' 2'

O

Bp

N

N N N H

DMTO

5'

4'

O

3'

1' 2'

Bp

O P NCCH2CH2O N

OR NCCH2CH2O

O P O5' 4'

O

3'

1' 2'

Bp

I2 H2O DMTO5' 4'

OR

O

1' 2'

Bp

3'

O NCCH2CH2O P O O5' 4'

O

3'

1' 2'

Bp

OR

Fig. 63.II36

4) Construo da cadeia oligodesoxinucleotdica a) Em soluo Na sntese em soluo e pela metodologia do fosfatotrister a extenso da cadeia polinucleotdica pode fazer-se de maneira alternada no sentido 3' 5' ou 5' 3', visto que se pode desproteger o grupo hidroxlico na extremidade 5', ou o triesterfosfato na posio 3' do oligmero em construo. Dois oligmeros podem igualmente ser condensados um com o outro. Devido sensibilidade dos fosforoamiditos s condies ligeiramente cidas, esta flexibilidade prpria aos triesterfosfatos, no se aplica ao mtodo do fosfitotrister, que no foi desenvolvido em soluo. A sntese em soluo permite a deteco de reaces secundrias de maneira mais directa que a sntese em fase slida. Ela permite a identificao e a compreenso da origem dos produtos parasitas e portanto possibilita a interveno sobre os parmetros correctores (Fig. 64.II.). b) Em fase slida A extenso da cadeia de DNA em fase slida realiza-se numa s direco (em geral 3' 5'), a partir de um desoxirribonucleosdeo fixo, por uma das funes hidroxlicas, a um suporte slido. A fixao efectua-se em geral atravs da formao de uma ligao amida entre um 2'-desoxi-3'-succinilorribonucleosdeo e um polmero insolvel aminado (P-NH2) (Fig. 65.II.).

37

Bp O DMTO P O ClPh NEt3

Bp O OPOCE OClPh DMTO

Bp O P O ClPh NEt3

Bp O OPOCE OClPh

1. TCA 2. cromatog Bp O HO P O ClPh Bp O OPOCE OClPh DMTO Bp O P O ClPh

1. TCA 2. cromatog Bp O HO P O ClPh Bp O OPOCE OClPh

Bp O DMTO P O ClPh

Bp O OPO OClPh

Bp O OPO OClPh

1. MSNT 2.cromatog

1. MSNT 2.cromatog

Bp O DMTO P O ClPh

Bp O OPO

Bp O P

Bp O OPOCE OClPh DMTO

Bp O P O ClPh

Bp O OPO

Bp O P

Bp O OPOCE OClPh

OClPh O ClPh NEt3

OClPh O ClPh

1. TCA 2. cromatog Bp HO O Bp Bp Bp O O O OPOCE P P P OClPh

Bp DMTO

O

Bp Bp Bp O O O OPO P P P OClPh

O O O ClPh ClPh ClPh

O O O ClPh ClPh ClPh

MSNT

Bp DMTO

O

Bp Bp Bp Bp Bp Bp Bp O O O O O O O OPOCE P P P P P P P OClPh

O O O O O O O ClPh ClPh ClPh ClPh ClPh ClPh ClPh

DMT = dimetoxitritilo Bp = citosina, adenina, guanina protegidas ou timina ClPh =2-clorofenil TCA = cido tricloroactico MSNT = mesitilenosulfonil-3-nitrotriazolo

Fig 64.II

38

DMTO

O

Bp +

O O O

DMTO

O

Bp

DMTO H2N P DCC O

O

Bp

OH

O C CH2 CH2 CO2H O

C CH2 CH2 O C

O

NH

P

Bp = citosina, adenina, guanina protegidas ou timina P = polmero insolvel Fig. 65.II

O poliestirenodivinilbenzeno, a resina composta polidimetilacrilamida-kieselguhr, a slica, as esferas de vidro de porosidade controlada, a celulose, o co-polmero teflonpoliestireno so exemplos de polmeros insolveis que podem ser utilizados. A extenso da cadeia polinucleotdica em fase slida consiste na repetio de um ciclo que compreende essencialmente: a) a reaco de desproteco do grupo hidroxlico em 5' do primeiro nucleosdeo (ou de cadeia em crescimento) fixo no polmero insolvel; b) a reaco de condensao entre a funo hidroxlica libertada e a espcie nucleotdica introduzida em soluo e activada in situ no tomo de fsforo em posio 3'. Com o mtodo do fosfitotrister, uma terceira reaco, que consiste na oxidao do fosfito em fosfato, , como j acima foi referido, necessria. Uma reaco suplementar por vezes efectuada (caping). Ela visa o bloqueamento da ligeira percentagem dos grupos hidroxlicos que no reagiram na reaco de condensao a fim de os desactivar para as reaces ulteriores. Os reagentes em excesso, os subprodutos e os solventes das reaces e de lavagem so eliminados por simples filtrao do suporte slido (Fig. 66.II.).Bp O DMT P OR Bp O P OR Bp O P OR Bp O Orepetio n vezes 1) Desproteco 5'OH 2) Condensao Bp

Bp O DMT P OR

Bp O O

Bp O O

DMT

N

P OR

OC(CH 2)2CNH P

OC(CH 2)2CNH P

3) capping 4) oxidao

DMT

OC(CH 2)2CNH P

Fig. 66.II

DMT = dimetoxitritilo Bp = citosina, adenina, guanina protegidas ou timina R = grupo protector do fosfato P = polmero insolvel

39

O isolamento do produto ligado ao polmero insolvel , por consequncia, simples e rpido, em relao aos mtodos convencionais em soluo. O conjunto das operaes prestase bem automatizao. Uma desvantagem da fase slida a cintica desfavorvel. Para conseguir reaces completas dentro de tempos razoveis, indispensvel utilizar excessos importantes de reagentes, cuja pureza portanto crtica. Vestgios de impurezas reactivas podem inibir completamente a reaco de condensao. Em fase slida a acumulao de produtos indesejveis inevitvel, visto no haver purificao em nenhuma etapa da extenso do fragmento de DNA. Uma maneira de minimizar este inconveniente consiste em utilizar dmeros ou trmeros, preparados em soluo, estratgia que diminui de um factor 2 ou 3 o nmero de reaces efectuadas no polmero insolvel. O comprimento do fragmento de DNA que possvel obter por sntese qumica depende evidentemente do rendimento da etapa de condensao, que tem que ser mantido o mais alto possvel (> 99 %). Do ponto de vista das vantagens e inconvenientes, o mtodo do cianoetilofosforamidito, pela alta velocidade da reaco de condensao e sobretudo pela possibilidade de obter produtos de reaco praticamente isentos de produtos secundrios (altos rendimentos) foi universalmente adoptado nos sintetizadores automticos. O polmero insolvel que melhores resultados tem dado constitudo por esferas de vidro de porosidade controlada e alquiloaminadas. 5) Desproteco A desproteco do fragmento de DNA uma operao delicada que deve preservar a integridade do edifcio molecular. Reaces incompletas, ou uma degradao parcial, conduzem a uma mistura complexa de produtos. A desproteco compe-se de 3 etapas distintas: I) transformao dos grupos triesterfosfatos em diesterfosfatos; II) desproteco das bases; III) desproteco da funo OH terminal em 5'. I) A desproteco dos grupos fosfatos uma fonte possvel de ruptura internucleotdica. Se a extenso da cadeia de DNA for realizada pelo mtodo do fosfatotrister em fase slida, a clivagem do suporte insolvel efectua-se com o mesmo reagente de desproteco dos grupos fosfatos clorofenilados, por exemplo com o 2-nitrofenilcarbaldoximato de40

Esta pode ser minimizada utilizando reagentes selectivos antes de desproteger as bases.

tetrametilguanidina. O grupo metilo utilizado no comeo do mtodo do fosfitotrister era deslocado por ataque nucleofilico pelo anio tiofenalato, antes da clivagem do suporte slido. Esta efectuada em condies suaves. O grupo cianoetilo, utilizado actualmente, removido em condies ainda mais suaves e sem necessidade de fazer intervir um reagente suplementar: por NH4OH temperatura ambiente. II) As aminas exocclicas das bases so desaciladas por amonlise a 50C. Este tratamento provoca uma ruptura, que no desprezvel, das ligaes fosfatos internucleotdicas quando o fosfato est na forma de trister; esta a razo pela qual se converte antecipadamente e selectivamente o fosfatotrister em fosfatodister. III) O grupo protector da funo hidroxlica em posio 5' o ltimo a ser retirado (pelo cido actico 80 % no caso do grupo dimetroxitritilo). conservado at ao fim para impedir a formao de tristeres fosfricos cclicos que conduzem a estruturas oligodesoxirribonucleotdicas com ligaes 5' 5, durante as primeiras etapas de desproteco. Devido ao seu carcter hidrfobo, o grupo dimetoxitritilo protector da funo 5'OH facilita o isolamento do produto por cromatografia de slica em fase inversa (Fig. 67.II.).Bp O DMT P OR Bp O P OR n Bp O ODesproteco dos fosfatos e Clivagem

Bp O P O

Bp O P O

BpDesproteco das bases

B O P O

B O P

B

OC(CH2)2CNH P

DMT

OH

DMT

OH

n

n

Desproteco do grupo 5'OH DMT = dimetoxitritilo Bp = citosina, adenina, guanina protegidas ou timina R = grupo protector do fosfato P = polmero insolvel

B O HO P O

B O P

B

OH

n Fig 67.II

41

RENDIMENTOS N de etapas n 10 10 10 20 20 20 30 30 30 50 50 50 100 100 100 Rendimento/etapa 90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99% 90% 95% 99% Rendimento final n x 100 35% 60% 90% 12% 36% 82% 4,2% 21,4% 74% 0,5% 7,7% 60% 0,0026% 0,59% 36%

42

6) Isolamento, purificao e caracterizao Os mtodos de isolamento e de purificao correntemente utilizados so a cromatografia de DEAE-celulose, de Sefadex, de camada fina de slica, a cromatografia liquida a alta presso (HPLC), com coluna de slica de fase inversa, ou de troca catinica e a electroforese preparativa em gel de poliacrilamida, ou capilar. A caracterizao do produto isolado e marcado numa das extremidades com um radioistopo pode ser efectuada pelo mtodo de sequenciao de DNA de Maxam & Gilbert. , no entanto, necessrio um reajustamento das condies das reaces aos fragmentos de pequeno comprimento. Um outro mtodo, conhecido pelo nome de Wandering spot, baseiase na anlise a duas dimenses (electroforese em acetato de celulose, seguida de cromatografia em camada fina de DEAE-celulose) dos fragmentos de oligonucleotdeo sinttico marcado numa extremidade, obtidos por digesto parcial com uma exonuclease. Este mtodo restringe-se a fragmentos de comprimento inferior a 20 nucleotdeos (vd. seco "Sequenciao"). As aplicaes dos oligodesoxirribonucleotdeos de sequncia definida abrangem quase todos os aspectos da investigao que implicam a recombinao de DNA, tanto no que diz respeito construo, identificao e caracterizao de clones bacterianos particulares, como manipulao do DNA clonado com o fim de modificar a sua estrutura. Nos campos da amplificao de DNA, da determinao de sequncias de DNA, do estudo das interaces protena-DNA, ou da anlise estrutural do DNA, os oligodesoxirribonucleotdeos sintticos tm-se revelado um instrumento extremamente til e indispensvel.

43

2.

VECTORES DE CLONAGEM A utilizao de novas molculas de DNA formadas por engenharia gentica depende da sua separao e da sua propagao. Para isso necessrio introduzi-las em clulas (bacterianas, por exemplo) de tal maneira que elas possam ser replicadas, preservadas e recuperadas vontade. Para o realizar recorre-se utilizao de vectores particulares, cujo DNA pode ser unido por ligao ao DNA que se deseja introduzir no hospedeiro biolgico e que podem depois ser levados a infectar eficazmente esse hospedeiro. Assim que a molcula recombinante se encontra no hospedeiro, pode-se replicar e propagar de maneira permanente. Portanto, em princpio, segmentos de DNA de qualquer origem podem ser clonados e preparados em quantidade a partir de cultura de clulas, contendo aquele DNA. Vrios tipos de vectores podem ser utilizados para clonar um fragmento de DNA e propag-lo na bactria E. coli: a) b) c) d) e) plasmdeos bacterifago cosmdeos bacterifago M13 sistemas de vectores bacterianos de elevada capacidade

Se bem que diferentes em comprimento e em estrutura, estes 5 tipos de vectores compartilham um certo nmero de propriedades: 1) 2) 3) replicam-se de maneira autnoma na bactria; podem ser facilmente separados do DNA do hospedeiro e purificados; contm regies de DNA no essenciais sua propagao no hospedeiro, nos quais

um DNA estrangeiro pode ser inserido. a) Os plasmdeos Os plasmdeos so molculas de DNA circular bicatenrio capazes de se replicar na bactria de maneira independente do cromossoma do hospedeiro. Em geral so designados por um p mnusculo (de plamdeo) e uma abreviao que pode ser descritiva ou meramente circunstancial. Cada plasmdeo possui uma sequncia que funciona como origem da replicao do DNA; sem esta regio no pode replicar-se na clula hospedeira. Os plasmdeos esto distribudos nos procariotas de maneira muito ampla; variam de massa molecular de + 106 a mais de 200 106 daltons. Conferem um certo nmero de fentipos ao hospedeiro que os contm (Tabela 1.II).44

Os plasmdeos podem-se agrupar segundo duas categorias principais, os plasmdeos conjugantes e os no conjugantes. Estes ltimos so destitudos de uma srie de genes (tra) que conduzem conjugao bacteriana. As funes de transferncia (tra) incluem um cluster de 12 genes, pelo menos, que so responsveis, entre outras coisas, pela sntese de pili e de outros componentes de superfcie celular. Estes pili permitem o contacto fsico -um prrequisito para a conjugao- entre as clulas doadoras e as receptoras. Independentemente destas funes, todos os plasmdeos possuem regies especficas, responsveis pela sua replicao autnoma (rep), que inclui uma origem de replicao (ori). Dado todos os genes e sequncias de DNA num plasmdeo, estarem habitualmente organizados em clusters funcionais, possvel desenhar uma estrutura geral dos plasmdeos (Fig. 68. II A). Os mecanismos que regulam o nmero de cpias dos plasmdeos so da maior importncia para a sua manuteno na bactria. O nmero de cpias , ou estritamente controlado por, e correlacionado com o nmero de molculas de DNA cromossmico (i. ., dificilmente superior a um) ou relaxado (i. ., uma clula bacteriana pode conter mltiplas cpias dum plasmdeo). Assim, uma categoria de plasmdeos mantm-se no hospedeiro em nmero elevado de cpias (plasmdeo relaxado) e outra em pequeno nmero de cpias (plasmdeo restritivo). Com algumas excepes, os plasmdeos restritivos possuem uma massa molecular relativamente elevada e so conjugativos, enquanto que os relaxados so normalmente no-conjugativos e tm uma massa molecular relativamente mais baixa. Os plasmdeos que se replicam sob controlo restrito requerem biossntese proteica activa, mas no DNA polimerase I para a sua replicao; os plasmdeos relaxados, contudo, necessitam duma DNA polimerase I funcional (produto do gene polA), mas replicam-se sem biossntese proteica de novo. Muitos dos plasmdeos multicpia apresentam um comportamento pouco usual: so capazes de continuar a replicao, mesmo na presena dum inibidor da biossntese de protenas. Praticamente, quando se interrompe a sntese proteica do hospedeiro com um antibitico (p. ex., cloranfenicol), bloqueia-se tambm a replicao do seu DNA. No entanto, a do plasmdeo relaxado continua e podem-se obter vrios milhares de cpias deste plasmdeo por clula (amplificao). Assim, os plasmdeos relaxados podem-se replicar mesmo se a replicao do DNA do hospedeiro estiver interrompida.