genética molecular

235
MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS Capítulo 1 - O FLUXO DE INFORMAÇÃO VIA MOLDES Os Ácidos Nucléicos Toda a informação que uma célula necessita durante a sua vida e a de seus descendentes, está organizada em forma de código nas fitas dos ácidos nucléicos que constituem os armazenadores e transmissores de informação nos seres vivos. Esta informação traduzida em proteínas permite que a célula execute todo o trabalho necessário à sobrevivência do organismo. Existem dois tipos de ácidos nucléicos: ácido desoxirribonucléico ou DNA e ácido ribonucléico ou RNA. Ambos são polímeros lineares de nucleotídios conectados entre si via ligações covalentes denominadas ligações fosfodiéster. Os nucleotídios, unidades básicas dos ácidos nucléicos, são constituídos de: Uma base nitrogenada (anel heterocíclico de átomos de carbono e nitrogênio); Uma pentose (açúcar com cinco carbonos); Um grupo fosfato. As bases nitrogenadas são de dois tipos: púricas e pirimídicas. Adenina (A) e Guanina (G) são purinas. Timina (T), Citosina (C) e Uracil (U) são pirimidinas. As purinas são constituídas de dois anéis fundidos de 5 e 6 átomos e as pirimidinas de um único anel de 6 átomos. Apenas quatro tipos diferentes de bases são encontrados em um dado polímero de ácido nucléico. No DNA as bases constituintes são A, G, C, e T enquanto no RNA são A, G, C e U. Uracil e Timina são moléculas bastante relacionadas, diferindo apenas pelo grupo metila encontrado no átomo C5 do anel pirimídico da Timina (Figura 1.1). Cristina M. Bonato 1

Upload: denilson-cleverson

Post on 10-Aug-2015

896 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Capítulo 1 - O FLUXO DE INFORMAÇÃO VIA MOLDES

Os Ácidos Nucléicos

Toda a informação que uma célula necessita durante a sua vida e a de seus descendentes, está organizada em forma de código nas fitas dos ácidos nucléicos que constituem os armazenadores e transmissores de informação nos seres vivos. Esta informação traduzida em proteínas permite que a célula execute todo o trabalho necessário à sobrevivência do organismo.

Existem dois tipos de ácidos nucléicos: ácido desoxirribonucléico ou DNA e ácido ribonucléico ou RNA. Ambos são polímeros lineares de nucleotídios conectados entre si via ligações covalentes denominadas ligações fosfodiéster.

Os nucleotídios, unidades básicas dos ácidos nucléicos, são constituídos de:

Uma base nitrogenada (anel heterocíclico de átomos de carbono e nitrogênio); Uma pentose (açúcar com cinco carbonos); Um grupo fosfato.

As bases nitrogenadas são de dois tipos: púricas e pirimídicas. Adenina (A) e Guanina (G) são purinas. Timina (T), Citosina (C) e Uracil (U) são pirimidinas.

As purinas são constituídas de dois anéis fundidos de 5 e 6 átomos e as pirimidinas de um único anel de 6 átomos. Apenas quatro tipos diferentes de bases são encontrados em um dado polímero de ácido nucléico. No DNA as bases constituintes são A, G, C, e T enquanto no RNA são A, G, C e U. Uracil e Timina são moléculas bastante relacionadas, diferindo apenas pelo grupo metila encontrado no átomo C5 do anel pirimídico da Timina (Figura 1.1).

Figura 1. 1. Purinas e pirimidinas são bases nitrogenadas. Os números identificam a posição nos anéis heterocíclicos (mais de uma espécie de átomo). É a presença dos átomos de nitrogênio que dá a estas moléculas seu caráter básico.

Dois tipos de pentoses são encontrados nos ácidos nucléicos: ribose e 2-desoxirribose (Figura 1.2). Diferem uma da outra pela presença ou ausência do grupo hidroxila no C 2' da pentose. É

Cristina M. Bonato 1

Page 2: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

baseado nesta característica que os ácidos nucléicos recebem o nome RNA (ribose) ou DNA (desoxirribose).

A pentose é o elo de ligação entre a base e o grupo fosfato. De um lado, o Nitrogênio 9 das purinas ou o Nitrogênio 1 das pirimidinas liga-se ao C1' da pentose e, de outro lado, o grupo carboxila do átomo de C5' da pentose participa da ligação éster com o grupo fosfato.

Figura 1. 2. Ribose e 2-desoxirribose. Os átomos de carbono são numerados como indicado. O grupo hidroxila está ausente no C2' da desoxirribose. É através do C1' que o açúcar conecta-se com a base nitrogenada. No DNA o açúcar é sempre uma deso-xirribose e no RNA é sempre uma ribose.

Mais de um grupo fosfato pode estar ligado à posição 5' do nucleotídio. As ligações de alta energia entre o primeiro (a) e o segundo (b) e entre o segundo (b) e o terceiro (g) grupos fosfato geram energia quando hidrolisadas. Os nucleosídios trifosfato 5' são precursores na síntese de ácidos nucléicos.

Denomina-se nucleosídio à combinação da pentose com a base nitrogenada. Dependendo do número de fosfatos adicionados ao nucleosídio ele é denominado nucleosídio monofosfato, difosfato ou trifosfato. A nomenclatura dos monômeros dos ácidos nucléicos está descrita na Tabela 1.1.

As diferenças entre RNA e DNA, todavia, não se restringem aos tipos de monômeros constituintes. Na maioria das vezes o DNA apresenta-se como uma longa hélice dupla com uma estrutura secundária regular e simples, enquanto os RNAs são, geralmente, moléculas de fita única bem menores que o DNA apresentando uma enorme diversidade de estruturas secundárias. Estas características estruturais estão relacionadas às funções destas duas macromoléculas na célula.

Tabela 1. 1. Nomenclatura dos monômeros dos ácidos nucléicos

Base Nucleosídio Nucleotídio RNA DNA

Adenina adenosina ácido adenílico AMP dAMP

Guanina guanosina ácido guanílico GMP dGMP

Citosina citidina ácido citidílico CMP dCMP

Timina timidina ácido timidílico - dTMP

Uracil uridina ácido uridílico UMP -

A letra "d" é utilizada para indicar que o açúcar é a desoxirribose.

A molécula de DNA é uma dupla hélice cujas cadeias estão unidas por pontes de hidrogênio estabelecidas entre purinas e pirimidinas complementares. Adenina sempre pareia com Timina (A = T) e Guanina com Citosina (G = C).

O modelo de dupla hélice (Figura 1.3), proposto por Watson e Crick (1953a), pautava-se nas fotografias de difração de raio X das fibras de DNA feitas por Rosalind Franklin no laboratório de

Cristina M. Bonato2

Page 3: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Maurice Wilkins (Cavendish Institute, Cambridge, UK)e nas razões entre as bases, descritas por Chargaff.

Figura 1. 3. Modelo da dupla hélice de DNA. A orientação das duas fitas é antiparalela. As fitas são mantidas unidas por pontes de hidrogênio entre bases complementares as quais se posicionam perpendicular-mente ao eixo açúcar-fosfato de cada fita. Interações hidrofóbicas e de van der Waals contribuem para a estabilidade da hélice. Uma volta da hélice é constituída de 10 nucleotídios (3,4 nm). Cada nucleotídio tem 0.34 nm ou 3,4 Angstrons (Å).

A estabilidade e regularidade estrutural da molécula de DNA, deve-se principalmente ao fato dos anéis de desoxirribose não possuirem grupos hidroxila no C 2'. Os grupos hidroxila tanto do C2' como C3' são muito reativos e podem participar de uma série de ligações pouco usuais permitindo uma variedade enorme de conformações para a molécula de ácido nucléico. Tal variedade, não seria uma característica desejável para uma molécula que tem armazenado e transmitido a informação genética durante estes milhões de anos de evolução. O exercício de tal função exige estabilidade e regularidade.

Já o RNA, constituído de riboses é, por isto mesmo, muito mais reativo e flexível. Além disto, o fato de ser fita simples permite um emparelhamento intramolecular de bases, gerando estruturas bastante complexas. Ao adquirir diferentes conformações numa estrutura tridimensional, as moléculas de RNA podem, inclusive, apresentar sítios ativos que catalisem reações químicas da mesma forma que as enzimas protéicas, nossas velhas conhecidas.

As enzimas de RNA são denominadas ribozimas e apesar de exibirem função catalítica são menos versáteis que as enzimas protéicas, uma vez que possuem menos grupos funcionais. A existência de RNA catalítico foi demostrada por Thomas Cech (1984) quando estudava a remoção de introns nas moléculas precursoras de rRNA em Tetrahymena (um protozoário ciliado).

É a grande flexibilidade dos RNAs que lhes permite executar uma atividade fundamental na célula, qual seja, a de interpretar o código contido na linguagem de nucleotídios e descodificá-lo para a linguagem de aminoácidos. A molécula de RNA é o intermediário no fluxo de informações dentro da célula, do DNA às proteínas.

Cristina M. Bonato 3

Page 4: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

O Dogma Central e os Moldes

Desde meados da década de 50 já se pensava na hipótese do DNA constituir-se num molde para a síntese de moléculas de RNA, as quais, por sua vez, devido a sua mobilidade e flexibilidade acoplar-se-iam aos ribossomos e dirigiriam a síntese de proteínas. Baseado neste raciocínio, Francis Crick propôs em 1956 o dogma central da biologia, salientando o fluxo unidirecional da informação: do DNA à proteína.

Para compreender este fluxo utilizamos a idéia de moldes. O DNA serviria de molde para a síntese de novas moléculas de DNA (duplicação) e, ao mesmo tempo, para a síntese de moléculas de RNA (transcrição). Por outro lado algumas destas moléculas de RNA, que denominamos RNA mensageiros (mRNA), poderiam servir de molde para a síntese de proteínas (tradução), que ocorre nos ribossomos. Nesta proposta, jamais as proteínas servem de molde à síntese de ácidos nucléicos ou de outras moléculas de proteína. Esta hipótese tem sido confirmada no decorrer de quase quatro décadas de pesquisa.

A proposta original, todavia, foi ampliada nos últimos anos com a descoberta, em 1970, da enzima transcriptase reversa por Temin & Mizutani de um lado e, de outro, por Baltimore. Ficou, então, esclarecido, que é possível sintetizar DNA utilizando-se RNA como molde. Um pouco antes disto, por volta de 1965, Spiegelman & Haruna haviam demostrado que o RNA também podia servir de molde à síntese de outras moléculas de RNA. Isto foi possível graças ao isolamento da enzima replicase codificada por um vírus infeccioso cuja informação genética está contida numa molécula simples de RNA.

Estes novos conhecimentos permitiram que o dogma central se ampliasse sem, contudo, perder a unidirecionalidade, ou seja, de ácido nucléico para proteína.

Sintetizando DNA

A síntese "in vivo" de uma molécula de ácido nucléico depende sempre da existência de um molde complementar e de máquinas protéicas específicas que adicionem os monômeros ao polímero nascente. Como funcionaria um molde? No caso dos ácidos nucléicos a complementaridade de bases permite facilmente a utilização de moldes. Esta complementaridade está baseada no fato de que é possível estabelecer pontes de hidrogênio entre G e C , A e T ou A e U, ou seja, purinas emparelham com pirimidinas (Figura 1.4).

Cristina M. Bonato4

Page 5: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 1. 4. O pareamento entre bases complementares envolve a formação de duas pontes de hidro-gênio entre A e T ou de três pontes de hidrogênio entre G e C.

A noção de complementaridade está claramente expressa nos parágrafos abaixo retirados da publicação feita por Watson e Crick em 1953 logo após a proposta do modelo da dupla hélice:

... "If the actual order of the bases on one of the pairs of chains were given, one could write down the exact order of the bases on the other one, because of the specific pairing. Thus one chain is, as it were, the complement of the other, and it is this feature which suggests how the deoxyribonucleic acid molecule might duplicate itself. Previous discussions of self-duplication have usually involved the concept of a template, or mould. Either the template was supposed to copy itself directly or it was to produce a "negative", which in its turn was to act as a template and produce the original "positive" once again. In no case has it been explained in detail how it would do this in terms of atoms and molecules. Now our model for deoxyribonucleic acid is, in effect, a pair of templates, each of which is complementary to the other. We imagine that prior to duplication the hydrogen bonds are broken, and the two chains unwind and separate. Each chain then acts as a template for the formation onto itself of a new companion chain, so that eventually we shall have two pairs of chains, where we only had one before. Moreover, the sequence of the pairs of bases will have been duplicated exactly;" .

No momento da polimerização, cada nucleosídio trifosfatado é adicionado à cadeia nascente, a qual está pareada com a fita molde. A adição de cada nucleotídio é feita através do estabelecimento de uma ligação éster entre a hidroxila terminal 3' da pentose e o grupo fosfato do nucleotídio ingressante. A energia armazenada no nucleosídio trifosfatado é utilizada pela polimerase para catalisar a reação que resulta na adição de um nucleosídio monofosfato à cadeia e conseqüente liberação de um pirofosfato que será posteriormente quebrado em íons fosfato por pirofosfatases (Figura 1.5).

Cristina M. Bonato 5

Page 6: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 1. 5. A síntese dos ácidos nucléicos ocorre com a adição de nucleotídios ao terminal 3'-OH da cadeia nascente de sorte que a síntese é sempre no sentido 5' 3'. O precursor da sínte-se é um núcleo-sídio trifosfatado que perde os fosfatos g e b, durante a durante a reação, na forma de pirofosfato (2 Pi).

A nova molécula adicionada deixa sempre exposto um terminal 3'OH para receber o próximo nucleotídio. Assim, a posição 5' de uma pentose está conectada à posição 3' da próxima pentose, via um grupo fosfato. A cadeia, cuja espinha dorsal são as moléculas de açúcar-fosfato, cresce no sentido 5' 3'. As bases nitrogenadas fixam-se perpendicularmente ao esqueleto açúcar-fosfato. Durante a síntese de DNA as enzimas envolvidas são DNA polimerases enquanto na síntese de RNA as enzimas envolvidas são RNA polimerases. Estas enzimas são máquinas protéicas, constituídas de várias subunidades que executam funções específicas durante os processos de polimerização.

As polimerases são específicas para desoxirribonucleotídios ou ribonucleotídios. Sempre que tivermos uma seqüência de desoxirribonucleotídios 5' ATCGAAG 3' como molde, será sintetizada, com absoluta precisão, a seqüência da fita complementar 5'CTTCGAT 3', desde que a enzima catalisadora seja uma DNA polimerase ou então, a fita 5' CUUCGAU 3' se a enzima catalisadora for uma RNA polimerase.

Em qualquer dos casos a adição de nucleotídios à cadeia nascente obedece a ordem da seqüência de nucleotídios na cadeia molde. É importante salientar que tanto no caso da síntese de DNA como de RNA as cadeias nascentes e o molde correm em direções opostas ou anti-paralelas (Figura 1.6).

Figura 1. 6. Duplicação do DNA. Cada nucleotídio é adicionado utilizando-se a energia armazenada nas ligações fosfato dos nucleosídios trifosfatados. A cadeia molde e a cadeia nascente são antiparale-las. A síntese depende da especificidade do emparelhamento das bases.

Sintetizando Proteína

A síntese "in vivo" de uma cadeia polipeptídica também depende de um molde: a molécula de mRNA. Denomina-se RNA mensageiro (mRNA), o RNA transcrito a partir de uma seqüência de DNA capaz de codificar uma proteína.

Cristina M. Bonato6

Page 7: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Para que o RNA sirva de molde para a síntese de proteínas, é necessário um descodificador ou molécula adaptadora capaz de "ler" o código genético. Esta molécula é um RNA especial, o RNA transportador (tRNA) cuja cadeia polinucleotídica de 75 a 85 nucleotídios apresenta uma estrutura secundária peculiar na forma de trevo, ilustrada na Figura 1.7.É interessante notar que há um pareamento interno entre as bases desta fita simples formando hastes que sustentam alças onde se encontram as seqüências de nucleotídios não emparelhadas. Alguns nucleotídios apresentam bases modificadas. A modificação das bases ocorre após a síntese do tRNA.

Figura 1. 7. A) Estrutura secundária de um tRNA. A posição do anticódon e do braço aceptor de aminoácido estão indica-das. B) Estrutura tridimensional determi-nada por difração de Raio X.

Estas estruturas de haste e haste/alças são os braços da molécula:

Braço aceptor - haste que termina numa seqüência, não emparelhada, CCA 3'OH na qual se ligará o aminoácido específico deste tRNA.

Braço do anti-códon - encontrado na posição oposta do braço aceptor, contém uma trinca central de nucleotídios específica para cada tipo de tRNA a qual reconhece a trinca complementar no mRNA. A trinca do mRNA é denominada códon e a do tRNA é denominada anti-códon.

Cada códon é uma trinca de nucleotídios que corresponde a um único tipo de aminoácido . Alguns códons não correspondem a nenhum aminoácido. Estes são chamados códons de terminação O códon AUG especifica metionina que geralmente inicia a síntese protéica (veja aqui o Código Genético). Tal sistema de descodificação permite que um mRNA seja utilizado como molde para a síntese de um polipeptídio.

A ligação dos tRNAs ao seu aminoácido específico, depende da ação das enzimas aminoacil-tRNA sintetases que ativam cada aminoácido ligando-o corretamente ao tRNA específico (Figura 1.8). Do contato entre a enzima e o tRNA participam os braços do anti-códon e a haste D. Logo, numa dada célula devem existir, no mínimo, 20 tipos de aminoacil-tRNA sintetases. Todavia, como o código é degenerado este número pode subir para 40 ou 50. As aminoacil tRNA sintetases também são moléculas adaptadoras.

Figura 1. 8. A enzima aminoacil-tRNA sintetase acopla um aminoácido particular ao seu tRNA correspondente. O tRNA carregado dirige-se ao ri-bossomo onde, via complementaridade de bases, reconhecerá o códon apropriado no mRNA. O tRNA específico recebe a notação do aminoácido correspondente.

Cristina M. Bonato 7

Page 8: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

O "entendimento" do código genético requer, portanto, duas moléculas adaptadoras: as enzimas aminoacil-tRNA sintetases, que ligam um aminoácido particular ao seu tRNA correspondente e a molécula de tRNA propriamente dita que se liga ao códon apropriado no mRNA, através de pareamento com o anti-códon.

O processo de síntese de polipeptídios usando como molde os mRNAs é denominado tradução e ocorre nos ribossomos em presença do mRNA, dos tRNAs carregados e de uma série de outros fatores acessórios e enzimas específicas utilizando energia proveniente da hidrólise do GTP.

Os ribossomos são partículas compostas de duas subunidades. A subunidade grande (L, do inglês, Large) e a subunidade pequena (S, do inglês Small). Cada subunidade ribossômica é constituída de um conjunto específico de proteínas e de moléculas de RNA ribossômico (rRNA).

Figura 1. 9. Mecanismo de adição de um único aminoácido à cadeia nascente de polipeptídio durante a tradução do mRNA. O aminoácido 6 carregado pelo seu respectivo tRNA está sendo adicionado. Os aminoácidos de 1 à 5 já fazem parte do polipeptídio. O tRNA vazio, de anti-códon CCC, complementar ao códon GGG (aa4) está abandonando o ribossomo. O sítio do ribossomo que recebe o tRNA carregado é denominado sítio A. O sítio onde se liga o tRNA carregando a cadeia polipeptídica (peptidil-tRNA) é denominado sítio P.

Quando uma mensagem (mRNA) acopla-se à subunidade ribossômica pequena, juntamente com o tRNA iniciador (tRNAMet), está dado o passo inicial para a síntese da cadeia polipeptídica codificada no mRNA. Uma leitura cuidadosa desta mensagem será feita por tRNA sucessivos, carregando os aminoácidos adequados (Figura 1.9). Aqui, a molécula de mRNA será utilizada como molde para a construção do polipeptídio nascente.

A reação fundamental no processo de síntese protéica é a formação da ligação peptídica entre o grupo carboxila no final da cadeia nascente e o grupo amino livre de um aminoácido ingressante.Logo, o sentido de síntese da cadeia polipeptídica é do terminal amino ao terminal carboxila colinear à leitura da mensagem a qual é sempre feita do terminal 5' para o terminal 3' da molécula de mRNA.

Todos os processos delineados acima, tais como duplicação do DNA, transcrição e tradução, são executados por máquinas protéicas especializadas que poderão ser estudados com mais detalhes nos capítulos específicos.

Cristina M. Bonato8

Page 9: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

GUIA DE ESTUDO

Qual a característica do DNA que contribui para a enorme estabilidade e regularidade da molécula de DNA?

Discuta o dogma central da biologia.

Como a idéia de molde complementar se adequa à síntese dos ácidos nucléicos e à síntese de proteínas?

Qual a função das aminoacil tRNA sintetases?

Defina códon, anti-códon, mRNA, tRNA e rRNA.

Compare as funções da transcriptase reversa, replicase e DNA polimerase.

Aprenda a utilizar a tabela de Código Genético indicando a seqüência de aminoácidos correspondente ao mRNA abaixo: 5' AUG CUG AAU CAA CGC GGC GAC GCU UCU UAC CCC UUU UAG 3'.

Cristina M. Bonato 9

Page 10: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Capítulo 2 – LEIS DA GENÉTICA

As Leis de Mendel

Desde o início do século já se sabia que unidades funcionais discretas, responsáveis pela hereditariedade, estavam localizadas nos cromossomos, dentro do núcleo de células eucarióticas. O comportamento dos cromossomos durante os estágios de divisão celular, mitose e meiose, mimetizava o comportamento destas unidades funcionais, indicando que os traços hereditários em eucariotos deveriam fazer parte dos cromossomos. Os traços hereditários podem ser definidos pela sua habilidade de passarem de uma geração a outra de maneira previsível.

As regras básicas de transmissão de informação genética de uma geração a outra haviam sido estabelecidas por Gregor Johann Mendel, em 1866, com a publicação do artigo "Experiments in Plant Hybridization", pela Sociedade de História Natural de Brno (então, Brünn, Áustria). Todavia, a comunidade científica da época não foi capaz de absorver suas idéias que se opunham à noção generalizada de que a herança resultava de uma mistura difusa de substâncias, responsáveis por variações contínuas como as observadas em relação à altura, longevidade, etc.

O que Mendel fez, essencialmente, foi cruzar plantas com características singulares distintas e observar a distribuição destas características nas gerações subseqüentes. Escolheu para estudo a ervilha de jardim Pisum sativum porque era fácil de cultivar; tinha ciclo de vida curto; a polinização da planta podia ser controlada; apresentava 7 características bem definidas: cor da flor (violeta ou branca); cor da semente (amarela ou verde); textura da semente (lisa ou rugosa); cor da vagem (amarela ou verde); forma da vagem (inflada ou com constrições); disposição das flores e vagens (axial ou terminal) e comprimento do caule (padrão ou anão).

Mendel demonstrou que as diferentes características da ervilha eram controladas por fatores, os quais eram herdados como unidades discretas. Postulava que, num organismo diplóide (2n) como a ervilha, para cada característica analisada, dois fatores estariam envolvidos. P. ex., em relação à característica cor, as sementes da ervilha poderiam ser amarelas ou verdes, dependendo dos fatores presentes na planta e da interação entre eles. Se apenas os fatores que determinam a cor amarela estivessem presentes, a semente seria amarela. Se apenas os fatores que determinam a cor verde estivessem presentes, a semente seria verde.

Atualmente, estes fatores são denominados genes e as formas alternativas existentes numa população recebem o nome de alelos. Durante a meiose, processo pelo qual são produzidas as células reprodutivas ou gametas (n), os alelos se separam (segregam) um do outro. Após o término do processo, os gametas produzidos possuem apenas um dos alelos para cada uma das características analisadas.

As formas alélicas surgem numa população em decorrência de alterações ocorridas nos genes. A nova forma mutada pode ser herdada e assim se estabelecer na população. Em geral, o alelo mais frequente numa população é denominado selvagem e o alelo alterado é denominado mutante.

Para realizar suas análises Mendel estabeleceu linhagens puras para cada uma das características que havia escolhido. Numa linhagem pura, quando a planta é auto polinizada, produz uma progênie idêntica a si própria, ou seja, com as mesmas características originais.

Cristina M. Bonato10

Page 11: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Linhagens puras produzem apenas um tipo de gameta. Considere-se, por exemplo, a cor da semente.

Numa linhagem pura de sementes amarelas todos os gametas produzidos conterão o alelo que determina a cor amarela e que será denominado A. Já a linhagem pura verde, só produzirá gametas contendo o alelo que determina a cor verde, denominado a.

Aos atributos observáveis de um organismo, como cor, tamanho, forma, etc., denomina-se fenótipo. Ao conjunto de alelos que determinam tais aspectos fenotípicos, denomina-se genótipo.

Quando Mendel cruzou linhagens parentais puras (P) de sementes amarelas, produtoras de gametas tipo A, com linhagens parentais puras de sementes verdes, produtoras de gametas tipo a, a primeira geração resultante, denominada geração F1, apresentava fenótipo amarelo e genótipo híbrido (Aa), pois resultava da fusão dos gametas A e a (Figura 2.1).

O fato de todos os indivíduos F1 serem amarelos indicava que o alelo amarelo era completamente dominante sobre o verde. Em função disto, o alelo verde foi considerado recessivo, uma vez que só era notado na ausência do outro, ou seja, não se expressava no híbrido.

Figura 2. 1. Segregação dos alelos. Razões fenotípica e genotípica em F2.

Quando os dois alelos são idênticos, isto é, genótipo AA ou aa dizemos que o indivíduo em questão é homozigoto para aquele gene. Quando os alelos são diferentes, genótipo Aa, dizemos que é heterozigoto.

Portanto, cada planta contem um par de genes governando um traço fenotípico particular, sendo cada alelo proveniente de um dos pais e transmitido de geração à geração, como unidade individual, através dos gametas.

Cristina M. Bonato 11

Page 12: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Os diferentes tipos de gametas da geração F1 irão se combinar aleatoriamente produzindo, na geração F2, fenótipos amarelos e verdes, na proporção 3:1 e 3 tipos de genótipos, AA : Aa : aa, na proporção 1:2:1.

A lei da segregação dos alelos constitui o primeiro princípio de Mendel.

Testando a Lei de segregação

A forma mais simples de testar a hipótese de segregação dos fatores, proposta por Mendel, é proceder a uma auto-fertilização da geração F2, produzindo a geração F3. Pela regra da segregação seria possível predizer as freqüências das classes fenotípicas resultantes.

A Figura 2.2 esquematiza os cruzamentos e as proporções de cada geração e representa o ponto central da proposta de Mendel sobre o comportamento dos alelos.

Figura 2. 2. Auto-fertilização de F2.

Outra maneira de testar a hipótese de Mendel é efetuar o cruzamento teste (testcross). Este teste consiste em cruzar o organismo em questão com um homozigoto recessivo. Neste cruzamento o fenótipo da progênie será determinado pelos alelos do parental que não seja o homozigoto recessivo (Figura 2.3). Outro teste é o do retrocruzamento (backcross), onde o organismo em questão é cruzado com um dos parentais. Assim, algumas vezes, o cruzamento teste é um backcross.

As principais conclusões tiradas por Mendel relativas a cruzamentos monohíbridos foram:

Cristina M. Bonato12

Page 13: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

 Para cada uma das características estudadas a ervilha contem dois determinantes hereditários (alelos);

 Para cada par de alelos, os membros do par podem ser idênticos (AA ou aa) ou diferentes (Aa);  Cada célula reprodutiva (gameta) contem somente um dos alelos de cada par (A ou a);  Na formação dos gametas os alelos se separam de sorte que a probabilidade de se formar um

gameta A é igual a de formar um a (1:1);  A união das células reprodutivas masculina e feminina é um processo aleatório que reúne os

alelos em pares;  Duas plantas com o mesmo fenótipo podem diferir em seus genótipos;  Os híbridos da geração F1 só expressam a característica dominante; Na geração F2 a característica recessiva reaparece. A razão dominante:recessivo é 3:1.

Figura 2. 3. Cruzamento teste

Dominância Parcial

A dominância completa de um alelo sobre outro não é um fenômeno universal. Em alguns casos, o fenótipo que se observa no heterozigoto é diferente do fenótipo dos parentais, apresentando características intermediárias entre os homozigotos dominante e recessivo. Quando os alelos comportam-se desta maneira diz-se que ocorre dominância parcial ou incompleta. Um exemplo é a cor das pétalas das flores de Mirabilis jalapa. Quando linhagens puras de pétalas vermelhas são cruzadas com linhagens puras de pétalas brancas, a progênie em F1 apresenta pétalas rosas. Auto-cruzamento de F1 gera plantas com pétalas vermelhas, rosas e brancas na razão fenotípica 1:2:1 que corresponde à razão genotípica de 1:2:1 (Figura 2.4).

Nas plantas com flores vermelhas os dois alelos presentes são funcionais e codificam uma enzima que participa da via metabólica para produção do pigmento vermelho. Nas plantas com flores brancas ambos alelos estão mutados e não há produção de pigmento, resultando em pétalas brancas. No heterozigoto apenas um alelo está funcional, de sorte que é produzido metade do pigmento encontrado nas plantas de pétalas vermelhas o que resulta em plantas com pétalas rosas.

Dominância incompleta, em geral é observada quando o traço analisado pode ser medido numa escala contínua, como por exemplo, quantidade de enzima produzida, altura, peso, etc., diferente de uma condição tudo ou nada, como sementes lisas ou rugosas.

Cristina M. Bonato 13

Page 14: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 2. 4. Dominância parcial ou incompleta na herança da cor da pétala da flor em M. jalapa. Em F2 as proporções fenotípica e genotípica são idênticas: 1:2:1.

Codominância

Um outro caso de ausência de dominância completa é o de codominância. Neste caso, o fenótipo do heterozigoto não se encontra em algum ponto na faixa entre os dois fenótipos parentais, como no exemplo de dominância parcial. Na codominância, os dois alelos são funcionais e expressam-se simultaneamente. Este é o caso do grupo sangüíneo ABO no ser humano. Na população existem quatro tipos de fenótipos (A, B, AB e O), produzidos por três alelos: A, B, e O.

Na superfície das células vermelhas do sangue (eritrócitos) são encontrados mucopolissacarídeos cujos açúcares terminais são modificados diferentemente em indivíduos A ou B, pela ação das enzimas codificadas, respectivamente, nos alelos IA ou IB (Figura 2.5). As enzimas que provocam estas modificações são galoctosiltransferases específicas.

Em indivíduos do tipo O é produzida uma enzima não funcional, incapaz de modificar o substrato, de sorte que o alelo IO é recessivo aos alelos IA ou IB. Indivíduos do grupo sangüíneo AB produzem os dois tipos funcionais da enzima fazendo, portanto, os dois tipos de modificação no substrato, o que caracteriza o fenômeno de codominância.

As estruturas A ou B expostas na superfície dos eritrócitos funcionam como antígenos. Antígenos são substâncias estranhas ao organismo, que induzem o sistema imune à produzir anticorpos. Os anticorpos são proteínas que se ligam aos antígenos inativando-os e/ou destruindo as células que os apresentam.

Indivíduos tipo A produzem anticorpos contra indivíduos tipo B (anti-B) e indivíduos B, produzem anticorpos contra A (anti-A). Indivíduos O, que não produzem nem antígeno A nem antígeno B, produzem anticorpos anti-A e anti-B. Indivíduos AB, que produzem os dois tipos de antígenos, não produzem anti-A nem anti-B.

Nas transfusões de sangue é necessário considerar os antígenos e anticorpos para evitar que se agreguem. Indivíduos com sangue tipo A produzirão anticorpos anti-B e, portanto, não podem receber sangue nem de B, nem de AB. Indivíduos tipo B produzirão anticorpos anti-A e, portanto,

Cristina M. Bonato14

Page 15: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

não podem receber sangue nem de A, nem de AB Indivíduos tipo O são doadores universais, porque não possuem antígenos, mas só podem receber sangue de indivíduos tipo O. Indivíduos AB só podem doar sangue para indivíduos AB mas são receptores universais (Tabela 2.1).

Tabela 2. 1. Tipos sangüíneos ABO

Tipo Sangüíneo (correspondente ao tipo de antígeno)

Anticorpos(no soro)

Genótipo

O Anti-A e Anti-B IOIO

A Anti-B IAIA ou IAIO

B Anti-A IBIB ou IBIO

AB nenhum IAIB

O sistema ABO é um sistema de múltiplos alelos, ou seja, na população existem mais de dois tipos de alelos para o mesmo locus gênico. Os alelos IA e IB são dominantes sobre o alelo IO, mas codominantes entre si. Muitos outros exemplos de múltiplo alelismo existem na natureza. Na verdade, o alelismo múltiplo é a regra e não a exceção. Tais situações de múltiplos alelos na população são descritas como polimorfismo.

Figura 2. 5. Funções dos alelos IA, IB e IO. O alelo IA codifica a enzima a-3-N-acetil-D-galactosaminiltransferase que transfere acetilgalactosamina para a estrutura H. O alelo IB codifica a-3-N-acetil-D-galactosiltransferase que transfere galactose para a estrutura H. O alelo IO codifica uma proteína não funcional, de sorte que a estrutura H não é modificada.

Segregando Dois ou Mais Genes

Ao analisar o comportamento conjunto de duas características fenotípicas diferentes, p. ex., cor (verde ou amarela) e forma das sementes (lisa ou rugosa), Mendel observou que a segregação dos fatores que determinavam a cor era independente da segregação dos fatores que determinavam a forma (segregação independente).

Neste caso a progênie F1, híbrida para duas características (diíbrida), apresentava o fenótipo liso, amarelo indicando que liso era dominante sobre o rugoso e que amarelo era dominante sobre

Cristina M. Bonato 15

Page 16: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

verde. Quando Mendel auto fecundou F1 observou 4 tipos de fenótipos para as sementes nas seguintes proporções:

9/16 amarelo liso

3/16 verde liso

3/16 amarelo rugoso

1/16 verde rugoso

 Esta distribuição refletia a segregação independente de cada uma das duas características, cor e forma da semente em F2: 9:3:3:1. Na Figura 2.6 está esquematizada, no quadrado de Punnet, a segregação dos pares de alelos que determinam cor (A, a) e forma (L, l) das sementes na geração F2. A combinação aleatória dos 4 tipos de gametas produzidos pela auto fecundação de F1

produzirá os zigotos da geração F2.

Na construção do quadrado de Punnett assume-se que os 4 tipos de gametas são produzidos por cada pai em quantidades iguais e, portanto, cada categoria de descendente é igualmente provável. Como existem 16 categorias, a razão de cada uma é 1/16. Ao se agrupar os descendentes por fenótipos, observa-se a distribuição 9:3:3:1 citada acima. Isto ocorre porque a segregação dos alelos para estas duas características é independente uma da outra e existe dominância completa entre os alelos de um mesmo gene.

A lei de segregação independente dos alelos de diferentes genes é o segundo princípio de Mendel.

Figura 2. 6. Quadrado de Punnett da geração F2, mostrando o cruzamento entre linhagens heterozigotas para duas características (diíbridas): cor e forma das sementes. As letras A e L referem-se aos alelos dominantes os quais determinam, respectivamente, a cor amarela e a forma lisa. As letras a e l referem-se aos alelos recessivos os quais, em homozigose são responsáveis, respectivamente, pela cor verde e forma rugosa.

Cristina M. Bonato16

Page 17: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Testando a Lei de Segregação Independente

Realizando-se o cruzamento teste AaLl x aall, podemos predizer que serão gerados quatro tipos de fenótipos na proporção 1:1:1:1, correspondendo, justamente, à proporção 1:1 de uma par de alelos, multiplicada pela proporção 1:1 do outro par.

Um bom exercício é calcular quantos tipos de gametas seriam produzidos, na geração F1, para o caso de 3 genes com segregação independente.

Considere o cruzamento de AA BB CC com aa bb cc, gerando F1 Aa Bb Cc. Como os alelos de cada par se separam e os 3 genes são independentes, serão produzidos 8 tipos de gametas F1 os quais, ao se auto cruzarem podem produzir 64 (8 x 8) tipos de categorias entre os descendentes F2.

Neste caso, a razão de cada categoria é 1/64 e o número de fenótipos diferentes na geração F2, no caso de dominância completa, será 8. Caso não haja dominância, as razões fenotípicas e genotípicas serão iguais (Tabela 2.2).

Tabela 2. 2. Auto-fertilização multi híbrida (n = número de genes segregando 2 alelos cada)

Monohíbrido n = 1

Diíbridon = 2

Triíbridon = 3

Regra Geral

N° de genótipos dos gametas F1 2 4 8 2n

Proporção de homozigotos recessivos em F2 1/4 1/16 1/64 (1/2)2n

N° de tipos fenotípicos em F2 sob domi-nância completa

2 4 8 2n

N° de tipos fenotípicos em F2 sob domi-nância incompleta

3 9 27 3n

Se bem que as regras que governam a transmissão de características de pais para filhos tenham sido definidas no trabalho de Mendel, suas idéias só passaram a ser aceitas cerca de 30 anos mais tarde quando, em 1900, foram recolocadas por Correns, Tschermak & de Vries, num momento em que o desenvolvimento do conhecimento celular permitia a aceitação de suas propostas. Nesta época os cromossomos já haviam sido descobertos e muito se aprendera acerca dos movimentos cromossômicos durante o processo de divisão celular.

Em 1903, Walter Sutton propõe a teoria cromossômica da herança sugerindo que os genes estavam localizados nos cromossomos, baseado na semelhança de comportamento entre a segregação dos alelos e a dos cromossomos durante a meiose.

Os Genes Encontram-se nos Cromossomos

Em 1910 Thomas Hunt Morgan demonstra que os genes encontram-se nos cromossomos ao analisar o padrão de herança do olho branco na mosca de frutas Drosophila melanogaster.

Na maioria da população o olho das moscas é vermelho e, portanto este é considerado o traço selvagem. Olho branco é mutante. Ao cruzar fêmeas selvagens (olho vermelho) com machos mutantes (olho branco), Morgan observou que na geração F1 todos os indivíduos apresentavam o fenótipo selvagem, o que demonstrava a recessividade do alelo para olho branco. Na geração F2, metade dos machos tinham olho vermelho e a outra metade olho branco. Todas as fêmeas tinham

Cristina M. Bonato 17

Page 18: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

olho vermelho. De alguma forma esta característica estava ligada ao sexo, uma vez que somente entre os machos surgiram moscas de olho branco.

Morgan, então, fez o retrocruzamento das fêmeas híbridas de F1 (olho vermelho) com os machos parentais (olho branco). Apareceram fêmeas de olho branco e vermelho assim como machos de olho branco e vermelho, na proporção 1:1:1:1, indicando que o fenótipo olho branco não era característico apenas dos machos. Ao realizar o cruzamento recíproco, isto é, fêmea de olho branco x macho de olho vermelho, Morgan verificou que todas as fêmeas da progênie tinham olho vermelho e todos os machos, olho branco, um resultado bastante diferente de seu recíproco (Figura 2.7).

Retrocruzamento

Cruzamento Recíproco

Figura 2. 7. Cruzamentos em Drosófila analisando a segregação do alelo para olho de cor branca.

Cromossomos Sexuais

Nos experimentos realizados por Mendel, não importava se o alelo mutante estava no macho ou na fêmea. Os cruzamentos recíprocos sempre davam o mesmo resultado.

Com a cor do olho da Drosófila isto não aconteceu. Morgan percebe, então, que o alelo para a cor branca do olho deveria estar ligado ao cromossomo X, uma vez que este cromossomo é transmitido num padrão diferente entre machos e fêmeas: o macho (XY) só transmite seu cromossomo X para as filhas. A fêmea (XX) transmite o X para ambos os sexos.

Os cromossomos X e Y constituem os cromossomos sexuais, distinguindo-se dos outros pares de cromossomos denominados autossomos. As características analisadas por Mendel encontravam-se em autossomos.

Na Figura 2.8 está esquematizada a interpretação que Morgan deu ao padrão de herança do olho branco. Os resultados indicavam que os alelos para cor do olho segregavam juntamente com o cromossomo sexual X e que o alelo vermelho era dominante sobre o alelo branco.

A partir do momento que se constatou que um gene ocupa uma posição no cromossomo, esta posição passou a ser denominada locus gênico. O cromossomo Y, homólogo parcial de X, não teria um locus equivalente para a cor de olho. Uma vez que os machos só possuem uma cópia do

Cristina M. Bonato18

Page 19: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

cromossomo X, não podem ser considerados nem homozigotos nem heterozigotos para o locus em questão. O termo hemizigoto é utilizado para genes ligados ao X nos machos.

Nesta situação, uma única cópia do alelo recessivo determina o fenótipo, fenômeno denominado pseudo dominância. Genes que se encontram no cromossomo X são denominados genes ligados ao X.

Um exemplo humano de padrão de herança ligada ao X é a hemofilia A, uma desordem severa de coagulação do sangue determinada por um alelo recessivo. Indivíduos afetados não produzem a proteína coagulante fator VIII e após ferimentos leves, sangram muito.

CRUZAMENTO X+X+ x   XwY

F1: todos os indivíduos tem fenótipo selvagem conferido pelo alelo + localizado no cromossomo X da fêmea.

X+ X+

Xw X+Xw X+Xw

Y X+Y X+Y

F2: todas as fêmeas tem fenótipo selvagem. Metade dos machos é selvagem, metade é mutante

X+ Xw

X+ X+X+ X+Xw

Y X+Y XwY

CRUZAMENTO RECÍPROCO XwXw x  X+Y

F1: todas as fêmeas tem fenótipo selvagem conferido pelo alelo + localizado no cromossomo X do macho. Todos os machos tem fenótipo mutante conferido pelo alelo w localizados nos cromosssomos X da fêmea.

Xw Xw

X+ X+Xw X+Xw

Y XwY XwY

F2: 50% das fêmeas tem fenótipo selvagem, 50% fenótipo mutante. 50% dos machos é selvagem, 50% é mutante

X+ Xw

Xw X+Xw XwXw

Y X+Y XwY

Figura 2. 8. Padrão de herança do olho branco em Drosophila.

Ligação

Se os genes estão linearmente localizados nos cromossomos, então os alelos de diferentes genes, dispostos num dado cromossomo, sempre segregariam juntos, constituindo um grupo de ligação. Assim, a segregação independente da forma e da cor das sementes analisadas por Mendel, informa que estes loci estavam localizados em diferentes cromossomos ou grupos de ligação. Os pares de cromossomos que contem os mesmos loci gênicos são denominados cromossomos homólogos.

Regra geral: somente genes localizados em diferentes cromossomos apresentam segregação independente; genes localizados no mesmo cromossomo tendem a segregar juntos.

Todavia, a ligação não é completa. Isto porque, durante a meiose, quando os cromossomos homólogos pareiam, podem trocar partes entre si (recombinação), mesmo que seja numa freqüência baixa. Este processo implica em quebra e reunião de segmentos do DNA com a participação de um conjunto de proteínas especializadas nos processos de recombinação. Quando ocorre esta troca de

Cristina M. Bonato 19

Page 20: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

segmentos entre homólogos, os alelos aí localizados passam a apresentar uma independência relativa, o que resulta no surgimento de recombinantes.

Quanto maior a distância entre dois loci, maior a probabilidade de ocorrer quebra e reunião e maior a freqüência de recombinantes na população.

Sturtvent utilizou-se deste fenômeno para localizar a posição relativa dos genes nos 4 cromossomos de Drosophila, ou seja, para construir o mapa genético de Drosophila, demonstrando que os cromossomos são estruturas lineares não ramificadas. Atualmente, com a automatização do sequenciamento dos genomas, a posição dos genes nos cromossomos, determinada nesta época, tem sido geralmente confirmada.

Apesar da posição dos genes nos cromossomos ser fixa, constituindo os grupos de ligação característicos de cada espécie, alguns elementos genéticos não possuem uma localização fixa, podendo mover-se de um local a outro genoma sem que isto implique em afetar a arquitetura dos cromossomos envolvidos. Quando estes elementos genéticos saltam de um ponto a outro, em geral, afetam o funcionamento dos genes no qual se inseriram, constituindo uma das causas importantes de variação entre genomas individuais. Este fenômeno foi inicialmente observado e analisado de 1942-51, por Barbara McClintock, ao realizar análises genéticas do milho. Tais seqüências móveis são denominadas elementos transponíveis ou transposons.

Apesar dos grandes avanços ocorridos no início do século, a natureza química dos fatores hereditários ainda não estava definida. Seriam proteínas ou ácidos nucleicos?

Durante muito tempo acreditou-se que as proteínas seriam as depositárias da informação genética transmitida de geração à geração, baseado no fato de serem moléculas bastante complexas e de haver um número quase ilimitado de combinações possíveis com os 20 diferentes aminoácidos. Somente em 1944 foi demonstrado cabalmente por Avery, MacLeod & McCarty, que o material genético era o ácido desoxirribonucleico. Ainda foi necessário esperar quase 10 anos para que a estrutura desta molécula fosse finalmente desvendada por Watson & Crick (1953), com a colaboração fundamental de Rosalin Franklin e Maurice Wilkins. Portanto, mais de 80 anos se passaram desde a proposição de Mendel sobre as regras da hereditariedade até o conhecimento da molécula depositária da informação genética nos seres vivos do Planeta Terra.

Guia de Estudo

Para desenvolver linhagens puras de plantas de ervilha altas, um estudante cruzou duas plantas altas. Todos os 200 descendentes deste cruzamento (F1) eram altos. Na geração F2, todos eram altos, também. O estudante então, cruzou duas plantas altas de F2 e produziu a geração F3 onde todos eram altos. Todavia, ao cruzar duas plantas altas de F3, produziu plantas anãs na geração F4. Isto não poderia ser encarado como mutação, porque uma proporção razoável da população era anã. Explique o que aconteceu e prediga que proporção da geração F4 era anã (de Zwicker, 1996).

Defina dominância completa, parcial, pseudodominância e codominância.

Mendel cruzou plantas altas de ervilha, com plantas anãs. A geração F1 era toda alta. Quando auto-cruzadas para produzirem a geração F2, obteve-se uma proporção de 3:1 (altas:anãs). Dê os genótipos, fenótipos e proporções relativas da geração F3 resultante do auto-cruzamento de F2 (de Tamarin, 1996).

Cristina M. Bonato20

Page 21: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Defina grupo de ligação.

A cegueira para cor vermelha-verde (daltonismo), em humanos, é causada por alelos recessivos ligados ao X.

Uma mulher daltônica casa-se com um homem que tem visão normal para cores. Que proporção de seus filhos e filhas espera-se que seja daltônica?

Uma mulher normal para visão de cores, cujo pai era daltônico, casa-se com um homem normal. Que proporção de seus filhos e filhas espera-se que seja daltônica?

Cristina M. Bonato 21

Page 22: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Capítulo 3 – NATUREZA DO GENE

O DNA é o Material Genético

Trabalhando com Streptococcus pneumoniae, uma bactéria que causa pneumonia no ser humano mas é letal ao camundongos, Griffith mostrou, em 1928, que uma variante não patogênica da bactéria poderia transformar-se em patogênica desde que entrasse em contato com uma variante patogênica morta pelo calor. Portanto, as bactérias mortas liberavam algum fator no meio, capaz de transformar uma bactéria não patogênica em uma patogênica.

Para demonstrar a transformação, Griffith utilizou duas linhagens de S. pneumoniae: uma patogênica que formava colônias lisas (S) em meio nutriente sólido e uma não patogênica que formava colônias rugosas (R). A linhagem S produz colônias lisas porque suas células são envolvidas por uma capa de polissacarídeo. Camundongos infectados com esta linhagem morrem. A linhagem R não tem efeito patogênico no camundongo porque suas células são rapidamente destruídas pelas células brancas do sangue, o mesmo não acontecendo com as células da linhagem S, protegidas pela capa de polissacarídeos.

Quando células da linhagem S eram mortas pelo calor e depois inoculadas no camundongo, não causavam bacteremia (infecção bacteriana). Células vivas da linhagem R também não causavam bacteremia, pois esta linhagem não é patogênica. Porém, ao inocular no camundongo, células S mortas juntamente com células R vivas, os camundongos desenvolviam uma bacteremia idêntica àquela observada quando infectados com a linhagem S viva (Figura 3.1).

Figura 3. 1. Experimento de Griffith com linhagens patogênicas (S) e não patogênicas (R) de S. pneumoniae inoculadas em camundongo.

Cristina M. Bonato22

Page 23: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Que componente da célula S morta teria sido responsável pela transformação ocorrida? O experimento de Griffith não respondeu esta questãomas demonstrou a possibilidade de transformação.

Dezesseis anos mais tarde, Avery e colaboradores, analisaram o fenômeno de transformação in vitro, ou seja, observaram a variação de morfologia das colônias (lisa ou rugosa) em placas de Petri, sem inocular no camundongo e testaram a capacidade de diferentes macromoléculas transformarem células R em S.

Demonstraram, então, que a capacidade transformante das células S mortas seria perdida se o extrato fosse tratado com enzimas que destruíssem o DNA (DNases). Para realizar este ensaio, preparam um extrato de células S mortas e separaram as diferentes classes de moléculas existentes no extrato: DNA, RNA, proteínas, polissacarídeos e lipídios. A seguir, testaram a capacidade transformante de cada uma delas separadamente (Figura 3.2).

Figura 3. 2. Transformação de células R em S com moléculas de DNA isoladas de extrato de células S demonstrando que o DNA é o material genético. Os outros componentes celulares testados não transformaram células R em células S.

Estes testes demonstraram que os polissacarídeos não transformavam as células rugosas, apesar da capa de polissacarídeos estar envolvida na patogenicidade. Proteínas, lipídios ou RNA, também não possuíam capacidade transformante. Somente o DNA induzia a transformação das células R. Como contra prova, o extrato bruto foi colocado em presença de enzimas degradativas. Os extratos das células S mantinham sua capacidade transformante após tratamento com enzimas que degradavam proteínas, lipídios, polissacarídeos ou RNA. Todavia, quando tratavam o extrato das células S com DNAses, o extrato perdia sua capacidade transformante, ou seja não transformava mais células R em células S, uma vez que não mais apareciam colônias lisas.

Desta forma foi possível deduzir que o DNA era o agente responsável pelo desenvolvimento da capa de polissacarídeos e pela patogenicidade a ela associada.

Assim, o fenômeno de transformação refere-se à alteração genética de uma célula provocada pela incorporação e expressão de DNA estranho à célula. O trabalho de Avery, MacLeod e McCarty (1944) foi a primeira evidência experimental de que o DNA era o material genético: o DNA transformava células tipo R em células tipo S.

Posteriormente, Hershey & Chase (1952) trabalhando com o bacteriófago T2, demonstraram o papel do DNA na produção de novos fagos durante o processo infeccioso. Uma vez que os fagos

Cristina M. Bonato 23

Page 24: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

são estruturas muito simples, constituindo-se basicamente de uma capa protéica envolvendo uma molécula de ácido nucléico, os pesquisadores aproveitaram-se disto marcando radiativamente os componentes protéico ou nucléico e medindo a radiatividade intra e extra celular após infecção das bactérias Escherichia coli pelos fagos marcados (Figura 3.3). Este experimento apenas corroborou os dados iniciais de Avery et al. (1944) ao demontrar que, também em vírus, o DNA, e não as proteínas, era o material genético.

Figura 3. 3. Experimento de Hershey & Chase usando bacteriófago T2 marcado com 32P ou 35S. Uma vez que grande parte do 35S será incorporado em proteínas (cisteína, metionina), as novas partículas fágicas terão sua capa protéica marcada. Quando estas partículas infectam bactérias E. coli não marcadas, então a marcação 35S é detectada praticamente apenas no meio extracelular. Por outro lado, como grande parte do 32P é incorporado nos ácidos nucleicos, as novas partículas fágicas tem DNA marcado. Ao infectarem E. coli não marcada, a marcação 32P é encontrada intracelularmente e em uma fração das novas partículas fágicas recém montadas.

Atualmente, o desenvolvimento científico e tecnológico tem permitido a incorporação e expressão de DNA estrangeiro em diferentes organismos. Bactérias podem expressar genes típicos de eucariotos como os que codificam o fator VIII de coagulação do sangue ou a insulina e cuja produção em grande escala é de enorme interesse à medicina.

Quando células eucarióticas são transformadas o processo é denominado transfecção porque o termo transformação já era utilizado para significar crescimento canceroso. Os eucariotos (animais ou plantas) que incorporam DNA estrangeiro na linhagem germinativa são denominados transgênicos.

Na Figura 3.4A, um experimento realizado em 1982 por Palmiter, Brinster e colaboradores, mostra um camundongo transgênico que recebeu e expressou o gene que codifica hormônio de crescimento de rato, ao lado de um camundongo não transgênico. Na Figura 3.4B, Wood (1989) transfecta uma planta de fumo (tabaco) com o gene da luciferase de vaga-lume.

A luciferase catalisa a oxidação ATP-dependente de luciferina, o que leva a emissão de luz. Se as plantas transfectadas forem aguadas com luciferina elas se tornam luminescentes. Tanto o camundongo como a planta receberam DNA exógeno que se incorporou e se expressou provocando alteração fenotípica no organismo transgênico.

Cristina M. Bonato24

Page 25: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Assim, atualmente, a demonstração de que os ácidos nucléicos são os armazenadores da informação genética é facilmente verificada nos experimentos de transferência de genes de um para outro organismo, mesmo entre indivíduos tão díspares quanto uma planta de fumo e um vagalume ou uma bactéria e o ser humano.

A B

Figura 3. 4. Organismos transgênicos. A) camundongo transfectado com o gene para hormônio de crescimento de rato. B) planta de tabaco transfectada com o gene para luciferase de vagalume.

O RNA Como Material Genético

Em alguns vírus, o RNA é o material genético. Este é o caso do vírus TMV (do inglês, Tobacco Mosaic Virus) que infeta as plantas de fumo e é constituído de uma única molécula de RNA empacotada numa estrutura helicoidal formada por milhares de cópias de um único tipo de proteína.

Em 1955, Fraenkel-Conrat & Williams mostraram que os componentes protéicos e nucléicos do vírus podiam ser separados in vitro e a partícula reconstituída com os componentes trocados. Valendo-se disto, Fraenkel-Conrat & Singer (1957) reconstituíram partículas virais a partir de duas linhagens diferentes. Quando as partículas reconstituídas infectavam uma planta, as novas partículas fágicas apresentavam a capa de proteína do tipo originalmente associado ao RNA (Figura 3.5) demonstrando que o RNA e não a proteína era o material genético.

Figura 3. 5. TMV, vírus do mosaico de tabaco. A informação genética está codificada numa molé-cula de RNA.

Cristina M. Bonato 25

Page 26: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

As evidências acima mostram que o DNA é o material genético e que, em alguns vírus, o RNA é o material genético.

Prion: Uma Partícula Protéica Infecciosa e Hereditária

Todos os exemplos de infecção, seja de bactérias, fagos, fungos ou parasitas, dependem da existência de uma molécula de ácido nucléico. Existe, porém, um tipo de doença infecciosa cujo agente infeccioso é uma proteína, sem participação de DNA ou RNA. Além disto esta doença também apresenta caráter hereditário sendo transmitida de geração a geração como traço autossômico dominante. Este tipo de doença, com formas diferentes de manifestação nos seres humanos e animais, é fatal. A partícula protéica infecciosa, é denominada Prion.

A proteína infecciosa tem uma conformação diferente da proteína celular normal. A forma normal, denominada PrPc, é encontrada, predominantemente, na superfície dos neurônios, ligada a uma âncora fosfolipídica glicoinositol; é sensível à proteases e possivelmente, está envolvida em funções sinápticas. A proteína infectiva, denominada PrPSc, encontra-se na forma de agregados no sistema endossomo-lisossomo, caracterizando-se pela alta resistência à temperaturas elevadas e à ação de proteases. Na estrutura da proteína normal prevalecem alfa-hélices (42%), quase sem lâminas beta. Na estrutura da proteína infecciosa prevalecem lâminas beta (43%), com 30% de alfa-hélices.

As doenças causadas por prion resultam em desordens degenerativas do sistema nervoso central, conhecidos como encefalopatias espongiformes transmissíveis TSE, do inglês, Transmissible Spongiform Encephalopaties). Caracterizam-se pela perda de controle motor, demência, paralisia e finalmente a morte, geralmente antecedida por pneumonia. Os prions afetam diferentes regiões do cérebro. A morte das células nervosas infectadas dá ao cérebro a aparência de uma esponja, daí o nome genérico da doença, encefalopatia espongiforme. Os sintomas de cada tipo de doença dependem da região do cérebro que foi afetada.

No ser humano, o prion pode causar doenças como Creutzfeldt-Jakob (CJD), Síndrome de Gerstmann-Straussler-Scheinker (GSS), Insônia Familiar Fatal (FFI), Kuru e Síndrome de Alpers. Em carneiros, o prion causa uma doença denominada scrapie e no gado, a encefalopatia bovina espongiforme, BSE (do inglês Bovine Spongiform Encephalopatie), recentemente referida como a doença da vaca louca. As TSE desenvolvem-se muito vagarosamente e podem surgir, possivelmente, via:

Transmissão horizontal: p. ex., do carneiro para a vaca; da vaca para o homem ou do homem para o homem, através da dieta ou procedimentos médicos;

Transmissão vertical (hereditária): uma mutação no gene PrP é transmitida de pais para filhos, como um caráter autossômico dominante;

Surgimento espontâneo: a proteína muda da conformação não infecciosa para a infecciosa.

A idéia de que o agente infeccioso responsável por esta doença era uma proteína foi aventada pela primeira vez em 1966, por Tikvah Alper, ao observar que a radiação ultra-violeta, capaz de destruir ácidos nucleicos, não destruía a infectividade do scrapie.

Em 1967 J. S. Griffith propôs que a infectividade do scrapie poderia ser resultante de uma conformação alterada da proteína normal.

Cristina M. Bonato26

Page 27: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Estas idéias só foram desenvolvidas alguns anos mais tarde por Stanley Prusiner que se propôs, juntamente com vários colaboradores, a explicar como uma proteína é capaz de transmitir uma doença quando ingerida. S. Prusiner, que recebeu o Prêmio Nobel de Fisiologia e Medicina em 1997 por sua contribuição no estudo das doenças provocadas por prions, sugeriu que a proteína infecciosa reconhecia a proteína normal e induzia uma modificação conformacional nesta proteína tornando-a também infecciosa. Portanto, somente indivíduos que produzam a forma normal da proteína (PrPc) podem ser infectados, pois a propagação da PrPSc depende da presença da PrPc.

As proteínas com conformação alterada agregam-se formando longos filamentos que se depositam em organelas citoplasmáticas provocando danos ao tecido nervoso e finalmente, a morte do indivíduo. A real função das formas normais desta proteína ainda não está totalmente esclarecida. As estruturas dos prions podem ser visualizadas nos sites indicados abaixo.

Os Genes Governam a Expressão das Proteínas

Como os genes controlam as características fenotípicas dos organismos?

A primeira sugestão à respeito foi feita pelo médico Archibald Garrod (1909), em seu trabalho sobre erros inatos do metabolismo, ao estabelecer uma conexão entre genes e enzimas. Garrod estudava uma desordem metabólica benigna denominada alkaptonúria que provoca artrite tardiamente no adulto mas que pode ser detectada desde o nascimento, pela cor escura da urina exposta ao ar, particularmente após ingestão de alimentos ricos em fenilalanina ou tirosina.

Num estudo familiar demonstrou que esta desordem resultava de um traço recessivo herdado no padrão mendeliano e que a cor escura da urina decorria da alta concentração, nos indivíduos afetados, de ácido homogentísico, que escurece ao ser oxidado. Concluiu que os afetados não possuíam uma enzima capaz de metabolizar esta substância resultando em interrupção da via metabólica e, conseqüentemente, acúmulo de ácido homogentísico (Figura 3.7).

Fenilalanina Tirosina Hidroxifenil Piruvato

Fenilalanina Hidroxilase

Tirosina Aminotransferase

Hydroxifenilpiruvato Desoxigenase

Ácido Homogentísic

oHomogentisato desoxigenase

CO2 + H2O

Figura 3. 7. Via metabólica de degradação da fenilalanina. A ausência da enzima homogentisato desoxigenase interrompe a via, provocando acúmulo de ácido homogentísico que é excretado na urina.

Em 1941, três décadas após a publicação de Garrod, George Beadle & Edward Tatum, trabalhando com esporos do fungo filamentoso Neurospora crassa, mostram, novamente, existir correlação entre uma mutação e a ausência de uma atividade enzimática específica. O intenso trabalho destes pesquisadores utilizando mutantes para desvendar os passos das vias metabólicas de um organismo une, naquele momento, os campos da Genética e da Bioquímica.

Esporos selvagens de Neurospora podem crescer muito bem em um meio mínimo, ou seja, em um meio onde as únicas fontes de carbono e nitrogênio são glicose e amônia e que contem

Cristina M. Bonato 27

Page 28: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

ainda alguns sais e ácidos orgânicos além da vitamina biotina. Isto significa que as células de Neurospora possuem informação genética para sintetizar todos os aminoácidos, bases, vitaminas e tantas outras biomoléculas necessárias a sua sobrevivência.

Ao tratar uma população selvagem de Neurospora com radiação X, Beadle & Tatum conseguiram isolar uma série de indivíduos que haviam perdido a capacidade de crescer em meio mínimo. Analisaram, então, qual a deficiência destes mutantes, complementando o meio mínimo com aminoácidos, bases ou vitaminas. Localizaram, desta forma, grupos de indivíduos que necessitavam, p. ex., de arginina para crescer, ou seja, que haviam perdido a capacidade de sintetizar arginina. Mutantes que requerem a adição de um nutriente específico ao meio de crescimento são denominados auxotróficos e apresentam deficiência enzimática em algum passo da via biossintética daquela substância.

Utilizando o grupo de mutantes deficientes em arginina, Beadle & Tatum puderam deduzir qual a via metabólica para síntese de arginina. Inicialmente, através de cruzamentos entre os diversos mutantes obtidos, para arginina, identificaram 3 loci gênicos localizados em cromossomos diferentes: arg-1, arg-2, arg-3. Como sabiam a estrutura da molécula de arginina, podiam inferir que tipos de moléculas teriam sido seus precursores, tais como citrulina e ornitina. Quando ornitina era colocada no meio, somente o mutante arg-1 crescia. Na presença de citrulina, os mutantes arg-1 e arg-2 cresciam. O mutante arg-3 só crescia na presença de arginina (Tabela 3.3).

Tabela 3. 3. Crescimento de mutantes arg em meio mínimo suplementado com ornitina, citrulina ou arginina.

Ornitina Citrulina Arginina

arg-1 + + +

arg-2 - + +

arg-3 - - +

Isto indicava uma hierarquia de eventos. Como o mutante arg-3 não consegue sintetizar arginina na presença de nenhum dos dois precursores, deve apresentar uma mutação na enzima que transforma um precurssor (ornitina ou citulina), em arginina. Já o mutante arg-2 que consegue sintetizar arginina na presença de citrulina, mas não de ornitina, indica que a citrulina é o precursor imediato da arginina e tem uma deficiência no passo da via que converte ornitina em citrulina. O mutante arg-1 capaz de sintetizar arginina em presença tanto de ornitina como citrulina, seria deficiente num passo anterior, que convertesse uma molécula precursora em ornitina.

Cada um destes passos é catalisado por enzimas específicas. Uma mutação em um dado gene interfere na produção de uma dada enzima. A deficiência na enzima provoca um bloqueio na via metabólica. O bloqueio pode ser superado se suprirmos as células com o composto que seria formado se não ocorresse o bloqueio.

O modelo proposto por Beadle e Tatum ficou conhecido como a hipótese um gene - uma enzima e lhes valeu o prêmio Nobel de Fisiologia e Medicina, em 1958, juntamente com Joshua Lederberg. Mostravam que os genes eram responsáveis pelas funções enzimáticas e que cada gene controlava uma enzima específica.

Posteriormente, com o avanço do conhecimento acerca do que seriam os genes, a hipótese um gene - uma enzima mostrou-se pouco abrangente, na medida em que restringia a definição de gene à de uma atividade enzimática.

Atualmente podemos considerar o gene como qualquer segmento de DNA utilizado como molde para síntese de um RNA funcional.

Cristina M. Bonato28

Page 29: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Guia de Estudo

 Como foi demonstrado que o DNA é o material genético?

 Compare as conclusões tiradas a partir do experimento de Griffth com aquelas tiradas a partir do experimento de Avery et al.

 Como foi demonstrado que o RNA, em alguns casos, poderia ser o material genético?

 O que são prions? Como funcionam?

 O que são mutantes auxotróficos?

 Porque indivíduos com alkaptonúria apresentam a urina escura?

 O que significa a hipótese, um gene-uma enzima?

 Qual a função da luciferase?

 Como os prions estão relacionados com o Dogma Central da Biologia?

 Relate a evolução do conceito de gene.

 Uma geneticista estudando a via de síntese da fenilalanina em Neurospora isolou vários mutantes que requeriam fenilalanina para crescer. Ela testou o crescimento de cada um dos tres mutantes em meios de cultivo diferentes, contendo cada uma das substâncias que poderiam fazer parte desta via metabólica (tabela abaixo). O sinal + indica crescimento e o sinal - indica ausência de crescimento. Em que posição da via se encontra cada uma das substâncias testadas?

Substâncias

Linhagem Fenilpiruvato Prefenato Corismato Fenilalanina

Selvagem + + + +

Mutante 1 - - - +

Mutante 2 + + - +

Mutante 3 + - - +

Cristina M. Bonato 29

Page 30: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Capítulo 4 – ESTRUTURA DO DNA

A Molécula de DNA

Em 1953, Watson & Crick propuseram que a molécula de DNA era constituída de uma dupla hélice de cadeias polinucleotídicas antiparalelas interconectadas pela energia cooperativa de muitas pontes de hidrogênio que se estabeleciam entre bases complementares, púricas e pirimídicas, dos nucleotídios. Em seu modêlo, as bases projetavam-se para o interior da hélice a partir dos esqueletos externos de açucar-fosfato (Figura 4.1).

Figura 4. 1. A dupla hélice. O diâmetro constante de 20Å da dupla hélice é decorrente do emparelhamento de uma base púrica com uma pirimídica. Cada volta completa da hélice engloba cerca de 10 nucleotídios, com comprimento de 34 Å.

A proposta da dupla hélice baseava-se em tres pontos:

Na natureza química dos componentes do DNA (desoxirribonucleotídios);

Nos dados de difração de Raio X coletados por Rosalind Franklin & Maurice Wilkins;

Nas relações entre as bases, estabelecidas por Erwin Chargaff.

Com estas informações disponíveis, Watson & Crick construíram modelos moleculares, confeccionados em arame, na tentativa de encontrar aquele que se adequasse aos dados de difração de Raio X, à complementaridade de bases e a estrutura química de cada base.

Difração de Raio X

Para analisar a estrutura do DNA, R. Franklin, no laboratório de M. Wilkins, utilizava o método de difração de Raio-X. Em um cristal as moléculas estão arranjadas ordenadamente. Assim, quando um feixe de Raio-X atinge um cristal, espalha-se ordenadamente de acordo com um padrão que reflete a estrutura do cristal. A imagem do padrão de espalhamento é fixada em um filme fotográfico impressionado pelos Raios-X.

Na Figura 4.2, o padrão de espalhamento do feixe de Raio-X atravessando um cristal de DNA indica que:

Cristina M. Bonato30

Page 31: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

A molécula é uma hélice (padrão em cruz no centro)

As bases (áreas escuras) dispõem-se perpendicularmente ao eixo principal da molécula.

Figura 4. 2. Imagem produzida por um feixe de Raio X atravessando um cristal de DNA (Franklin & Gosling, 1953).

As Razões de Chargaff

Erwin Chargaff (1950) desenvolveu uma técnica para medir a quantidade de cada tipo de base presente no DNA de diferentes espécies. Seus dados mostraram que a quantidade relativa de um dado nucleotídio podia ser diferente entre as espécies, mas sempre, a quantidade de adenina era igual a de timina e a quantidade de guanina era igual a de citosina.

Em todos os organismos estudados verificava-se a razão 1:1 entre bases púricas e pirimídicas: A + G = T + C. Todavia, a quantidade relativa de cada par AT ou GC podia variar bastante de organismo para organismo, de sorte que a razão A+T/G+C era característica da espécie analisada (Tabela 4.1). Estas relações entre as bases são, atualmente, denominadas Razões de Chargaff.

Tabela 4. 1. Bases de DNA de diversas origens

Organismo Adenina Timina Guanina Citocina A+T/G+C

EcoliK12 26 23,9 24,9 25,2 1,0

Sreptococcus pneumoniae 29,8 31,6 20,5 18 1,59

Mycobacterium tuberculosis 15,1 14,6 34,9 35,4 0,42

Leveduras 31,3 32,9 18,7 17,1 1,79

Homo sapiens 30,3 30,3 19,5 19,9 1,53

Methanococcus jannaschii 34,4 34,1 15,5 15,8 2,18

Archaeoglobus fulgidus 25,8 25,6 24,2 24,3 1,05

Cristina M. Bonato 31

Page 32: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Hélices Antiparalelas

Qual a estrutura possível?

Os dados de difração mostravam que o diâmetro da hélice, cerca de 20 Å, mantinha-se constante em toda sua extensão. Isto só seria possível se purinas sempre emparelhassem com pirimidinas. Duas purinas emparelhadas aumentariam o diâmetro enquanto duas pirimidinas emparelhadas diminuiriam o diâmetro da hélice. Adenina e Timina podiam estabelecer facilmente duas pontes de hidrogênio entre si, da mesma forma que Guanina e Citosina podiam estabelecer facilmente três pontes de hidrogênio entre si e estes eram os pares propostos por Chargaff.

Todavia, o estabelecimento das pontes de hidrogênio entre as bases complementares das duas hélices somente se adequou perfeitamente aos dados de difração quando o modelo foi construído com as hélices invertidas uma em relação a outra. Para isto é necessário considerar que as fitas de DNA tem polaridade. Ou seja, uma das extreminadades da fita tem um fosfato 5' e a outra tem um grupo hidroxila 3' (Figura 4.3). Quando as duas fitas correm em sentidos opostos, ou seja, estão antiparalelas, as bases púricas e pirimídicas dos pares A-T e G-C encaixam-se perfeitamente bem.

Figura 4. 3. Polaridade das fitas do DNA. A polaridade é relativa à posição dos carbonos 3' e 5' da molécula de açúcar. A fita à esque-rda, corre no sentido 5' para 3' e a fita à direi-ta, no sentido 3' para 5'.

Apesar das pontes de hidrogênio serem individualmente muito fracas, uma grande quantidade delas é suficiente para manter as duas hélices unidas. À temperaturas mais elevadas, todavia, estas ligações se rompem e as hélices se separam, fenômeno denominado desnaturação. Quanto maior for a quantidade de pontes de hidrogênio entre as duas hélices, maior será a temperatura necessária para desnaturar a molécula de DNA. Portanto, quanto maior a quantidade de pares G-C (3 pontes), maior a temperatura de desnaturação.

Formas e Tamanhos do DNA

Cristina M. Bonato32

Page 33: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

A estrutura do DNA descrita no tópico anterior é denominada forma B do DNA. Nesta configuração as hélices enrolam-se para a direita (sentido horário). As bases estão dispostas quase que absolutamente perpendiculares ao eixo principal e cada giro completo da hélice corresponde a cerca de 10 bases numa extensão de 34 Å (3,4 nm).

Nem sempre a molécula de DNA encontra-se na forma padrão B. Outras conformações são possíveis, uma vez que a molécula não é uma estrutura estática, mas dinâmica, em constante movimento. Em certas regiões e em determinados momentos, as fitas da dupla hélice podem se separar transitoriamente e depois, voltar à conformação original ou adquirir, localmente, uma nova conformação. Mais de 20 variantes de hélices dextras já foram observadas.

Além, disso, em algumas regiões da molécula podem ser encontradas estruturas onde a hélice gira para a esquerda (sentido anti-horário). Esta forma, denominada forma Z do DNA, ocorre quando segmentos pequenos da molécula apresentam seqüências repetidas C-G. A estabilidade desta estrutura, em condições fisiológicas, parece depender de grupos metila ligados às citosinas presentes nas repetições CpG e afetaria o padrão de expressão gênica de células eucarióticas.

As moléculas de DNA são enormes. Um par de desoxirribonucleotídios tem uma massa molecular média de 660 Da e uma espessura de 3,4 Å. A Tabela 4.2 mostra o número de pares de bases e o comprimento total do DNA de alguns organismos com diferentes níveis de complexidade. Numa faixa ampla, de virus à mamíferos, poderíamos dizer que a quantidade haplóide de DNA varia com a complexidade, todavia isto nem sempre é verdade. Compare peixe pulmonado com Homo sapiens.

Tabela 4. 2. Tamanho de algumas moléculas de DNA

Organismo # cromossomos haplóides pares de bases comprimento, micrometro

Vírus

SV40 - 5,10 x 103 1,7

Lambda - 4,8 x 104 17

T4 - 1,66 x 105 55

Bacteria

Mycoplasma hominis - 7,6 x 105 2,6 x 102

Escherichia coli - 4,7 x 106 1,6 x 103

Eucarya

Levedura 16 1,35 x 107 4,6 x 103

Drosophila 04 1,65 x 108 5,6 x 104

Homo sapiens 23 2,9 x 109 0,99 x 106 (~1m)

Peixe pulmonado 19 1,02 x 1011 34,7 x 106 (~35m)

Modos de Duplicação

O grande mérito do trabalho de Watson & Crick (1953) foi sugerir um mecanismo de cópia da molécula de DNA baseado na complementaridade de bases:

Cristina M. Bonato 33

Page 34: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

"It has not escaped our notice that the specific pairing we have postulated immediately suggests a possible copying mechanism for the genetic material"

Ao decifrarem a estrutura demonstraram como a molécula se auto duplicava garantindo a manutenção e a transmissão da informação genética de geração à geração.

Em artigo posterior publicado ainda em 1953, Watson & Crick analisaram as implicações genéticas da estrutura do DNA, propondo que:

a) cada uma das fitas serviria de molde para a síntese de uma fita complementar;

b) a seqüência dos pares de nucleotídeos nos genes constituiria informação codificada a qual seria sequencialmente traduzida para a linguagem dos aminoácidos nas proteínas.

Watson e Crick salientaram ainda que o passo inicial da duplicação deveria ser o desenrolamento das duas hélices do DNA as quais, separadas, serviriam de molde para a síntese da fita complementar. Ao final do processo existiriam dois pares de cadeias onde a seqüência de bases estaria exatamente duplicada, uma vez que a duplicação baseava-se no emparelhamento específico das bases. Cada par seria constituído de uma fita nova e uma velha.

O problema era desenrolar as duas cadeias interconectadas da dupla hélice.

Se apenas uma das cadeias se quebrasse, a outra poderia facilmente girar em torno dela aliviando a tensão da fita não quebrada. No ponto de quebra os terminais mantidos bastante próximos, unir-se-iam novamente.

Três modos possíveis de duplicação da molécula foram considerados (Figura 4.4):

As duas fitas se desenrolariam, sem rupturas do esqueleto açúcar-fosfato e cada uma delas, separadamente, seria utilizada como molde para construir a sua complementar, de sorte que cada nova dupla seria constituída de uma fita velha e de uma nova (modo semi-conservativo);

Similar ao modo anterior, mas as fitas novas recém sintetizadas constituiriam a nova dupla e a dupla original se manteria como tal (modo conservativo);

Haveria quebras continuadas na espinha-dorsal de açúcar-fosfato e subseqüente reconstituição após duplicação que poderia resultar numa mistura entre segmentos velhos e novos na mesma fita (modo dispersivo).

Figura 4. 4. Modos possíveis de replicação da dupla hélice: semi-conservativo, conservativo e dispersivo. As fitas recém-duplicadas são vermelhas

As hipóteses colocadas foram testadas por Mathew Meselson & Franklin Stahl, em 1958, num engenhoso experimento que permitiria distinguir um modo do outro pelo padrão de sedimentação das moléculas de DNA após ultracentrifugação em gradiente de clorento de césio.

Cristina M. Bonato34

Page 35: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

A Replicação é Semiconservativa

Em 1958, Mathew Meselson & Franklin Stahl idealizaram um experimento para testar as hipóteses colocadas acerca dos modos possíveis de duplicação do DNA. Utilizaram como método, ultracentrifugação em gradiente de cloreto de césio, que permite separar moléculas com densidades levemente diferentes. O objetivo era distinguir as moléculas de DNA, antes e depois da duplicação, por diferenças de densidade entre elas.

Como a densidade do cloreto de césio (1,7) é correspondente a do DNA, um gradiente deste sal permitiria que amostras de DNA com diferentes densidades se concentrassem na região do gradiente que correspondesse a sua própria densidade, formando bandas em diferentes posições do tubo. As bandas podem ser detectadas com luz ultra-violeta no comprimento de onda de 260nm, onde os ácidos nucléicos absorvem fortemente.

Mas, se o processo de duplicação do DNA gera uma dupla hélice idêntica à original, qual o truque utilizado para que moléculas de DNA de mesma origem tivessem densidades diferentes antes e depois da duplicação?

1. Cultivaram células de E. coli em um meio contendo o isótopo pesado de nitrogênio na forma de 15NH4Cl. Após várias gerações todas as moléculas sintetizadas naquela população da bactérias, tinham incorporado 15N.

2. Transferiram as células para um meio contendo apenas isótopo leve, 14NH4Cl e permitiram a duplicação de mais duas gerações.

3. No intervalo de tempo correspondente à 1a geração, coletaram uma porção das células e extrariam o DNA.

4. O DNA isolado foi ultracentrifugado (40.000 rotações por minuto)/20 horas, quando deveria alcançar uma posição no tubo de centrífuga onde sua densidade correspondesse à da solução de CsCl.

No intervalo de tempo correspondente à 2a geração, repetiram-se os procedimentos 3 e 4.

Esperava-se o seguinte: A amostra de DNA da 1a geração contendo tanto isótopo leve como isótopo pesado, deveria

sedimentar numa posição diferente daquela das moléculas contendo apenas isótopo leve ou apenas isótopo pesado.

Após duas gerações, a quantidade de moléculas com isótopo leve aumentaria.

Levando-se em consideração as três hipóteses apresentadas, qual seria a localização das bandas de DNA após o primeiro ciclo de duplicação, ou seja, após uma geração (Figura 4.5)?

Se a duplicação fosse conservativa, haveriam duas bandas, uma pesada a outra leve; Se a duplicação fosse semiconservativa ou dispersiva, haveria uma única banda em posição

intermediária entre a leve e a pesada.

15NH4Cl14NH4Cl

Cristina M. Bonato 35

Page 36: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

1o ciclo

2o ciclo

Semi-Conservativo Conservativo Dispersivo

Leve        Pesado

Tempo 0

  

1a geração

2a geração

Topo        Fundo

Figura 4. 5. Distribuição de moléculas pesadas e leves e posicionamento das bandas em gradiente de cloreto de césio, no tempo 0, na 1a e na 2a geração, de acordo com os modelos semi-conservativo, conservativo e dispersivo. As curvas mostram quantitativamente o montante de absorção da luz ultra-violeta através do tubo.

Qual seria a localização das bandas após o segundo ciclo de duplicação? No modo conservativo de duplicação ainda seriam detectadas duas bandas, só que a banda

leve estaria, agora, mais espessa; No modo semi-conservativo surgiriam duas bandas de proporções equivalentes, uma

intermediária e uma leve; No modo dispersivo continuaria presente uma única banda intermediária, porém mais

espessa.

Os resultados obtidos por Meselson e Stahl mostraram que, após o 1o ciclo de duplicação, somente uma banda intermediária era visualizada no gradiente de cloreto de césio, em conseqüência, descartaram imediatamente a hipótese do modo conservativo de duplicação do DNA. No 2o ciclo, encontrava-se uma banda leve e uma pesada, o que eliminava o modo dispersivo de duplicação.

Demonstraram, desta forma que o modo de duplicação da molécula de DNA era semi-conservativo, o que confirmava a sugestão inicial feita por Watson & Crick.

Movimentação Bidirecional

Em 1963, J. Cairns, utilizando-se da técnica de autorradiografia e microscopia eletrônica, verificou fotograficamente o modo semi-conservativo de replicação do DNA em E. coli.

Células da bactéria foram cultivadas em meio contendo timidina radioativa. A radioatividade estava no tritium (3H-timina). O DNA foi extraído num tempo pouco superior ao de uma

Cristina M. Bonato36

Page 37: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

duplicação e tratado com emulsão fotográfica para observação ao microscópio eletrônico. A interpretação da autorradiografia revelou alguns pontos interessantes (Figura 4.6):

confirmou que a molécula de DNA em E. coli era circular, como indicavam as análises genéticas;

mostrou que as duas fitas da dupla hélice de DNA inicialmente se separam em uma posição denominada ponto de origem e as novas fitas começam a ser sintetizadas, produzindo-se os garfos de replicação (junções Y), que se movem ao longo da fita, bidirecionalmente, até o ponto de término (TER) da replicação;

enquanto o DNA se replica a integridade do círculo é mantida e uma estrutura teta (Ø) intermediária é formada;

mostrou, finalmente, que as duas hélices recém sintetizadas e entrelaçadas são separadas, liberando as novas dúplex, processo que requeria cortes em uma das fitas para que se efetivasse o desenlace.

Figura 4. 6. Estágios de dupli-cação do cromossomo circular da bactéria E. coli. Modo semiconservativo, com crêsci-mento bidirecional. Figuras inter-mediárias são as estrutu-ras teta.

Guia de Estudos

 Numa molécula de DNA fita simples, a quantidade de G é o dobro de A; a quantidade de T é três vezes superior a de C e a razão pirimidinas/purinas é 1,5:1. Qual a composição de bases do DNA em questão?

 Se o conteúdo GC de uma molécula de DNA é 56%, qual a porcentagem de cada uma das bases nesta molécula?

 Qual a relação entre os fragmentos de Okazaki e o fato da DNA polimerase sintetizar DNA no sentido 5' 3'?

Para cada uma das moléculas de ácido nucleico abaixo, deduza se é DNA ou RNA, e se é fita simples ou dupla.

Molécula % A % G % T % C % U Tipo Ácido Nucléico

A 33 17 33 17 0 - DNA dupla fita

B 33 33 17 17 0 -

Cristina M. Bonato 37

Page 38: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

C 26 24 0 24 26 -

D 21 40 21 18 0 -

E 15 40 0 30 15 -

F 30 20 15 20 15 -

Se a massa de um nucleotídio é ~330 Da, de quantos pares de base é constituída uma molécula de DNA dupla fita cuja massa é 8,9 x 109 Da? Quantos cm tem esta molécula? Quantos cm teria uma molécula de 2,9 x 109 nucleotídios?

Quantas voltas completas da dupla hélice devem ser desenroladas durante a replicação de um cromossomo de E. coli? O cromossomo de E. coli contem 4,7 x 106 pb.

A seguir estão as temperaturas de fusão (desnaturação) de 4 moléculas de DNA: 730 C, 690 C, 840 C 780 C e 820 C. Ordene estas moléculas de acordo com a quantidade crescente de pares G-C.

Se a razão A/C = 1/3, quais são as quantidades relativas de cada uma das quatro bases?

Cristina M. Bonato38

Page 39: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Capítulo 5 – MÁQUINAS REPLICADORAS

Repicação Semidescontínua

A síntese de uma nova fita de DNA depende da colaboração de diferentes polimerases que se enquadram em dois tipos básicos: as primases, que iniciam a cadeia e as polimerases replicativas, que sintetizam a maior parte do DNA (Kornberg & Baker, 1992). As polimerases replicativas sintetizam uma nova fita de DNA utilizando uma fita complementar como molde, desde que haja um grupo 3’ OH livre de uma cadeia iniciadora (primer), o qual perpetuará o ataque nucleofílico sobre o a-fosfato dos nucleosídios trifosfatados ingressantes. Assim, a cadeia sempre cresce no sentido 5’ 3’ (Figura 5.1).

Figura 5. 1. Há necessidade de um primer para a DNA polimerase sintetizar a fita com-plementar. O segmento de primer é sintetizado pela primase. O alongamento da cadeia com adição de desoxirribonucleotídios é feito pela DNA polimerase III e sempre ocorre no sentido 5’ 3’.

Arthur Kornberg (1957) identificou e purificou, em E. coli, uma atividade de DNA polimerase, que recebeu o nome de DNA polimerase I ou pol I. Posteriormente foram identificadas mais dois tipos de DNA polimerases, pol II e pol III.

A dependência das DNA polimerases por um terminal 3’ OH para catalisar a síntese da nova fita colocava alguns problemas na compreensão do processo:

Quem era o segmento iniciador (primer) e como era sintetizado? Se a enzima trabalha apenas no sentido 5’ 3’, como explicar a síntese simultânea da

dupla antiparalela, visualizada nas autorradiografias dos cromossomos replicantes de E. coli? Como era resolvida a questão topológica do desenlace da dupla hélice e da manutenção

destas hélices, separadas, durante a síntese? Quais seriam os mecanismos utilizados pela célula para a execução destas tarefas?

As evidências experimentais eram da: Formação de uma bolha de replicação no ponto de origem de replicação; Dependencia de um primer para iniciar a síntese pela DNA pol III; As duas novas fitas sintetizadas acompanham o movimento do garfo de replicação que

avança abrindo a dupla hélice.

Então, qual seria o mecanismo utilizado para replicar a fita complementar antiparalela? (Figura 5.2).

Cristina M. Bonato 39

Page 40: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 5. 2. Garfo de replicação. Como explicar a replicação simultânea das fitas antiparalelas observada por Cairns, em E. coli, se a DNA polimerase só permite o crescimento da cadeia no sentido 5’ 3’ ?

Fragmentos de Okasaki

Em 1968 Reiji Okasaki, trabalhando com E. coli, explicou a incompatibilidade aparente entre a replicação simultânea das duas fitas antiparalelas e o fato da DNA polimerase só adicionar nucleotídios no sentido 5’ 3’, ao mostrar que, enquanto uma fita replica continuamente, acompanhando o sentido de abertura do garfo de replicação, a fita complementar, antiparalela, replica descontínuamente, produzindo pequenos fragmentos de DNA que crescem no sentido oposto ao garfo de replicação e que só serão unidos posteriormente.

Experimento realizado por Okasaki:

Numa cultura de E. coli, Okasaki adicionou 3H (tritium) por 30 segundos (pulso radioativo) e imediatamente após extraiu e desnaturou o DNA. Grande parte do DNA fita simples radioativo sedimentou a 7S-11S (moléculas de 1000 a 2000 nucleotídios).

Quando, após o pulso, transferiu as células para um meio não radioativo (pulso e cassa) por 30 segundos adicionais, a marcação radioativa foi detectada em moléculas maiores cujo tamanho e radioatividade incorporada, aumentava com o tempo de cultivo no meio não radioativo. Isto implicava que os fragmentos iniciais haviam sido unidos posteriormente.

Baseado nestas observações, Okasaki propôs, então, o modelo semi-descontínuo de replicação do DNA:

A nova fita sintetizada que se estende no sentido 5’ 3’ em direção ao movimento do garfo de replicação, é denominada fita líder (leading) e cresce continuamente.

A fita complementar, denominada fita lenta (lagging), também é sintetizada no sentido 5’ 3’ mas, necessariamente, em direção oposta à do movimento do garfo de replicação,

implicando numa replicação descontínua, em pequenos fragmentos. Os pequenos fragmentos só podem ser sintetizados após movimento do garfo sobre uma

extensão razoável da hélice, implicando sempre num atraso em relação à fita líder. Este tipo de replicação gera fragmentos de 1000 a 2000 nucleotídios, hoje denominados fragmentos de Okasaki.

Posteriormente, os fragmentos de Okasaki são covalentemente unidos por ação da enzima DNA ligase (Figura 5.3)

Cristina M. Bonato40

Page 41: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 5. 3. Replicação semidescontínua do DNA. A fita lider é sintetizada continuamente a partir do primer. A fita lagging é sintetizada descontinuamente produzindo fragmentos de Okasaki. A) Dois fragmentos de Okasaki na fita lagging. B) Fragmento de Okasaki maior devido a união covalente entre eles catalisada pela DNA ligase. Novo fragmento é sintetizado conforme o garfo se movimenta. Três polimerases estão presentes no garfo de replicação; uma primase e duas DNA pol III.

Primers e Primases

Uma análise acurada dos fragmentos de Okasaki permitiu responder à questão do primer, ou seja, do início da replicação. O terminal 5’ dos fragmentos de Okasaki é constituído de segmentos de RNA (de 2 a 12 nucleotídios), que são complementares à fita molde. Duas enzimas de E. coli poderiam sintetizar os primers de RNA: a RNA polimerase, envolvida no processo de transcrição e a primase, uma enzima monomérica muito menor, de apenas 60kDa, produto do gene dnaG. Estas enzimas são capazes de iniciar a síntese de RNA estabelecendo uma ligação fosfodiéster entre dois ribonucleotídios livres, complementares à fita molde. Portanto, ao contrário das DNA polimerases, não dependem da existência de um primer. As primases são responsáveis pela síntese dos primers nos fragmentos de Okasaki e não são inibidas por rifampicina, um conhecido inibidor da RNA polimerase em bactérias.

Fragmentos de Okasaki: curtos segmentos de ácido nucléico (1000-2000n em E. coli e 100-200n em eucariotos), que contêm uma pequena seqüência de ribonucleotídios seguida de uma seqüência mais extensa de desoxirribonucleotídios sintetizadas, respectivamente, pela primase e pela DNA pol III.

Um grupo de proteínas, diferentes daquelas que participam da replicação propriamente dita, é requerido para transformar os fragmentos de Okasaki numa fita contínua de DNA sem a presença dos primers (ribonucleotídios). Basicamente três passos são necessários neste processo:

Remoção dos primers por ação do domínio de exonuclease da própria DNA pol I, o qual age no sentido 5' para 3';

Síntese de DNA, pela DNA pol I, preenchendo a lacuna resultante da remoção dos primers; Ligação dos segmentos de DNA adjacentes, pela DNA ligase.

Convém salientar que todas as DNA polimerases seja em fagos, bactérias, arqueotos ou eucariotos, possuem atividade exonucleolítica associada. Isto pode parecer estranho num primeiro

Cristina M. Bonato 41

Page 42: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

momento, mas tem lógica ao considerarmos que a atividade exonucleolítica permite a remoção da base que tenha sido erroneamente adicionada no momento da replicação, exercendo um papel revisor do processo replicativo e contribuindo, decisivamente, para a fidelidade da replicação. Os domínios de exonuclease com função revisora agem no sentido 3’ para 5’ diferindo, portanto, dos que removem o primer.

Porque os RNA seriam utilizados como primers, na síntese do DNA? Esta é uma questão de interesse evolutivo. É possível que a utilização de primers de RNA diminua a taxa de erros na replicação do DNA. A adição dos primeiros nucleotídios, sem um primer inicial, é um processo que está sujeito a mais erros do que o alongamento subseqüente. Se o fragmento inicial for RNA, será reconhecido posteriormente, como tal, e removido. A re-síntese pela pol I será feita a partir de um primer de DNA (fragmento de Okasaki adjacente).

Super-Hélices

Um problema que se coloca com o avanço do garfo de replicação é que a abertura das fitas provoca uma torção na dupla hélice, induzindo alterações topológicas nas moléculas de DNA que podem culminar com a formação de super hélices (Figura 5.6 de Voegt & Voegt, 1995).

Figura 5. 6. Micrografia eletrônica de uma dúplex circular de DNA, cujas conformações variam de ausência de super hélices para uma estrutura altamente super helicoidal .

Se, ao girar em torno de seu próprio eixo, a molécula de DNA o fizer no mesmo sentido de giro das fitas na dúplex, então será introduzido um super enrolamento positivo (positive supercoiling) e a molécula ficará mais firmemente fechada. Caso o sentido de giro da molécula seja oposto (para a esquerda) ao do giro das fitas, então se introduzirá um super enrolamento negativo (negative supecoiling) e a molécula ficará mais solta. Construa uma dúplex circular e experimente fazer os giros.

Uma propriedade de dúplex circulares é que o número de voltas existentes na molécula não pode ser alterado a não ser que se corte, pelo menos, uma das fitas. Enzimas denominadas topoisomerases controlam o estado conformacional de super hélice que é fundamental ao DNA no exercício de suas funções biológicas. Em geral, as moléculas de DNA in vivo, apresentam super enrolamento negativo, contribuindo para a separação das fitas e, consequentemente, para a realização de processos biológicos tais como replicação e transcrição.

A DNA girase é um exemplo de topoisomerase. Corta as duas fitas da super hélice, um pouco à frente do Y de replicação, permitindo um desenlace contido da molécula e, ao religar os terminais livres, inverte o sentido do giro, o que alivia a tensão, introduzindo um super enrolamento negativo. Um círculo relaxado não apresenta super hélices.

A formação de super hélices é mais estudada em moléculas circulares pequenas de DNA, tais como os cromossomos de alguns vírus e plasmídios. Todavia, as mesmas considerações feitas para estas moléculas são aplicáveis a qualquer região de uma molécula de DNA cujos terminais estejam impedidos de girar livremente.

Cristina M. Bonato42

Page 43: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Origens de Replicação

A replicação em E. coli inicia-se num sítio específico do cromossomo, denominado origem de replicação, onde se forma a bolha de replicação que se expande bidirecionalmente via garfos de replicação (Y) até encontrar o ponto de término.

Num cromossomo circular como o da bactéria E. coli, uma única origem de replicação é suficiente e os dois garfos de replicação, em movimento, encontram-se no polo oposto do círculo ao completar o processo. Os longos cromossomos de eucariotos contem múltiplas origens de replicação. Os dois garfos em movimento, a partir de um dado ponto de origem, avançam em direções opostas até encontrar os garfos em movimento de origens vizinhas.

Cada segmento de DNA que contem um ponto de origem é capaz de replicação autônoma e é denominado replicon.

Os cromossomos bacterianos constituem um replicon, na medida em que possuem apenas uma origem de replicação. Em eucariotos cada cromossomo possui vários replicons. Estima-se que o genoma humano contenha 10.000 a 100.000 replicons.

As origens de replicação estão localizadas em seqüências específicas do DNA, sempre no mesmo ponto do cromossomo, sendo definidas como o segmento de DNA que é necessário e suficiente para a replicação da molécula (Figura 5.4).

Figura 5. 4. Esquema das origens de replica-ção em bactérias e eu-catiotos e do sistema de replicação semidescon-tínua do DNA.

A origem de replicação em E. coli, denominada oriC, contem 245 pares de bases (pb) e apresenta seqüências repetidas, em série, de 9 e 13 nucleotídios. Os grupos de 9 nucleotídios repetem-se 4 vezes e são denominados caixas de DnaA (DnaA boxes), porque estas seqüências são reconhecidas pelas proteínas DnaA, iniciadoras de replicação. Os grupos de 13 nucleotídios estão repetidos 3 vezes e apresentam alta freqüência de pares AT, o que facilitará a abertura da bolha de replicação, uma vez que pares AT só estabelecem 2 pontes de hidrogênio entre si (Figura 5.5).

As proteínas DnaA, codificadas pelo gene dnaA, formam um complexo multimérico de 10-20 subunidades de DnaAs que se liga à oriC. Utilizando a energia de hidrólise do ATP esta

Cristina M. Bonato 43

Page 44: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

máquina protéica facilita o desenlace inicial da dupla hélice, formando o complexo aberto. A ligação do complexo DnaA à oriC é pré-requisito, mas não é suficiente ao desencadeamento do processo replicativo (Baker & Bell, 1998).

Um passo crítico neste sentido é a separação das duas fitas de DNA, o que facilita o carregamento da maquinaria de replicação e expõe as fitas complementares às polimerases aí instaladas. Tal abertura iniciada com o complexo DnaA expande-se por ação de helicases, as quais,às custas da energia de hidrólise do ATP, rompem as pontes de hidrogênio entre as bases, movendo-se em direções opostas ao longo da dupla hélice.

 Em E.coli, as helicases que agem neste processo são denominadas DnaB e codificadas pelo gene dnaB. As DnaB formam um complexo hexamérico que se liga à origem de replicação com ajuda de proteínas acompanhantes denominadas DnaC, as quais, após a entrega do complexo DnaB, abandonam o local.

Para impedir o reanelamento, proteínas que reconhecem fita simples ligam-se a cada uma das hélices num processo concomitante ao da separação. Estas proteínas são denominadas SSB (do inglês, single-strand binding protein). Esta maquinaria protéica instalada passo a passo no ponto de origem de replicação constitui o complexo pré-replicativo (Figura 5.5).

Em seguida, a primase, sintetizadora do primer, é recrutada. O conjunto helicase/primase é denominado primossomo. Está formado o complexo de iniciação da replicação. Uma vez sintetizado o primer, duas DNA polimerase III acoplam-se ao complexo e iniciam o alongamento da cadeia, uma na fita leading e outra na fita lagging.

Ao complexo protéico primossomo + 2 DNA pol III, dá-se o nome de replissomo. O replissomo coordena a replicação nas junções Y, movendo-se ao longo do DNA. Assim, em E. coli, a DNA pol III adiciona nucleotídios nas cadeias nascentes tanto da fita leading como lagging. Processo similar ocorre em eucariotos e arqueotos.

Origem de replicação em eucariotos: Um eucarioto bastante estudado e utilizado como modelo é a levedura Saccharomyces cerevisiae.

O genoma de S. cerevisiae, um eucarioto unicelular, apresenta múltiplas origens de replicação denominadas ARS (do inglês, autonomously replicating sequence). Estima-se que existam cerca de 400 origens de replicação distribuídas nos 16 cromossomos da levedura S. cerevisiae.

Uma análise detalhada dos 180 pb da região ARS, revelou a existência de um elemento essencial, constituído de 15 pb o qual foi denominado elemento A. Três outros segmentos, B1, B2 e B3 são necessários para um funcionamento mais eficiente do ARS. Um heterodímero de 6 subunidades denominado ORC (do inglês, origin-recognition complex), análogo ao complexo DnaA de bactérias, liga-se ao elemento A do ARS, em presença de ATP, para iniciar a replicação.

Cristina M. Bonato44

Page 45: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 5. 5. Iniciação da re-plicação em E. coli. A ori-gem de replicação oriC é re-conhecida pelo complexo multimérico DnaA ao qual se acoplam as helicases com a-juda das DnaC. A abertura da bolha é garantida pelas SSBs. A replicação se inicia com a síntese do primer dirigida pela primase.

DNA Polimerases

A enzima DNA polimerase III (pol III) é muito grande e complexa (~600kDa), sendo composta de dez polipeptídios diferentes (a, b, c, d, d’, g, q, t, e, y). As subunidades, unidas por ligações fracas, constituem a holoenzima. A pol III é uma enzima dimérica, portanto, cada uma das subunidades predominantes está presente em duplicata e na sua conformação final expõe dois sítios catalíticos para a adição de nucleotídios.

A central enzimática, constituída das subunidades a (polimerase), e (exonuclease) e q (função desconhecida), contem os sítios ativos para adição de nucleotídios e para revisão do processo de síntese.

A subunidade t ajuda dimerizar a central enzimática, ao mesmo tempo que interage com a helicase e com a primase exercendo o papel de proteína andaime (scaffold) no replissomo, ao permitir a ação cooperativa das sub máquinas protéicas helicase, primase e polimerase.

As outras subunidades estão envolvidas na manutenção da enzima junto ao DNA forçando a enzima a adicionar nucleotídios em seqüência, sem se desprender da hélice. A subunidade fundamental nesta função é a b, a qual, na forma de um dímero, enrosca-se em torno da dupla hélice recém-sintetizada movendo-se livremente ao longo do DNA, como um anel, carregando junto, a central enzimática e garantindo a eficiência do processo (Figura 5.7).

Figura 5. 7. Papel da subunidade β aumentando a processividade da DNA polimerase

Cristina M. Bonato 45

Page 46: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

A forma dimérica da pol III sugere um mecanismo de síntese das fitas leading e lagging, onde os desoxirribonucleotídios sejam adicionados ao mesmo tempo nas duas fitas (Figura 5.8). É possível que a fita molde lagging dê uma volta em torno de um dos sítios catalíticos da pol III, invertendo fisicamente porém, não bioquimicamente, a direção de crescimento da fita. Com esta inversão os terminais 3’ das cadeias nascentes leading e lagging ficam posicionados próximos aos sítios catalíticos das DNA polimerases permitindo a adição simultânea de desoxirribonucleotídios nas duas fitas, no sentido de abertura do garfo.

Figura 5. 8. Modelo pro-porsto para a síntese com-comitante das fitas leading e lagging durante a replicação do DNA, com a participação das várias máquinas proteicas (polimera-ses, exonucleases, helicases e complexos aces-sórios) que cons-tituem o re-plissomo.

As DNA pol III trabalham numa velocidade superior à da pol I. Adicionam cerca de 30.000 nucleotídios por minuto enquanto a pol I adiciona cerca de 600. Isto se reflete na quantidade de moléculas necessárias para os processos em questão. Cerca de 400 unidades de pol I são encontradas dentro da célula para cada 10-20 unidades de pol III. A enzima pol II, menos estudada, está envolvida no reconhecimento e reparo de danos ao DNA.

Sítios de terminação: Ao sítio de terminação (TER), em E. coli, ligam-se proteínas denominadas Tus. Supõe-se que estas proteínas inibam as helicases impedindo, desta forma, o avanço do garfo de replicação e provocando a parada da síntese. Ao final da replicação do cromossomo circular de E. coli são produzidos dois cromossomos filhos interconectados que serão separados pela ação de topoisomerases.

Modos Alternativos de Replicação em Cromossomos Circulares

Nos DNA circulares, além da forma bidirecional de replicação, que implica na estrutura q, alguns podem replicar pelo modo de círculo rolante, como encontrado em bacteriófagos e plasmídios ou pelo modo de alça D, como encontrado no DNA das mitocondrias e dos cloroplastos, em eucariotos.

Cristina M. Bonato46

Page 47: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Na Figura 5.9 está representado um esquema do círculo rolante na replicação do plasmídio F, de E. coli, durante a conjugação. No processo de conjugação, as informações genéticas contidas no plasmídio de uma célula, são transferidas para outra célula que não continha este plasmídio, de sorte que, ao final do processo as duas células carreguem o mesmo tipo de plasmídio. Durante a transferência o cromossomo replica-se pelo modo de círculo rolante.

No modo de círculo rolante, a replicação se inicia com um corte em uma das fitas. Este corte produz dois terminais distintos. O terminal 3’ que expõe um grupo OH livre, será utilizado como primer para o replissomo que se moverá desenlaçando as duas fitas originais enquanto sintetiza uma fita nova, contínua, no sentido 5’ 3’. O terminal livre 5’, que vai sendo deslocado com o avanço do replissomo, será utilizado como molde para a síntese descontínua da fita complementar. Ao final do processo uma endonuclease separa as dúplex.

Figura 5. 9. Círculo rolante. As letras representam marcas genéticas no cromosssomo.

O DNA presente em cloroplastos e mitocôndrias, apresenta duas origens de replicação, uma para cada fita, em posições diferentes do círculo. Isto cria um modo de replicação diferente, com a formação de uma alça (D loop) como esquematizado na Figura 5.10. A replicação se inicia em um ponto de origem, sintetizando apenas uma fita. O deslocamento da outra fita da dúplex cria a alça D. Quando a fita recém sintetizada passa pelo ponto de origem da outra fita, inicia-se a replicação da fita complementar em sentido oposto. O resultado são dois círculos duplicados.

Cristina M. Bonato 47

Page 48: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 5. 10. Replicação de DNA mitocondrial no modelo de alça D.

Replicação dos Telômeros

Uma diferença marcante na replicação de um cromossomo circular como o de E. coli e de cromossomos lineares como os de eucariotos e de algumas bactérias, é a necessidade de um mecanismo especial para replicar os terminais do cromossomo. Replicar o terminal é complicado uma vez que a DNA polimerase requer um primer e somente pode alongar a fita a partir do terminal 3'. A degradação do RNA primer no terminal, gera uma lacuna não preenchida. Isto poderia resultar em cromátides filhas progressivamente menores a cada ciclo de replicação pelo modo convencional. Como superar este problema?

Em 1978 Elizabeth Blackburn & J. Gall (veja Blackburn, 1990) descreveram a estrutura dos terminais cromossômicos do protozoário ciliado Tetrahymena, que possui centenas de pequenos cromossomos lineares. Tal estrutura, denominada telômero, é essencial para a estabilidade dos cromossomos e também importante na segregação dos mesmos durante a meiose (veja Price, 1999). As seqüências teloméricas encontradas em vários organismos (Tabela 5.1) consistem de repetições em série de seqüências simples tais como 5'-TTAGGG-3', típica de vertebrados.

Tabela 5. 1. Seqüências teloméricas repetidas em série

Tetrahymena 5' T2G4 3' Caenoharbditis 5' T2AG2C 3'

Trypanosoma 5' T2AG3 3' Bombyx 5' T2AG2 3'

Dictyostelium 5' AG1-8 3' Vertebrados 5' T2AG3 3'

Saccharomyces 5' T1-6GTG2-3 3' Arabidopsis 5' T3AG3 3'

Neurospora 5' T2AG3 3' Fonte: Hartl & Jones, 1998

A fita rica em nucleotídios G (fita G) estende-se em direção ao terminal 3', projetando-se na forma de fita simples e, portanto, não possui, o molde correspondente. Logo, durante a replicação pela DNA polimerase III as moléculas filhas perderiam esta projeção (Figura 5.11).

Figura 5. 11. Perda de nucleotídios nos terminais teloméricos no modo com-vencional de replica-ção, por ação da DNA polime-rase III (Adaptado de

Cristina M. Bonato48

Page 49: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Lingner & Cech, 1998).

No final dos anos 80, Blakburn e colaboradores isolaram, de Tetrahymena, uma enzima capaz de resolver este problema, a qual passou a ser denominada telomerase. A telomerase é uma enzima ribonucleoprotéica e age como uma transcriptase reversa para alongar o terminal 3' telomérico, adicionando mais desoxirribonucleotídios na projeção da fita G. Uma molécula de RNA com ~160pb é parte integrante desta enzima e funciona como molde para a síntese das repetições teloméricas, uma vez que apresenta uma região complementar à projeção (RNA guia). Após adicionar novas repetições a telomerase desliza sobre a dupla para adicionar mais desoxirribonucleotídios complementares ao segmento de RNA. Provavelmente, a fita complementar é sintetizada via mecanismos usuais à síntese da fita lagging. Com esta tática o cromossomo pode ser estendido até 10 kb (Figura 5.12).

Figura 5. 12. O RNA guia pareia com a seqüência complementar das repetições teloméricas e é utilizado como molde para o alongamento do telômero conforme a telomerase deslisa sobre o DNA.

Múltiplas proteínas ligam-se à região telomérica do DNA compactando o terminal telomérico num complexo DNA/proteína onde não se encontram nucleossomos. As proteínas associadas ao terminal protegem a projeção de degradação e recrutam a telomerase. Aparentemente, as proteínas teloméricas também participam do alinhamento de cromossomos homólogos durante a meiose, agindo como uma cola entre eles e permitindo recombinação e segregação adequadas.

A utilização de telomerases e repetições em série nos terminais teloméricos, apesar de amplamente utilizada não é universal. Em Drosófila, por exemplo, o telômero é composto de elementos transponíveis especializados, retroposons, cuja transposição mantem os terminais cromossômicos. Bactérias com cormossomos lineares também não utilizariam telomerases para a manutanção dos terminais cromossômicos.

Em eucariotos, as polimerases envolvidas na síntese do DNA são as DNA polimerases a, b e d, correspondentes às DNA polimerases I, II e III de bactérias. Ainda são encontradas as DNA polimerases g (mitocôndrias) e e. Estudos mais detalhados da replicação em eucariotos foram feitos com o vírus SV40, específicos de células de mamíferos. Os mecanismos são basicamente os

Cristina M. Bonato 49

Page 50: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

mesmos dos encontrados em bactéria. Deve-se salientar a diferença entre as polimerases que atuam nas fitas leading e lagging. Aparentemente, tanto a pol a como a pol d atuam conforme o garfo se move sobre o cromossomo. Mas, a pol d é preponderante na síntese da fita leading e a pol a, fortemente associada à primase, é preponderante na síntese da fita lagging.

Guia de Estudos

 Progeria é uma desordem humana na qual os indivíduos afetados envelhecem prematuramente. Uma criança de 9 anos é semelhante, fisica e fisiologicamente, a um indivíduo de 60-70 anos. Você isolou o DNA de um paciente e, ao invés de encontrar longas moléculas de DNA como era esperado, encontrou grande quantidade de fragmentos pequenos de DNA. Que enzimas poderiam estar deficientes neste paciente?

 O que é uma nuclease? Qual a diferença entre exonucleases e endonucleases?

 Qual a função das helicases?

 Qual seria a conseqüência, para o organismo, de uma mutação com perda de função no gene que codifica a proteína DnaA? Explique.

 Qual a função das proteínas SSB?

 Dos dados constantes neste capítulo, quanto tempo leva para replicar o cromossomo de E. coli, a 37oC se dois garfos de replicação partem, bidirecionalmente, da origem? Em boas condições, as células de E. coli dividem-se a cada 20 minutos. Como isto é possível?

 Durante a replicação do cromossomo de E. coli, quantos fragmentos de Okasaki, aproximadamente, são formados?

 Qual poderia ser a conseqüência de uma mutação que diminuisse a atividade da enzima telomerase?

Capítulo 6 – TRANSCRIÇÃO EM BACTÉRIAS

Antecedentes Históricos

Ao se desvendar a estrutura da molécula de DNA o princípio da replicação pôde ser visualizado sem dificuldades. Todavia, a forma com que as proteínas eram geradas a partir desta molécula informacional ainda constituía um mistério.

Em 1954, o astrofísico George Gamow, tomando conhecimento dos trabalhos de Watson & Crick, sobre estrutura e replicação do DNA, propôs que os quatro tipos de bases dos desoxirribonucleotídios seqüencialmente dispostos na molécula de DNA constituiriam as letras de um código e que este código comandaria a seqüência dos aminoácidos nas proteínas. A questão

Cristina M. Bonato50

Page 51: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

inicial era descobrir como o sistema de 4 bases estava organizado para sinalizar aos 20 tipos de aminoácidos que participam das proteínas.

De 1954 a 1966, intensas discussões e experimentações foram realizadas por todos aqueles que se interessavam pelo assunto, particularmente Crick, que já postulava a existência de uma molécula intermediária para estabelecer a complementaridade necessária entre as bases dos ácidos nucléicos e os aminoácidos das proteínas.

Finalmente, os trabalhos realizados por Nirenberg & Leder (1964) e por Khorana e colaboradores (1966), desvendaram por completo o código genético, estabelecendo que aminoácido correspondia a cada códon (cada uma das possíveis combinações das quatro bases, três a três). Este assunto é discutido em "Desvendando o Código da Vida".

A Síntese de Proteínas Ocorre no Citoplasma

Em 1954 Zamecnik & Keller mostraram que para haver síntese protéica in vitro, ou seja, num sistema livre de células, era necessária a presença dos seguintes componentes num tubo de ensaio:

aminoácidos, os quais eram marcados radioativamente (14C) para serem detectados nas proteínas, após precipitação das mesmas ao término do processo de síntese;

ATP, como gerador de energia; retículo endoplasmático rugoso (RER), ou seja, retículo endoplasmático acoplado a

ribossomos, local de síntese protéica. O RER é sedimenta no fundo do tubo após centrifugação do extrato bruto celular a 100.000xg;

sobrenadante de 100.000 x g, onde fora detectada atividade enzimática capaz de produzir aminoácidos ativados (aminoacil-AMP).

Com isto ficava claro que a síntese protéica ocorria no citoplasma, na presença de ribossomos, estabelecendo-se uma relação entre rRNA e síntese protéica.

Apesar de, neste momento, já estar claramente demonstrado que o material genético era o DNA, cuja estrutura também já era conhecida, os autores não fizeram qualquer conexão entre o processo de síntese protéica que ocorre no citoplasma e a molécula de DNA presente no núcleo.

Em 1958 Hoagland e colaboradores detectaram um outro tipo de RNA no sobrenadante de 100.000 x g. Este RNA passou a ser denominado RNA solúvel, em contraposição ao rRNA que sedimentava com os ribossomos. O RNA solúvel era uma molécula pequena que se ligava covalentemente aos aminoácidos ativados. Atualmente o RNA solúvel é denominado RNA transportador (tRNA).

Paulatinamente sedimentava-se a idéia de que o molde para a síntese de proteínas era RNA e não DNA, baseado em evidências tais como:

Existência de um tipo de RNA que transportava aminoácidos (tRNA); Ocorrência de síntese protéica nos ribossomos localizados no citoplasma da célula

eucariótica, portanto, separado do DNA, que se encontra no núcleo.

De início imaginou-se que a informação contida no DNA era trazida do núcleo para o citoplasma via rRNA. Mas Davern & Meselson (1960), trabalhando com E. coli, demonstraram

Cristina M. Bonato 51

Page 52: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

que as moléculas de rRNA eram muito estáveis mantendo-se íntegras após várias divisões celulares. Moléculas tão estáveis e pouco variáveis, não poderiam ser responsáveis pela rápida mudança nos níveis de síntese enzimática observada nas bactérias em resposta a diferentes estímulos.

Particularmente importantes, para o compreensão do que estava acontecendo, foram os experimentos realizados no Instituto Pasteur por François Jacob, Jacques Monod e diversos colaboradores.

Caracterização de um RNA Instável

Jacob & Monod estudavam a atividade de b-galactosidase em E. coli, cultivada em presença ou ausência de lactose. A b-galactosidase degrada lactose em glicose + galactose. Células de E. coli produzem cerca de 0,5 a 5 moléculas ativas da enzima, quando cultivadas na ausência de lactose. Ao adicionarem lactose ao meio observaram que:

A atividade de b-galactosidade, nas células, aumentava paulatina e drasticamente; O aumento de atividade dependia de síntese protéica; A síntese da enzima b-galactosidade era induzida ~1.000 vezes A transferência das células para um meio sem lactose, mas com glicose como fonte de

carbono, implicava em parada imediata da síntese de b-galactosidase (Figura 6.1).

Dedução: uma variação tão grande e tão rápida não poderia depender de moléculas tão estáveis como os rRNAs, constituintes dos ribossomos.

Num conjunto paralelo de experimentos o análogo 5-fluor-uracila foi adicionado à culturas de E. coli, que estavam produzindo b-galactosidase. Quando presente no meio este análogo é incorporado em lugar de uracil durante a síntese de RNA. Observou-se, então, que a atividade de b-galactosidase produzida a partir da incorporação do análogo, caía abruptamente. Quando as células retornavam a um meio sem 5-fluor-uracila, a atividade era recuperada (Bussard et al., 1960). Isto sugeria fortemente a existência de RNA não estável, que podia ser sintetizado e degradado rapidamente, o qual serviria de molde para a síntese da proteína. A dificuldade em se detectar tal RNA devia-se a sua alta labilidade.

Cristina M. Bonato52

Page 53: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 6. 1. Indução da síntese de β-galactosidase na presença de lactose.

Já existiam, então, algumas evidências da existência de um RNA instável associado aos ribossomos.

Hibridização

Quando um DNA dupla fita é desnaturado pelo calor (90oC), suas hélices se separam devido ao rompimento das pontes de hidrogênio entre as bases. Se a solução contendo DNA desnaturado for resfriada lentamente, as duas hélices, complementares entre si, voltam a se anelar (hibridizar). Ou seja, os segmentos complementares conseguem "se encontrar", refazendo a dupla hélice.

Utilizando esta técnica Hall & Spiegelman (1961) demonstraram que o DNA agia como molde para a síntese de moléculas instáveis de RNA e que havia uma correlação entre o aumento de RNA instável e síntese protéica.

Hall e Spiegelman estudavam os tipos de RNAs produzidos em E. coli após infecção com o fago T2. Quando o fago T2 infecta a bactéria, esta passa a sintetizar uma série de proteínas típicas do fago, parando a síntese de suas próprias proteínas. Após algum tempo uma grande quantidade de partículas fágicas é produzida e liberada com a lise da célula bacteriana.

Ao isolarem o RNA instável, recém sintetizado, observaram que formava híbridos apenas com o DNA desnaturado de T2 mas não com o DNA desnaturado de E. coli. Antes da infecção, o RNA extraído da célula bacteriana hibridizava com o DNA bacteriano.

Os trabalhos acima e outros publicados entre 1957-1961, com bactérias e seus bacteriófagos, mostravam que um intermediário instável e heterogêneo em relação ao peso molecular, o qual associava-se fracamente aos ribossomos, apresentava as características desejáveis a uma molécula capaz de transferir a informação genética do DNA, seja de bactéria ou fago, até os ribossomos. Isto implicava que as mesmas máquinas produtoras de proteína serviriam tanto para sintetizar proteína bacteriana como proteína fágica.

Cristina M. Bonato 53

Page 54: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 6. 2. Hibridização DNA/RNA-Após desnaturação da molécula de DNA uma das fitas pode hibridizar com a molécula complementar de RNA. A existência de complemetaridade RNA/DNA é uma forte indicação de que o DNA é molde para a síntese de moléculas de RNA.

O mRNA é o Intermediário Entre Genes e Ribossomos

Em trabalho publicado em 1961 (Brenner et al) assumiu-se, definitivamente, que a espécie instável de RNA, agora denominada RNA mensageiro (mRNA), era responsável por carregar a mensagem contida na molécula de DNA até os ribossomos. Finalmente estabelecia-se uma conexão entre genes e proteínas via uma molécula instável de RNA, cuja síntese e degradação podia ser perfeitamente regulada pela célula em resposta a suas necessidades (Leia Jacob & Monod, 1961).

Como foram feitos estes experimentos?

Células de E. coli foram cultivadas em presença de 15N. Portanto, os ribossomos produzidos continham 15N incorporado em suas moléculas (ribossomos pesados).

A seguir, as células foram infectadas com bacteriófago T4 e, ao mesmo tempo, transferidas para um meio contendo 14N.

No momento da infecção as células bacterianas foram expostas a curtos pulsos radioativos de 32P ou 35S que marcam, respectivamente, ácidos nucléicos e proteínas.

Logo: a partir da infecção fágica, todas as moléculas produzidas incorporariam nitrogênio leve (14N); as proteínas recém-sintetizadas estariam marcadas radioativamente com 35S e os RNAs recém-sintetizados estariam marcados radioativamente com 32P.

Resultados obtidos após isolamento dos ribossomos e ultracentrifugação em gradiente de densidade (Figura 6.3):

Não se detectou partícula ribossômica leve radioativa, após a infecção. Portanto, não houve síntese nova de rRNA.

Foi detectado, após infecção fágica, um RNA instável (mRNA), marcado radioativamente com 32P, associado às partículas ribossômicas "pesadas", produzidas antes da infecção.

As proteínas sintetizadas após a infecção, ou seja, as proteínas do fago, identificadas pelo 35S, estavam associadas à partícula ribossômica "pesadas", antes de serem liberadas na solução citoplasmática.

Cristina M. Bonato54

Page 55: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 6. 3. Após infecção fágica, os ri-bossomos "pesados" de E. coli associam-se, transitoriamente, à um tipo instável de RNA (32P) e à moléculas de peptídios (35S)

Estas observações sugeriam fortemente que a proteína do fago era sintetizada a partir de mRNAs do fago, nos ribossomos bacterianos, que haviam sido produzidos antes da infecção. Uma vez que as informações para proteínas fágicas não poderiam residir em ribossomos bacterianos, esta informação deve ter sido provida pela fração de mRNA, sintetizada a partir do DNA do fago, a qual se associava transitoriamente aos ribossomos

A presença de um intermediário instável que utilizava o DNA como molde, poderia explicar as observações feitas com a síntese de b-galactosidase em E.coli:

A partir de uma seqüência do DNA seria produzida uma fita complementar de RNA do tipo instável, contendo a mensagem.

Esta molécula se dirigiria aos ribossomos, complexos macromoleculares estáveis, onde ocorreria a síntese protéica. Tais máquinas de tradução, constituídas de rRNA e proteínas, seriam capazes de traduzir qualquer texto que lhes fosse apresentado pelos RNAs instáveis.

Do processo participariam, necessariamente, as moléculas de tRNA, carregando seus respectivos aminoácidos.

Em revisão publicada em 1961, Jacob & Monod analisam todos os resultados que, até então, haviam obtido sobre a ação dos genes e explicitam claramente o conceito de RNA mensageiro (mRNA). A seguir, um extrato da introdução do artigo, onde a molécula intermediária é nomeada mRNA:

"Since it seems to be established that proteins are synthesized in the cytoplasm, rather than directly at the genetic level, this transfer of structural information must involve a chemical intermediate synthesized by the genes. This hypothetical intermediate we shall call the structural messenger. The rate of information transfer, i.e. of protein synthesis, may than depend either upon the activity of the gene in synthesizing the messenger, or upon the activity of the messenger in sinthesizing the protein."

O trabalho realizado pelos pesquisadores do Instituto Pasteur teve uma amplitude maior do que a colocada no contexto deste capítulo, uma vez que foram eles que estabeleceram os conceitos básicos de regulação coordenada de expressão gênica em E. coli. Este assunto será discutido no capítulo referente à regulação da expressão gênica em bactérias.

Tipos de RNA

Cristina M. Bonato 55

Page 56: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

As células possuem muitos tipos diferentes de moléculas de RNA que executam trabalhos diversos. Os tipos de RNA que participam do processo de síntese protéica são: RNA mensageiro (mRNA), RNA transportador (tRNA) e RNA ribossômico (rRNA)(Figura 6.4).

Figura 6. 4. Os três tipos de RNA, rRNA, tRNA e mRNA participam do processo de síntese protéica. Os mRNA contem a mensagem que será traduzida em proteína, de sorte que a seqüência de bases no mRNA determina a seqüência dos aminoácidos no polipeptídio. Os tRNA carregam os aminoácidos específicos para cada códon. O local de síntese protéica é o ribossomo, um complexo ribonucleoprotéico onde rRNAs associam-se à proteínas específicas. O valor S indica a velocidade de sedimentação de uma molécula numa ultracentrífuga.

A síntese dos diferentes tipos de RNA, a partir de um molde de DNA, usando as regras da complementaridade, é um processo enzimático denominado Transcrição do DNA.

No processo de transcrição, a informação genética contida num segmento do DNA, é reescrita em uma fita simples de RNA que apresenta uma seqüência de ribonucleotídios complementar a uma das fitas da dupla hélice de DNA (fita molde) e idêntica à seqüência da outra fita (fita codificadora), com substituição de T por U (Figura 6.5).

Figura 6. 5. Fita codificadora, fita molde e RNA. O sentido da transcrição está indicado pela flecha.

Por convenção, quando se escreve um seqüência de nucleotídios correspondente a um gene, sempre é representada a fita codificadora. Também, por convenção, a seqüência é sempre escrita

Cristina M. Bonato56

Page 57: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

no sentido 5' 3'. Em alguns sistemas a fita molde é também identificada como fita menos (-) e a fita codificadora como fita mais (+).

As moléculas de mRNA, transcritas a partir de diferentes regiões do DNA, carregam a mensagem que será descodificada em polipeptídios, nos ribossomos, com a ajuda dos tRNAs. Isto implica que as moléculas de mRNA apresentam tamanhos bastante variáveis.

Os tRNAs "leem" a mensagem contida nos mRNA, via pareamento de bases complementares (códon/anti-códon), ao mesmo tempo que carregam o aminoácido correspondente aquele códon. Assim, a cada códon, corresponde um único amino ácido carregado por um tRNA particular. Diferentes genes codificam os tRNAs específicos para cada aminoácido.

Os diferentes tipos de rRNAs, juntamente com os diferentes tipos de proteínas ribossômicas, constituem o complexo macromolecular ribonucleoprotéico (máquina de tradução) denominado ribossomo, onde ocorre a síntese protéica. As moléculas de rRNA estão envolvidas nos processos de atração de moléculas de mRNA para o ribossomo e de catálise na formação das ligações peptídicas. Os genes que codificam rRNAs são encontrados em múltiplas cópias no cromossomo.

Estruturas do RNA

A molécula de RNA é fita simples, arranjada em estruturas secundárias e terceárias. A evidência de que as moléculas de RNA, em geral, estão na forma de fita simples é dada pelo fato de não apresentarem as razões de Chargaff entre purinas e pirimidinas. P. ex., em RNA isolado de E. coli, as percentagens das bases são: A=24; U=22; G=32; C=22. As características de cada um dos tipos predominantes de RNA, em E. coli, estão apresentadas no Quadro 6.1.

Quadro 6. 1. Moléculas de RNA em E. coli

Tipo % RNA Total Coefic. Sedim. S PM no nucleotídios

rRNA 80 23 1,2.106 3700

- - 16 0,55.106 1700

- - 5 3,6.104 110

tRNA 15 4 2,4.104 75

mRNA 5 - heterogêneo variável

O pareamento de bases entre segmentos complementares distantes da molécula de RNA permite contatos intramoleculares substanciais, gerando domínios estruturais tipo haste/alça, grampos e outras estruturas secundárias. As interações entre tais estruturas resulta num dobramento tridimensional, criando estruturas terceárias como o pseudo-nó (Figura 6.6).

Figura 6. 6. Estruturas secundárias e terceárias: alças, grampos e pseudo-nó

Cristina M. Bonato 57

Page 58: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Neste sentido, as moléculas de RNA assemelham-se à proteínas, com diferentes domínios estruturados que se conectam por regiões mais flexíveis. Tais conformações sofisticadas conferem à molécula de RNA a possibilidade de interagir especificamente com proteínas e outras moléculas e de apresentar, eventualmente, atividade catalítica agindo, portanto, como uma enzima ou Ribozima.

A Unidade de Transcrição

A síntese de qualquer dos tipos de molécula de RNA é catalisada pela enzima RNA polimerase. Apesar dos processos de transcrição e replicação do DNA apresentarem várias características em comum, são fundamentalmente diferentes em um aspecto: durante a replicação, o cromossomo inteiro é copiado, produzindo-se fitas filhas idênticas às originais enquanto, durante a transcrição, apenas segmentos selecionados de uma das fitas do DNA são utilizados como molde resultando na transcrição apenas dos genes necessários em um determinado momento da vida do organismo.

Transcrever regiões não-gênicas ou genes cujos produtos não são necessários num determinado momento, seria uma perda de tempo e de energia. Portanto, o processo de transcrição deve ser bastante seletivo e as enzimas e proteínas reguladoras que dele participam devem ser capazes de distinguir sinais que demarquem as seqüências de interesse, ou seja, onde começar e onde terminar a transcrição de um segmento.

A transcrição de um segmento se inicia quando a RNA polimerase reconhece e liga-se a seqüências específicas de nucleotídios em uma região especial, no início do gene, denominada promotor. Além destas seqüências, o promotor engloba o ponto de início, que é o primeiro par de bases a ser transcrito em RNA. A partir daí a RNA polimerase move-se ao longo do molde, sintetizando RNA, até alcançar uma outra seqüência específica que sinaliza o término da transcrição. Assim, a unidade de transcrição estende-se do ponto de início (+ 1) no promotor, até o terminador (Figura 6.7).

Figura 6. 7. A unidade de transcrição é uma seqüência de DNA transcrita pela RNA polimerase, com início no ponto +1 e término no sinal de terminação à jusante.

Diz-se que as seqüências que antecedem o ponto de início localizam-se à montante (upstream) e as que o sucedem localizam-se à jusante (downstream). A posição das bases é numerada nos dois sentidos, a partir do ponto de início, ao qual se atribui o valor +1. Os valores aumentam (valor positivo) à jusante e diminuem (valor negativo) à montante.

Fita Molde

Cristina M. Bonato58

Page 59: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Numa unidade de transcrição, apenas uma das fitas do DNA é utilizada como molde para síntese de RNA.

Em princípio, qualquer uma das fitas da dupla hélice de DNA poderia ser utilizada como molde para sintetizar uma molécula de RNA. Se, dentro de uma mesma unidade, as duas fitas fossem transcritas, dois tipos diferentes de RNA seriam gerados. Evidências genéticas e bioquímicas indicam, todavia, que para um dado segmento informacional do DNA (gene) só um dos dois tipos possíveis de moléculas de RNA é produzido.

Uma das evidências mais convincentes de que apenas uma das fitas do DNA é transcrita num determinado segmento, é dada pelo bacteriófago SP8 ao infectar a bactéria Bacillus subtilis (Figura 6.8).

Figura 6. 8. A) No bacteriófago SP8, apenas uma das fitas do genoma é utilizada como molde. B) No fago T4, que infecta E. coli, qualquer das duas fitas pode ser utilizado como molde, mas para um dado segmento apenas uma delas funciona como molde.

No bacteriófago SP8, uma das fitas do DNA tem um percentual de purinas superior ao da outra, o que a torna mais densa, sendo possível separar as duas fitas em gradiente de CsCl. Após infecção da bactéria pelo fago, só será sintetizado RNA viral. Ao se hibridizar o RNA viral coletado da bactéria, com cada uma das duas fitas de DNA do fago, previamente separadas pela densidade, observou-se que o RNA só hibridizava com a fita mais pesada, demonstrando que, neste caso, somente uma das fitas do DNA era utilizada como molde para transcrição dos genes do fago SP8. Outros fagos pequenos apresentavam o mesmo comportamento. Em vírus maiores como o T4, qualquer uma das duas fitas pode ser transcrita, mas, num dado segmento de DNA, apenas uma das fitas é utilizada como molde.

Como é determinado qual das duas fitas será utilizada como molde?

É o posicionamento da RNA polimerase holoenzima, no segmento de DNA a ser transcrito, que define qual das fitas será utilizada como molde, determinando o sentido da transcrição. Na Figura 6.9, a RNA polimerase caminha em sentidos opostos sobre os genes adjacentes A e B, implicando que fitas complementares estão sendo utilizadas como molde. O posicionamento da RNA polimerase, por sua vez, depende da configuração da região promotora. As seqüências de nucleotídios aí presentes, determinam o acoplamento e posicionamento da holoenzima (veja Reconhecimento do promotor).

Cristina M. Bonato 59

Page 60: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 6. 9. Transcrição utilizando fitas diferentes como molde. No segmento A, a fita "superior" será utilizada como molde e a molécula de RNA produzida terá a mesma seqüência do segmento correspondente da fita "inferior". No segmento B, a fita "inferior" será utilizada como molde e a molécula de RNA produzida terá a mesma seqüência do segmento correspondente da "superior".

Híbridos DNA/RNA na Transcrição

O início da transcrição exige o rompimento localizado de algumas pontes de hidrogênio entre as duas cadeias de DNA formando-se a bolha de transcrição, com cerca de 17 pares de bases, envolvida pela RNA polimerase. Conforme a RNA polimerase avança ao longo da fita molde, a dupla fita de DNA à frente da bolha vai se abrindo enquanto, atrás da bolha, a fita enrola-se novamente.

Na região da bolha ocorre a formação de híbridos DNA/RNA,em função do emparelhamento transitório entre o segmento de RNA nascente e a fita de DNA que serve como molde. Geralmente, este híbrido abarca 2 a 10 pares de bases, o suficiente para dar estabilidade à reação de pareamento do nucleotídio específico. O emparelhamento DNA/RNA desfaz-se rapidamente com o avanço da bolha de transcrição.

A RNA polimerase, enquanto máquina protéica de transcrição, executa diferentes funções: desenrola e enrola as fitas de DNA; mantém as fitas molde e codificadoras separadas no local de síntese; sintetiza o RNA. Não está ainda claramente definida qual a contribuição de cada uma das subunidades da RNA polimerase neste processo inicial (Figura 6.10).

Figura 6. 10. O DNA se desenrole localmente. A fita não-codificadora é utilizada como molde no processo de transcrição. O transcrito produzido tem uma seqüência idêntica à da fita codificadora do

Cristina M. Bonato60

Page 61: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

DNA, apenas com substituição de T por U. Uma curta molécula híbrida DNA/RNA é formada no local da bolha de transcrição.

RNA Polimerases

No processo de transcrição as RNA polimerases catalisam a formação de ligações fosfodiéster entre ribonucleotídios, os quais são complementares aos desoxirribonucleotídios do molde (DNA). Isto implica que:

A atividade desta enzima é dependente da presença de DNA; O molde determina a ordem em que os ribonucleotídios serão adicionados via

emparelhamento de bases onde uma purina forma pontes de hidrogênio com uma pirimidina na seguinte combinação: A=U e G=C.

Os precursores imediatos na síntese de RNA são os ribonucleosídeos trifosfatados (ATP, GTP, CTP, UTP) que utilizam a energia armazenada na ligação pirofosfato de cada nucleotídio ingressante para estabelecer a ligação fosfodiéster entre os monômeros do RNA nascente. Esta reação necessita da presença dos ions Mg2+ e Zn2+.

As RNA polimerases sempre adicionam ribonucleotídios ao polímero, via ligação fosfodiéster entre o terminal 3'-OH do polímero pré-existente e o fosfato do ribonucleosídio 5'-trifosfato ingressante, utilizando a energia armazenada no nucleosídio trifosfatado. O molde está orientado no sentido 3' 5' e a molécula de RNA nascente, no sentido 5'-->3', similar ao que ocorre no alongamento de uma cadeia de DNA. O sentido 5'-->3' da síntese de RNA pode ser comprovado experimentalmente.

Se utilizarmos o inibidor 3' desoxiadenosina (cordicepina), um análogo de adenosina que perdeu o oxigênio no C3, haverá uma parada na síntese de RNA assim que o análogo for incorporado. Isto ocorre porque, no análogo, o grupo 3’OH está ausente, impedindo que se estabeleça uma ligação fosfodiéster com potenciais ribonucleosídios trifosfatados ingressantes. Se o crescimento fosse pelo terminal 5'-trifosfato, o análogo nem sequer seria incorporado já que, nele, não existe um oxigênio reativo no C3. Neste caso, a síntese de RNA não seria inibida. Isto demonstra que a cadeia cresce do terminal 5' para o terminal 3' (Figura 6.11).

Figura 6. 11. O ribonucleotídio, selecionado pela sua capacidade de parear com o desoxirribonu-cleotídio comple-mentar na fita molde de DNA, é adicionado ao terminal 3'OH da cadeia nascente com liberação de pirofosfato. A adição do análogo 3'desoxiadeno-sina bloqueia o alongamento da cadeia, uma vez que não possui grupo 3'OH.

Cristina M. Bonato 61

Page 62: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Uma das características das RNA polimerases que as distinguem das DNA polimerases é a capacidade de iniciarem a síntese de uma molécula de ácido nucléico na ausência de um iniciador ou primer. Para iniciar a cadeia, a RNA polimerase liga os dois primeiros ribonucleotídios entre si, de acordo com sua complementaridade às bases da molécula de DNA, na fita molde. A DNA polimerase é incapaz de realizar tal façanha, uma vez que ela só consegue adicionar novos nucleotídios a um polímero preexistente. Uma das conseqüências disto é que a síntese de DNA requer primers de RNA (veja "Primers e primases").

Por outro lado, as RNA polimerases não fazem revisão do processo de transcrição, como fazem as DNA polimerases, durante o processo de replicação, corrigindo erros eventuais. Estima-se que uma base errada é incorporada a cada 104 bases transcritas. Esta taxa de erro, todavia, pode ser tolerada porque uma grande quantidade de moléculas de RNA é sintetizada a partir de um gene; as moléculas de RNA tem vida curta; muitas das substituições de aminoácidos nas proteínas são funcionalmente inócuas. Assim, um erro ocasional não teria conseqüências graves, nem seria permanente. Se uma cópia foi sintetizada com erro, utiliza-se outra cópia. Do ponto de vista evolutivo, parece que sintetizar muitas moléculas de RNA rapidamente é mais interessante do que revisar cada uma das moléculas que está sendo sintetizada.

RNA Polimerase de E.coli

Em E. coli a RNA polimerase é uma proteína multimérica constituída de cadeias polipeptídicas diferentes: b (beta), b' (beta linha), 2a (alfa) e s (sigma). A união entre estas moléculas é assegurada por ligações fracas. Quando todas estas moléculas estão associadas, o complexo bb'a 2 s é denominado RNA polimerase holoenzima (Figura 6.12, Quadro 6.2).

Figua 6. 12. Subunidades da RNA polimerase de E. coli: duas a (40.000 kDa), uma b (150.000 kDa), uma b' (160.000 kDa) e uma s (70.000 kDa). A subunidade s de 70.000 daltons é a forma predominante na célula e também é conhecida como s70. Todavia, outras formas de subunidades sigma são sintetizadas na célula e substituem a s70 em condições particulares. A determinação do sítio correto de iniciação da transcrição depende das subunidades sigma. O processo de alongamento da cadeia de ribonucleotídios depende do sítio catalítico existente na subunidade b.

Cristina M. Bonato

Quadro 6. 2. Subunidades da RNA polimerase de E. coli

Subunidade Gene Massa (d) Quantidade Funções possíveis

rpoA ~40.000 2 montagem

rpoB ~150.000 1ligação dos nucleotídios

' rpoC ~160.000 1 ligação ao molde

rpoD 32-92.000 1 ligação ao promotor

62

Page 63: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

A holoenzima tem um peso molecular aproximado de 450 kDa e apresenta uma forma alongada recobrindo cerca de 40 a 70 pares de nucleotídios no DNA. A associação da subunidade s ao complexo constituindo a holoenzima é transitória, dissociando-se do agregado bb'a2 logo após o início da transcrição. O agregado bb'a2, denominado central enzimática (core enzyme, em inglês), é responsável por catalisar as ligações fosfodiéster para formação do polímero, independente da subunidade sigma, mas é incapaz de iniciar a transcrição a partir do local correto. Para isto, depende da subunidade sigma.

A função da subunidade s é reconhecer o sítio correto para o início da transcrição. O processo de alongamento do polímero é realizado pela central enzimática e não pode ocorrer enquanto a subunidade s estiver presente.

Qual a extensão do DNA ocupada pela RNA polimerase holoenzima? Isto pode ser determinado por digestão do DNA com nucleases como esquematizado na Figura 6.13.

Figura 6. 13. A RNA pó-limerase protege o segmento do DNA ao qual está ligada, contra a digestão pela DNAse I. Isolamento do DNA protegido e seu se-qüenciamento determinam o número de nucleotídios a-brangidos pela RNA poli-merase e identificam as se-quencias de reconhecimento na região promotora.

As nucleases são enzimas que digerem ácidos nucleicos. Alguns tipos de nucleases são específicas para DNA (DNAses), outras para RNA (RNAses). Todavia, quando um segmento de ácido nucleico está associado à proteínas, ele fica protegido da ação das nucleases. Baseado nisto pôde-se estimar a extensão do DNA ocupada pela RNA polimerase.

Reconhecimento do Promotor

O processo de transcrição pode ser subdividido em quatro momentos fundamentais: reconhecimento do promotor, iniciação, alongamento e terminação. Cada uma destas fases está sujeita à modulação via diversos mecanismos reguladores. Para que este processo ocorra é necessário, antes de mais nada, que a RNA polimerase identifique sinais específicos no DNA, os quais direcionarão a transcrição de genes específicos no momento adequado.

Cristina M. Bonato 63

Page 64: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

A região do gene que contem estas seqüências de reconhecimento é o promotor. Uma enorme variedade de sinais pode ser encontrada nas regiões promotoras de diferentes genes. É por este motivo que os promotores são locais extremamente importantes no controle da expressão gênica.

Analisando-se as seqüências de nucleotídios, de mais de 100 promotores diferentes de bactérias, observou-se que dois tipos de seqüências estão sempre presentes, centradas nas regiões -10 e -35 do promotor. Apesar destas seqüências não serem perfeitamente idênticas entre os diferentes genes analisados, alguns nucleotídios são encontrados com maior freqüência do que outros, numa determinada posição, constituindo o que se denomina seqüência consenso. Dois consensos, com 6 nucleotídios cada, foram determinados a partir da análise referida acima.

A seqüência consenso -10, também conhecida como Pribnow box é T77 A76 T60 A61 A56 T82. A seqüência consenso -35 é T69 T79 G61 A56 C54 A54. Os índices representam o percentual com que cada base é encontrada entre os promotores analisados. Os consensos estão separados entre si por cerca de 16-18 nucleotídios em 90% dos casos analisados. A posição destas seqüências dá orientação ao promotor e esta orientação direcionará a RNA polimerase holoenzima.

Sem a subunidade s, a central enzimática não pode iniciar a transcrição de modo específico, mas pode alongar um transcrito pré-iniciado. Mutações nas regiões promotoras podem afetar o processo de transcrição. Regiões promotoras cujas seqüências divergem muito do consenso são promotores fracos, pois sua afinidade pela holoenzima é menor resultando num número menor de transcritos por unidade de tempo.

Nas células bacterianas existem diferentes fatores s os quais são codificados por diferentes genes. Cada tipo de fator s reconhece seqüências específicas nas regiões promotoras dos genes a serem transcritos. Dependendo da concentração celular de um determinado s, um conjunto específico de genes será expresso. Uma vez que os diferentes fatores s diferem entre si pelo peso molecular (PM), convencionou-se denominá-los de acordo com seu PM.

Quadro 6. 3. Seqüências -35 e -10 de alguns promotores de E. coli

gene seqüência -35 distância seqüência -10 distância +1

trp TTGACA N17 TATGTT N5 A

tRNAtyr TTTACA N16 TATGAT N7 G

lac TTTACA N18 TATGTT N6 A

recA TTGATA N16 TATAAT N8 A

araB, A, D CTGACG N18 TACTGT N6 A

bioB TTGTAA N17 TAGGTT N8 T

rrnA1 TTGACT N16 TATTAT N6 C

Consenso s70 TTGACA - TATAAT - -

Consenso s54 CTGGNA - TTGCA - -

Consenso s28 CTAAA - CCGATAT - -

Consenso s32 TxtCcCcTTGAA N13-15 CCCCATtTA - -

Em vermelho, as bases que diferem do consenso para s70, o qual está envolvido no metabolismo geral da célula.

Cristina M. Bonato64

Page 65: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Genes cuja transcrição é induzida por choque térmico são reconhecidos por s32. A expressão dos genes relacionados ao metabolismo de nitrogênio é controlada por s54. A expressão dos genes relacionados à motilidade e quimiotaxia é controlada po s28.

Iniciação da Transcrição

As taxas com que os genes são transcritos variam diretamente com a taxa com que seus promotores formam complexos de iniciação estáveis com a holoenzima RNA polimerase.

O fator s liga-se ao DNA somente enquanto subunidade da holoenzima. Sem ele, a central enzimática associa-se inespecificamente a qualquer segmento do DNA, promovendo uma varredura da molécula ao deslizar sobre a fita até que o fator s encontre o sítio promotor e ligue-se a ele fortemente, com uma constante de associação 1000 vezes superior à da central enzimática. Estabelece-se um complexo binário (RNA polimerase/DNA) estável ou complexo fechado.

O fator sigma interage, via terminal carboxila, com as seqüências -10 e -35 do promotor. A região central do fator sigma interage com a central enzimática da RNA polimerase. A região amino terminal do fator sigma tem função reguladora, impedindo que o C-terminal interaja com o promotor na ausência da central enzimática.

Após a formação do complexo fechado ocorre a abertura local da dupla hélice (bolha), promovida pela RNA polimerase holoenzima, com o rompimento das pontes de hidrogênio e a exposição de cerca de 17 bases em cada uma das fitas. Note que no consenso -10, reconhecido pelo s70, predominam nucleotídios de adenina e timina o que facilita a formação do complexo aberto, com a RNA polimerase articulada corretamente à fita que será utilizada como molde. Estabelece-se, então, a primeira ligação fosfodiéster entre dois ribonucleotídios trifosfatados complementares às bases expostas na fita molde. Está constituído o complexo ternário: DNA, RNA polimerase holoenzima e RNA nascente (Figura 6.14).

Figura 6. 14. Iniciação da transcrição: o fator s reconhece a seqüência do promotor e a subuni-dade β adiciona os pri-meiros ribonucleotí-dios sem ne-cessidade de um primer.

Em seguida, a enzima move-se, dissociando-se da região promotora, abrindo a dupla hélice mais à frente e expondo novos nucleotídios. Este movimento é acompanhado pela liberação do fator sigma provocando uma mudança conformacional na central enzimática a qual se tornará apta a promover o alongamento da cadeia. Só, então, o promotor ficará disponível para receber uma nova RNA polimerase holoenzima. Proteínas ativadoras ou repressoras podem alterar a eficiência

Cristina M. Bonato 65

Page 66: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

do processo de iniciação ao se ligarem à seqüências específicas à montante ou à jusante do início da transcrição (veja Regulação da Expressão Gênica).

Alongamento do Transcrito

A dissociação do fator s é fundamental para que o processo de alongamento da cadeia ocorra, caso contrário à enzima permaneceria fortemente ligada ao promotor e não poderia deslocar-se sobre o DNA. Assim que o s é liberado, a central enzimática interage com a proteína NusA que se mantém ligada à central enzimática até terminar a polimerização. NusA influencia tanto o alongamento da cadeia como o processo de terminação e, aparentemente, serve de "âncora" para outros fatores que podem exercer papéis específicos na transcrição (Figura 6.15).

O processo de alongamento só termina quando a RNA polimerase encontra um sinal de terminação, que é também, uma seqüência específica de nucleotídios, na molécula de DNA. Neste ponto NusA dissocia-se e a enzima desliga-se do molde de DNA e do RNA nascente ficando livre para reassociar-se ao fator s disponível e iniciar outro ciclo de transcrição.

Figura 6. 15. Alongamento do transcrito: liberação do fator sigma e interação com NusA, permite o deslizamento da central enzimática sobre a fita de DNA, até encontrar o sinal de terminação da transcrição

No processo de alongamento, a velocidade média de polimerização é de ~ 40 nucleotídeos/segundo/37oC. Consequentemente, uma cadeia de RNA com 6.000 nucleotídios é sintetizada em aproximadamente 3 min.

A hélice híbrida DNA/RNA formada durante o processo é de curta duração porque as duas fitas do DNA voltam a se enrolar deslocando o segmento de RNA recém sintetizado. A extremidade 5' do RNA liberado fica, portanto, disponível.

Uma vez que em bactérias o material genético não está compartimentalizado pela membrana nuclear os processos de transcrição e tradução podem estar acoplados e a extremidade 5' livre de

Cristina M. Bonato66

Page 67: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

uma molécula de mRNA poderá ser imediatamente engajada no processo de tradução, mesmo antes do término da transcrição.

Em eucariotos, as moléculas de mRNA recém-sintetizadas precisam atravessar a barreira imposta pela membrana nuclear antes de alcançarem os ribossomos que se localizam no citoplasma, sofrendo uma série de modificações antes de serem exportadas para o citoplasma (veja Processamento pós-transcricional).

Terminação da Transcrição

Sinais de terminação são variados e o processo de terminação depende da formação de estruturas secundárias, em forma de grampo, na molécula de RNA nascente e/ou da participação de proteínas auxiliares. Há dois tipos de terminadores em E. coli: Rho-dependente e Rho-independente.

Terminação Rho-independente: Neste caso, a terminação da cadeia cabe totalmente à RNA polimerase, não dependendo de proteínas auxiliares. As características de um terminador Rho-independente são:

Seqüências repetidas invertidas ricas em GC, na molécula de DNA, centradas entre 15 e 20 nucleotídeos do término.

Uma série de 6 ou mais As na fita molde que serão transcritas em Us no terminal 3' da fita de RNA.

A presença de seqüências repetidas invertidas (auto-complementares) permite a formação de estruturas em grampo ou haste-alça (hairpin, stem-loop, em inglês) via emparelhamento dos segmentos complementares (Figura 6.16).

Figura 6. 16. Sinal de parada. Na fita molde, uma seqüência auto-complementar de ribonucleotídios é seguida de uma série de As. Após a adição da série de Us, forma-se um grampo entre as seqüências auto-complementares e a síntese do RNA pára.

Como funcionaria o processo de terminação, neste caso? Provavelmente, a formação de um grampo na molécula de RNA provoca uma pausa no movimento da RNA polimerase logo após a

Cristina M. Bonato 67

Page 68: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

transcrição da seqüência de As. A região híbrida polidA/poliU, é relativamente mais instável, facilitando a expulsão da fita de RNA e terminando o processo.

Assim, a formação do grampo e a pausa da RNA polimerase são cruciais na terminação da transcrição. Se forem incorporadas bases alteradas nesta região, afetando a formação do grampo, a terminação não ocorre.

Terminação Rho-dependente: Em terminadores Rho-dependentes também é encontrada uma região de simetria dupla no terminal, porém ela apresenta baixa complementaridade entre as bases de sorte que um grampo "fraco" é formado, no RNA, após transcrição desta região. Além disto, não existe uma seqüência rica em As após a dupla simetria. Neste caso, a parada da transcrição lança mão de uma proteína auxiliar, Rho.

A proteína Rho é um hexâmero constituído de seis unidades idênticas (~46kDa), com atividade de ATPase. Na presença de RNA liga-se ao mesmo e usa a energia de hidrólise do ATP em ADP + Pi, para deslizar sobre a molécula de RNA recém-transcrita, numa velocidade comparável a do próprio processo de transcrição.

Assim que o grampo fraco se forma no transcrito, ocorre uma pausa no movimento da RNA polimerase o que é suficiente para permitir que a proteína Rho alcance a polimerase aprisionando-a e provocando o desenovelamento do híbrido DNA/RNA com liberação final da enzima RNA polimerase. A habilidade de desenovelar o híbrido seria dada pela atividade de helicase da proteína Rho . Os detalhes deste processo ainda não são conhecidos (Figura 6.17).

Figura 6. 17. Terminação Rho-dependente. A pausa da RNA polimerase após a formação do grampo fraco permite que a proteína Rho alcance a enzima aprisionando-a e desenovelando o híbrido DNA/RNA.

Guia de Estudos

 Qual a função da b-galactosidase?

Cristina M. Bonato68

Page 69: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

 Que evidências levaram os pesquisadores a identificação do mRNA como molécula intermediária entre a informação contida no DNA e as máquinas de síntese protéica?

 Quais os tipos de RNA? Quais suas funções principais?

 Quais as subunidades constituintes da RNA polimerase holoenzima de E. coli?

 Qual o tempo médio gasto por uma bactéria para sintetizar uma molécula de RNA de 2.000 nucleotídios?

 Qual o sentido de polimerização de uma cadeia de RNA?

 Como ficou demonstrado que a cadeia de RNA cresce do terminal 5' para o 3'?

 Qual é a funço da região promotora?

 Qual a função das subunidades sigma da RNA polimerase, em E. coli?

 Quais são as seqüências consenso reconhecidas pelo fator sigma?

 Quais as diferenças entre s70 e s32?

 Como é determinado qual das fitas será transcrita?

 Quais os sinais, na molécula de DNA, reconhecidos pela RNA polimerase, como pontos de início e pontos de término da transcrição? Explique.

 Uma unidade de transcrição pode conter mais do que uma unidade de tradução?

 O que são fatores de transcrição?

 Como se inicia a transcrição?

 Porque a dissociação do fator sigma é importante no alongamento da cadeia de RNA?

 Quais as diferenças entre terminação da transcrição dependente de Rho e terminação da transcrição independente de Rho?

Você isolou um mutante de bactéria que fabrica uma proteína Rho termo sensível: a proteína funciona normalmente a 30oC mas não funciona a 40oC. Se você cultivar a linhagem mutante, por um curto período de tempo, em ambas as temperaturas, e depois isolar o RNA recém sintetizado, em cada caso, que tamanho relativo você esperaria para estas moléculas? Explique.

 Diferente das DNA polimerases, as RNA polimerases não fazem revisão da síntese do RNA. Porque não seria tão importante reparar os erros cometidos pela RNA polimerase?

 A seqüência de bases, abaixo, de uma molécula de DNA, foi transcrita em RNA:

CCAGGTATAATGCTCCAGTATGGCATGGTACTTCCGGATC...

Se T, em vermelho, é a primeira base transcrita, determine a seqüência e polaridade no RNA; identifique o Pribnow box.

Cristina M. Bonato 69

Page 70: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

A seqüência abaixo representa o início de um gene de E. coli.O que os nucleotídios em vermelho poderiam estar indicando? Baseado nesta análise, transcreva este segmento. Indique a polaridade do transcrito, a fita codificadora e a fita molde. Explique porque você fez esta opção.

3' CCTCTTGTCAGGCCGGAATAACTCCCTATAATGCGCCACCACTAGCTAATCGTACACCTTAA 5'

5' GGAGAACAGTCCGGCCTTATTGAGGGATATTACGCGGTGGTGATCGATTAGCAUGTGGAATT 3'

Capítulo 7 – PECULIARIDADES A TRANSCRIÇÃO EM ARCHAEA, BACTERIA E EUKARYA

Organização dos Genes em Operons

O mapeamento genético em E. coli permitiu determinar que muitos dos genes com funções relacionadas, p. ex., os componentes de uma via biossintética, estão agrupados numa região específica do cromossomo. Este grupo de genes é transcrito numa única molécula de RNA mensageiro (RNA poligênico ou RNA policistrônico), e sua transcrição é controlada por uma única região promotora. Dentro da região promotora localiza-se uma pequena seqüência regulatória denominada operador, na qual se ligam proteínas repressoras específicas que dificultam a transcrição dos genes quando seus produtos gênicos não são necessários à celula (vide Regulação da Expressão Gênica). Tais grupamentos de genes sob regulação de um único promotor/operador são denominados operons, permitindo que os parceiros de uma mesma via metabólica sejam ativados ou reprimidos em conjunto.(Figura 7.1).

Cristina M. Bonato70

Page 71: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 7. 1. Organização de um operon hipotético em E. coli. Os genes E, D, C, B e A codificam proteínas cuja expressão é com-trolada por um mesmo pro-motor, à montante. Quando a proteína repressora liga-se ao operador, não ocorre transcrição deste conjunto de genes. O seg-mento que compreende os genes mais a região promotor/operador é denominado operon.

Este tipo de organização do genoma é comum nos procariotos, tanto Archaea como Bacteria. Cerca de 30% do genoma bacteriano está organizado em operons. Em eucariotos este tipo de organização é mais rara. Os transcritos são, via de regra, monocistrônicos. Todavia, a estrutura operônica já foi identificada no nematóide C. elegans (Zorio, 1994) e em tripanossomatídeos como T. brucei.

Processamento Pós-Transcricional

O produto imediato da transcrição, o transcrito primário não é, necessariamente, uma entidade funcional. Para se tornar funcional, a maioria deles precisa sofrer uma série de modificações que podem envolver adição ou remoção de nucleotídios ou ainda, modificação de alguns nucleosídeos específicos. Tanto o mRNA como o tRNA ou rRNA podem ser alterados de diferentes formas para se transformarem num RNA funcional. O conjunto das modificações sofrida pelo transcrito primário é conhecido por processamento pós-transcricional.

A ausência de compartimentalização do genoma em procariotos permite que os processos de transcrição e tradução sejam acoplados de formas que, antes mesmo de terminar a transcrição a tradução já se inicia. Uma das conseqüências disto é que, em geral, os mRNAs de procariotos não sofreriam modificações.

Nos eucariotos, os processos de transcrição e tradução estão temporal e espacialmente isolados. A transcrição do DNA ocorre no núcleo e a tradução no citoplasma. Os transcritos primários que originarão mRNAs, na sua migração do núcleo para o citoplasma, sofrem extensiva modificação antes de atravessarem a barreira imposta pela carioteca (Figura 7. 2).

As modificações que podem ocorrer nos transcritos nucleares são, basicamente de três tipos:

Coroamento ("capping") do terminal 5'; Poliadenilação do terminal 3'; Montagem de segmentos codificadores ("splicing").

Este conjunto de modificações no transcrito nuclear originará o mRNA, pronto para migrar para o citoplasma. Transcritos originados na mitocôndria ou cloroplastos não sofreriam tais modificações, comportando-se de forma similar aos de bactérias.

Cristina M. Bonato 71

Page 72: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 7. 2. Nos Procariotos, transcrição e tradução ocorrem simultâneamente. Em eucariotos, o transcrito primário é modificado dentro do núcleo e, só então, migra para o citoplasma.

Coroamento do Terminal 5' ("Capping")

Assim que o terminal 5' do transcrito primário é liberado (em geral com cerca de 30 nucleotídios de extensão), um nucleotídio de guanina é adicionado bloqueando o terminal. A ligação do nucleotídio de guanina se dá via ligação fosfodiéster 5'- 5', uma reação pouco usual, formando a estrutura 3'-G-5'ppp5'-N-3'p. Em seguida um grupo metil é adicionado à posição 7 do anel de purina (7-metilguanosina). Esta estrutura é denominada cap. Após a formação do cap, o grupo 2'-OH da ribose é metilado. O segundo açúcar da cadeia, no nucleotídio adjacente pode ser ou não metilado (Figura 7.3).

Figura 7. 3. CAP no terminal 5' de moléculas de RNA sintetizadas pela Pol II, que transcreve, especificamente, seqüências que originarão mRNAs em eucariotos. A letra N representa qualquer um dos 4 ribonucleotídios, se bem que, usualmente, o nucleotídio que inicia uma cadeia de RNA é uma purina (A ou G). Imagina-se que as enzimas necessárias ao processo de adição do cap estejam associadas à RNA pol II. Os transcritos das RNA Pol I e Pol III não tem cap.

Aparentemente esta estrutura metilada é utilizada para ajudar na interação entre ribossomos e mRNA de forma tal que a tradução inicie-se no códon AUG correto. Nos procariotos isto seria

Cristina M. Bonato72

Page 73: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

desnecessário uma vez que, neste caso, os mensageiros possuem uma seqüência 5' complementar ao terminal 3' do rRNA 16S posicionando corretamente o mRNA nos ribossomos (veja Tradução). Outra função que tem sido atribuída ao cap é a de proteger o transcrito de degradação.

Poliadenilação do Terminal 3'

A adição de uma longa cauda de resíduos de adenina (poli A) no terminal 3' é também uma modificação sofrida por grande parte dos transcritos RNAPII. A cauda poli A, cerca de 200 resíduos adenílicos, é adicionada ao terminal 3' da molécula após o término da transcrição (Figura 7.4).

Inicialmente, uma endonuclease específica reconhece a seqüência consenso AAUAAA, clivando o transcrito 11-30 nucleotídios à jusante do consenso. A seguir, a enzima poli-A polimerase adiciona os resíduos de adenina a partir do ponto de quebra.

Várias funções têm sido associadas à cauda poli A: 1) poderia facilitar a exportação do mRNA do núcleo para o citoplasma; 2) poderia afetar a estabilidade do mRNA no citoplasma e, aparentemente, 3) é importante na eficiência da tradução. Neste caso, o cap e a cauda poli A agiriam combinados, impedindo que se inicie a tradução de moléculas de mRNA que não estejam intactas.

Figura 7. 4. Poliadenilação do transcrito RNAPII. O sítio AAUAAA é reconhecido por uma endonuclease que cliva a molécula 11 a 30 nucleotídios à jusante. Aí são adicionados resíduos de Adenina pela enzima poli A polimerase. Não há utilização de molde para a síntese da cadeia de poli A.

Montagem do mRNA (“Splicing”)

Uma das características do genoma de eucariotos é que os genes podem ser fragmentados. O que significa isto?

Num segmento do DNA, correspondente a um gene que codifica uma determinada proteína, são encontradas regiões codificadoras (exons) alternando-se com regiões não-codificadoras (introns). O transcrito resultante não é funcional e só poderá ser traduzido se for devidamente montado, descartando-se os introns e unindo-se os exons em seqüência ordenada. Este tipo de modificação do transcrito primário é denominado "splicing" (cortar e colar; montagem) e ocorre

Cristina M. Bonato 73

Page 74: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

dentro do núcleo. O transcrito processado e pronto para migrar para o citoplasma, recebe o nome de RNA mensageiro.

A descoberta de que os genes de eucariotos poderiam ser interrompidos ou fragmentados, foi realizada por Philip Sharp & Richard Roberts, em 1977, tendo lhes valido o prêmio Nobel de 1993.

Posteriormente, foram detectados genes interrompidos também em bactérias, porém como um evento raro tanto nos genomas indivíduais como no próprio domínio Bacteria.

Segmentos não codificadores são muito frequentes no genoma eucariótico. Ao contrário do que ocorre nas bactérias, onde os genes estão mais compactamente organizados. Em eucariotos as distâncias intergênicas são grandes e, dentro dos próprios genes a freqüência de introns é alta. Em geral, os introns são muito mais extensos que os exons.

O processo de remoção dos introns e união dos exons ocorrem via reações altamente específicas, em pontos de junção definidos, de sorte a garantir que a mensagem contida na seqüência de nucleotídios dos exons não seja alterada durante a montagem.

O resultado da retirada dos introns pode ser visualizado quando o mRNA é hibridizado com o segmento de DNA que lhe deu origem. As regiões complementares entre mRNA/DNA pareiam, mas aquelas regiões do DNA que correspondem aos introns não têm equivalente no mRNA e, portanto, formam-se alças de DNA fita simples, o que nos permite identificar o número de introns no gene (Figura 7.6).

Existem diferentes mecanismos de retirada dos introns, podendo ser auto-suficientes (auto-splicing) ou, então, dependentes de partículas ribonucleoprotéicas (spliceossomos).

Figura 7. 6. Alças formadas após hibridiza-ção do mRNA com a fita complementar de DNA que lhe serviu de molde.

Auto-Montagem ("Auto-splicing")

A auto-montagem (auto-splicing) do transcrito RNA pol II depende da configuração do próprio intron, uma vez que é a própria molécula de RNA que catalisará as reações químicas que culminarão na retirada de si própria e na união dos exons. Existem duas classes de introns que sofrem auto-splicing: introns do grupo I e do grupo II. Em ambos os casos, a reação de auto-montagem do mRNA implica em dois passos consecutivos de transferência de ligação fosfodiéster de um ponto para outro, sem gasto de energia. Grupos hidroxila 2' ou 3' de uma ribose perpetuam um ataque nucleofílico a um fósforo, estabelecendo uma nova ligação, às custas da velha, mantendo o equilíbrio energético.

Cristina M. Bonato74

Page 75: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Em introns do grupo I, o primeiro passo depende da presença de uma molécula de guanosina (GMP, GDP ou GTP), que não é usada como fonte de energia, mas como nucleófilo. Em introns do grupo II o ataque nucleofílico é perpetuado pelo 2' OH de um resíduo de adenilato do próprio intron, sem necessidade de um cofator externo (Figura 7.7). Intron de grupo II tem sido detectado em bactérias, se bem que como evento raro (The Xylella fastidiosa Consortium, 2000 ; Ferat & Michel, 1993).

O mecanismo de auto-splicing foi descoberto em 1982 por Thomas Cech e Sidney Altman, que receberam o prêmio Nobel de 1988, ao demonstrarem que moléculas de RNA podem apresentar propriedades catalíticas. RNAs com atividade catalítica recebem o nome de ribozimas. A descoberta de ribozimas tem trazido uma grande contribuição para a compreensão da evolução dos seres vivos no planeta, sugerindo que, provavelmente, as moléculas de RNA precederam as de DNA neste processo.

GRUPO I GRUPO II

Figura 7. 7. Reação de trans esterificação. Introns do grupo I: no primeiro passo, o 3' OH da guanosina estabelece uma ligação fosfodiéster 3', 5' com o terminal 5' do intron. No segundo passo, o grupo 3' OH livre do exon age como um nucleófilo no terminal 3' do intron. O resultado é a excisão exata do intron e ligação dos exons. Introns do grupo II: um laço intermediário é formado entre a guanosina 5' terminal do intron e o 2' OH do adenilato interno, estabelecendo-se uma ligação fosfodiéster 2', 5'. O segundo passo é similar ao do grupo I.

Spliceossomo

Nem sempre a montagem dos exons é do tipo auto-splicing. Algumas vezes depende da ação de proteínas e de RNAs nucleares pequenos (snRNAs, do inglês, small nuclear RNAs). Ao complexo de proteínas específicas e de seus snRNAs, denomina-se snRNPs (pronuncia-se "snarps"). Diferentes snRNPs participam do processo de montagem de um transcrito primário, constituindo a máquina ribonucleoprotéica denominada "spliceossomo", a qual dirige a montagem

Cristina M. Bonato 75

Page 76: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

do mRNA, dentro do núcleo. O "spliceossomo" sedimenta à 60S, indicando que é quase tão grande quanto um ribossomo.

De acordo com o seu tipo, as partículas snRNP recebem a denominação U1, U2, U4, U5 ou U6. As moléculas de snRNA que participam dos diferentes snRNPs variam de tamanho entre 100 e 215 pares de base (pb). Funções específicas são atribuídas a cada um dos tipos de partículas ribonucleoprotéicas.

As reações que culminam com a montagem do mRNA são reações de trans esterificação, onde uma ligação fosfodiéster entre dois nucleotídeos no terminal 5' do intron é transferida para um outro ponto no teminal 3' do intron, similar ao que ocorre no auto-splicing. Neste processo não há consumo de energia, uma vez que o número de ligações éster-fosfato, na molécula, não é alterado (Figura 7.8).

Figura 7. 8. Esquema simplificado de splicing dependente de ribonucleproteínas. A montagem de transcritos da polimerase II é catalisada pelo spliceossomo, um complexo ribonucleoprotéico constituído de U1, U2, U5 e U4/U6 entre outros componentes. Um OH reativo de uma purina localizada próxima ao sítio 3' de splicing do intron, ataca o sítio 5', clivando-o e liberando o terminal 5' do intron que se liga covalentemente à purina, formando um laço (lariat). Em seguida, o 3' OH terminal do primeiro exon une-se ao início do segundo exon, clivando o sítio de splicing 3'. O intron é liberado como um laço e os dois exons unem-se, em seqüência.

A marca registrada de eucariotos é a presença de genes interrompidos, mas nem todos os genes eucarióticos são interrompidos. P. ex., os múltiplos genes que codificam as diferentes histonas, proteínas envolvidas no empacotamento do DNA em nucleossomos, ou os genes que codificam interferons, proteínas produzidas por vertebrados contra infecção viral, não são, via de regra, interrompidos. Também não são interrompidos a grande maioria dos genes que codificam as proteínas de choque térmico (HSPs), sintetizadas pela célula em resposta a condições adversas.

Cristina M. Bonato76

Page 77: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Genes Interrompidos e a Taxa de Evolução

Porque a fragmentação dos genes é um evento comum em eucariotos? Seria um resquício da evolução, hoje descartado pelas bactérias em função de uma pressão seletiva no sentido de tornar seu genoma o mais compacto possível permitindo taxas máximas de reprodução ou estas interrupções foram adquiridas pelos eucariotos porque deveriam cumprir objetivos muito especiais?

As evidências em favor de uma ou outra alternativa não são conclusivas. De qualquer forma, as vantagens de genes interrompidos para o eucarioto poderiam ser elencadas como:

Aumentar a taxa de recombinação entre genes e diminuir a probabilidade da junção recombinante cair dentro do exon, uma vez que, quanto maior a distância entre dois segmentos dados, maior a probabilidade de recombinação entre eles. Tais eventos permitem combinações de diferentes domínios protéicos (exons), aumentando a variedade de tipos de uma dada proteína.

Facilitar a duplicação de exons. Há uma série de exemplos de genes que contem dois ou mais exons que são muito semelhantes entre si. Tais exons provavelmente surgiram devido a crossing-over desigual entre seqüências de introns, seguida por divergência dos exons duplicados para prover novas funções. Os genes de imunoglobulinas e colágeno são um exemplo disto, apresentando múltiplas cópias de exons relacionados.

Permitir que uma nova proteína seja testada enquanto o organismo retém a expressão do produto original. Sabe-se que uma mutação pontual pode criar um novo sinal de junção 5' ou 3' para splicing do transcrito primário. Durante o splicing, um sítio de junção 3' pode unir-se a um dos dois (ou mais) sítios de junção 5' (ou vice-versa), possibilitando que uma única mensagem seja, agora, montada de duas formas diferentes, originando dois mRNAs diferentes. Assim, tanto a proteína "velha" como a nova poderão ser produzidas simultaneamente, independente de uma duplicação gênica anterior.

Aparentemente, a presença de introns é tanto maior quanto mais alto estivermos na escala evolutiva. Entre os eucariotos inferiores a freqüência de introns cai muito. Genes nucleares de levedura praticamente não possuem introns, apesar dos mesmos serem encontrados nos genes mitocondriais das leveduras. Já em mamíferos os introns não são encontrados nos genes mitocondriais mas são a regra entre os genes nucleares.

Uma variante do splicing é o trans RNA splicing, quando a montagem ocorre entre terminais de moléculas de mRNA provenientes de dois genes diferentes.

Edição

O fenômeno de Edição do RNA consiste em adicionar ou deletar nucleotídios no mRNA antes do mesmo ser traduzido. Na maioria das vezes, as deleções ou inserções são exclusivamente de Us. Este fenômeno é comum nos mRNA mitocondriais de tripanossomos e depende da presença de um RNA guia (gRNA). O gRNA apresenta uma seqüência não inteiramente complementar ao mRNA que será editado porque neste segmento do RNA guia estão presentes nucleotídios (As) ausentes no mRNA. Por causa disto o gRNA servirá de molde para a inserção de Us na fita do mRNA. (Figura 7.9).

Cristina M. Bonato 77

Page 78: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

O interessante neste processo é que o próprio gRNA é o doador de Us, presentes em seu terminal 3'. A transferência dos nucleotídeos de uridina do gRNA para o mRNA depende de duas reações de trans esterificação.Vários ciclos podem ocorrer, alterando a mensagem original.

Figura 7. 9. Pareamento do gRNA ao mRNA e duas reações consecutivas de trans esterificação que permitem a adição de um nucleotído de uridina pareado ao nucleotídeo de adenosina do gRNA. Na primeira transferência, o terminal 3' OH do gRNA ataca uma ligação fosfodiéster interna do mRNA pré-editado, gerando uma molécula linear 5' e um híbrido 3'-gRNA. Na segunda trans esterificação, o terminal 3' OH da molécula linear ataca a região rica em Us do gRNA, liberando o gRNA e editando o mRNA.

RNA Polimerases em Eukarya e Archaea

Enquanto as bactérias utilizam apenas um tipo de RNA polimerase (RNAP) para transcrever todos os diferentes tipos de RNA encontrados na célula, os eucariotos necessitam de pelo menos três tipos de RNA polimerases, especializadas na síntese de dos diferentes tipos de RNA: RNA polimerase I (RNAP I), para sintetizar rRNA; RNA polimerase II (RNAP II), para mRNAs e RNAs nucleares pequenos (snRNAs) e RNA polimerase III (RNAP III), para tRNAs, 5S RNA e outros RNAs pequenos.

Estima-se que em uma célula de mamífero sejam encontradas 40.000 moléculas de RNAP II, 40.000 de RNAP I e cerca de 20.000 de RNAP III. Nos procariotos estima-se que o número de moléculas de RNAP seja 7.000/célula.

As RNAP eucarióticas são constituídas de várias subunidades, cerca 10-15, que exercem funções específicas no processo de transcrição. O peso molecular varia de 500-700 kDa.

As diversas enzimas eucarióticas devem ter evoluído de uma mesma enzima ancestral a qual se especializou no decorrer do tempo, uma vez que as subunidades dos diferentes tipos apresentam similaridade entre si. Além destas três RNA polimerases nucleares, as célula eucarióticas contem RNA polimerases separadas nas mitocôndrias e nos cloroplastos.

Nos Archaea, apenas uma RNAP transcreve todos os tipos de RNA, todavia, é mais complexa do que a RNAP encontrada no domínio Bacteria. A RNAP arqueana é constituída de 8-

Cristina M. Bonato78

Page 79: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

13 componentes, enquanto a RNAP bacteriana holoenzima apresenta as 4 subunidades centrais, (a2, b, b'), e o fator s, que reconhece o promotor. A maioria das subunidades arqueanas apresenta maior similaridade de seqüência com as subunidades da RNAP dos Eukarya do que de Bacteria (Keeling & Doolittle,1995). Em Archaea, as duas subunidades maiores da RNAP são denominadas A e B. A subunidade A corresponde à RpoC (b') de E.coli e à RpoA da RNAP II de Eukarya. A subunidade B corresponde à RpoB (b) de E. coli e à RpoB da RNAP II de Eukarya (Brown & Doolitlle,1997).

Uma distinção importante entre as enzimas dos três domínios é o reconhecimento do promotor e início da transcrição. Em bactérias, o fator de transcrição sigma, parte integrante da holoenzima, é responsável pelo reconhecimento do promotor. Diferentes sigmas reconhecem diferentes promotores. Em eucariotos, por sua vez, os fatores de transcrição, eTF (do inglês, eukaryotic Transcription Factor) não fazem parte da holoenzima. Ligam-se previamente ao DNA propiciando, então, a ligação das RNA polimerases.

Uma vez que existem três tipos de RNA polimerases nos eucariotos, os eTF requeridos em cada caso também são diferentes e designados de acordo com a polimerase correspondente, ou seja: TFI, TFII e TFIII. Alguns destes fatores já foram isolados. Os fatores de transcrição TFI e TFII ligam-se à montante dos sítios de iniciação de transcrição e os TFIII ligam-se à jusante.

A expressão de genes que codificam proteínas, os quais são transcritos pela RNAPII, dependem, de um modo geral, de três classes de TFII:

Fatores de transcrição gerais (GTF) ou basais, necessários à síntese de qualquer mRNA, selecionando o sítio de iniciação (equivalente ao sigma em Bacteria) e contribuindo ao acoplamento da RNAPII; suportam níveis basais de transcrição (promotor basal). Nos Archaea são encontradas subunidades de fatores de transcrição bastante similares a dos TFII basais de Eukarya.

Fatores de transcrição à montante, os quais ligam-se à seqüências à montante, próximas do ponto de início, estimulam ou reprimem a iniciação da transcrição pelo complexo RNAP II/GTF, modulando a expressão do gene.

Estimuladores de transcrição (enhancers), os quais ligam-se à seqüências específicas distantes do promotor basal, à montante ou à jusante e são necessários à máxima atividade dos promotores cognatos. Nos procariotos as seqüências reconhecidas por moduladores ou estimuladores estão, geralmente, próximas ao ponto de início de transcrição do gene e são denominados elementos à montante ou elementos UP (do inglês, upstream). Em Archaea os moduladores e estimuladores de transcrição são mais similares aqueles do domínio Bacteria.

Transcrição Basal em Eukarya

O início da transcrição implica no reconhecimento do promotor pela RNA polimerase. No caso da RNAP II, em Eukarya, alguns tipos característicos de promotores são reconhecidos:

TATA box ou Hogness box - seqüência consenso centrada aproximadamente na posição – 25, rica em pares AT (T82A97T93A85A63A50), como os Pribnow box de E. coli. É importante no posicionamento da RNAPII para iniciação da transcrição. Em ~75% dos casos, a primeira base a ser transcrita, nos genes contendo TATA box, é uma purina, com predominância de adenina. Estes promotores são característicos de genes expressos seletivamente em alguns tipos de células.

Cristina M. Bonato 79

Page 80: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Iniciador (Inr) - a maioria dos iniciadores apresentam um C na posição –1 e um A na posição +1. A seqüência ao redor do ponto de início determina a força do promotor. Um consenso, altamente degenerado, proposto para esta região é: Py Py A N T/A Py Py, onde A é o ponto de início (+1), Py é pirimidina (C ou T) e N é qualquer nucleotídio.

GC box - em alguns genes, o início da transcrição não está bem definido, podendo iniciar-se em qualquer ponto numa extensão variável de 20 a 200 pb, da unidade de transcrição, gerando mRNAs com terminais 5' diversos. Em geral, estes genes contem uma região rica em GC (20–50 nucleotídios), posicionada entre 100–200 pb à montante do início de transcrição, denominada GC box. Genes que são expressos em todos os tecidos, denominados genes de rotina (housekeeping), costumam apresentar GC box.

CCAAT box - elemento localizado à -50 e -110, o qual, juntamente com o TATA box poderia ser o sítio inicial de ligação da RNAPII e de outras proteínas envolvidas na iniciação da transcrição.

Transcrição basal pela RNAPII:

Reconhecimento do promotor: depende de ligação prévia do fator de transcrição TFIID, o qual é um complexo protéico composto de várias subunidades. Entre as subunidades do TFIID encontra-se a proteína TBP ("TATA-Binding Protein"), a qual recebeu este nome por ter sido identificada, inicialmente, como ligante do TATA box.Todavia esta proteína está sempre presente na máquina basal de transcrição atuando, também, em promotores que não contem TATA box.

Ligação de outros fatores de transcrição ao complexo inicial, juntamente com a RNA polimerase II.

Caminhada da RNA polimerase ao longo do gene: para tanto, a RNAPII precisa livrar-se dos fatores de transcrição, da mesma forma que a RNA polimerase de E.coli livra-se do sigma. O fator de transcrição TFIIH, uma serina/treonina proteína quinase que fosforila o domínio carboxi-terminal da RNAPII é um elemento preponderante neste desengate.

Figura 7. 10. Iniciação da transcrição. Da máquina protéica de transcrição participam várias proteínas que se aglomeram numa seqüência específica permitindo a ação da RNA polimerase II. Em mamíferos, o terminal carboxila da RNAPII apresenta 52 repetições da seqüência YSPTSPS, onde os resíduos de serina (S) e treonina (T) podem ser fosforilados por TFIIH.

Cristina M. Bonato80

Page 81: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Em Archaea foram encontrados homólogos dos fatores de transcrição eucarióticos TFIIB e TBP, denominados respectivamente, TFB e aTBP. Além disto os promotores de Archaea apresentam uma região rica em A-T na posição -25 à montante do início de transcrição, que forma um complexo ternário com aTBP e TFB, bastante similar à estrutura encontrada em eucariotos. Os dados disponíveis até o momento mostram que a maquinaria de transcrição basal é partilhada por Archaea e Eukarya. A grande maioria dos componentes reguladores são partilhados por Archaea e Bacteria. Algumas proteínas associadas à transcrição são comuns aos três domínios e, por causa disto, consideradas universais.

Guia de Estudos

O que é um operon?

O que é um RNA policistrônico?

O que são introns e exons?

Desenhe o produto de hibridização DNA/RNA, gerado por um gene que contem 5 introns. Se o gene não tivesse introns, qual seria o produto de hibridização?

Que tipos de modificações podem ocorrer em transcritos produzidos pela RNA polimerase II de eucariotos, antes de migrarem para o citoplasma?

O que são ribozimas?

Explique os tipos de auto-splicing que você conhece.

Como o spliceossomo funciona? Quais são seus componentes?

Onde você esperaria que se acumulassem mais mutações, nos introns ou exons?

Haveria vantagens em genes interrompidos?

O que significa edição do mRNA?

Desenhe uma molécula típica de mRNA em bactérias e eucariotos. Marque todas as regiões.

Faça um quadro comparativo dos elementos e eventos chaves da transcrição em Archaea, Eukarya e Bacteria.

Cristina M. Bonato 81

Page 82: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Capítulo 8 – O CÓDIGO GENÉTICO

Mutações Gênicas e Proteínas Alteradas

Como o DNA codifica a informação genética? Desde a publicação de Watson & Crick (1953) sobre a estrutura do DNA e da carta de George Gamow a eles endereçada, desenvolvendo a idéia da existência de um código genético onde o DNA serviria de molde para a síntese de proteínas, muitas perguntas surgiram e vários experimentos fascinantes foram realizados na tentativa de respondê-las.

Em 1957, Vernon Ingram mostrou que havia uma relação entre mutações gênicas e proteínas alteradas ao comparar a hemoglobina de indivíduos normais com a de indivíduos com anemia falciforme, caracterizada como uma doença molecular, por Linus Pauling em 1945. Pauling havia mostrado que a hemoglobina normal (HbA) apresentava uma carga aniônica cerca de duas unidades mais negativa do que a da hemoglobina proveniente de células falcêmicas (HbS).

A hemoglobina, o pigmento dos eritrócitos, é uma proteína tetramérica, constituída de duas cadeias polipeptídicas a idênticas (141 aminoácidos) e duas cadeias polipeptídicas b idênticas (146 aminoácidos), cuja função é transportar oxigênio através de todo o corpo.

Indivíduos com anemia falciforme apresentam eritrócitos em forma de foice, conseqüência da alteração conformacional sofrida pela molécula de hemoglobina, devido a uma mutação afetando o 6o aminoácido da cadeia b onde ácido glutâmico é substituído por valina. A hemoglobina HbS, desoxigenada, agrega-se em filamentos suficientemente grandes para deformar os eritrócitos. A anemia falciforme já era conhecida como uma doença hereditária, de acordo com as leis da genética Mendeliana, apresentando caráter de codominância ao nível da molécula:

HbA/HbA - células vermelhas normais; hemoglobina tipo HbA HbS/ HbS - células vermelhas em forma de foice; praticamente 100% da hemoglobina é tipo

HbS; geralmente a anemia é fatal HbA/HbS- células vermelhas em forma de foice só ocorrem sob baixa concentração de

oxigênio; curiosamente, os heterozigotos apresentam resistência aumentada à malária, o que confere uma vantagem seletiva a estes indivíduos em regiões onde a malária é endêmica; 40% da hemoglobina é tipo HbS.

As moléculas de hemoglobina provenientes de um falcêmico, quando submetidas a um campo elétrico, migram diferente das normais devido a diferença de carga entre elas, resultante da troca de um aminoácido com carga negativa por um aminoácido apolar (Figura 8.1).

Cristina M. Bonato82

Page 83: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 8. 1. A) Célula normal de eritrócito e célula falcêmica. B) Relação entre uma mutação geneticamente transmissível, que provoca anemia falciforme, e migração da hemoglobina num campo elétrico. No mutante, o ácido glutâmico, que possui carga negativa, foi substituído por valina, um aminoácido apolar, modificando as interações intramoleculares que se refletem na conformação da proteína que perde a capacidade de transportar oxigênio.

Assim, no segmento da cadeia b, onde esta mutação pode ocorrer, a sequência de aminoácidos da hemoglobina normal (A), Val His Leu Thr Pro Glu Glu é substituída pela seqüência Val His Leu Thr Pro Val Glu da hemoglobina falcêmica (S).

Que tipo de alteração ocorrera na molécula de DNA provocando a substituição de um aminoácido por outro na proteína? Por esta época, nada se sabia sobre a natureza do Código Genético e várias propostas estavam sendo feitas e analisadas pelos pesquisadores.

Características do Código Genético

O Código Genético é a fórmula que converte a informação hereditária dos genes em proteínas. Uma seqüência de bases poderia especificar uma seqüência de aminoácidos de diferentes maneiras. Já que existem só 4 bases diferentes para os 20 tipos de aminoácidos encontrados nas células, a combinação de algumas bases seria necessária para especificar cada um dos aminoácidos. A esta combinação de bases especificando um determinado aminoácido, dá-se o nome de códon.

De quantas bases seria constituído cada códon?

Uma combinação dos quatro tipos de bases, dois a dois, seria insuficiente para especificar todos os aminoácidos, já que 42 = 16. Assim, uma combinação de bases três a três seria minimamente necessária, já que 43 = 64. Todavia, num código de trincas, ou 44 códons não especificariam nenhum aminoácido ou então, cada aminoácido poderia ser especificado por mais de um códon. Neste caso, o código seria degenerado.

Assumindo-se que o códon é uma trinca, como as trincas estariam organizadas para codificar proteínas? Haveria ou não sobreposição das trincas? Observe a Figura 8.2: se houvesse sobreposição, a trinca ABC codificaria o primeiro aminoácido, BCB o segundo, CBD o terceiro, e assim sucessivamente; não havendo sobreposição o primeiro aminoácido seria codificado pela trinca ABC, o segundo por BDA, o terceiro por DCB, etc.

Figura 8. 2. Sobrepo-sição ou não sobrepo-sição de codons. No ca-so de sobreposição de codons, uma mu-dança em C poderia alterar os aminoácidos 1, 2 e 3 emquanto, no caso de não sobre-posição, uma mudança em C afetaria apenas o aminoácido 1.

Cristina M. Bonato 83

Page 84: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Existiria pontuação na leitura do código? Ou seja, na seqüência: ABC, BDA, DCB, ACD........ as vírgulas entre os códons seriam representadas por uma das bases, por uma combinação delas ou, simplesmente, não existiriam?

Como identificar o início e o fim das seqüências a serem "lidas"?

A resposta a estas questões foi resultado do trabalho intensivo de Crick, Brenner e colaboradores no final dos anos 50 e início dos 60, culminando com a demonstração de que o Código Genético é lido a partir de um ponto fixo, não tem vírgulas, não se sobrepõe, está organizado em trincas e é degenerado.

Abaixo, o primeiro parágrafo do trabalho publicado em 1961 por Crick e colaboradores, acerca das propriedades do código:

"There is now a mass of indirect evidence which suggests that the amino-acid sequence along the polypeptide chain of a protein is determined by the sequence of the bases along some particular part of the nucleic acid of the genetic material. Since there are twenty common amino-acids found throughout Nature, but only four common bases, it has often been surmised that the sequence of the four bases is in some way a code for the sequence of the amino-acids. In this article we report genetic experiments which, together with the work of others, suggests that the genetic code is of the following general type: A group of three bases (or, less likely, a multiple of three bases) codes one amino-acid. The code is not of the overlapping type. The sequence of the bases is read from a fixed starting point. This determines how the long sequences bases are to be correctly read off as triplets. There are no special 'commas' to show how to select the right triplets. If the starting point is displaced by one base, then the reading into triplets is displaced, and thus becomes incorrect. The code is probably 'degenerate'; that is, in general, one particular amino-acid can be coded by one of several triplets of bases."

Os Códons São Lidos Sem Sobreposição

A análise das seqüências de proteínas mutantes obtidas de células tratadas com diferentes agentes químicos levou ao entendimento de como agiam os mutagênicos utilizados e de como o código genético funcionava. As evidências de não sobreposição vieram dos trabalhos realizados por alguns pesquisadores que estudavam mutações produzidas no vírus do mosaico do fumo (TMV), por ação de ácido nitroso.

O ácido nitroso é um agente mutagênico que causa desaminação das aminas aromáticas e, portanto, pode converter citosina em uracil e adenina em hipoxantina. A conseqüência disto é que, na próxima duplicação, uracil pareará com adenina e, portanto, a guanina que originalmente deveria estar naquela posição teria sido substituída por adenina, redundando na troca do par G-C por A-T, como esquematizado a seguir.

Cristina M. Bonato84

Page 85: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Se o código fosse sobreposto, além de restringir o tipo possível de vizinhos para cada aminoácido, a alteração de uma base geraria mudanças em aminoácidos adjacentes da cadeia polipeptídica (Figura 8.2). Todavia, ao seqüenciarem as proteínas mutantes da capa do vírus, os pesquisadores observaram que apenas um aminoácido, por vez, era alterado como resultado do tratamento com ácido nitroso. Além disso, todas as hemoglobinas humanas anormais estudadas em detalhe até então, mostraram alterações em um único aminoácido levando a conclusão de que os códons são lidos sem sobreposição.

Os Códons São Lidos a Partir de um Ponto Fixo, Sem Vírgulas

As evidências sobre a leitura contínua das trincas estão descritas no trabalho de Crick, Brenner e colaboradores, onde analisaram uma mutação induzida por proflavina no bacteriófago T4.

Proflavina é um agente mutagênico que intercala na molécula de DNA provocando deleção ou inserção de nucleotídios. O fago T4 é um fago lítico, ou seja, quando infecta a bactéria E. coli provoca lise celular produzindo milhares de partículas fágicas (vide Transferência de informação genética em bactérias). Tratamento com proflavina, provoca uma mutação no fago T4, designada FC0, localizada no gene rIIB.

O gene rIIB controla a morfologia das placas de lise. Mutantes FC0 não multiplicam-se no hospedeiro E. coli K12, mas multiplicam-se em E. coli B, produzindo placas de lise muito maiores que as produzidas pela linhagem selvagem do fago, a qual multiplica-se nas duas hospedeiras, E. coli B e K12 (Figura 8.3).

Figura 8. 3. Os pontos claros marcam os locais onde partículas fágicas individuais se multipli-caram resultando na lise das bactérias destas regiões. Estas regiões são denominadas placas de lise. A inativação do produto gênico rIIB provoca uma lise rápida das bactérias, produzindo-se placas de lise maiores que as do selvagem. O gene foi nomeado r, por causa da lise rápida observada nos mutantes.

Os pesquisadores haviam observado que proflavina gerava mutantes completamente não funcionais para o gene em questão, diferindo da ação dos análogos de base que, ao substituirem uma base por outra, não comprometem totalmente a função dos genes. O fato da proflavina

Cristina M. Bonato 85

Page 86: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

provocar ausência completa de função sugeria que, provavelmente, não estava ocorrendo substituição de bases mas sim inserção ou deleção de nucleotídios, desorganizando a leitura dos códons a partir do ponto do evento (Figura 8.4).

Considerando que uma mutação tenha sido produzida pela inserção de uma base na seqüência selvagem, então, a leitura à direita da inserção, estaria deslocada de uma base e geraria um produto completamente alterado daí para frente, o que explicaria a ausência de função em mutantes produzidos pela ação de proflavina. Portanto, a retomada da fase de leitura dependeria da deleção de um nucleotídio.

Figura 8. 4. Cada uma das letras A, B e C representa uma base diferente do ácido nucléico. Para simplificar está representada uma seqüência repetida de bases ABC, codi-ficando um polipeptídio onde todos os aminoácidos são idênticos. A fase de leitura, a partir de um ponto inicial, está representada pelos col-chetes, implicando que a leitura é feita em conjuntos de três à partir da esquerda. Com a adição do nucleotídio C (+), a leitura saiu de fase, só retomando com a deleção de outro C (-) mais à frente.

Partindo do mutante FC 0 (placas grandes de lise), resultante do tratamento com proflavina, buscaram por indivíduos que tivessem revertido para o fenótipo selvagem (placas pequenas de lise), readquirindo a capacidade de infectar as duas linhagens de E. coli. A idéia era que, para reverter ao fenótipo selvagem, deveria ocorrer adição ou deleção de um nucleotídio no momento da replicação, dependendo se a mutação original fora causada por uma deleção ou inserção, respectivamente.

Isolaram 18 revertentes da mutação FC 0. Observaram então que, nos revertentes, ocorriam inserções ou deleções em posições diferentes, porém não muito distantes das originais. A nova mutação era antagônica à original, permitindo que o fenótipo mutante fosse suprimido. Assim, se a mutação FC 0 fosse uma inserção, a mutação supressora seria uma deleção. Uma mutação que suprime o efeito da outra dentro de um mesmo gene provoca uma supressão intragênica.

A explicação dada pelos autores ao fenômeno observado foi a seguinte: uma seqüência de bases é lida, trinca a trinca, a partir de um ponto fixo localizado à esquerda, sem nenhuma pontuação entre elas, ou seja, livre de vírgulas.

O Código Genético é Constituído de Trincas e é Degenerado

Nos fagos revertentes FC 0 a morfologia das placas de lise é variável porque depende da região compreendida entre as duas mutações. Esta região está fora de fase, o que implica na codificação de aminoácidos diferentes do selvagem, neste segmento (vide Figura 8.4). Dependendo

Cristina M. Bonato86

Page 87: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

das alterações sofridas por este segmento, o produto sintetizado no revertente será mais semelhante ou menos semelhante ao do selvagem, resultando nas diferentes morfologias das placas de lise.

Quando duas mutações de mesmo tipo (+,+) ou (-,-) são combinadas, sempre ocorre alteração no quadro de leitura. Porém, quando três mutações de mesmo tipo são combinadas, o fenótipo selvagem pode ser restaurado. Estas observações confirmavam a hipótese de que o código genético é representado por trincas. Indicavam também que cada uma das 64 trincas possíveis poderiam codificar um aminoácido e, portanto, o código é degenerado.

Figura 8. 5. A adição ou a deleção de três nucleotídios recupera o qua-dro de leitura.

O Gene é Colinear ao Peptídio que Ele Codifica

A demonstração pontual de que a seqüência de códons corresponde exatamente a seqüência de aminoácidos na proteína foi feita no início dos anos 60. Um dos grupos de pesquisa envolvidos na resolução deste problema isolou e analisou uma série de mutantes do gene trpA, de E. coli, o qual codifica a enzima triptofano sintetase (Charles Yanofsky et al, 1964). Esta enzima, constituída de 286 resíduos de aminoácidos, converte indol glicerol fosfato em triptofano. Mutantes neste gene não sintetizam triptofano.

Uma vez que, nesta época, ainda não estava desenvolvida a técnica de seqüenciamento gênico, para saber a posição de cada nucleotídio no gene, Yanofsky e colaboradores fizeram um mapeamento genético usando a técnica de transdução.

Transdução é o processo de transferência de informação genética de uma bactéria para outra via fago. Quando uma bactéria é infectada por um fago e, em seguida, lisada, algumas (1/1000) das partículas fágicas produzidas poderão carregar um fragmento do cromossomo bacteriano (veja

Cristina M. Bonato 87

Page 88: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Transferência da informação genética em bactérias). Tais partículas fágicas (fagos defectivos) podem injetar este segmento de DNA em outra célula bacteriana. Uma vez que o cromossomo da célula infectada pelo fago defectivo contem um fragmento homólogo de DNA, será possível a recombinação entre o segmento carregado pelo fago e aquele presente no cromossomo da bactéria. A freqüência de recombinação entre os diferentes mutantes trpA permitiu construir um mapa determinando-se a posição das diferentes mutações no gene trpA (mapa genético).

Por outro lado, para saber qual a alteração causada pelas mutações, em cada uma das proteínas mutantes, foi utilizada a técnica de impressão digital (fingerprint) ou mapa peptídico. Esta técnica consiste em purificar a proteína, clivá-la com enzimas proteolíticas para obter peptídios e separá-los por eletroforese e cromatografia. A posição ocupada pelos fragmentos peptídicos durante a migração no suporte de separação, depende dos aminoácidos que os constituem.

Os fragmentos que contiverem o aminoácido alterado migrarão de forma diferente do selvagem, posicionando-se num ponto específico do suporte (spot). Os spots (manchas) são então cortados e eluídos do suporte onde se encontram. Em seguida a seqüência de aminoácidos de cada um é determinada. O sequenciamento das manchas com migração alterada, nos diferentes mutantes, permitiu desenhar o mapa peptídico. Os resultados mostraram que a posição das mutações no gene correspondia à posição ocupada pelos aminoácidos alterados, na cadeia polipeptídica (Figura 8.6).

Figura 8. 6. Colinearidade do gene trpA e cadeia polipeptídica a, da triptofano sintetase, por ele especificada. Em vermelho estão especificadas as substituições ocorridas nos diferentes mutantes analisados.

Conclui-se, então, que a seqüência de aminoácidos na proteína pode ser lida diretamente a partir da seqüência de nucleotídeos no gene. Posteriormente, a descoberta de que os genes podem ser fragmentados, apresentando regiões codificantes (exons) e não-codificantes (introns), alertava para o fato da colinearidade estava restrita aos módulos codificadores, uma vez que os introns não são traduzidos.

Após determinar as propriedades do Código Genético restava elucidá-lo, ou seja, descobrir qual era o significado de cada uma das possíveis 64 trincas. A que aminoácido cada uma delas correspondia?

Atualmente, como o código já foi desvendado e a técnica para seqüenciamento de genes já está automatizada, é possível seqüenciar genomas inteiros e identificar todos os segmentos passíveis de codificarem proteínas atribuindo-se a cada um destes fragmentos de DNA a seqüência putativa de aminoácidos nele codificada. Segmentos de DNA que contem informação potencial

Cristina M. Bonato88

Page 89: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

para codificar um peptídio são denominados quadros de leitura aberta ou ORFs (do inglês, Open Reading Frames).

Decifrando o Código Genético: Homopolímeros e Copolímeros Aleatórios

Em 1955, Grunberg-Manago & Ochoa, isolaram da bactéria Azobacter vinelandii, uma enzima capaz de juntar ribonucleotídios na reação esquematizada abaixo, onde NDP representa um ribonucleosídio difosfato:

(RNA)n + NDP (RNA)n+1 + Pi

Esta enzima, denominada polinucleotídio fosforilase, não utiliza um molde para sintetizar a nova molécula, ligando aleatoriamente os ribonucleosídios difosfatados disponíveis. Difere, portanto, da RNA polimerase. Se apenas um tipo de ribonucleosídio estiver disponível, sintetizará um homopolímero.

Conhecendo esta enzima, Nirenberg e Matthaei sintetizaram três tipos de homopolímeros de RNA: poli U, poli A e poli C. Com estes homopolímeros fizeram ensaios de síntese protéica "in vitro". Em 20 tubos de ensaio contendo os requisitos necessários à síntese proteica, adicionavam um dos homopolímeros e uma mistura de 19 aminoácidos não marcados + 1 marcado radioativamente, que era diferente em cada tubo.

O homopolímero poli U (mRNA poli U), recuperava uma quantidade significativa de radioatividade no precipitado protéico do tubo que recebera fenilalanina (Phe) radioativa. Logo, UUU é códon para Phe. Nos casos de mRNA poli A e mRNA poli C, precipitado protéico radioativo foi encontrado, respectivamente, em presença de lisina (Lys) e prolina(Pro) marcadas. Assim, AAA especifica lisina Lys e CCC especifica Pro.

Para elucidar o significado das outras trincas foram sintetizados copolimeros aleatórios, misturando-se a enzima polinucleotídio fosforilase com quantidades diferentes de cada tipo de nucleotídio. Por ex., ao misturar 76% de U e 24% de G, a probabilidade de uma trinca desta mistura ser

UUU é 0,76 x 0,76 x 0,76 = 0,44. UUG, UGU ou GUU (2 UU e 1 G) é 0,76 x 0,76 x 0,24 = 0,14 para cada uma das

configurações possíveis. GGG é 0,24 x 0,24 x 0,24 = 0,01 (Tabela 8.1).

A utilização de diferentes copolímeros permitiu que se inferisse os códons para alguns aminoácidos e comprovou o fato do código ser degenerado.

Tabela 8. 1. Incorporação de aminoácidos estimulada por um copolímero aleatório de U e G numa razão molar 0,76:0,24. GGG

CódonProbabilidade de Ocorrência

Incidência Relativa

AminoácidoQuantidade Relativa de aminoácido incorporado

UUU 0,44 100 Phe 100

UUG, UGU, GUU 0,14 para cada 32Leu ou Cys ou Val

Leu 36; Cys 35; Val 37

Cristina M. Bonato 89

Page 90: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

UGG, GUG, GGU 0,04 para cada 9 Trp ou Gly Trp 14; Gly 12

GGG 0,01 2 - -a Incidência relativa é aqui definido como 100 x probab. ocorrência/0,44. Adaptado de Voet & Voet, 1995, pg 964.

Ligando Trincas Específicas aos tRNAs

Em 1964 Nirenberg & Leder verificaram que trincas de nucleotídios são capazes de promover a ligação de aminoacil-tRNAs específicos aos ribossomos. Utilizaram um filtro de nitrocelulose cujos poros eram suficientemente pequenos para impedir a passagem dos ribossomos mas não dos aminoacil-tRNAs livres. Quando o aminoacil-tRNA liga-se ao ribossomos, fica retido no filtro. Os ensaios foram feitos em tubos contendo ribossomos, uma dada trinca e uma mistura de tRNAs carregados com seus respectivos aminoácidos, sendo que apenas um dos aminácidos daquela mistura estava marcado radioativamente. O aminoacil-tRNA complementar à trinca liga-se a ela. Este procedimento foi repetido para os vinte aminoácidos (Figura 8.7). Cerca de 50 códons foram determinados neste ensaio de ligação.

Figura 8. 7. Ensaio de ligação do tRNA à trinca específica. Uma trinca de ribonucleoídios associa-se ao ribossomo e captura o aminoacil-tRNA cognato. Este complexo não atravessa o filtro de nitocelulose. Os aminoacil-tRNAs não ligados atravessam o filtro. No tubo contendo o aminoacil-tRNAcognato, marcado radioativamente, será possível detectar radioatividade aprisionada ao filtro.

A resolução do Código finalmente foi completada por Khorana, utilizando poliribonucleotídos de trincas conhecidas e repetidas em seqüência. P.ex., num poli UGC, três homopolímeros diferentes poderiam ser especificados, uma vez que a leitura do polímero pelos ribossomos pode acontecer em três fases possíveis (UGC UGC UGC UGC ou GCU GCU GCU GCU ou CUG CUG CUG CUG), gerando homopeptídios de cisteína, alanina ou leucina (Figura 8.8).

Cristina M. Bonato90

Page 91: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 8. 8. Um mRNA pode ser lido em qualquer um dos três quadros de leitura, gerando, em cada caso, um polipeptídio diferente.

Códons de Terminação e Iniciação

A utilização de tetranucleotídios repetidos permitiu a identificação dos códons de terminação. Analise os três copolímeros abaixo:

No caso A) é gerado um polipeptídio onde 4 aminoácidos se repetem em seqüência: Tyr(Y).Leu(L).Ser(S).Ile(I). Nos casos B) e C) são gerados apenas tripeptídeos com as composições de aminoácidos Ile(I). Asp(D). Arg(R) e Val(V). Ser(S). Lys(K), respectivamente. Isto porque UAG e UAA são sinais de parada da síntese protéica. UGA é outro sinal de parada. Os códons de terminação UAA, UAG e UGA são denominados códons sem sentido (nonsense) porque são os únicos códons que não especificam nenhum aminoácido. Freqüentemente são denominados ochre (UAA), amber (UAG) e

opala (UGA).

O códon AUG inicia a cadeia polipeptídica na maioria dos casos. GUG é um iniciador mais raro. Estes mesmos códons são encontrados em posições internas do gene, especificando metionina (AUG) e valina (GUG). Algumas variações em torno da regra são encontradas (veja Universalidade do Código Genético).

A síntese de proteínas a partir dos polímeros sintéticos acima descritos como, p. ex., UUU, que não possui o iniciador, acontece "in vitro", sob condições muito altas de Magnésio, bastante diferente das condições fisiológicas.

Tabela do Código Genético

O arranjo da tabela do código não é aleatório, porque basea-se em propriedades do código.

O código é altamente degenerado, sendo que três aminoácidos, Arg, Leu e Ser podem ser especificados por 6 códons cada. Os outros são especificados por 4 ou 2 códons. Somente

Cristina M. Bonato 91

Page 92: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

metionina e triptofano são especificados por um único códon. São três os códons de terminação. Códons que especificam o mesmo aminoácido são denominados sinônimos.

A maioria dos sinônimos difere apenas na 3a posição e, assim, estão agrupados na mesma caixa da Tabela, exceto os que possuem 6 códons e, portanto, ocupam mais de uma caixa. Assim, mutações na 3a posição, em geral, não provocam mudanças de aminoácidos sendo fenotipicamente silenciosas.

Códons com pirimidinas na 2a posição codificam, em geral, aminoácidos hidrofóbicos (verde). Códons com purinas na 2a posição codificam, em geral, aminoácidos polares. Observando estes códons verifica-se que se os códons codificando os aminoácidos hidrofóbicos F, L, I e V, sofrerem mudanças na 1a ou 3a posição continuarão codificando aminoácidos com características similares de sorte a preservar o funcionamento da proteína resultante.

Aparentemente o código evoluiu de modo a minimizar os efeitos deletérios das mutações. A maioria das mutações que levam a substituição de um aminoácido por outro na cadeia polipeptídica são provocadas pela mudança de uma única base, ou seja, num único ponto do polímero de ácido nucléico e, por esta razão são denominadas mutações de ponto. Acredita-se que grande parte das variações genéticas observadas entre indivíduos de uma população humana (polimorfismo) seja decorrente de alterações em um único nucleotídio no gene, recebendo a denominação SNP, do inglês single nucleotide polymorphism.

Tabela do Código Genético

1a posição2a

posição3a posição

U C A G

U

UUUPhe(F)

UCU

Ser(S)

UAUTyr(Y)

UGUCys(C)

U

UUC UCC UAC UGC C

UUALeu(L)

UCA UAATERM

UGA TERM A

UUG UCG UAG UGG Trp(W) G

C

CUU

Leu(L)

CCU

Pro(P)

CAUHis(H)

CGU

Arg(R)

U

CUC CCC CAC CGC C

CUA CCA CAAGln(Q)

CGA A

CUG CCG CAG CGG G

A

AUU

Ile(I)

ACU

Thr(T)

AAUAsn(N)

AGUSer(S)

U

AUC ACC AAC AGC C

AUA ACA AAALys(K)

AGAArg(R)

A

AUG Met(M) ACG AAG AGG G

G

GUU

Val(V)

GCU

Ala(A)

GAUAsp(D)

GGU

Gly(G)

U

GUC GCC GAC GGC C

GUA GCA GAAGlu(E)

GGA A

GUG GCG GAG GGG G

A Universalidade do Código

Cristina M. Bonato92

Page 93: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

O fato de ser possível traduzir genes de um organismo em outro, p. ex., genes humanos, em E. coli, sugeria que o código padrão apresentado na tabela 8.2 era universal. Todavia, o estudo de diferentes seqüências de DNA a partir dos anos 80 revelaram algumas divergências em relação ao padrão.

Por exemplo, em mitocôndrias de mamíferos o códon para a Met iniciadora pode ser AUG ou AUA (Ile no padrão); UGA especifica Trp e não terminação; AGA e AGG especificam terminação e não Arg. Nas mitocôndrias de plantas, fungos, Drosófila e protozoárias, também ocorrem variações em relação ao padrão. Nos protozoários ciliados, os códons UAA e UAG, ao invés de especificarem parada, codificam Gln. Além disto, foi relatado em Candida spp (Santos et al , 1997 ), eucariotos unicelulares, a existência de códons polissêmicos, isto é, um códon codificando mais de um aminoácido. No caso citado, CUG codifica tanto Leu como Ser, denotando ambigüidade e nos remetendo as seguintes questões: 1) em Candida, as alterções no Código Genético ainda não estariam completamente estabelecidas, ou 2) a ambiguidade CUG seria vantajosa, permitindo rápida adaptação a desafios ambientais, devendo ser mantida como tal.

Estas são algumas das evidências de que o código genético padrão, se bem que amplamente utilizado, não é universal.

Ainda, em relação à utilização de códons, o seqüenciamento dos genomas nos permitiu verificar que existe uma preferência por determinados códons de acordo com os grupos taxonômicos. A preferência de códons (codon usage, em inglês) nos permite fazer conjecturas acerca da origem de determinados genes dentro de um grupo taxonômico. Mais recentemente pode-se verificar preferência de códons dentro de um mesmo genoma dependendo do posicionamento dos genes. Em Borrelia burgdorferi , genes localizados na fita líder (leading) de duplicação do DNA apresentam uma preferência diversa daqueles localizados na fita lenta (lagging), revelando um novo paradigma para seleção de códons em procariotos (McInerney, 1998).

Genes sobrepostos: O fato dos códons serem lidos sem pontuação e de cada códon ser uma trinca, permite, em princípio, que qualquer seqüência de nucleotídios apresente três fases potenciais de leitura. Logo, uma dada seqüência poderia codificar até três polipeptídios diferentes. Este tipo de organização do genoma foi encontrado no fago fX174, onde a seqüência de um gene está completamente contida na seqüência de um gene maior, lido em outro quadro de leitura e codificando proteínas não relacionadas (Figura 8.8). Em bactérias pode-se observar sobreposição nos terminais de genes que pertencem ao mesmo operon: o terminal de um gene sobrepõe-se ao início do próximo. Mas, sobreposição completa de um gene só foi detectada em fagos pequenos de DNA fita simples, como fX174. Este tipo de organização permite o uso máximo daquela quantidade de DNA, que é a quantidade disponível para ser empacotada em seus capsídios.

Figura 8. 8. Região do genoma de fX174. Note que o gene B está completamente contido em A. Também, o gene E está completamente contido em D. Além disto, os terminais dos genes D e E sobrepõem-se a seqüência controle de iniciação da tradção do gene J. Logo, este pequeno segmento do DNA executa uma tarefa tripla.

Guia de Estudos

Cristina M. Bonato 93

Page 94: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Qual é o polipeptídio especificado na fita molde de DNA, abaixo? Assuma que a tradução se inicia no primeiro códon de iniciação transcrito.

5’TCTGACTATTGAGCTCTCTGGCACATAGCA3’

A seqüência abaixo é um mRNA:

5’ - CGAUGCGAACCACGUGAUAAGCAU - 3’

Transcreva a fita molde indicando seu sentido Transcreva a fita codificadora indicando seu sentido Deduza a seqüência de aminoácidos, indicando o terminal amino e carboxila Deduza a seqüência de aminoácidos caso haja a inserção de um A, no início da cadeia de

mRNA.

Qual seria a seqüência possível de um mRNA que codificasse o polipeptídeo abaixo? (Indique as variações)

His - Thr - Glu -Asp - Trp - Leu - His - Gln – Asp

Quais as propriedades do código genético?

A impressão digital (fingerprinting) de uma proteína de um mutante fenotipicamente revertente do fago T4 indica a presença de um peptídio alterado em relação ao selvagem:

Selvagem: Cys-Glu-Asp-His-Val-Pro-Gln-Tyr-Arg

Mutante: Cys-Glu-Thr-Met-Ser-His-Ser-Tyr-Arg

Explique como surgiu o mutante e dê as seqüências, sempre que possível, dos mRNAs que especificam os dois peptídios.

Quais são os aminoácidos especificados por códons que, com uma única mutação de ponto mudam para um códon âmbar (UAG)?

O mRNA especificando a cadeia a da hemoglobina humana contem a seqüência:

........UCCAAAUACCGUUAAGCUGGA......., que codifica o tetrapeptídio C-terminal da cadeia a-normal: Ser-Lys-Tyr-Arg. Numa hemoglobina mutante, a seqüência correspondente a esta região é: Ser-Lys-Tyr-Arg-Gln-Ala-Gly... Que tipo de mutação provocou esta alteração?

Um segmento de uma proteína normal e de três mutantes aparece abaixo:

Normal: gly, ala, ser, his, cys, leu, phe....

Mutante 1: gly, ala, ser, his

Murante 2: gly, ala, ser, leu, cys, leu, phe

Mutante 3: gly, val, ala, ile, ala, ser

Cristina M. Bonato94

Page 95: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Qual é a provável seqüência de bases no RNA normal?

Uma proteína normal tem histidina numa dada posição. Quatro mutantes foram isolados com os seguintes aminoácidos na posição da histidina: tirosina, glutamina, prolina ou leucina. Quais os possíveis códons para estes aminoácidos e qual era, provavelmente, o códon utilizado para histidina?

Capítulo 9 – TRADUÇÃO EM BACTÉRIAS

A Molécula Adaptadora

Cristina M. Bonato 95

Page 96: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

A molécula de tRNA preenche todas as características da molécula adaptadora proposta por Crick, necessária à ocorrência da tradução: carrega um aminoácido, que aí se ligou por ação enzimática e reconhece o códon correspondente por complementaridade de bases (Figura 9.1). Desta forma, a função do tRNA é assegurar que cada um dos aminoácidos incorporados na proteína corresponda ao seu códon particular na molécula de mRNA.

Figura 9. 1. Hipótese do adaptador.

A primeira molécula de tRNA a ser seqüenciada foi tRNAAla, de leveduras, em 1965. A partir de então, centenas de moléculas de tRNA de diferentes organismos já foram seqüenciadas. A molécula de tRNA pode ser representada na forma de uma folha de trevo, resultante de pareamento intramolecular, produzindo três estruturas tipo haste/alça e uma haste, caracterizando os quatro braços da molécula (Figura 9.2).

No braço aceptor de aminoácido, algumas bases dos terminais 3´ e 5´ da molécula estão pareadas, deixando livre a seqüência 5´CCA 3´ que é constante em todos os tipos de tRNAs. Ao grupo 3´ OH ou 2´OH livre do adenilato terminal conecta-se o aminoácido específico.

Oposto ao braço aceptor encontra-se o braço do anticódon, ou seja, os 3 nucleotídios complementares ao códon da molécula de mRNA.

O braço DHU posiciona-se próximo ao terminal 5´. O braço TyC posiciona-se próximo ao terminal 3´. Entre o braço TyC e o braço do anticódon, encontra-se um braço de tamanho bastante

variável quando se comparam os diferentes tRNAs. Este braço não está presente em todos os tRNAs (braço extra).

Um grande número de bases nos tRNAs são modificadas após a sintese da molécula gerando diidrouridina (D), pseudouridina ( y ) , inosina, metilguanosina, etc. Não está claro qual é a função destas modificações. Algumas foram associadas à restrição ou expansão no reconhecimento do códon. Outras seriam necessárias como elementos identificadores, para as aminoaci-tRNA sintetases.

Os cromossomos de E. coli contem aproximadamente 60 genes para tRNAs, alguns dos quais participam dos operons de rRNA. Os outros encontram-se agrupados em diferentes posições do cromossomo e o transcrito inicial pode incluir vários tRNAs. Nos eucariotos são encontradas várias centenas de genes para tRNAs, espalhados no genoma.

Figura 9. 2. Estrutura planar e estrutura terceária do tRNA. Em ge-ral apresentam 76 nucleotídios, variando na faixa de 60 a 95 (18 a 28kDa). Análises de cristalografia sugerem que as moléculas de tRNA assumem uma estrutura terceária na forma de um L, onde o braço acep-

Cristina M. Bonato96

Page 97: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

tor e o braço TyC constituem uma perna do L e os braços D e do nati-códon, constituem a outra perna. Variações nesta estrutura são encontradas nos tRNAs mitocon-driais de mamíferos, flagelados e nematóides, incidindo sobre os bra-ços D e T.

Os transcritos iniciais dos tRNAs apresentam seqüências extras nos terminais 3´ e 5´ as quais são retiradas por diferentes RNases. A RNase P, que atua no terminal 5´ dos tRNAs é uma ribozima, encontrada em procariotos e eucariotos (núcleo, mitocôndria e cloroplastos). Esta ribozima apresenta um componente ribonucléico e um componente protéico, mas é o RNA que, de fato, possui atividade catalítica.

Muitos transcritos primários para tRNAs de eucariotos contem introns adjacentes ao braço do anticódon, os quais são excisados antes da molécula migrar para o citoplasma. Outra característica de eucariotos é que os tRNAs são transcritos sem a seqüência CCA típica do terminal 3´ de todos os tRNAs, a qual será adicionada posteriormente, pela enzima tRNA nucleotidil transferase, utilizando CTP e ATP como substrato.

A quantidade, dentro da célula, de cada espécie de tRNA isoaceptor varia de acordo com o organismo. É interessante observar que esta quantidade está associada à preferência dada por um organismo na utilização de certos códons. Ou seja, é típico de cada organismo a preferência de códons dentre os vários possíveis num sistema degenerado. Quanto maior a quantidade de tRNAs para estes códons, maior será a eficiência de tradução dos mesmos.

Hipótese Oscilatória

Nem sempre é necessário um pareamento perfeito entre as bases, na interação códon-anticódon. Se isto fosse imprescindível, as células deveriam possuir 61 tipos de tRNAs, correspondentes aos 61 códons. Todavia, as células contem apenas cerca de 30 a 40 tRNAs diferentes em bactérias e ~50 em eucariotos. Portanto, não existe um tipo de tRNA para cada códon.

Por exemplo:

O tRNAPhe com o anticódon 5’GmAA3’, pode parear com 5’UUC3’ e 5’UUU 3’ (lembre-se que as fitas são antiparalelas);

O tRNAAla, com o anti-códon 5’IGC3’, pode parear com 5’GCU3’, 5’GCC3’ e 5’GCA3’.

Para explicar como o anticódon de um dado tRNA pode reconhecer códons degenerados Crick propôs a hipótese oscilatória (wobble)(Crick, 1966). Analisando o código genético, observa-se que a 3a base do códon é menos restritiva que a 1a e a 2a. Ele assumiu que os dois primeiros pares códon-anticódon, obedeciam o pareamento normal Watson-Crick. O 3o par, todavia, podia apresentar oscilação no pareamento. Quando U, G ou I ocupam a 1a posição do anticódon, podem ser reconhecidos dois ou três códons, com variação na 3a posição (Tabela 9.1).

Cristina M. Bonato 97

Page 98: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Tabela 9.1 Pareamentos permitidos na 3a posição

Base 5' - anticódon Base 3' - códon

C G

A U

U A ou G

G U ou C

I U, C ou A

As Aminoacil tRNA Sintetases

As enzimas aminoacil tRNA sintetases são responsáveis pela ligação correta de cada aminoácido a seu tRNA correspondente. Em E. coli existe uma amino acil tRNA sintetase, pelo menos, para cada um dos 20 tipos de aminoácidos (p. ex., arginil t-RNA sintetase - ArgRS, leucil t-RNA sintetase - LeuRS, etc). Uma enzima particular reconhece um aminoácido particular e todos os tipos de tRNAs que transportam aquele aminoácido (Como o código genético é degenerado, existem diferentes códons para leucina, p. ex., que serão reconhecidos por diferentes anti-códons e, portanto, diferentes tRNAs).

Em eucariotos existe um conjunto de pelo menos 20 diferentes aminoacil t-RNA sintetases nucleares e um outro conjunto mitocondrial. Uma vez que todas estas enzimas exercem o mesmo papel, ou seja, "carregar" o t-RNA com o aminoácido correto e, considerando-se que os diferentes tipos de tRNAs tem estrutura bastante similar, esperava-se que as enzimas também apresentassem uma estrutura similar. Todavia, este não é o caso. Elas são um grupo bastante heterogêneo, variando de proteínas monoméricas à tetraméricas.

Os diferentes tipos de amino acil tRNA sintetases pertencem a duas classes, I e II, de acordo com sua habilidade de conectar o aminoácido, respectivamente, ao grupo 2’OH ou 3’OH do adenilato livre no terminal 3’ da molécula. Geralmente, é a face interna (côncava) do L que interage com as aminoacil t-RNA sintetases. As evidências atuais são de que os identificadores de cada um dos tipos de tRNA encontram-se no braço aceptor e na alça do anticódon (Figura 9.3).

Figura 9. 3. Interação do tRNA com a enzima aminoacil tRNA sintetase (AARS)

Cristina M. Bonato98

Page 99: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Acoplando o Aminoácido ao tRNA Específico

Para carregar um tRNA específico com o aminoácido correto duas reações consecutivas, catalisadas pela mesma aminoacil t-RNA sintetase são necessárias, utilizando-se energia de hidrólise de uma molécula de ATP:

Ativação do aminoácido ao reagir com ATP, gerando aminoacil adenilato (aminoacil-AMP) + PPi;

Ligação do aminoacil-AMP ao tRNA, gerando aminoacil-tRNA + AMP.

O processo de aminoacilação do tRNA é altamente específico. Se o aminoácido errado (não-cognato), ligar-se ao tRNA, a seqüência de aminoácidos ficará alterada uma vez que o reconhecimento do aminoacil tRNA é via pareamento códon-anticódon.

Este fenômeno foi demonstrado experimentalmente da seguinte forma: um resíduo de cisteína ligado ao tRNACys, cisteinil-tRNACys, foi modificado para alanina, tornando-se alanil-tRNACys (Figura 9.4).

Figura 9. 4. De-monstração experi-mental de que o pa-reamento codon-anticódon direcio-na a adição de ami-noácidos ativados durante a síntese protéica.

No momento da síntese "in vitro", o alanil-tRNACys agrega alanina aos polipeptídios em resposta ao códon de cisteína no mRNA, de sorte que, no polipeptídio, alanina passa a ocupar posições que deveriam ser ocupadas por cisteína. Isto significa que somente o anticódon do aminoacil-tRNA participa do processo de reconhecimento do códon, sem qualquer envolvimento

Cristina M. Bonato 99

Page 100: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

do aminoácido. Assim, a tradução correta do código genético em proteínas depende de dois eventos de reconhecimento por parte do tRNA: reconhecer o aminoácido ativado e reconhecer o códon equivalente no mRNA.

Ribossomos, as Máquinas Tradutoras

O processo de síntese protéica está confinado à complexas e abundantes estruturas ribonucleoprotéicas denominadas ribossomos, às quais se agregam, transitoriamente, tRNAS e mRNAs. O confinamento das moléculas envolvidas no processo de síntese torna-o extremamente eficiente.

Os ribossomos de E. coli são partículas esferóides de ~250 Å, com coeficiente de sedimentação 70S e massa aproximada de 2,5 x 106 Da. Estas partículas são formadas por duas subunidades desiguais. A subunidade pequena (30S) é constituída de uma molécula de rRNA 16S e 21 tipos de proteínas. A subunidade grande (50S) é constituída das moléculas de rRNA 23S e RNA 5S mais 31 proteínas diferentes (Figura 9.5).

Por convenção, as proteínas das subunidades grande e pequena são designadas, respectivamente, com os prefixos L (do inglês, Large) e S (do inglês, Small), seguidas de um número indicativo de sua posição no gel após corrida eletroforética em duas dimensões. A seqüência de aminoácidos de todas as 52 proteínas ribossômicas de E. coli já está determinada, uma vez que o genoma já foi completamente sequenciado. A maioria das proteínas ribossômicas é rica nos aminoácidos básicos Lys e Arg, contendo poucos resíduos aromáticos, o que era de se esperar de proteínas interagindo intimamente com moléculas polianiônicas como o RNA.

O rRNA 16S consiste de 1542 nucleotídios com pareamento intramolecular, determinando uma estrutura secundária complexa com 4 domínios bastante conservados. A estrutura da molécula de RNA determina sua interação com as proteínas ribossômicas e a própria conformação da subunidade ribossômica pequena. O rRNA 5S é constituído de 120 nucleotídios e o 23S de 2904 nucleotídios.

Subunid. grande, 50SMassa: 1590 kDaRNAs: 23S e 5SProteínas: 31

Subunid. pequena, 30SMassa: 930 kDaRNA: 16SProteínas: 21

Ribossomo, 70sMassa: 2520 kDaRNAs: 23S, 16S, 5SProteínas: 52

Figura 9. 5. A subunidade pequena combina-se com a subunidade grande formando o ribossomo completo (70S)

Os ribossomos de eucariotos (80S) são maiores e mais complexos que os de E. coli. A subunidade pequena (40S) é constituída de ~ 33 proteínas e de uma molécula de rRNA 18S (1900

Cristina M. Bonato100

Page 101: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

nucleotídios). A subunidade grande (60S) é constituída de 3 espécies de rRNA: 28S (4.800 nucleotídios); 5,8S (160 nucleotídios) e 5S (20 nucleotídios). Cerca de 50 proteínas fazem parte desta subunidade. Os cloroplastos e mitocôndrias também possuem ribossomos, os quais assemelham-se aos de bactéria. Se bem que a seqüência primária de cada tipo de rRNA varie consideravelmente entre diferentes organismos, a estrutura secundária que acabam adotando é muito similar em todos os casos analisados.

Os Estágios da Tradução

Três estágios podem ser considerados no processo de síntese protéica: iniciação, alongamento e terminação.

A iniciação implica na ativação do aminoácido iniciador. O aminoácido iniciador é a metionina, cujo códon é AUG (códon de iniciação). Uma vez que o aminoácido iniciador é sempre uma metionina, a iniciação requer a presença de metionil-tRNAMet. Existem dois tipos de tRNAMet. Um deles, o tRNAi

Met, inicia a cadeia, o outro tRNAMet, incorpora metionina na cadeia crescente. A mesma aminoacil-tRNA sintetase acopla metionina aos dois tipos de tRNA, mas somente o metionil-tRNAi

Met pode se ligar à subunidade pequena do ribossomo para iniciar a síntese protéica.

Em bactérias, o grupo amino da metionina do metionil-tRNA iMet é modificado pela

adição de um grupo formil sendo, algumas vezes, designado formilmetionil-tRNA fMet ou

fMet-tRNAfMet. A enzima responsável pela formilação utiliza N10-formil tetrahidrofolato

como doador do grupo formil (Fig. 9.6).

Figura 9. 6. Estruturas da Metionina e N-formil me-tionina. Em vermelho, o grupo formil.

Em E. coli, o sítio de iniciação da síntese protéica, na molécula de mRNA, é identificado pela interação do terminal 3´ do rRNA 16S, da subunidade pequena, com o terminal 5´ da molécula de mRNA a ser traduzida. Uma seqüência de nucleotídios no terminal 5´ do mRNA, denominada seqüência Shine-Dalgarno (a dupla de pesquisadores que a identificou), é parcialmente complementar a uma seqüência do terminal 3´ do rRNA 16S, rica em pirimidinas (Shine & Dalgarno, 1974). A seqüência Shine-Dalgarno, no mRNA, está centrada a cerca de 10 nucleotídios do ponto de início da tradução. O pareamento entre as duas moléculas não é absoluto e devem ser considerados pares G.U.

mRNA da replicase do fago Qb 5' UAAGGAUGAA-(5 nucl.)- AUG...3'

mRNA da prot. ribos. L10 5' CAGGAGCAAA -(4 nucl.) - AUG ...3'

mRNA do trp leader 5' AAAGGGUAUC - (4nucl.) - AUG ...3'

Terminal 3' do 16S rRNA 3' AUUCCUCCAC - (~1400 nucl.) - 5'

Cristina M. Bonato 101

Page 102: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Em E. coli, a interação inicial entre a molécula de mRNA, a subunidade pequena do ribossomo e o fMet-tRNAf

Met forma o complexo de iniciação de tradução. Tal interação é facilitada por proteínas que se associam transitoriamente aos ribossomos conhecidas pelo nome genérico de fatores de iniciação da tradução (IF1, IF2 e IF3).

Apesar da síntese protéica sempre iniciar com metionina, este aminoácido não é encontrado no terminal amino de todas as proteínas funcionais uma vez que é modificado ou removido após a síntese.

O Complexo de Iniciação da Tradução

Ribossomos intactos (70S) não se ligam a novos mensageiros para iniciar a síntese protéica. É necessário que as subunidades se dissociem. A formação do complexo de iniciação da tradução (Figura 9.7) requer os seguintes passos:

O fator de iniciação da tradução, IF3, liga-se à partícula 70S propiciando a dissociação das duas subunidades.

IF1 aumenta a taxa de dissociação. O mRNA e o fMet-tRNAf

Met ligam-se à subunidade 30S, assessorados por IF3. O acoplamento do fMet-tRNAf

Met ao mRNA exige energia, cedida por GTP, e assistência do fator IF2 (IF2-GTP + fMet-tRNAf

Met). Forma-se o complexo 30S de iniciação: subunidade ribossômica 30S, mRNA, IF3,

IF1, IF2-GTP e fMet-tRNAfMet).

Figura 9. 7. Iniciação da síntese protéica em E. coli.

Cristina M. Bonato102

Page 103: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

A subunidade ribossômica grande, 50S, acopla-se ao complexo 30S, após liberação do fator IF3.

O acoplamento estimula IF2 a hidrolisar GTP a GDP + P i, provocando rearranjo conformacional na subunidade 30S que resulta na liberação dos fatores IF1 e IF2.

Na iniciação da síntese protéica, o fMet-tRNAfMet ocupa o sítio ribossômico P enquanto o

sítio ribossômico A está posicionado para receber o aminoacil-tRNA ingressante cujo anticódon seja complementar ao códon imediatamente adjacente ao iniciador AUG.

Alongamento da Cadeia de Aminoácidos

O alongamento da cadeia (Figura 9.8) implica na adição consecutiva de resíduos de aminoácidos aos terminais carboxila do polímero em crescimento, de sorte que o polipeptídio cresce no sentido amino ao carboxila, colinear ao 5´ —> 3´ mRNA. Este processo que ocorre na velocidade de 40 resíduos/s exige a presença de três fatores de alongamento (EF-Tu, EF-Ts e EF-G) e da energia cedida por moléculas de GTP:

Figura 9. 8. Ciclo de alongamento nos ribossomos de E. coli

O aminoacyl-tRNA liga ao sítio A, formando um complexo ternário com EF-Tu e GTP. EF-Tu é uma GTPase porque hidrolisa GTP a GDP + Pi. A energia liberada permite o pareamento do códon ao anticódon, ligando este complexo ao ribossomo. A seguir EF-Tu.GDP + Pi são liberados.

O complexo EF-Tu.GDP é reciclado pelo fator de elongação EF-Ts, que substitui GDP por GTP restaurando EF-Tu-GTP o qual voltará a capturar novos aminoacil-tRNAs.

A enzima peptidil transferase faz a ligação peptídica entre fMet-tRNAfMet, localizada no

sítio P, e o aminoacil-tRNA ingressante, localizado no sítio A. Nesta reação a formil

Cristina M. Bonato 103

Page 104: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

metionina é deslocada para o sítio A, ligando-se ao aa-tRNA aí presente. Este processo é denominado transpeptidação. A atividade de peptidil transferase reside no rRNA 23S, portanto, uma ribozima.

O tRNAfMet descarregado é transferido para o sítio E do ribossomo e depois descartado.

O peptidil-tRNA, no sítio A e o mRNA a ele acoplado por interações códon/anticódon, movem-se para o sítio P, num processo denominado translocação. Neste momento o ribossomo está pronto para os ciclos subsequentes de alongamento. O processo de translocação exige a participação do fator EF-G + GTP que liga-se ao ribossomo e só será liberado após hidrólise do GTP. Uma vez que o sítio de iniciação foi liberado, um segundo ribossomo pode ligar-se ao ponto de início.

Terminação da cadeia de aminoácidos

A tradução de mRNAs termina nos códons de terminação UAA, UGA ou UAG. Neste momento, os polipeptídeos produzidos são liberados no citoplasma da célula.

Em E. coli, os códons de terminação, os únicos que não possuem um tRNA correspondente, são reconhecidos por fatores de liberação ou RF (do inglês, release factors). RF-1 reconhece os códons UAA e UAG. RF-2 reconhece UAA e UGA.

O fator RF-3, uma GTPase, quando complexada à GTP estimula a ligação de RF–1 ou RF-2 ao sítio A do ribossomo. A ligação do RF ao códon de terminação apropriado induz peptidil transferase a transferir o peptidil–tRNA para a água, ao invés de um aa–tRNA. Com a liberação do peptídeo, o tRNA presente no sítio P fica descarregado e é expelido do ribossomo. Também são descartados os RF, após hidrólise de GTP a GDP + Pi pela GTPase RF–3 e o mRNA, o qual será degradado (Figura 9.9).

Em eucariotos um processo similar ocorre mas requer apenas um fator de liberação denominado eRF, o qual reconhece os tres códons de terminação. Liga-se ao ribossomo junto com a molécula de GTP. A hidrólise do GTP dissocia o fator do ribossomo

Cristina M. BonatoFigura 9. 9. Terminação da tradução em E. coli. RF1 reconhece os códons de termi-nação UAA e UAG. RF2 reconhece UAA e UGA.

104

Page 105: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Polissomos

Tanto em bactérias como em eucariotos, os ribossomos lêem a molécula de mRNA no sentido 5´ —> 3´ e a cadeia polipeptídica cresce do terminal amino para o carboxila. Micrografias eletrônicas revelam que os ribossomos engajados no processo de síntese protéica localizam-se na moléculas de mRNA, um em seguida do outro, como as contas de um colar, numa freqüência de 1 ribossomo a cada 80 nucleotídios. O complexo mRNA, ribossomos ativamente engajados na síntese protéica e polipeptídeos nascentes é denominado polissomo ou polirribossomo(Figura 9.10).

Os polissomos são uma evidência de que o sítio de iniciação da tradução é imediatamente ocupado por outro ribossomo assim que o ribossomo inicial desliza sobre a molécula de mRNA liberando o ponto de início.

Chaperones Moleculares

Conforme uma cadeia polipeptídica emerge do ribossomo, associa-se à proteínas especiais denominadas chaperones moleculares cuja função é permitir que os polipeptídios recém-sintetizados adquiram sua estrutura final ativa. Os chaperones moleculares ajudam no enovelamento das proteínas ao interagir com o peptídio nascente, impedindo interações espúrias com outras moléculas, o que poderia interfirir na conformação final da proteína (Ellis & van der Vies, 1991).

Cristina M. Bonato

Figura 9. 10. Síntese protéica em um polissomo. O mRNA mensa-geiro é ocupado por vários ribosso-mos. Cada um sintetiza uma cadeia polipeptédica completa, conforme vai deslizando sobre a molécula de mRNA.

105

Page 106: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Uma dada seqüência de aminoácidos pode se enovelar, potencialmente, em diferentes estruturas. Muitas destas estruturas poderiam ser não-funcionais e/ou altamente instáveis. O papel dos chaperones moleculares seria ajudar os peptídeos encontrarem um estado funcional estável.

O termo chaperone molecular foi utilizado pela primeira vez, para descrever a função da nucleoplasmina na montagem ordenada dos nucleossomos. Quando DNA e histonas de Xenopus eram misturados sob condições fisiológicas de força iônica, ocorria precipitação das moléculas. Todavia, se nucleoplasmina fosse adicionada à mistura, formavam-se os nucleossomos. A nucleoplasmina é requerida apenas para a montagem dos nucleossomos, não participando do produto final. Ela também não carrega nenhuma informação estérica para a montagem dos nucleossomos. Esta informação está contida nas histonas. Assim, os chaperones moleculares agem sem modificar covalentemente seu substrato e sem participar do produto final.

Uma série de eventos celulares relativos a enovelamento, oligomerização, transporte e degradação de proteínas, em diferentes tipos de células dependem da participação das máquinas chaperônicas moleculares, compostas de um chaperone molecular principal (o qual se liga promiscuamente à cadeias polipeptídicas nascentes, desenoveladas ou agregadas) e um conjunto de outros chaperones (côrte), cuja função seria aumentar a eficiência do processo e permitir a reciclagem (Georgopoulos, 1992).

Cada ciclo de enovelamento requer energia provida por moléculas de ATP. Vários dos chaperones conhecidos são proteínas de choque térmico, ou seja , proteínas cuja expressão é induzida em resposta à elevação de temperatura. Um dos papéis presumido para proteínas de choque térmico seria o de proteger a célula reparando os danos provocados pelo calor. Proteínas desnaturadas pelo calor poderiam ser re-enoveladas na forma apropriada por ação dos chaperones moleculares (Hartl et al ., 1994 ). Os chaperones moleculares são encontrados tanto em bactérias como em árqueas e eucariotos e são proteínas altamente conservadas na evolução.

tmRNAs

O tmRNA bacteriano é assim denominado devido sua dupla natureza: tipo tRNA e tipo mRNA. Este RNA também é conhecido pela denominação 10Sa RNA ou SSrA.

O tmRNA está envolvido num processo notável trans-traducional. Sua função é adicionar uma etiqueta polipeptídica no C-terminal de peptídeos incompletos, prisioneiros dos ribossomos.

Porque estes peptídios estariam aprisionados?

Alguns mRNAs podem ter sido danificados e perderam seus códons de parada. Nestas circunstâncias, os fatores RF, de liberação dos peptídios, não podem associar-se aos ribossomos. Cria-se uma situação de bloqueio. Os ribossomos estão aprisionados ao polissomo; os peptídios nascentes continuam acoplados ao peptidil-tRNA. Uma vez que estes peptídios não terminaram de ser traduzidos, mesmo que sejam liberados não serão funcionais e, portanto, é conveniente para a célula que eles sejam degradados. A etiqueta adicionada pelos tmRNA é um sinal para as proteases degradarem tais peptídeos (Keiler et al ., 1996 ).

Cristina M. Bonato106

Page 107: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

O terminal 3' da molécula de tmRNA apresenta similaridade com o braço T de moléculas de tRNA e sempre está associado a um resíduo de Alanina. Na ampla alça que se forma, antes do caule (Figura 9.11), encontra-se uma seqüência de códons especificando a etiqueta (Tag) que sinaliza para proteólise. A etiqueta é constituída dos resíduos de aminoácidos (A)ANDENYALAA, em E. coli. O tmRNA reconhece ribossomos com tradução bloqueada e ocupa o sítio A. O peptídio nascente é transferido para o resíduo de alanina no terminal 3' do tmRNA. O mRNA danificado é descartado e substituído pela seqüência de códons do tmRNA. A síntese protéica recomeça e continua até encontrar um códon de parada convencional.

Assim, o tmRNA promove a destruição de produtos muito pequenos do processo de tradução, uma vez que, em bactérias, mRNAs danificados não são discriminados e entram no processo de tradução,

gerando peptídios não funcionais. Moléculas de tmRNA tem sido identificadas em diferentes grupos do domínio Bacteria, mas não foram encontrados entre os Archaea nem Eukarya.

Em eucariotos, o sistema tmRNA talvez não seja necessário porque a tradução de mRNAs danificados é evitada utilizando-se outros controles de qualidade, tais como a seleção positiva de mRNAs com cap no terminal 5' e cauda poliA no terminal 3´.

Guia de Estudos

Quais os passos de iniciação de tradução em E. coli?

Quem determina o reconhecimento do códon? O aminoácido carregado pelo tRNA ou a seqüência de anti–códon da molécula de tRNA?

Qual a função da seqüência Shine–Dalgarno?

Quais são os fatores de iniciação da tradução? Como atuam?

Quais são os fatores de alongamento da cadeia polipeptídica? Como atuam?

Como ocorre a terminação da tradução?

Qual o sentido de crescimento da cadeia polipeptídica?

Qual a ação dos análogos de base sobre a síntese protéica?

Qual a conseqüência, na síntese protéica, da ação dos corantes de acridina?

Comente esta frase: somente o anticódon do aminoacil-tRNA participa do processo de reconhecimento do códon.

Cristina M. Bonato

Figura 9. 11. Modelo de ação das moléculas de tmRNA.

107

Page 108: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Quais são as características estruturais da molécula adaptadora?

Qual a constituição dos ribossomos de E. coli?

Qual o papel das aminoacil-tRNA sintetases (AARS)?

Qual o papel da tRNA-nucleotidil transferase?

Como funciona o sistema tmRNA?

Capítulo 10 – RECOMBINAÇÃO GENÉTICA EM BACTÉRIAS

Crescimento de Bactérias em Laboratório

As bactérias podem crescer tanto em meio líquido como em uma superfície semi-sólida, tais como um gel de ágar, desde que alguns ingredientes nutritivos tenham sido adicionados. As bactérias dividem-se por fissão binária, isto é, simplesmente dividem-se ao meio depois que seu único cromossomo, um DNA circular dupla fita, se duplicou. O tempo de geração das bactérias é muito curto. Uma vez que as bactérias são unicelulares, seu tempo de geração coincide com o tempo de duplicação da célula. Assim, o tempo de geração de E. coli, por exemplo, é 20 minutos, enquanto o tempo de geração da mosca de frutas é 14 dias e dos seres humanos cerca de 20 anos.

Uma única célula bacteriana num meio líquido irá se multiplicar geometricamente até exaurir os nutrientes do meio ou até que dejetos tóxicos se acumulem num tal nível que bloqueiem o crescimento populacional. Se uma pequena quantidade desta cultura líquida for espalhada, em condições estéreis, sobre uma superfície semi-sólida contida em placas de Petri, células isoladas, invisíveis a olho nú, irão se posicionar em pontos diferentes. Este processo é denominado plaqueamento. Cada uma das células individuais, imobilizadas no gel, irá se dividir várias vezes formando aglomerados de células, visíveis a olho nú, denominados colônias. Os membros de uma colônia, todos originários de um único ancestral genético, são denominados clones. Assim, se quisermos determinar o número de células presentes numa cultura líquida de bactérias, espalhamos um pequeno volume desta cultura sobre um meio sólido e contamos o número de colônias formadas. A Figura 10.1, mostra que após plaqueamento de 100 ml de uma cultura líquida inicial foram obtidas 10 colônias na superfície do ágar. Portanto, em 1ml de meio líquido teríamos 100 células, ou seja 102 células por mililitro.

Cristina M. Bonato108

Page 109: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 10. 1. Crescimento de bactérias em laboratório. Um pequeno volume de células crescidas em meio nutriente líquido é espalhada sobre a superfície de um meio semi-sólido. As células individuais isoladas, não visíveis a olho nu, na superfície do ágar, irão proliferar formando colônias. Todas as células de uma colônia apresentarão o mesmo fenótipo e genótipo, pois são clones das originais.

Uma cultura líquida típica da bactéria Escherichia coli, por exemplo, contém cerca de 109

células por mililitro (cel/ml). A aparência das colônias ou a capacidade de formar ou não formar colônias em meios particulares pode ser utilizada para identificar o genótipo das células bacterianas. Quando uma quantidade muito grande (> 104) de células é colocada numa mesma placa contendo meio semi-sólido, não é possível identificar colônias isoladas porque estando muito próximas, ao se duplicarem formam uma cobertura contínua de células (tecido) após um dia de cultivo.

Identificação de Mutantes Bacterianos

Em geral as bactérias selvagens são prototróficas, isto é, podem crescer em meio mínimo (MM) que contem apenas água, sais inorgânicos e uma fonte de carbono orgânico. Clones incapazes de crescerem em meio mínimo, mutantes auxotróficos, podem ser facilmente identificados. Um exemplo de mutação auxotrófica é a deficiência em uma das enzimas que participam da via biossintética de arginina (mutante arg1). Tal mutante não crescerá em MM a não ser que se adicione arginina neste meio (veja Os genes governam a expressão das proteínas). Outra característica das bactérias selvagens é que, em geral, são sensíveis a antibióticos, como estreptomicina (Str) ou tetraciclina (Tet), de sorte que os mutantes resistentes são facilmente selecionados porque formam colônias em meio contendo o antibiótico. Outro tipo de mutante é aquele incapaz de utilizar uma determinada fonte de carbono orgânico. Por exemplo, mutantes Lac-

não crescem em meio mínimo cuja única fonte de carbono seja lactose, isto porque são defectivos ou na enzima que coloca a lactose dentro da célula ou na enzima que degrada a lactose para a obtenção de glicose, substrato básico para o crescimento bacteriano.

Um meio nutriente é denominado não-seletivo quando todas as células bacterianas, mutantes ou selvagens, formam colônias. O meio é denominado seletivo quando permite o crescimento de apenas um tipo de célula, seja selvagem ou mutante. Por exemplo, um mutante arg-, não cresce num meio seletivo que não contenha arginina enquanto o selvagem cresce. Em meio completo (MC), que é um meio não-seletivo porque contem todos os nutrientes, cresceriam tanto o mutante como o selvagem.

Cristina M. Bonato 109

Page 110: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Na genética bacteriana o fenótipo é designado por três letras, a primeira maiúscula e um super escrito + ou - denotando a presença ou ausência do fenótipo em questão e um s ou r denotando a sensibilidade ou resistência a antibióticos: Arg- ou Arg+; Strr ou Strs. O genótipo, por sua vez, é designado por letras minúsculas itálicas: arg- ou arg+ ; strr ou strs . Um número é adicionado para identificar o passo da via que está alterado: arg1, arg2, etc. A facilidade em se determinar o fenótipo de diferentes clones permitiu a descoberta da troca de informação genética entre bactérias.

Uma técnica conhecida como plaqueamento de réplicas (replica plating), desenvolvida por Lederberg & Lederberg, permite a rápida identificação de clones mutantes (Figura 10.2). Nesta técnica, as bactérias são plaqueadas em meio completo, não-seletivo, de forma a se obter colônias isoladas, as quais ocupam posições definidas no meio semi-sólido. Esta placa é pressionada sobre um pedaço de veludo esterilizado ao qual ficarão aderidas as células bacterianas de cada posição. Em seguida o veludo é pressionado sobre um meio seletivo, por exemplo, um meio seletivo contendo todos os requerimentos nutricionais exceto arginina. Após um dia de incubação compara-se o posicionamento das colônias nas duas placas. Se uma colônia cresceu na placa de meio completo e não cresceu na placa de meio seletivo, podemos inferir que a colônia que ocupava aquela posição, na placa original, era um mutante biossintético de arginina e será identificado como Arg -.

Figura 10. 2. Replica plating – Após a réplica é possivel identificar os mutantes porque não formam colônias na placa seletiva, mas formam no meio completo.

A transferência do material genético de uma bactéria para outra pode ocorrer por três vias: transformação, conjugação e transdução. Na transformação a célula bacteriana capta DNA livre diretamente do meio ambiente e o incorpora ao seu genoma via recombinação. Na conjugação, uma molécula de DNA autônoma e auto-transmissível é transferida para outra célula bacteriana via contato célula-célula. Na transdução, a informação genética é carregada de uma bactéria para outra por um vírus de bactéria (bacteriófago).

Em qualquer dos mecanismos utilizados, o DNA doador passará a integrar o genoma da célula receptora conferindo-lhe novas características fenotípicas.

Transformação

O fenômeno de transformação foi descoberto por Frederick Griffith (1928), quando investigava o modo de infecção da bactéria S. pneumoniae (vide O DNA é o material genético).

Na natureza, a transformação ocorre naturalmente quando moléculas de DNA estão disponíveis no meio e a célula bacteriana encontra-se num estado propício à captação destas

Cristina M. Bonato110

Page 111: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

moléculas. Bactérias aptas a serem transformadas são denominadas competentes. O estado de competência tem sido detectado em diferentes espécies bacterianas, tanto gram-positivas quanto gram-negativas. Em geral, as bactérias são induzidas ao estado fisiológico de competência, num período definido ao final do ciclo de crescimento, pouco antes da população atingir a fase estacionária, quando os nutrientes começam a escassear e a densidade populacional é alta (Figura 10.3). Este período coincide com um decréscimo ou bloqueio na duplicação do DNA.

A transferência do DNA só é geneticamente visível se modificar pelo menos um dos caracteres da célula receptora. Considere, por exemplo, dois mutantes da bactéria gram-positiva Bacillus subtilis: um mutante auxotrófico para leucina, sensível à estreptomicina (Strs Leu-) e um mutante resistente à estreptomicina, capaz de sintetizar leucina (Strr Leu+).

Misturando-se células competentes Strs Leu- com o DNA extraído de células doadoras Strr

Leu+, durante 60 minutos a 37oC, obtém-se células transformadas. Um volume conhecido da mistura é espalhado na superfície de meios seletivos para seleção dos transformantes. No meio seletivo contendo estreptomicina ou no meio seletivo sem leucina, só podem crescer transformantes, uma vez que a população competente é originalmente sensível à estreptomicina e não sintetiza leucina. Já em um meio não seletivo crescem todas as células, transformadas ou não transformadas (Tabela 10.1).

Tabela 10.1 - Transformação de células Strs Leu- em células Strr ou Leu+

Adição ao meio # clones crescendo sob condição seletiva

LEU STR A B (controle)

Fenótipos selecionados cel/ml F* cel/ml F*

Todos (total de células receptoras) + - 1.108 - 1.108 -

Leu+ - - 5.105 5.10-3 2.101 2.10-7

Strr + + 4.105 4.10-3 <1 <1.10-8

F* (Freqüência) corresponde ao no de recombinantes dividido pelo no total de células

A possibilidade de mutação espontânea na população de células competentes é checada nos mesmos meios seletivos, sem que estas células tenham sido previamente misturadas com o DNA extraído da célula doadora (coluna B). Os resultados obtidos comprovam que DNA exógeno foi captado pela célula competente e passou a integrar o seu genoma, uma vez que a freqüência de mutação espontânea é de 2 em 10 milhões para leucina ou menor do que 1 em 100 milhões para a

Cristina M. Bonato

Figura 10. 3. Desenvolvimento e eficiência da competência durante o ciclo de crescimento de B. subtilis. Concentração celular total (em azul). Concentração dos recombinantes para uma determinada marca (em vermelho).

111

Page 112: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

resistência à estreptomicina enquanto entre as células tratadas com DNA doador, a freqüência de bactérias com o genótipo da doadora é 4 ou 5 em 1.000 (4-5.10-3).

Mecanismo de Transformação

A passagem do DNA transformador de fora para dentro da célula se dá basicamente em 3 passos:

Captação do DNA doador, o qual será adsorvido a um complexo protéico (fator de competência) na superfície da célula receptora;

Transporte do DNA através da membrana; Integração do segmento de DNA exógeno, ao cromossomo bacteriano via recombinação

(Figura 10.4).

Em B. subtilis, uma bactéria gram-positiva, o DNA fita dupla presente no meio extracelular liga-se a receptores específicos na superfície da célula bacteriana. Uma vez ligado o DNA é digerido em fragmentos menores por endonucleases localizadas no espaço periplasmático, próximas ao sítio de ligação. O fragmento dupla fita (DSF, do inglês double-strand fragments) com ~15kb, atravessa a membrana celular onde estão localizadas exonucleases que digerem uma das fitas gerando uma fita simple (SSF, do inglês single-strand fragment) que é transportada para o citoplasma.

Uma vez no citoplasma, este segmento de DNA fita simples irá reconhecer uma região homóloga no cromossomo bacteriano e integrar-se a ele via recombinação. Como o cromossomo bacteriano está ligado à membrana, o DNA que acaba de atravessar a membrana é entregue diretamente ao seu alvo. No processo de integração ao cromossomo, regiões transitórias de heteroduplex são formadas. O DNA fita simples resultante é degradado por exonucleases bacterianas. A eficiência da transformação pode ser aumentada se as células forem submetidas a tratamentos químicos adequados. A presença de CaCl2, por exemplo, é importante na transformação de alguns tipos de bactérias.

Figura 10. 4. Entrada do DNA transformador em B. subtilis.

Atualmente são utilizadas técnicas que aumentam muito a eficiência de transformação como eletroporação e biobalística. Na eletroporação, uma corrente elétrica de alta voltagem atravessa uma suspensão bacteriana por mili segundos, criando poros nas parede e membrana celular.

Cristina M. Bonato112

Page 113: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Através deles, substâncias podem entrar ou sair de acordo com seu respectivo gradiente de concentração. Com isto, mesmo aquelas células, que sob condições naturais, não sofreriam transformação genética, podem agora ser transformadas uma vez que o DNA entra através destes poros artificiais. Na técnica de Biolística (de Biologia e Balística), o DNA que se quer introduzir na célula é adsorvido à micropartículas de tungstênio ou ouro as quais perfuram as células como projéteis ao serem impulsionadas por um equipamento tipo revólver. Esta técnica foi inicialmente desenvolvida para transformação de células vegetais.

Mapeamento Genético

Transformação pode ser, eventualmente, uma técnica conveniente de mapeamento genético. Por exemplo, se dois genes a+ e b+, utilizados como marcadores de transformação, posicionarem-se muito longe um do outro no cromossomo doador, dificilmente farão parte do mesmo fragmento cromossômico após ação das endonucleases (vide Mecanismo de transformação). Estando em fragmentos diferentes, dificilmente serão transferidos simultaneamente (cotransformação) para uma célula receptora a- b-. Se a probabilidade de transformação de uma marca é ~1.10-3, então a probabilidade de ocorrer transformação das duas marcas (a+ b+) seria, grosseiramente, 1. 10-6 (10-3 x 10-3) (vide Transformação). Por outro lado, se dois genes estão suficientemente próximos um do outro, participarão do mesmo fragmento doador e, neste caso, a freqüência de cotransformação é praticamente a de um único gene. O índice de co-transformação (r), é calculado como:

r = no. de duplos transformantes / no. de duplos + no. de simples

Quanto maior o índice r, mais próximos dois genes devem estar.

Se a e c são cotransformados; b e c são cotransformados; a e b não são cotransformados, então podemos supor que a ordem destes genes é a c b, sendo que a e b estão a uma distância tal que dificilmente participariam do mesmo fragmento de DNA. Assim, a análise sistemática de vários loci permite a obtenção de sua ordem relativa no cromossomo.

Conjugação

O processo de conjugação foi descoberto em 1946 na bactéria Escherichia coli, por Joshua Lederberg e Edward Tatum. Quando as bactérias conjugam, o DNA de uma célula doadora é transferido para uma célula receptora através de contato célula-célula, sob o controle de um conjunto de genes que confere ao doador a capacidade de transferir DNA. Este conjunto de genes conhecidos como tra, encontra-se em uma molécula circular de DNA denominada fator de fertilidade ou fator F. Tais moléculas circulares de DNA comportam-se como mini cromossomos. Replicam-se independente do cromossomo bacteriano, têm aproximadamente 100 kb e, além dos genes tra contêm outros genes e elementos de seqüência particulares, importantes na sua manutenção e distribuição nas células. O fator F é membro de uma ampla classe de moléculas de DNA extracromossômicas, auto-replicativas, independentes do cromossomo bacteriano, denominadas plasmídios.

Cristina M. Bonato 113

Page 114: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Células com plamídio F são denominadas F+ e sem plasmídio F são denominadas F-. Toda célula F+ é um doador potencial porque pode transferir DNA para uma célula receptora.

Nas bactérias gram-negativas, células F+

produzem pilus sexual, que é um filamento protéico longo e flexível, constituído de monômeros de pilina. O pilus sexual atraca na célula F- e mantém as duas unidas, propiciando a transferência do DNA, uma vez que ao se retrair o pilus aproxima completamente as duas células. Um poro se forma no local de junção das duas membranas.

Tais acontecimentos sinalizam uma endonuclease que faz um corte numa das fitas do DNA plasmidial, no sítio oriT (origem de transferência). Isto permitirá a transferência e replicação concomitante do fator F, de sorte que

a célula receptora se transformará em F+ enquanto a doadorá continuará F+.

Plasmídios

Os plasmídios são moléculas de DNA dupla fita, com replicação independente do cromossomo bacteriano, sendo encontrados em quase todos os tipos de bactérias. Os diferentes tipos de plasmídios apresentam tamanhos variados, de alguns milhares a centenas de milhares de pares de bases. Podem ser circulares ou lineares.

Da mesma forma que os cromossomos, os plasmídios codificam proteínas e moléculas de RNA, replicam durante o crescimento celular e as cópias replicadas são distribuídas entre as células filhas no momento da divisão celular. É interessante observar que os genes plasmidiais não codificam funções essenciais ao crescimento celular, todavia, seus produtos podem beneficiar a célula em circunstâncias especiais.

Por, exemplo, os plamídios podem codificar proteínas que confiram à célula hospedeira, resistência a antibióticos e, neste caso são denominados fatores R. Já os plasmídios ColE1 carregam um gene para produção de colicina, que é uma bacteriocina que mata as bactérias que não albergam o mesmo plasmídio. Em Agrobacterium tumefaciens são encontrados plasmídios Ti (do inglês, Tumor iniciation), que carregam genes para iniciação do tumor em plantas (Tabela 10.2).

Atualmente a nomenclatura para plasmídios está padronizada, mesmo porque muitos destes plamídios originais foram extensivamente modificados para sua utilização como vetores de clonagem. Na nova nomenclatura, cada tipo de plasmídio recebe letras e números como as linhagens bacterianas. Assim, a letra minúscula p refere-se a plasmídio e antecede letras maiúsculas que descrevem o plasmídio ou são as iniciais de quem os construiu. Estas letras são acompanhadas de números que identificam uma construção particular. Por exemplo, um plasmídio muito utilizado como vetor de clonagem é o pBR322, construído por Bolivar e Rodriguez.

Cristina M. Bonato

Figura 10. 5. O sítio oriT é clivado por uma endonuclease codificada por um dos genes tra(violeta) do plasmídio. oriv, é a origem de replicação do vetor; IS são seqüências de inserção.

114

Page 115: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Tabela 10. 2. Alguns plasmídios de ocorrência natural e seus traços característicos

Plamídio Característica Fonte original

ColE1 Bacteriocina que mata E. coli E. coli

Tol Degradação de tolueno e ácido benzóico Pseusomonas putida

Ti Iniciação de tumor em plantas Agrobacterium tumefaciens

pSym Nodulação nas raízes de plantas leguminosas Rhizobium meliloti

SCP1 Biossíntese do antibiótico metilenomicina Streptomyces coelicolor

RK2Resistência à ampicilina, tetraciclina e kanami-cina

Klebsiella aerogenes

pJP4 Degradação de 2,4-D (dicloroacetato) Alcaligenes eutrophus

Assim como todo replicon, os plasmídios também possuem sua origem de replicação (Origens de replicação). A origem de replicação dos plasmídios é denominada oriV (origem do vetor) e deve ser reconhecida por proteínas que participam da maquinaria de iniciação da replicação. Algumas destas proteínas são codificadas pelo cromossomo da célula hospedeira. Logo, a existência de um plasmídio dentro de um determinado hospedeiro dependeria deste reconhecimento. Em função disto, alguns plasmídios tem uma faixa restrita de hospedeiros onde podem se duplicar, como é o caso de ColE1 e pBR322. Outros plasmídios, como o RK2, replicam numa ampla faixa de hospedeiros porque eles próprios codificam as proteínas que necessitam para iniciação da replicação, daí sua independência em relação ao hospedeiro que os alberga.

Dois mecanismos podem ser utilizados na replicação dos diferentes tipos de plasmídios: a replicação em teta (q) e a replicação do círculo rolante. O mecanismo q é o mais comum, sendo utilizado pelos cromossomos bacterianos e por plasmídios como ColE1, RK2, F e P1 (Movimentação bidirecional). Já o mecanismo de círculo rolante foi identificado nos plasmídios pUB110 e pC194, de Staphylococcus aureus e pIJ101 de Streptomyces lividans (Modos alternativos de replicação).

Alguns plasmídios, como ColE1, apresentam um alto número de cópias dentro da bactéria enquanto outros, como o plasmídio F têm apenas 1-2 cópias/célula. Plasmídios com alto número de cópias são denominados plasmídios relaxados (relaxed plasmids) e os com baixo número são denominados plasmídios rígidos (stringent plasmids).

Uma célula bacteriana pode conviver com plasmídios de tipos diferentes durante muitas gerações. Mas, às vêzes, alguns tipos não podem coexistir. Este fenômeno é denominado incompatibilidade plasmidial. Plasmídios que não podem coexistir são membros de um mesmo grupo de incompatibilidade ou grupo Inc. Portanto, só coexistem plasmídios de grupos Inc diferentes. Assim, RP4 e RK2, do grupo IncP não coexistem, mas podem coexistir com RSF1010, do grupo IncQ.

Tanto em leveduras como em fungos filamentosos já foram detectados plasmídios. Na levedura S. cerevisiae é encontrado um plamídio de DNA circular dupla fita com 6.318pb, ~2mm de comprimento, daí ser designado 2-micron. Contem uma única origem de replicação (ARS, do inglês autonomous replication sequence). Cada célula haplóide pode albergar 60-100 cópias do plasmídio; o plasmídio codifica um sistema de partição que promove a dispersão aleatória, entre mãe e filha, das múltiplas cópias da molécula, seja durante a mitose ou meiose. No plasmídio ainda são codificados genes que catalisam recombinações sítio-específicas e regulação da expressão gênica. As moléculas do plasmídio 2-micron residem no núcleo e são empacotadas como cromatina. Entre os Archaea, os plasmídios estão amplamente distribuídos nos diferentes grupos.

Cristina M. Bonato 115

Page 116: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Os plasmídios, transformaram-se numa arma poderosa na tecnologia do DNA recombinante uma vez que são veículos eficazes no transporte de genes oriundos de organismos próximos ou distantes na escala evolutiva. Além disto, sua autonomia replicativa permite a amplificação, em larga escala, da informação que carregam.

Mecanismo de conjugação

O mecanismo de transferência do plasmídio de uma célula F+ para uma F- está acoplado à duplicação da molécula pelo mecanismo de círculo rolante (Modos alternativos de replicação).

Um corte, feito em apenas uma das fitas no sítio oriT, gera os terminais 3'OH e 5'P. O terminal 3' OH livre é utilizado como primer para síntese contínua em torno do círculo. Conforme o terminal 3' cresce, o terminal 5' vai sendo deslocado do círculo e direcionado para o poro que se formou após contato das células F+ e F-. O processo de corte da fita simples e preparação da transferência do terminal 5' é denominado mobilização(Figura 10.6).

O terminal 5'P é utilizado como molde para a síntese descontínua que se processa na célula receptora. A replicação inicia-se assim que o terminal 5' ingressa na célula receptora porque juntamente com o DNA é transferida a primase codificada pelo plasmídio.

Figura 10. 6. Mecanismo de transferência do DNA durante a conjugação. O cromossomo bacteriano não está representado no esquema. O corte de uma das fitas em oriT libera terminais 3'OH e 5'P. A adição de nucleotídios no terminal 3'OH desloca o terminal 5'P que invade a célula F -. Na célula receptora o terminal 5' serve de molde para síntese descontínua do DNA. Os círculos se fecham e o par conjugante se separa. Agora, as duas células são F+.

Após completa transferência e replicação da molécula, os terminais dos DNAs replicados são religados na região oriT, recompondo o círculo. A seqüência oriT do plasmídio F possui <300pb, é rica em AT e contem seqüências repetidas invertidas.

O processo de transferência é unidirecional. Uma linhagem serve de doadora do material genético e a outra de receptora.

Ao término do processo uma cópia permanece no doador F+ e outra se instala no novo hospedeiro que se torna F+, comportando-se como doador daqui para a frente.

O contato celular para transferência do fator F só é permitido entre uma célula F+ e outra F-. Entre duas células F+ o contato é muito menos eficiente. A transferência completa de F requer de 2 a 3 minutos.

Cristina M. Bonato116

Page 117: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

A unidirecionalidade da transferência foi demonstrada por William Hayes em 1952 e em 1953 quando relata a existência de linhagens Hfr. Linhagens Hfr propiciam alta freqüência de recombinação, mediada por plamídio, entre genes bacterianos cromossômicos. Em artigo de revisão publicado em 1956, juntamente com Wollman e François Jacob, define os diferentes passos envolvidos nos processos de conjugação e recombinação em E. coli K-12.

Células Hfr

A transferência de genes cromossômicos de uma bactéria para outra, resultando em recombinação, pode ser mediada pelo pelo plasmídio F. Ocasionalmente, o plasmídio F abandona sua vida livre e integra-se ao cromossomo da bactéria hospedeira (Figura 10.7).

A integração de F é um evento raro, mas células com F integrado podem ser isoladas e mantidas, estavelmente, neste estado. A integração do plasmídio no cromossomo hospedeiro dá-se via elementos de inserção.

Uma vez que existe homologia entre estes pequenos segmentos, pode ocorrer recombinação entre o IS cromossômico e o IS plasmidial. Após integração, o plasmídio F ficará ladeado por cópias do elemento IS que participou da integração. Plasmídios capazes de existirem tanto no estado livre como no integrado são denominados epissomos.

Figura 10. 7. Inserção do plas-mídio F via recombinação ho-mologa entre elementos IS do plasmídio e do cromossomo bac-teriano, originando uma célula Hfr. A integração de F ocorreu entre os loci a e b.

Células com o F integrado, ao conjugarem, carregam consigo genes cromossômicos para a hospedeira F -. Uma vez dentro da célula F -, o segmento de DNA transferido pode recombinar com a região correspondente do cromossomo da receptora. As células das linhagens que conseguem transferir, com eficiência, seu cromossomo via plasmídio F integrado são denominadas células Hfr (do inglês, high frequency of recombination).

Hfr X F-

O processo de conjugação de Hfr x F- tem aspectos semelhantes ao de F+ x F-, mas apresenta particularidades (Figura 10.8):

Cristina M. Bonato 117

Page 118: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

A transferência do DNA de uma célula Hfr para uma F- inicia-se com um corte na região oriT, situada numa posição mediana do plasmídio integrado;

A primeira porção do DNA a ser transferida é o terminal 5' do F, seguido dos genes cromossômicos e, por último, da outra porção do F;

A transferência do cromossomo inteiro é um evento raríssimo e o par acasalante separa-se antes disto, mas dezenas de marcas cromossômicas chegam à célula F-;

O segmento linear transferido se replica porém não se circulariza; Num curto lapso de tempo a célula F – possui duas cópias de cada um dos loci transferidos; O segmento replicado (exogenoto) pode incorporar-se ao cromossomo da célula receptora

(endogenoto) via recombinação com regiões homólogas; O DNA não incorporado é degradado; A célula receptora torna-se um recombinante, porém continua F-, pois não recebeu o

plasmídio integral.

Figura 10. 8. Transferência de DNA cromossômico via plasmídio integrado.

Observando Recombinantes

Foi observando o surgimento de recombinantes que Lederberg & Tatum (1946) descobriram o fenômeno de transferência de informação genética entre células bacterianas. Estudavam dois mutantes auxotróficos: a linhagem A, Met - e Bio - e a linhagem B, Thr -, Leu - e Thi -. Logo, nenhuma das duas crescia em meio mínimo (MM).

Cristina M. Bonato118

Page 119: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Quando misturavam A (met-, bio-, thr+, leu+ e thi+) e B (met+, bio+, thr-, leu- e thi-), durante algumas horas e depois plaqueavam em MM, algumas colônias se desenvolviam. Portanto, estas células deviam ser prototróficas (met+, bio+, thr+, leu+ e thi+). A freqüência era de 1.10-7, ou seja, uma prototrófica em cada 10.000.000 de auxotróficas.

A possibilidade de mutação foi descartada por duas razões:

a) linhagens A ou B isoladamente não produziam colônias prototróficas em MM; b) no mínimo duas mutações seriam requeridas para surgirem colônias prototróficas; como a freqüência de mutação é ~1.10-7, a de duas mutações seria ~1.10-14, muito menor do que a freqüência com que apareciam os recombinantes.

Os pesquisadores concluíram que deveria estar passando informação genética de uma célula para outra (Figura 10.9 A).

Figura 10. 9. Transferência de informação genética entre mutantes auxotróficos. A. As placas contendo MM foram inoculadas com 108 células. Apenas nas placas que rece-beram a cultura mista houve formação de colônias, neces-sariamente prototróficas. B. No tubo em U, pressão e sucção alternadas forçam o li-quido e macromoléculas atra-vessarem o filtro que separa as duas culturas, mas recom-binantes não são gerados.

O fato de que as células precisavam entrar em contato uma com a outra para transferir informação foi demonstrado por Bernard Davis ao construir um tubo em U, onde os 2 braços estavam isolados por um filtro (Figura 10.9 B). Com este experimento ele eliminou, também, a possibilidade de estar ocorrendo transformação. Culturas de linhagens diferentes eram colocadas em cada um dos braços do tubo. Os poros do filtro não permitiam a passagem de bactérias e nenhum recombinante cresceu nas placas de MM, logo a transferência de informação fora bloqueada. Portanto, o contato físico entre as células era fundamental para transferência da informação genética. Este processo foi denominado conjugação.

A partir daí, o estabelecimento de linhagens puras Hfr permitiu que o processo de transferência se realizasse com uma eficiência muito maior. Analisando-se os recombinantes produzidos pelo acasalamento Hfr x F-, foi possível construir o mapa genético do cromossomo bacteriano.

Mapa Genético Via Conjugação

O mapa genético do cromossomo é construído de acordo com a ordem em que os genes são transferidos. Para isto interrompe-se a conjugação em tempos definidos. A interrupção pode ser feita simplesmente com uma agitação vigorosa do tubo de cultura.

Cristina M. Bonato 119

Page 120: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Quanto mais longe uma marca estiver da origem de transferência, mais tempo ela demorará para ser transferida. As que estão bem próximas ao oriT serão as primeiras a serem transferidas. Portanto existe um gradiente de transferência.

Considere, por exemplo, o acasalamento Hfr a+, b+, c+ x F- a-, b-, c-, strr (Figura 10.10).

Após misturar as duas linhagens, a conjugação foi interrompida aos 10, 15, 20 e 30 minutos e amostras dos diferentes tempos foram plaqueadas em meio mínimo (MM) contendo estreptomicina (Str) e todos os outros componentes menos um, de sorte que apenas recombinantes pudessem formar colônias. Assim, os meios seletivos devem conter:

a) MM + Str + A + B a+ b+ c+

b) MM + Str + A + C % recombinantes 25 20 20

c) MM + Str + B + C tempo de entrada 9' 18' 25'

As colônias que crescerem em a) serão F- strr c+; as que crescerem em b) serão F- strr b+ ; as que crescerem em c) serão F- strr a+. O número de recombinantes, nos diferentes tempos, em cada uma das placas com meio seletivo, permite a construção de um gráfico (Figura 10.10).

Figura 10. 10. A mistura de uma linhagem Hfr com uma F-, com marcas genéticas diferentes, gera recombinantes identificados em meios seletivos. O gráfico mostra que o número de reco-mbinantes aumenta com o tempo de contato entre as células e que existe um gradiente de transfe-rência destas marcas.

O gráfico nos diz que o número de recombinantes aumenta com o tempo de acasalamento e que para cada marca existe um período (tempo de entrada), antes do qual nenhum recombinante é detectado. Por exemplo, recombinantes c+ só são detectados aos 25' de conjugação enquanto recombinantes a+ já estavam presentes nos 10 primeiros minutos. Isto significa que:

Nem todas as células iniciam a conjugação ao mesmo tempo; A transferência inicia-se num ponto particular do cromossomo Hfr (oriT); Os genes são linearmente transferidos do doador ao receptor; As distâncias genéticas entre as marcas podem ser medidas pelos minutos que decorrem

entre seus tempos de entrada.

O mapa genético, onde a unidade de distância é o minuto, correspondente ao gráfico acima, seria:

A comparação de mapas construídos com diferentes marcas e linhagens de E. coli, permitiu concluir que o plasmídio podia se integrar em pontos diferentes do

Cristina M. Bonato120

Page 121: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

cromossomo e que o cromossomo de E. coli era circular. Cerca de 1500 genes de E. coli foram assim mapeados. A técnica de acasalamento interrompido para mapear genes bacterianos foi desenvolvida por Jacob & Wollman, no Instituto Pasteur, na década de 60. A Tabela 10.3 mostra a ordem de transferência dos genes de alguns recombinantes de E. coli analisados por estes pesquisadores.

Tabela 10. 3. Tranferência de informação de diferentes tipos de Hfrs.

Tipos de Hfr Ordem de transferência das marcas genéticas

1 Pro Lac Ade Gal Try His Sm Iso

2 Iso Sm His Try Gal Ade Lac Pro

3 Pro Iso Sm His Try Gal Ade Lac

4 Ade Lac Pro Iso Sm His Try Gal

5 Iso Pro Lac Ade Gal Try His Sm

6 His Try Gal Ade Lac Pro Iso Sm

7 Sm Iso Pro Lac Ade Gal Try His

Se você se detiver nesta tabela por alguns minutos vai perceber que a ordem relativa dos genes é sempre a mesma. O que difere é o ponto de origem e a direção da transformação.

Diplóides Parciais

Eventualmente, o fator F integrado é excisado do cromossomo via recombinação entre as mesmas seqüências envolvidas na inserção. Todavia, pode acontecer que o processo de excisão não seja exatamente o reverso da inserção. Neste caso, junto com os genes plasmidiais podem ser excisados genes cromossômicos. Plasmídios que se encontram na forma livre carregando um segmento do DNA cromossômico são denominados plasmídios F' (F primo).

Quando um plasmídio F’ é transferido para uma célula F - ele poderá continuar livre no citoplasma e, consequentemente, a célula receptora se tornará diplóide, uma vez que apresentará dois alelos para os loci gênicos transferidos: um contido no plasmídio F' e outro, no cromossomo da F-. É preciso lembrar que apenas um pequeno segmento cromossômico foi excisado juntamente com o plasmídio do cromossomo Hfr. Portanto os diplóides acima referidos são diplóides parciais ou merozigotos, uma vez que a diploidia diz respeito apenas àqueles loci gênicos (Figura 10.11). A passagem do plasmídio F' para uma célula F - é denominada sexdução ou F-dução. A utilização de diplóides parciais é muito útil na verificação de dominância e dosagem gênica.

Cristina M. Bonato 121

Page 122: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 10. 11. Diplóide parcial do operon lac

Transdução

No processo de transdução o DNA bacteriano é transferido de uma célula bacteriana para outra por um vírus. Vírus que infectam bactérias são denominados bacteriófagos ou simplesmente fagos. O termo bacteriófago significa, literalmente, "comedor de bactéria", uma vez que se reproduzem às expensas da bactéria hospedeira a qual, normalmente, não sobrevive ao processo.

Os fagos são estruturas especiais e simples constituídas, de uma molécula de ácido nucléico (DNA ou RNA), envolvida por uma capa protéica protetora. A molécula de ácido nucléico contem a informação genética do fago, a qual será transmitida às novas gerações de partículas fágicas. Os genomas dos fagos são replicons possuindo, portanto, uma origem de replicação. Todavia, para se reproduzirem precisam infectar uma célula, agindo como parasitas celulares. Em geral as células apresentam sítios receptores específicos para determinados vírus de sorte que a interação célula-vírus é específica. Uma célula que permite infeção por um determinado vírus é denominada célula hospedeira.

A capa protetora do fago, denominada capsídeo, é constituída de uma pequena variedade de proteínas, específicas para cada tipo de partícula viral. O volume interno do capsídeo, na maioria das vezes, é apenas levemente superior ao volume ocupado pelo próprio ácido nucléico. Em geral, o capsídeo é construído como uma concha vazia e o ácido nucléico é inserido posteriormente, condensando-se comforme vai entrando (empacotamento). Os genomas dos fagos são lineares, via de regra. No caso do T4, por exemplo, o comprimento do genoma do fago é 1.000 vezes maior que o diâmetro do capsídeo o que exige um empacotamento considerável da molécula.

Ao infectar a bactéria o fago injeta uma molécula de ácido nucléico dentro dela, livrando-se da capa protetora. A molécula invasora será utilizada como molde para a síntese de mRNAs virais e também para a síntese de novos genomas virais. Normalmente, quando replicam, os genomas fágicos adotam a forma circular. A tradução dos mRNAs virais, utilizando a maquinaria da bactéria, leva à produção de uma série de enzimas e proteínas estruturais envolvidas no ciclo de desenvolvimento do fago.

A infecção da bactéria por fagos pode levar a sua lise ou não, dependendo do tipo de fago que a infecta. Se, ao infectar a bactéria, o genoma do fago replica-se vegetativamente originado

Cristina M. Bonato122

Page 123: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

novas partículas fágicas, dizemos que instalou-se o ciclo lítico que resultará na lise da célula hospedeira. Se, ao infectar a bactéria o genoma do fago integrar-se ao genoma do hospedeiro e aí permanecer silencioso por longo tempo, duplicando-se juntamente com o cromossomo do hospedeiro, sem lisar a célula, instalou-se o ciclo lisogênico.

Ciclo Lítico

Dizemos que houve infecção lítica quando novas partículas virais são produzidas. A seqüência de eventos no ciclo lítico pode ser resumida em:

Aderência do fago à superfície da bactéria seguida de injeção do DNA no citoplasma bacteriano;

Transcrição dos genes virais; Tradução destas mensagens utilizando-se a maquinaria do hospedeiro; Replicação do DNA do fago; Montagem dos capsídeos; Empacotamento do DNA dentro do capsídeo; Lise da célula hospedeira; Liberação de dezenas de partículas virais (Figura 10.12).

Figura 10. 12. Infec-ção de E.coli pelo fago T4. O fago reco-nhece o receptor es-pecífico na superfície da bactéria. O ácido nucleico do fago é utilizado como molde para duplicação e pa-ra transcrição dos ge-nes virais que codi-ficam as proteínas da cabeça, cauda e fi-bras.

As novas partículas liberadas infectam as células bacterianas vizinhas. Este ciclo se repete inúmeras vezes redundando na formação de zonas claras numa camada de bactérias que cobrem um meio de cultivo semi-sólido. Estas zonas claras são denominadas placas de lise e refletem a destruição das bactérias, localizadas naquela região, pela progênie de fagos liberados consecutivamente a partir de uma bactéria inicialmente infectada. Cada tipo de fago apresenta uma morfologia de placa de lise, típica. A contagem das placas permite que se calcule a concentração de fagos na suspensão inicial.

Diferenças de morfologia refletem mutações em dois loci. Um dos loci interfere na lise da bactéria e o outro, na compatibilidade com o hospedeiro. Mutantes no locus de lise podem lisar a bactéria mais rápidamente que o selvagem (+), produzindo placas de lise maiores. Mutação neste locus é denominada r (lise rápida). Linhagens selvagens do fago infectam E.coli, mas não infectam uma variante resistente da bactéria. Todavia, mutantes do fago são capazes de infectar a variante resistente e a selvagem. Mutação neste locus é denominada h. Mutantes h podem lisar os dois tipos de bactérias e produzem placas de lise bem claras enquanto o selvagem h+ produz placas de lise

Cristina M. Bonato 123

Page 124: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

turvas porque só consegue lisar um dos tipos de bactérias que recobrem a superfície da placa (Figura 10.13).

Figura 10. 13. Quatro tipos de placas produzidas por uma mistura de formas mutantes e selvagem do fago T2, sobre uma cobertura de dois tipos de E. coli. Selvagens h+r+ produzem placas pequenas e turvas; recombinantes hr+ produzem placas claras e pequenas; recombinantes h+r, placas turvas e grandes; duplo mutante hr, placas claras e grandes.

Ciclo Lisogênico

Dizemos que houve infecção lisogênica quando o DNA do fago integra-se ao cromossomo do hospedeiro. Integrado não tem replicação autônoma. Duplica-se a cada divisão celular da bactéria, como parte integrante do cromossomo hospedeiro. Esta forma de perpetuação do genoma do fago não implica nem na morte do hospedeiro nem na liberação de partículas virais, uma vez que a expressão da maioria dos genes virais estará reprimida.

O genoma viral integrado e inativo é denominado profago. Este tipo de interação fago-hospedeiro é denominado lisogenia e as células hospedeiras são denominadas lisogênicas. Fagos capazes de estabelecerem este tipo de interação com a célula hospedeira são denominados fagos temperados. O fago lambda (l) é um exemplo de fago temperado (Figura 10.14). O fago l insere-se no genoma bacteriano via crossing-over. O ponto de crossing-over é entre o sítio de ligação do l e um sítio do cromossomo bacteriano localizado entre os genes gal e bio.

Figura 10. 14. Ciclo lisogênico. Fagos temperados como o bacteriófago pode optar pelo ciclo lítico ou lisogênico. O desenvolvimento lisogênico permite a integração do genoma do fago ao cromossomo bac-teriano por ação de recombinases codificadas pelo genoma do próprio fago. Na condição de profago não provocará qualquer dano à célula hospedeira.

Ocasionalmente as linhagens lisogênicas podem produzir fagos infectivos. Agentes agressivos como raios ultra violeta (UV) e certos produtos químicos podem induzir o profago, ou seja, provocar sua excisão do cromossomo bacteriano. A conseqüência disto será a lise celular. Por esta razão, bactérias que contem o DNA do fago integrado a seu cromossomo recebem o nome de lisogênicas que significa, literalmente, "dar origem à lise". O fenômeno de lisogenia foi descoberto por André Lwoff em meados da década de 40.

Em fagos temperados, a opção entre a via lítica e a lisogênica de desenvolvimento é governada por proteínas codificadas pelo genoma do fago e da bactéria assim como pelas

Cristina M. Bonato124

Page 125: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

condições de infecção. Dependendo dos estados escolhidos, lítico ou lisogênico, diferentes conjuntos gênicos serão transcritos a partir do genoma viral. Uma vez estabelecido o padrão de transcrição, ele é estavelmente mantido. Assim, por exemplo, o fago l integrado poderá permanecer latente no genoma hospedeiro de E. coli por milhares de gerações celulares. Bactérias lisogênicas são imunes à infecção por outras partículas virais do mesmo tipo, ou seja, se uma bactéria lisogênica for infectada por um fago de mesmo tipo ele não poderá se multiplicar.

Os bacteriófagos têm um importante papel na transferência de genes entre bactérias. Às vezes, na excisão, genes bacterianos, adjacentes ao sítio de integração, são carregados juntos e serão encapsulados nas partículas fágicas. Outras vezes, o capsídeo engloba fragmentos do DNA cromossômico provenientes de qualquer região do cromossomo bacteriano. Em ambos os casos, informação bacteriana poderá ser carregada para outra célula bacteriana por infecção fágica. O processo de transferência de DNA bacteriano de uma célula a outra via fago é denominado transdução. Partículas fágicas que transferem DNA cromossômico de uma bactéria a outra são denominadas transdutoras. Dois tipos de fagos transdutores são conhecidos: transdutores generalizados e transdutores especializados.

O fago P1 é um exemplo de transdutor generalizado e o fago lambda (l) é um exemplo de transdutor especializado. Ambos infectam E. coli.

Transdução Especializada

Na transdução especializada, o bacteriófago l é integrado e excisado do cromossomo bacteriano pela ação de endonucleases específicas que reconhecem elementos de seqüência típicos, tanto no cromossomo bacteriano como no cromossomo do fago e catalisam as reações de recombinação entre estas moléculas. As seqüências envolvidas no reconhecimento e permuta, constituem o sítio att (do inglês, attachment) presente no fago, attP e na bactéria, attB. Uma pequena seqüência de homologia com ~15pb (O) é flanqueada por segmentos não similares, P e P’ no fago e B e B’ na bactéria. Do evento de permuta participam apenas os pares de bases assinalados em azul na seqüência O: GCTTT TTTATAC TAA. No cromossomo bacteriano este sítio encontra-se entre os operons gal e bio.

O evento de integração do fago ao cromossomo bacteriano depende da recombinase Int (integrase) do fago. O evento de excisão também depende de outra recombinase codificada pelo fago, a recombinase Xis. Este sistema de recombinação que envolve um sítio específico em cada uma das moléculas é denominado recombinação sítio-específica.

O processo de transdução especializada é análogo ao de sexdução uma vez que ambos dependem de um erro durante a excisão de uma molécula integrada ao cromossomo do hospedeiro. Na sexdução o erro ocorre durante a excisão do plasmídio F enquanto na transdução especializada o erro ocorre durante a excisão do profago.

As descobertas dos processos de transferência de informação genética em bactérias associadas ao conhecimento da fisiologia bacteriana, bastante desenvolvida no Instituto Pasteur de Paris, permitiram um enorme avanço no conhecimento da genética bacteriana: centenas de mutantes em diferentes vias metabólicas foram isolados; foi possível determinar as relações de dominância e recessividade entre alelos, utilizando-se diplóides parciais; foi possível mapear os genes ao longo dos cromossomos e, finalmente, foi possível se estabelecer um modelo acerca de como a expressão destes genes era regulada. O desenvolvimento deste modelo culminou com o trabalho publicado por Jacob & Monod (1961) onde os princípios básicos da regulação gênica em

Cristina M. Bonato 125

Page 126: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

bactérias são claramente enunciados e se constituiram num suporte vigoroso para as futuras investigações no campo do controle gênico.

Guia de Estudo

Um experimento de transformação em bactérias foi realizado com uma linhagem doadora que é resistente às drogas, A,B,C e D e com uma linhagem receptora sensível a todas as quatro drogas. Após transformação, as células foram distribuídas em 4 placas contendo várias combinações das drogas e incubadas para desenvolvimento de colônias. Resultados na tabela abaixo.

Drogas adicionadas

Número de colônias

Drogas adicionadas

Número de colônias

nenhuma 10.000 BC 51

A 1156 BD 49

B 1148 CD 786

C 1161 ABC 30

D 1139 ABD 42

AB 46 ACD 630

AC 640 BCD 36

AD 942 ABCD 30

a. Um dos genes está obviamente mais distante do que os outros três, os quais parecem estar intimamente ligados. Qual é o gene mais distante?

b. Qual seria a ordem provável dos três genes intimamente ligados? (Griffiths et al., 1993 - Genetic Analysis, cap. 10, no. 16).

Quatro linhagens de E.coli com genótipo a+b- foram marcadas 1,2,3, e 4. Quatro linhagens com genótipo a-b+ foram marcadas 5,6,7,8. Os dois genótipos foram misturados em todas as combinações possíveis e, após incubação, espalhados para determinar a frequência de recombinantes a+b+. Obteve-se o resultado abaixo, onde M = muitos recombinantes; L = poucos recombinantes; 0 = nenhum recombinante. (Griffiths et al., 1993 - Genetic Analysis, cap. 10, no. 3)

1 2 3 4

5 0 M M 0

6 0 M M 0

7 L 0 0 M

8 0 L L 0

Baseado nestes resultados determine o tipo sexual de cada linhagem (Hfr, F+ ou F-).

Cristina M. Bonato126

Page 127: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

O DNA de uma linhagem prototrófica de E. coli foi isolado e usado para transformar linhagens auxotróficas deficientes na síntese de purinas (pirB-), pirimidinas (pyrC-) e do aminoácido triptofno (trp-). O triptofano foi usado como marcador para determinar se a transformação ocorrera (marca seletiva). Qual a ordem dos genes e a freqüência de co-transformação, considerando-se os dados abaixo? (Tamarin,1996)

trp+ pyrC + purB + 86

trp+ pyrC + purB - 04

trp+ pyrC – purB + 67

trp+ pyrC – purB - 14

Uma linhagem bacteriana que é lys+ his+ val+ é usada como doadora e lys- his- val- , como receptora. Transformantes iniciais foram isolados em meio mínimo + histidina + valina.

a. Que genótipos crescerão neste meio? b. Estas colônias foram replicadas em MM + histidina e 75% das colônias originais cresceram.

Quais os genótipos das colônias que cresceram neste meio? c. As colônias originais também foram replicadas em MM + valina e 6% cresceram. Qual o

genótipo possível destas? d. Finalmente, as colônias originais foram replicadas em MM. Não cresceu nada. Baseado nestas

informações, que genótipos cresceriam em MM + histidina e em MM + valina? e. Qual dos dois genes está mais próximo de lys? f. A transformação original foi repetida só que o plaqueamento original foi feito em MM +

lisina + histidina. Formaram-se 50 colônias. As colônias foram replicadas para determinar seus genótipos e se obeteve os seguintes dados:

val+ his+ lys+ 0

val+ his- lys+ 37

val+ his+ lys- 03

g. Baseado nestes dados, qual a possível ordem dos genes? (Tamarin, 1996)

O que é recombinação sítio-específica. Exemplifique.

Como se dá a inserção do plasmídio F no cromossomo do hospedeiro?

Como funciona a técnica de "replica-plating"?

Quais as diferenças e semelhanças entre os processos de conjugação, transformação e transdução?

O que é um plasmídio? Que exemplos você conhece?

Quais as funções dos genes tra?

Porque o plasmídio F é um mutante que expressa constitutivamente os genes tra?

O que significa competência?

O que são elementos de inserção (IS)?

O que é uma placa de lise?

Cristina M. Bonato 127

Page 128: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Capítulo 11 – TECNOLOGIA DO DNA RECOMBINANTE

Visão Geral

Do final do século XIX até meados do século XX, o estudo da genética foi baseado em inferências indiretas acerca dos genes, pautadas nas razões fenotípicas resultantes de cruzamentos controlados, como inicialmente proposto por Mendel. O estabelecimento de uma correlação entre mutações específicas e proteínas singulares, assim como a descoberta do código genético e da estrutura do DNA, constituíram um avanço considerável no entendimento da Genética. Todavia, até então, nenhum gene havia sido isolado nem uma seqüência de nucleotídios examinada diretamente. Até os anos 70, todas as manipulações feitas com material biológico, para se obter organismos com novos genótipos e fenótipos fundamentavam-se nos conceitos de mutação e recombinação e consistiam basicamente em:

a) Tratamento com agentes mutagênicos que induziam o surgimento de mutantes na população.

b) Cruzamento entre mutantes diferentes permitindo o isolamento de recombinantes.

Estes processos são essencialmente aleatórios e a identificação de recombinantes com as características desejadas, entre todos os produzidos , exige procedimentos seletivos, às vezes, bastante complexos.

A partir da década de 70 têm sido desenvolvidas várias técnicas onde o genótipo de um organismo pode ser modificado diretamente, de maneira pré-determinada. O conjunto destas técnicas recebeu o nome de Tecnologia do DNA Recombinante, ou Engenharia Genética ou Clonagem Gênica. Neste tipo de manipulação as mutações e recombinações são realizadas "in vitro". Moléculas de DNA provenientes de dois organismos diferentes são isoladas e cortadas em fragmentos menores utilizando-se enzimas especiais. Os fragmentos dos dois tipos são então unidos na combinação desejada e reintroduzidos no organismo vivo. Assim, os fundamentos continuam os mesmo dos cruzamentos tradicionalmente praticados pelo ser humano em plantas e animais, mas aumentam a eficiência na construção dos tipos genéticos desejáveis e permitem, ao geneticista, criar genótipos novos que seriam impossíveis utilizando as técnicas de genética clássica.

O enorme interesse na tecnologia do DNA recombinante é motivado pela grande variedade de aplicações, tais como:

Isolamento de um gene, de parte de um gene ou de uma região genômica particular;

Cristina M. Bonato128

Page 129: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Produção de um RNA ou proteína específica em quantidades muito maiores do que se obteria por métodos convencionais;

Eficiência cada vez maior na produção de compostos orgânicos de interesse, tais como enzimas e drogas;

Criação de organismos com características desejáveis, tais como plantas que não dependam de fertilizantes ou de animais que exibam alta taxa de crescimento;

Correção potencial de defeitos genéticos em organismos superiores.

A possibilidade de se criar novas combinações informacionais na molécula de DNA dependeu fundamentalmente do isolamento de endonucleases (Enzimas de Restrição) que reconheciam e clivavam sítios específicos da molécula de forma tal que moléculas de origem diferentes pudessem, após a clivagem, ligarem-se uma a outra.

Enzimas de Restrição

Uma enzima de restrição ou endonuclease de restrição é um tipo de nuclease que cliva uma fita dupla de DNA sempre que identificar uma seqüência particular de nucleotídios que seja o sítio de restrição da enzima (Smith & Wilcox, 1970). Por exemplo, a enzima BamH1 reconhece a seqüência dupla fita:

Uma vez reconhecida a seqüência acima, a ligação fosfodiéster 5'GpG3' é clivada em cada uma das fitas, como indicado pelas setas, produzindo grupos 3'OH e 5'P em cada posição. O nome dado à enzima refere-se ao organismo de onde foi isolada. No caso, Bacillus amyloliquefaciens. Outras enzimas reconhecem outras seqüências, como exemplificado na Tabela 11.1.

As enzimas de restrição tipo II fazem parte de um sitema mais amplo da célula bacteriana denominado sistema de modificação-restrição. Este sistema consiste de uma endonuclease de restrição e de seu par, uma metilase de modificação. A metilase metila uma base específica da mesma seqüência reconhecida pela endonuclease de restrição. As bases alvo de metilação são Adenina (grupo amino) ou Citosina (grupo amino ou posição 5). Quando o DNA está modificado a enzima de restrição não é capaz de clivá-lo. Desta forma o sistema de restrição-modificação protege a bactéria da invasão de DNA exógeno (em geral, vírus) que será clivado pela Enzima de Restrição da bactéria que não ataca seu próprio genoma pois este está modificado (Linn & Arber, 1968). Todavia, se o genoma do vírus for modificado após a invasão ele será capaz de se reproduzir no seu novo hospedeiro.

Centenas de enzimas de restrição já foram isoladas de diferentes microrganismos. Grande parte destas enzimas ao clivarem as duas fitas de DNA geram terminais coesivos enquanto outras geram terminais abruptos (Tabela 11.1; Figura 11.1). P. ex., a enzima EcoRI, gera terminais coesivos ao clivar as duas fitas nas ligações fosfodiéster 5'GpA3'. Os terminais fita simples, gerados com a clivagem de cada uma das fitas, são complementares entre si. Isto significa que os fragmentos produzidos podem formar espontaneamente um novo círculo. Se a enzima DNA ligase

Cristina M. Bonato 129

Page 130: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

estiver presente no meio, os terminais 3' e 5' podem ser covalentemente unidos. Estas propriedades da molécula de DNA e das enzimas de restrição permitem que se construa moléculas recombinantes a partir de fragmentos de DNA originários de organismos até bastante distantes do ponto de vista evolutivo.

Tabela 11. 1. Sítios de reconhecimento, modificação e clivagempor algumas enzimas de restrição

Enzima Sítio de Restrição Organismo de origem

EcoRIEscherichia coli

HindIII Haemophilus influenza

TaqI Thermus aquaticus

PstI Providencia stuartii

HaeIII Haemophilus aegyptius

SmaI Serratia marcescens

As seqüências reconhecidas pelas Enzimas de Restrição caracterizam-se pelo fatode que as duas fitas complementares apresentam seqüências idênticas, poréminvertidas, constituindo um palíndromo. Observe o eixo de simetria.A letra m refere-se a modificação das bases A ou C por metilação.

Assim, se o DNA de um mamífero e o da uma bactéria forem digeridos com EcoRI, ambos formarão o mesmo tipo de terminal coesivo e poderão ser covalentemente ligados, após pareamento por complementaridade, gerando uma quimera. Este é um dos fundamentos básicos da tecnologia do DNA recombinante.

Cristina M. Bonato130

Page 131: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 11. 1. Tipos de cortes feitos por enzimas de restrição. A. Terminais coesivos gerados por ação da enzima de restrição EcoRI. B. Terminais abruptos gerados por ação da enzima de restrição SmaI.

A seqüência de nucleotídios reconhecida pela EcoRI contem 6 nucleotídios. Como existem apenas 4 tipos de bases, a probabilidade de se encontrar a seqüência específica GAATTC é 1/46, portanto, um sítio deste poderá ser encontrado a cada ~4096 pares de bases. Se o DNA de E.coli é formado por ~ 4,7.106 pares de bases, então cerca de mil fragmentos podem ser gerados quando o cromossomo de E. coli é digerido com EcoRI. Já o genoma de um mamífero, que é muito maior do que o de uma bactéria, geraria milhões de fragmentos. É possível construir mapas de restrição de segmentos de DNA analisando-se os fragmentos gerados após tratamento com diferentes enzimas de restrição.

Mapa de Restrição e RFLPs

O tratamento de uma molécula de DNA com uma enzima de restrição, p. ex. HindIII, produz fragmentos de tamanhos diversos que podem ser separados por eletroforese em gel de agarose. Uma molécula de DNA com vários sítios para HindIII produzirá vários fragmentos de DNA de tamanhos diferentes, dependendo da posição dos sítios na molécula de DNA. Devido à especificidade de seqüência, uma dada enzima de restrição produz um conjunto único de fragmentos para uma molécula particular de DNA. Portanto, se a mesma molécula de DNA for tratada paralelamente com BamHI, muito provavelmente gerará fragmentos de tamanhos diferentes. O tratamento concomitante com as duas enzimas permite que se estabeleça, por comparação, a posição relativa dos sítios de restrição presentes na molécula, isto é, permite que se determine o mapa de restrição da molécula (Figura 11.2).

Cristina M. Bonato 131

Page 132: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 11. 2. Mapa de restrição de uma molécula linear de DNA com 4kb, tratada com BamH1 e HindIII, isoladamente e em conjunto. Cada fragmento aparece como uma banda horizontal no gel. Os fragmentos maiores movem-se mais vaga-rosamente que os menores durante a migração num campo elétrico. O comprimento de cada fragmento gerado com os diferentes tratamentos está indicado. A informação obtida dos géis permite deduzir as posições relativas dos sítios de restrição na molécula de DNA.

Os mapas de restrição são convenientes na localização de seqüências particulares de bases no cromossomo e para se estimar o grau de diferenças entre cromossomos relacionados.

A individualidade nos seres vivos resulta de polimorfismo genético, ou seja variação, de um indivíduo para outro, na seqüência equivalente do DNA. Bases únicas do DNA que diferem em pelo menos 1% da população, caracterizam polimorfismo de um único nucleotídio (SNPs, single nucleotide polimorfism) e salpicam o genoma humano irregularmente, cerca de 1 a cada 1250 bases (Lewis, R., 2002). Tais variações podem criar ou eliminar sítios de restrição na molécula de DNA. Portanto, cromossomos homólogos quando digeridos com uma dada enzima de restrição geram fragmentos de tamanhos diferentes, ou seja, o DNA exibe polimorfismo em relação ao comprimento dos fragmentos de restrição (RFLPs, do inglês, Restriction-Fragment Lenght Polymorphisms). As vezes o RFLP resulta de diferenças no número de cópias de pequenas seqüências de DNA repetidas em série num determinado local do cromossomo. Se o sítio de restrição de uma determinada enzima flanqueia esta região, é claro que os fragmentos terão tamanhos diferentes, dependendo do número de repetições em cada um dos cromossomos homólogos que estão sendo comparados. Um RFLP resultante de um número variável de repetições em série é denominado VNTR (variable number of tandem repeats).

Como as diferenças de tamanho dos fragmentos de restrição podem facilmente ser visualizadas em géis após eletroforese, os RFLPs são valiosos no diagnóstico de doenças hereditárias de genes desconhecidos, na identificação de indivíduos nas investigações criminais e no desvendamento da nossa história evolutiva. Os RFLPs são herdados de acordo com as regras da genética mendeliana (Figura 11.3).

Figura 11. 3. Um gene com quatro alelos que se caracterizam pelas posições diferentes dos sítios de restrição (marcadores diferen-tes) podem ocorrer em qualquer das com-binações possíveis e segregar indepen-dentemente a cada geração. Na geração parental dois indivíduos são homozigotos (AA e BB) e dois são heterozigotos (CD e BD) para o gene em questão, detectado no gel pela utilização de uma sonda específica. Os descendentes em F1 são AC e BB. Portanto só podem gerar filhos que herdem o traço B do pai e A ou C da mãe (F2). Círculo representa fêmea e quadrado representa macho.

Cristina M. Bonato132

Page 133: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

A utilização desta técnica tem fornecido informações interessantes sobre as populações humanas. Barbujani et al. , (1997) , analisando 109 marcadores de DNA (79 RFLPs e 30 micro satélites) de 16 populações mundiais verificaram que 84,4% da variação mundial destas marcas encontra-se entre os membros de uma mesma população e apenas 10% ocorria entre "raças" predominantes. Estudos dos padrões de restrição do DNA mitocondrial de 145 indivíduos representando diferentes populações mundiais concluiu que todo DNA mitocondrial humano origina-se de um ancestral comum pertencente a uma população Africana há 200.000 anos (Cann et al. , 1987 ).

Southern, Northern, Western Blots

A visualização de um fragmento de interesse num gel que separou milhares de fragmentos de um DNA submetido a ação de uma determinada enzima de restrição pode ser feita via Southern Blot. Como funciona esta técnica desenvolvida por Edwin Southern (daí o nome)?

Ela baseia-se no conhecimento de que as fitas de DNA são complementares e, portanto, seqüências similares podem hibridizar. Logo, este método identifica um segmento de DNA com uma seqüência de bases específica. A primeira coisa a se fazer é desnaturar o DNA, in loco, com tratamento alcalino do gel. A seguir, as bandas do gel, que agora contem DNA fita simples, são carimbadas (blot) numa membrana de nitocelulose ou de nylon, o que facilita o manuseio e permite que elas continuem ocupando as mesmas posições originais. A membrana contendo todos os fragmentos é seca a vácuo (800C), fixando o DNA permanentemente e, então, exposta a uma solução que contenha moléculas radioativas de DNA desnaturado ou RNA cujas seqüências são conhecidas (sonda). Estas moléculas vão hibridizar com a banda ou bandas onde houver DNA complementar a elas, gerando uma molécula dupla fita. A radioatividade é detectada num filme de Raio-X que será exposto a membrana. Depois de revelado o filme apresentará bandas escuras que indicam a posição de hibridização. Desta forma é possivel detectar, entre os milhares de fragmentos produzidos, aquele que lhe interessa (Figura 11.4). Detecção não radioativa, utilizando-se sondas fluorescentes, é desejal sempre que possível.

Figura 11. 4. Southern blot. Um fragmento de interesse pode ser detectado usando-se sonda radioativa. A sonda só hibridiza com o fragmento complementar entre os milhares de fragmentos gerados pela digestão de um cromosso com enzima de restrição. Desta forma, utilizando-se como sonda o fragmento de um gene ou mRNA bacteriano podemos procurar por similares entre os

Cristina M. Bonato 133

Page 134: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

fragmentos de um cromossomo humano.

O mesmo princípio descrito acima permite que imobilizemos RNA no papel e utilizemos DNA ou RNA como sonda. Esta técnica é denominada Northern blot (apenas por referência ao Southern blot).

Uma proteína específica também pode ser analogamente detectada num procedimento denominado Imunoblotting ou Western Blotting. Neste caso utilizam-se anticorpos para reagir com suas proteínas específicas dentre aquelas separadas por eletroforese em gel de poliacrilamida. Por exemplo, as proteínas de um extrato de células são separadas por eletroforese, transferidas para o papel de nitrocelulose e exposta ao anticorpo que deverá detectar a proteína de interesse. Como isto é visualizado? Trata-se o papel com um anticorpo secundário que reage com o anticorpo primário. Ao anticorpo secundário está associada uma enzima cuja atividade é fácil de visualizar (geralmente por reação colorimétrica). Onde houve interação antígeno-anticorpo sugem bandas coloridas.

Fragamentos de DNA obtidos por ação das enzimas de restrição, separados por eletroforese e identificados pela técnica de Southern Blot podem ser lidos, ou seja, podemos saber exatamente qual é a seqüência de bases do fragmento de interesse.

Sequenciando o DNA

O método atualmente utilizado para sequenciamento automático do DNA é aquele proposto por Frederick Sanger em 1975 e baseia-se nos princípios de duplicação do DNA e na utilização de um terminador da cadeia nascente. Ou seja, a DNA polimerase só trabalha no sentido 5´ > 3´, adicionando os desoxirribonucleosídeos trifosfatados (dATP, dGTP, dCTP, dTTP) ingressantes no terminal livre 3´OH de uma seqüência pré-existente (primer), obedecendo a ordem determinada pela fita molde (Figura 11.5).

Figura 11. 5. Duplicação do DNA.

Portanto, a duplicação implica na presença de um molde, do primer, das enzimas apropriadas e de desoxirribonucleosídeos trifosfatados (dNTP). Na proposta do terminador, além de todos estes componentes adiciona-se também aos tubos de reação uma pequena quantidade de um 2´,3´-didesoxinucleotídio trifosfato (ddNTP) específico. Os ddNTPs são os terminadores, uma vez que não possuem um grupo 3’ OH livre para perpetuar o ataque nucleofílico sobre o a-fosfato dos nucleosídios trifosfatados ingressantes.

Como isto é feito?

Cristina M. Bonato134

Page 135: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Quatro tubos de reação são utilizados e em cada um adiciona-se uma pequena quantidade de um dos ddNTP (ddATP, ddGTP, ddCTP, ddTTP). O terminador competirá com o desoxirribonucleosídeo trifosfatado análogo (dNTP) e interromperá a cadeia sempre que for incorporado, gerando fragmentos de diferentes tamanhos.

Como visualizar estes fragmentos? Em geral marcava-se radioativamente o primer ou um dos dNTPs e os fragmentos de cada tubo eram separados por eletroforese, onde os fragmentos maiores migram mais lentamente que os menores. Após a migração, um filme de Raios-X era exposto ao gel e então revelado (autorradiograma), de sorte que os fragmentos de cada tubo pudessem ser visualizados. A ordem das bases na molécula é lida, em seqüência, do fragmento maior para o menor, que corresponde ao sentido 3´ > 5´ (Figura 11.6).

Figura 11. 6. Esquema do método Terminador de Cadeia (di-desoxi).

Atualmente, no seqüênciamento automático, não se utiliza mais marcação radioativa e sim um corante fluorescente, ligado ao primer, específico para cada ddNTP: verde, vermelho, preto e azul para ddATP, ddTTP, ddGTP e ddCTP respectivamente. Detectores de fluorescência presentes nas máquinas de sequenciamento são controladas pelo computador de sorte que a aquisição dos dados é automatizada (Figura 11.7). Em 2001 foi completado o rascunho da seqüência do genoma humano por dois grupos: a) International Human Genome Sequence Consortium e b) Celera Genomics, USA (Venter et al ).

Cristina M. Bonato 135

Page 136: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 11. 7. Produto de sequenciamento auto-mático. As letras especificam as bases e os núme-ros indicam a posição das bases no segmento sequenciado. As curvas indicam a intensidade de fluorescência de um corante particular.

Para sequenciar um fragmento de DNA é conveniente partirmos de um grande número de cópias deste fragmento. Tal amplificação do segmento de DNA desejado pode ser obtida pela reação de polimerização em cadeia (PCR) ou pela clonagem em vetores multi-cópia.

Reação de Polimerização em Cadeia (PCR)

A técnica de PCR, amplamente utilizada em laboratórios de pesquisa e clínicos, consiste em produzir, automaticamente, milhões de cópias de um único segmento de DNA em questão de horas. Tal façanha depende da habilidade das enzimas copiadoras de DNA permanecerem estáveis em alta temperatura, como veremos a seguir. A DNA polimerase isolada da bactéria hipertermófílica Termus aquaticus, encontrada em fontes termais do parque florestal de Yellowstone-USA, deu grande impulso a utilização automatizada desta técnica. A replicação no tubo de ensaio mimetiza o que ocorre na natureza. O primeiro passo é "abrir o DNA", separando as duas fitas da dupla hélice. Em seguida a DNA polimerase de T. aquaticus, denominada Taq polimerase, faz cópias utilizando cada uma das fitas como molde. Para copiar o DNA, a polimerase necessita de nucleosídeos trifosfatados de adenina, timina, citosina e guanina e de primers. A partir dos primers, a polimerase sintetiza as novas fitas.

Como isto é feito?

1. Para separar as duas fitas, o tubo de ensaio contendo, Taq polimerase, nucleosídeos trifosfatos, primers e fragmento de DNA dupla fita, é submetido à temperatura de 90-95oC, por alguns segundos.

2. Em seguida o tubo é resfriado para a temperatura de ~55oC. Nesta temperatura os primers vão se anelar às seqüências complementares no fragmento de DNA. Isto leva alguns segundos.

3. A seguir a temperatura é novamente elevada porque a Taq polimerase trabalha melhor à 75oC. Então, a polimerase começa a adicionar nucleotídios a partir dos primers fazendo, finalmente, uma cópia completa dos moldes. Ao final tem-se um ciclo completo de PCR. Este processo leva menos do que dois minutos.

4. Este ciclo é repetido 30 ou mais vezes de sorte que após ~3 horas, mais de um milhão de cópias de um determinado pedaço do DNA foi produzido (Figura 11.8).

Cristina M. Bonato136

Page 137: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 11. 8. Reação de Polimerização em Cadeia. Técnica formulada por Kerry Mullis.

O PCR tem inúmeras aplicações. Na clínica é utilizado no diagnóstico de doenças infecciosas e na detecção de eventos patológicos raros. Na criminalistica, um único fio de cabelo pode identificar o doador. Na paleontologia molecular, a amplificação de amostras de DNA extraídas de fósseis incrustados e preservados no ambar há mais de 120 milhões de anos permite a determinação da seqüência desta molécula para estudos evolutivos.

Vetores e Estratégias de Clonagem

Moléculas de DNA capazes de auto-duplicação (replicons), podem ser utilizadas como veículos para carregar fragmentos de DNA obtidos por ação das enzimas de restrição. Os veículos são denominados vetores. Quando um fragmento de DNA é inserido num vetor diz-se que está clonado, uma vez que várias cópias deste fragmento poderão ser produzidas com a auto-duplicação do vetor no hospedeiro apropriado. Em geral, a molécula recombinante é colocada dentro do hospedeiro via transformação. Os vetores mais utilizados até o momento são plasmídios de E. coli e moléculas derivadas dos bacteriófagos l e M13.

As características básicas de um vetor são:

a. Pode ser introduzido numa célula hospedeira; b. Contem uma origem de replicação, o que permite sua duplicação no hospedeiro; c. Células contendo o vetor podem ser facilmente selecionadas pelo fenótipo

conferido ao hospedeiro, por um gene presente no vetor como, p. ex. resistência a antibióticos.

Estratégias de clonagemA clonagem de fragmentos em um vetor pode seguir os passos abaixo:

Cristina M. Bonato 137

Page 138: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

a. Digestão do DNA de interesse, denominado DNA doador, com uma enzima de restrição apropriada, p. ex. EcoRI, que cria terminais coesivos, produzindo-se centenas de fragmentos com o mesmo tipo de terminal;

b. Digestão do vetor com a mesma enzima de restrição, observando-se que o vetor deve possuir um único sítio de restrição para a enzima. Desta forma os terminais de qualquer dos fragmentos do DNA doador complementam-se ao do vetor, podendo ser inseridos neste único ponto de abertura do vetor gerando uma molécula constituída de vetor + inserto;

c. Tratamento com DNA ligase para selar os terminais, permitindo o fechamento do círculo e gerando um DNA recombinante, lembrando sempre que o vetor deve possuir genes que confiram à célula receptora um fenótipo facilmente identificável;

d. Introdução do vetor na célula hospedeira, seja por transformação clássica, eletroporação, biobalística, etc.(Figura 11.9).

Resumindo, a idéia central na clonagem molecular é inserir um segmento de DNA de interesse numa molécula de DNA de replicação autônoma (veículo ou vetor de clonagem), de sorte que o fragmento seja replicado com o vetor. O resultado é uma quimera que, ao ser clonada num organismo hospedeiro apropriado como E. coli ou levedura, produz uma enorme quantidade do segmento de DNA ali inserido. Se o gene clonado estiver apropriadamente flanqueado por seqüências que controlem a síntese de RNA (transcrição) e de proteínas (tradução), a célula hospedeira também será capaz de produzir grandes quantidades de RNA e da proteína codificada no gene inserido.

Figura 11. 9. Clonagem de fragmentos de DNA num vetor. Tanto o vetor como o DNA estrangeiro são cortados com a mesma enzima de restrição gerando terminais coesivos que podem se anelar produzindo uma quimera. Todavia, os terminais do próprio vetor podem se reanelar e neste caso não será produzido um DNA recombinante. Com esta população de vetores serão transformadas as células hospedeiras. Ao se transformar uma população bacteriana com um vetor nem todas as células são transformadas. Portanto, é necessário selecionar as transfor-mantes. Para tanto, as células são espalhadas em meio sólido seletivo, que permitirá o crescimen-to apenas das células que receberam o vetor. Se o vetor conferir resistência à antibiótico, o meio seletivo deve conter o antibiótico em questão. Desta forma, as células que não foram trans-formadas com o vetor não sobreviverão neste meio. Como distinguir entre as células que receberam o vetor "vazio" e o vetor com inserto? Veja no item pBR322 e outros vetores.

Cristina M. Bonato138

Page 139: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

pBR322 e Outros Vetores

Existem vários plasmídios interessantes para clonagem. Em geral são pequenos; replicam sob controle relaxado, isto é, estão presentes em várias cópias na célula; carregam genes de resistência a um ou mais antibióticos e contêm uma série de sítios de restrição estrategicamente localizados.Nos vetores construídos para clonagem, o sítio de clonagem contem sítios de clivagem, em série, para diferentes enzimas de restrição. Isto permite que distintos fragmentos estrangeiros cortados com diferentes enzimas de restrição sejam inseridos no vetor. Tais segmentos de DNA com múltiplos sitios de clonagem são denominados polylinkers. Um dos primeiros vetores de clonagem construídos foi o plasmídio pBR322, representado na Figura 11.10.

Figura 11. 10. pBR322 - Vetor de Clonagem apropriado para duplicar em E. coli. Contem a origem de replicação de plas-mídios bacterianos e dois genes conferindo resistência aos anti-bióticos Tetraciclina (Tet) e Ampicilina (Amp). Os diferentes sítios de restrição estão indicados. Ainda não tinha polylinker. Observe que o gene que confere resistência à Tet possui sítios para as enzimas de restrição BamHI e SalII e o gene que confere resistência à Amp possui um sítio para PstI. Se em qualquer destes sítios for introduzido um inserto o gene correspondente ficará inativado.

Suponha que um fragmento de DNA humano, cortado com BamH1 foi colocado num tubo de ensaio contendo pBR322 também clivado com BamH1. Alguns vetores vão se ligar ao fragmento exógeno (inserto) e, com ajuda da ligase formar a quimera. Outros vetores vão simplesmente ligar suas extremidades novamente sem incorporar o inserto. É esta população de vetores que será utilizada para transformar E. coli. Como selecionar apenas as colônias que contem o vetor com inserto? Se os transformantes forem semeados em um meio seletivo contendo Amp, crescerão todos os transformantes, com e sem inserto. Se as colônias AmpR forem então transferidas, via carimbo (replica plating), para um meio contendo Tet, não crescerão as colônias que possuam o vetor + inserto, justamento porque o inserto entra no gene que codifica resistência a Tet, inativando-o. Assim, a partir das placas de Amp podemos isolar as bactérias que receberam o inserto. Estas bactérias serão estocadas e nomeadas para posterior identificação do inserto aí inserido.

Os plasmídios são usualmente utilizados para clonar fragmentos pequenos de DNA (5-10 kb). Quando se quer clonar fragmentos um pouco maiores pode-se utilizar o bacteriófago l cujo DNA tem ~50kb de comprimento. A porção central do genoma do fago não é essencial ao crescimento lítico podendo ser retirada e substituída pelo DNA exógeno. O DNA recombinante é então empacotado "in vitro" e a partícula madura é utilizada para infectar células bacterianas. O tamanho do inserto, neste caso, pode variar de 12 a 20kb, devendo ser proporcional ao segmento excisado (nem maior, nem menor), caso contrário não será possível empacotá-lo.

Alguns vetores combinam características de plasmídio e do fago l e aceitam insertos maiores (40-45kb). Tais vetores denominados cosmídios podem existir como plasmídios mas contêm os terminais coesivos do fago lambda (sítio cos) numa distância de 36 a 51 kb. Nestas condições o plasmídio pode ser empacotado "in vitro" para infectar a célula hospedeira. Uma vez que o

Cristina M. Bonato 139

Page 140: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

cosmídio não tem genes do fago, ao ser introduzido na célula reproduz-se como um plasmídio.

Um vetor de clonagem mais moderno é o plamídio pBluescript II (Figura 11.11), com 2961 pares de base contendo: 1. A origem de replicação do plasmídio ColE1 que permite um alto número de cópias (~300

cópias/cel). 2. O gene que confere resistência à ampicilina para selecionar as células transformadas. 3. O gene lac Z que permite a detecção dos plasmídios recombinante por coloração das colônias.

A enzima b-galactosidade produzida pelo gene lac Z quebra o composto X-gal adicionado ao meio de cultura, liberando um corante azul forte. Portanto, em colônias azuis o gene lac Z está funcional. No plasmídio recombinante, todavia, a inserção do fragmento exógeno inativa o gene lac Z. Portanto, são as colônias brancas que contem o plasmídio recombinante.

4. Um polylinker de 108 pb contendo sítios de clonagem para 23 enzimas de restrição diferentes na porção N-terminal do gene lac Z, sem interfirir no quadro de leitura do gene. A inserção do fragmento na região do polylinker vai alterar o quadro de leitura do gene lac Z, inativando-o.

5. Origem de replicação do fago de DNA fita-simples f1.

Às vezes a quimera é construída à partir de um mRNA. Isto porque em eucariotos são freqüentes genes muito grandes devido a presença de introns. Os introns são retirados no processamento da molécula gerando um mRNA bem menor que o gene, facilitando a clonagem. Além disto, genes com introns clonados em bactérias não poderiam gerar o produto, porque não seriam processados. Como um gene é clonado a partir o mRNA? Utiliza-se a transcriptase reversa para sintetizar uma molécula de DNA dupla-fita a partir de um RNA fita simples. O DNA obtido é denominado DNA complementar ou cDNA. Esta seqüência é então inserida no vetor apropriado como descrito acima. É necessário salientar que esta molécula, contendo apenas a região codificadora do gene, não possui as seqüências reguladoras de iniciação (promotor) e terminação de transcrição, as quais deverão estar presentes no vetor onde o gene será inserido se quisermos que o mesmo seja expresso.

Um outro tipo de vetor é aquele que mimetiza um cromossomo e, portanto, permite a clonagem de milhares de pares de bases. Um destes vetores é o YAC (yeast artificial chromosome) que se duplica em levedura e o outro é o BAC (bacteria artificial chromosome), que se duplica em bactéria. YACs: podem receber fragmentos de DNA de até 1Mb. Os YACs contem um sítio de clonagem; o centrômero de leveduras; um par de seqüências teloméricas; origens de replicação

Cristina M. Bonato140

Page 141: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

de levedura e de E. coli e marcas genéticas para seleção tanto em levedura como em E.coli. Assim, o vetor YAC é bifuncional já que pode se replicar e ser selecionado tanto em E. coli como levedura. Aliás, qualquer plasmídio capaz de se propagar em células de duas ou mais espécies diferentes é um plasmídio bifuncional (shuttle vector). BACs: podem receber fragmentos de 100.000 a 300.000 pb que serão herdados mais estavelmente que nos YACs. Os BACs funcionam como um cromossomo bacteriano, portanto possuem origem de replicação, marcas seletivas e sítio para clonagem. No sequenciamento do genoma humano, longos fragmentos do DNA cromossômico humano foram clonados em BACs para serem posteriormente sequenciados.

Bibliotecas Genômicas e de cDNA

Uma biblioteca genômica refere-se ao conjunto dos fragmentos de DNA, obtidos do genoma completo de um organismo, clonados no vetor escolhido. Tal biblioteca é feita uma única vez porque ela pode ser perpetuada para uso sempre que uma nova sonda estiver disponível. As bibliotecas genômicas podem ser geradas por uma técnica denominada "shotgun cloning". Resumidamente, o DNA de um organismo é isolado e submetido a digestão parcial por uma dada enzima de restrição, de sorte que o conjunto de fragmentos gerados contenha representantes intactos de cada um dos genes do genoma. Os fragmentos com tamanho adequado serão inseridos no vetor escolhido.

Como calcular o número de clones para assegurar que uma dada seqüência esteja presente pelo menos uma vez na biblioteca?

P= 1 - (1 - f)N

Onde P= probabilidade; N= conjunto de clones; f= fração do genoma representada pelo fragmento clonado, em pares de bases. Portanto,

N= log(1 - P) / log (1 - f)

Por exemplo, considerando o genoma de E. coli, que possui 4700 kb (4,7.106pb) e decidindo-se por clonar fragmentos de 10kb, qual o número de clones necessários para representar todos os genes do genoma, com uma probabilidade de 99%?

N= log (1-0,99) / log (1-10/4700)

N= log 0,01 / log 0,99787234

N= 2162 clones

Assim, quanto maior o inserto clonado, menor o número de clones necessários para representar o genoma. Por esta razão são utilizados vetores BAC ou YAC quando se pretende clonar genomas muito maiores que os de Bacteria ou Archaea.

Uma vez clonados os fragmentos é necessário que encontremos entre os milhares clonados, aqueles que nos interessam, ou seja, é preciso passar pela peneira (screen). Isto pode ser feito por hibridização "in situ".

As colônias que cresceram em meio seletivo são transferidas via replica plating para uma membrana de nitocelulose. Tratamento da membrana com NaOH lisa as células e desnatura o

Cristina M. Bonato 141

Page 142: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

DNA, o que permite sua ligação a membrana. A secagem da membrana fixa o DNA in loco. A membrana é então mergulhada numa solução contendo a sonda radioativa para o gene de interesse sob condições ideais para anelamento. Autorradiografia da membrana permite identificar as colônias que carregam o fragmento de interesse (Figura 11.12).

Figura 11. 12. Hibridização in situ. Colônias que cresceram no meio seletivo contem o DNA recombinante. Estas placas constituem as placas mestres. A partir delas é feita a réplica para a membrana de nitrocelulose. Na membrana as células são lisadas e o DNA desnaturado e fixado in loco. Após hibridização da membrana com a sonda radioaativa, a exposição ao filme de raio X revela a colônia que continha o fragmento de DNA com quem a sonda se hibridizou. Como a posição da colônia está fixada durante todo o processo, volta-se à placa mestre e recupera-se o clone de interesse.

Uma biblioteca de cDNA refere-se a clonagem de fragmentos de DNA obtidos a partir de uma população de mRNAs. As células expressam diferentes mRNAs durante o desenvolvimento do organismo e quando expostas a diferentes condições. Portanto, a população de mRNAS de uma célula num dado momento não representa o genoma. Após isolar a população de mRNAs de uma célula, ela será exposta à transcriptase reversa que irá sintetizar DNA dupla fita a partir do molde de RNA. Este DNA complementar (cDNA) ao RNA será então clonado no vetor escolhido. Estes fragmentos contem basicamente a seqüência codificadora do gene, já que o mRNA não contem introns nem as seqüências controladoras de transcrição.

Proteínas Recombinantes

O domínio da tecnologia do DNA recombinante permite que se produza, em grande escala, proteínas raras ou totalmente novas. Para isto é necessário que o gene recombinante seja clonado num vetor de expressão, o qual contem seqüências controle de transcrição e tradução apropriadamente localizadas. Um plasmídio de controle relaxado da replicação e um promotor eficiente permitirão a síntese de um grande número de cópias do gene de interesse. A síntese da proteína codificada por tais genes, na célula bacteriana, dependerá de sinais contidos no mRNA e que serão reconhecidos pelo aparato tradutor da bactéria.

Se o gene clonado for de origem eucariótica uma série de providências devem ser tomadas:

1. Os elementos de controle para síntese de RNA e proteínas dos eucariotos devem ser substituídos pelos de procariotos, caso contrário não seriam reconhecidos.

2. Se o gene possui introns deve-se clonar o cDNA do mRNA correspondente, uma vez que as bactérias não tem a maquinaria para retirada dos introns e união dos exons (splicing).

3. Para as modificações pós-tradução que ocorrem nos eucariotos não existe uma estratégia universalmente aplicável. Todavia, o desenvolvimento de vetores que se propagam em eucariotos eliminou muitos destes problemas.

Cristina M. Bonato142

Page 143: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Algumas proteínas recombinantes já são rotineiramente utilizadas na clínica médica, tais como: insulina humana (tratamento de diabetes); fator de crescimento humano (tratamento de nanismo); eritropoietina (fator de crescimento secretado pelo rim que estimula a produção de eritrócitos); fator VIII de coagulação do sangue (para hemofílicos); fatores estimuladores de colônia (estimula a produção de leucócitos, utilizado nos casos de imunodeficiência); interferons (interfere na reprodução viral e também é usado no tratamento de alguns canceres); interleucinas (ativam diferentes classes de leucócitos e poderiam ser utilizadas na cicatrização de feridas, infecção por HIV, cancer, imuno deficiências); vacinas (como a da hepatite B, onde proteína derivada da capa viral é tão eficiente em desencadear uma resposta imunológica quanto o próprio vírus morto, porém mais segura); etc.

Os escritórios de patente da Europa e dos USA já emitiram milhares de patentes para uso clínico de produtos de genes humanos geneticamente engenheirados. Se, num "site" de busca mundial, você colocar a palavra chave "Recombinant Protein" aparecerão dezenas de "sites" tratando do assunto, principalmente, comercializando os produtos. Algumas vezes há interesse em clonar um gene com alguma alteração que modifique uma dada proteína de forma específica para servir a um determinado propósito. Isto é possível via mutagênese sítio-dirigida.

Mutagênese Sítio-Dirigida

Na mutagênese sítio-dirigida, altera-se a seqüência de bases (1 ou 2 pb) do DNA do gene de interesse, clonado num vetor específico. Duas abordagens têm sido utilizadas para alterar o gene e consequentemente, engenheirar a proteína: 1. Um pequeno segmento do gene que se deseja alterar é removido pela ação de uma enzima de

restrição que possua sítios próximos, ladeando o segmento, o qual será substituído pelo segmento sintético equivalente (oligonucleotídio), alterado em um único par de bases, por exemplo.

2. Caso sítios de restrição não estejam disponíveis próximos ao local que se deseja alterar, sintetiza-se um pequeno segmento de DNA (oligonucleotídio), complementar à região de interesse, porém, contendo a alteração desejada. O plasmídio contendo o gene é desnaturado e a fita simples do plasmídio anela-se a fita simples do oligonucleotídio síntético. Este anelamento não é perfeito, visto que existe uma alteração de bases (mismatch). O oligonucleotídio funcionará como um primer para sintetizar a fita complementar do plasmídio. O plasmídio dupla fita transformará bactérias onde irá se duplicar gerando plasmídios com genes alterados e plasmídios com genes não-alterados. Em meio seletivo serão isolados os plasmídios alterados, contendo o gene que sintetizará a proteína recombinante carregando a modificação desejada (Figura 11.13).

Cristina M. Bonato 143

Page 144: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 11. 13. Um oligonucleotídio complementar a uma porção do gene A do plasmídio, carrega uma alteração e apesar do emparelhamento defeituoso funciona como um primer. Também funciona como primer o oligonucleotídio complementar ao gene amp que corrige a mutação existente no plasmídio. Após a síntese da fita complementar o plasmídio híbrido dupla fita transforma células bacterianas e se duplica, sendo gerados, de um lado, plasmidios com gene A alterado e resistência à ampicilina (ampR) e, de outro, plasmídios com gene A selvagem e sensibilidade à ampicilina (ampS). As bactérias contendo o gene A mutado serão selecionadas em meio contendo tetraciclina e ampicilina.

Organismos Transgênicos

O termo transgênico refere-se a animais ou plantas nos quais um novo segmento de DNA tenha sido incorporado na célula germinativa. Vejamos alguns exemplos de transgênicos:

Salmão gigante engenheirado com hormônio de crescimento - Sabemos que a expressão de um gene depende dos elementos reguladores encontrados, geralmente, à montante da região codificadora, aos quais se ligam proteínas reguladoras (fatores de transcrição) que podem ativar ou inibir a transcrição. O gene que codifica a proteína metalotioneína contem elementos reguladores altamente eficientes podendo induzir um alto nível de expressão da proteína na presença dos estimuladores adequados. Quando esta região regulatória é associada ao gene do hormônio de crescimento do salmão, vai induzir uma alta expressão deste gene. O salmão da espécie coho é um peixe pequeno (~10cm) do oceano Pacífico e foi engenheirado com o hormônio de crescimento sob controle da região regulatória do gene da metalotioneína, ambos provenientes de uma espécie maior de salmão (sockeye). Os salmões coho transgênicos mediam, em média, 42 cm e eram 11 vezes mais pesados que os originais (Devlin et al. , 1994 ).

Plantas transgênicas: A introdução de DNA recombinante em plantas poderia propiciar a produção de alimentos mais nutritivos e assegurar uma alta produção de grãos, resistindo a estresses ambientais tais como o ataque de insetos, nematóides, vírus, alta temperatura ou seca. As plantas de algumas espécies podem se desenvolver a partir de uma única célula, de sorte que se

Cristina M. Bonato144

Page 145: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

introduzirmos um gene modificado nesta célula, ele será transmitido a todas as células do indivíduo adulto e às gerações futuras.

A introdução na planta do gene modificado depende de um vetor. O vetor que tem sido utilizado é o plasmídio Ti (Tumor-inducing), de ~ 200kb. Este plasmídio está presente na bactéria de solo Agrobacterium tumefaciens, que invade plantas sensíveis, num local onde exista um ferimento. Um segmento do plasmídio, denominado DNA T (23kb), flanqueado por repetições diretas de 25pb, transforma as células da planta integrando-se em qualquer sítio dos cromossomos vegetais. O segmento T, depois de integrado, induz a formação de um tumor na planta (crown gall tumor). Este é um exemplo natural de engenharia genética, com transferência de informação de um procarioto para um eucarioto (Figura 11.14 A).

O DNA T codifica proteínas que estimulam a divisão celular da célula infectada (tumor) e enzimas que convertem o aminoácido arginina em nopaline ou octopina, necessários ao crescimento da própria bactéria e metabolizados apenas por ela. O processo de transferência do DNA T depende de seis genes presentes na região vir do plasmídio. A expressão dos genes vir é induzida por um composto fenólico (acetilsiringona) que é produzido e excretado pelas células da planta na região do ferimento.

Utilizando tal sistema, foi possivel criar plantas de tomate resistentes ao ataque da larva de mariposa. A bactéria Bacillus thurigiensis produz uma proteína que é tóxica para a larva de certas espécies de mariposa que atacam o tomateiro. Esta toxina, todavia, não é tóxica aos seres humanos. O gene que codifica esta toxina, quando transferido para a planta torna-a resistente ao ataque da larva (Figura 11.14 B).

Figura 11. 14. A. Estratégia de dois plasmídios para criar uma planta recombinante de tomate. Um dos plasmídios está envolvido no processo de transferência (genes vir) e o outro contem o segmento que será transferido (toxina de B. thuringiensis). Este segmento mimetiza o T DNA, uma vez que está flanqueado pelas repetições de 25pb mas, ao invés dos genes indutores de tumor, contem um gene de Bacillus thuringiensis que codifica uma toxina e outro gene codificando resistência à kanamicina. O fenótipo de resistência à kanamicina permite selecionar as plantas recombinantes. B. Tomateiros expostos a larva da mariposa: à direita está a planta transgênica que resistiu ao ataque.

Plantas resistentes ao herbicida glyphosate: a primeira planta recombinante de valor comercial foi desenvolvida em 1985. A produção agrícola tem dependido de herbicidas utilizados

Cristina M. Bonato 145

Page 146: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

contra as hervas daninhas da cultura. Um dos herbicidas mais comercializados no mundo é o Roundup cujo ingrediente ativo é o glyphosate que ataca plantas e microrganismos. O problema é na sua aplicação, porque só pode atingir as ervas daninhas uma vez que também é tóxico para a colheita. Um mutante de Salmonella typhimurium resistente ao glyphosato permitiu que a forma resistente do gene fosse isolada, clonada em E. coli e reclonada no DNA T de Agrobacterium. Plantas transformadas com o gene de resistência ao glyphosato produziram variedades de milho, algodão, tabaco e outras, resistentes ao herbicida.

Guia de Estudo

Porque as enzimas de restrição produzidas por uma dada bactéria não degradam seu próprio DNA?

Quais as características de uma biblioteca genômica e de uma biblioteca de cDNA?

O que as técnicas de Southern, Northern e Western Blot permitem visualizar, respectivamente?

Um fragmento linear de DNA foi clivado individualmente com as enzimas HindII e SmaI. Paralelamente, foi clivado com as duas enzimas ao mesmo tempo. Foram obtidos os seguintes fragmentos: tubo 1 (HindII): 2,5kb e 5,0 kb tubo 2 (SmaI): 2,0 kb e 5,5 kb tubo 3 (HindII e SmaI): 2,5 kb, 3,0 kb e 2,0 kb. a) desenhe o mapa de restrição b) os fragmentos do tubo 3 foram submetidos à clivagem com a enzima EcoRI. Num gel de agarose colorido com brometo de etídio, a banda original de 3kb desapareceu, tendo surgido uma banda que representa um fragmento de 1,5kb. Marque o sítio de clivagem de EcoRI no mapa de restrição.

Qual a metodologia utilizada por Sanger para seqüenciar o DNA?

A proteína W, isolada de uma linhagem selvagem de E. coli, pode ser detectada pelo anticorpo anti-W. O peso molecular da proteína W é 40kDa. Você isolou a proteína W e produziu o anticorpo anti-W. Submeteu a proteína à eletroforese em gel de acrilamida. Transferiu para nitrocelulose. Expôs a nitrocelulose ao anticorpo marcado anti-W. O anticorpo anti-W liga-se à proteína alvo (W). O resultado é mostrado abaixo, na linha 1:

Que resultados você esperaria obter se ocorressem as seguintes mutações:

· Inativação do promotor do gene W (linha 2)

· Mutação nonsense no gene W, localizada ¾ adiante do terminal 5'do mRNA (linha 3)

Cristina M. Bonato146

Page 147: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

· Mutação missense, localizada ¾ adiante do terminal 5'do mRNA (linha 4)

· Deleção de um nucleotídio do códon de parada de tradução, permitindo que a tradução continue ainda por mais 90 nucleotídios ao longo do mRNA (linha 5)

Obs.: O peso médio de um aminoácido é 110 daltons. Desenhe as bandas nas linhas correspondentes a cada tipo de mutação, na posição relativa a seu peso molecular.

Deseja-se clonar um gene que confere resistência à ampicilina (ampr ) em um plasmídeo que possui o gene de resistência a canamicina (canr ), como marca de seleção. Os mapas de restrição são dados abaixo.

Para obter clones positivos, digere-se o DNA genômico e de plasmídeo com certa enzima e, em seguida, utiliza-se um antibiótico para seleção. A enzima e o antibiótico apropriados são, respectivamente,(A) Eco RI e canamicina.

(B) Eco RI e ampicilina.

(C) Sal I e ampicilina.

(D) Sal I e canamicina.

(E) Hind III e ampicilina.

O que é o DNA T? Como funciona?

O que é mutagênese sítio-dirigida?

O que é um vetor de expressão?

O que são cosmídios?

O que são YACs e BACs?

O que são RFLPs?

O que é o sistema de modificação-restrição?

Cristina M. Bonato 147

Page 148: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Capítulo 12 – Regulação da Expressão Gênica em Bactéria

Visão Geral

Nem todos os genes são continuamente expressos numa célula. Dependendo da situação em que a célula se encontre, conjuntos apropriados de genes serão acionados. Por exemplo, sob condições de estresse, tais como aumento de temperatura, aumento de concentração salina ou diminuição da quantidade de O2 disponível, a célula "ligará> certos genes específicos, capazes de responderem a tais situações adversas e "desligará" outros. Também, durante o ciclo celular, a cada momento, expressam-se diferentes conjuntos de genes para executar as tarefas específicas de cada fase do ciclo. É o conjunto de proteínas encontrados numa célula, numa dada situação, que lhe confere seus atributos específicos.

Uma célula de bactéria, como E. coli contem toda informação genética necessária ao seu metabolismo, crescimento e reprodução. Pode sintetizar qualquer molécula orgânica a partir de íons inorgânicos e glicose. Muitos de seus genes estão se expressando continuamente, ou seja, estão ligados. Genes com expressão constante são denominados genes de expressão constitutiva. Outros genes, como citado anteriormente, só são ligados em circunstâncias muito especiais onde seus produtos são necessários. A expressão destes genes, portanto, é regulada.

Neste capítulo iniciaremos o estudo dos mecanismos que regulam a expressão gênica e usaremos como modelo, genes bacterianos que codificam polipeptídios. A presença ou não de uma atividade protéica num determinado momento pode ser regulada em diferentes níveis:

Transcrição: o gene poderá ou não ser transcrito e isto depende da habilidade da RNA polimerase acionar os promotores desejáveis no momento certo (vide Reconhecimento do promotor)

Tradução: o mRNA poderá ou não ser traduzido em determinadas circunstâncias e a eficiência eficiência do processo também poderá ser controlada.

Pós-tradução: o peptídeo resultante poderá ser modificado para exercer sua função, pois nem sempre é sintetizado na forma ativa. As modificações podem implicar em proteólise parcial, fosforilação, acetilação, metilação, dimerização, etc.

Em bactérias a atividade gênica é controlada, predominantemente, ao nível da transcrição. Se uma determinada atividade for requerida pela célula a transcrição do gene correspondente será induzida (Sistema induzível). O fenômeno de indução implica em aumentar espetacularmente (1.000-10.000 vezes), o número de cópias de mRNA existentes em nível basal. Por outro lado, se uma determinada atividade precisar ser "desligada", então a transcrição do gene correspondente será reprimida por reguladores que bloqueiam a ação da RNA polimerase (Sistema Reprimível).

Na bactéria E. coli, um exemplo de Sistema Induzível é o operon lac, responsável pela degradação da lactose (via degradativa) e que só é induzido quando lactose é a única fonte de carbono disponível. Um exemplo de Sistema Reprimível é o operon triptofano, que contem os genes responsáveis pela síntese do triptofano (via biossintética) e que somente será reprimido quando a concentração de triptofano na célula for alta.

Cristina M. Bonato148

Page 149: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Sistema Lac

A lactose, um dissacarídio encontrado no leite, é um b-galactosídio que pode ser utilizado pela bactéria E. coli como fonte de carbono e energia, após sua quebra em glicose e galactose. A enzima que quebra a lactose é a b-galactosidase (b-gal), é codificada pelo gene lacZ. Esta mesma enzima é também capaz de modificar a lactose convertendo-a em alolactose a qual, na verdade, é a molécula indutora do operon lac (Figura 12.1).

Figura 12. 1. Degra-dação e modificação da lactose pela enzi-ma b-galactosidase, cuja transcrição é in-duzida em presença do indutor 1,6-alolac-tose.

O que é um operon?

Um operon é um grupamento de genes adjacentes sob controle do mesmo promotor/operador. Em geral os genes de um mesmo operon executam funções relacionadas. Quando um operon é induzido, todos os genes que dele fazem parte são transcritos numa molécula única de mRNA. Tal molécula é denominada RNA poligênico ou policistrônico. Tais grupamentos de genes são comuns em Bacteria e Archaea e ainda podem ser encontrados em alguns eucariotos.

O operon lac é constituído pelos genes lacZ, lacY e lacA, sob o controle dos sítios P (promotor) e O (operador)(Figura 12.2).

Figura 12. 2. Operon Lac

Qual a função de cada um destes genes?

O gene lac Z, como mencionado acima, tanto modifica como degrada a lactose que entra na célula. A entrada da lactose na célula depende da ação de uma proteína transportadora transmembrana denominada b-galactosídio permease codificada pelo gene lac Y. O gene lac A codifica a enzima tiogalactosídeo transacetilase que, in vitro, transfere grupos acetil da acetil-CoA para o grupo OH do C6 b-galactosídeos. Como a fermentação da lactose ocorre normalmente na ausência desta enzima sua função fisiológica é desconhecida.

Cristina M. Bonato 149

Page 150: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Numa linhagem selvagem de E. coli, a quantidade de b-galactosidase presente em células cultivadas na ausência de lactose é muito baixa (nível basal). Todavia, assim que as células são transferidas para um meio contendo lactose como única fonte de carbono, a atividade de b-galactosidade aumenta cerca de 1.000 vezes (Figura 12.3). Ao mesmo tempo é induzida a síntese de permease e acetilase. Além disto, se glicose e lactose estão presentes no meio, o operon lac não é induzido enquanto a glicose não se esgotar.Tais observações permitem propor a existência de um controlador, regulando a expressão concomitante destes genes. Mostra ainda que este controlador, de alguma forma detecta a presença de lactose ou do b-galactosídio alolactose, em cuja presença a expressão dos genes do operon é liberada, desde que não haja glicose no meio.

Como decifrar este sistema?

Mutantes Lac

A utilização de mutantes com perda de função, para os genes lac Z, lac Y e lac A, e também de mutantes controladores permitiu a elucidação do sistema.

Inicialmente foram isolados mutantes de diversos tipos:

Mutantes com perda de função para os genes lacZ e lacY, incapazes de utilizar lactose (Lac -). Estes mutantes são designados z- e y- enquanto a forma selvagem é designada z+ e y+.

Mutantes constitutivos, ou seja, mutantes que sintetizavam as enzimas mesmo na ausência do indutor. Dois tipos de mutantes constitutivos foram isolados: i- e oc.

Mutantes suprimidos, ou seja, mutantes que nunca sintetizavam as enzimas, mesmo que o indutor estivesse presente e que mapeavam na mesma posição da mutação i-.

Em seguida, foi feita uma análise de diplóides parciais gerados por sexdução, o que permitiu entender melhor o sistema.

Mutantes estruturais

Quando o operon lac z - y+ incorporado ao fator F' é transferido para uma linhagem F - z+ y -, os diplóides parciais (merozigotos) gerados, F z - y+ / z+ y -, são do tipo selvagem, ou seja, fermentam a lactose e produzem quantidades normais das enzimas b-galactosidase, permease e acetilase (Tabela 12.1), indicando que:

a) houve complementação, portanto, as mutações z - e y - pertencem a genes diferentes;b) z+ e y+são dominantes sobre z - e y -.

Os genes codificadores das enzimas (lacZ, lacY e lacA) foram nomeados genes estruturais.

Cristina M. Bonato150

Page 151: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Experimentos com merozigotos haviam demonstrado que mutações nos genes estruturais afetavam apenas a estrutura da enzima correspondente. Assim, mutantes z -, por exemplo, não produziriam b-galactosidase ativa, mas poderiam produzir permease e acetilase ativas.

Tabela 12. 1. Diplóides parciais dos genes estruturais

Genótipo Fenótipo Conclusão

F z - y +/ z+ y- Fermenta lactose Complementação total: z e y pertencem a cistrons diferentesF z+ y - / z- y+ Fermenta Lactose

F z+ y- / z+ y - Não fermenta Lactose

Não há complementação: mesmo cistron (y)

Mutantes i -, oC e iS

Nos mutantes constitutivos a transcrição do operon lac nunca está "desligada", mesmo na ausência de indutor. Experimentos de conjugação entre linhagens Hfr e F - , permitiriam mapear esta nova mutação, que se mostrou independente do operon lac, posicionando-se à montante de lac Z. O lócus foi nomeado lac I e a mutação i -. Os mutantes i - produzem as mesmas quantidades de enzimas (Z, Y e A) que o selvagem induzido. Tais fatos poderiam significar que o gene lac I codificava um Repressor do sistema, controlando negativamente a expressão dos três genes (Figura 12.4).

Figura 12. 4. Mutações no gene lac I podem redundar em expressão constitutiva (i -) ou suprimida (iS). Mutações em O podem redundar em mutação constitutiva (oC).

O outro tipo de mutação constitutiva mapeava entre o gene lac I e o lac Z e só tinha efeito sobre a expressão dos genes adjacentes, portanto, no mesmo cromossomo. Foi assim encontrado um sítio de ação em cis, ou seja, uma região de controle que só é ativa na mesma molécula, regulando genes adjacentes. Tais mutantes foram denominados oC (operator constitutive).

Como se testou a possibilidade de haver um repressor do sistema? Como foi possível distinguir entre os dois tipos de mutantes constitutivos?

Elucidando o Sistema: Diplóides Parciais e Indutores Gratuitos

Cristina M. Bonato 151

Page 152: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

A análise dos diplóides parciais envolvendo os genes estruturais e o regulador, assim como a utilização de indutores gratuitos, permitiu o estabelecimento de um modelo de regulação do operon lac.

O que são indutores gratuitos?

São b-galactosídios capazes de induzirem o sistema sem, todavia, serem substrato para a enzima b-galactosidase. Assim, se as bactérias crescerem em presença de glicerol como única fonte de carbono, pode-se analisar o efeito do indutor sob a síntese das enzimas independente da metabolização do b-galactosídio. O indutor mais eficiente do sistema foi o isopropil tiogalactosídio (IPTG) que passou, então, a ser utilizado nas análises subsequentes.

Quando os merozigotos com duplas mutações (F i - z+ y+/i+ z - y+ ou F i+ z+ y - / i - z+ y+) foram analisados, verificou-se que a produção das enzimas só ocorria na presença de IPTG (Tabela 12.2). Portanto:

a) o alelo induzível i+ era dominante sobre o alelo constitutivo i -;b) o alelo induzível i+ tinha ação em trans, em relação aos genes lac Z e lac Y.

Dos resultados obtidos podia-se inferir que:

a) lac I era um gene independente cujo produto, com ação em trans (atuava tanto no plasmídio como no cromossomo bacteriano), regulava negativamente a expressão de lac Z e lac Y;b) a função repressora do produto de lac I era antagonizada pelo indutor IPTG.

Tal idéia foi confirmada quando se isolou um outro tipo de mutante, o mutante iS. Em mutantes iS o operon lac está sempre reprimido, mesmo em presença do indutor. No merozigoto iS/i+ a transcrição do operon lac encontra-se travada, indicando que iS é dominante sobre i+. Tal comportamento sugeria que o repressor tinha perdido a capacidade de se ligar ao indutor mantendo, portanto, o operon lac desligado.

Quando o merozigoto F i + oC z- y+ / i + o+ z+ y+ foi testado, apesar da mutação constituiva oC

em F, a expressão de b-gal no diplóide parcial não é constitutiva mas, a da permease é constitutiva. Isto demonstrava que o Operador só agia em cis, ou seja, o oC plasmidial não tem qualquer efeito sobre a expressão do gene z+ presente no cromossomo. Uma vez que no cromossomo o Operador não está mutado, só ocorrerá expressão de b-gal quando houver indutor no meio. A permease, todavia, terá expressão constitutiva porque está sob ação de oC.

O isolamento dos mutantes oC (Figura 12.5.) permitiu definir claramente a existência do operador com ação em cis, numa época em que ainda não se seqüênciava o DNA nem estava desenvolvida a técnica de footprinting que permitiu estabelecer exatamente qual era o fragmento do DNA ao qual se ligava o repressor. Aliás, nem o próprio repressor havia sido isolado ( Isolando o Repressor). A descoberta deste sistema de regulação da expressão gênica foi feita por Jacob & Monod, valendo-lhes o Prêmio Nobel em 1965.

Tabela 12.2. Expressão do operon lac em haplóides e diplóides parciais na presença e ausência do indutor (IPTG)

Genótipo B-gal Permease Observações

- IPTG     - IPTG    

Cristina M. Bonato152

Page 153: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

+IPTG + IPTG

i+ o+ z+ y+ -       + -       + Repressor funcional

i - o+ z+ y+ +       + +       +Repressor não funcional.Não reconhece o Operador

i + oC z+ y+ +       + +       +Repressor funcional e Operador constitutivo

i S o+ z+ y+ -       - -       -Super Repressor: não se liga ao indutor.Ação em trans

F i - o+ z+ y+ / i + o+ z - y+ -       + -       +Repressor funcional agindo noDNA plasmidial. Ação em trans.

F i - o+ z- y+ / i - o+ z+ y- +       + +       +Repressor não-funcional.Não reconhece o Operador

F i + oC z- y+ / i + o+ z+ y+ -       + +       +Repressor funcional e operador constitutivo no plasmídio. Ação em cis.

F i + oC z+ y+ / i + o+ z+ y+ +       + +       +Repressor funcional e operador constitutivo no plasmídio. Ação em cis.

F i + o+ z+ y+ / iS o+z+ y+ -       - -       -Super Repressor: não se liga ao indutor.Ação em trans

F i - o+ z+ y+ / iS o+ z+ y+ -       - -       -Super Repressor: não se liga ao indutor.Ação em trans

Figura 12. 5. Seqüência de DNA do Operador, a qual é reconhecida pelo Repressor. Estão indicadas mutações identificadas neste sítio e que tornam o operador constituti-vo.

Controle Negativo: O Repressor em Ação

O gene regulador lac I codifica uma proteína repressora que impede a transcrição do operon lac ao nível do DNA. A ação do repressor é antagonizada pelo indutor (IPTG, alolactose).

O repressor lac é uma proteína tetramérica, alostérica, que reconhece uma seqüência específica do DNA denominada operador. Enquanto proteína alostérica, possui sítios para ligação tanto com o DNA como com o indutor, de sorte que cada vez que se liga a uma das moléculas, sua conformação é alterada e sua habilidade de reagir com a outra molécula é afetada. Na ausência do indutor, liga-se ao DNA. Na presença de indutor, liga-se a ele, o que diminui significativamente sua afinidade pelo sítio operador no DNA

Cristina M. Bonato 153

Page 154: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Alguns nucleotídeos do operador sobrepõem-se aos do promotor, onde se liga a RNA polimerase. Assim, quando o repressor está ocupando sua posição no operador, a RNA polimerase não pode atuar - operon desligado (Figura 12. 6). Os genes do operon lac só serão liberados para transcrição quando o indutor ligar-se ao repressor - operon ligado (Figura 12. 7). Quando a concentração do indutor diminui dentro da célula, o repressor volta a conformação anterior e liga-se ao DNA, "desligando" o operon

Figura 12. 6. Operon Lac Des-ligado. Quando o tetrâmero re-pressor liga-se ao sítio Operador, impossibilita a ação da RNA poli-merase.

Figura 12. 7. Operon Lac Ligado. Na presença do Indutor, o tetrâmero repressor é inativado. O sítio ope-rador livre não bloqueia mais a ação da RNA polimerase.O operon lac é transcrito e o mRNA poligênico traduzido, gerando as enzimas b-galactosidase, permease e acetilase.

Controle Positivo: CAP-cAMP em Ação

Quando a bactéria E. coli é cultivada em presença de glicose + lactose, a expressão do operon lac permanece inibida até que a lactose seja exaurida. A repressão do operon lac pela glicose é denominada repressão pelo catabólito e é o resultado dos baixos níveis de cAMP intracelular, característico de células crescendo com suprimento adequado de glicose. Quando o nível de glicose cai, os níveis de cAMP aumentam e, simultaneamente os galactosídios induzem o sistema ligando-se ao repressor. Em conseqüência, o promotor é liberado para ligação da RNA polimerase.

Como agem as moléculas de cAMP?

cAMP interage com a proteína CRP (cAMP receptor protein), também denominada CAP (catabolite activator proteina). O complexo cAMP/CAP, na forma de um dímero tem afinidade por

Cristina M. Bonato154

Page 155: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

uma região do promotor, à montante da região onde a RNA polimerase se liga. A ligação do complexo facilita a ligação da RNA polimerase, aumentando em 50 vezes sua atividade (Figura 12. 8).

Figura 12. 8. A glicose inibe a atividade da Adenilato Ciclase, a qual sintetiza cAMP a partir de ATP. Em conseqüência, a concentração de cAMP diminui dentro da célula, não ativando eficientemente o fator de transcrição CAP. O complexo CAP-cAMP é um ativador do Operon Lac. Sem ele a transcrição é bastante ineficiente porque o promotor Lac é um promotor fraco, ou seja, um promotor pelo qual a RNA polimerase tem baixa afinidade. Isto porque a seqüência do promotor difere um pouco do consenso, dificultanto o reconhecimento pelo fator sigma 70 (s70). Daí a necessidade de ajuda.

O Operon Lac é um modelo tanto de controle positivo como negativo. O repressor codificado pelo gene lac I mantem o sistema trancado (controle negativo), até que ele seja induzido por um b-galactosídio. Já o complexo cAMP/CAP é imprescindível para a ocorrência da transcrição, pois propicia a ligação da RNA polimerase (controle positivo). Mesmo em presença do indutor, se o sítio de ligação do complexo cAMP/CAP estiver alterado, a transcrição ocorrerá em níveis baixíssimos.Logo, a lactose só age como indutor na ausência de glicose. Sempre que glicose e lactose estiverem presentes no meio o operon lac não será induzido, até que a concentração de glicose decaia.

O Fago Lambda: Lise ou Lisogenia?

Os vírus são estruturas muito especiais e simples constituídas, basicamente, de uma molécula de ácido nucléico envolvida por uma capa protetora. A molécula de ácido nucléico contem a informação genética do vírus, a qual será transmitida às novas gerações de partículas virais. Para se reproduzirem precisam infectar uma célula. São, portanto, parasitas celulares. Tanto células de eucariotos como de procariotos podem ser infectadas por vírus. Em geral as células apresentam sítios receptores específicos para determinados vírus de sorte que a interação célula-vírus é específica. Uma célula que permite infeção por um determinado vírus é denominada célula hospedeira. Vírus que infectam bactérias são denominados bacteriófagos ou, simplesmente, fagos. Aos vírus que infectam as células vegetais ou animais referimo-nos, de um modo geral, como vírus vegetais e vírus animais.

A informação genética dos vírus pode estar contida em moléculas de DNA ou de RNA

Nunca DNA e RNA coexistem em uma mesma partícula viral. Na maioria das vezes o DNA é fita dupla e o RNA é fita simples. Todavia, podem ser encontrados vírus de DNA fita simples e

Cristina M. Bonato 155

Page 156: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

vírus de RNA fita dupla. Em alguns vírus a quantidade de informação disponível é suficiente para codificar de 3 a 10 tipos de proteínas enquanto em outros são codificadas de 100 a 200 tipos. A partícula viral infecciosa é denominada vírion e consiste de ácido nucléico protegido por uma capa protéica.

A capa protetora viral é constituída principalmente de proteínas

A capa protetora, denominada capsídeo, constituída de uma pequena variedade de proteínas, é específica para cada tipo de partícula viral. Em alguns exemplos conhecidos, moléculas de carboidratos e lipídeos também fazem parte do capsídeo. Na maioria das vezes, o volume interno do capsídeo, é apenas levemente superior ao volume ocupado pelo próprio ácido nucléico.

Em alguns vírus muito simples, o capsídeo tem um único tipo de proteína, com centenas de cópias idênticas arranjadas em estrutura regular, helicoidal, em torno do ácido nucléico. Este é o caso do vírus vegetal TMV, vírus do mosaico de tabaco, que é um vírus de RNA. Durante a montagem do capsídeo, as proteínas são arranjadas em volta do RNA, condensando-o, via interações RNA-proteína (Figura 12. 9).

Figura 12. 9. No TMV, o capsídeo é um filamento de ~2.000 moléculas idênticas de proteínas arranjadas helicoidalmente em torno da molécula central de RNA fita simples, que contem, ~6000 nucleotídeos (2nm).

O bacteriófago Lambda (l), que infecta E. coli, contem mais de um tipo de cadeia polipeptídica e apresentam um capsídeo com simetria icosaédrica (poliedro de 20 faces). O capsídeo é construído como uma concha vazia e só então o ácido nucléico (DNA dupla fita) é inserido, condensando-se conforme vai entrando. Assim, o empacotamento é posterior à construção do capsídeo ao qual se conecta uma cauda com fibras terminais que são utilizadas no processo de reconhecimento e infeção do hospedeiro (Figura 12.10).

Figura 12. 10. No capsídeo do bacteriófago l está empacotada uma molécula de DNA dupla fita de ~ 50Kb codificando cerca de 50 proteínas. O DNA é inserido na cabeça vazia, que se expande durante o processo. A estrutura é estabilizada pela adição da cauda e fibras, originando a partícula madura.

Em alguns casos, como no do HIV, um vírus animal de RNA, o capsídeo é envolvido por uma membrana (vírus de envelope). A aquisição do envelope ocorre via um processo de brotamento ao nível da membrana plasmática (Figura 12. 11).

Cristina M. Bonato156

Page 157: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 12. 11. Vírus animal com envelope. O envelope é constituído da bicamada lipídica e proteínas específicas da membrana plasmática da célula infectada.

Controle Temporal na Expressão dos Genes Virais

Ao infectar a célula hospedeira o vírus injeta uma molécula de ácido nucléico dentro da célula livrando-se da capa protetora. No caso do bacteriófago l, as fibras terminais da cauda interagem com uma proteína de membrana da E. coli, responsável pelo transporte de maltose, codificada pelo gene lamB. Esta interação inicia um processo pouco compreendido, no qual o DNA linear do fago é injetado na célula hospedeira. Assim que penetra no hospedeiro, o DNA do l se circulariza, uma vez que apresenta terminais 3' e 5' complementares (terminais coesivos) que são covalentemente ligados pela ligase do hospedeiro. A molécula invasora será utilizada como molde para a síntese de mRNAs virais e também para a síntese de novos genomas virais. A tradução dos mRNAs virais leva à produção de enzimas e proteínas estruturais envolvidas no ciclo de desenvolvimento do fago.

Todavia, a expressão dos genes virais é rigidamente controlada ao nível de transcrição. Algumas moléculas de mRNAs virais, produzidas imediatamente após a infecção, codificam proteínas reguladoras que controlam a expressão posterior de outros genes, criando-se uma cascata na qual grupos de genes são ligados ou desligados no momento exato.

Freqüentemente observa-se uma correlação entre a ordem temporal de expressão dos genes e a ordem espacial de organização dos genes nos cromossomos. O bacteriófago l é um exemplo marcante desta correlação (Figura 12. 12). Os genes que codificam proteínas com funções relacionadas estão todos agrupados permitindo que sejam controlados por um número reduzido de promotores e proteínas reguladoras.

Ao infectar a bactéria E. coli, o fago l pode seguir dois caminhos:

Seu genoma replica-se vegetativamente originado novas partículas fágicas e lisando a célula hospedeira (via lítica);

Seu genoma integra-se ao genoma do hospedeiro e aí permanece silencioso por longo tempo, duplicando-se juntamente com o cromossomo do hospedeiro, sem lisar a célula (via lisogênica).

Cristina M. Bonato 157

Page 158: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 12. 12. Mapa genético do fago l na forma circular intracelular. Antes de ser empacotado dentro do capsídeo o DNA do fago é cortado no sítio cos, tornando-se linear. O genoma do l possui cerca de 50.000 pb. Os promotores/operadores PLOL e PROR controlam a transcrição à esquerda e à direita, respectivamente. Inicialmente são trans-critos os genes reguladores. Dependendo do equilí-brio momentâneo entre as proteínas reguladoras, desencadeia-se a transcrição, à esquerda, de genes emvolvidos na integração do genoma do vírus ao genoma do hospedeiro (lisogenia) ou a transcrição, à direita, de genes envolvidos na montagem de partículas virais (lise).

Via Lítica de Desenvolvimento

Na via lítica de desenvolvimento há multiplicação das partículas virais com morte da célula hospedeira. A seqüência de eventos no ciclo lítico pode ser resumida em:

O fago é adsorvido ao receptor presente na superfície da bactéria; O DNA é injetado na célula; Inicia-se a transcrição dos genes virais; Os mRNAs são traduzidos pela maquinaria do hospedeiro; O ácido nucléico do fago replica e recombina; Os capsídeos são montados e o DNA é empacotado com posterior adesão da haste e fibras; O cromossomo bacteriano é degradado; A célula hospedeira é lisada; Dezenas de partículas virais são liberadas (Figura 12. 13).

Figura 12. 13 Infecção fágica da bactéria E. coli. Os primeiros genes a serem transcritos são os genes reguladores. A seguir são transcritos os genes que codificam enzimas envolvidas na síntese, recombinação e modificação do DNA, levando a uma produção massiva do genoma do fago. Posteriormente são ativados genes que codificam os componentes protéicos que participam da estrutura e montagem da partícula viral.

Via Lisogênica de Desenvolvimento

Na via lisogênica de desenvolvimento o fago integra-se ao cromossomo da célula hospedeira, sem lise celular.

Cristina M. Bonato158

Page 159: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

O bacteriófago l é um exemplo de fago que apresenta tanto a via lítica como a lisogênica. Quando o DNA do l está integrado ao cromossomo bacteriano a replicação autônoma do cromossomo do fago fica reprimida e o fago só se duplica a cada divisão celular da bactéria, como parte integrante do cromossomo hospedeiro. Esta forma de perpetuação do genoma do fago não implica nem na morte da célula nem na liberação de partículas virais, uma vez que a maioria dos genes virais estarão reprimidos.

O genoma viral integrado e inativo é denominado profago. Este tipo de interação fago-hospedeiro é denominada lisogenia e as células hospedeiras são denominadas lisogênicas. Fagos capazes de estabelecerem este tipo de interação com a célula hospedeira são denominados fagos temperados (Figura 12. 14).

Figura 12. 14. Ciclo lisogênico. Fagos temperados como o bacteriófago l podem optar pelo ciclo lítico ou lisogênico. As recombinases codificadas pelo fago são responsáveis pela integração do genoma do fago ao cromossomo bacteriano. Após integração, a expressão gênica do fago ficará quase que completamente reprimida. Na condição de profago não provocará qualquer dano à célula hospedeira.

A opção entre as vias lítica e lisogênica de desenvolvimento é governada por proteínas codificadas tanto pelo genoma do fago como da bactéria e, também, pelas condições de infecção. Dependendo do estado escolhido, lítico ou lisogênico, diferentes conjuntos de genes serão transcritos a partir do genoma viral. Uma vez que um ou outro padrão de transcrição tenha se estabelecido, ele é mantido estavelmente. O fago lintegrado poderá permanecer latente no genoma hospedeiro de E. coli por milhares de gerações celulares. Bactérias lisogênicas são imunes à infecção por outras partículas virais do mesmo tipo, ou seja, se uma bactéria lisogênica for infectada por um fago de mesmo tipo ele não poderá se multiplicar.

Transcrição Precoce

De acordo com sua ordem de expressão, podemos distinguir três grupos de genes no fago l: precoce imediato, precoce posterior e tardio. Quando o fago l infecta a célula bacteriana, seu DNA se circulariza e começa a ser transcrito via RNA polimerase do hospedeiro, a partir dos promotores PL (Left, esquerda) e PR ( Right, direita). Os primeiros genes transcritos codificam proteínas reguladoras que controlarão os passos posteriores de desenvolvimento. Os genes reguladores estão todos agrupados numa região específica do cromossomo sob o comando dos promotores PL, PR e PRM.

Cristina M. Bonato 159

Page 160: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Na fase precoce imediata de transcrição os promotores PL e PR controlam, respectivamente, a expressão de genes N (à esquerda) e cro (à direita), transcritos em sentidos opostos. Isto implica que fitas complementares são utilizadas como molde pela RNA polimerase. Entre os dois promotores encontra-se o gene cl e seu promotor PRM (Figura 12. 15).

Figura 12. 15. O fago l apresenta duas unidades de transcrição precoce imediatas. A fita “superior” é transcrita para a esquerda e a “inferior” para a direita, a partir dos promotores PL e PR. Os sinais de terminação da transcrição, tL1 e tR1 estão indicados, assim como os sítios nut, locais de reconhecimento da proteína antiterminadora N. Os genes N e cro codificam funções precoces imediatas e estão separados dos genes precoces posteriores por seus terminadores. Nesta fase inicial o gene cl não é transcrito.

O gene N, regulado pelo promotor PL, codifica uma proteína antiterminadora que se liga às seqüências nut (do inglês, N utilization) e interage com a RNA polimerase impedindo que ela reconheça os sítios usuais de terminação, tL1 e tR1. O fato da RNA polimerase ignorar os sítios de terminação permite que a transcrição avance, tanto à direita como à esquerda. Inicia-se, assim, a fase precoce posterior, com a transcrição dos genes reguladores cll e clll, os quais controlam a expressão do gene cl. Também nesta fase são transcritos genes necessários à replicação do fago (O e P) e à integração do fago no cromossomo hospedeiro (att, int, xis, a, b e g) assim como de outro antiterminador codificando a proteína Q (Figura 12. 16).

Figura 12. 16. Transcrição dos genes reguladores cll e clll na fase precoce posterior assim como do antitermindor Q. Os sítios terminadores tL1 e tR1 são ignorados pela RNA polimerase quando a enzima interage com o antiterminador N, ligado aos sítios nut.

As proteínas Cll e a Clll são reguladores positivos, capazes de ativar a transcrição do gene cl, propiciando a lisogenia. A proteína Q também é um regulador positivo que age como um antiterminador dos genes de transcrição tardios envolvidos na síntese de proteínas da cabeça, cauda e lise. Assim, enquanto o antiterminador N permite que se avance para a fase precoce posterior de transcrição, o antiterminador Q permite que se avance para fase tardia da cascata lítica desde que as condições sejam propícias.

Cristina M. Bonato160

Page 161: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

O fato do fago l utilizar antiterminadores para assegurar a transcrição em estágios subsequentes permite que os mesmos promotores iniciais, PL e PR, sejam utilizados para transcrever quer os genes da via lítica quer os genes da via lisogênica. Como é tomada a decisão?

Competição Cro X Cl

No bacteriófago l os reguladores Cro e Cl e a enzima RNA polimerase competem pela mesma região do DNA.

O gene cl, codifica a proteína reguladora Cl, capaz de ligar-se às regiões PR/OR e PL/OL. Quando ligada, bloqueia a transcrição de todos os genes do fago ao mesmo tempo que ativa a transcrição de seu próprio gene à partir do promotor PRM. Por esta razão Cl é denominado repressor do l e é responsável pela manutenção do estado lisogênico.

O gene cro, regulado pelo promotor PR, codifica a proteína reguladora Cro. A proteína Cro também se liga às mesmas regiões PR/OR e PL/OL, competindo com Cl. Quando Cro se instala na região reguladora a transcrição do gene cl fica reprimida. Por esta razão a proteína Cro é considerada um anti-repressor de l.

A própria organização dos genes no cromossomo do fago, permite esta competição. Os promotores PR e PRM à direita e PL à esquerda, estão sobrepostos aos sítios operadores OR e OL, respectivamente. O operador OR é constituído de três sítios discretos de reconhecimento: OR1, OR2 e OR3. Estes sítios são semelhantes, mas não idênticos. As proteínas Cro e Cl apresentam afinidades diferentes por eles. Cl, p. ex., possui maior afinidade por OR1 enquanto Cro possui maior afinidade por OR3.

O arranjo espacial de operadores e promotores que se sobrepõem, regulando a expressão de operons à esquerda e à direita, é crucial na opção lise/lisogenia (figuras 12. 17 e 12. 18).

Logo, a transcrição dos genes cl e cro é mutuamente exclusiva. Como este sistema é regulado? O que determina que Cl ligue-se a seus sítios operadores antes de Cro ou vice-versa? Muitos dos mecanismos que controlam este sistema já foram esclarecidos e, aparentemente, a opção por um tipo de desenvolvimento ou outro do fago dependerá, em última instância, das condições apresentadas pela célula hospedeira. Os sinais transduzidos pela bactéria modularão a atividade do regulador positivo de transcrição, a proteína Cll, elemento chave neste processo.

Figura 12. 17. Circuito autógeno na manutenção da lisogenia. Cl liga-se a OR1/OR2 e OL1/OL2, pelos quais tem alta afinidade, impedindo a transcrição dos genes cro e N, respectivamente e

Cristina M. Bonato 161

Page 162: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

facilitanto a do gene cl a partir de PRM (do inglês, Repressor Maintenance)

Figura 12. 18. Estabelecimento do ciclo lítico. Na ausência de Cl, as proteínas tardias são sintetizadas e Cro acaba ocupando os operadores OR3/OR2 e OL3/OL2, pelos quais tem alta afinidade, impedindo a transcrição de cl.

O Regulador Positivo Cll

A opção entre lise e lisogenia depende dos níveis relativos de atividade das proteínas reguladoras CII e Cro.

O fator de transcrição Cll ativa a transcrição a partir de dois promotores no DNA do fago: PI e PRE (de Repressor Establishment). Ao ligar-se a estes promotores permite uma atuação mais eficiente da RNA polimerase. Os promotores PI e PRE controlam, respectivamente, a transcrição do gene int e a transcrição inicial do gene cl (Figura 12. 19).

O produto do gene int é uma recombinase (integrase) envolvida na inserção do fago no cromossomo bacteriano, enquanto o gene cl produz o repressor do l. Logo, Cll cria as condições ideais para que se instale a via lisogênica de desenvolvimento. A transcrição de cl a partir do promotor PRE utiliza como molde a fita oposta à utilizada na transcrição do gene cro produzindo, conseqüentemente, um transcrito antisense de cro, que pode hibridizar com o mRNA de cro inibindo sua tradução.

Cristina M. Bonato162

Page 163: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Figura 12. 19. O circuito lisogênico é mantido pela proteína Cl. A expressão inicial do gene cl depende da ação da proteína reguladora Cll que ao ligar-se ao promotor PRE permite o reconhecimento deste promotor pela RNA polimerase que transcreverá o gene cl à esquerda. Cll também agirá sobre o promotor PI, ativando a transcrição do gene que codifica a integrase. O 5' terminal do mRNA transcrito a partir de PRE é o antisense de cro.

A tradução dos primeiros mensageiros cl produz os monômeros de Cl que se unem formando dímeros (repressor) com alta afinidade pelo sítio OR1. Assim que o dímero liga-se ao sítio OR1, o sítio OR2 torna-se muito mais atrativo a outro dímero repressor, sendo imediatamente preenchido. Este fenômero é chamado cooperatividade. Uma vez instalado no sítio OR2, o dímero permitirá que a RNA polimerase ligue-se ao sítio promotor à esquerda, PRM. A partir deste momento a transcrição do gene cl ocorrerá via promotor PRM e não necessitará mais de Cll, uma vez que o repressor Cl exercerá controle positivo sôbre a transcrição de seu próprio gene (Figura 2.11).

Instala-se, assim, o circuito autógeno onde o gene cl é continuamente transcrito. Ao mesmo tempo, como os sítios OR1 e OR2 estão preenchidos com a molécula repressora, a RNA polimerase fica impedida de ligar-se ao promotor da direita, PR e, consequentemente, a transcrição do gene cro e dos genes subsequentes estará reprimida (controle negativo). Fenômeno semelhante ocorre à esquerda, em relação ao promotor PL. Desta forma a lisogenia é mantida estavelmente através de gerações.

É a síntese continuada do repressor que explica o fenômero da imunidade à infecção por outro fago de mesmo tipo. Se um outro fago l infectar uma bactéria lisogênica, as moléculas repressoras Cl, sintetizadas pelo genoma do profago ligar-se-ão imediatamente aos operadores OL e OR do novo invasor impedindo sua duplicação e a entrada no ciclo lítico.

Cll é Degradada por uma Protease Bacteriana

Uma vez que Cll controla a transcrição de cl, a partir do promotor PRE, resta saber quem controla a atividade da Cll.

Cristina M. Bonato 163

Page 164: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

A proteína Cll é extremamente instável "in vivo" porque é degradada pela protease HflB/FtsH, sintetizada pelo gene hflB (do inglês high frequency of lysogeny) também denominado ftsH, do cromossomo de E. coli. Mutantes hflB/ftsH apresentam alta freqüência de lisogenia, uma vez que a protease HflB está ausente. HflB é uma proteína transmembrana com atividade de protease dependente de ATP. Perda de sua função estabiliza Cll e a super produção da protease acelera a degradação de Cll (Kihara et al. , 1997 ).

A ação da protease HflB é modulada pelo complexo HflKC (HflA), que reside na margem periplasmática da membrana plasmática de E. coli. HflB tem afinidade por HflKC(HflA) formando um complexo hetero oligomérico in vivo. A modulação transmembrana permitiria acoplar os rumos do desenvolvimento do fago às condições do meio ambiente.

Por outro lado, a ação da protease HflB sobre Cll pode ser controlada pela proteína Clll, codificada no genoma do fago. Recentemente foi demonstrado que a ação de Cll também pode ser controlada pelo RNA oop, um RNA antisense de Cll. Concentrações elevadas do RNA oop tornam o processo de lisogeinização do hospedeiro ineficiente.

Portanto, o desencadeamento da via lisogênica depende da relação entre as atividades dos genes cll e clll do fago e dos genes hflB/ftsH e hflA do hospedeiro, uma vez que estas atividades, em última instância, vão afetar as concentrações relativas de Cro e Cl. Mutações que tornam inativos os produtos dos genes cl, cll ou clll determinam o desenvolvimento lítico do fago enquanto mutação no gene hflB/ftsH aumenta a lisogenia.

Quando a célula hospedeira está crecendo em um meio rico, o desenvolvimento lítico é privilegiado formando-se inúmeras partículas fágicas. Por outro lado, em células que se encontram em um meio carente há uma tendência à lisogenia. Assim, é provável que um sensor de membrana capte os sinais nutricionais repassando-os para a protease via complexo HflKC que modula a atividade de HflB/FtsH. Desta forma, a proteólise intracelular de Cll poderia ser controlada por eventos que ocorrem na superfície da célula. Resumindo, para que o fago faça a opção pelo ciclo lítico, a atividade da Clll deve estar baixa e a proteína HflB/FtsH ativa. Isto diminuirá os níveis de atividade de Cll e, consequentemente, não haverá síntese do repressor Cl dirigida pelo promotor PRE.

A proteína Cro, na ausência de seu competidor, liga-se ao sítio OR3 impedindo a transcrição a partir do promotor PRM. Em compensação, o promotor PR à direita, estará livre e a transcrição dos genes tardios, envolvidos no ciclo lítico, será ativada pela proteína antiterminadora Q. Conforme aumenta a concentração da proteína Cro ela ocupará os sítios OR2 e OR1 do operador, pelos quais tem baixa afinidade, impedindo a transcrição a partir de PR e PL. Todavia, neste momento, já existe quantidade suficiente do antiterminador Q para dirigir a transcrição dos genes tardios.

Indução do Profago

A indução do profago depende da degradação do repressor Cl. Como romper o circuito autógeno, que mantem a produção de Cl?

Quando uma população de bactérias lisogênicas é exposta brevemente a um agente que provoque danos ao DNA, como por exemplo a radiação ultra-violeta (UV), o repressor do l é inativado por ação da proteína RecA da bactéria, que estimula a clivagem autocatalítica do repressor Cl (Voet & Voet,1995)

Cristina M. Bonato164

Page 165: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

O repressor CI é um dímero constituído de dois monômeros idênticos (Figura 12. 20). Cada monômero possui dois domínios distintos. O domínio N-terminal está envolvido na ligação ao sítio operador no DNA. O domínio C-terminal está envolvido na associação dos monômeros para formar o dímero ativo. É o dímero que tem alta afinidade pelo DNA. A ação da protease sôbre o repressor é digerir a conexão entre os dois domínios do monômero. Como a afinidade dos domínios N-terminais pelo DNA é controlada pela dimerização dos domínios C-terminais, a clivagem resulta na dissociação do repressor do DNA. Consequentemente, a transcrição de cI diminui e a de cro aumenta; o genoma do fago é excisado do cromossomo bacteriano; instala-se o ciclo lítico de desenvolvimento.

Este processo é denominado indução do profago e corresponde a uma resposta dramática da célula à alterações transitórias no meio ambiente (Figura 12. 21).

Figura 19. 20. O monômero do repressor é um polipeptídeo de 27.000 daltons com domínios distintos. Os domínios C-terminais associam-se formando dímeros e os domínios N-terminais ligam-se ao sítio operador do DNA. O domínio N-terminal contem 5 segmentos de a-hélice. As a-hélices 2 e 3 ligam DNA.

Figura 12. 21. No processo de indução do profago, a RecA estimula a autoproteólise dos monômeros de Cl separando os dois domínios.

Cristina M. Bonato 165

Page 166: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Conclusões

A decisão lise-lisogenia, depende, de quem ocupará primeiro as regiões PL/OL e PR/OR: Cl ou Cro. A RNA polimerase, o repressor Cl e a proteína Cro, competem pelas mesmas regiões de controle de forma mutuamente exclusiva e cooperativa. A instalação de Cl ou Cro depende de suas concentrações relativas, as quais são afetadas pelas atividades de Cll, Clll, HflB e HflA. A presença de múltiplos operadores e a ligação cooperativa do repressor Cl são fundamentais na mudança de estado do l, frente as condições do hospedeiro.

Guia de estudos

Defina: fago l; virion; capsídeo; profago; fago temperado; lisogenia; infecção lítica; antiterminador; operador; mRNA antisense; cooperatividade; nut .

Quantas vezes o genoma do l é maior que o do TMV?

Como vírus animais podem adquirir seu envelope?

Quais são as proteínas reguladoras codificadas pelo fago l?

Como os genes estão organizados no cromossomo do l?

Porque bactérias lisogênicas são imunes à infecção por outras partículas virais de mesmo tipo?

Que genes do l são imediatamente transcritos após a infecção? A partir de que promotores?

Quais as conseqüências de uma mutação, com perda de função, no gene cro?

Quais as conseqüências de uma mutação, com perda de função, no gene cl ?

Porque as transcrições de cro e cl são mutuamente exclusivas?

Qual a vantagem de utilizar antiterminadores?

Se um fago l mutado no gene clll, com perda de função, infectar uma célula mutada no gene hflB, também com perda de função, que tipo de desenvolvimento mais provavelmente acontecerá, lítico ou lisogênico? Porque?

Porque a transcrição do gene cl a partir do promotor PRE inibe a tradução dos mRNA cro?

Qual a conseqüência de uma mutação no gene recA da bactéria hospedeira lisogênica?

Explique o circuito autógeno de manutenção da lisogenia.

Qual a função do RNA oop?

Como explicar a transcrição dos genes tardios depois de Cro ligar-se a PR/OR e PL/OL?

Cristina M. Bonato166

Page 167: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

REFERÊNCIAS

Leitura Básica

Alberts, B.; Bray, D.; Lewis, J.; Raff, M.; Roberts, K. & Watson, J., 1997 – Biologia Molecular da Célula – Tradução Arnaldo Zaha, 3a edição, Editora Artes Médicas, Porto Alegre–RS

Azevedo, J. L., 1998 –Genética de Microrganismos – Editora da Universidade Federal de Goiânia, Goiânia–GO

Birge, E. A., 1994 – Bacterial and Bacteriophage – 5d edition – Spring–Verlag New York Inc.

Bonato, M.C.M., 1998 – Assimetrias e Destinos – Texto didático. Griffiths et al., 1996 - An Introduction to Genetic Analysis - Freeman and Company, 6th ed. New York, NY.

Hartl, D.L. & Jones, E.W., 1998 - Genetics. Principles and Analysis, 4th ed, Jones and Bartlett Plub., USA.

Hausmann, R., 1997 - História da Biologia Molecular – Trad. Celma E. Lynch de Araújo Hausmann – Sociedade Brasileira de Genética (SBG) – Ribeirão Preto – SP.

Judson, H.F., 1996 - The Eighth Day of Creation: The Makers of the Revolution in Biology Cold Spring Harbor, NY: Cold Spring Harbor Laboratory Press.

Lewin, B, 2000 - Gene VII - Oxford University Press Inc., New York.

Lodish et al., 1995 - Molecular Cell Biology, 3d ed, Scientific American Books, Inc. NewYork.

Leningher, AL.; Nelson, DL & Cox, MM.,1995 - Princípios de Bioquímica – 2a ediçãoo – Sarvier Editora, São Paulo-SP.

Snyder, L. & Champness, W., 1997 - Molecular Genetics of Bacteria - ASM Press, Washington, D.C.

Tamarin, R. H., 1996 - Principles of Genetics – 5th ed , Wm. C. Brown Publishers.

Voet & Voet, 1995 - Biochemistry – John Wiley & Sons, Inc., 2nd ed. USA.

Bibliografia Especializada

Capítulo 1

Baltimore, D. (1970) Viral RNA-Dependent DNA polymerase. Nature 226:1209-1211.

Cech, T.R. (1986) RNA as an enzyme. Scientific American, november: 64-75.

Crick, F. (1970) Central dogma of molecular biology. Nature 227:561-563.

Cristina M. Bonato 167

Page 168: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Spiegelman, S., I. Haruna, I. B. Holland, G. Beaudreau & D. Mills (1965) The synthesis of a self-propagting and infectious nucleic acid with a purified enzyme. Proc. Natl. Acad. Sci. 54: 919-927.

Temin, H. M. & S. Mizutani (1970) Viral RNA -Dependent DNA polymerase. Nature 226: 1211-1213.

Watson, J.D. & Crick, F.H.C. (1953a) Molecular structure of nucleic acid. A structure for deoxyribose nucleic acid. Nature 171: 737-738.

Watson, J.D. & Crick, F.H.C. (1953b) Genetic implications of the structure of deoxyribonucleic acid. Nature 171: 964-967.

Capítulo 2

McClintock, B. (1951) Chromosome organization and gene expression. Cold Spring Harbor Symp. Quant. Biol. 16: 13-57

Mendel, G. (1866) Experiments in Plant Hybridization in Genetics: readings from Scientific American pp. 8-17. W.H. Freeman and Company, San Francisco-USA.

Morgan, T.H. (1910) Sex-linked inheritance in Drosophila. Science 32: 120-122

Sturtvent, A.H. (1913) The linear arrangement of six sex-linked factors in Drosophila as shown by mode of association. J. Exp. Zool. 14: 39-45

Sutton, W.S. (1903) The chromosome in heredity. Biol. Bull. 4: 231-251.

Capítulo 3

Avery, O., MacLeod, C. & McCarthy, M. (1944) Studies on the chemical nature of the substance inducing transformation of pneumococcal types. J. Exp. Med. 79: 137-158.

Franklin, R.E. & Gosling, R.G. (1953) Molecular configuration in sodium thymonuclease. Nature 171: 740-741.

Griffith, F. (1928) Significance of pneumococcal types. J. Hygiene 27:113-159.

Hershey, A. & Chase, M. (1952) Independent functions of viral protein and nucleic aid in growth o bacteriophage. J. Gen. Physiol. 36: 39-56.

Prusiner, S.B. (1995) The prion diseases. Scientific American, january: 48-57.

Prusiner, S.B. (1998) Prions. Proc. Natl. Acad. Sci. 95:13363-13383.

Capítulo 4

Cairns, J. (1963) The chromosomes of E. coli. Cold Spring Harbour Symp. Quant. Biol. 28: 43-46.

Chargaff, E. (1950) Chemical specificity of nucleic acids and mechanisms of their enzymatic degradation. Experientia 6: 201-240.

Cristina M. Bonato168

Page 169: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Kornberg, A & Baker, T.A. DNA replication, 2nd ed. New York, W.H. Freeman & Company.

Meselson, M. & Stahl, F.H. (1958) The replication of DNA in Escherichia coli. Proc. Natl. Acad. Sci. USA 44: 671-82.

Capítulo 5

Baker, T. A. & Bell, S. P. (1998) Polymerases and the replisome: machines within machines. Cell 92:295-305.

Blackburn, E. H. (1990)Telomeres and their synthesis. Science 249:489

Greider, C.W. (1995) Telomerase biochemistry and regulation in Telomeres ed. by E. H. Blackburn & C. W. Greider, Cold Spring Harbor Laboratory Press, NY, pg. 35-68.

Kornberg, A (1960) Biogical synthesis of deoxyribonucleic acid. Science 131: 1503-1508.

Lingner, J & Cech, TR (1998) Telomerase and chromosome end maintenance Cur. Op. Gen. Dev.8: 226-232.

Okasaki, R. et al. (1968) In vivo mechanism of DNA chain growth. Cold Spring Harbour Symp. Quant. Biol. 33: 129-143.

Price, CM(1999) Telomeres and telomerases: broad effects on cell growth Cur.Op. Gen. Dev. 9:218-224.

Capítulo 6

Brennan, CA; Dombroski, AJ; Platt, T. (1987) Transcription termination factor rho is na RNA-DNA helicase. Cell 48: 945-52

Brenner, S., Jacob, F. & Meselson, M. (1961) Un unstable intermediate carrying information from genes to ribosomes for protein synthesis. Nature 190:576-585.

Bussard, A., Nanos, S., Gros, F. & Monod, J. (1960) Effects d'un analogue de l'uracil sur les proprietés d'une protéine enzymatique synthetisée en sa presence. Compt. Rend. Acad. Sci. (Paris) 250: 4049-4051.

Davern, C.L. & Meselson, M. (1960) The molecular conservation of ribonucleic acid during bacterial growth. J. Mol. Biol. 2: 153-160.

Gamow, G (1954) Possible relation between deoxyribonucleic acid and protein structures. Nature 173: 318.

Hall, B.D. & Spiegelman, S. (1961) Sequence complementarity of T2-DNA and T2-specific RNA. Proc. Natl. Acad. Sci. 47: 137-146.

Hoagland, M.B., Stehpenson, M.L., Scott, J.F., Hecht, L.I. & Zamecnik, P.C. (1958) A soluble ribonucleic acid intermediate in protein synthesis, J. Biol. Chem. 231: 241-257.

Jacob, F. & Monod, J. (1961) Genetic regulatory mechanisms in the synthesis of proteins. J. Mol. Biol. 3: 318-356.

Cristina M. Bonato 169

Page 170: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Sharp, P. & Roberts,R.(1977)

Zamecnik, P.C. & Keller, E.B. (1954) Relation between phosphate energy donors and incorporation of labeled amino acids in proteins. J. Biol. Chem. 209: 337-353.

Zamecnik, P.C., Stephenson, M.L. & Scott, J.F. (1960) Partial purification of soluble RNA Proc. Natl. Acad. Sci. USA 46: 811-822.

Capítulo 7

Cech, T.R. (1986) RNA as an enzyme. Sci. Am. 255 (5): 64-75.

Doolittle, R.F. (1991) Counting and discount tne universe of exons. Science 253: 677-679.

Kyrpides, N.C. & Ouzounis, C. (1999) Transcription in Archaea. Proc. Natl. Acad. Sci. 96: 8545-8550.

Simpson, L. (1990) RNA editing - a novel genetic phenomenon. Science 250: 512-513.

Steitz, J. A. (1988) "Snurps". Scientific American, June, 56-63.

Zorio, D.A.R.et al. (1994) Operon as a common form of chromosomal organization in C. elegans. Nature 372: 270-272.

Capítulo 8

Crick, FHC; Leslie Barnett, FRS; Brenner, S. & Watts-Tobin, RJ (1961) General nature of the genetic code for proteins. Nature 192: 1227-1232.

Gamow, G (1954) Possible relation between deoxyribonucleic acid and protein structures. Nature 173: 318.

McInerney, J.O. (1998)-Replication and Transcriptional selection on codon usage in Borrelia burgdorferi. Proc. Natl. Acad. Sci. 95: 10698-10703.

Nirenberg, M. & Leder, P. (1964) RNA code words and protein synthesis. Science 145: 1399-1407.

Santos, M.A.S.; Ueda, T.; Watanabe, K. & Tuite, M.F. (1997) The non-standard genetic code of Candida spp.: an evolving genetic code or a novel mechanism for adaptation? Mol. Microb. 26: 423-431.

Yanofsky, C.; Carlton, B.C.; Guest, J.R.; Helinsky, D.R & Hening, U. (1964) On the colinearity of gene structure and protein structure. Proc.Natl.Acad.Sci.USA 51: 266-272.

Capítulo 9

Crick, FHC (1966) Codon–anticodon pairing: the wobble hypothesis. J. Mol. Biol. 19: 548-55.

Ellis, R.J. & van der Vies, S.M. (1991) Molecular chaperones. Ann. Rev. Biochem. 60: 321-347.

Georgopoulos, C. (1992) The emergence of the chaperone machines. TIBS 17: 295-296

Cristina M. Bonato170

Page 171: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Hartl, F-Y; Hlodan, R. & Langer, T. (1994) Molecular chaperones in protein folding: the art of avoiding sticky situations. TIBS 19: 20-25.

Keiler, KC; Waller, PR & Sauer, RT (1996) Role of a peptide tagging system in degradation of proteins synthesized from damaged messenger RNA. Science 271: 990-3

Shine, J. & Dalgarno, L (1974) The 3' terminal sequence of Escherichia coli 16S ribosomal RNA: complementarity to nonsense triplets and ribosome binding sites. Proc. Natl. Acad. Sci. 71:1342-46.

Capítulo 10

Hayes, W (1952) Recombination in Bact. coli K 12: unidirecional transfer of genetic material. Nature 169:118-119

Jacob, F & Monod, J (1961) Genetic regulatory mechanisms in the synthesis of proteins. J. Mol. Biol. 3:318-356.

Jacob, F & Wolmann (1961) Sexuality and the genetics of bacteria. NY. Academic Press.

Lederberg, J & Lederberg, EM (1952) Replica plate and indirect selection of bacterial mutants. J. Bacteriol. 63: 399-406.

Lederberg, J & Tatum, E (1946) Novel genotypes in mixed cultures of biochemical mutants of bacteria. Nature 158: 558-

Zinder, N & Lederberg, J(1952) Genetic exchange in Salmonella. J. Bacteriol. 64: 679-699.

Capítulo 11

Barbujani et al., (1997) An apportionment of human DNA diversity. Proc. Natl. Acad. Sci. 94: 4516-4519.

Cann et al., (1987) Mitochondrial DNA and Human evolution. Nature 325:31-36.

International Human Genome Sequence Consortium, (2001) Initial sequencing and analysis of the human genome. Nature 409: 860-921.

Devlin, RH et al., (1994) Nature 371: 209.

Lewis, R (2002) SNPs as windows on evolution. The Scientist 16 (1): 16, Jan. 7. on line

Linn, S & Arber, W. (1968) Host specificity of DNA produced by E. coli X. In vitro restriction of phage fd replicative form. Proc. Natl. Acad. Sci. 59: 1300-1306.

Mullis, K. (1990) The unusual origin of the polimerase chain reaction. Sci. Am. 262:56-65

Sanger, F & Coulson, AR (1975) A rapid method for determining sequences in DNA by primed synthesis with DNA polymerase. J. Mol. Biol. 94: 444-448.

Smith, HO & Wilcox, KW (1970) A restriction enzyme from Haemophilus influenzae. 1. Purificatation and general properties. J. Mol. Biol. 51: 379-391.

Cristina M. Bonato 171

Page 172: Genética Molecular

MOLDES MÓDULOS E FORMAS: DO DNA AS PROTEÍNAS

Southern, EM (1975) Detection of a specific sequences among DNA fragnebts separated by gel eletrophoresis. J.Mol. Biol. 98: 503-517.

Venter, JC et al., (2001) The sequence of the human genome. Science 291: 1304-1351.

Cristina M. Bonato172