Ao vivo

Cópia de Sebenta Bio Mol_Hugo Soares

Outros

Carlos

em 16/11/2024

Conteúdos escolhidos para você

70 pág.

BIOLOGIA MOLECULAR EXER SIMULA

ESTÁCIO

12 pág.

RESPOSTAS - Biologia Molecular Aplicada À Biomedicina

UNICID

22 pág.

Resumo Livro Genética Humana - Maria R

FAMINAS-BH

137 pág.

EBOOK Genética e Biologia Molecular_240909_122547

Perguntas dessa disciplina

Questão 05 Proteínas controlam praticamente todos os processos que ocorrem em uma célula, exibindo uma quase infinita diversidade de funções. Para exp

USP-SP

Questao 09 O DNA serve como um manual de instrucoes da vida. So que alteracoes ao acaso podem modificar esse manual. Fatores como radiacao e variacao

oi Todas as alternativas estão erradas, EXCETO: Selecione a resposta: aUm determinado ribossomo pode fazer apenas um tipo de proteína.bAs subuni...

AJUDAR LISTA EXERCICIOS 1) Todas as alternativas estão erradas, EXCETO: A) Um determinado ribossomo pode fazer apenas um tipo de proteína. B) As ...

3 Desmarcar para revisão 00 45 3 hora min S Algumas estruturas são fundamentais às células bacterianas, estando presentes em todas as bactérias. So...

ESTÁCIO

Material

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Conteúdos escolhidos para você

70 pág.

BIOLOGIA MOLECULAR EXER SIMULA

ESTÁCIO

12 pág.

RESPOSTAS - Biologia Molecular Aplicada À Biomedicina

UNICID

22 pág.

Resumo Livro Genética Humana - Maria R

FAMINAS-BH

137 pág.

EBOOK Genética e Biologia Molecular_240909_122547

Perguntas dessa disciplina

Questão 05 Proteínas controlam praticamente todos os processos que ocorrem em uma célula, exibindo uma quase infinita diversidade de funções. Para exp

USP-SP

Questao 09 O DNA serve como um manual de instrucoes da vida. So que alteracoes ao acaso podem modificar esse manual. Fatores como radiacao e variacao

oi Todas as alternativas estão erradas, EXCETO: Selecione a resposta: aUm determinado ribossomo pode fazer apenas um tipo de proteína.bAs subuni...

AJUDAR LISTA EXERCICIOS 1) Todas as alternativas estão erradas, EXCETO: A) Um determinado ribossomo pode fazer apenas um tipo de proteína. B) As ...

3 Desmarcar para revisão 00 45 3 hora min S Algumas estruturas são fundamentais às células bacterianas, estando presentes em todas as bactérias. So...

ESTÁCIO

Prévia do material em texto

Biologia Celular e
Molecular II
(sebenta Hugo Soares)

Licenciatura em Biologia
Faculdade de Ciências e Tecnologia
Universidade de Coimbra

Professor Ana Luísa Carvalho
2
Em 1944, o artigo, de autoria de Avery, MacLeod e MacCarty, tratava da transformação de cepas não
virulentas de pneumococos em cepas causadoras de pneumonia. Veio a causar grande revolução nos estudos
de genética. Com esta experiência ficou-se a saber que ratos inoculados pelas bactérias que não causavam
doença juntamente daquelas que causavam (só que estas últimas mortas pelo calor) levava ao aparecimento
de pneumococos virulentos. Há muito já se sabia disto, no entanto o trabalho que tinha em mãos propunha-
se a descobrir qual fracção da bactéria patogénica era responsável pela passagem da característica genética
da formação de cápsula bacteriana. Em outras palavras, os autores haviam identificado o ''princípio
transformante'', a molécula que carrega os genes. Descobriram que se trata do ácido desoxiribonucleico, o
DNA.

Nesta altura já a composição química do ADN era conhecida cadeia polimérica constituída por vários
monómeros de (TGAC).

O Ácido desoxirribonucleico (ADN) é o armazém, ou a livraria celular, que contém toda a informação
requerida para construir as células e os tecidos de um organismo. A duplicação exacta de informação em
qualquer espécie de geração em geração assegura a continuidade genética daquela espécie. A informação
esta arranjada em genes, unidades hereditárias que controlam certos aspectos de um organismo.
No processo de transcrição, a informação guardada no ADN é copiado para ácido ribonucleico (RNA),
este possui três formas distintas, e papéis diferentes na síntese proteica. O RNA mensageiro (mRNA)
carrega as instruções do DNA que especifica a ordem correcta dos aminoácidos durante o processo de
síntese. A especificidade notável em que os aminoácidos se arranjam nas proteínas ocorre durante a
tradução do mRNA. Neste processo, a informação no mRNA é interpretada por um segundo tipo de RNA
chamado RNA de transferência (tRNA) com a ajuda (AID) do terceiro tipo de RNA, o RNA ribossomal
3
(rRNA), e as proteínas a este associadas. À medida que a os aminoácidos correctos são trazidos até a
sequência pelos tRNA, eles são ligados por ligações peptídicas a fim de formar proteínas.
A descoberta da estrutura do DNA em 1953 e as suas subsequentes elucidações dos passos de síntese do
DNA, RNA e proteínas são os monumentos atingidos nos primeiros dias da biologia molecular. Para
entender como o DNA dirige a síntese de RNA, que então dirige a síntese proteica é o então chamado,
dogma central da biologia molecular.

ESTRUTURA DOS ÁCIDOS NUCLEICOS
O DNA e o RNA têm grandes similaridades entre si. Na sua estrutura primária ambos são polímeros
(estruturas químicas múltiplas) compostos por monómeros (estruturas químicas simples) chamados
nucleótidos. O RNA celular encontra-se em arranjos de menos de 100 até vários milhares de nucleótidos. As
moléculas de DNA celular podem ser tão longas quanto varias centenas de milhões de nucleótidos. Estas
estruturas largas de DNA podem se encontrar ligadas a proteínas e então serem vistas e analisadas ao
microscópico sob a forma de cromossomas.

POLIMERIZAÇÃO DE NUCLEÓTIDOS FORMA OS ÁCIDOS NUCLEICOS
Tanto o DNA como o RNA consistem apenas em 4 nucleótidos diferentes. Todos os nucleótidos têm
uma estrutura em comum: o grupo fosfato ligado por uma ligação
fosfodiéster a uma pentose (uma molécula de açúcar com 5 carbonos) que
por sua vez se encontra ligada a uma base orgânica. No RNA a pentose é a
ribose e no DNA a pentose é a desoxirribose – ou seja um grupo OH foi
substituído por um H. A outra única diferença entre os nucleótidos de DNA
e de RNA é que uma das quatro bases orgânicas difere entre os dois
polímeros. As bases adenina, guanina e citosina são encontradas tanto em
DNA quanto em RNA contudo a timina apenas se encontra no DNA e o
uracilo é exclusivo do RNA. As bases são usualmente abreviadas A, G, C, T e U, respectivamente. As
bases que compõem os ácidos nucleicos são heterociclicas com anéis que contém azoto e carbono. A
adenina e a guanina são purinas, ou seja contêm um par de anéis fundidos; a citosina, a timina e o uracilo
são pirimidinas, ou seja contêm um anel simples. O carácter ácido dos nucleótidos é devido a presença do
fosfato, o qual se dissocia no pH celular, libertando iões de hidrogénio deixando o fosfato carregado
negativamente. Devido a esta carga negativa atrair proteínas muitos dos ácidos nucleicos encontram-se
associados a proteínas. Nos nucleótidos, o carbono 1’ do açúcar está ligado ao azoto 9 da purina ou ao azoto
1 da pirimidina.

Nas células e nos espaços extracelulares encontram-se pequenas concentrações de nucleósidos (termo
utilizado para designar o grupo açúcar mais a base, sem grupo fosfato). Nucleótidos são nucleósidos que
possuem um, dois ou três grupos fosfato esterificados no grupo hidroxilo 5’. Nucleósidos monofosfatos
possuem um esterificação simples, difosfato contêm um grupo pirofosfato e o trifosfato têm um terceiro
fosfato. Como veremos mais tarde os nucleósidos trifosfato são usados na síntese de ácidos nucleicos.
Contudo alguns destes servem para muito mais funções na célula: o ATP, por exemplo, é o maior
transportador de energia dentro da célula e o GTP desempenha papéis fundamentais na sinalização
intracelular e actua como receptor de energia, particularmente na síntese proteica.
4

Quando nucleótidos polimerizam para formar ácidos nucleicos, o grupo hidróxilo ligado ao carbono 3’
do açúcar de um nucleótido forma uma ligação éster com o fosfato do outro nucleótido, eliminando uma
molécula de água.

Esta reacção de condensação é semelhante aquela em que se formam ligações peptídicas entre dois
aminoácidos. Assim uma simples cadeia de ácidos nucleicos é um polímero de fosfato-pentose (poliester)
no qual as bases de purina e de pirimidina são as suas cadeias laterais. As ligações entre nucleótidos é
chamada de ligação fosfodiéster. Tal como os polipéptidos uma cadeia de ácidos nucleico tem uma
orientação química de terminal para terminal: o terminal 5’ possui um grupo fosfato livre no carbono 5’ do
açúcar; o terminal 3’ tem um grupo hidroxilo livre no carbono 3’ do açúcar terminal. Esta direccionalidade
mais o facto que a síntese progredi no sentido 5’ 3’ deu asas a convenção de que sequências de
polinucleótidos são escritas e lidas no sentido 5’ 3’ (da esquerda para a direita); Por exemplo, a sequência
AUG assume-se ser (5’)AUG(3’). A direcção 5’ 3’ de uma cadeia tem extrema importância nas
propriedades da molécula. A sequência linear de nucleótidos ligados por fosfodiéster constitui a estrutura
primária dos ácidos nucleicos.

5
Chargaff teve percepção ao ler, em 1944, o artigo recém - publicado no “Journal of Experimental
Medicine”, por Avery et. al. (sobre a localização da informação genética/hereditária supra-referido) e a sua
reacção foi concreta. Decidiu, naquele exacto momento, concluir o mais rapidamente possível os projectos
em curso no seu laboratório, para se dedicar à bioquímica dos ácidos nucleicos. Em poucos anos chegou à
descoberta que o tornou famoso: em praticamente todas as moléculas de DNA a concentração total das
purinas (A e G) é igual ao conteúdo total das pirimidinas (C e T), ou seja, [A] + [G] = [T] + [C] a razão das
concentrações molares das bases é igual a 1, sendo [A] = [T] e [G] = [C]. O conjunto desses postulados
passou a ser conhecido como a “regra de Chargaff”.
Algumas citações de Chargaff:
• “Eu parti da convicção de que, se diferentes espécies de DNA exibem actividades biológicas diversas,
devem existir também diferenças quimicamente demonstráveis entre os DNAs”
• DNA isolado de tecidos diferentes de um organismo tem a mesma composição em bases
• A composição do DNA em bases é constante ao longo da vida de um indivíduo

Hojede transcrição imunoglobulinas nos vertebrados, incluem centenas de membros. A maioria das
29
famílias de proteínas, contudo, incluem de poucos a 30 membros; os exemplos mais comuns são as
proteínas do citoesqueleto, proteínas 70-kDa de heat-shock, a cadeia leve da miosina, ovalbumina da
galinha e as α e ß-globinas nos vertebrados.
Os genes que codificam as ß-globinas são um bom exemplo de uma família de genes, tal como mostrado
na figura da página anterior, todas as hemoglobinas transportam oxigénio no sangue mas elas exibem de
alguma maneira diferentes propriedades que são necessárias para a fisiologia humana. Por exemplo,
hemoglobinas que contêm polipéptidos Aγ ou Gγ são expressos durante a vida fetal. Porque estas
hemoglobinas fetais possuem maior afinidade para o oxigénio que a hemoglobina de adultos elas
conseguem, efectivamente, extrair o oxigénio do sangue materno da placenta. A hemoglobina adulta de
baixa afinidade, expressa logo após o nascimento, permite melhor libertação de oxigénio nos tecidos
especialmente nos músculos, os quais têm alta necessidade de oxigénio durante o exercício.
As diferenças entre os genes de ß-globinas provavelmente urgiu por duplicação de um gene original,
mais provavelmente devido a um crossing-over desigual, durante a recombinação meiótica no
desenvolvimento da linha germinativa. Durante a evolução as duas cópias do gene terão acumulado
mutações arbitrárias; mutações benéficas que conferiram algumas melhorias na função básica de transportar
oxigénio e estas foram retidas pela selecção natural resultando numa sequência acumulada (sequence drift).

30
Duas regiões na zona dos genes de ß-globinas contêm sequências não funcionais, chamadas de
pseudogenes, semelhantes àqueles funcionais. Análises da sequência mostraram que estes têm a mesma
estrutura de intrões e exões que os genes funcionais de ß-globinas, sugerindo que eles também surgiram por
duplicação do mesmo gene ancestral. Porque tais pseudogenes não são prejudiciais eles permaneceram no
genoma e marcam a localização da duplicação de genes que ocorreu num dos nossos ancestrais.

GENES REPETIDOS MUITAS VEZES CODIFICAM rRNA, tRNA E HISTONAS
Tanto em vertebrados como em invertebrados genes que codificam rRNAs, e alguns outros que não
codificam RNAs tais como alguns snRNAs envolvidos no splicing de RNA, ocorrem repetidos e seguidos.
Estes são distinguíveis dos genes duplicados das famílias de genes no que diz respeito que múltiplos genes
repetidos seguidos codificam proteínas ou RNA idênticas ou quase idênticas. Muitas vezes cópias de uma
sequência ocorrem uma a seguir à outra durante uma longa porção de DNA. Dentro de uma disposição de
genes para rRNA repetidos seguidos, cada cópia é exactamente, ou quase, igual às outras. Apesar das
porções transcritas de genes de rRNA serem as mesmas num dado indivíduo, as regiões espaçadoras não
codificantes podem variar.
Os genes de rRNA, tRNA e histonas altamente repetidos são necessários para ir ao encontro da grande
necessidade da célula para a transcrição. Para entender porquê, considere-se que existe um número fixo
máximo de cópias de RNA que podem ser produzidas durante uma geração celular quando o gene está
completamente lotado com moléculas de RNA polimerase. Se mais RNA é necessário do que aquele que
consegue ser transcrito de apenas um gene, são necessárias várias cópias para responder à necessidade
celular. Por exemplo, durante a fase embrionária, as células duplicam em ~24h, e têm entre 5-10 milhões de
ribossomas. Para produzir rRNA suficiente para este número de ribossomas são necessárias pelo menos 100
cópias do gene para rRNA (subunidade maior e menor) por célula.

MUITAS SEQUÊNCIAS SIMPLES DE DNA ESTÃO CONCENTRADAS EM LOCALIZAÇÕES
ESPECÍFICAS NO CROMOSSOMA
Para além de genes duplicados codificantes de proteínas e genes muitas vezes repetidos, as células
eucarióticas contém múltiplas cópias de outras sequências de DNA no genoma, geralmente referidas como
DNA repetitivo. Dos dois grandes tipos de DNA repetitivo, o menos comum são sequências simples de
DNA o qual constitui 3% do genoma humano e é composto de pequenas sequências perfeitas, ou quase,
relacionadas. O outro tipo de DNA repetitivo muito mais comum é composto por sequências muito maiores.
Sequências simples de DNA são geralmente chamadas de DNA satélite porque em estudos preliminares
de DNA de organismos superiores algumas sequências simples de DNA “fugiam”, por centrifugação, para
posições diferentes daquela do DNA celular. A estas dava-se o nome de bandas satélite para as distinguir da
banda maior. Sequências simples de DNA no qual a repetição contenha 1-13 pb são muitas vezes chamados
microsatélites.
A maioria do DNA satélite é composto por repetições de 14-500pb em
repetições seguidas de 20-100kb. Estudos de hibridização in situ com
cromossomas em metafase localizaram DNA satélite em regiões específicas do
cromossoma. Nos mamíferos muito do DNA satélite localiza-se nos centrómeros
e nos telómeros. Estas sequências podem ser úteis para identificar cromossomas
particulares por hibridização in situ por fluorescência (FISH).
Sequências simples localizadas nos centrómeros podem contribuir na ligação
dos cromossomas a rede de microtúbulos durante a mitose.

Repetições espalhadas de centenas de cópias de uma sequência
• Sequência curta (~300 nucleótidos) – SINEs (“small interspersed elements”); por exemplo,
sequências Alu (Tabela 10-1)
• Sequência longa (~6-7 kb) – LINEs (“long interspersed elements”) (Tabela 10-1)

FISH
31
DNA FINGERPRINTING
Dentro de uma espécie, a sequência de nucleótidos de unidades repetidas que compõem as sequências
simples de DNA muitas vezes repetidas estão altamente conservadas entre os indivíduos. Pelo contrário,
diferenças no número de repetições, e deste modo no tamanho do contendo a mesma unidade de repetição é
pouco comum entre os indivíduos. Estas diferenças no tamanho pensa-se resultarem de crossing-overs
desiguais com regiões de sequência simples de DNA durante a meiose. Em humanos e outros mamíferos,
algum do DNA satélite existe em relativamente pequenos fragmentos de 1 a 5 kb feitos de 20-50 unidades
repetidas, cada uma contendo 15-10pb. Estas regiões são chamadas de minisatélites de modo a distingui-las
dos satélites comuns com ~20-100kb de tamanho. Eles diferem dos microsatélites por estes possuírem
unidades repetidas muito pequenas. Ainda assim diferenças no total do tamanho de vários minisatélites de
diferentes indivíduos podem ser detectadas por Southern Blotting do DNA celular tratado com enzimas de
restrição que corta exteriormente à sequência repetida. O polimorfismo neste tipo de DNA forma a base
para o DNA fingerprinting, o qual é superior às convencionais impressões digitais para a identificação de
indivíduos.

DNA MITOCONDRIAL
Apesar da vasta maioria do DNA na maior parte dos eucariotas se encontrar predominantemente no
núcleo, algum DNA esta presente dentro das mitocôndrias das plantas, animais e fungos e nos cloroplastos
das plantas. Muitas evidências apontam que as mitocôndrias e os cloroplastos evoluíram de bactérias que
foram endocitadas por células ancestrais contendo núcleos eucarióticos e formaram uma endossimbiose. O
genoma mitocondrial possui grandes semelhanças com o DNA da bactéria Rickettsia prowazekii. Uma outra
evidência desta evolução reside no facto dos ribossomas mitocondriais se assemelharem aos ribossomas
procarióticos enquanto diferem dos ribossomas citosólicos a nível de proteínas, RNA, tamanho e resistência
a antibióticos.
Durante a evolução a maioria dos componentes de genes bacterianos dos, actualmente, organelos foram
transferidos para o núcleo. Contudo, as mitocôndrias e os cloroplastos nos eucarióticos actuais retêm DNA
codificante de proteínas essenciais para funções dos mesmos, assim como rRNA e tRNA necessários para a
tradução. Deste modo as células eucarióticaspossuem múltiplos sistemas genéticos um sistemas
predominante nuclear e um sistema secundário como seu próprio DNA em mitocôndrias e cloroplastos.
O DNA mitocondrial encontra-se presente na matriz e estudos de fluorescência indicam que uma
mitocôndria possui pelo menos 30 moléculas de DNA mitocondrial (mtDNA). Estudos posteriores
mostraram que na maioria dos organismos o mtDNA replica-se durante a interfase, na mitose cada célula
filha recebe aproximadamente o mesmo número de mitocôndrias , mas como não existe qualquer
mecanismo para fazer a divisão exacta das mitocôndrias, algumas células possuem mais mtDNA que outras.
Por isolamento das mitocôndrias de células e análise do DNA extraído destas, pode ser visto que uma
mitocôndria possui muitas moléculas de mtDNA. Assim a quantidade de mtDNA numa célula varia
grandemente de acordo com a quantidade de mitocôndrias na célula e o número de moléculas de mtDNA na
mitocôndria. Cada um destes parâmetros varia consideravelmente com o tipo de célula.

O mtDNA É HERDADO CITOPLASMATICAMENTE E PODE CODIFICAR rRNA, tRNA, E
ALGUMAS PROTEINAS MITOCONDRIAIS.
Estudos em leveduras mutantes e outros seres unicelulares primeiro indicaram que as mitocôndrias
exibiam hereditariedade citoplasmática e que deste modo devia possuir o seu próprio sistema genético. No
acasalamento por fusão de leveduras haplóides ambos os pais contribuíram igualmente para o citoplasma
resultando em diploidia; deste modo a herança é biparental. Em mamíferos e muitos outros organismos
multicelulares, contudo, o espermatozóide contribui pouco para o citoplasma do zigoto, e virtualmente todas
as mitocôndrias no embrião derivam do ovo, não do espermatozóide. Estudos em ratinhos de laboratório
mostram que uma pequena parte (0.01%) do material citoplasmático provem do progenitor masculino. Nas
plantas o mtDNA é herdado exclusivamente da parte feminina e nada do gâmeta masculino (pólen).
O genoma mitocondrial inteiro de um número de diferentes organismos tem sido clonado e sequenciado,
e mtDNA de todas essas fontes mostraram capacidade de codificar tRNA e rRNA assim como proteínas
essenciais à mitocôndria. Todas as proteínas codificadas são sintetizadas em ribossomas mitocondriais.
Todos os polipéptidos codificados pelos mtDNA identificados até agora (com uma possível excepção) não
são enzimas completas mas subunidades de complexos multiméricos usados no transporte de electrões ou
síntese de ATP. A maioria das proteínas das mitocôndrias como a RNA e DNA polimerases são sintetizadas
em ribossomas citosólicos e depois transportadas para a matriz mitocondrial.
33
O TAMANHO E A CAPACIDADE DE CODIFICAÇÃO DO mtDNA VARIA CONSIDERAVELMENTE
EM DIFERENTES ORGANISMOS
Surpreendentemente o tamanho de mtDNA, o número e a natureza das proteínas que ele codifica, e até
mesmo o código genético mitocondrial varia muito entre diferentes organismos. Nos humanos o mtDNA,
uma molécula circular que já foi completamente sequênciada, esta entre as moléculas de mtDNA mais
pequenas que se conhecem, contendo 16.569pb. Este
codifica os dois rRNA encontrados nos ribossomas
mitocondriais assim como os 22 tRNA usados para a
tradução do mRNA mitocondrial. O mtDNA humano
possui 13 sequências que iniciam com o codão ATG
(metionina), acabam com um codão stop, e são
grandes o suficiente para codificar um polipéptido de
mais de 50 aminoácidos; todas as possíveis proteínas
codificadas por estes pontos já foram identificadas.
mtDNA de mamíferos em contraste com o DNA
nuclear, tem falta de intrões e não possui sequências
não codificantes.
O mtDNA da maioria dos animais (metazoários)
possui um tamanho semelhante ao dos humanos. Pelo
contrário o mtDNA das leveduras é quase 5 vezes
maior (~78.000pb). o mtDNA das leveduras e de
outros fungos codificam os mesmos produtos génicos
que o mtDNA de mamíferos, assim como outros genes
encontrados no núcleo dos metazoários. Um exemplo bastante evidente deste transporte de genes das
mitocôndrias para o núcleo é o do gene cox II (que codifica a subunidade 2 do citocromo c oxidase) em
todos os organismos está presente no mtDNA, mas num espécie de legumes, uma espécie de feijão, este
encontra-se no DNA nuclear.
Em contraste com outros eucariotas que possuem apenas um tipo de mtDNA, as plantas possuem vários
tipos de mtDNA devido a recombinações umas com as outras.

PRODUTOS DOS GENES MITOCONDRIAIS NÃO SÃO EXPORTADOS
Tanto quanto se sabe, todos o RNA transcritos do mtDNA e os seus produtos de tradução permanecem
nas mitocôndrias, e todos as proteínas codificadas pelo mtDNA são sintetizados nas mitocôndrias por
ribossomas mitocondriais. As mitocôndrias codificam o rRNA que forma os ribossomas mitocondriais,
contudo todas excepto uma ou duas proteínas (conforme a espécie) que constituem os ribossomas são
importadas do citoplasma. Na maioria dos eucariótas, todo o tRNA usados para a síntese de proteínas nas
mitocôndrias são codificadas pelo mtDNA.
Contudo uma espécie de parasita Tripanossoma brucei, e noutros protozoários ciliados, a maioria dos
tRNA mitocondriais são codificados pelo DNA nuclear e importados para as mitocôndrias.

O CÓDIGO GENÉTICO DAS MITOCÔNDRIAS DIFERE DO PADRÃO NUCLEAR
O código genético usado em mitocôndrias animais e fúngicas é diferente do código genético padrão
usados em procariotas e no núcleo eucariótico; espantosamente o código das mitocôndrias difere mesmo
entre diferentes espécies. Porquê e como estas diferenças surgiram durante a evolução continua um mistério.
UGA, por exemplo, é normalmente um codão stop, mas é codificado como triptofan por mitocôndrias
humanas e fúngicas; contudo nas mitocôndrias das plantas UGA é também reconhecido como um cordão
stop. AGA e AGG, no código padrão codifica para arginina, assim também é codificado para arginina em
mitocôndrias de fungos e plantas, mas é codificado como codão stop em mitocôndrias de mamíferos e como
serina em Drosophila .
34

TELÓMEROS

ADIÇÃO DE SEQUÊNCIAS TELOMÉRICAS PELA TELOMERASE IMPEDE O ENCURTAMENTO
DOS CROMOSSOMAS

A sequênciação dos telómeros de uma data de organismos, incluindo humanos, mostrou que a maioria
são constituídos por sequências de oligonucleótidos repetitivas, com alta quantidade de G e T numa cadeia
(terminal 3’) e C e A na cadeia complementar (terminal 5’). A sequência dos telómeros em humanos e
outros vertebrados é TTAGG. Estas simples sequências repetem-se em todos os terminais dos cromossomas,
num total de algumas centenas de pares de bases em leveduras e protozoários e alguns milhares em
vertebrados. O terminal 3’ com uma cadeia rica em G estende-se por 12 a 16 nucleótidos para além do final
5’ da cadeia complementar. Esta região é ligada por proteínas específicas que ao mesmo tempo protegem o
final linear dos cromossomas do ataque de exonucleases assim como associa telómeros a domínios
específicos do núcleo.
A necessidade para uma zona especializada no final dos cromossomas é visível quando nós consideramos
que todas as DNA polimerases conhecidas alongam a cadeia de DNA na extremidade 3’, e todo este
processo necessita de um primer de RNA ou DNA. Assim à medida que o garfo de replicação cresce e se
aproxima do final linear do cromossoma, a síntese da cadeia líder continua até ao fim completando a cadeia
de dupla hélice filha. Contudo, como a cadeira seguidora é copiada de forma descontínua, ela não pode ser
replicada no seu total. Quando o primer final de RNA é removido, não existe nenhuma cadeia onde a DNA
polimerase se possa ligar e construir nova cadeia. Sem a ajuda de mecanismos especiais a cadeia de DNA
filha resultante seria encurtada a cada divisão celular.
O problema do encurtamento dos telómeros é resolvido por uma enzima que adiciona sequências
teloméricas ao final de cada cromossoma. A enzima é uma ribonucleoproteína (proteína com um núcleo de
RNA de cerca de 150 nucleótidos) chamada telomerase. Porque a sequência do RNA associado à
telomeraseé complementar à sequência dos telómeros, esta serve de cadeia molde para a adição de
desoxirribonucleótidos no final dos telómeros. A estratégia de usar cadeias de RNA como molde para a
síntese de cadeias de DNA chama-se transcriptase inversa e é usada pelos retrovírus (pegou-se nesta ideia
e esquematizou-se uma nova técnica RT-PCR). A sequência adicionada é maioritariamente controlada pela
origem da enzima e não pelo primer de DNA telomérico. Isto foi provado usando Tetrahymena
transformadas com mutantes de genes que codificam o RNA associado a telomerase. A telomerase
resultante adicionava sequências de DNA complementares à cadeia de RNA mutada no final dos
cromossomas. Deste modo a telomerase é uma forma especializada de transcriptase inversa que carrega o
seu próprio RNA interno.
35
As figuras que se seguem mostram como a telomerase, por transcrição inversa do seu RNA interno,
alonga a cadeia 3’ da cadeia simples de DNA. Células de ratinhos knockout que n conseguiam produzir
RNA associado à telomerase não exibiam actividade de telomerase, e os seus telómeros tornavam-se
sucessivamente mais curtos a cada geração celular. Tais ratinhos podiam procriar e reproduzir-se
normalmente por três gerações antes da repetição de sequências nos telómeros se tornarem demasiado
curtas. Depois a ausência de DNA telomerase resultava em efeitos adversos, tais como a fusão de terminais
de cromossomas e danos cromossómicos. Por volta da quarta geração a taxa de reprodução destes ratinhos
reduzia substancialmente e a partir da 6º geração eles já
não geravam qualquer descendência. Contudo isto traz
um benefício, os ratinhos eram menos susceptíveis a
desenvolverem cancro. Foram testados com produtos
cancerígenos e a taxa de incidência de cancro era
consideravelmente inferior.

 Mecanismo de acção da telomerase

A cadeia de extremidade 3’ de um telómero é
estendida pela telomerase, contrabalançado a
incapacidade do mecanismo de replicação em sintetizar
o extremo terminal de cadeia simples. A telomerase
alonga estas cadeias simples por um mecanismo
repetido de transcrição inversa.
A acção da telomerase do protozoa Oxytricha, que
possui uma sequência repetida T4G4 já se encontra
descrita: outras telomerases possuem ligeiras diferenças
na sequência repetida. A telomerase contem uma cadeia
de RNA (vermelho) que emparelha com a extremidade
3’ da cadeia seguidora.
O local activo da telomerase (verde) cataliza a
adição de desoxirribonucleótidos (azul) usando a
molécula de RNA como molde, esta transcrição inversa
segue até à posição 35 da cadeia de RNA molde (1).
Suspeita-se que a cadeia dupla resultado da
interacção DNA-RNA deslize sobre si mesma, uma em
relação à outra, conduzindo ao desligamento de uma
região em cadeia simples do telómero de DNA e a
desocupação de parte da sequência molde da cadeia de
RNA (2).
A cadeia seguidora telomérica é novamente
estendida até à posição 35 pela telomerase, e a cadeia
dupla RNA-DNA sofre translocação e hibridação, tal
como antes (3 e 4).
O mecanismo de deslize, pensa-se, ser facilitado por
um, pouco usual, emparelhamento de bases (pontos
negros) entre os resíduos de G desligados, que são
menos estáveis que o emparelhamento de Watson e
Crick. A telomerase pode adicionar múltiplas
repetições por repetição dos passos 3 e 4. O resultado
em rede previne o encurtamento de cadeias seguidoras
a cada ciclo de replicação de DNA.

36
É importante que o telómero esteja associado a proteínas ou com um arranjo específico para que ele
possa ser diferenciado das quebras cromossómicas. Quando o mecanismo celular encontra extremidades
cromossómicas quebradas – produzidas por radiação, dano no DNA, ou outro factor – esse DNA deve ser
reparado de alguma forma antes da próxima replicação, pois se isso não acontecer, a célula pode perder uma
quantidade significativa de material genético e morrer. Assim, o telómero deve possuir proteínas específicas
associadas, de forma a proteger e caracterizar as extremidades cromossómicas. Acredita-se que pelo menos
metade dos cromossomas de mamíferos tem telómeros que formam um tipo mais complexo de arranjo, o
chamado T Loop, que esconde a cadeia simples e a protege dos ataques. Sua formação depende,
principalmente, de três factores: (1) repetições de cadeia dupla; (2) repetições de cadeia simples; e (3)
presença de TRF2, que se liga ao sítio de formação do loop.
Este forma-se pela dobragem da cadeia simples para trás, e o seu emparelhamento com nucleótidos
complementares numa porção de cadeia dupla do telómero. A formação do T loop envolve a invasão da
extremidade 3’ de cadeia simples numa cadeia de dupla hélice do DNA , pensa-se que este mecanismo
talvez se assemelhe à iniciação da
recombinação genética homóloga (estudada
mais a frente). Nos mamíferos este loop é
regulado por duas proteínas TRF1 (Telomere
Repeat binding Factor 1) e TRF2., com a
última envolvida na formação do T loop.
Na figura: a estrutura proposta para os T
loop nos telómeros. A cauda de cadeia
simples sintetizada pela telomerase é dobrada
para trás e emparelha com nucleótidos
complementares na porção em cadeia dupla
do telómero. O telómero é ligado por grandes
variedades de proteínas incluindo TRF1 E
TRF2.
No caso dos mamíferos os telómeros chegam a possuir 5.000 pares de bases. A telomerase encontra-se
particularmente activa em células embrionárias, células da linha sexual e células cancerígenas mas
encontram-se muito pouco activas em células somáticas adultas.

SUPERENROLAMENTO DO DNA

O DNA celular, como vimos anteriormente, encontra-se extremamente
compactado implicando um elevado grau de organização estrutural. O
mecanismo de compactação deve não só empacotar o DNA como permitir o
acesso à informação contida no DNA.
O superenrolamento significa o enrolamento de algo já enrolado. O fio do
telefone é tipicamente um fio enrolado. O caminho que leva a base do telefone
até ao escutador muitas vezes inclui um ou mais superenrolamentos. O DNA
encontra-se enrolado em dupla hélice com ambas as cadeias enrolando-se
segundo um eixo. Um enrolamento adicional desse eixo sobre si mesmo
produz o superenrolamento do DNA (fig. prox. pag.) Como será explicado
mais a frente o superenrolamento do DNA é geralmente manifestação da força
estrutura. Quando o DNA não se encontra superenrolado, ou seja o eixo não se encontra dobrado sobre si
mesmo, diz-se que o DNA se encontra relaxado.
Nós podemos prever que a compactação do DNA envolve a forma superenrolada, o que se calhar não é
tão previsível é que até mesmo a replicação e a transcrição são afectadas por este estado do DNA. Ambos os
processos requerem a separação das cadeias de DNA – um processo complicado devido ao enrolamento
helicoidal das cadeias. (como demonstrado na figura da próxima pagina).
37

O facto do DNA se enrolar sobre si mesmo e se empacotar na célula poderia parecer lógico, e até mesmo
trivial, não fosse um simples facto: muitas moléculas de DNA circular permanecem altamente
superenroladas, mesmo após a extracção e purificação, livre de todas as proteínas e outros componentes
celulares. Isto indica que o superenrolamento é uma propriedade intrínseca da estrutura terciária do DNA.
isto ocorre em todas as moléculas de DNA e é altamente regulada em cada uma.
Um número mensurável de propriedades do superenrolamento já foram estabelecidas, e o estudo do
superenrolamento providenciou muitas luzes sobre a estrutura e função do DNA. Este trabalho apoiou-se
fortemente num ramo da matemática chamado Topologia, o estudo das propriedades de objectos que não
mudam sobre deformações contínuas. Para o DNA, deformações contínuas incluem mudanças
conformacionais, devido a alterações na temperatura ou interacções com proteínas ou outras moléculas;
deformações descontínuas incluem a quebra de cadeias do DNA. Para moléculas de DNA circular, uma
propriedade topológica é aquela que não é afectada pordeformações da cadeia de DNA desde que nenhuma
quebra seja introduzida. Propriedades topológicas são alteradas apenas por quebras e re-ajuntamentos do
esqueleto de uma ou ambas as cadeias de DNA.

Para entender o superenrolamento primeiro necessitamos debruçarmo-nos sobre as propriedades de
pequenas moléculas de DNA circulares tais como os plasmídeos e DNA viral. Quando estes DNAs não
possuem nenhuma quebra em nenhuma cadeia, elas são referidas como DNAs circulares fechados. Se o
DNA de uma molécula circular fechada possui uma conformação semelhante à forma B descrita por Watson
e Crick, com uma volta de dupla hélice por 10.5pb, o DNA está relaxado em vez de superenrolado.

O superenrolamento resulta quando o DNA está sujeito a alguma forma de tensão estrutural. DNA
circular fechado purificado encontra-se raramente na sua forma relaxada. Para mais, DNA deriva de uma
dada fonte celular possui um grau característico de superenrolamento. A estrutura do DNA é portanto
forçada numa forma que é regulada pela célula para induzir o superenrolamento.
38
Em praticamente quase todos os instantes, a tensão é resultado do baixo
enrolamento da dupla hélice de DNA num circulo fechado. Por outras palavras, a
DNA possui menos voltas helicoidais das que seriam de esperar para uma
estrutura B. Os efeitos do baixo enrolamento estão sumariados na figura ao lado
(superenrolamento negativo).
Um segmento de 84pb de uma molécula de DNA circular no seu estado
relaxado, iria possuir oito voltas de duplas hélice, ou uma por cada 10.5 pb. Se
uma destas voltas for removida, vai haver 84pb/7 = 12.0pb por volta, em vez de
10.5 encontrado na forma B-DNA. Isto é um desvio da forma mais estável de
DNA, como resultado a molécula encontra-se termodinamicamente tensa.
Geralmente, muito desta tensão provoca o enrolamento do eixo do DNA sobre si
mesmo, de forma a formar um superenrolamento (alguma da tensão nestes 84pb
simplesmente seriam dispersados na estrutura destorcida da larga molécula de
DNA). Em principio a tensão poderia também ser gasta pela quebra das duas
moléculas de DNA numa distância de 10pb. Em moléculas de DNA circulares
fechadas, a tensão induzida pelo desenrolamento é geralmente acompanhado de superenrolamento em vez
da separação das cadeias, porque o enrolamento do eixo do DNA geralmente requer menos energia do que a
quebra das pontes de hidrogénio que estabilizam os pares de bases. Note contudo, que o desenrolamento do
DNA in vivo torna mais fácil separar as cadeias de DNA dando acesso à informação que elas contêm.
Por convenção, se a ligação entre as duas cadeias de DNA está
arranjada de modo que as cadeias se enrolem para a direita dá-se o
nome de enrolamento positivo, para cadeias que se enrolem para à
esquerda diz-se tratar-se de enrolamento negativo. Quando há um
maior número de pares de bases por volta (>10.5pb/volta) a cadeia de
DNA tenta libertar essa tensão enrolando-se sobre si mesma provocando
superenrolamento negativo que enrola para a direita, quando há uma
diminuição do número de pares de bases por volta (a longo prazo.
Outra reacção importante em desoxirribonucleótidos é a hidrólise da ligação N-β-glicosil entre a base e a
pentose. Isto ocorre a uma razão mais elevada
para as purinas que para as pirimidinas. Tantas
quanto uma em cada 105 em cada 24 horas em
condições celulares típicas. A depurinação de
ribonucleótidos e RNA é muito mais lenta e
geralmente não é considerada significante
fisiologicamente. No tubo de ensaio, perdas de
purinas podem ser aceleradas pela diluição de
ácidos. A incubação do DNA a pH3 causa
remoção selectiva das bases purínicas, resultando
num ácido derivado chamado ácido apurínico.
Outras reacções são promovidas por radiação.
Luz UV induz a condensação de dois grupos etileno para formar um anel de ciclobutano. Na célula a mesma
reacção entre pirimidinas adjacentes leva à formação de dímeros ciclobutanos de pirimidinas. Isto acontece
mais frequentemente entre timinas adjacente da mesma cadeia de DNA. Um segundo tipo de dímero de
pirimidina, chamado 6-4 fotoproducto, é também formado durante
irradiação com luz UV. Radiação ionizante como os raios-X e os
raios gama podem causar a abertura dos anéis e a fragmentação
das bases assim como quebras nas ligações covalentes do
esqueleto dos ácidos nucleicos.
Virtualmente todas as formas de vida encontram-se expostas a
radiações de alta energia capazes de causar alterações químicas no
DNA. Radiação perto do UV (c.o. entre os 200 e 400nm), que
perfaz uma grande porção do espectro solar, é conhecida por
causar a formação de dímeros de pirimidinas e outras mudanças
químicas no DNA de bactérias e de células da pele humana. Nós
estamos sujeitos constantemente a exposição com radiação
ionizante na forma de raios cósmicos, os quais conseguem
penetrar fundo na terra, assim como as radiações emitidas por
elementos radioactivos, tais como o rádio, plutónio, urânio, rádon
14C e 3H. É estimado que raios UV e radiações ionizantes sejam responsáveis por cerca de 10% de todos os
danos causados por agentes ambientais.
41
O DNA pode também ser danificado por agentes químicos introduzidos no ambiente como produto da
actividade industrial. Tais produtos podem não ser prejudiciais por si mas modem ser metabolizados pelas
células em formas que o são.
Agentes alquilantes podem igualmente alterar certas bases de DNA. Por exemplo, a alta reactividade
química do dimetilsulfato consegue metilar a guanina de modo a esta “segurar” O6 – metilguanina, a qual
não consegue emparelhar com a citosina.
Muitas reacções semelhantes são trazidas a cabo por agentes alquilantes normalmente presentes nas
células, tais como S-adenosil-metionina.

O nucleótido modificado O6 – metilguanina formado, é uma lesão comum e altamente mutagénica. Ela
tende a emparelhar com a timina em vez da citosina durante a replicação, e por isso causar a alteração de
bases G≡C para A=T. A reparação directa deste produto é levada a cabo pela O6 – metilguanina – DNA
metiltransferase, uma proteína que catalisa a transferência de grupos metil de O6 – metilguanina para um
dos seus resíduos de Cys. Esta metiltransferase não é estritamente uma enzima porque uma simples
transferência de um grupo metil, metila permanentemente a proteína, inactivando-a. O consumo de uma
proteína inteira para corrigir um único dano numa simples base é uma ilustração viva da prioridade dada à
preservação da integridade do DNA celular.

42
Outros agentes causadores de danos no DNA são agentes carcinogénicos – Grupos volumosos que se
ligam às bases azotadas e impedem a transcrição e a replicação – e espécies reactivas de oxigénio, tais como
peróxido de hidrogénio, radicais hidróxilo, e radicais de superóxido que chegam através a irradiação ou
como produto do metabolismo aeróbico. Destas espécies os radicais de oxigénio são responsáveis pela
maioria dos danos oxidativos do DNA. As células possuem um poderoso sistema de defesa contra estas
agressões, incluindo enzimas tais como a catalase e superóxido dismutase que convertem o oxigénio
reactivo a simples produtos de oxigénio inofensivo. Uma fracção destes oxidantes inevitavelmente escapam
das defesas celulares, e danificam o DNA celular em qualquer uma de uma larga série de reacções desde a
oxidação de desoxirriboses até quebras de cadeias. O mecanismo pelo qual actua ainda não se encontra bem
descrito, mas todos os dias o DNA humano é sujeito a milhares de danos por reacções oxidativas.

Assim resumindo o que foi dito anteriormente, as razões pelas quais o DNA pode sofrer danos são:
1.Erros introduzidos durante a replicação
2.Bases anormais (desaminação, metilação, depurinação)
3.Lesões no DNA que causam alterações estruturais (dímeros de timina, por exemplo)
4.Quebra das cadeias de DNA
5.Oxidação de bases e açúcares

Estes são apenas alguns exemplos das reacções mais bem estudadas. Muitos compostos carcinogénicos
na comida, água ou mesmo no ar podem causar o cancro por modificação das bases no DNA. A integridade
do DNA é mais bem conservada que a do RNA ou a das proteínas porque o DNA é a única macromolécula
que tem o benefício de ter sistemas bioquímicos de reparação.

REPARAÇÃO DO DNA

Uma célula geralmente possui apenas um ou dois sistemas de DNA genómico. Proteínas o RNA
danificados podem ser rapidamente substituídos pelo uso da informação codificada no genoma, mas as
moléculas de DNA por si só são insubstituíveis. Manter a integridade da informação contida no DNA é um
imperativo celular, suportado por um elaborado conjunto de sistemas de reparação de DNA. O DNA pode
ser danificado por um conjunto de processos espontâneos, ou catalisados por agentes ambientais. A
replicação por si mesmo pode originar ocasionalmente danos na informação contida no DNA quando
introduz erros no emparelhamento de bases.
A química dos danos do DNA é grande (como já foi visto), assim, também as respostas celulares para
reparação destes erros apresentam uma grande variedade de transformações químicas no metabolismo do
DNA.
A melhor maneira para ilustrar a importância da reparação do DNA é considerando os efeitos do DNA
não reparado. O dano mais sério no DNA é a troca de bases na sua sequência, a qual é transmitida pela
replicação às gerações futuras tornando-se permanentes. Uma alteração permanente no DNA é chamada de
mutação. As mutações podem envolver a substituição de bases, e por isso são chamadas de mutações de
substituição, ou então envolver a quebra ou adição de sequências e por isso são chamadas de mutações de
adição ou de quebra. Se a mutação afectar uma zona não essencial do DNA, então dizemos que se trata de
uma mutação silenciosa pois ela não produz nenhuma alteração no fenótipo do organismo. É raro uma
mutação conferir alguma vantagem biológica ao organismo, a maioria das mutações não silenciosas são na
maior parte das vezes deletérias.
O número e a diversidade de sistemas de reparação reflectem tanto a importância da reparação do DNA
para a sobrevivência celular como a variedade de fontes de danos. A reparação de alguns danos causados no
DNA é possível em parte graças ao facto deste ser constituído por duas cadeias complementares, sendo que
se usa a cadeia não danificada como molde para a correcção do dano verificado na outra cadeia.

43
REPARAÇÕES DIRECTAS

Vários tipos de reparações são efectuados sem haver a necessidade de remover a base ou o nucleótido. O
exemplo melhor caracterizado é a fotoreactivação directa dos ciclobutanos de dímeros de pirimidinas,
reacção esta promovida pelas DNA fotoliases. Os dímeros de pirimidinas resultam da acção de raios UV
(como visto anteriormente), e a fotoliase utiliza energia da luz absorvida para desfazer os dímeros. A
fotoliase geralmente possui dois cofactores que servem como agentes absorventes da luz, ou cromóforos.
Um dos cromóforos é sempre FADH–. Exemplos adicionais de reparações directas podem ser observados na
reparação de bases modificadas com alquilantes.Este processo já foi explicado anteriormente.

REPARAÇÃO DE BASES MAL EMPARELHADAS – METILAÇÕES EM E. coli

A correcção de bases mal emparelhadas não corrigidas pelo mecanismo de revisão da DNA Polimerase
durante a replicação aumenta o grau de fidelidade numa taxa de 102 a 103. Os mal emparelhamentos são
muitas vezes corrigidos de forma a reflectir a informação contida na cadeia antiga (molde), assim o
mecanismo de reparação deve, de alguma maneira, fazer a discriminação entre a cadeia molde e a nova
cadeia. A célula resolve este problema rotulando a cadeia molde com grupos metilo. O mecanismo de
reparação de mal emparelhamentos em E. coli envolve pelo menos 12 componentes proteicos envolvidos
tanto no reconhecimento da cadeia molde como na correcção do erro.
O mecanismo de discriminação, propriamente dito, ainda não se encontra bem documentado quer em
procariotas quer em eucariotas, contudo, em E. coli e outras bactérias aparentadas este já se encontra bem
definido. Nestes procariotas o mecanismo de discriminação baseia-se na acção da Dam metilase, a qual
metila o DNA na posição N6 de todas as adeninas em sequência (5’) GATC. Imediatamente após a
passagem do garfo de replicação existe um curto período (apenas alguns segundos ou minutos) em que a
cadeia molde é metilada mas a cadeia sintetizada não é. O estado transitório não metilado da sequência
GATC na cadeia nova permite a esta distinguir-se da cadeia molde. Os erros de replicação no
emparelhamento de bases é então corrigido de acordo com a informação na cadeia metilada (molde). Testes
in vitro mostraram que se ambas as cadeias se encontrarem metiladas na sequência GATC poucos são os
mal emparelhamentos que são corrigidos. Se nenhuma cadeia se encontrar metilada, a correcção ocorre mas
não favorece nenhuma cadeia. O sistema de reparação celular de bases mal emparelhadas repara
eficientemente até 1000pb de sequências GATC hemimetiladas. Para muitas espécies bacterianas, o
mecanismo de discriminação das cadeias durante a reparação de mal-emparelhamentos ainda não se
encontra bem determinado.

44
Como é o mecanismo de correcção dirigido para zonas relativamente distantes da sequência GATC. A
proteína MutL forma um complexo com as proteínas MutS, e este complexo liga-se a todas as bases mal
emparelhadas (excepto C-C). Então a proteína MutH reconhece as sequências GATC e junta-se ao
complexo MutS/MutL. O DNA de ambos os lados do emparelhamento incorrecto são juntos pelo complexo
de proteínas Mut e formam um loop de DNA. A proteína MutH possui um local específico com actividade
de endonuclease que se encontra inactivo até ao complexo encontrar o local com a sequência GATC. Neste
local a MutH catalisa a clivagem da cadeia não metilada do lado 5’ do nucleótido G da sequência GATC, o
que marca a cadeia a ser reparada.

Futuros passos na reparação dependem de onde o emparelhamento incorrecto está localizado
relativamente a este local de clivagem. Quando o emparelhamento incorrecto se encontra a 5’ da clivagem,
a cadeia desmetilada é desligada e degradada no sentido 3’ 5’ desde o local de clivagem até ao local do
erro, e este fragmento é preenchido com novo DNA. Este processo inclui a acção combinada da DNA
helicase II, SSB, exonuclease I ou exonuclease X (ambos degradam DNA na direcção 3’ 5’), DNA
polimerase III, e DNA ligase. A via para reparar emparelhamentos que se encontrem a 3’ do local de
clivagem é semelhante, excepto que a exonuclease é tanto a exonuclease VII (que degrada cadeias simples
de DNA tanto na direcção 3’ 5’ como na direcção 5’ 3’) ou RecJ nuclease ( a qual degrada cadeias
simples de DNA apenas na direcção 5’ 3’).

45
A reparação de bases mal emparelhadas é um processo particularmente dispendioso para E. coli em
termos de energia utilizada. O emparelhamento incorrecto pode estar até 1000pb do local da sequência
GATC. A degradação e o re-preenchimento do segmento da cadeia com este comprimento requer um
investimento enorme de energia em activar percursores de desoxinucleótidos de forma a reparar um único
erro no emparelhamento de DNA. Isto, mais uma vez, sublinha a importância em preservar a integridade
genómica.
Todas as células eucarióticas possuem proteínas funcionalmente e estruturalmente análogas às proteínas
procariotas MutL e MutS (mas não às MutH). Alterações nos genes humanos que codificam este tipo de
proteínas produzem alguns dos mais comuns sindromas hereditários de susceptibilidade a cancros, mais
uma vez isto representa a importância na reparação do DNA.

REPARAÇÃO DE EXCISÃO DE BASES
Todas as células possuem um tipo de enzimas chamadas DNA glicosilases que reconhecem lesões no
DNA particularmente comuns (tais como os produtos de desaminação da citosina ou da adenina) e remover
a base afectada simplesmente quebrando a ligação N-glicosil. Esta clivagem cria um local apurínico ou
apirimidínico, normalmente referido como Locais AP ou Locais abasic. Cada DNA glicosilase é
geralmente específica para um tipo de lesão.
DNA glicosilase de uracilo, por exemplo, encontrado na maioria das células, remove especificamente o
uracilo do DNA resultante da desaminação espontânea da citosina. Células mutantes para este gene que
cause a falta desta enzima têm um grande número de mutações que transformam pares G≡C em pares A= T.
Esta enzima não remove o uracilo das moléculas de RNA nem os resíduos de timina das moléculas de DNA.
A capacidade de distinguir timina de uracilo, pode ter sido uma das razões que levou o DNA a evoluir na
presença de timina em vez de uracilo como base.
As bactérias geralmente possuem apenas um tipo de uracilo DNA glicosilase, enquanto que os humanos
possuem pelo menos 4 tipos, com diferentes especificidades – um indicador da importância da remoção de
uracilo do DNA.
Outras DNA glicosilases reconhecem e removem uma variedade de outros danos no DNA, incluindo
bases anormais (uracilo, xantina, hipoxantina), bases alquiladas e bases alteradas por oxidação ou pela
radiação ionizante. Glicosilases que reconhecem outras lesões, incluindo dímeros de pirimidina, já foram
identificadas em algumas classes de organismos. Não esquecer que os locais AP também se originam na
lenta e espontânea degradação das ligações N-glicosil.
Uma vez o local AP estar formado um outro grupo de enzimas entra em cena para o reparar. A reparação
não é feita simplesmente pela inserção de uma nova base e re-formar a ligação N-glicosil. Em vez disso, a
desoxirribose com fosfato 5’ deixada para trás é removida e substituída por um novo nucleótido. Este
processo inicia-se com AP endonuclease, uma enzima que corta a cadeia de DNA que contém o local AP.
O local da cisão relativamente ao local AP (a montante ou a jusante do local) varia com o tipo de AP
endonuclease. O segmento contendo o local AP é então removido e a DNA polimerase I substitui este
fragmento, por fim uma DNA ligase sela a ligação entre o novo fragmento e a cadeia antiga.

Em eucariotas, a substituição de nucleótidos é levado a cabo por polimerases especializadas.
46
REPARAÇÃO POR EXCISÃO DE OLIGONUCLEÓTIDOS
Lesões no DNA que causem grandes distorções na estrutura helicoidal geralmente são reparadas pelo
sistema de reparação por excisão de nucleótidos, uma via de reparação essencial para a sobrevivência de
todos os organismos livres. Na reparação por excisão de nucleótidos, uma enzima multisubunitária hidrolisa
duas ligações fosfodiester, uma em cada lado da distorção causada pela lesão. Em E. coli e outros
procariotas, o sistema enzimático hidrolisa a quinta ligação fosfodiéster do lado 3’ e a oitava ligação
fosfodiéster no lado 5’ de modo a gerar um fragmento de 12 a 13 nucleótidos (dependendo se a lesão afecta
uma ou duas bases). Em humanos e outros eucariotas, o sistema enzimático hidrolisa a sexta ligação do lado
3’ e a vigésima segunda ligação do lado 5’, produzindo um fragmento entre 27 e 29 nucleótidos. Seguindo a
incisão dupla, os oligonucleótidosexcisados são libertados da dupla hélice e a falha resultante é preenchida
pela DNA polimerase I em E. coli e pela DNA polimerase ε em humanos. A DNA ligase liga a falha
resultante.
Em E. coli a chave do complexo enzimático é a excinuclease ABC, a qual possui três subunidades, UvrA,
UvrB e UvrC. O termo excinuclease é usado para descrever a capacidade única do complexo para catalizar
duas clivagens endonucleotídicas específicas, distinguindo esta actividade da actividade das endonucleases
padrão. O complexo das proteínas UvrA e UvrB (A2B) revê o DNA e liga-se ao local da lesão. Quando o
dímero de UvrA se dissocia deixa um ligeiro complexo UvrB-DNA. A proteína UvrC então liga-se à UvrB
e faz uma incisão na quinta ligação fosfodiéster do lado 3’ da lesão. Esta é seguida por uma incisão mediada
por UvrC na oitava ligação fosfodiéster do lado 5’ da lesão. O fragmento resultante, com 12 ou 13
oligonucleótidos é removido pela UvrD helicase. A pequena falha então criada é preenchida pela DNA
polimerase I e DNA ligase. Esta via é uma rota de reparação primária para muitos tipos de lesões, incluindo
dímeros ciclobutanos de pirimidinas, 6-4 fotoproductos, e vários outros tipos de lesões.
O mecanismo de excinuclease em eucariotas é semelhante a este, contudo 16 polipéptidos sem qualquer
similaridade com as subunidades de excinuclease de E. coli são necessários para se efectuar o corte duplo.
Deficiências genéticas na reparação por excisão de nucleótidos em humanos dão origem a uma série de
doenças.

47
A DNA lesion that causes distortion of the
double helix, such as a thymine dimer, is initially
recognized by a complex of the XP-C (xeroderma
pigmentosum C protein) and 23B proteins (step 1).
This complex then recruits transcription factor
TFIIH, whose helicase subunits, powered by ATP
hydrolysis, partially unwind the double helix. XP-G
and RPA proteins then binds to the complex and
further unwind and stabilize the helix until a bubble
of ≈25 bases is formed (step 2). Then XP-G (now
acting as an endonuclease) and XP-F, a second
endonuclease, cut the damaged strand at points
24-32 bases apart on each side of the lesion (step
3). This releases the DNA fragment with the
damaged bases, which is degraded to
mononucleotides. Finally the gap filled by DNA
polymerase exactly as in DNA replication, and the
remaining nick is sealed by DNA ligase (step 4).
A EXCISÃO DE NUCLEÓTIDOS FOI ELUCIDADO ATRAVÉS DO ESTUDO DE XERODERMA
PIGMENTOSUM

As células usam o mecanismo de reparação por excisão de
nucleótidos para corrigir regiões do DNA que contenham bases
quimicamente modificadas, isto distorce a forma normal do DNA
localmente. A chave para este tipo de reparação é a habilidade de
certas proteínas deslizarem ao longo da superfície da cadeia dupla de
DNA à procura de irregularidades na forma da dupla hélice. Por
exemplo, este mecanismo repara dímeros de timina, um dano comum
causado pela luz UV. Estes dímeros interferem tanto com a
replicação como com a transcrição. A excisão de nucleótidos
consegue corrigir zonas do DNA que contenham bases alteradas por
ligações covalentes de agentes carcinogénicos tais como o
benzo(a)pyrene e aflatoxin, ambos causadores da troca G para T.
A figura ao lado ilustra a forma como o mecanismo de reparação
por excisão de nucleótidos repara o DNA. Algumas 30 proteínas
estão envolvidas neste processo, a primeira das quais foi identificada
pelo estudo de defeitos na reparação do DNA em células cultivadas a
partir de indivíduos com a doença Xeroderma pigmentosum, uma
doença hereditária associada com a predisposição para o cancro.
Indivíduos com esta doença desenvolvem frequentemente cancros da
pele chamados melanomas e carcinomas escamosos da pele, se a sua
pele estiver exposta a raios UV do sol.
Nas células de pacientes afectados falta um sistema funcional de
reparação por excisão de nucleótidos. Mutações em qualquer um, de
pelo menos 7 genes diferentes, chamados XP-A até XP-G, levam à
inactivação deste processo de reparação e causam esta doença; todas
estas mutações produzem o mesmo fenótipo e têm as mesmas
consequências. O papel da maioria destas proteínas XP na excisão de
nucleótidos ainda não é bem compreendido.
Espantosamente, cinco subunidades polipeptídicas da TFIIH, um
factor de transcrição comum, são necessárias para a excisão de
nucleótidos em células eucarióticas, incluindo duas com homologia
com as helicases. Na transcrição a actividade de helicase da TFIIH
desfaz a hélice de DNA no local da origem de replicação,
possibilitando à RNA polimeraseII iniciar o processo de síntese dos
primers.
O uso de subunidades partilhadas na transcrição e na reparação
do DNA pode ajudar a explicar a observação de que danos no
DNA, em eucariotas superiores, são reparados a uma velocidade
muito superior em regiões do genoma que são activamente
transcritas do que naquelas zonas não transcritas. Visto que apenas
uma pequena fracção do genoma é transcrita em qualquer célula
dos eucariotas superiores, o par transcrição/reparação repara
eficientemente reparações directas nas regiões mais criticas. Neste
sistema, se a RNA polimerase ficar presa numa lesão no DNA (ex.:
dímeros de timina), uma pequena proteína, CBS, é recrutada, esta
acciona a abertura da hélice de DNA naquele ponto e recruta a
TFIIH, e o resto da reacção é igual (identificação, corte e
substituição).

REPARAÇÃO DAS QUEBRAS NAS CADEIAS DE DNA

JUNÇÃO DAS EXTREMIDADES (“ERROR-PRONE”)
Em organismos multicelulares, o mecanismo predominante para a correcção de quebras na cadeia dupla
de DNA envolve a colagem de extremidades não homologas de duas moléculas de DNA. Mesmo que as
moléculas tenham origem no mesmo cromossoma, do processo de reparação resulta sempre a perda de
nucleótidos da sequência original no ponto de junção. A formação de tais estruturas com potencialidade
mutagénica é um exemplo de como a reparação de DNA pode introduzir mutações.
Visto que o movimento de DNA no denso núcleo é escasso, muitas vezes as pontas unidas têm origem no
mesmo ponto, contudo há sempre perda se nucleótidos. Contudo, extremidades de cromossomas diferentes
ocasionalmente são coladas, o que resulta numa translocação de pedaços de DNA de um cromossoma para
outro. Os efeitos devastadores que estas translocações podem provocar fazem destas “the most unkindest
cuts of all” citando William Shakespeare na sua obra Julius Caesars.

Esta tabela mostra
alguns dos diferentes tipos
de proteínas e enzimas
envolvidas nos diferentes
processos de reparação de
bases, e o tipo de danos que
elas corrigem.
1. Junção das extremidades (“error-prone”)

2. Recombinação homóloga (“error-free”)
49
RECOMBINAÇÃO DE DNA

Os eventos de recombinação genética envolvem a troca genética entre quaisquer duas moléculas de DNA
(ou segmentos da mesma molécula) e distribuem-se em três classes gerais. Recombinação genética
homóloga (também chamada geralmente de recombinação), envolvendo a troca genética entre moléculas ou
zonas da mesma que partilham uma região da sequência quase idêntica. A actual sequência de bases é
particularmente irrelevante, desde que seja semelhante nas duas moléculas de DNA. Na recombinação
genética específica, as trocas ocorrem apenas em zonas particulares da sequência de DNA. A transposição
de DNA é distinta das duas anteriores no facto de que envolve um pequeno fragmento do DNA com
capacidade de se mover de um local para outro. Há, no entanto, outras formas de rearranjos genéticos que
não pertencem propriamente a nenhum destes três tipos e cujo mecanismo ainda não é muito explicito. Nós
vamo-nos focar apenas nestes três.
As funções dos sistemas de recombinação genética são tão variadas quanto os próprios mecanismos.
Eles têm papeis na reparação de DNA, actividade especifica na replicação do DNA, regulação de alguns
genes, facultar a segregação própria dos cromossomas durante a divisão celular, manutençãoda diversidade
genética e implementação de rearranjos genéticos programados durante o desenvolvimento embrionário. Na
maioria dos casos, a recombinação genética encontra-se bastante relacionada com outros processos no
metabolismo do DNA.

RECOMBINAÇÃO GENÉTICA HOMÓLOGA
Nos eucariótas, a recombinação genética homóloga pode ter vários papéis na replicação e na divisão
celular, incluindo o reparo de garfos de replicação “enguiçados”. A recombinação atinge o auge de
frequência durante a meiose. A meiose inicia-se com a
replicação do DNA nas células da linha germinativa, de
modo que cada molécula de DNA forma 4 cópias. A célula
entra então em dois ciclos de divisão celular sem, entre
eles, passar por uma fase de replicação de DNA. Isto reduz
o conteúdo de DNA a um nível haplonte em cada gâmeta.
Depois do DNA ser replicado durante a profase I, os
cromatídeos irmãos resultantes associam-se pelos
centrómeros. Nesta fase, cada par cromossomas homólogos
existe como dois pares de cromatídeos. Informação
genética é agora trocada entre os cromatídeos homólogos
associados por recombinação genética homóloga, um
processo que envolve a quebra e a colagem de DNA. Esta
troca, também referida como crossing-over, liga os dois
pares de cromatídeos irmãos em pontos chamados “pontos
de quiasma” (plural, quiasmata).
O crossing-over liga eficientemente todos os quatro cromatídeos
homóloga, uma ligação que é essencial para a própria segregação dos
cromossomas na divisão meiótica subsequente. O crossing-over não é
um processo totalmente ao acaso, e alguns “hot spots” têm sido
detectados em muitos cromossomas eucarióticos.
A recombinação homóloga, assim, possui pelo menos três funções:
(1) contribui para a reparação de vários tipos de danos no DNA
(principalmente em bactérias, nós não estudamos); (2) providencia,
em eucariótas, uma ligação transitória entre os cromatídeos irmãos
que promovem a segregação ordeira dos cromossomas na primeira
divisão celular da meiose; e (3) ela engrandece a diversidade genética
na população.

50
A RECOMBINAÇÃO DURANTE A MEIOSE É INICIADA COM UM CORTE NA CADEIA DUPLA
Uma via provável para a recombinação homóloga é
ilustrada na figura ao lado. O modelo possui três
características chave. Primeiro, os cromossomas homólogos
são alinhados. Segundo, a cadeia dupla é clivada por uma
exonuclease, deixando uma extensão em cadeia simples
com um grupo hidróxilo 3’ livre na extremidade cortada (1).
Terceiro, a extremidade 3’ exposta invade a cadeia dupla de
DNA intacta, e isto é seguido de “branch migration” e/ou
replicação de forma a criar uma estrutura chamada de
“intermediário de Holliday” ((2) e (3)). Quarto, clivagem
dos dois crossover criados de forma a completar os
produtos recombinantes.
No modelo de reparação de quebras na cadeia dupla, o
terminal 3’ é usado para iniciar as trocas genéticas. Uma
vez emparelhado com a cadeia complementar no homólogo,
cria-se uma região de DNA híbrida que contém cadeias
complementares de origens diferentes (produto do passo 2).
Cada um dos terminais 3’ pode agora servir como primer
para a replicação. As estruturas assim formadas, chamadas
de “intermediário de Holliday”, são o aspecto da
recombinação genética homóloga em todos os organismos.

A recombinação Homóloga pode variar em muitos
detalhes de uma espécie para a outra, mas a maioria dos
passos supra-referidos estão de alguma forma presentes.
Para entender de que forma é que este processo contribui
para a diversidade genética há que se ter em atenção que os
cromossomas homólogos que sofrem recombinação não são
totalmente idênticos. A disposição linear dos genes pode ser
a mesma, mas a sequência de bases em alguns genes pode
diferir ligeiramente (alelos). Nos humanos, por exemplo,
um gene com um alelo para a hemoglobina normal, pode
recombinar com um gene com o alelo para a hemoglobina
S. A diferença pode consistir em não mais de um par de
bases entre milhões. Recombinações homólogas não
alteram a disposição linear dos genes, mas pode determinar
quais os alelos que ficam ligados num único cromossoma.

51
A recombinação como todos os processos já
estudados envolve uma série de enzimas que regulam
os vários passos. De todas, a proteína Rec A é a que
promove os passos centrais na recombinação: o
emparelhamento das duas cadeias de DNA, a formação
dos intermediários de Holliday e “branch migration”.
A proteína RecA é algo invulgar, dentro de todas as
proteínas do metabolismo de DNA, na sua forma
activa, ordenada, em forma de um filamento helicoidal
de mais de mil monómeros de RecA que se associam
cooperativamente na cadeia de DNA. Este filamento
vai-se também formar em torno da cadeia dupla de
DNA. À medida que a cadeia dupla é incorporada no
seio do filamento de RecA e alinhada com a cadeia
simples proveniente do cromossoma homólogo, uma
cadeia da dupla hélice troca de parceiros de
emparelhamento (passo2). Porque o DNA tem uma
estrutura helicoidal, a troca continua requer uma
rotação ordenada das duas moléculas de DNA
alinhadas. Isto trás à tona a actividade da RecA de
bobina que faz a troca, pontualmente, ao longo da
hélice. Para esta reacção é necessário a hidrólise de
ATP por parte da RecA.
Uma vez formado o intermediário de Holliday,
muitas outras proteínas – topoisomerases, TuvAB
branch migration protein, resolvases, nucleases, DNA
polimerase I e III e DNA ligase – são necessárias para
completar a recombinação.

52
RECOMBINAÇÃO GENÉTICA ESPECÍFICA
A recombinação genética homóloga pode envolver quaisquer duas sequências homólogas. O segundo
tipo geral de recombinação, recombinação específica, é um tipo de processo bastante diferente: a
recombinação é limitada a sequências específicas. Reacções de recombinação deste tipo ocorrem
virtualmente em todas as células, preenchendo papéis especializados que variam grandemente de uma
espécie para outra. Exemplos que incluem a regulação da expressão génica e a promoção de rearranjos de
DNA no desenvolvimento embrionário; ou ainda nos ciclos de replicação de alguns DNAs virais e
plasmidiais. Cada sistema de recombinação específica consiste numa enzima chamada recombinase e uma
pequena sequência única onde a recombinase actua (local de recombinação). Uma ou mais proteína podem
regular o tempo e desenrolar da reacção.
A sequência dos locais de recombinação reconhecida pela recombinase são parcialmente assimétricas
(não palindrómicas), e os dois locais de recombinação alinham-se na mesma direcção durante a reacção da
recombinase. O resultado depende da localização e da orientação dos locais de recombinação. Se os locais
de recombinação se encontram em moléculas diferentes, a recombinação é intermolecular; se um DNA ou
ambos são circulares o resultado é uma inserção. Também ocorre este tipo de recombinação dentro da
mesma molécula de DNA, mas esse processo não é estudado por nós nesta cadeira.
O primeiro sistema de recombinação específica estudado in vitro foi aquele descodificado pelo
bacteriófago λ. Quando o DNA do fago entra numa célula de E. coli , uma série de eventos regulatórios
complexos submetem o DNA a um dos dois destinos. O DNA λ ou se duplica e produz mais bacteriófagos
(destruindo a célula hospedeira) ou se integra no cromossoma hospedeiro, replicando-se passivamente
juntamente com a bactéria ao longo de várias gerações. A integração é acompanhada por uma recombinase
codificada pelo bacteriófago (λ integrase) que actua no local de recombinação no DNA do fago e da bactéria
– nos locais de ligação attP e attB (attchment sites Phage anda Bacterial), respectivamente.

RECOMBINAÇÃO DOS SEGMENTOS V E J DA CADEIA LEVE IG KAPPA
Alguns rearranjos do DNA são uma parte programada no desenvolvimento de organismos eucariotas.
Um exemplo importante é a geração do gene completo da imunoglobina a partir de segmentos de genes
separados no genoma de vertebrados. Um humano (tal como todos os mamíferos)é capaz de produzir
milhões de imunoglobinas (anticorpos) diferentes, com especificidades de ligação distintas, mesmo quando
o genoma humano possui apenas ~35 000 genes. A recombinação permite a um organismo produzir uma
variedade extraordinária de anticorpos a partir de uma capacidade limitada de genoma codificante. Estudos
do mecanismo de recombinação revelaram uma relação próxima com os transposões e sugeriram que o
sistema de gerar esta diversidade de anticorpos evoluiu a partir de ancestrais invasões por transposões.
53
Nós podemos usar os genes humanos que codificam proteínas da classe das imunoglobinas G (IgG) para
ilustrar como se gera a diversidade de anticorpos. Imunoglobinas consistem em duas cadeias polipeptídicas
pesadas e duas leves. Cada uma destas cadeias possui duas regiões, uma variável, com uma sequência que
varia bastante de uma imunoglobina para outra, e uma conservada dentro de cada classe de imunoglobinas.
Existem ainda duas famílias distintas de cadeias leves, Kappa e Lambda, que diferem de alguma maneira na
sequência da sua região constante. Para todos os três tipos de cadeias polipeptídicas (cadeia pesada e cadeias
leves kappa e lambda), a variabilidade na região variável é gerada por mecanismos semelhantes. Os genes
para estes polipéptidos encontram-se divididos em segmentos, e o genoma contém grupos com múltiplas
versões de cada segmento. A junção de uma versão de cada segmento cria um gene completo.
A figura ilustra a organização do DNA que
codifica a cadeia leve kappa de IgG em humanos
e mostra como uma cadeia madura é gerada. Em
células indiferenciadas a informação codificante
para este polipéptido encontra-se separada em
três segmentos. O segmento V (variável) codifica
95 aminoácidos, a região J (joining) codifica os
restantes 12 aminoácidos da região variável, e o
segmento C (constante) que codifica a região
constante. O genoma possui cerca de 3
segmentos V diferentes, 4 segmentos J
diferentes, e 1 segmento C.
Assim uma célula estaminal da medula óssea
diferencia-se para formar um linfócito B maduro,
um segmento V e outro J são juntos por um
mecanismo especializado de recombinação.
Durante esta delecção programada de DNA, o
DNA interveniente é descartado. Existem cerca
de 300 x 4 = 1 200 possibilidades de
combinações V-J. Este processo de
recombinação não é tão preciso quanto a
recombinação específica, assim variações
adicionais ocorrem na sequência na junção V-J.
Isto aumenta a variação global num factor de pelo menos 2.5, assim as células podem gerar cerca de
1200x2.5 = 3000 combinações diferentes de V-J. A junção final da combinação junta-se à sequência C e é
acompanhada de uma reacção de splicing de RNA pós transcrição.
Os genes para a cadeia pesada e a cadeia leve lambda formam-se de forma semelhante. As cadeias leves
possuem mais fragmentos de genes que as cadeias leves, com mais de 5000 combinações possíveis. Porque
qualquer cadeia leve pode emparelhar com qualquer cadeia pesada para gerar imunoglobulinas, cada
humano tem pelo menos 3000 x 5000 = 1.5X107 IgG possíveis. Variações adicionais são geradas pela
elevada taxa de mutações (de mecanismo desconhecido) na sequência V durante a diferenciação do
linfócito. Cada linfócito B maduro produz apenas um tipo de anticorpo, mas a variedade de anticorpos
produzidos por diferentes células é enorme.

ELEMENTOS GENÉTICOS MÓVEIS TRANSPOSÕES
Iremos agora considerar o terceiro tipo geral de sistemas de recombinação: é um tipo de recombinação
que possibilita o movimento de elementos transponíveis, os transposões. Estes segmentos de DNA,
virtualmente encontrados em todas as células, movem-se ou saltam de um local para outro do cromossoma
(local dador) para outro local no mesmo cromossoma ou num diferente (local alvo). Não é necessário
nenhum tipo de homologia no DNA para este tipo de movimento, chamado transposição; o novo local é
determinada mais ou menos ao acaso. A inserção de um transposão num gene essencial poderia matar o
54
organismo, por isso a transposição é um fenómeno altamente regulado e
pouco frequente. Os transposões são, talvez, os parasitas moleculares
mais simples; adaptados a replicarem-se passivamente com o
cromossoma da célula hospedeira. Em alguns casos eles carregam genes
que são úteis para a célula hospedeira, e por isso existem num tipo de
simbiose com o hospedeiro.
Os transposões bacterianos variam em estrutura, mas a maioria
possui uma pequena sequência repetida em cada extremidade que serve
como locais de ligação para a transposase. Quando a transposição ocorre,
uma pequena sequência na zona alvo (5 a 10pb) é duplicada para formar
uma sequência repetida adicional que encaixe cada extremidade do
transposão a ser inserido (mecanismo “cortar e colar”). Estes segmentos
duplicados resultam do mecanismo de corte usado para inserir o
transposão na nova localização.
Existem duas vias gerais para a transposição em bactérias. Na
transposição directa (representada com o transposão a cor-de-laranja na
figura de baixo) ou transposição simples, cortes em ambos os lados do transposão retira-o do local de
origem e o transposão move-se para o sua nova localização. Isto
deixa um corte na cadeia dupla no DNA dador que necessita ser
reparado. No local alvo, um corte estratégico é feito, o transposão
é inserido no corte e a replicação do DNA preenche as falhas
duplicando as sequências alvo (zonas a vermelho na figura de
cima).
No segundo tipo de transposição, o transposão é transcrito, não
sendo portanto removido do seu local de origem, formando-se um
intermediário de RNA, este é convertido por uma trancriptase
reversa numa cadeia dupla de DNA e é esta que se vai ligar à
zona alvo, a estes transposões chamamos de retrotransposões.
A maioria dos elementos móveis em bactérias são transposões
directos (transposões de DNA). Em contraste em eucariótas a
maioria são retrotransposões, contudo transposões directos
também ocorrem, e de facto estes foram os primeiros a serem
descobertos.

SEQUÊNCIAS DE INSERÇÃO BACTERIANA (TRANSPOSÕES DE DNA)
A primeira luz para perceber os elementos móveis veio do estudo de certas mutações em E. coli
causadas pela inserção espontânea de sequências de DNA no meio de alguns genes. Estes segmentos de
DNA inseridos são chamados sequências de inserção, ou elementos IS. Por agora mais de 2 elementos IS
diferentes já foram caracterizados em E. coli e outras bactérias.
A transposição de um elemento IS é um evento muito raro, ocorrendo apenas um em cada 105-107 células
por geração, variando com o tipo de elemento. Muitos transposões inactivam genes essenciais, matando a
célula hospedeira e o elemento IS que carregam. Consequentemente, altas taxas de transposões iriam
provavelmente resultar numa taxa de mutação bastante elevada para que a célula hospedeira conseguisse
sobreviver.
Contudo, visto que os elementos IS transpõem mais ou menos ao acaso alguns transposões entram em
regiões não essenciais do genoma (ex. zonas entre os
genes), permitindo à célula sobreviver a uma taxa muito
baixa de transposões a maioria da s células é capaz de
sobreviver e consequentemente propagam o elemento
IS simbiótico. Elementos IS também conseguem-se
ligar a plasmídeos ou a vírus lisogénicos, e assim serem
transferidos para outras células. Quando isto acontece,
55
elementos IS podem ser transpostos em cromossomas de células virgens.
A estrutura geral de um elemento IS esta representado na figura. Uma zona repetida e invertida (inverted
repeat) contendo cerca de 50 pares de bases encontra-se, invariavelmente, na extremidade de uma sequência
de inserção. Numa inverted repeat a sequência 5’ 3’ numa cadeia é repetida na outra cadeia como:
5’GAGCT-------GAGCT3’ / 3’CTCGA-------CTCGA5’. Entre as regiões de inverted repeat encontra-se
uma região que codifica a transposase, uma enzima necessária para a transposição do elemento IS para um
novo local. A transposase é expressaa uma taxa muito baixa, dado a baixa frequência de ocorrência de
transposões. Um importante ponto dos elementos IS é a presença de sequências curtas repetidas
directamente. (direct-repeat sequence), contendo 5-11 pb,
imediatamente adjacente a ambos os terminais do
elemento de inserido.
O comprimento das direct-repeat é característico de
cada elemento IS, mas esta sequência depende da zona
alvo onde uma cópia particular do elemento IS vai ser
inseria. Quando a sequência de um gene mutado contendo
um elemento IS é comparada com a sequência do gene
tipo selvagem, apenas uma cópia da pequena sequência
direct-repeat é encontrada. A duplicação desta sequência
no local alvo para criar uma segunda sequência direct-
repeat adjacente ao elemento IS ocorre durante o processo
de inserção.
Como mostra a figura, a transposição de um elemento
IS é semelhante ao mecanismo “Cortar e colar”. A
transposase desempenha três funções neste processo: (1)
retira com precisão o elemento IS do DNA dador, (2) faz
cortes estratégicos numa pequena sequência no DNA
alvo, e (3) liga o terminal 3’ do elemento IS ao terminal 5’
do corte efectuado no dador. Finalmente a DNA
polimerase da célula hospedeira preenche as falhas ,
gerando uma pequena sequência direct-repeat que
rodeiam o elemento IS, e a DNA ligase liga os terminais
livres.
Estes elementos móveis que são transpostos através de
intermediários de DNA são geralmente chamados de
transposões de DNA. Os elementos móveis que são transpostos para novos lugares através de um
intermediário de RNA são chamados retrotransposões porque o seu movimento é análogo ao efectuado por
processos infecciosos por parte dos retrovírus. De facto os vírus podem ser “imaginados” como
retrotransposões que transportam genes codificantes para proteínas virais, de modo a possibilitar-lhes
infectar mais células.

RETROTRANSPOSÕES COM SEQUÊNCIAS LTR
O genoma de todos os organismos eucariótas contém retrotransposões, elementos de DNA móveis que
são transpostos através de um intermediário de RNA utilizando uma transcriptase reversa. Estes elementos
móveis encontram-se divididos em duas grandes categorias, aqueles que contêm e aqueles que não contêm
LTRs (long terminal repeats). Retrotransposões com LTR são comuns em leveduras e em Drosophila.
Apesar de menos abundantes em mamíferos que os transposões sem LTRs, retrotransposões com LTR
constituem nada menos que 8% do genoma humano.
A estrutura geral de um retrotransposão com LTR, encontrado
em eucariotas, está representada na figura. Em adição as pequenas
direct-repeats nas extremidades 3’ e 5’ típicas de todos os
elementos móveis, estes retrotransposões estão marcados pela
presença de LTR que rodeiam a zona central codificadora de proteínas. Estes LTRs, contendo ~250-600pb,
56
são característicos por integrarem DNA retoviral e são críticos ao ciclo de vida dos retrovírus. Além de
partilharem LTRs com os retrovírus, retrotransposões com LTRs codificam todas as proteínas dos tipos
mais comuns de retrovírus, exceptuando as proteínas do invólucro. Na falta destas proteínas do invólucro,
retrotransposões LTRs não conseguem sair da sua célula hospedeira e infectar outra célula; contudo eles
conseguem-se mover para novos locais no DNA do seu hospedeiro.
Um passo chave no ciclo de vida dos
retrovírus é a formação de RNA retroviral a
partir de DNA retroviral integrado. Este
processo serve como modelo para a geração
de RNA intermediário durante a transposição
dos retrotransposões com LTR. Como mostra
a figura, a zona LTR da esquerda tem funções
como promotor que direcciona RNA
polimerase II da célula hospedeira a iniciar a
transcrição no nucleótido 5’ da sequência R.
Após todo o DNA retroviral ter sido transcrito
a sequência de RNA correspondente ao LTR
do lado esquerdo direcciona as enzimas de
processamento de RNA da célula hospedeira a
clivar o transcrito primário e a acrescentar
uma cauda de poli(A) na extremidade 3’ da sequência R. O RNA retroviral
resultante, no qual falta uma sequência completa de LTR, é empacotado
num virião que cresce na célula hospedeira.
Após uma infecção com retrovírus, dá-se a transcrição reversa do seu
RNA pela proteína transcriptase reversa codificada pelo retrovírus
resultando numa cadeia dupla de DNA contendo LTRs completos. Integrase, uma outra enzima codificada
pelo retrovírus, que se encontra relacionada com a transposase codificada por alguns transposões de DNA,
usa um mecanismo semelhante para inserir a cadeia dupla de DNA retroviral no genoma da célula
hospedeira. Neste processo, short direct-repeats do local alvo são geradas em ambos os lados da sequência
viral inserida.
Como visto antes, retrotransposões com LTR codificam transcriptase reversa e integrase. Por analogia
com os retrovírus, pensa-se que estes elementos móveis se deslocam através do mecanismo “cortar e colar”,
contudo a transcriptase reversa converte uma cópia do RNA do local dador em DNA; o qual é inserido no
local alvo pela integrase.
O sequênciamento do genoma humano mostrou que as sequências mais comuns relacionadas com
retrotransposões LTRs são derivadas de retroviroses endógenas (ERV). A maioria das 443.000 sequências
relacionadas-ERV no genoma humano consiste unicamente de LTRs isolados. Estas são derivadas de DNA
inteiro proviral por recombinação homóloga entre as duas sequências LTR, resultando na delecção da
sequência interna retroviral.

RETROTRANSPOSÕES SEM SEQUÊNCIAS LTR
Os elementos móveis mais abundantes em mamíferos são retrotransposões sem sequências LTRs, por
vezes chamados de retrotransposões não virais. Estas sequências de DNA moderadamente repetidas formam
duas classes em genomas de mamíferos: long interspersed elements (LINEs) e short interspersed elements
(SINEs). Em humanos o tamanho médio de LINEs é de ~6kb (21% genoma humano) enquanto que as
sequências SINEs rondam os 300pb (13% genoma humano). Sequências repetidas com características de
LINEs foram observadas em protozoários, insectos e plantas, mas por razões desconhecidas elas são
particularmente abundantes nos genomas de mamíferos. SINEs também foram encontrados primariamente
em DNA de mamíferos. Um largo número de LINEs e SINEs em eucariótas superiores foi acumulado com
o processo evolutivo por cópias múltiplas das sequências em algumas posições no genoma e inserção
noutras. Embora estes elementos móveis não contenham LTRs, as evidências disponíveis apontam que elas
são transpostas através de um intermediário de RNA.
57

LINEs
DNA humano contém três grandes famílias de LINEs que são semelhantes no seu mecanismo de
transposição, mas diferem nas suas sequências: L1, L2 e L3. Apenas membros da família L1 ainda
transpõem no genoma actual. A estrutura geral de um LINE completo é mostrada na figura. LINEs
normalmente são rodeados por curtas direct-repeats, os marcadores dos elementos móveis, e contêm duas
ORFs (open reading frames). ORF1, ~1kb, codifica uma proteína que liga RNA, e a ORF2, ~4kb, codifica
uma proteína que possui uma longa região de homologia com a transcriptase reversa dos retrovírus e
retrotransposões mas também possui actividade de endonuclease.

Dado que LINEs não contêm LTRs, o seu mecanismo de transposição através de um intermediário de
RNA difere dos transposões com LTR. As proteínas ORF1 e ORF2 são traduzidas a partir de um RNA
LINE. Estudos in vitro indicam que a transcrição pela RNA polimerase II é dirigida por promotores na
extremidade esquerda do DNA LINE integrado. RNA LINE é poliadenilado pelos mesmos mecanismos de
pós-transcrição que poliadenilam outros RNA. O RNA LINE é então transportado para o citoplasma, onde é
traduzido em proteínas ORF1 e ORF2. Cópias múltiplas da proteína ORF1 ligam-se ao RNA LINE, e a
proteína ORF2 liga-se à cauda de poli(A). O RNA LINE é então transportado de volta para o núcleo como
um complexo com as proteínas ORF1 e ORF2.

58
A proteína ORF2 faz então cortespodemos verificar, em retrospectiva, que naquela época somente um golpe intuitivo muito
excepcional, de extrema genialidade, poderia levar à cogitação de que a codificação da mensagem genética
fosse feita por meio da utilização de pares de bases complementares. Não havia a mínima evidência que
permitisse essa conjectura. Por isso, nem Chargaff, e nem qualquer outro pesquisador, até 1953, foi capaz de
perceber a complementaridade estrutural oculta na relação entre as concentrações molares das bases. Isso só
se tornou claro após a descoberta da hélice dupla do DNA. No dizer de Crick, “não foi a regra de Chargaff
que revelou a estrutura do DNA, e sim a estrutura do DNA que revelou a regra de Chargaff”.

Para analisar a estrutura do DNA, R. Franklin, no laboratório de M. Wilkins,
utilizava o método de difracção de Raios-X. Em um cristal as moléculas estão
arranjadas ordenadamente. Assim, quando um feixe de Raio-X atinge um cristal,
espalha-se ordenadamente de acordo com um padrão que reflecte a estrutura do
cristal. A imagem do padrão de espalhamento é fixada em um filme fotográfico
impressionado pelos Raio-X.

Na figura o padrão de espalhamento do feixe de Raio-X atravessando um cristal
de DNA indica que:
• A molécula é uma hélice (padrão em cruz no centro);
• As bases (áreas escuras) dispõem-se perpendicularmente ao eixo principal da molécula.
• Possui um diâmetro constante de 20 Å (angstrongs) o que não seria possível se a molécula fosse
composta apenas por uma cadeia de DNA, assim concluiu-se que a molécula seria composta por duas
cadeias de DNA entrelaçadas;
• O modelo proposto por Watson diz ainda que a cadeia
enrola para a direita e que no interior (no esqueleto)
existem as bases.
• A estrutura mantém-se devido a pontes de hidrogénio que
se estabelecem entre as bases e devido a forças de van der
Walls e interacções hidrofóbicas que se geram entre os
nucleótidos.
• Cada nucleótido distancia-se do outro por 3.4Å
• Cada volta da cadeia é constituída por 10 bases e possui
um comprimento de 36Å;
• A este modelo da molécula de DNA é chamado “modelo
B”

6
Outras observações:
• As bases adjacentes em cada cadeia encontram-se em planos paralelos;
• A orientação de uma cadeia é antiparalela em relação a outra;
• As cadeias são seguras por um preciso e regular emparelhamento de bases;
• Esta complementaridade é consequência do tamanho, forma e composição química das bases;
• Para manter a forma de dupla hélice uma purina (A ou G) – grandes – têm de emparelhar com uma
pirimidina (T ou C) – mais pequenas.
• No DNA normalmente A emparelha com T e G emparelha com C formando os pares A-T e G-C
também chamados de pares de Watson-Crick.
• A emparelha sempre com T pelo meio de duas pontes de hidrogénio;
• G emparelha sempre com C pelo meio de três pontes de hidrogénio;

• Sabe-se que uma purina emparelha com uma pirimidina devido ao diâmetro da molécula de DNA, se o
emparelhamento fosse purina-purina a molécula teria um maior diâmetro e se o emparelhamento fosse
pirimidina-pirimidina então a molécula teria um diâmetro mais reduzido.
• Duas cadeias polinucleótidas, ou regiões dessa, nas quais os nucleótidos formem tais pares dizem-se ser
complementares;
• Contudo em teoria e em DNAs sintéticos outras interacções podem ocorrer. Por exemplo a guanina
(purina) pode, teoricamente, emparelhar com a timina (pirimidina), causando apenas uma pequena
distorção na hélice;
• O espaço disponível na hélice permitiria também o emparelhamento entre duas pirimidinas, citosina e
timina;
• Apesar dos pares não padrão G-T, C-T normalmente não se encontrarem nas moléculas de DNA, G-U
são um quanto comuns em regiões de dupla hélice de RNA;
• Uma molécula com grande quantidade de ligações G-C é uma molécula muito estável e de difícil
desnaturação;

Duas cadeias de polinucleótidos podem, a princípio, formar tanto hélices que rodem para a esquerda
como hélices que rodem para a direita. Devido a geometria do esqueleto açúcar-fosfato ser mais compatível
com a primeira o DNA é naturalmente enrolado para a direita.
No exterior da forma B, os espaços entre as cadeias enroscadas forma dois tipos de encaixe com
diferentes dimensões – um maior e um menor. Consequentemente estes locais servem para ligar diferentes
tipos de proteínas com diferentes afinidades e tamanhos. Estas duas superfícies de ligação na molécula de
DNA é usada para ligar diferentes classes de DNA-biding proteins.

Em adição a forma B de DNA, outras 3 foram descritas. Uma delas a forma A DNA encontra-se quando
a molécula de forma B se encontra em ambientes muito baixos em humidade. A forma A é mais compacta
que a forma B, possuindo 11 bases por cada volta. Moléculas pequenas de DNA compostas por bases de
7
purina-pirimidina alternados (especialmente G e C) adoptam uma configuração enrolada a esquerda. A esta
estrutura damos o nome de Z DNA, pois as bases parecem ziguezaguear quando vistas de lado. É
inteiramente possível que ambas as formas A e Z existam nas células.
Finalmente, uma estrutura de três cadeias pode também existir, pelo menos no tubo de ensaio, e
possivelmente durante a recombinação e reparação de DNA.

Como separar duas cadeias de DNA?
• Temperatura;
• Enzimas;

O termo desnaturação no caso de moléculas de DNA não tem o mesmo significado que tem quando se
fala de proteínas. Nas proteínas disto resulta uma quebra de ligações e interacções e a proteína perde as suas
funções.
No caso do DNA isto refere-se apenas à separação das duas cadeias, resultado da quebra de pontes de
hidrogénio por enzimas ou temperatura.
Quando DNA desnaturado é submetido a temperaturas baixas as moléculas renaturam.

Durante a replicação do DNA e durante a transcrição, as cadeias da hélice necessitam de se separar, pelo
menos temporariamente. A libertação da tenção e separação das cadeias de DNA, referidas como
desnaturação (melting), pode ser induzido experimentalmente. Por exemplo, se a solução de DNA for
aquecida a energia térmica aumenta o movimento molecular, eventualmente quebrando as pontes de
hidrogénio e as outras forças estabilizadoras da dupla hélice e as cadeias separam-se. Isto altera a absorção
de luz ultravioleta (na gama dos 260nm), que é normalmente utilizada para medir a concentração de DNA
8
devido a absorvância das luz UV por parte dos nucleótidos (devido ao
seu anel). Molécula de DNA no seu estado nativo (dupla hélice)
absorve cerca de metade da quantidade de luz UV que a mesma
quantidade de DNA de cadeia simples. Assim a medida que o DNA se
desnatura a sua absorvância vai aumentando. Perto do ponto de
desnaturação um ligeiro aumento na temperatura causa uma abrupta,
quase simultânea, perda de múltiplas ligações fracas que seguram a
cadeia, assim a desnaturação rapidamente ocorre em toda a cadeia.
O melting point, Tm, à qual as cadeias de DNA se separam varia
com vários factores. Moléculas que contêm uma grande proporção de
pares G-C requerem altas temperaturas para desnaturar pois as três
pontes de hidrogénio que se estabelecem entre estas duas bases tornam este par mais estável que A-T com
apenas duas pontes de hidrogénio. Assim a percentagem de pares G-C numa amostra de DNA pode ser
estimado através do seu ponto de Tm .

As cadeias simples que resultam da desnaturação formam estruturas aleatórias sem uma estrutura regular.
A diminuição da temperatura causa o rearranjo das duas cadeias numa estrutura perfeita de dupla hélice.
A desnaturação e renaturação do DNA é a base da hibridação dos ácidos nucleicos, uma poderosa
ferramenta para estudar relações de parentesco de duas amostras de DNA ou para detectar e isolar
moléculas de DNA específicas numa mistura contendo um inúmero de sequências.

A260nm =1 [DNA] = 50ug/ml
[ RNA ] ou [DNA cadeia simples]= 40ug/ml

Nota: Como o RNA absorve maior quantidade de luz não é necessário uma concentração tão elevada
para que se dê o mesmoestratégicos no DNA
do cromossoma em ambos os lados de qualquer sequência
rica em A/T (1). A transcrição reversa de RNA LINE por
parte da ORF2 tem como primer a cadeia simples rica em
bases T gerada pelas clivagens da ORF2, a qual hibridiza
com a cadeia de poli(A) (2). A enzima ORF2 então
transcreve reversamente o RNA LINE (3), a transcrição
continua, trocando a cadeia molde para a região em cadeia
simples da cadeia superior do cromossoma, (4 e 5). Agora,
enzimas celulares hidrolizam o RNA e extendem o terminal
3’ do DNA da cadeia superior do cromossoma,
substituindo a cadeia RNA LINE com DNA (6).
Finalmente, as extremidades 3’ e 5’ do DNA são ligadas,
completando a inserção (7). Estes dois últimos passos
provavelmente são catalizados pelas mesmas enzimas
celulares que removem os primers de RNA e ligam os
fragmentos de Okazaki durante a replicação do DNA. O
processo completo resulta na inserção de uma cópia do
retrotransposão LINE inicial num novo local no
cromossoma. Uma curta repeat-direct sequência é gerada
no local de inserção por causada clivagem inicial das duas
cadeias de DNA cromossomais (1).
A vasta maioria de LINEs no genoma humano são
truncados (aleijados, incompletos) na sua extremidade 5’,
sugerindo que a transcrição reversa termina antes de estar
completa e os fragmentos resultantes extendem distancias
variáveis a partir da cauda de poli(A) onde foram inseridos.
Devido a este encurtamento, o tamanho médio de
elementos LINE é apenas 900pb, enquanto que a sequência
inteira é de 6kb. Em adição quase todos os elementos
completos possuem codões stop e mutações nas regiões
ORF1 e ORF2; estas mutações provavelmente foram-se
acumulando com o processo evolutivo. Como resultado da
truncação e das mutações, apenas 0.01% da sequências
LINE no genoma humano estão completas com ORF1 e
ORF2 intactas, ~60-100 do total.

SINEs
Esta é segunda classe mais abundante de elementos
móveis no genoma humano. Variando muito no tamanho,
desde 100 até 400pb, estes retrotransposões não codificam
proteínas, mas contêm uma sequência 3’ rica em A/T
semelhante à cauda dos LINEs. A sua inserção no genoma dá–se de igual maneira que a inserção dos LINEs
mas como estes não codificam proteínas fazem uso das proteínas codificadas pelos LINEs.

FUNÇÕES DO DNA MÓVEL
Apesar de parecer não possuírem mais nenhuma função para além da sua própria sobrevivência, a sua
presença provavelmente teve um impacto profundo na evolução dos organismos. Por exemplo, cerca de
metade das mutações espontâneas que ocorrem em Drosophila resultam da inserção de elementos de DNA
móvel dentro ou perto de uma unidade de transcrição. Em mamíferos, contudo, elementos móveis causaram
uma proporção muito menor de mutações espontâneas (~10% em ratinhos e 0.1 a 0.2 % em humanos).
59
Mesmo assim, elementos móveis têm sido encontrados em alelos mutantes associados a várias doenças
humanas.
Algumas evidências sugerem que
durante o processo evolutivo dos
eucariótas superiores a recombinação
intrões de dois genes separados, gerou
novos genes a partir de combinações de
exões já existentes. A este processo
evolutivo chama-se “shuffling de exões”.
Ambos os transposões de DNA como
os retrotransposões mostraram por vezes
carregar sequências do genoma não
relacionadas com eles através do
mecanismo ilustrado na figura ao lado. Este tipo de mecanismo também contribuiu para o shuffling de exões
durante a evolução. Em adição a causar mudanças em sequências codificantes do genoma, a recombinação
entre elementos móveis e a transposição de DNA adjacente também desempenhou algum papel na evolução.
Estas considerações sugerem que a visão de que os elementos de DNA móveis eram completamente
parasitas moleculares egoístas, falha um pouco. Em vez disso, eles contribuíram profundamente para a
evolução dos organismos superiores promovendo (1) a geração de famílias de genes por duplicação; (2) a
criação de novos genes via Shuffling de exões preexistentes e (3) a formação de regiões reguladoras mais
complexas que providenciam controlo multifacetado da expressão génica.

METABOLISMO DE RNA
A expressão da informação num gene geralmente envolve a produção de uma molécula de RNA
transcrita a partir de uma molécula de DNA molde. As cadeias de DNA e RNA podem parecer muito
semelhantes à primeira vista, diferindo apenas no grupo OH na posição 2’ da pentose e na presença de
Uracilo no RNA em vez de T. contudo, ao contrário do DNA, a maioria dos RNA desempenham as suas
funções em cadeia simples, cadeias que se enrolam sobre si mesmas e têm o potencial para uma diversidade
estrutural muito maior que o DNA. o RNA é assim essencial a uma variedade de funções celulares.
O RNA é a única macromolécula conhecida que tem funções tanto de armazenas e transmitir informação
mas também como catalizador, o que leva à especulação sobre o seu possível papel como intermediário
químico essencial no desenvolvimento de vida neste planeta. A descoberta de RNAs catalíticos, ou
ribossomas, mudou a definição de enzimas, estendendo-a para além do domínio das proteínas. As proteínas
nunca foram essenciais para o RNA e para as suas funções. Nas células modernas, todos os ácidos
nucleicos, incluindo o RNA, são complexos com proteínas. Alguns deste complexos são bastante
elaborados, e o RNA pode assumir ambos os papéis catalítico ou estrutural em maquinarias bioquímicas
bastante complicadas.
Todas as moléculas de RNA, excepto o RNA genómico de alguns vírus, derivam da informação guardada
no DNA. Durante a transcrição um sistema de enzimas converte a informação genética de um segmento de
DNA em cadeia dupla numa cadeia de RNA com uma sequência de bases complementar a uma das cadeias
de DNA. Três grandes tipos de RNA são produzidos RNA mensageiro (mRNA) que codifica a sequência
de aminoácidos de um ou mais polipéptidos especificados por um gene ou série de genes. RNA de
transferência (tRNA) lê a informação codificada no mRNA e transfere o aminoácido apropriado para a
cadeia polipeptídica em crescimento durante a síntese proteica. RNA ribossomal (rRNA) é o constituinte
dos ribossomas, o mecanismo celular intrincado que sintetiza as proteínas. Muitos outros RNAs
especializados possuem funções regulatórias ou catalíticas ou são precursores de algum destes tipos.

60
TRANSCRIÇÃO
Durante a replicação o cromossoma inteiro é copiado, mas a transcrição é um processo mais selecto.
Apenas genes particulares ou grupos de genes são transcritos de cada vez, e algumas porções do genoma
nunca são transcritas. A célula restringe a expressão da informação génica na formação de produtos génicos
necessários naquele momento em particular. Sequências regulatórias específicas marcam o início e o final
do segmento de DNA a ser transcrito e designam qual das cadeias da dupla hélice é usada como molde.
A transcrição assemelha-se à replicação nos seus mecanismos químicos fundamentais, na sua polaridade
(direcção) e no uso de uma cadeia molde. Também como a replicação, a transcrição possui uma fase inicial
(ainda subdividida em pequenas fases de ligação ao DNA e inicio da síntese), de alongamento e de
terminação. A transcrição difere da replicação no facto de não serem necessários primers para esta ter inicio,
e no facto de que geralmente a transcrição envolve apenas uma porção limitada do genoma.

RNA POLIMERASES
A descoberta das DNA polimerases e a sua ligação à cadeia de DNA levou à procura de uma enzima que
sintetizasse cadeias de RNA complementares à cadeia de DNA. Em 1960 quatro grupos de pesquisa
independentes detectaram uma enzima num extracto celular que podia formar um polímero de RNA a partir
de ribonucleósidos 5’-trifosfatados. Trabalhos subsequentes na purificação desta enzima em E. coli ajudou a
definir as propriedades principais da
transcrição. RNA polimerase dependente
de DNA requeria, em adição a uma cadeia
molde de DNA, todos os quatro
ribonucleótidos na forma trifosfatada(ATP, GTP, UTP, CTP) como percursores
das unidades de nucleótidos do RNA. A
química do mecanismo da transcrição
assemelha-se àquele usado pelas DNA
polimerases. RNA polimerase estende a
cadeia de RNA por adição de unidades de
ribonucleótidos ao terminal hidroxilo 3’,
construindo a cadeia de RNA na direcção
5’ 3’. Durante a adição dos
ribonucleótidos há a libertação de
pirofosfato, tal como na replicação. Através da reacção (NMP)n + NTP → (NMP)n+1 + PPi . A RNA
polimerase necessita de DNA para estar activa e encontra-se mais activa quando ligada a DNA em cadeia
dupla. Como dito antes, apenas uma das duas cadeias serve como molde. A cadeia de DNA molde é copiada
no sentido 3’ 5’ (antiparalela com a nova cadeia de RNA), tal como na replicação. Cada nucleótido no
RNA recém-formado é seleccionado pelas interacções de emparelhamento de bases de Watson-Crick.
Ao contrário da DNA polimerase, a RNA polimerase não necessita de um primer para iniciar a
transcrição. A iniciação ocorre quando a RNA polimerase se liga a uma sequência específica chamada
promotores. O grupo trifosfato 5’ do primeiro resíduo numa cadeia de RNA recém formada não é clivado
para libertar pirofosfato, mas em vez disso permanece intacto pelo processo de transcrição. Durante o
alongamento, a extremidade crescente da nova cadeia de RNA emparelha temporariamente com a cadeia
molde formando um pequeno híbrido DNA-RNA de cadeia dupla, estima-se que terá cerca de 8pb de
comprimento. O RNA neste híbrido rapidamente “salta fora”, e a cadeia dupla de DNA volta a formar-se.
De modo a possibilitar RNA polimerase a sintetizar uma cadeia de RNA complementar a uma cadeia de
DNA, a cadeia dupla deve desenrolar-se por uma curta distância, formando-se uma bolha de transcrição.
Durante a transcrição a RNA polimerase de E. coli geralmente mantém cerca de 17pb desenrolados. Os 8pb
híbridos ocorrem nesta região desenrolada. Porque o DNA é uma hélice, os movimentos da bolha de
transcrição requer consideráveis rotações das cadeias dos ácidos nucleicos. A rotação da cadeia de DNA
está restrita na maioria dos RNA por proteínas ligantes e outras barreiras estruturais. Como resultado, uma
RNA polimerase que se move gera ondas de superenrolamento positivo no início da bolha de transcrição e
superenrolamento negativo no final. Isto foi já observado em estudos tanto in vivo como in vitro. Na célula,
61
os problemas topológicos gerados pela transcrição são resolvidos pela acção de topoisomerases (processo já
descrito anteriormente).
As duas cadeias de DNA complementares têm diferentes papéis na transcrição. A cadeia que serve como
molde ao RNA é chamada a cadeia molde. A cadeia de DNA complementar à cadeia molde, a cadeia não
molde, ou cadeia codificante, é idêntica
em sequência de bases à molécula de
RNA a ser transcrita, com a alteração da
presença de U no lugar de T. A cadeia
codificante para um gene em particular
pode estar localizada em ambas as cadeias
do cromossoma, como mostra a figura.
A RNA polimerase bacteriana é um
largo complexo enzimático com um
núcleo de cinco subunidades (α2ββ’ω) e uma sexta subunidade α de
variável peso molecular. A subunidade α liga-se temporariamente
ao núcleo de cinco subunidades e dirige a enzima a locais de
ligação específicos no DNA, é esta que faz a ligação da enzima ao
DNA. Esta sexta subunidade consiste na holoenzima da RNA
polimerase.

Nas RNA polimerases falta um local activo distinto com acção
de revisão (tal como existe em muitas DNA polimerases), e por
isso a taxa de erros para a transcrição é maior que para a replicação
– aproximadamente um erro em cada 104 a 105 ribonucleótidos inseridos. Como muitas cópias de mRNA de
um único gene são produzidas, e todos os RNA são degradados e depois substituídos, um erro numa
molécula de RNA não tem tantas consequências para a célula do que um erro na informação permanente
guardada no DNA.

PROMOTORES
O início da síntese de RNA em locais ao acaso no DNA teria sido um processo extraordinariamente bem
sucedido. Em vez disso, uma RNA polimerase liga-se a sequências específicas no DNA chamados de
promotores, que direcciona a transcrição de segmentos de DNA adjacentes (genes). As sequências às quais
o RNA se liga podem variar e muitos estudos têm sido feitos para a identificação de sequências particulares
críticas para a função do promotor.
Em E. coli, a ligação da RNA polimerase ocorre dentro de uma região de cerca de 70pb antes do local de
início da transcrição até cerca de 30 pb após este mesmo local. Por convenção, aos pares de bases
correspondentes ao início da síntese de uma molécula de RNA é-lhes atribuído um número positivo
enquanto que àqueles que precedem essa posição é-lhes atribuído um número negativo. Assim, a região do
promotor estende-se entre as posições -70 r +30. Análises e comparações das classes de promotores
bacterianos mais comuns revelaram similaridades em duas curtas sequências centradas nas posições -10 e -
35. Apesar das sequências não serem totalmente iguais para todos os promotores bacterianos, certos
nucleótidos possuem uma posição particular formando a sequência consenso. A sequência consenso na
região -10 é (5’)TATAAT(3’) e a sequência consenso na região -35 é (5’)TTGACA(3’). Uma terceira zona,
de reconhecimento, rica em bases AT chama-se elemento UP (upstream promoter), ocorre entre as posições
-40 e -60 no promotor de certos genes altamente expressos. O elemento UP é ligado pela subunidade α da
RNA polimerase. A eficiência pela qual a RNA polimerase se liga ao promotor e inicia a transcrição
depende em larga medida destas sequências, ao espaçamento entre elas e a sua distância do local de
iniciação da transcrição.
A sequência do promotor regula a expressão génica (uma variação apenas numa base pode determinar a
elevada ou baixa expressão de um gene), e por isso ele é considerado o nível base da expressão génica.
62

O mecanismo de iniciação da transcrição está agora muito melhor
definido. Ele consiste em duas partes principais, ligação e iniciação,
cada um deles com múltiplos passos. Primeiro a polimerase liga-se ao
promotor, formando um complexo fechado (no qual o DNA ligado
encontra-se intacto), e um complexo aberto (no qual o DNA ligado
encontra-se intacto e parcialmente desenrolado perto da região -10).
Segundo, a transcrição é iniciada dentro do complexo, levando a uma
mudança conformacional que converte o complexo para a sua forma
de alongamento, seguido de movimentos do complexo de transcrição
para longe do promotor. Qualquer um destes passos pode ser afectado
por arranjos na sequência dos promotores.

TERMINAÇÃO DA TRANSCRIÇÃO EM PROCARIOTAS
A RNA polimerase é uma enzima processiva (isto é com elevada
processividade) – necessária para que, caso uma RNA polimerase
liberte um transcrito prematuro esta não possa reutilizar este
transcrito mas tenha de iniciar nova transcrição. Contudo, o encontro
com certas sequências de DNA resulta numa pausa da síntese de
RNA, e em algumas dessas a transcrição termina. O processo de
terminação da transcrição ainda não é bem percebido em eucariotas, por isso iremo-nos focar em
procariotas.
Os terminadores da transcrição possuem duas características distintas. A primeira é uma região que
produz um transcrito de RNA com sequência complementar a si mesma, permitindo a formação de uma
estrutura secundária, centrada 15 a 20 nucleótidos antes do final da cadeia de RNA. A segunda característica
é um segmento altamente conservado de três resíduos de A na cadeia molde que são transcritos como três
resíduos de U perto do final da estrutura secundária. Quando a polimerase atinge um local de terminação
com esta estrutura, ela pára. A formação de tal estrutura no RNA rompe vários pares de bases A=U no
segmento híbrido DNA-RNA e pode com isto romper interacções importantes entre o RNA e a RNA
polimerase, facilitando a dissociação da transcrição.

63
REGULAÇÃO DA TRANSCRIÇÃOA geração de vários tipos celulares diferentes que formam um organismo multicelular depende da
correcta activação de genes nas células no tempo certo do desenvolvimento.
Na maioria dos casos, uma vez iniciado o desenvolvimento duma célula ela não pode voltar atrás (esta
teoria está a ser fortemente contrariada por estudos recentes – aulas de Desenvolvimento II). Apesar das
diferenças nos propósitos do controlo génico em bactérias e eucariotas, duas características chaves foram
inicialmente descobertas em bactérias, mas sabe-se que também são válidas para eucariotas. Primeiro,
proteínas ligantes de sequências reguladoras do DNA determinam onde a transcrição terá início e tanto
reprimem como activam a transcrição dos genes. Como representado na figura, em organismos
multicelulares eucariotas, a inactivação de genes está relacionada com a condensação da cromatina, a qual
inibe a ligação da RNA polimerase e factores de transcrição basais necessários para a iniciação da
transcrição. Proteínas activadoras ligam-se a elementos de controlo perto dos locais de iniciação da
transcrição do gene assim como a kilobases de distância e promovem a descondensação da cromatina,
possibilitando a ligação da RNA polimerase e dos factores de transcrição ao promotor. Proteínas repressoras
ligam-se a locais de controlo alternativo e promovem a condensação da cro9matina, impedindo a ligação da
RNA polimerase.

TATA BOX
Os primeiros genes a serem sequenciados e estudados em sistemas de transcrição in vitro , foram genes
virais e genes codificantes de proteínas que se encontravam muito activos ora em certos períodos do ciclo
celular ou diferenciação específica de uma célula. Em todos estes genes rapidamente transcritos, uma
sequência chamada TATA box foi descoberta, cerca de 25 a 35 pb a montante do local de início da
transcrição. Estudos mutagénicos mostraram que uma simples alteração de bases na sequência de
nucleótidos fazia descer drasticamente a transcrição in vitro de genes adjacentes à caixa TATA. Na maioria
das vezes alterações de bases na região entre a sequência da caixa TATA e o local de início da transcrição
não afectava em muito com a taxa de transcrição. Se esta região fosse removida, a transcrição do gene
inicia-se cerca de 25 nucleótidos a jusante. Consequentemente, a caixa TATA actua de forma semelhante a
um promotor de E. coli para posicionar a RNA polimerase e para se iniciar a transcrição.

64
RNA POLIMERASE II & FACTORES DE TRANSCRIÇÃO

Os organismos eucariotas possuem uma maquinaria de transcrição nuclear muito mais complexa que os
organismos procariotas. Os eucariotas possuem três tipos de RNA polimerase, designadas de I, II, e III, que
são complexos enzimáticos distintos mas que contêm algumas subunidades em comum. Cada uma delas
possui funções específicas e são recrutadas por sequências específicas de promotores.
RNA polimerase I é responsável pela síntese de pré-mRNA, percursor dos rRNA 18S, 5.8S e 28S. RNA
polimerase III forma os tRNA, rRNA 5S, e algumas pequenas moléculas especializadas de RNA.
A RNA polimerase II é responsável pela síntese de mRNA e alguns RNA especializados. Esta enzima
pode reconhecer centenas de promotores, alguns deles têm algumas características em comum, como a caixa
TATA
A enzima RNA polimerase II é essencial na expressão génica de eucariotas, e por isso tem sido estudada
intensamente. Apesar desta ser bastante mais complexa que a sua sósia bacteriana, a complexidade mascara
uma espantosa conservação na estrutura, função e mecanismo. A enzima Pol II é uma enzima enorme com
12 subunidades. A maior delas, RBP1, exibe um elevado grau de homologia com a subunidade β’ da enzima
bacteriana. Outra subunidade (RBP2) é estruturalmente semelhante à subunidade β da RNA polimerase
bacteriana, outras subunidades (RBP3 RBP11) mostram alguma homologia com as subunidades α da
polimerase bacteriana. Pol II deve funcionar melhor com genomas mais complexos e com moléculas de
DNA mais elaboradas e empacotadas. A necessidade do contacto proteína-proteína com números factores
proteicos é responsável em grande escala para a adição da complexidade da polimerase eucariótica.
A subunidade maior da Pol II possui ainda uma característica invulgar, uma longa cauda no terminal
carboxílico que consiste de muitas repetições de uma sequência de 7 aminoácidos. Este domínio carboxílico
terminal (CTD) encontra-se separado do corpo da enzima por um sequência de ligação não estruturada. O
CTD possui muitos papéis importantes no desempenho das funções da Pol II.
RNA polimerase II requer uma gama de outras proteínas, chamas factores de transcrição, de maneira a
formar um complexo de transcrição activo. Os factores de transcrição basais necessários a todas os
promotores de Pol II (geralmente designados de TFII com um identificador adicional) estão altamente
conservados em eucariotas. Os processos de transcrição pela Pol II podem ser descrito em várias fases –
reunião, iniciação, alongamento, terminação – cada um deles associado a várias proteínas.

Reunião da RNA polimerase e de factores de
transcrição na zona do promotor
A formação de um complexo fechado inicia-se quando
TBP (TATA binding protein) se liga à caixa TATA. TBP é
ligada por um factor de transcrição TFIIB, que também se
liga ao DNA em ambos os lados do TBP. A ligação da
TFIIA, apesar de nem sempre ser essencial, consegue
estabilizar o complexo TFIIB-TBP no DNA e pode ser
importante em promotores não consenso onde a ligação da
TBP é relativamente fraca. O complexo TFIIB-TBP é de
seguida ligado por outro complexo consistindo nas
proteínas TFIIF e Pol II. A proteína TFIIF ajuda a
direccionar a Pol II ao promotor, tanto por interacção com
a TFIIB como por redução da ligação da polimerase a
locais não específicos no DNA. Finalmente, TFIIE e
TFIIH ligam-se para criar um complexo fechado. TFIIH
possui actividade de DNA helicase que promove o
desenrolamento do DNA perto do local de início da síntese
de RNA (este processo requer a hidrólise do ATP –
propriedade de cinase), criando assim um complexo
aberto. A transcrição inicia-se! Contando todas as
subunidades de todos os factores essenciais (excepto
TFIIA), este complexo contém mais de 30 polipéptidos.
Assim que a polimerase transcreve longe do promotor,
outra subunidade de TFIIH fosforila o CTD em múltiplos
locais. Nos ensaios feitos in vitro, apenas a subunidade
TBP se manteve ligada à caixa TATA à medida que a
transcrição decorria, todos os outros factores de transcrição
se dissociaram.

De uma maneira espantosa outras subunidades do
complexo proteico TFIIH são necessárias noutros
processos celulares: a activação das cinases necessárias
para entrar em fase S do ciclo de vida e a reparação de
danos no DNA pela excisão de bases. Deste modo
indivíduos com deficiência nesta proteína muitas vezes
desenvolvem doenças com hipersensibilidade da pele
como a Xeroderma pigmentosum (descrito anteriormente).

PROCESSAMENTO DO RNA
Muitas moléculas de RNA em bactérias e virtualmente todas as moléculas de RNA em eucariótas são
processadas em algum grau após a sua síntese. Alguns dos eventos moleculares mais interessantes no
metabolismo do RNA ocorrem durante o seu processamento pós síntese. Intrigantemente, varias das
enzimas que catalizam estas reacções são moléculas de RNA em vez de proteínas. A descoberta destes RNA
catalíticos, ou ribozimas, trouxe uma revolução no pensamento de qual o papel do RNA e na origem da
vida.
Uma molécula de RNA recém sintetizada chama-se transcrito primário. Talvez o processamento mais
extensivo ocorra no mRNA eucariótico e no tRNA.
O transcrito primário de um mRNA típico contém sequências transcritas do gene, contudo as sequências
codificantes de uma polipéptido podem não estar seguidas. Pedaços não codificantes que “quebram” a
66
região codificante do transcrito são chamados “intrões”, e os segmentos codificantes são chamados“exões”. Num processo chamado splicing, os intrões são removidos do transcrito primário e os exões são
juntos para formar uma sequência contínua que especifica um polipéptido funcional. Os mRNAs
eucarióticos são também modificados nas duas extremidades. Um resíduo modificado chamado cápsula 5’
(5’ cap) é adicionado na extremidade 5’. O terminal 3’ é clivado, e de 80 a 250 resíduos de A são
adicionados, criando assim a cauda de poli(A). Os, por vezes, elaborados complexos proteicos que levam a
cabo estas modificações não operam independentemente. Eles parecem estar organizados uns com os outros
e associados ao terminal fosforilado CTD da Pol II; cada complexo afecta a função do outro. Outras
proteínas envolvidas no transporte de mRNA para o citoplasma estão também associadas com o mRNA no
núcleo, e o processamento do transcrito é
acompanhado pelo seu transporte. De facto, um
mRNA eucariótico, assim que é sintetizado é
posicionado confortavelmente num complexo
envolvendo dúzias de enzimas. A composição do
complexo varia à medida que o RNA é processado,
transportado para o citoplasma e encaminhada para o
ribossoma.
O transcrito primário de tRNAs também é
processado pela remoção (clivagem) de sequências
em cada extremidade, e em alguns casos pela
remoção dos intrões. Muitas bases e açúcares no
tRNA são também modificadas; tRNA maduro está
repleto com bases invulgares e não encontradas e
outro ácido nucleico.
O destino final de qualquer RNA é a sua completa
e regulada degradação. Isto é essencial para parar a
expressão de genes que já não são necessário serem expressos.

MODIFICAÇÃO DO TERMINAL 5’ DA MOLÉCULA DE MRNA
A maioria dos mRNA eucarióticos possui um 5’cap, um resíduo de 7-metilguanosina ligado ao resíduo
5’ terminal do mRNA, através de uma invulgar ligação 5’,5’-trifosfato. O cap 5’ ajuda a proteger o RNA do
ataque de ribonucleases. O cap também liga a complexos de proteínas cap binding específicos e participa na
ligação do mRNA ao ribossoma de modo a iniciar a tradução. Esta modificação dá-se ainda muito cedo
durante a transcrição, logo após os primeiro 20 ou 30 nucleótidos.

67
PRÉ-RNA ENCONTRA-SE ASSOCIADO A hnRNP
O chamado pré-mRNA nunca existe livre no núcleo, na verdade, desde que é iniciada a sua síntese até
ser transportado para o citoplasma, já maduro, ele encontra-se sempre associado a um vasto leque
enzimático. Estas são o principal componente proteico do chamado heterogeneous ribonucleoprotein
particles (hnRNP), o que contém heterogeneous nuclear RNA (hnRNA), um termo colectivo que se refere a
pré-mRNA e outras moléculas de RNA.

CLIVAGEM E POLI-ADENILAÇÃO DO mRNA
Na extremidade 3’ da maioria dos mRNA eucarióticos possui
uma cauda com 80 a 250 nucleótidos de A, constituindo a cauda
de poli(A). Esta cauda serve como um local de ligação para uma
ou mais proteínas especializadas. A cauda de poli(A) e as suas
proteínas associadas provavelmente ajudam a proteger o mRNA da
destruição enzimática. Muitos mRNA procarióticos também
adquirem uma cauda de poli(A), mas esta ajuda a no declínio do
mRNA em vez de o proteger.
A cauda de poli(A) é adicionada num processo com múltiplos
passos. O transcrito é estendido para além do local onde a cauda de
poli(A) vai ser adicionada, depois é clivada até ao ponto de
inserção da cauda, pelo componente de endonuclease de um largo
complexo enzimático, mais uma vez associado com CTD da RNA
polimerase II. O local do mRNA onde ocorreu a clivagem é
marcado por duas sequências: a altamente conservada
(5’)AAUAAA(3’), 10 a 30 nucleótidos a montante (lado 5’) do
local de clivagem, e uma sequência um pouco menos bem definida
rica em G e U, cerca de 20 a 40 nucleótidos a jusante (lado 3’) do
local de clivagem. A clivagem gera um grupo hidroxilo3’ livre que define o final da molécula de mRNA, ao
qual os resíduos de A são prontamente adicionados pela poliadenilase polimerase, esta enzima não
necessita de uma cadeia molde mas necessita do mRNA clivado para ser usado como primer.

SPLICING SITES
Durante os passos finais da formação de uma molécula de mRNA madura e funcional, os intrões são
removidos e os exões são juntos. Para curtas unidades de
transcrição, o splicing do DNA usualmente baseia-se na
clivagem e poliadenilação do terminal 3’ do transcrito
primário. Mas para longas unidades de transcrição, contendo
muito exões, o splicing de exões no RNA nascente
normalmente começa ainda antes da transcrição estar
completa.
O local da junção intrão/exão é chamado de local de
splicing, estes podem ser determinados por comparação da
sequência de DNA genómico e do cDNA preparado a partir do
mRNA. As sequências que estão presentes no DNA genómico
mas ausentes no cDNA representam os intrões e indicam a posição dos locais de splicing. Tal análise de um
largo número de mRNA diferentes revelou uma sequência
moderadamente conservada, em organismos superiores uma
região rica em pirimidinas logo a jusante da região 3’ do local
de splicing, também ele conservado. Os nucleótidos mais
conservados são (5’)GU e (3’)AG. Encontrados no final de
vários intrões. Análises em delecções da porção central de
intrões em vários pré-mRNA mostraram que geralmente apenas 30 a 40 nucleótidos em cada final são
necessários para se dar o splicing a taxas normais.
68
Análises dos intermediários formados durante o splicing de pré-mRNA in vitro levaram à conclusão de
que os intrões são removidos como um laço no qual a guanina 5’ do intrão é unido invulgarmente por uma
ligação 2’,5’fosfodiester a uma adenosina perto do terminal 3’ do intrão. Este resíduo de A chama-se
“branch point” porque ele forma um ramo (branch) de RNA no final da estrutura em laço.

SPLICIOSSOMAS & snRNPs
Mesmo antes do splicing ser observado in vitro, muitas observações tinham sugerido que pequenas
RNAs nucleares (snRNAs) intervinham na reacção de splicing. Primeiro, descobriu-se uma pequena
sequência consenso no final 5’ dos intrões complementar a uma sequência perto do final 5’ de uma snRNA,
chamada U1. Cinco snRNA ricas em U (U1, U2, U4, U5, U6) variando entre 107 a 2010 nucleótidos,
participam no splicing de RNA.
No núcleo de células eucarióticas, snRNA encontram-se associadas com seis a dez proteínas em snRNPs
(small nuclear ribonucleoprotein particles). Algumas destas proteínas são comuns a todos os snRNPs, e
algumas são específicas de snRNPs individuais.
O envolvimento da U2 no início do splicing foi inicialmente suspeito quando se descobriu possuir uma
sequência interna que era largamente complementar à sequência consenso que rodeava o branch point nos
pré-mRNAs. Experiências com mutantes, mostraram que o emparelhamento de bases entre a U2 e o branch-
point nos pré-RNAs era critica para o splicing. Estes estudos com U1 e U2 indicaram que durante o splicing
elas emparelham com o pré-mRNA.

Estudos semelhantes com outras snRNA demonstraram que interacções RNA-RNA envolvendo estas
moléculas ocorre ainda durante o splicing. Por exemplo, uma região interna da U6 inicialmente emparelha
com o terminal 5’ da snRNA U4. Rearranjos tardios no splicing resultam num emparelhamento da snRNA
U6 com o terminal 5’ da U2, a qual permanece ligada ao branch-point. Mais tarde, o emparelhamento de U5
com quatro nucleótidos de exões adjacentes ao local de splice desliga a U1 do pré-mRNA.
Baseando-se nos resultados destas experiências, a identificação dos intermediários da reacção, e outras
análises bioquímicas, pensa-se que os cinco snRNPs se ligam sequêncialmente ao pré-mRNA formando um
largo complexo de ribonucleoproteínas chamado spliciossoma, que possui aproximadamente o tamanho de
um ribossoma. De acordo com o modelo actual o spliciossoma inicia-se com a ligação das snRNAs U1 e U2
ao pré-mRNA. O emparelhamento extensivo entre as snRNAs U4 e U6 forma um complexo que liga U5.
este complexo (U4/U6/U5) então associa-se ao complexo formado anteriormente (pré-mRNA/U2/U1)
formando o spliciossoma.Após a formação do spliciossoma, rearranjos extensivos ocorrem no emparelhamento das snRNAs e do
pré-mRNA. O rearranjo do spliciossoma então cataliza duas reacções de transesterificação que resultam no
splicing do RNA. Após a segunda reacção de transesterificação, os exões ligados são libertados do
spliciossoma enquanto que o intrão em forma de laço continua associado a este. Este complexo final de
intrão com snRNPs é instável e dissocia-se. As snRNPs libertadas participam em novos ciclos de splicing.
Os intrões excisados são rapidamente degradados.

Pr
e-
m
R
N
A
c
on
ta
in
s
ho
rt,
c
on
se
rv
ed
s
eq
ue
nc
es
r
eq
ui
re
d
fo
r
sp
lic
in
g.
T
he
m
os
t c
on
se
rv
ed
in
tro
n
se
qu
en
ce
a
re
th
e
(5
’)
G
U
, (
3’
)A
G
, a
nd
th
e
br
ac
h-
po
in
t A
. C
en
tra
l t
o
th
e
sp
lic
in
g
re
ac
tio
ns
a
re
th
e
fiv
e
sm
al
l n
uc
le
ar
R
N
A
s
(s
nR
N
A
s)
, c
om
pl
ex
ed
w
ith
p
ro
te
in
s
in
s
m
al
l r
ib
on
uc
le
op
ro
te
in
pa
rti
cl
es
(s
nR
N
P)
. A
dd
iti
on
al
p
ro
te
in
s a
nd
A
TP
a
re
a
ls
o
re
qu
ire
d
fo
r s
pl
ic
in
g,
b
ut
a
re
n
ot
sh
ow
n
he
re
.
1-
T
he
s
nR
N
A
s
ba
se
p
ai
rs
w
ith
p
re
-m
R
N
A
s
eq
ue
nc
es
a
nd
w
ith
e
ac
h
ot
he
r t
o
di
re
ct
th
e
sp
lic
in
g
cy
cl
e.
2
F
irs
t,
th
e
5’
e
nd
o
f U
1
sn
R
N
A
b
as
e
pa
ir
w
ith
th
e
5’
sp
lic
e
si
te
, a
nd
U
2
sn
R
N
A
s
eq
ue
nc
e
ba
se
p
ai
r w
ith
th
e
br
an
ch
p
oi
nt
re
gi
on
. 3
E
xt
en
si
ve
b
as
e
pa
iri
ng
b
et
w
ee
n
sn
R
N
A
in
th
e
U
4
an
d
U
6
sn
R
N
Ps
f
or
m
s
a
co
m
pl
ex
t
ha
t
as
so
ci
at
es
w
ith
U
5
sn
R
N
P.
4
Th
e
U
4/
U
6/
U
5
co
m
pl
ex
t
he
n
as
so
ci
at
es
w
ith
t
he
p
re
-m
R
N
A
.
5R
ea
rr
an
ge
m
en
t o
f R
N
A
/R
N
A
b
as
e
pa
iri
ng
o
cc
ur
s,
so
th
at
U
6
di
ss
oc
ia
te
s
fr
om
U
4,
a
nd
b
as
e
pa
irs
w
ith
U
2.
U
1
di
ss
oc
ia
te
s
fr
om
th
e
5’
s
pl
ic
e
si
te
, a
nd
U
5
ba
se
p
ai
rs
w
ith
e
xo
n
se
qu
en
ce
s.
5
6
7
8
Th
e
re
ar
ra
ng
em
en
t s
pl
ic
eo
so
m
e
ca
ta
ly
ze
s
tw
o
tra
ns
es
te
rif
ic
at
io
n
re
ac
tio
ns
, r
es
ul
tin
g
in
in
tro
n
re
m
ov
al
a
nd
e
xo
n
lig
at
io
n.
9
Th
e
lig
at
e
ex
on
s
ar
e
re
le
as
ed
fr
om
s
pl
ic
eo
so
m
e.
T
he
s
nR
N
Ps
d
is
so
ci
at
es
fr
om
th
e
ex
ci
se
d
la
ria
t i
nt
ro
ns
a
nd
ar
e
re
cy
cl
ed
fo
r a
no
th
er
ro
un
d
of
sp
lic
in
g.
1
0T
he
la
ria
t i
s r
ap
id
ly
d
eg
ra
de
d.

70
SPLICING ALTERNATIVO
A transcrição de intrões parece consumir muitas reservas e energia celular sem retribuir nenhum
benefício ao organismo, mas os intrões podem conferir uma vantagem ainda não muito apreciada pelos
cientistas. Os intrões podem ser vestígios de parasitas moleculares não muito diferentes dos transposões.
Apesar dos benefícios dos intrões ainda não se encontrar muito bem definido, as células evoluíram de modo
a tirar vantagem da via de splicing de modo a alterar a sua expressão génica.
A maioria dos transcritos de
mRNA em eucariotas produz
apenas um mRNA maduro e um
polipéptido correspondente, mas
alguns conseguem ser
processados em mais de uma
maneira diferente e originar
diversos mRNA maduros e
consequentemente diferentes
polipéptidos. O transcrito
primário contém sinais
moleculares para todas as vias de
processamento alternativo, e a via
favorecida numa dada célula é
determinada por factores de
processamento, proteínas ligantes
de RNA que promovem uma
determinada via.
Transcritos complexos, podem
ter mais de um local de clivagem e poliadenilação ou padrões de splicing alternativo, ou ambos. Se existe
dois ou mais locais de clivagem e poliadenilação, o uso do local mais perto da extremidade 5’ (mais interno)
irá remover maior porção de RNA que o uso do local mais perto da extremidade 3’. Este mecanismo,
chamado de escolha de local de poli(A), gera diversidade em domínios variáveis da cadeia pesada da
imunoglobina. Padrões de splicing alternativo produzem, a partir de um transcrito primário comum, três
formas diferentes da cadeia pesada da miosina nos diferentes estágios de desenvolvimento da mosca da
fruta. Ambos os mecanismos são accionados quando um simples transcrito de RNA é processado de forma
diferente de forma a produzir duas hormonas diferentes: a hormona reguladora de cálcio – calcitonina na
tiróide de rato e o péptido relacionado com o gene da calcitonina (CGRP) no cérebro de rato.

71
EDIÇÃO DO RNA

A edição do RNA é um processo que ocorre no interior do núcleo, ainda antes da saída do mRNA para o
citoplasma. É promovido pela RNA desaminase que retira um grupo amina aos ribonucleótidos, por
exemplo, um nucleótido de adenina pode ser desaminado, e nesse caso origina um nucleótido de iosina.
Estas modificações podem ter grandes consequências.
Por exemplo os receptores de glutamato localizados na
superfície das células (sistema nervoso) ligam glutamato
(aminoácido e ao mesmo tempo um neurotransmissor) e a
membrana torna-se permeável a Ca2+ e Na+. Esta
permeabilidade selectiva é essencial para a transmissão do
impulso nervoso de um neurónio para o outro. Contudo,
conforme a edição do mRNA no núcleo a membrana pode
tornar-se impermeável a Ca2+. Isto porque uma simples
alteração num nucleótido de A que codifica para o codão
glutamina (não carregada) foi desaminado transformando-
se num nucleótido de iosina que codifica para o codão
arginina (carregado positivamente). Esta troca de cargas
provoca uma alteração profunda na função destes
receptores.

Uma outra forma distinta da edição do RNA
ocorre no gene para a apolipoproteína B. uma
forma da apolipoproteína B, apo-B-100, é
sintetizada no fígado; uma segunda forma, apoB-
48, é sintetizada no intestino. Ambas são
codificadas por um mRNA produzido a partir do
gene apo-B-100. uma citosina desaminase
encontrada apenas nos intestinos liga-se ao
mRNA no codão para os resíduos de
aminoácidos 2, 153 (CAA=Gln) e converte o C
em U, de modo a introduzir o codão UAA ou
codão stop. A apo-B-48 produzida nos intestinos
a partir deste RNA modificado é simplesmente a
forma abreviada da aopB-100. Esta reacção
permite síntese de duas proteínas específicas em
tecidos diferente a partir do mesmo gene.

CAP BINDING PROTEINS
Após a molécula de RNA nascente produzida pela RNA polimerase II atingir cerca
de 25-30 nucleótidos, a 7-metilguanosina e outros componentes do cap 5’ são
adicionados à extremidade de RNA 5’ a ser produzida. Este passo inicial é catalizado por
uma enzima dimérica que se associa com o terminal CTD fosforilado da RNA
polimerase II. A enzima não se associa com RNA polimerase I ou III porque estas não
possuem o terminal CTD, logo este cap é específico para RNA produzidos pela RNA
polimerase II (lembrar que é aquela responsável pela síntese de mRNA).

72
TRANSPORTE NUCLEAR
Uma vez que o processamento de RNA esteja completo no núcleo, o RNA permanece ligado a hnRNPs
específicas num complexo de proteínas ribonucleares mensageiras (mRNP). Antes que o RNA possa ser
traduzido na sua proteína codificante, ele necessita ser transportado do núcleo para o citoplasma. O núcleo
separa-se do citoplasma por duas membranas a que damos o nome de invólucro nuclear que tal como a
membrana celular que reveste a célula, também este consiste numa camada dupla fosfolipídica e várias
proteínas associadas. O transporte de macromoléculas incluindo mRNPs, tRNAs, e subunidades ribossomais
para fora do núcleo, assim como o transporte de todas as proteínas nucleares do citoplasma para o núcleo
passa pelo poro nuclear.
Numerosos poros perfuram o invólucro nuclear. Cada poro nuclear é formado por uma estrutura
elaboradadesignada de complexo poro nuclear (NPC). Um NPC é composto por imensas cópias de
proteínas diferentes, de 50 a 100, chamadas nucleoporinas. Micrografias electrónicas revelam estruturas em
filamentosas que se extendem a partir do nucleoplasma, o terminal distal destas estruturas é unido por um
anel terminal formando uma estrutura chamada cesto nuclear. Componentes pequenos como iões água ou
moléculas até 60kDa passam livremente por difusão através dos poros nucleares. Contudo proteínas
maiores, e complexos ribonucleoproteícos não conseguem difundir livremente para dentro e fora do núcleo.
Em vez disso, estas moléculas são transportadas selectivamente para dentro e fora do núcleo com a ajuda de
transportadores proteicos solúveis que ligam as proteínas e ao mesmo tempo interactuam com algumas
nucleoporinas.

ENDEREÇAMENTO PROTEICO
A comunicação celular entre o núcleo e o citosol requer o movimento de macromoléculas através dos
poros nucleares. Moléculas de RNA sintetizadas no núcleo são transportadas para o citoplasma e proteínas
sintetizadas no citoplasma são importadas para o núcleo, entre outros exemplos. Este tráfego é regulado por
um sistema complexo de sinais moleculares e proteínas transportadoras que têm vindo a ser cada vez mais
esclarecido.
Na maioria dos organismos eucarióticos o invólucro nuclear desmancha-se a cada divisão celular,
dispersando o seu conteúdo, e as proteínas nucleares têm de ser constantemente importadas para o núcleo.
De forma a permitir esta importação constante as sequências de sinal que enderecem a proteína – a
sequência de localização nuclear, NLS – não são clivadas após entrada da proteína no seu destino. As NLS,
assim como qualquer outra sequência, pode-se localizar em qualquer zona da sequência primária da
proteína. NLSs podem variar consideravelmente, mas muitas consistem numa sequência de 4 a 8
aminoácidos, dos quais muitos são básicos (Arg ou Lys).
A importação nuclear é mediada por um número de proteínas que circulam entre o citosol e o
nucleoplasma, incluindo importinas (α e β) e proteínas Ran (GTPases). Um heterodímero de importina α e β
funciona como um receptor solúvel para proteínas endereçadas para o núcleo, com a subunidade alfa a ligar-
se à zona NLS das proteínas no citosol. O complexo da sequência NLS da proteína com o importina liga-se
ao poro nuclear e é translocado através do poro por um mecanismo dependente de energia que requer a
enzima Ran GTPase. As duas subunidades (α e β) dissociam-se durante a translocação e são, depois disso,
exportadas para o citoplasma.
73
As NLS foram inicialmente descobertas durante a
análise de vírus SV40 (uma mutação do vírus 40 de
símios) que produzia uma forma anormal de uma proteína
chamada antigénio-t. O tipo selvagem desta proteína
encontrava-se exclusivamente no núcleo, enquanto que a
forma mutada se distribuía por todo o citosol. As mutações
responsáveis por esta alteração da localização celular
ocorriam todas em cinco aminoácidos básicos na
sequência Pró – Lys – Lys – Lys – Arg – Lys – Val.
Espantosamente, quando esta região da proteína era
fundida com piruvato cinase, uma proteína citosólica de
grandes dimensões envolvida no metabolismo dos hidratos
de carbono, a proteína fundida era transportada para o
núcleo. A sequência de aminoácidos que dirigia a piruvato cinase para o núcleo era a sequência de sete
aminoácidos descrita acima. Esta experiência demonstrou que era esta sequência do antigénio-t de SV40
que actuava como um sinal para a importação para o núcleo.

MECANISMO DE IMPORTAÇÃO NUCLEAR
Usando este tipo de ensaio, foram purificadas quatro proteínas: Ran, nuclear transport factor 2 (NTF2),
importina α, e importina β. Ran é uma proteína G monométrica que existe em duas conformações, uma
quando em complexo com GTP, e outra quando em complexo com GDP. As duas importinas formam um
receptor de importação nuclear heterodimérico: a subunidade α liga-se à zona NLS na proteína “carga” a ser
transportada, e a subunidade β interage com uma classe de proteínas chamadas Nucleoporinas-FG. Estas
nucleoporinas, que delimitam o canal do poro nuclear são também encontradas no cesto nuclear e em
filamentos citoplasmáticos, contêm múltiplas repetições de pequenas sequências hidrofóbicas ricas em
fenilalanina (F) e glicina (G) (FG-repeats).
O modelo actual para a importação de carga do citoplasma para o núcleo mediado por importinas
monoméricas é mostrado na figura. Importinas livres no
citoplasma ligam-se à zona NLS da proteína a ser
transportada, formando um complexo de carga
bimolecular. O complexo é transportado para o
nucleoplasma à medida que a importina liga
transitoriamente as sucessivas repetições FG individuais
nas Nucleoporinas-FG que delimitam o canal. Pensa-se
que as repetições FG actuam como “stepping stones” à
medida que o complexo de carga difunde de uma FG-
nucleoporina para outra, no seu caminho pelo canal, este
processo não requer o gasto directo de energia.
Quando o complexo de carga atinge o nucleoplasma, a
importina interage com Ran·GTP, causando uma troca
conformacional na importina diminuindo a sua afinidade
para com a zona NLS, libertando a proteína carga no
nucleoplasma. O complexo importina-Ran·GTP difunde
então de volta para o citoplasma através do NPC, por
interacções transitórias da importina com as repetições FG. Uma vez o complexo importina-Ran·GTP atinja
o citoplasma, a Ran interage com GTPase-accelerating protein (Ran-GAP), que é um componente
específico dos filamentos citoplasmáticos do NPC. Isto estimula à Ran a hidrolizar o GTP que tem ligado
em GDP, provocando uma troca conformacional para uma forma com baixa afinidade para a importina, e
isto liberta a importina no citoplasma e torna-a disponível para iniciar novo ciclo de importação.
A Ran agora volta para o núcleo pela NTF2. o dímero de NTF2 liga especificamente à Ran·GDP e
também interage com as repetições FG das Nucleoporinas-FG. Quando este complexo atinge o
nucleoplasma ele encontra uma guanine nucleotide–exchange factor (Ran-GEF) específica e causa a
74
libertação de Ran do seu GDP e re-liga GTP que se encontra em muito maior concentração deste lado do
invólucro. Esta alteração conformacional torna o Ran com baixa afinidade para NTF2, desligando-se desta.
Agora encontra-se Ran·GTP livre no nucleoplasma e NTF2 volta por difusão para o citoplasma.
Ainda que este transporte seja unidireccional. A direcção do transporte é uma consequência da rápida
dissociação do complexo de importação quando este atinge o nucleoplasma. Como consequência existe um
gradiente de concentração do complexo importina-carga através do poro nuclear: alta no citoplasma, onde se
lá a associação, e baixa no citoplasma onde ocorre a dissociação. Este gradiente de concentração é
responsável pela importação unidireccional. Um gradiente semelhante é responsável por retomar as
importinas do núcleo para ao citoplasma. A concentração do complexo importina-Ran·GTP é maior no
nucleoplasma, onde se dá a associação que no citosol, onde ocorre a dissociação.
Numa última fase, o responsável pela unidirecionalidade da importação nuclear é a distribuição
assimétrica de Ran-GEF e de Ran-GAP. Ran-GEF no nucleoplasma mantém Ran no estado de Ran·GTP
onde ele promove a dissociação do complexo de carga. Ran-GAP no lado citosólico converte Ran·GTP em
Ran·GDP causando a dissociação do complexo importina-Ran·GTP e a libertação de importina livre no
citoplasma.

MECANISMO DE EXPORTAÇÃO NUCLEAR
Um mecanismo muito semelhante é usado para exportar proteínas, tRNAs, e subunidades ribossomais do
núcleo para o citoplasma. Este mecanismo inicialmente foi elucidado pelo estudo de certas proteínas nhRNP
que saltavam entre o núcleo e o citoplasma. Estudos feitos mostraram que algumas nhRNPs circulavam
entre o núcleo e o citoplasma enquanto que outras permaneciam sempre no núcleo. Tais proteínas saltitantes
possuíam um sinal de exportação nuclear (NES), queestimulava a sua exportação do núcleo para o
citoplasma através dos poros nucleares, em adição a um NLS que resultava numa reentrada no núcleo.
De acordo com o modelo actual de exportação nuclear
(baseado no exporte de proteínas com sequências ricas em
leucina), mostrado na figura, um receptor de exportação
nuclear específico no núcleo, exportina1, forma um
complexo inicial com Ran·GTP e depois liga-se à
sequência NES na proteína carga. A ligação da exportina1
ao Ran·GTP leva a uma mudança conformacional da
exportina1, que aumenta a afinidade para a sequência
NES, e por isso forma-se um complexo de exportação
trimolécular. Que tal como as importinas, também a
exportina1 interage transitoriamente com as repetições FG
das nucleoporinas-FG e difundem através do NPC. O
complexo de carga dissocia-se quando encontra Ran-GAP
nos filamentos citosólicos do NPC, que estimulam o Ran a
hidrolizar GTP, mudando-o para uma conformação com
baixa afinidade para a exportina1. A exportina1 livre,
altera a conformação para a de uma estrutura com pouca afinidade para NES, libertando a carga no citosol.
A direcção do processo de exportação é guiado pela dissociação da carga da exportina1 que causa um
gradiente de concentração do complexo de carga pelo NPC, de modo que existe uma elevada concentração
de complexo de carga no nucleoplasma, onde se dá a associação, e uma baixa concentração no citoplasma,
onde ocorre a dissociação. Exportina1 e são agora transportados pela NTF2, tal como discutido antes. O
Ran·GDP é então convertido em Ran pela Ran-GEF no nucleoplasma.
Por comparação dos dois modelos conseguimos observar uma diferencia óbvia: Ran·GTP é parte do
complexo de carga durante a exportação mas não durante a importação. Aparte desta diferença, os dois
transportes processam-se com uma elevada semelhança. Em ambos a associação do sinal de transporte com
Ran·GTP no nucleoplasma causa uma alteração conformacional que afecta a afinidade com o sinal de
transporte. Durante a importação, a interacção causa a libertação da carga, enquanto que, durante a
exportação a interacção promove a associação com a carga. Em ambos, a estimulação de Ran·GTP para a
75
hidrólize no citoplasma por parte da Ran-GAP associada com filamentos citoplasmáticos do NPC produz
uma alteração conformacional na Ran que liberta o receptor de sinal de transporte.
Importinas e exportinas são ambas difundíveis através do NPC devido a ligações transitórias com as
repetições FG nas nucleoporinas-FG. A localização das Ran-GAP e –GEF no citoplasma e no núcleo,
respectivamente, é a base para o transporte unidireccional de proteínas através do NPC. A par das
semelhanças nas funções das importinas e exportinas, os dois transportadores são altamente homólogos em
sequência e estrutura.

FORMAÇÃO DO “MESSENGER RIBONUCLEAR PROTEIN COMPLEX” (mRNP)
Estudos recentes em leveduras sensíveis à temperatura mutantes no transporte nuclear, identificaram um
exportador mRNA heterodimérico que parece direccionar a maioria dos mRNPs através dos poros
nucleares. Leveduras com mutações nas subunidades destas proteínas acumulam RNA poliadenilado no
núcleo a uma temperatura não premissiva, indicando que a proteína é requerida para o transporte da maioria
das mRNPs. Exportadores de mRNA homólogos aos das leveduras são encontrados em todos os organismos
eucarióticos, e várias linhas de evidências mostram que exportadores de mRNA são necessários para
exportar da maioria dos mRNPs. A pequena subunidade do exportador é homóloga à NTF2 e interage com
uma região na subunidade maior eu também partilha homologia com NTF2.
O grande exportador de mRNA também contém domínios de ligação de RNA que parecem ligar ao RNA
cooperativamente com proteínas de mRNP específicas. A descoberta de que os exportadores de mRNA se
encontravam associados mRNPs, e ligavam directamente às repetições FG levaram à proposta de um
modelo, ilustrado na figura. Este modelo propõe que o exportador de mRNA transloca mRNPs através do
canal do poro nuclear de maneira semelhante às importinas e exportinas, isto é por ligação transitória
sucessiva e individual a repetições FG. Actualmente, não é claro do que direcciona este mecanismo do
transporte de mRNP através dos poros.
Por analogia com as importinas e exportinas pensa-se que o complexo transportador de mRNA dissocia-
se assim que atinge o citoplasma. Isto resultaria numa alta concentração de complexos exportadores de
mRNA no nucleoplasma e no poro nuclear, onde ele se associa com as nucleoporinas-FG, e uma baixa
concentração do complexo no citoplasma onde ele se dissocia. Tal como para as importinas e exportinas, tal
gradiente de concentração poderia direccionar a translocação vectorial do mRNAP. Contudo muito há ainda
a aprender sobre as proteínas hnRNP associadas com mRNPs durante o transporte através do poro, assim
como o mecanismo pelo qual elas se dissociam do mRNP no lado citoplasmático do poro nuclear.
As glândulas salivares da larva de insecto de Chironomous tentans providenciaram um bom modelo de
estudo de ME da formação de hnRNPs e a exportação de mRNPs. Nesta larva, alguns genes são altamente
transcritos em pré-mRNAs nascentes que se associam com proteínas hnRNPs e
são processados em mRNPs enrolados com uma molécula de mRNA de ~75kb.
Estes mRNAs gigantes codificam grandes proteínas colantes que aderem a larva
em desenvolvimento à folha. Após o processamento do pré-mRNA, as mRNPs
resultantes movem-se através do poro nuclear para o citoplasma. Micrografias
electrónicas de secções destas células mostram mRNPs que parecem desenrolar
durante a sua passagem através do poro e depois ligarem-se ao ribossomas a
medida que entram no citoplasma. A observação de que mRNPs se associam aos
ribossomas durante o transporte indica que a extremidade 5’ lidera o caminho
pelo NPC. Além disto também os factores de “splicing” promovem exportação do mRNA, isto porque como
visto anteriormente, o spliciossoma impede a exportação do mRNA com splicing incompleto.
Estudos detalhados de micrografias electrónicas deste transporte levaram à formulação do modelo
ilustrado na figura.

76
DEGRADAÇÃO DO mRNA
A concentração de mRNA numa célula é uma função da taxa de síntese em ordem à taxa de degradação.
A estabilidade de um mRNA também determina a rapidez com que a síntese da proteína codificada pode ser
cancelada. Para uma molécula estável de mRNA, a síntese da proteína codificada persiste muito tempo após
a transcrição do gene ter sido reprimida. A maioria dos mRNA bacterianos é instável, decaindo
exponencialmente com um meio-tempo de vida de apenas alguns
minutos. Por esta razão, uma célula bacteriana rapidamente ajusta
a síntese de proteínas de forma a acomodar alterações no
ambiente celular. Por outro lado, a maioria das células em
organismos multicelulares existem num ambiente celular
equitativo, e carregam uma série específica de funções através de
períodos de dias ou meses, ou mesmo o tempo de vida de um
indivíduo (células nervosas, p.e.). assim, a maioria dos mRNA dos eucarióticos superiores possui um tempo
de meia vida de varias horas. Contudo, algumas proteínas nas células eucariótica são necessárias apenas por
curtos períodos de tempo e necessitam ser expressas repentinamente (Burst – estouro, rompimento,
explosão…). A expressão de tais proteínas pode ocorrer em pequenos flashes porque a regulação da
transcrição dos genes que as codificam pode ser rapidamente activada ou desactivada, além disso também o
seu mRNA possui geralmente tempos médios de vida muito curtos – cerca de 30 min ou menos.
mRNA citoplasmático é degradado por uma
das vias ilustradas na figura. Para a maioria dos
mRNAs, o tamanho da cauda de poli(A) decresce
gradualmente com o tempo por acção da nuclease
deadenilizante. Quando ela se encontra pequena o
suficiente, as moléculas de PABPI já não se
conseguem ligar e estabilizar a interacção do cap
5’ e os factores de iniciação. O cap entãoexposto
é removido pela enzima decapping e o mRNA
desprotegido é degradado no sentido 5’ 3’ por
exonucleases. A remoção da cauda de poli(A)
também torna os mRNAs susceptíveis à
degradação por exossomas citoplasmáticos
contendo exonucleases 3’ 5’.

Para os mRNAs degradados neste processo dependente da deadenização, a taxa à qual eles são
deadenilizados controla a taxa à qual eles são degradados. A razão de deadenilação varia inversamente com
a frequência de iniciação da tradução: quanto mais alta a frequência de iniciação, mais baixa a taxa de
Célula Meia-vida do RNA
(tempo médio)
E. coli 2-5 min
S. cerevisiae 22 min
Células em cultura 10h
(de rato ou humanas)
77
deadenilização. Esta relação provavelmente deve-se às interacções recíprocas entre os factores de iniciação
e PABPI que estabilizam a ligação de PABPI à cauda de poli(A), com isto, protegendo-a da acção de
exonucleases.
Muitos mRNA de vida curta em mamíferos contêm
múltiplas cópias da sequência AUUUA na região 3’ não
traduzida. Descobriram-se proteínas que interagem com
estas sequências, e experiências recentes sugerem que a
ligação destas proteínas interagem com a enzima que deadenila o mRNA e com o exosoma promovendo,
com isto, a rápida deadenilação do mRNA e subsequente degradação do mRNA no sentido 3’ 5’.
Nestes mecanismos, a velocidade de degradação não está associada a velocidade de tradução. Assim o
mRNA contendo estas sequências AUUUA pode ser rapidamente traduzido e também rapidamente
degradado, permitindo a codificação de proteínas a serem expressas em curtos espaços de tempo (burts).
Como demonstrado na figura da página anterior algum RNA é degradado em vias que não envolvem
deadenilação significativa. Neste o mRNA é “decapped” antes da cauda de poli(A) ser totalmente
degradada. Parece que algumas sequências de mRNA tornam o cap sensível a enzimas decapantes, mas este
mecanismo ainda não é muito claro. Em outras vias alternativas o mRNA é primeiro clivado internamente
por endonucleases, e os fragmentos daqui resultantes são degradados por exonucleases.

REGULAÇÃO DA ESTABILIDADE DO mRNA DO RECEPTOR DA TRANSFERRINA
O controlo das concentrações de ferro intracelular pelo ironresponse element–binding protein (IRE-BP) é
um elegante exemplo de proteínas individuais que regulam a tradução de um mRNA e a degradação de
outro. Quando os valores de ferro intracelular estão em baixo este sistema duplo de controlo opera de forma
aumentar os níveis de ferro livre necessários para algumas enzima; quando os níveis de ferro estão muito
altos, este sistema opera de forma a prevenir a acumulação de níveis tóxicos de ferro. Este é um dos mais
simples e melhor entendidos processos de tradução
mediada por proteínas.
Um componente deste sistema é a regulação da
produção de ferritina, uma proteína intracelular
ligadora de ferro. A região 5’ do mRNA da ferritina
contém ironresponse elements (IREs), que possui uma
estrutura em stem loop. IRE-Binding Proteins
reconhecem cinco bases específicas no loop IRE e a
natureza dupla do loop. A baixas concentrações, IREBP
encontra-se numa conformação activa que liga IRES. As
IRE-BP ligadas bloqueiam a subunidade ribossomal 40s
de reconhecer o codão de iniciação AUG, e portando
inibindo o inicio da tradução. O resultante decréscimo na concentração de ferritina significa menos ferro
complexado com a ferritina e por isso disponível para ser usado por outras enzimas. A altas concentrações
de ferro, IRE-BP encontra-se na sua forma inactiva e por isso não liga IRES, e portanto a tradução ocorre. A
recém sintetizada ferritina então liga o ferro livre, prevenindo a sua acumulação até níveis tóxicos.
A outra parte deste sistema regulatório controla a importação de ferro para dentro das células. Em
vertebrados, o ferro ingerido é transportado pela
corrente sanguínea ligado a uma proteína chamada
transferrina. Após se ligar a um receptor de
transferrina (TfR) na membrana plasmática, o
complexo transferrina-ferro é levado para dentro das
células por endocitose mediado por receptores
A região 3’ não traduzida do mRNA das TfR contém
IREs cujos stem loop são ricos em sequências
destabilizantes AU. A altas concentrações de ferro,
quando a IRE-BP se encontra inactiva, pensa-se que
estas sequências ricas em AU promovem a degradação
78
do mRNA de TfR pelo mesmo mecanismo que lidera a rápida degradação de outros mRNA de pouco tempo
de vida, como descrito anteriormente. O resultante decréscimo na produção de receptores de transferrina
rapidamente reduz a concentração de ferro, contudo, agora, IRE-BP pode-se ligar ao terminal 3’IRE no
mRNA de TfR. Pensa-se que o IRE-BP ligado bloqueia o reconhecimento da sequência destabilizante rica
em AU pelas proteínas, que de outro modo, iriam rapidamente degradar mRNAs. Como resultado a
produção de transferrina aumenta e mais ferro entra na célula.

LOCALIZAÇÃO DO mRNA PERMITE PRODUÇÃO DE PROTEÍNAS EM REGIÕES ESPECÍFICAS
DA CÉLULA
Muitos processos celulares dependem da localização de proteínas particulares em estruturas específicas
ou regiões da célula. Alternativamente, a localização de uma proteína pode ser atingida por localização do
mRNA a regiões específicas do citoplasma da célula. Na maioria dos casos estudados até agora, tais
localizações do mRNA é especificada por sequências na região 3’ não traduzida do mRNA. Um exemplo
bem documentado ocorre nos Mioblastos de mamíferos (células percursoras musculares) à medida que eles
se diferenciam em Miotubos. Os Mioblastos são células móveis que extendem regiões do citoplasma,
chamadas lamellipodia, que se estendem desde a margem líder na direcção do movimento. Extensões dos
lamellipodia durante o movimento celular requerem a polimerização de actina. mRNA da β-actina encontra-
se concentrado nas margens líder dos Mioblastos, a região do citoplasma em que a proteína codificada é
necessária para a mobilidade. Quando os Mioblastos se fundem em Miotubos sinciciais, a actividade da β-
actina é reprimida e a expressão da α-actina (muscle-specific) é induzida. Em contraste com a β-actina, a α-
actina é restrita nas regiões perinucleares dos Miotubos. Quando cultivados mioblastos no processo de
diferenciação são marcados com partículas florescentes para β-actina ou α-actina, e ambos os mRNA se
encontram localizados nas suas respectivas zonas de actuação.
Para testar a habilidade das sequências do mRNA
da actina em direccionar para a localização celular de
um mRNA específico, fragmentos dos cDNAs de β-
actina e α-actina foram inseridos em plasmídeos
separados que expressavam β-galactosidase a partir
de um forte promotor viral. Os plasmídeos resultantes
eram então transfectados para culturas de células que
n expressavam a actividade de β-galactosidase. Estas
experiências mostraram que a inclusão do terminal 3’
não traduzida da β ou da α-actina direccionava a
localização da β-galactosidase, no entanto regiões 5’
não traduzidas e regiões codificantes não
direccionavam.
O tratamento de mioblastos cultivados com citocalasina D, a qual provoca a disrupção dos
microfilamentos de actina, leva à rápida deslocalização dos mRNAs de actina, indicando que o
citoesqueleto de microfilamentos de actina participa no processo de localização. A disrupção de outros
componentes do citoesqueleto, contudo, não provocava qualquer alteração na localização dos mRNAs.

PROCESSAMENTO DO rRNA
Aproximadamente 80% do total de RNA é constante crescimento nas células de mamíferos é rRNA, e
15% tRNA; RNA codificante de proteínas mRNA apenas constitui uma pequena porção do total de RNA
presente numa célula. Os transcritos primários produzidos pela maior parte dos genes de rRNA e de tRNA,
tal como os pré-mRNA, são extensamente processados de forma a assegurar a forma madura e funcional
destes RNAs.
Os rRNAs 28s e 5.8s associados à subunidade maior (60s) e o rRNA 18s associado à subunidade menor
(40s), em eucariótas superioressão codificados por uma única unidade de transcrição de pré-RNA. A
transcrição por parte da RNA polymerase I assegura um transcrito primário de 45s (pré-RNA), o qual é
processado em rRNA maduro 28s, 18s e 5.8s encontrados nos ribossomas citoplasmáticos. A sequênciação
do DNA codificante pré-RNA de muitas espécies revelou que o DNA partilha varias propriedades em todos
79
os eucariótas. Primeiro, os genes de pré-RNA estão arranjados em longas repetições (tandem – estudado
anteriormente) separadas por regiões espaçadoras não transcritas que variam entre os 2kb em sapos e 30kb
em humanos. Segundo, as regiões do genoma correspondentes aos três rRNAs maduros encontram-se
sempre arranjadas na mesma ordem 5’ 3’: 18s,5.8s,28s. Terceiro, em todos as células eucariotas (e mesmo
em bactérias), o gene do pré-rRNA codifica para, e o transcrito primário contém, regiões que são removidas
durante o processamento e rapidamente degradadas. Tanto a síntese como o processamento de pré-rRNA
ocorrem no nucléolo. A estrutura geral do pré-rRNA em Humanos, sapos, Drosophila e leveduras encontra-
se representado na figura que se segue.

Seguindo-se à sua síntese no nucléolo, o transcrito de pré-rRNA nascente é imediatamente ligado por
proteínas, formando preribosomal ribonucleoprotein particles (pre-rRNPs). A maior destas (80s) contém
uma molécula de 45s intacta, a qual é cortada numa série de clivagens e passos exonucleolíticos que
asseguram a formação dos rRNAs maduros encontrados
nos ribossomas.
Durante o processamento, o pré-rRNA é também
extensivamente modificado, principalmente por
metilações do grupo hidroxilo 2’ de riboses específicas e
a conversão de resíduos de uridina específicos em
resíduos de pseudouridina.
Ao contrário dos genes de pré-RNA, o RNA 5s é
transcrito pela RNA polimerase III no nucleoplasma fora
do nucléolo. Sem mais nenhum processamento, RNA 5s
difunde-se para o nucléolo, onde se associa com os
rRNAs 28s e 5.8s, e proteínas em grandes subunidades
ribossomais .
Quando a associação das subunidades ribossomais no
nucléolo está completa, elas são transportadas pelo poro
nuclear para o citoplasma, onde elas aparecem pela
primeira vez como subunidades livres.

PROCESSAMENTO DE tRNAs
As moléculas maduras, citosólicas, de tRNA, com
cerca de 75-80 nucleótidos, são produzidas a partir de
largos percursores (pré-tRNAs) sintetizados pela RNA
polimerase III no nucleoplasma. tRNAs maduros
contêm, ainda, numerosas bases modificadas que não
estão presentes no transcrito primário de tRNAs. Clivagens e modificações de bases ocorrem durante o
processamento; alguns pré-tRNAs também sofrem splicing durante o processamento.
Uma sequência de tamanho variável na extremidade 5’ encontra-se ausente em todos os tRNAs maduros,
mas encontra-se presente em todos os pré-tRNA. Estes nucleótidos 5’ extras são removidos pela
ribonuclease P (RNase P) uma ribonucleoproteína com actividade de endonuclease.
80
Cerca de 10% das bases no pré-tRNA são modificadas enzimaticamente durante o processamento.
Ocorrem três classes de modificações no terminal 3’ do pré-tRNA com a sequência CCA, a qual se encontra
no terminal 3’ de todos os tRNA é necessária pelo seu carregamento pela aminoacil-RNA sintetase durante
a síntese proteica; adição de grupos metil e isopentenil ao anel heterocíclico das bases purínicas e metilação
do grupo 2’ OH da ribose em qualquer resíduo presente; e por fim a conversão de uridinas específicas em
dihidrouridinas, pseudouridinas ou ribotimidinas.
O mecanismo de splicing do pré-tRNA difere do habitual processo a vários níveis. Primeiro, o splicing
de pré-tRNA é catalizado por proteínas e não por RNAs. Segundo, os intrões nos pré-tRNA são excisados
num só passo que engloba simultaneamente clivagem nas duas extremidades do intrão. Finalmente a
hidrólise do GTP e do ATP é necessária para juntar as duas metades de tRNAs geradas pela clivagem nos
dois lados do intrão.
Após o processamento do pré-tRNAs no nucleoplasma, o tRNA maduro é transportado para o citoplasma
através do NPC pelas exportinas-t, tal como discutido antes. No citoplasma, os tRNAs são “passados” por
aminoacil-tRNA sintetases, factores de alongamento e ribossomas durante a síntese proteica. Assim tRNAs
geralmente estão associados com as proteínas e gastam pouco tempo livres nas células.

81
PRÍNCIPIOS GERAIS DA REGULAÇÃO DA TRANSCRIÇÃO
De todos os 4,000 e tal genes presentes no genoma bacteriano, ou dos 35,000 genes em humanos, apenas
uma fracção deles é expresso numa célula a um dado instante. Alguns produtos dos genes estão presentes
em grandes quantidades: factores de alongamento (estão entre as proteínas mais abundantes das bactérias),
ou a enzima rubisco (até agora a enzima conhecida mais abundante no mundo vivo). Outros produtos estão
presentes em quantidades muito pequenas, como por exemplo um factor de reparação de um dano celular
muito raro.
Muitos são os factores capazes de regulara a expressão génica:
1. Síntese do transcrito primário de RNA;
2. Modificações pós – transcrição do mRNA;
3. Degradação do mRNA;
4. Síntese proteica;
5. Modificações pós – tradução;
6. Transporte e endereçamento proteico;
7. degradação proteica;
nesta parte vamo-nos focar essencialmente na regulação da iniciação da transcrição. Este controlo
permite a regulação sincronizada de múltiplos genes codificantes de proteínas com actividades
interdependentes.
Nós iniciaremos o nosso estudo por examinar as interacções entre proteínas e DNA que são a chave para
a regulação da transcrição. De seguida discutiremos as proteínas especificas que influenciam a a expressão
de genes específicos, primeiro em procariotas e depois em eucariótas.

PRINCÍPIOS DA REGULAÇÃO GÉNICA
Os genes para produtos que são necessários em qualquer altura na célula, tais como as enzimas centrais
na via metabólica, são expressos a um nível mais ou menos constante, virtualmente, em qualquer célula de
um organismos tais genes damos o nome de Housekeeping genes. E a expressão não variada de um gene é
dita como expressão génica constitutiva.
Para outros produtos génico, os níveis celulares dobem e descem em resposta a sinais moleculares; isto é
expressão génica regulada. Os produtos génicos que aumentem em concentrações sob condições
moleculares particulares são referidos como indutíveis; e o processo da sua expressão é a indução. A
expressão de muitos dos genes codificantes de enzimas reparadoras do DNA, por exemplo, são induzidos
por altos níveis de danos no DNA. Contrariamente, produtos de genes que decrescem a sua concentração em
resposta de um sinal molecular são chamados de repressíveis e o processo chama-se repressão. Por
exemplo nas bactérias, as grandes concentrações de triptofan lideram a repressão dos genes que codificam
para enzimas que catalizam a biosíntese de triptofan.
A transcrição é mediada e regulada por interacções proteínas/DNA, especialmente aquelas que envolvem
componentes da RNA polimerase.

LIGAÇÃO DA RNA POLIMERASE A PROMOTORES NO DNA
A DNA polimerase liga-se ao DNA e inicia a sua transcrição em zonas chamadas promotores, locais
estes geralmente encontrados perto dos locais de inicio da transcrição. A regulação do inicio da transcrição
muitas vezes envolve a maneira como RNA polimerase interactua com o promotor.
A sequência de nucleótidos do promotor varia consideravelmente, afectando a afinidade de ligação da
polimerase e consequentemente a frequência de transcrição. Alguns genes de E. coli são transcritos uma vez
por segundo, enquanto outros são apenas transcritos uma vez em cada geração celular. Muitas destas
diferenças devem-se a alterações na sequência do promotor. Na ausência de proteínas reguladoras, as
diferenças nos promotores podem influenciar a transcrição numa taxa de 1000x ou mais. Muitos dos genes
de E. coli têm sequências nos promotores muito perto da sequênciaconsenso. Mutações que provocam um
afastamento da sequência consenso geralmente provocam um decréscimo na expressão desse gene.
A taxa de transcrição de promotores de genes não housekeeping é também determinado por diferenças
nas sequências dos promotores, mas essencialmente pela presença de proteínas reguladoras, muitas destas
actual por aumentar ou interferir com a eficácia da ligação da RNA polimerase ao promotor.
82
A sequência de um promotor eucariótico é mais variável que a dos seus correspondentes procarióticos.
As três RNA polimerases eucarióticas geralmente necessitam um arraial de factores de transcrição de modo
a ligarem-se ao promotor. Mas mesmo assim, da mesma maneira que nos procariotas, o nível básico da
regulação é definido pela sequência de nucleótidos do promotor e da eficiência de ligação da RNA
polimerase a este.

OPERADORES
O início da transcrição é regulado por proteínas que se ligam a
zonas do DNA perto dos promotores. Existem pelo menos três tipos de
proteínas reguladoras do inicio da transcrição: os factores de
especificidade alteram a especificidade da RNA polimerase para um
dado promotor; repressores impedem o acesso da polimerase ao
promotor; e os activadores aumentam as interacções RNA
polimerase/promotor.
Estas proteínas ligam-se a locais específicos no DNA. Em DNA de
procariotas, tais locais de ligação, chamados operadores, geralmente
encontram-se perto dos promotores. A ligação da RNA polimerase ou
o seu movimento ao longo do DNA após ligação é bloqueado quando
um repressor está presente. A regulação por meio de um repressor é
referida como regulação negativa. A ligação do repressor ao DNA é
regulada por um sinal molecular (efector), normalmente uma pequena
molécula ou uma proteína que se liga ao repressor e causa uma
mudança conformacional. A interacção entre o repressor e a molécula
sinal tanto aumenta como diminui a transcrição. Em alguns casos, a
mudança conformacional resulta numa dissociação do repressor do
operador. A iniciação da transcrição pode então prosseguir. Noutro
caso, a interacção entre um repressor e uma molécula sinal causa a
ligação do repressor ao operador. Em células eucarióticas o local de
ligação para um repressor pode estar um quanto distante do promotor;
mas a ligação tem o mesmo efeito que nas bactérias: inibição da
compilação ou actividade do complexo de transcrição no promotor.
Os activadores representam um contraponto molecular dos
repressores; eles ligam-se ao DNA e aumentam a actividade da RNA
polimerase; isto é regulação positiva. Os locais de ligação de um
activador está normalmente adjacente do promotor, ao qual a RNA
polimerase se liga-se muito fracamente ou não se liga de todo. Alguns
activadores eucarióticos ligam-se a locais de ligação no DNA,
chamados enhancers, que se encontram um pouco distantes do
promotor, afectando a taxa de transcrição no promotor que pode estar
localizado a milhares de bases de distância. Alguns activadores
encontram-se normalmente associados ao DNA aumentando a
transcrição até que um sinal molecular provoque a dissociação do
activador. Noutros casos, os activadores apenas se ligam ao DNA após
uma interacção com um sinal molecular.
Os sinais moleculares podem, por isso, aumentar ou diminuir a
transcrição, dependendo apenas da maneira como eles afectam o
activador. A regulação positiva é particularmente frequente em
eucariotas.

83
REGULAÇÃO DA TRANSCRIÇÃO EM PROCARIÓTAS
OPERÃO LAC
As bactérias possuem um mecanismo geral muito simples para coordenar a regulação de genes que
codificam produtos que participam numa série de processos relacionados. Estes genes encontram-se
reunidos no cromossoma e são transcritos juntos. Muitos mRNAs procarióticos são policistrónicos - muitos
genes num único transcrito – e o único promotor que inicia a transcrição desta reunião, é também zona de
regulação para a expressão destes genes. O conjunto de genes, do promotor, e sequências adicionais que
funcionam juntos na regulação, é chamado de operão.

Muitos dos princípios da expressão génica em procariotas foram
inicialmente definidos por estudos do metabolismo da lactose (na figura)
em E. coli, que pode usar a lactose como sua única fonte de carbono.
O operão da lactose (lac) (figura de baixo) inclui o gene da ß-
galactosidase (z), galactoside permease (Y), e thiogalactoside
transacetylase (A). Esta ultima parece modificar galacatosídeos tóxicos
para facilitar a sua remoção da célula. Cada um destes três genes é
precedido por um local de ligação de ribossomas (não mostrado na
figura), que independentemente direcciona a tradução daquele gene. A
regulação do operão lac por proteínas repressoras lac segue os padrões
delineados anteriormente, na figura a) da pagina anterior.

Estudos de operões lac mutantes revelaram alguns detalhes no funcionamento do sistema de regulação
dos operões. Na ausência de lactose, os genes do operão lac são reprimidos. Mutações no operador ou
noutro gene, no gene I, resultava numa síntese constitutiva dos produtos dos genes. Quando o gene I é
defeituoso, a repressão pode ser restaurada pela introdução do gene I funcional na célula numa outra
molécula de DNA, demonstrando que o gene I codifica uma molécula difundível que causa a repressão do
gene. Esta molécula, uma proteína, é agora chamada o repressor lac. O operador ao qual ele se liga mais
fortemente (O1) bloqueia a local de iniciação da transcrição. O gene I possui o seu próprio promotor (PI)
independente dos genes do operão lac. O operão lac possui ainda dois locais de ligação do repressor. Um
deles (O2) encontra-se na região +410, dentro do gene que codifica a ß-galactosidase (Z); o outro (O3)
encontra-se próximo da zona -90, dentro do gene I. Para reprimir o operão, parece que o repressor lac se
ligar a ambos, o local principal de ligação e um dos locais secundários, formando um loop. Qualquer uma
das combinações bloqueia a transcrição.
Apesar deste elaborado complexo de ligação a repressão não é absoluta. A ligação do repressor lac reduz
a transcrição a uma taxa de 103. Se os locais O2 e O3 forem eliminados do operão, a simples ligação do
repressor ao local O1 reduz a transcrição numa taxa de 102.
Quando as células possuem lactose, o operão lac encontra-se induzido. Uma molécula indutora liga-se a
um local específico no repressor lac e provoca uma alteração conformacional que resulta na dissociação do
repressor do operador. O indutor no sistema de repressão do operão lac não é a lactose por si mesma, mas a
84
alolactose, um isómero da lactose. Após a lactose entrar na célula por uma das poucas permeases ainda
existentes, a lactose é convertida em alolactose por uma das poucas ß-galactosidase ainda existentes.
Libertando o operador do repressor, permitindo ao operão lac ser transcrito, conduzindo a um aumento da
expressão de permeases e ß-galactosidases.
Os mecanismos pelos quais os operões são regulados podem variar muito do modelo aqui apresentado
anteriormente, de facto o próprio operão da lactose é mais complexo do que aquilo que foi aqui indicado,
com um activador que contribui para o esquema global.

REGULAÇÃO POSITIVA DO OPERÃO LAC
As interacções operador/repressor/indutor descritas anteriormente para o operão lac providenciam um
modelo satisfatório e intuitivo para um mecanismo on/off na regulação da expressão génica. Na verdade, a
regulação de um operão raramente é assim tão simples. O ambiente bacteriano é demasiado complexo para
que os seus genes sejam controlados apenas por um sinal. Outros factores para além da lactose controlam a
expressão dos genes lac, tais como a disponibilidade de glucose. A glucose proveniente directamente da
glicólise é a fonte principal de energia da célula. Claramente a expressão de genes para proteínas que
metabolizem açucares tais como a lactose ou a arabinose é um desperdício quando a glucose é abundante.
O que acontece ao operão lac quando ambasgrau de absorvância. RNA ou DNA cadeia simples absorve maior quantidade
porque os anéis estão mais expostos.

COMPACTAÇÃO DE DNA:
O genoma dos eucariótas é, não só, mais complexo que o dos procariotas como, além disso, encontra-se
organizado de maneira diferente. O genoma dos procariotas está contido em cromossomas simples, que
usualmente são moléculas de DNA circulares. Pelo contrário o genoma de um eucariota é composto por
múltiplos cromossomas, cada um contendo uma cadeia linear de DNA. Apesar das diferenças entre as
espécies a estrutura básica do DNA eucariótico é semelhante em todos os seres. Este tipo de DNA encontra-
se ligado a pequenas proteínas (histonas) que empacotam o DNA de uma forma ordenada no núcleo da
célula – esta é uma tarefa crucial dado a quantidade de DNA na maioria dos eucariotas. Por exemplo, o
tamanho total do genoma humano é cerca de 2m, contudo ele tem de caber num núcleo de 5 a 10 µm.

9
CROMATINA:
O complexo formado entre o DNA eucariótico e as proteínas é chamado cromatina, geralmente contém
cerca do dobro de proteínas que de DNA. O maior grupo de proteínas presente na cromatina são as histonas
– pequenas proteínas contendo uma alta proporção de aminoácidos básicos (arginina e lisina) que facilitam a
ligação a moléculas de DNA carregadas negativamente. Existem cinco grandes grupos de histonas (H1,
H2A, H2B, H3, H4) muito semelhante entre as diferentes espécies eucariontes.

As histonas são proteínas extremamente abundantes nas células eucarióticas; juntas, a sua massa é
aproximadamente igual à do DNA celular. Além disso, a cromatina contém uma massa aproximadamente
igual de uma grande variedade de proteínas não histónicas. Existem mais de mil tipos diferentes destas
proteínas, cada uma delas envolvida numa grande gama de actividades incluindo a replicação e a expressão
génica.
A unidade básica estrutural da cromatina, os nucleossomas, foi descrita por Roger Kornberg em 1974.
Dois tipos de experiências levaram a que ele propusesse o modelo. Primeiro uma digestão parcial da
cromatina com nuclease micrococcal (enzima que degrada DNA) formou fragmentos com um comprimento
de aproximadamente 200 bases. Em contrate, uma digestão semelhante de DNA nu (sem proteínas
associadas) originou uma gama de fragmentos de tamanhos aleatórios. Estes resultados sugeriam que a
ligação de proteínas ao DNA protegia algumas regiões da digestão por parte das nucleases de modo que a
enzima só era capaz de atacar o DNA em locais espaçados por cerca de 200 pares de bases. Consciente
desta noção, a microscopia electrónica revelou que a fibra de cromatina tinham um aspecto de rosário, com
as contas separadas em intervalos aproximadamente de 200 pares de bases. Assim, tanto a experiência de
digestão com nucleases como a microscopia electrónica sugeriam que a cromatina fosse composta por
unidades repetitivas de 200 pares de bases, chamados nucleossomas.

O empacotamento de DNA por parte das histonas forma um fibra de
aproximadamente 10nm de diâmetro que é composta por cromatossomas
(nucleossomas associados a uma molécula de histona H1) separados por segmentos
de DNA ligante com cerca de 80 pares de bases de tamanho. O enrolamento do
DNA em fibras de 10nm reduz cerca de sete vezes (7x) o seu tamanho. A cromatina
pode depois condensar em fibras de 30nm. Forças entre as histonas H1 dos
10
diferentes cromatossomas parecem desempenhar um papel importante na fixação desta estrutura. Este tipo
de condensação não permite a expressão génica. Equivale a uma compactação de 100x. numa célula em
interfase, diferentes zonas do cromossoma podem-se encontrar em diferentes graus de compactação.

A extensão da condensação da cromatina varia durante o ciclo celular. Na interfase a maioria da
cromatina (chamada eucromatina) está relativamente condensada e espalhada pelo núcleo. Durante este
período, genes são transcritos e o DNA é replicado em preparação para a divisão celular. A maioria da
cromatina na interfase parece encontrar-se na forma condensada de 30nm, organizada em grandes loops
contendo aproximadamente 50 a 100 kb de DNA. os genes que estão a ser transcritos encontram-se numa
forma mais descondensada de maneira a facilitar o processo. Concluindo – a estrutura da cromatina está
altamente relacionada com a regulação da expressão génica nos eucariotas.
Ao contrário da eucromatina, cerca de 10% da cromatina interfásica, chamada heterocromatina,
encontra-se num estado altamente condensado que se assemelha à cromatina da célula durante a mitose. A
heterocromatina encontra-se transcriptamente inactiva, e contém elevado número de sequências de DNA
repetidas, tais como aquelas presentes nos centrómeros e telómeros.
Quando as células entram em mitose, os seus cromossomas tornam-se altamente condensados, de modo a
que eles se consigam distribuir pelas células filhas. Pensa-se que os loops de cromatina das fibras de 30nm
ligam-se e entrelaçam-se entre si de modo a compactar e formar os cromossomas típicos de metafase. Tal
estado de condensação da cromatina não pode ser usado para a síntese de DNA, assim a transcrição cessa
durante o processo de mitose.

DNA cadeia de dupla hélice
Cromatina DNA + proteínas associadas
Cromossomas 1 cromossoma = 1 molécula de DNA (homem tem 46 moléculas de DNA)
Gene porção da molécula que codifica informação
DNAses ou Nucleases proteínas que clivam ácidos nucleicos;
Compactação ~10000x
11
REPLICAÇÃO DO DNA
A descoberta do emparelhamento complementar das bases de DNA sugeriu imediatamente uma solução
molecular para a questão de como o material genético dirigia a sua replicação – um processo necessário
cada vez que se dava a divisão celular. Foi inicialmente proposto que as duas cadeias se podiam separar e
servir de modelos para a síntese de novas cadeias, a sequência seria ditada pelo simples emparelhamento de
bases. O processo é chamado de replicação semiconservativa porque uma das cadeias do DNA parental é
conservada em cada um dos descendentes.
Um suporte directo para este suposto foi obtido em 1958 por Mathew Meselson e Frank Stahl, através de
uma experiência em que o DNA ela rotulado com isótopos que alteravam a sua densidade. E. coli primeiro
cresceu num meio contendo isótopos de alta densidade (15N) em vez de isótopos normais (14N). O DNA
destas bactérias incorporou este isótopo no seu DNA e tornou-se, por isso, mais pesado.
Esta diferença de densidades permitia a separação de cadeias por centrifugação, e foi esta característica
que eles usaram para estudar o processo de replicação.
As bactérias que tinham crescido num meio com isótopo pesado de DNA foram depois transferidas para
um meio com isótopos normais e foi permitida a sua replicação uma vez mais. O DNA das bactérias foi
então extraído e analisado. O resultado destas análises mostrou que todas as moléculas de DNA possuíam
agora uma densidade intermédia entre a densidade de 15N e 14N. Isto mostrou que durante o processo de
replicação as duas cadeias parentais pesadas separam-se e servem de molde para novas cadeias, estas
formadas com o isótopo leve e formando, por isso, cadeias de densidade intermédia.

A REPLICAÇÃO É BIDIRECCIONAL
Seguindo-se à confirmação de que a replicação era semiconservativa uma série de questões surgiram.
• Estarão as duas cadeias de DNA completamente separadas antes do início de cada replicação?
• A replicação começará em locais aleatórios ou em locais específicos?
• Após o início da replicação, esta procede num única direcção ou nas duas?
Uma antecipada indicação de que a replicação se tratava de um processo altamente ordenado no qual as
cadeias iniciais eram simultaneamente separadas e replicadas foi-nos dada por John Cairns, usando a
autoradiografia. Ele tornou o DNA de E. coli radioactivo fazendo-a crescer num meio com timina
radioactiva (rotulada com tritium - 3H). Quando o DNA foi revelado com película fotográfica, esta mostravaa glucose e a lactose estão presentes? Um mecanismo de
regulação conhecido como repressão catabolítica restringe a expressão dos genes necessários para o
catabolismo da lactose, arabinose, e outros açucares na presença de glucose, mesmo quando estes açucares
estão presentes. O efeito da glucose é mediado pelo AMP cíclico (cAMP), como coactivador, e uma
proteína activadora conhecida como proteína receptora de cAMP (CRP) – por vezes referida como CAP.

Quando a glucose está ausente, CRP-cAMP liga-se a um local perto do promotor lac e estimula a
transcrição do RNA. CRP-cAMP é portanto um regulador positivo responsivo aos níveis de glucose,
enquanto o repressor lac é um regulador negativo responsivo aos níveis de lactose.
CRP-cAMP tem pouco efeito no operão lac quando o repressor lac está a bloquear a transcrição, assim
como a dissociação do repressor do operador tem pouco efeito na transcrição do operão lac a menos que a
CRP-cAMP esteja presente para facilitar a
transcrição; quando CRP não se encontra
ligado, o tipo selvagem de promotor lac é um
promotor relativamente fraco. O complexo
aberto de RNA polimerase e do promotor não
se forma automaticamente, é necessária a presença de CRP-cAMP. CRP interage directamente com RNA
polimerase.
O efeito da glucose no CRP é mediado
pelas interacções com cAMP. CRP liga-
se ao DNA quase avidamente quando as
concentrações de cAMP são altas. Na
presença de glucose, a síntese de cAMP é
inibida e o fluxo do cAMP na célula é
estimulado. À medida que a concentração
de cAMP diminui, a ligação do CRP ao
DNA também decresce,
consequentemente diminuindo a
expressão do operão lac. Fortes induções
do operão lac são depois necessárias
ambas a lactose (para inactivar o repressor) e baixas concentrações de glucose (para desencadear o aumento
na concentração de cAMP e o aumento da ligação de cAMP ao CRP). As proteínas CRP e cAMP estão
envolvidos em muitos sistemas regulatórios de vários operões.

85
OPERÃO DA ARABINOSE
A arabinose é um açúcar que entra na via da pentose, mas que antes tem de ser transformada em xilulose
5-p; isto é feito por proteínas codificadas pelos genes araA, araB e araD. O operão é regulado pelos níveis
de arabinose glicose, já que só se usa a arabinose quando não há glicose.

A proteína codificada pelo gene araC, funciona como repressor, estando ligado ao operador e impedindo a
transcrição; na presença de arabinose a repressão
é levantada. Esta proteína regula a sua própria
expressão. No gene araC existe um local
regulador, que é chamado de sequência araO1,
junto do promotor, onde a proteína se liga
quando os seus níveis são elevados (mecanismo
de autorregulação).
Os operadores do operão são as sequências
araO2 e araI; a proteína AraC vai dimerizar e
ligar-se a estes operadores, formando um loop
no DNA. A estrutura é mantida pela dimerização
que impede a transcrição. Na presença de
arabinose, o gene araC liga-se ao operador AraI,
e dimeriza de uma forma diferente e deixa de se
ligar ao araO1, e a ligação a um dos operadores
facilita a transcrição – A proteína AraC passa de
repressora a activadora (facilita a ligação da
RNA polimerase).
O promotor deste operão é também um
promotor fraco e só se torna mais eficiente
quando há pouca glicose; neste sistema , os
níveis de cAMP sobem, há ligação com CRP que
se liga, posteriormente, a uma sequência do
operão; a ligação desta CRP juntamente com a
ligação da arabinose aumentam a transcrição.

86
OPERÃO DO TRIPTOFAN E ATENUAÇÃO
Os 20 aminoácidos são necessários em grandes quantidades para a síntese proteica, e a E. coli consegue
sintetizá-los a todos. Os genes para as enzimas necessárias para a síntese de aminoácidos estão geralmente
reunidos num operão e são expressos sempre que haja necessidade. Quando o aminoácido está em
abundância na célula, as enzimas biosintéticas não são necessárias e o operão é reprimido.
O operão de triptofan (trp) em E. coli inclui cinco genes para as enzimas necessárias para a síntese de
triptofan. De notar que duas das enzimas catalizam para mais de um passo na via metabólica. O mRNA
resultante deste operão tem um tempo de meia-vida de apenas 3 minutos, permitindo à célula responder
rapidamente a mudanças de necessidades para este aminoácidos. Quando o triptofan é abundante ele se liga
ao repressor de Trp, causando uma alteração conformacional que permite ao repressor ligar-se ao operador
trp e inibir a expressão do operão trp. O operador trp sobrepõe-se ao promotor, assim a ligação do repressor
bloqueia a ligação da RNA polimerase.

Uma vez mais, este simples mecanismo on/off mediado por um repressor não é a história completa da
regulação. Diferentes concentrações celulares de triptofan consegue variar a velocidade de síntese das
enzimas biosintéticas. Uma vez que a repressão é elevada e a transcrição comece, a taxa de transcrição é
afinada por um segundo processo de regulação, chamado atenuação da transcrição, no qual a transcrição
se inicia normalmente mas depois é abruptamente interrompida antes dos genes serem transcritos. A
frequência pela qual se dá a atenuação varia com a quantidade de triptofan disponível e faz uso da relação
muito próxima que existe entre a transcrição e a tradução nas bactérias.
O mecanismo de atenuação do
operão trp usa sinais codificados em
quatro sequências dentro de uma
região líder de 162 nucleótidos na
extremidade 5’ do mRNA,
precedendo o codão de iniciação do
primeiro gene. Dentro da região
líder reside uma região conhecida
como atenuadora, composta pelas
sequências 3 e 4.
87
Estas sequências emparelham para formar um stem loop rico em G≡C perto de uma série de resíduos de
U. a estrutura atenuadora actua como finalizador da transcrição.

A sequência 2 é uma complemento alternativo para a sequência 3. se a sequência 2 e 3 emparelharem, a
estrutura atenuadora não se pode formar e a transcrição continua pela genes síntese de trp, isto porque o
loop formado pelo emparelhamento das sequências 2 e 3 não termina a transcrição.
A sequência reguladora 1 é crucial para o sensível mecanismo, e este que determina qual o loop formado,
se entre a sequências 2 e 3 ou se entre as sequências 3 e 4. a formação da estrutura atenuadora depende de
eventos que ocorrem durante a tradução da sequência reguladora 1, a qual codifica um péptido líder de 14
aminoácidos dois dos quais são resíduos de triptofan. O péptido líder não possui mais nenhuma função
celular conhecida; a sua síntese é apenas um aparato regulatório do operão.

Este péptido é traduzido imediatamente após ser transcrito por ribossomas que seguem logo atrás da
RNA polimerase. Quando as concentrações de triptofan estão altas, as concentrações de tRNA carregado
com triptofan também são elevadas. Isto permite à tradução prosseguir rapidamente através dos dois codões
de triptofan da sequência 1 e começar a tradução da sequência 2, antes da sequência 3 ser transcrita pela
RNA polimerase. Nesta situação, a sequência esta coberta por ribossomas e indisponível para ligar com a
sequência 3; deste modo a sequência 3 emparelha com a sequência 4 formando a estrutura atenuadora.
Contudo, quando as concentrações de triptofan estão em baixo, os ribossomas ficam travados nos dois
codões de triptofan da sequência 1 porque os codões de tRNA carregados estão menos disponíveis. Deste
modo a sequência 2 continua disponível quando a sequência 3 é transcrita e estas formam um loop, que
permite a transcrição.

88
CONTROLO DA TRANSCRIÇÃO EM EUCARIOTAS
Os vários elementos de controlo da transcrição em DNA eucariótico são locais de ligação de proteínas
reguladoras. Nesta secção, vamos discutir a identificação, purificação e estrutura destes factores de
transcrição, os quais funcionam como activadores ou repressores da transcrição
Apesar das diferenças nos propósitos do controlo da transcrição entre procariotas e eucariotas, duas
característicaschave do controlo da transcrição inicialmente descobertas em bactérias são também válidas
para organismos eucariotas. Primeiro a ligação de proteínas reguladoras a sequências de DNA. Segundo, a
ligação de proteínas específicas a zonas reguladoras do gene determinam se a transcrição terá inicio, e
também activam ou reprimem a transcrição.
O controlo da transcrição em eucariotas tem três níveis de actuação:
• Interferência com o complexo de iniciação da transcrição
• Regulação da estrutura da cromatina
• Modulação dos níveis e da actividade dos activadores e dos repressores da transcrição

A caixa TATA é uma sequência do promotor altamente conservada em eucariotas, mas em vez dela
alguns organismos possuem um elemento alternativo no promotor chamado iniciador. A maioria dos
iniciadores que ocorrem naturalmente possui uma citosina (C) na posição -1 e uma adenina (A) na posição
+1. A mutagénese dirigida em mamíferos com promotores contendo iniciadores revelaram que a sequência
de nucleótidos imediatamente nas redondezas do local de iniciação determina a força de tais promotores. Ao
contrario das sequências altamente conservadas caixas TATA, apenas uma sequência consenso
extremamente degenerada foi definida (5’) Y-Y-A+1-N-T/A-Y-Y-Y (3’), onde A+1 é a base na qual se inicia
a transcrição, Y é uma pirimidina (C ou T), N é qualquer uma das quatro bases, e T/A é qualquer uma destas
duas bases na posição 3’.
A transcrição de genes, com promotores contendo uma caixa TATA ou um elemento iniciador, inicia-se
num ponto bem definido. Contudo, foi mostrado que a transcrição de muitos genes codificantes de proteínas
tem início em qualquer um dos muitos locais possíveis numa região que se estende entre 20 e 200
nucleótidos. Estes genes não possuem nem uma caixa TATA nem uma sequência iniciadora, a maioria
destes genes contêm porções de 20 a 50 nucleótidos ricas em CG a uma distancia de ~100 nucleótidos de
distancia do local de iniciação da transcrição.

ELEMENTOS REGULADORES DA TRANSCRIÇÃO
Técnicas de DNA recombinante têm sido usadas para sistematicamente mutar a sequência de nucleótidos
a montante do local de iniciação de vários genes eucarióticos de modo a identificar regiões controladoras da
transcrição. Por agora centenas de genes já foram analisados e outras tantas regiões foram identificadas.
Estes elementos de controlo juntos com a caixa TATA ou o iniciador são muitas vezes referidos como o
promotor do gene que eles regulam. Contudo, vamos reservar o termo promotor para a caixa TATA ou
sequência iniciadora e chamemos a estas sequências elementos próximos do promotor. Em alguns casos
os elementos próximos do promotor são específicos para o tipo celular, isto é apenas funcionam em tipos
celulares especializados.

Uma aproximação frequentemente utilizada para determinar o quadro da região controladora da
transcrição para um gene de mamífero envolve a construção de séries de delecções 5’. Uma vez criado o
quadro da região, a análise de linker scanning mutations, pode apontar para a sequência com funções
reguladoras que reside entre o quadro e o local de início da transcrição. Nesta aproximação, uma série de
construções com encaixes sobrepostos são ensaiados para analisar o seu efeito na expressão do gene repórter
89
ou produção de mRNA específicos. Um dos primeiros trabalhos foi a análise de elementos próximos do
promotor do gene da cinase de timidina (tk) do vírus do herpes (HSV). Os resultados, ilustrados na figura,
mostram que regiões no DNA a montante do gene tk do
HSV contem três zonas separadas de controlo da
transcrição: a caixa TATA (de -32 a -16), e dois outros
controladores um pouco mais longe do local de
iniciação da transcrição.
Para testar as constrições de espaço nos elementos de
controlo na região do promotor, identificadas por análise
de linker scanning mutations, os cientistas promoveram
um ensaio contendo pequenas delecções e inserções
entre os elementos. Isto indicou que uma certa
flexibilidade no espaçamento entre elementos próximos
do promotor é geralmente tolerada, mas a separação de
vários emparelhamentos pode diminuir a taxa de
transcrição.

ELEMENTOS CONTROLADORES DA TRANSCRIÇÃO – (ELEMENTOS CIS)
Inicialmente pensava-se que enhancers e elementos próximos do promotor eram diferentes tipos de
elementos de controlo da transcrição. Contudo, quantos mais enhancers e elementos próximos do promotor
eram analisados, a distinção entre eles tornou-se menos clara. Por exemplo ambos os tipos geralmente
conseguiam estimular a transcrição mesmo quando invertidos, e ambos muitas vezes eram cell-type-
specific. Agora o consenso geral é que um espectro de elementos regula a transcrição pela RNA polimerase
II. Num extremo estão os enhancers, capazes de estimular a transcrição de um promotor a dezenas de
milhares de pares de bases de distância (p.e. o enhancer de SV40). No outro extremos estão os elementos
próximos do promotor tais como os elementos a montante no gene de tk do HSV, os quais perdem a sua
função quando distanciados a mais de 30-50 pb do promotor. As investigações demonstraram a existência
de elementos reguladores entre estes dois.
A figura ilustra a localização de sequências de controlo de transcrição para um gene hipotético. O local
de iniciação da transcrição codifica o primeiro nucleótido (5’) do primeiro exão do mRNA – o codão que
está capped. Para muitos genes, especialmente aqueles codificantes proteínas abundantemente transcritas, a
caixa TATA localiza-se aproximadamente 25-35pb a montante do local de iniciação. Elementos próximos
do promotor, que são relativamente curtos com cerca de 10 a 20pb, estão localizados entre os primeiros 200
pb a montante do local. Os enhancers, pelo contrário usualmente possuem 100pb de comprimento e são
compostos por múltiplos elementos de 10 a 20 pb.

Enhancers podem estar localizados até 50kb de distancia a montante ou a jusante do local de iniciação ou
dentro de um intrão. Muitos genes de mamíferos são controlados por mais de uma região enhancer. O
genoma de S. cerevisiae contém elementos reguladores chamados upstream activating sequences (UASs),
os quais funciona de maneira semelhante aos enhancers e aos elementos próximos do promotor. A maioria
dos genes de leveduras possui apenas um UAS, que geralmente reside dentro de centenas de pb a partir do
ponto de partida. Em contrapartida, os genes de S. cerevisiae contêm caixa TATA ~90pb a montante do
local de iniciação da transcrição.

90
FACTORES DE TRANSCRIÇÃO TÊM DOMÍNIOS FUNCIONAIS INDEPENDENTES
Estudos com o activador de transcrição de leveduras chamado GAL4 providenciaram uma luz no
domínio da estrutura dos factores de transcrição. O gene codificante da proteína GAL4, a qual promove a
expressão de enzimas necessárias no metabolismo da galactose foi
identificado por análises de complementação de mutantes de gal4.
Estudos de mutagénese dirigida tais como aqueles já aqui referidos
identificaram UASs para os genes activados por GAL4. Descobriu-se
que cada um destes possuía uma ou mais cópias da sequência de 17pb
chamada USAGAL.
Quando uma cópia de UASGAL era clonada a montante da caixa TATA seguida pelo gene repórter lacZ,
a expressão deste gene era activada em células do tipo selvagem em meio de galactose, mas não em
mutantes gal4. Estes resultados mostraram que UASGAL é um elemento de controlo da transcrição activado
pela proteína GAL4 em meio de galactose.
Um espantoso número de experiências com
delecções mutantes em gal4 demonstrou que o
factor de transcrição GAL4 é composto por
domínios funcionais separados: um domínio
ligador do terminal N do DNA, o qual liga a
sequências específicas do DNA, e um domínio
activador no terminal C, o qual interage com
outras proteínas para estimular a transcrição de
um promotor na vizinhança. Quando o domínio
de ligação de proteínas no terminal N de GAL4
está fundido com vários terminais C dos seus
fragmentos, o resultadosão proteínas truncadas
retêm a habilidade de estimulara a expressão do
gene repórter num ensaio in vivo. Deste modo a
porção interna da proteína não é necessária para
o funcionamento de GAL4 como factor de
transcrição.
O modelo estrutural para os activadores eucarióticos é um molde no qual um ou mais domínios de
activação estão conectados a uma sequência específica de domínio ligador de proteínas. Em alguns casos,
aminoácidos envolvidos na ligação ao DNA também contribuem para a activação da transcrição. Pensa-se
que os domínios de activação funcionam por ligação de outras proteínas envolvidas na transcrição. A
presença de domínios do DNA ligadores de proteínas flexíveis para a activação de domínios pode explicar
porque alterações no espaçamento entre os elementos de controlo são tão bem tolerados em regiões de
controlo eucarióticas. Assim mesmo quando a posição dos factores de transcrição ligados ao DNA é
deslocado relativamente a outro, os seus domínios de activação continuam disponíveis para interagir porque
estão ligados ao seu domínio do DNA através de regiões proteicas flexíveis.

91
DOMÍNIOS LIGADORES DE DNA
Os domínios de ligação ao DNA de activadores e repressores proteicos contêm uma variedade de
motivos estruturais que ligam sequências de DNA específicas. A habilidade das proteínas ligadoras de DNA
para ligar sequências específicas normalmente resulta de interacções não covalentes entre os átomos de uma
α-hélice no domínio ligante do DNA, e de átomos nas extremidades das bases que compõem o sulco maior
no DNA. Interacções com o esqueleto de açúcar/fosfato, e, em alguns casos, com átomos do sulco menor do
DNA também contribuem para a ligação.
Os princípios para as interacções DNA/proteína foram primeiro descobertas durante o estudo de
repressores bacterianos. Muitos repressores bacterianos são proteínas diméricas nas quais uma α-hélice de
cada monómero se insere num sulco maior do DNA. Esta α-hélice é referida como a hélice de
reconhecimento ou a hélice de leitura de sequências porque a maioria das cadeias laterais dos
aminoácidos que contactam com o DNA estendem-se a partir desta hélice. A hélice de reconhecimento que
espicha da superfície do repressor bacteriano para entrar no sulco maior do DNA e faz múltiplas, especificas
interacções com átomos no DNA é usualmente suportado na estrutura da proteína
em parte por interacções hidrofóbicas com uma segunda α-hélice na zona N
terminal. Este elemento estrutural, que se encontra presente em muitos repressores
bacterianos, é chamado de motivo helix-turn-helix. Muitos motivos que podem
apresentar uma α-hélice ao sulco maior do DNA são encontrados em factores de
transcrição eucarióticos, que muitas vezes são classificados de acordo com o tipo
de domínio ligante de DNA que contêm. Porque a maioria destes motivos possui
sequências de aminoácidos consenso características, novos factores de transcrição
podem ser classificados uma vez que os genes correspondentes ou cDNAs sejam
clonados e sequenciados. O genoma de eucariótas superiores codifica dúzias de
classes de domínios ligantes de DNA e centenas a milhares de factores de transcrição. O genoma humano,
por instantes, codifica ~2000 factores de transcrição.
Iremos agora introduzir várias classes de proteínas ligadores de DNA cuja estrutura tridimensional já foi
determinada. Em todos estes exemplos e muitos outros factores de transcrição, pelo menos uma α-hélice é
inserida no sulco maior do DNA. Contudo alguns factores de transcrição contêm motivos estruturais
alternativos que interagem com o DNA.

PROTEÍNAS COM HOMEODOMÍNO
Muitos factores de transcrição eucarióticos que funcionam durante o desenvolvimento contêm um motivo
de ligação ao DNA com cerca de 60 nucleótidos que é semelhante ao motivo helix-turn-helix dos
repressores bacterianos.
Proteínas Zinc-Finger– um número de proteínas eucarióticas diferentes possuem regiões que se ligam à
volta de um ião Zn2+, produzindo um domínio compacto de uma porção relativamente curta do péptido que
pode ligar a sua α-hélice ao sulco maior do DNA . Chamado de zinc-finger, este motivo estrutural foi
inicialmente identificado em proteínas ligantes de DNA, mas hoje sabe-se que também ocorre em outras que
n ligam DNA. este motivo possui uma sequência
consenso de 23 a 26 resíduos, contendo duas cisteínas
e duas histidinas altamente conservadas (Tyr/Phe-X-
Cys-X2-4-Cys-X3-Phe/Tyr-X5-Leu-X2-His-X2-4-
His) cujas cadeias laterais ligam a um ião de Zn2+. O
nome zinc-finger foi atribuído porque o diagrama a
duas dimensões da estrutura faz lembrar um dedo.
Muitos factores de transcrição possuem mais do que
um domínio zinc-fingers, que interagem com grupos
de pares de bases sucessivos, dentro do sulco maior,
enquanto a proteína se enrola à volta da dupla hélice
de DNA.

92
Proteínas Leucine-Zipper – Outro motivo estrutural presente nos domínios ligantes de DNA de uma
grande classe de factores de transcrição que contêm aminoácidos hidrofóbicos como a leucina a cada sete
posições na sequência. Estas proteínas ligam ao DNA como dímeros, e mutações na sequência de leucinas
mostrou que elas são essenciais para a dimerização. Técnicas de cristalografia de raios-X em complexos
entre o DNA e este domínio mostraram que a proteína dimérica contém duas α-hélices extensas que
apertam a molécula de DNA, muito como uma par de tesouras, em dois sulcos maiores adjacentes. A porção
das α-hélices que contactam com o DNA possuem resíduos positivamente carregados (básicos) que
interagem com os grupos fosfatos do esqueleto do DNA, e resíduos adicionais que interagem com bases
específicas no sulco maior. Estas proteínas formam dímeros através de interacções hidrofóbicas entre os
terminais C das α-hélices, formando uma estrutura enrolada (coiled-coil).
Apesar do primeiro factor de transcrição Leucine-Zipper a ser analisado conter resíduos
de leucina a cada sete posições, na zona de dimerização, foram, posteriormente,
identificadas outras proteínas ligantes de DNA contendo outros resíduos hidrofóbicos
nessas posições. E tais como as proteínas Leucine-Zipper também elas formavam
dímeros contendo os terminais C enrolados e o terminal N ligado ao DNA. o termo
basic-zipper (bZip) é agora frequentemente usado para referir estas proteínas. Muitos
factores de transcrição basic-zipper são heterodiméricos para duas cadeias
polipeptídicas diferentes, outras há que são homoméricas, ou seja as duas cadeias
polipeptídicas são iguais, cada um dos polipéptidos possui um domínio basic-zipper. Os
dois factores de transcrição mais conhecidos desta família são Jun, Fos.

Proteínas Básicas Helix-Loop-Helix (bHLH) – o domínio ligante de DNA de outra
classe de factores de transcrição diméricos contem um motivo funcional muito
semelhante ao motivo basic-zipper excepto que um loop não helicoidal das cadeias
polipeptídicas separa as duas regiões α-hélices em cada monómero. Este domínio foi
previsto a partir de sequências de aminoácidos destas proteínas, que continham uma
cauda N com resíduos básicos que interagiam com o DNA, na região mediana do loop e
uma região no terminal com aminoácidos hidrofóbicos espaçados em intervalos
característicos, numa α-hélice anfipática.

ELECTROPHORETIC MOBILITY SHIFT ASSAY (EMSA)
Como se mede a actividade de um factor de transcrição? Podemos fazê-lo indirectamente avaliando a
expressão da proteína, ou então avaliar a ligação do factor de transcrição. Isto faz-se introduzindo uma
sequência de oligonucleótidos reconhecidos pelo factor de transcrição, através da técnica de EMSA.
O electrophoretic mobility shift assay (EMSA) também
conhecido como gel-shift ou band-shiftI, é mais útil que o
DNA footprinting para a quantificação de proteínas ligantes
de DNA. em geral a mobilidade electroforética de um
fragmento de DNA é reduzida quando ele é complexado a
uma proteína, causando uma troca na banda do fragmento.
Esta técnica pode ser usada para detectarfactores de
transcrição em fracções proteicas incubadas com um
marcador radioactivo e contendo um conhecido elemento de
controlo. O que se faz é isolar o DNA em cadeia dupla e
medir a sua mobilidade num gel de electroforese; se
incubarmos o DNA com o factor de transcrição eles ligam-se
(se o FT estiver activo), e o complexo terá maior mobilidade.
De seguida podemos incubar uma sonda de DNA com o estrato celular e aplicar estímulos para avaliar a
actididade do factor de transcrição.
No isolamento bioquímico do factor de transcrição, um estrato do núcleo celular é sujeito a vários tipos
sequênciais de cromatografia de coluna. E estas fracções são analisadas por EMSA e posteriormente por
cromatografia de afinidade sequence-specific, com múltiplas cópias de locais de ligação de factores de
93
transcrição associados à matriz. Para finalizar, para certificar de que as proteínas isoladas são de facto
factores de transcrição, a sua habilidade para modular a transcrição é testada in vitro.
Uma vez que o factor de transcrição esteja isolado e purificado a sua sequência de aminoácidos parcial
pode ser determinada e ser usada para clonar o gene ou o cDNA. O gene isolado pode depois ser usado para
testar a habilidade da proteína codificada para activar ou reprimira transcrição num ensaio de transfecção in
vivo.

FORMAÇÃO DA HETEROCROMATINA
Por muitos anos era clara a relação entre os genes inactivos e a heterocromatina, zonas onde o genoma se
encontra mais condensado, nas células eucarióticas. Regiões dos cromossomas perto dos centrómeros e dos
telómeros e regiões adicionais específicas que variam com o tipo celular encontram-se organizadas em
heterocromatina. O DNA na heterocromatina está menos acessível para o acesso de proteínas externas que o
DNA em eucromatina, e por isso é muitas vezes referido como a cromatina fechada.
O mecanismo detalhado para as mudanças estruturais associadas com a transcrição, são chamadas de
remodelação da cromatina, está agora a ser mais bem entendido, incluindo a identificação de uma
variedade de enzimas directamente implicadas no processo. Isto inclui enzimas que modificam
covalentemente o núcleo de histonas do nucleossoma e outras que usam energia química do ATP para
remodelar os nucleossomas no DNA.
A acetilação e desacetilação de histonas são uma figura
predominante no processo de activar a cromatina para a transcrição.
O terminal N das histonas é muitas vezes rico em resíduos de lisina.
Resíduos particulares deste aminoácido são acetilados pelas histona
acetiltransferases (HATs). HATs citosólicas acetilam histonas
recentemente sintetizadas antes destas serem transportadas para o
núcleo. A reunião das histonas na cromatina é depois facilitada por
um vasto número de outras enzimas.
Quando a cromatina esta a ser activada para a transcrição, as histonas nucleossomais são pois acetiladas
pelas HATs nuclear. A acetilação de múltiplos resíduos de Lys no terminal N das histonas H3 e H4,
consegue reduzir a afinidade de todo o nucleossoma. A acetilação pode ainda prevenir ou promover
interacções com outras proteínas envolvidas nos processos de regulação da transcrição. Quando a
transcrição de um gene não é mais necessária a acetilação dos nucleossomas é reduzida pela acção das
histona desacetilases (HDAC), como parte do processo geral de silenciamento de genes, que restora a
cromatina a um estado inactivo de transcrição.

94
REPRESSORES CONSEGUEM DIRECCIONAR A DESACETILAÇÃO DE HISTONAS EM GENES
ESPECÍFICOS
A importância da desacetilação de histonas na cromatina mediando a repressão de genes tem sido muito
suportada por estudos de repressores eucariótas que regulam os genes em posições internas do cromossoma.
Estas proteínas são conhecidas por agirem em parte causando a desacetilação da cauda das histonas nos
nucleossomas que ligam a caixas TATA e regiões próximas de promotores dos genes que elas pretendem
reprimir. Estudos in vitro mostraram que quando o promotor está reunido num nucleossoma com histonas
desacetiladas, os factores de transcrição basais não se conseguem ligar a caixa TATA nem a região de
iniciação. Em histonas desacetiladas, as lisinas do terminal N encontram-se carregadas positivamente e
interagem fortemente com DNA fosfatases. As caudas das histonas desacetiladas também interagem com
octâmeros de histonas vizinhas, unindo a cromatina na forma condensada. O efeito em rede é o que os
factores de transcrição basais não conseguem assimilar no complexo de pré-iniciação num promotor
associado com histonas hipoacetiladas. Pelo contrário, a ligação de factores de transcrição basais são muito
menos por histonas com hiperacetilação da cauda de lisinas, nas quais as lisinas carregadas positivamente
são neutralizadas e as interacções electrostáticas com os fosfatos do DNA são eliminadas.
A ligação entre histonas desacetiladas e a repressão da transcrição na maioria dos promotores da
vizinhança tornou-se mais clara quando o cDNA codificante de uma histona desacetilase humana foi
encontrado e possuía alta homologia com o gene RPD3 de leveduras, conhecido por ser altamente
responsável na repressão de genes nestes organismos.
Trabalhos posteriores mostraram que RPD3 possuía
actividades de desacetilase de histonas. A habilidade
para o RPD3 desacetilar histonas dependia da acção de
duas outras proteínas UME6, um repressor que liga
sequências reguladoras a montante (URS1), e SIN3, a
qual faz parte de um complexo multiproteíco que
também contém RPD3. SIN3 também liga a um
domínio repressor de UME6, posicionando deste modo
RPD3 no complexo para que assim ele possa interagir
com promotores associados a nucleossomas e remover os grupos acetil de histonas.
Todas estas descobertas e mais algumas contribuíram para a elaboração do modelo de desacetilação
dirigida por repressores mostrado na figura. Neste modelo, o complexo SIN3-RPD3 funciona como co-
repressor. Complexos co-repressores contêm desacetilases de histonas também foram encontrados
associados a muitos repressores nas células de mamíferos.

ACTIVADORES CONSEGUEM DIRECCIONAR A ACETILAÇÃO DE HISTONAS EM GENES
ESPECÍFICOS
Estudos genéticos e bioquímicos em leveduras levaram a descobertas de um largo complexo
multiproteíco contendo a proteína GCN5 que possui actividade de acetilase de histonas. Outra subunidade
deste complexo liga-se a domínios de activação acídicos nas proteínas activadoras de leveduras, tais como a
GCN4. A máxima activação da transcrição por parte da GCN4 depende deste complexo de acetilases de
histonas, que assim funciona como coactivador.
O modelo representado na figura é consistente
com as observações feitas de que nucleossomas
perto da região do promotor de um gene regulado
pelo activador GCN4 são especificamente
hiperacetilados. A hiperacetilação de nucleossomas
direccionada por activadores perto da região do
promotor modifica (abre) a estrutura da cromatina
assim como para facilitar a ligação de outras
proteínas necessárias para o início da transcrição.

95
METILAÇÃO DE DNA
Trata-se de outra forma de regulação da transcrição e encontra-se associado à desacetilação das histonas.
Isto porque, em zonas metiladas os genes estão silenciosos; normalmente o nucleótido metilado é uma
citosina, no entanto, a metilação de DNA vai recrutar algumas
proteínas – desacetilases – que vão desacetilar as histonas,
impedindo a transcrição, isto ocorre em sequências de DNA
ricas pares de base G-C que são zonas onde o DNA é mais
compacto. Esta metilação induz a ligação da proteína MeCP2
ao DNA metilado, este complexo “recruta” Desacetilases de
Histonas (HDACs) que inibem a transcrição.

REGULAÇÃO DA ACTIVIDADE DOS FACTORES DE TRANSCRIÇÃO
Até agora temos estudado como é que as combinações de vários factores influenciam a transcrição. Um
gene ser ou não transcrito num determinado tipo celular num dado momento do desenvolvimento de um
organismo é largamente comandado porinteracções entre factores de transcrição e sequências reguladoras.
Agora quais e em que quantidade, os factores de transcrição são expressos, é regulada por múltiplas
interacções regulatórias entre os genes codificantes de factores de transcrição num determinado tipo celular.
Não só a sua expressão como também a actividade destes factores de transcrição são reguladas por
interacções proteicas na superfície de células vizinhas, por acção de hormonas e factores de crescimento.
Em organismos multicelulares, estes sinais são segregados por um tipo celular e afectam células vizinhas
ou noutra zona do organismo. Um grande grupo destes sinais extracelulares compreende péptidos que se
ligam a receptores presentes na superfície da membrana plasmática. A ligação destes sinais a receptores
desencadeia uma série de vias de sinais de tradução no interior da célula.
Aqui vamos estudar apenas o segundo maior grupo de sinais extracelulares, pequenas hormonas
liposolúveis – incluindo esteróides, retinóides e hormonas da tiróide – que se conseguem difundir através da
membrana celular e interagir directamente com os factores de transcrição que elas regulam. Os receptores
intracelulares para estas hormonas liposolúveis pertencem à família dos receptores nucleares, que
funcionam como activadores da transcrição quando ligados ao seu ligando.

RECEPTORES NUCLEARES: FACTORES DE TRANSCRIÇÃO
A clonagem e sequênciamento dos genes codificantes dos receptores nucleares revelaram uma grande
conservação na sua sequência de aminoácidos e três regiões funcionais. Todos eles possuem uma região
única na extremidade N com um tamanho variável. Porções desta região variável funcionam como domínios
activadores em alguns receptores. Os domínios ligadores de DNA localizados ao centro da estrutura
primária possuem um motivo zinc-finger. Os domínios ligadores de hormonas localizados no terminal C
contêm um domínio de activação dependente de hormonas. Em alguns receptores estes domínios funcionam
como repressores na ausência do ligando.

96
SEQUÊNCIAS DE DNA QUE LIGAM OS RECEPTORES NUCLEARES
É a sequência de nucleótidos característica na região de ligação de DNA, chamado elementos de
resposta, que ligam vários receptores nucleares – como já foi referido. A sequência consenso dos elementos
de respostas dos receptores de glucocorticóides(a) e estrogénio(b) são inverted repeats de 6pb por cada 3
pares de bases. As descobertas sugerem que os receptores ligam ao DNA como dímeros simétricos como
aqueles dos domínios zinc-finger.
Alguns elementos de resposta de receptores nucleares, tais como aqueles que ligam vitamina D3,
hormonas tiróides e ácido retinóide, são direct repeats da mesma sequência reconhecida pelos receptores de
estrogénios, separados por três a cinco pares de bases (c - e). a especificidade para responder a estas
diferentes hormonas por ligação de diferentes receptores é determinada pelo espaçamento entre as
repetições.

RECEPTOR GLUCOCORTICÓIDE
O mecanismo de por meio de que as hormonas ligantes controlam a actividade de receptores nucleares
difere entre receptores heterodiméricos e homodiméricos. Os receptores nucleares heterodiméricos
localizam-se exclusivamente no núcleo. Na ausência do seu ligando, eles reprimem a transcrição quando
ligados a locais específicos no DNA. Eles fazem isto por desacetilação directa de histonas e nucleossomas
vizinhos, por mecanismos descritos
anteriormente.
Ao contrário dos receptores heterodiméricos,
os homodiméricos encontram-se no citoplasma
na ausência do seu ligando. Quando a hormona
se liga a estes receptores provoca a sua
translocação para o núcleo. A translocação
dependente de hormonas do receptor de
glucocorticóides (GR) foi demonstrada na
transfecção mostrada na figura. O domínio de
GR que liga as hormonas medeia a sua
transportação. Estudos subsequentes mostraram
que na ausência de hormona, GR encontra-se unicamente no citoplasma como um agregado de proteínas
complexado de proteínas inibidoras. Enquanto o receptor esteja confinado ao citoplasma ele n consegue
interagir com genes presentes no núcleo, e por isso não conseguem activar a transcrição. A ligação da
hormona ao receptor liberta-o das proteínas inibidoras, permitindo-lhe entrar no núcleo, onde ele se pode
ligar a elementos de resposta associados aos genes alvo, isto vai activar a transcrição por interacções com
remodeladores da cromatina, complexos de acetilação de histonas e mediadores.

97
TRADUÇÃO DO RNA
Existe muito menos variedade de nucleótidos (4) do que de aminoácidos (20), o constituinte base das
proteínas, logo daqui concluí-se que uma base não corresponde a um aminoácido, mas o mesmo se passa se
considerarmos que as bases se combinam 2 a 2 (42=16).
No entanto se considerarmos combinações 3 a 3 (43=64)
obtemos um número excessivamente elevado. Isto implica
que pode haver diferentes combinações de nucleótidos que
codifiquem o mesmo aminoácido. O conjunto destes 3
nucleótidos são designados de tripletos ou codões. Por
isso se diz que o código genético é degenerado ou
redundante, porque um aminoácido é codificado por mais
de um tripleto mas não é ambíguo porque um codão
codifica sempre o mesmo aminoácido, além disto é
praticamente Universal o mesmo tripleto codifica o
mesmo aminoácido em quase todas as situações (excluindo
por exemplo parte do genoma mitocondrial e alguns
organismos procariotas).
Esta redundância contudo nem sempre acontece visto
que a Met é sempre codificada pelo codão AUG, que
também é o codão de iniciação, que é sempre o primeiro a ser traduzido. Mas isto não significa que todos os
mRNAs possuam uma sequência AUG no inicio da sua cadeia ou que todas as proteínas possuam Met na
extremidade N. De facto o que se passa é que algures perto do inicio da cadeia do mRNA existe uma
sequência AUG, mas esta pode variar muito a sua posição, e de facto as proteínas no seu estado pré-
operacional possuem uma metionina na extremidade N, contudo durante a maturação pós–traducional esta
metionina pode, ou não, ser clivada.
Existem ainda 3 codões de terminação algures perto da extremidade 3’ do mRNA são eles UAA, UAG,
UGA. A tradução inicia sempre com uma sequência AUG e termina sempre com um codão de terminação.
A iniciação da tradução depende da ligação do mRNA à subunidade pequena do ribossoma e dos tRNAs
responsáveis por interpretar a mensagem. Os ribossomas são ribozimas, ou seja são RNAs com actividade
enzimática e de facto a maior parte do ribossoma é constituído por RNA e uma fracção menor é proteínas, e
este conjunto cataliza a formação de novas proteínas. O rRNA é sintetizado no núcleo e sofre maturação
antes de se juntar às proteínas correspondentes no citoplasma. A subunidade 5S dos ribossomas possui uma
estrutura secundária devido ao emparelhamento de certas zonas da molécula.

98
LOCAL DE SÍNTESE DAS PROTEÍNAS
O local onde as proteínas são sintetizadas depende muito da função e destino final da proteína. Proteínas
secretoras, da membrana dos lisossomas, do retículo (lúmen ou membrana) e do complexo de Golgi são
todas sintetizadas no Retículo Endoplasmático e nos ribossomas
a ele associados. As Proteínas citoplasmáticas, nucleares,
mitocondriais, cloroplastidiais, e peroxissomais são todas
sintetizadas no citoplasma por ribossomas livres (algumas
proteínas dos cloroplastos e das mitocôndrias são sintetizadas
nos próprios compartimentos através do seu próprio material
genético).
Todas as proteínas sintetizadas nos ribossomas do RER têm
uma sequência específica codificada logo na extremidade do
mRNA, imediatamente a seguir ao codão de iniciação na
extremidade 5’. Deste modo o inicio da tradução de todas as
proteínas tem lugar em ribossomas livres no citoplasma,
contudo as proteínas que devem ser sintetizadas no RE possuem
uma sequência sinal na extremidade N, constituída por
aminoácidos hidrofóbicos e um aminoácido básico que
determinam quea síntese deve parar, vai ligar SRP (Signal
Recognition Particle) esta ligação sinal – SRP vai causar uma
mudança conformacional na SRP que faz com que este
complexo seja reconhecido por outras proteínas na membrana
do RE, esta interacção provoca a translocação do ribossoma. Na
membrana do RE formam-se poros (translocões) associados ao
receptor que permitem a entrada da proteína a ser sintetizada
para o lúmen ou incorporadas na membrana. Uma vez no RE a
sequência sinal é clivada por uma peptidase sinal devido à
afinidade que esta tem para uma certa região do sinal. Após a síntese as proteínas necessitam de adquirir a
sua conformação terciária e sofrem modificações pós-traducionais como a clivagem ou glicosilação através
de proteínas típicas do RE. As proteínas são posteriormente transportadas para outros locais intracelulares
ou para o exterior pela acção do tráfego vesicular.

99
tRNAs E EFEITO DE WOBBLE
Os tRNAs são moléculas pequenas com estrutura secundária em folha de
trevo, mantida por pontes de hidrogénio, estas zonas são espaçadas por zonas
onde não ocorrem pontes de hidrogénio e formam-se loops, num destes loops
encontra-se o anticodão que são sequências complementares e antiparalelas dos
codões. Os tRNAs possuem duas zonas muito importantes o anticodão e a zona
do terminal 3’ onde se insere o aminoácido (esta ligação faz-se entre a
extremidade 3’ e o grupo COO- do aminoácido), a cada tRNA só se liga um
aminoácido, codificado pelo anticodão (contudo como iremos ver mais a frente
o anticodão por si mesmo não está envolvido na ligação do aminoácido).
Algumas bases no tRNA encontram-se modificadas, a guanina é muitas vezes metilada e surge a iosina.
E muitas vezes a extremidade 5’ do anticodão encontra-se modificada em inosina, isto porque esta é capaz
de emparelhar com três bases diferentes A, U, C, na posição 3’ do codão. Esta ligação permite poupar
energia (na síntese de vários tRNAs para o mesmo aminoácido) e codões, visto que um anticodão que inicie
com Inosina consegue reconhecer três codões diferentes. Por exemplo o codão GCI pode ligar-se a CGA,
CGU e CGC, todos eles codificam a arginina.
No anticodão quando surge um U na posição 5’, ele é
capaz de se ligar a uma A na posição 3’ do codão, mas
também a uma G! Isto porque no ribossoma o ambiente é
tal que a ligação não é tão rígida (no local A do ribossoma), o contrario também se verifica se se encontrar
G na extremidade 5’ do anticodão, este também liga C ou U na extremidade 3’ do codão. Contudo se na
extremidade 5’ do anticodão existir A ou C a ligação é especifica e segue a regra de Watson. A esta situação
designa-se por efeito de Wobble, ou seja designa a flexibilidade de ligação devido à existência de bases
modificadas e emparelhamento inespecífico.

É por esta razão que não existem 61 tRNAs como foi matematicamente calculado (43 = 64 – 3 codões
STOP =61), mas sim cerca de 30.
Estas ligações não são tão fortes quanto os emparelhamentos de Watson e Crick mas isso é bom visto que
ajuda a que o tRNA se desligue mais rapidamente do ribossoma aumentando com isto a velocidade de
síntese. Caso a ligação fosse forte formar-se-iam estruturas mais estáveis e a velocidade do tRNA se
desligar do mRNA no ribossoma seria menor.
Assim a partir de uma sequência de aminoácidos, não podemos saber bem qual a sequência de
nucleótidos que lhe deu origem, porque o código é um processo degenerado (à excepção da Met e do Trp).

100
LIGAÇÃO DE AMINOÁCIDOS AO tRNA CORRESPONDENTE
A ligação do aminoácido ao tRNA faz-se através de enzimas chamadas aminoacil-
tRNA sintetases e existem tantas destas enzimas quanto tRNAs existirem. Como
vimos anteriormente (pag. 79/80) o tRNA após ser sintetizada sofre um processo de
modificações e uma dessas modificações é a adição de uma sequência CCA na
extremidade 3’ que vai ligar o aminoácido.
Para ocorrer a ligação do aminoácido é necessário que primeiro ocorra a activação
deste, ligando-se a cAMP transferido do ATP que se vai ligar à zona COOH do
aminoácido.

Existem duas classes de aminoacil-tRNA sintetases que promovem a ligação do aminoácido ao tRNA de
diferentes maneiras mas sempre no terminal 3’. A ligação faz-se sempre entre o grupo COOH do
aminoácido e a adenina na extremidade 3’ do tRNA, pode é no entanto ocorrer a ligação com o grupo OH 2’
(tipo I) ou 3’ (tipo II) da ribose. O AMP facilita a ligação. No caso da ligação se dar ao grupo Oh 2’ há
posteriormente uma transesterificação que transfere o aminoácido para a posição 3’. O facto da ligação ser
feita pelo terminal COOH determina o modo como se produz a ligação peptídica e qual a extremidade da
proteína que é sintetizada primeiro (N).

101
ESPECIFICIDADE DAS AMINOACIL-tRNA SINTETASES
A aminoacilação do tRNA é acompanhada por dois finais: (1) identificação e activação do aminoácido e
(2) ligação do aminoácido a um adaptador de tRNA que assegura o posicionamento correcto no polipéptido
em crescimento. A identidade do aminoácido não é revista no ribossoma, por isso a ligação do aminoácido
correcto ao tRNA é essencial para a fidelidade na síntese proteica.
A discriminação entre dois substratos enzimáticos muito semelhantes tem sido estudada em detalhe no
caso da Ile-tRNA sintetase, capaz de distinguir entre valina e isoleucina, aminoácidos que diferem apenas
num grupo metil (-CH2-).

DIRECÇÃO DA SÍNTESE PROTEICA
A síntese proteica inicia-se no terminal amínico e
processa-se pela adição de aminoácidos até ao terminal
carboxílico tal como determinado por Howard Dintzins em
1961. Ele elaborou uma experiência onde reticulócitos que
transcrevem activamente hemoglobina eram incubados num
meio com leucina radioactiva. Amostras de cadeias α
completas foram isoladas dos reticulócitos a vários intervalos
de tempo e a sua radioactividade determinada. As zonas a
vermelho forte mostram as porções das cadeias completas da
α-globina que contêm resíduos de Leu radioactivos. Após 4
minutos apenas alguns resíduos do terminal carboxílico se
encontravam marcados sendo que o resto da cadeia possuía resíduos normais de Leu. Com tempos de
incubação mais longo, havia sucessivamente mais porção das cadeias marcadas com radioactividade,
sempre num bloco a partir da extremidade COOH. Assim a extremidade não rotulada, o terminal amínico,
era de facto a extremidade iniciadora, o que significa que o polipéptido cresce por adições sucessivas de
aminoácidos ao terminal carboxílico.

INICIAÇÃO DA TRADUÇÃO
A tradução nos procariotas tem inicio na sequência de
Shine-Delgarno, esta localiza-se no mRNA a montante do
codão de iniciação, a sequência é bastante conservada e surge
na extremidade 5’ esta a porção do mRNA localizada antes do
codão de iniciação é chamada de porção 5’UTR, a porção do
mRNA para além do codão STOP é chamado a porção 3’UTR.
A sequência Shine-Delgarno é complementar de uma
sequência do rRNA 16S à qual se liga inicialmente. Em
eucariotas as modificações sofridas durante a maturação do
mRNA, como a cauda de poli(A) ou o 5’cap com a Guanina
metilada são essenciais para que ocorra a ligação deste à
subunidade 40S do ribossoma, dado que estes não possuem
sequência Shine-Delgarno.
102
Em eucariótas a ligação do mRNA faz-se por
interacção com as extremidades deste e varias proteínas
como a eIF4E que se liga a extremidade 5’ do mRNA e a
PAB que liga a cauda de poli(A). A proteína eIF4G faz a
ligação entre a eIF4E e a PAB, permitindo a ligação do
mRNA à subunidade pequena do ribossoma, outras são as
proteínas que também intervêm como a eIF3 ou a eIF4F.
A eficiência na tradução varia com vários aspectos
desde o complexo até às modificações do mRNA como a
cauda de poli(A) que, geralmente, quanto maior melhor.
Nos procariotas a sequência Shine-Delgarno tem uma
distância tal no mRNA que faz com que o codão de
iniciação fique logo posicionado para que se dê o inicio
da tradução. Contudo os eucariotasnão possuem esta
sequência e o posicionamento faz-se por scanning do
mRNA até encontrar o primeiro codão AUG, pensa-se que este scanning seja promovido pelo complexo
eIF4e que liga a extremidade 5’.
Em eucariotas existe ainda a sequência de Kozak (sequência AAC antes do codão de iniciação e um C
imediatamente após) que facilita a localização do codão de iniciação pelo ribossoma facilitando com isto a
tradução. Esta sequência não é obrigatória mas facilita a síntese.

Ao contrario da ligação do mRNA a síntese proteica em eucariotas e
procariotas é muito semelhante. Os ribossomas possuem dois locais
distintos, Local A zona do ribossoma onde se encontra o codão a ser
traduzido e no qual se dá a ligação dos tRNAs, e o Local P que é a zona
onde se encontra o polipéptido em crescimento. Quando o mRNA se liga
ao ribossoma o codão de iniciação fica localizado na zona P, e o tRNA
para a metionina inicial liga-se nesta posição (é o único caso em que isto
acontece). Existem duas proteínas muito importantes no início da tradução,
a IF3 e IF1, a IF3 liga-se à subunidade pequena do ribossoma e impede que
a subunidade se ligue a esta, porque antes de se formar um ribossoma
funcional o tRNA cujo anticodão é complementar de AUG é ligado. O
codão AUG codifica sempre parara metionina, contudo existem dois
tRNAs para esta com o anticodão CAU, isto porque um desses tRNAs é
especifico para a primeira metionina a ser inserida no inicio da tradução
enquanto que o outro tRNA transporta a Met que serão inseridas noutras
partes da cadeia.
A molécula de tRNA iniciadora é transportada pela IF2 que liga GTP e
que direcciona o tRNA ao codão AUG. A hidrolise de GTP promovida
pela IF2 faz com que IF1 e IF3 se desliguem a subunidade pequena e que
ela própria se desligue do tRNA ligado ao codão de iniciação. Esta
dissociação permite a formação do ribossoma funcional por ligação da
subunidade maior, e com este surge também o local E (Exit) por onde saem
as moléculas de tRNA já utilizados e sem aminoácidos ligados.
Inicia-se agora a segunda fase da tradução: o Alongamento. É
necessário agora que já temos a metionina iniciadora que se liguem mais
tRNAs com os restantes aminoácidos, essa ligação faz-se por
complementaridade entre o codão no Local A e o anticodão do tRNA
complementar. O transporte dos outros tRNAs todos é promovido pelo
factor de alongamento TU (EF-TU), estas são proteínas procarióticas, mas
como nos eucariotas esta fase é semelhante limitar-nos-emos ao estudo dos
103
procariotas. Tal como a IF2 também a EF-TU necessita da hidrólize de
GTP para promover o transporte de tRNAs, depois da hidrólise, ela
deixa de ligar tRNAs e tem de ser regenerada (troca de GDP por GTP),
esta regeneração é facultada por outros factores de alongamento, as
proteínas T (EF-TS).
No final surgem dois aminoácidos lado a lado no ribossoma
associados aos seus tRNAs pelo grupo COOH, para que se forme a
ligação peptídica, o grupo NH3 do aminoácido na posição A liga-se ao
grupo COOH do aminoácido na posição P (ataque nucleofílico), e o
aminoácido na posição P fica “por cima” do aminoácidos da posição A,
esta reacção é catalizada pelo ribossoma, mais propriamente pelo
rRNA.
Para que se possa continuar a síntese é necessário desocupar a
posição A para ser ocupada por outro tRNA transportado pela EF-TU
que entretanto já se renovou. Isto implica que haja uma translocação do
ribossoma em relação ao mRNA, este movimento é da
responsabilidade do EF-G que também promove a hidrólize de GTP.
Depois da translocação o local A fica livre, há transporte do tRNA e
tudo recomeça.
O processo continua até que na posição A surja um codão STOP,
que n realidade funciona como tal porque não existem tRNAs com
anticodões complementares para este. Deste modo algumas proteínas
(proteínas RF – Releasing Factors) vão-se ligar aos codões STOP e
hidrolizam a ligação entre a proteína e o tRNA do ultimo aminoácido;
por outro lado o mRNA desliga-se do ribossoma, e este dissocia-se nas
duas subunidades que o compõem.
A síntese proteica decorre no sentido NH3 COOH, o terminal
NH3 corresponde à metionina, mas depois pode ser removida.

Em bactérias a subunidade 50S (grande) possui rRNA do tipo 5S e 23S;
é a 23S que é responsável pela formação da ligação peptídica (ataque
nucleofílico). O Ribossoma é por isso uma ribozima, e as proteínas do ribossoma asseguram a localização
correcta das moléculas que intervêm no processo.
104
CUSTO ENERGÉTICO DA TRADUÇÃO
A síntese proteica é um processo que consome muita energia. A ligação do aminoácido ao tRNA implica
gasto de ATP no processo de activação, é portanto necessário uma molécula de ATP por cada aminoácido
ligado. Depois por cada aminoácido que se ligue ao péptido em síntese gasta-se uma molécula de GTP
(gasto no transporte do aminoácido), além destes dois processos também há gasto de energia por hidrólize
de GTP cada vez que o ribossoma se desloca no mRNA (translocação).
O ribossoma não possui muitos mecanismos revisores da síntese proteica , no entanto quando a TU
transporta o tRNA, a ligação peptídica acontece apenas após a hidrólise de GTP, é um processo que leva
tempo e que permite a dissociação do tRNA caso não seja complementar do codão mRNA.
Isto garante alguma fidelidade na síntese proteica, porque neste intervalo de tempo os tRNA mal
emparelhados podem sempre dissociar-se.

READING FRAMES
Uma molécula de mRNA pode ser lida de 3 maneiras diferentes, consoante a pauta de leitura formam-se
proteínas diferentes, o que determina qual a pauta de leitura é o codão de iniciação, os ORF (open reading
frames) são as pautas de leituras lidas a partir do codão de iniciação.

mRNA PROCARIOTA POLICISTRÓNICO
Nos procariotas existem conjuntos de genes que são regulados conjuntamente sob a influência de um
único promotor (operões já estudados), surge assim, aquando da transcrição destes genes, uma molécula de
mRNA policistrónica codificante de várias proteínas; nos
eucariotas o mRNA é monocistrónico codificando apenas uma
proteína. Por isso, para que o DNA policistrónico seja usado na
tradução é necessário que a montante de cada zona codificante
exista uma sequência de Shine-Delgarno para cada uma das
proteínas codificantes. Isto é, se o mRNA codificar para 3
proteínas então ele liga-se simultaneamente de três maneiras
diferentes a três ribossomas. Mas isto apenas é possível em procariotas
dado que a ligação dos ribossomas se dá por reconhecimento de uma
sequência no meio da cadeia de mRNA, nos eucariótas tal já não é possível
visto que a ligação do mRNA ao ribossoma se faz por reconhecimento das
duas extremidades formando uma espécie de circulo que começa a ser lido
pela extremidade 5’, pelo que só permite o reconhecimento de um codão de
iniciação, o que é incompatível com o mRNA policistrónico.
Contudo um mRNA eucariota pode ser lido simultaneamente por
vários ribossomas já que um deles reconhece os locais e depois desliza
sobre o mRNA deixando as extremidades livres para novo
reconhecimento. A este sistema chamam-se polissomas vários
ribossomas envolvidos na tradução de uma molécula de mRNA ao
mesmo tempo.
Nos procariotas a transcrição e tradução estão muitas vezes acopladas,
devido a ausência de núcleo; um mRNA que é produzido pode ser logo
usado na tradução, porque é transcrito no sentido 5’ 3’ deixando logo
livre a extremidade 5’ para a tradução.
A maior parte dos antibióticos o que fazem é inibir a síntese proteica
procariótica não afectando por isso os organismos eucarióticos, dado às
diferenças no inicio de cada uma, à diferença significativa entre os
ribossomas eucarióticos e procarióticos e factores de iniciação.
Por exemplo a Puromicina termina precocemente a síntese proteica,
105
pois possui uma estrutura semelhante ao terminal 3’ do aminoacil-tRNA,
simulando um tRNA com um ligando (simula o grupo NH3 do aminoácido).
Assim a Puromicina vai-se ligar à posição A do ribossoma,dando-se um
ataque nucleofílico desta ao COOH do aminoácido na posição P.
eventualmente a Puromicina desliga-se do local A formando-se uma proteína
incompleta com Puromicina na extremidade.

MODIFICAÇÕES PÓS-TRADUCIONAIS
Após a tradução as proteínas sofrem modificações de modo a se tornarem funcionais, muitas destas
ocorrem no RE. Uma das modificações que elas sofrem é o correcto enrolamento da proteína de forma a
obterem a estrutura terciária / conformação funcional, esta estrutura vai ser mantida por interacções entre os
grupos laterais dos aminoácidos. Assim a estrutura terciária depende essencialmente da estrutura primária
(ou seja da sequência de aminoácidos), no entanto a maior parte das proteínas necessita de ajuda de outras
proteínas para adquirir a estrutura terciária, estas proteínas auxiliares chamam-se Chaperons.
As chaperonas estabilizam proteínas que ainda não adquiriram estrutura terciária, é um processo que
depende de ATP e no fim da aquisição da estrutura, as chaperonas libertam-se, muitas destas proteínas
(chaperonas) são chamadas de Heat Shock Proteins (Hsp). Nalguns casos a estabilização parcial da estrutura
é suficiente para que esta, depois, se enrole correctamente, mas noutros casos é necessário que se promova o
enrolamento total e nestes casos surge um outro tipo de chaperonas – as Chaperoninas – que formam uma
estrutura em barril no interior da qual se ocorre o enrolamento da proteína (ex: actina). Isto porque no
interior há condições “ambientais” que facilitam o processo, é também um processo dependente de ATP.

Existem chaperonas no citoplasma e outras (diferentes) no RE, assim uma proteína do retículo à qual foi
retirado a sequência sinal e portanto seja sintetizada no citoplasma não vai ser correctamente enrolada e
portanto não vai ser funcional, porque n existem no citoplasma as chaperonas correctas que promovam o
enrolamento funcional desta proteína.
106
GLICOSILAÇÃO DE PROTEÍNAS
Ocorre em proteínas da membrana e extracelulares que são produzidas no RE, a função destes açucares é
o reconhecimento entre células, o enrolamento das proteínas e o endereçamento (algumas proteínas têm o
seu destino marcado devido à adição de açucares como as proteínas dos lisossomas.
Existem dois tipos de glicosilação: N-
Glicosilação (surge no primeiro aminoácido de
Aspargina), ocorre no RE, e acontece quando
temos uma sequência do tipo: Asn – X- Ser ou
Asn – X – Thr, é o tipo de glicosilação mais
comum e é promovido por uma enzima do
retículo. Geralmente encontra-se ligado a esta o
açúcar N-acetil glucosamina, no retículo
encontra-se também muito o açúcar manose pelo
que às enzimas glicosiladas é-lhes
frequentemente adicionado este açúcar que
depois sofre modificações no Complexo de
Golgi, transformando a Manose em glicose ou
outros. Assim a N-Glicosilação começa no RE
mas só termina no Complexo de Golgi. O outro
tipo de glicosilação é O-glicosilação que liga os
açucares ao grupo OH da primeira Serina; o
açúcar é normalmente a N-acetil galactosamina, esta adição ocorre sempre e apenas no Complexo de Golgi.
No citoplasma as proteínas nunca são glicosiladas porque a enzima responsável por esta transferência é
exclusiva do lúmen do retículo, se por acaso se tratar de uma proteína que se destine à membrana do RE
então a glicosilação só pode ocorrer na face intraluminal.

ADIÇÃO DE LÍPIDOS
Pode ocorrer em proteínas citoplasmáticas, a principal função desta adição poderá ser anexar as proteínas
à membrana plasmática, sem que tenham um domínio transmembranar, permitindo a ligação à membrana
pelo interior. O aminoácido normalmente envolvido nesta ligação é a Cys, que tem um grupo SH, que pode
estar no terminal COOH.
Existem três formas de adição directa de lípidos às proteínas: Palmovil, Miristil e Prenil. Estas adições
variam de acordo com o grupo lipídico adicionado, mas são todas elas intramembranares . Contudo também
existem proteínas extracelulares com modificações lipídicas. Estes lípidos são adicionados no RE
(normalmente há adição de fosfatidilinositol que se encontra ligado à poteína por um açúcar (Gal, Nac, e
107
Manose), deste modo estas proteínas sofrem dois
tipos de modificações diferentes. Assim a
glicosilação ocorre no sistema endomembranoso e
a adição de lípidos ocorre tanto em proteínas
citoplasmáticas como do sistema
endomembranoso. Estas proteínas são chamadas
âncoras de GPI (Glucosil-FosfatidilInositol).
A glicosilação ou a adição de lípidos são dois
tipos diferentes de modificações irreversíveis mas
também ocorrem modificações reversíveis, estas
são de facto até mais frequentes, destas a mais
frequente é a fosforilação, que tem um papel
regulador da actividade proteica ao contrário das
modificações anteriores que têm uma função mais
estrutural.
A fosforilação dá-se por adição de grupos
fosfato, o fosfato no entanto não pode ser
adicionado a qualquer aminoácido, só podendo
ser, por isso, ligado a grupos OH em cadeias
laterais de resíduos de aminoácidos de Serina, Treonina e Tirosina. A fosforilação é promovida por cinases
de serina e treonina e a desfosforilação é feita por fosfatases de Serina/Treonina. A fosforilação altera a
função de uma proteína pois pode ser que com a adição de cargas negativas a um aminoácido neutro a
proteína altere (aumente ou diminua) a sua actividade ou altere capacidade de interacção com outras
proteínas.
Para a tirosina também surgem cinases e fosfatases, isto porque a serina e a treonina são muito
semelhantes e por isso pode haver uma classe de enzima para ambas, mas o mesmo já não se pode dizer
para a tirosina (embora existam alguns tipos de proteínas capazes de fosforilar os 3 aminoácidos). De notar
que nem todas as proteínas são susceptíveis à fosforilação.

Por exemplo a cinase A (PKA)é uma enzima cinase ubíqua, sendo activada na presença
de elevadas concentrações de cAMP (mensageiro intracelular). Esta cinase é tetramérica,
possuindo subunidades catalíticas e reguladoras; na presença de cAMP, ele liga-se às
subunidades reguladoras, promovendo a dissociação e activação das subunidades
catalíticas. Existem muitas enzimas substrato da PKA: glicogénio sintetase, fosforilase b
cinase, histonas, fosfatases… Podemos estabelecer a sequência consenso da fosforilação
da PKA: surgem aminoácidos básicos (Arg e Lis) perto da Serina e Treonina, tornando-se
a proteína um bom substrato. Sabendo esta sequência podemos prever locais de
fosforilação. Existem outras cinase s cujo requerimento a nível da sequência consenso é
completamente diferente.

108
TEMPO DE VIDA DAS PROTEÍNAS
Existem proteínas com tempo de vida muito curtos (minutos) e
outras com tempo de vida muito elevados (dias). Sabe-se que o
aminoácido no terminal NH3 está directamente associado com o
tempo de vida, mas não se sabe bem como. A Met, Gly, Ala, Ser,
Thr e valina são aminoácidos estabilizadores conferindo uma maior
longevidade à proteína. A maioria dos outros(Ile, Gln, Tyr, Glu,
Pró, Leu, Phe, Asp, Lys e Arg) são destabilizadores.
A degradação das proteínas pode ocorrer nos lisossomas
sobretudo para as proteínas membranares e dos sistema
endomembranoso que são proteínas com tempos de vida longo, mas
não é um processo regulado.
Existe um outro processo mais regulado. A degradação de proteínas nos proteossomas, que são
conjuntos de proteínas (proteases) organizados num complexo; as proteínas que são aí degradadas possuem
um sinal que as marca para a destruição, esse sinal é a Ubiquitina ligada. A ubiquitina é uma proteína de 76
aminoácidos que se liga às proteínas marcando-as para a degradação no proteossoma. A ligação desta à
proteína faz-se sempre através de uma Lys presente na sequência da proteína a degradar. Existem três
famílias de proteínas envolvidas na ubiquitinação E1, E2 e E3.
A família E1 liga-se à Ubiquitina (enzima activadora da ubiquitina), depois
há transferência para E2 e depois para E3que transfere a ubiquitina da E2 para
a proteína alvo. Existem vários ciclos de ubiquitinação, já que as proteínas a
serem degradadas no proteossoma têm que ter 4 ubiquitinas ligadas
(poliubiquitinação).
No processo a proteína alvo entra no proteossoma e dá-se a degradação da
proteína com reciclagem da ubiquitina. Isto permite regular o tempo de vida,
como por exemplo a passagem das etapas no ciclo celular depende da
ubiquitinação das proteínas (proteínas associadas; quando se dissociam pode
ser exposto um local susceptível à ubiquitinação).
Ainda não é conhecida nenhuma sequência de aminoácidos que determina a
ubiquitinação como ocorria com a fosforilação.

109

BIBLIOTECA DE cDNA
Até agora sempre que se falou de técnicas de Biologia Molecular partiu-se do principio que já se
conhecia a sequência do gene a utilizar. Mas e se pretendermos estudar um gene ou porção dele que ainda n
tenha sido estudado e por isso se desconheça a sua sequência? Como se procura e encontra o cDNA
codificante de proteínas de interesse cujos genes ainda não são conhecidos?
Hoje e cada vez mais com a sequênciação do genoma de tantos organismos diferentes torna-se cada vez
menos frequente esta prática. De facto hoje a primeira coisa a fazer-se é uma pesquisa da sequência do gene
ou do cDNA numa base de dados disponível na Internet.
Para a replicação do gene necessitamos não do gene em si mas da sequência de DNA complementar do
mRNA (cDNA) que codifica a proteína em estudo. O cDNA difere do gene porque não possui intrões. É
importante conhecer o gene que dá origem a uma proteína para sabermos como é a expressão desta e como
pode ser controlada, mas quando se quer apenas expressar uma proteína (por clonagem, p.e.) convém ter o
gene sem intrões, ou seja o cDNA.
Assim, se se quer produzir cDNA a partir do mRNA presente num determinado tipo de células é
necessário escolher uma população de células onde o mRNA pretendido exista com alguma abundância.
Não podemos pegar uma célula qualquer do corpo do organismo.
Uma biblioteca de cDNA é um conjunto de clones representativo de todo o mRNA de um conjunto de
células, a dada altura do desenvolvimento. E para o desenrolar deste processo parte-se do conjunto de
moléculas de cDNA correspondentes a todas as células de mRNA presentes neste tecido numa dada altura,
criam-se todas estas moléculas de cDNA a partir de transcrição reversa. Assim a construção de uma
biblioteca envolve os seguintes passos: Construção e Rastreio
Construção:
• Extracção do RNA total (Tecido – ter em atenção qual)
• Isolamento do mRNA
• Síntese do cDNA em cadeia dupla
• Ligação a um vector (bacteriófago l)
• Infecção de células hospedeiras (E. coli)

Deste modo começa-se por se isolar o RNA total da célula e depois
extrai-se o mRNA do RNA total, por cromatografia de afinidade que
tira partido da cauda de poli(A) para distinguir entre mRNA e os outros
tipos de RNA. Colocando oligonucleótidos com sequência de timinas
na matriz da coluna de cromatografia, este liga a cauda de poli(A) e
deixa todos os outros RNAs passar, ficando do o mRNA retido. Depois
para desligar o mRNA da resina da coluna da cauda de poli(A)
aumenta-se o pH na coluna por utilização de uma solução com muito
sal.
Depois de isolar os mRNA presentes nas células é necessário por
transcrição reversa transformar estes em cDNA de modo a poder
utilizá-los na biblioteca. Para isso pode-se novamente tirar partido da
cauda de poli(A) e usar como primer um oligonucleótido de timina, não
esquecer que as transcriptases são DNA polimerases e por isso
necessitam de um primer. Assim ficamos com uma cadeia de DNA em
cadeia simples híbrida com uma molécula de RNA. Mas como a
ligação do cDNA a um vector tem de ser feito com uma cadeia de
DNA de dupla hélice temos de destruir a cadeia de RNA. Podemos
fazê-lo pelo uso de RNAses ou de alkali, que corta a cadeia de RNA e
apenas a cadeia de RNA em pequenos fragmentos, que se vão desligar da cadeia de DNA. Estes pequenos
fragmentos vão ser úteis porque podem depois ser usados como primers na amplificação deste fragmento.
Assim fazemos PCR para ampliar esta cadeia, mas usamos DNA polimerase I de modo a garantir que
depois da síntese os oligonucleótidos de RNA são retirados.
110
É contudo necessário depois ligar estes cDNA a sequências de restrição de modo a poder ligá-los a
vectores de clonagem. Então é necessário ligar sequências de restrição em ambas as extremidades do nosso
cDNA, isto consegue-se usando cadeias duplas
contendo a sequência de restrição e DNA ligase do
bacteriófago T4 que é capaz de juntar cadeias de DNA
em dupla hélice “blunt-ended”. Embora este tipo de
reacção não seja muito eficaz nós podemos aumentar a
sua eficiência usando uma elevada concentração de
ligandos. As cadeias resultantes são então tratadas com
uma enzima de restrição dando origem a moléculas de
cDNA com sticky ends. O passo final da construção da biblioteca é a ligação destes pedaços de cDNA ao
vector de clonagem (plasmídeo ou vector viral) que já foi anteriormente tratado com a mesma enzima de
restrição e portanto possui sticky ends complementares.
O uso de bacteriófagos como vectores de clonagem torna esta técnica mais eficiente do que o uso de
plasmídeos. Por isso usamos o bacteriófago λ ao qual ligamos o nosso cDNA, inserindo-o por
complementaridade dos sticky ends do cDNA a clonar e o genoma do vírus. Depois de se ligar o cDNA ao
DNA viral há que se construir um vírus eficiente para que possa infectar as bactérias. Para isso adiciona-se
num tubo de ensaio o DNA viral modificado e as proteínas que compõem a cápsula viral e elas organizam-
se automaticamente para formar a cápsula.

No final juntamos estes vírus funcionais a uma caixa de petri com bactérias em cultura. Estas vão ser
infectadas pelos vírus e vão-se replicar juntamente com os vírus, formando colónias de bactérias infectadas
de vírus (cada bactéria só é infectada por um vírus, e devido a elevada eficiência destes mais de 90% dos
vírus infectam pelo menos uma célula). Mais tarde, devido ao elevado número de vírus (produzidos por
ciclo lítico) dentro das células, elas rebentam e espalham os vírus, as zonas da colónia rebentada chamam-se
placas fágicas.

111
O ciclo lítico de um vírus consiste na produção
de mais cópias de si mesmo, isto é possível
porque o genoma viral natural, assim coo o
utilizado, têm sequências que codificam proteínas
para a cabeça e cauda do invólucro do vírus. O
vírus quando infecta bactérias pode integrar o seu
genoma no genoma hospedeiro e reproduzir-se
com a bactéria (ciclo lisogénico) ou então pode
tirar partido da maquinaria celular e começar a
produzir várias cópias de si mesmo, (replicar,
transcrever e traduzir o seu genoma) – ciclo lítico
– o elevado número de cópias geradas por este
processo acabam por rebentar com a célula.
Assim dado que cada bactéria é apenas
infectada por um vírus, criam-se placas fágicas
(clones) resultantes de apenas uma bactéria mãe,
ou seja temos numa placa fágica varias cópias de um cDNA inserido. E em cada placa fágica existe um
cDNA diferente pois derivam de vírus diferentes com diferentes cDNAs introduzidos.
Mas agora temos uma mistura de vírus, DNA viral e cDNA para várias proteínas, como fazemos o
rastreio?
Primeiro o que temos de fazer é transferir uma amostra de
todas as placas fágicas para uma membrana, de modo a
podermos manipulá-las sem danificar toda a placa. Assim
coloca-se um filtro de nitrocelulose a cobrir as placas fágicas,
e parte destas vai ser transferido para a membrana; a partir
daqui trabalharemos sempre com esta membrana. De seguida
pegamos na membrana a incubamo-la numa solução alcalina
de forma a provocar a lise de todos os vírus e libertar o seu
material genético.
Depois de extraído, a membrana é incubada a altas
temperaturas de forma a desnaturar as cadeias de DNA em
dupla hélice e é hibridizada com uma sonda marcadacom
fosfato radioactivo ou com fluorescência. Esta sonda possui
uma sequência complementar a uma zona do cDNA a
detectar, por isso ela apenas se vai ligar ao nosso DNA,
deste modo através da técnica de autoradiografia podemos
detectar qual a zona marcada radioactivamente na membrana
de celulose, e por correspondência sabemos qual a placa
fágica que possui o cDNA que nos interessa. Agora podemos
ir buscar o nosso cDNA directamente à placa e utilizá-lo para
os mais diversos fins.
Mas se um dos objectivos desta técnica é descobrir qual a
sequência de DNA que dá origem a uma proteína como
construímos nós uma sonda complementar? É possível produzir uma sonda complementar se se conhecer
uma sequência parcial do nosso cDNA, nesse caso sintetizamos um oligonucleótido complementar, caso não
se conheça nenhuma sequência parcial podemos sempre tirar partido de informações anteriores, caso seja
cDNA codificante para um factor de transcrição ou uma proteína de determinada família que possua uma
região conservada, podemos tirar partido disto e construir uma sonda complementar a esta zona conservada.
Imaginando que se trata de uma proteína bastante conhecida em outros organismos como a actina, se
estivermos a estudar a actina de Capivara podemos sempre fazer uma sonda partindo da sequência
conhecida de actina de ratinho porque elas não hão-de variar muito.
112
Caso não se tenha qualquer destes conhecimentos, a hipótese que nos resta é sequênciar a proteína em
estudo e tentar criar uma sonda tendo como base a sequência da proteína. Temos, no entanto, de ter vários
aspectos em atenção: o código genético é degenerado pelo que um aminoácido pode ter sido originado a
partir de vários codões e não sabemos ao certo qual deles foi. Por isso escolhemos uma zona em que a
variabilidade de codões possível seja menor. E é também conveniente ter em conta a frequência de codões
utilizado por aquela espécie. Se à partida já sabemos que em 80% dos casos a Capivara utiliza o codão CCA
para codificar Prolina então usamos esse mesmo codão na nossa sonda pois é mais provável que seja esse o
correcto. No caso de construirmos a sonda através da sequência de aminoácidos da proteína temos muitas
vezes de construir mais de uma sonda devido às várias possibilidades de sequências do cDNA. Por isso
também convém escolher um local e uma sequência que não seja muito variável, pois isso iria dar mais
trabalho e dispêndio de dinheiro, assim como podia não ser específico.

Depois de sintetizar a sonda e de a marcar radioactivamente podemos utilizá-la como descrito
anteriormente. Em mais pormenor:

SEQUÊNCIAÇÃO DE GENES
Depois de localizados os vírus que contêm o cDNA que nos interessa vamos isolar o cDNA e sequenciá-
lo de modo a podermos obter a sequência de aminoácidos (caso ainda n se conheça) e a identidade da
proteínas, ou apenas para saber a sequência de nucleótidos a fim de podermos utilizar esta informação em
trabalhos posteriores como clonagem ou organismos transgénicos.
O método mais utilizado nesta sequênciação é o método de Sanger.
Este faz uso de um primer (convém saber qualquer coisa sobre o
fragmento a sequênciar, ou então caso se faça esta técnica com o uso de
vírus também podemos utilizar um primer complementar de ao DNA
viral na zona de inserção do cDNA), e de ddNTPs marcados. Fazem-se
4 reacções em tubos de ensaio diferentes, onde se coloca o DNA, DNA
polimerase e dNTPs normais, contudo também se adicionam dNTPs
modificados, ou seja ddNTPs. Estes possuem uma alteração no grupo
OH 3’, que é substituído por um H (pára a transcrição), e encontram-se
marcados com fluorescência.
Assim no primeiro tubo coloca-se para além dos 3 componentes
principais (DNA, DNA polimerase e dNTPs) coloca-se também
ddGTP, deste modo, dado que este não possui o grupo 3’OH, a
transcrição pára quando este é adicionado. Nos outros tubos adiciona-
se o mesmo mas e em cada um deles um ddNTP diferente.
113
Assim a cada adição de um ddNTP a transcrição
pára, o que se passa no 1º tubo é ilustrado na figura ao
lado, a cada adição de G modificada a transcrição pára
e assim formam-se várias moléculas de vários
comprimentos. A presença de G não modificadas em
maior quantidade permite que estas também sejam
adicionadas e deste modo a transcrição não parar
sempre no primeiro nucleótido de G. Com isto vão
haver cadeias que pararam a sua síntese na 1ª G, outras
que interromperam na 2ª, e assim sucessivamente até
há aquelas que foram até ao final sem serem travadas.
Depois das várias cadeias serem sintetizadas corre-se em
electroforese por tamanho molecular, as moléculas mais
pequenas (aquelas que foram travadas no inicio) correm
mais no gel porque são mais pequenas, enquanto as maiores
correm menos porque são maiores e não passam tão bem
nos poros. Assim a cadeia que se deslocar mais será aquela
que parou logo no primeiro nucleótido a seguir ao primer a
que estiver imediatamente acima desta terá parado a sua
síntese, muito provavelmente, no segundo nucleótido e
assim sucessivamente, como mostra a figura. Neste caso
foram feitas 4 reacções diferentes para cada um dos
nucleótidos diferentes em quatro tubos separados e
correram-se em diferentes poços na electroforese. Nestes
casos é mais comum marcar os ddNTPs radioactivamente
do que com marcadores fluorescentes, a leitura faz-se da mesma
maneira – consoante a posição relativa de cada banda no gel.
Podemos por vezes encontrar bandas mais intensas que outras, isso
depende do número de cadeias que foram travadas naquela posição.
Atenção para fazer a separação de fragmentos de DNA que variam tão
pouco (diferenças de 1 nucleótido por vezes) tem de se usar um gel de
poliacrilamida.
Notar que esta técnica tem de ser feito com o DNA em cadeia
simples, ou seja, depois de sintetizar as cadeias é necessário submetê-
las primeiro a um processo desnaturante.
Mas e se o que queremos sequênciar é um fragmento muito
grande? E se as diferenças entre as bandas forem tão pequenas que
não sejam fáceis de distinguir qual está primeiro e qual está depois?
Para isso usa-se sequênciação automática, e marcam-se os ddNTPs
com fluorescência (neste caso n pode ser por radioactividade), mas
pode-se fazer ocorrer todas as reacções no mesmo tubo se ensaio juntando todos os ddNTPs. Após a síntese
estar completa desnaturam-se as moléculas e procede-se uma electroforese capilar que tem muito mais
sensibilidade para as diferenças no tamanho das moléculas, além disso utilizam-se leitores a lazer que
detectam com tamanha precisão variações na absorvância (cor) das bandas e possibilitam uma leitura mais
eficiente - electrofluorograma. Onde cada pico corresponde a um nucleótido, o tamanho dos picos variam
com a concentração de moléculas daquele tamanho. A leitura faz-se da esquerda(5’) para a direita (3’).

114
BIBLIOTECA GENÓMICA
No caso de se pretender obter o gene tal e qual ele existe no núcleo, com intrões, exões e promotores, não
podemos fazer uma biblioteca de cDNA, em vez disso temos de fazer uma biblioteca genómica – conjunto
de clones representativo de todos os genes de um organismo. A construção de uma biblioteca genómica é
bastante semelhante à construção de uma biblioteca de cDNA, também esta é composta por duas partes
principais: Construção e Rastreio.
Construção:
• Extracção do DNA
• Digestão parcial com uma enzima de restrição
• Ligação a um vector (bacteriófago l)
• Infecção de células hospedeiras (E. coli)
A extracção do DNA processa-se de maneira diferente, pois n interessa qual o tipo celular que utilizamos
dado que o que queremos é o genoma completo e esse está presente em todas as células. Para extrair os
genes o que temos de fazer é clivar todo o genoma com enzimas de restrição de modo a obter fragmentos
pequenos que vão ser ligados a vectores e infectar as células hospedeiras. A estratégia de clonagem é igual
em ambas as bibliotecas, clivagem, ligação ao DNA viral, construçãorastos de DNA que revelavam que o cromossoma de E. coli era uma grande molécula circular. DNA
radioactivo isolado a partir de células em replicação mostravam ainda um loop extra. Cairns concluiu que o
loop resultava da formação de duas cadeias de DNA filhas radioactivas, cada uma delas complementar a
uma cadeia parental. Um, ou os dois, dos extremos dos loops eram pontos dinâmicos – chamados garfos de
replicação, onde as cadeias de DNA parental estavam a ser separadas e rapidamente replicadas. Os
resultados de Cairns demonstraram que ambas as cadeias de DNA se replicavam simultaneamente, e uma
12
variância na sua experiência demonstra que mostra que a
replicação do cromossoma bacteriano é bidireccional: ambos
os extremos do loop têm garfos de replicação activos.
Para determinar se a replicação tinha origem num único
ponto no DNA foram necessários marcos ao longo da
molécula. Isto foi providenciado por uma técnica chamada
mapeamento de desnaturação (denaturation mapping),
desenvolvida por Ross Inman e seus colegas. Usando um
cromossoma de um vírus (bacteriófago) eles mostraram que a
molécula podia ser selectivamente desnaturada numa
sequência rica em pares de base A=T, gerando um padrão
reproduzível de bolhas de cadeia simples.
DNA isolado
contendo loops de
replicação pode ser
parcialmente desnaturado da mesma maneira. Isto permite o
posicionamento e o progresso do garfo de replicação de forma a ser
medido e mapeado, usando as regiões desnaturadas como ponto de
referência. A técnica revelou que neste sistema os loops de replicação
iniciam-se sempre no mesmo ponto, o qual foi chamado de origem.
Isto também veio confirmar a anterior observação que a replicação é bidireccional. Para moléculas
circulares, os dois garfos de replicação encontram-se num ponto oposto ao da origem. Origens específicas
têm então sido identificadas e caracterizadas em bactérias e eucariótas inferiores.

NUCLEASES
Para entender a enzimologia da replicação do DNA, é necessário primeiro introduzir as enzimas que
degradam o DNA em vez daquelas que o sintetizam. Estas enzimas são conhecidas como nucleases, ou
DNases para o caso de serem específicas para o DNA e não actuem para o RNA. Todas as células contêm
vários tipos de nucleases que pertencem a duas grandes classes: exonucleases e endonucleases. As
Exonucleases degradam os ácidos nucleicos a partir da extremidade da molécula. Muitas operam apenas na
direcção 5’ 3’ ou 3’ 5’, removendo nucleótidos apenas da extremidade 5’ ou 3’, respectivamente, de uma
cadeia simples ou dupla. As Endonucleases conseguem começar a degradar em específicos locais internos
da molécula, reduzindo-a a pequenos fragmentos. Algumas exonucleases e endonucleases degradam apenas
cadeias simples de DNA. existem algumas classes importantes de endonucleases que clivam apenas
sequências específicas de nucleótidos (tais como as enzimas de restrição, muito importantes na
biotecnologia).

DNA POLIMERASE
A habilidade do DNA servir como molde para a sua própria replicação foi posteriormente estabelecida
com a demonstração de que uma enzima purificada de E. coli (DNA polimerase) conseguia catalizar a
replicação de DNA in vitro. Na presença de DNA que servisse como molde esta era capaz de, directamente,
incorporar nucleótidos na cadeia de DNA complementar.
Identificada por Arthur Kornberg em 1956,
a habilidade desta enzima para, apuradamente,
copiar uma cadeia de DNA providencia a base
bioquímica para o modelo de replicação, que
foi inicialmente proposto por Watson e Crick,
assim o seu isolamento representa um marco
na biologia molecular. Ironicamente, a
primeira molécula de DNA polimerase a ser
isolada (agora chamada DNA polimerase I)
não é a principal enzima responsável pela
13
replicação em E. coli. Em vez disso é agora claro que tanto procariotas como eucariótas possuem vários
tipos de DNA polimerases que desempenham papeis distintos na replicação e reparação de DNA.
O fundamento de tal reacção é a transferência de grupos fosforilos. O nucleófilo é a extremidade 3’ do
grupo hidroxilo do nucleótido na extremidade 3’ da cadeia crescente de DNA. Ataques nucleofílicos
ocorrem na extremidade 5’ do fósforo α do desoxinucleósido a ser inserido. Pirofosfato (duas moléculas
inorgânico é libertado durante esta reacção: onde dNMP e dNTP são
desoxinucleósidos 5’ – monofosfatados e 5’ –trifosfatados, respectivamente. A reacção parece acontecer
com uma mínima alteração na energia livres, visto que a ligação fosfodiéster é formada com o uso da
energia libertada pela quebra dos grupos fosfatos. Trata-se de duas reacções coordenadas. Também as
ligações não covalentes de emparelhamento de bases contribuem para estabelecer a cadeia de agora
formada.
Estudos em DNA polimerase I levaram à definição de dois requisitos centrais para as DNA polimerases:
Primeiro, todas as DNA polimerase necessitam de um molde. A reacção de polimerização é guiada por
uma cadeia de DNA molde de acordo com o emparelhamento de bases complementares. Todas elas
sintetizam DNA unicamente na direcção 5’ 3’, adicionando dNTP ao grupo hidroxilico 3’ da cadeia
crescente. Isto foi uma descoberta particularmente importante, não só porque providenciava uma base
química para a exactidão da replicação semiconservativa mas também porque representava o primeiro
exemplo do uso de moldes para guiar uma reacção de biosintética.
Segundo, as polimerases necessitam de um primer. Um primer é um segmento de cadeia (complementar
ao molde) com o grupo hidroxilo 3’ livre ao qual um nucleótido pode ser adicionado. Por outras palavras as
DNA polimerase apenas conseguem adicionar desoxirribonucleótidos a uma cadeia “primer” (iniciadora)
que se encontre já ligada por pontes de hidrogénio à cadeia molde; elas não são capazes de iniciar a síntese
de DNA a partir do nada. A maioria dos primers são oligonucleótidos de RNA em vez de DNA, e enzimas
especializadas (primases) sintetizam estes primers quando e onde eles são necessários. A este respeito,
DNA polimerase difere da RNA polimerase, a qual consegue iniciar a síntese de uma nova cadeia de RNA
na ausência de qualquer primer. Esta propriedade das DNA polimerases é critica para a alta-fidelidade na
replicação necessária durante a divisão celular
Após a adição de um nucleótido a uma cadeia crescente de DNA, a DNA polimerase ou se dissocia ou se
move ao longo da cadeia molde e adiciona mais nucleótidos. A dissociação e reassociação da polimerase
pode limitar a velocidade da polimerização – o processo é geralmente mais rápido quando a polimerização é
contínua. A média do número de nucleótidos adicionados por uma polimerase antes desta se dissociar é
definido pela sua processividade. As DNA polimerases variam bastante na sua processividade, algumas
adicionam apenas alguns nucleótidos outras milhares, antes de se dissociarem.

FIDELIDADE NA REPLICAÇÃO
A replicação ocorre com um extraordinário grau de fidelidade. Em E. coli um
erro é cometido apenas uma vez por cada 109 a 1010 nucleótidos inseridos. Para o
cromossoma de E. coli de aproximadamente 4.6x106 pares de bases. Isto significa
que ocorre um erro apenas por cada 1.000 a 10.000 replicações. Durante a
polimerização a descriminação entre nucleótidos correctos e incorrectos reside não
apenas nas pontes de hidrogénio que especificam o correcto
emparelhamento mas também na geometria padrão dos
pares de bases. O local activo da DNA polimerase I
acomoda apenas pares de base com geometria padrão.
Bases incorrectas podem ser rejeitadas após a ligação
fosfodiéster estar formada.
A exactidão da polimerização por si mesmo não é
suficiente para justificar o elevado grau de fidelidade da
replicação. Medições cuidadosas in vitro mostraram que a
DNA polimerase insere um nucleótido incorrecto por cada
104 a 105 outros correctos. Estes erros por vezes ocorrem
14
porque as bases se encontram brevemente numa forma tautomérica (formas modificadas influenciadasdo vírus, infecção, construção de
placas fágicas. De seguida temos de fazer o screening (rastreio) das placas para encontrar o genoma viral
associado ao fragmento de DNA com o gene de interesse. O rastreio é igual ao rastreio de usado na
construção de uma biblioteca de cDNA. A construção da sonda pode ser feita de igual maneira ou, caso já
haja informação de qual o cDNA para a proteína codificada por este gene, podemos ainda tirar partido desta
informação.
Contudo a biblioteca não termina por aqui. É ainda necessário fazer-se um Southern blot de modo a
identificar quais as porções importantes do nosso gene.

SOUTHERN BLOT
Consiste na análise de um genoma clivado em vários fragmentos por enzimas de restrição, nos quais
queremos saber qual(ais) o(s) fragmento(s) que correspondem ao nosso gene – fragmentos aos quais a sonda
se liga. Para isso clivamos o nosso genoma (no caso da biblioteca genómica, clivamos o fragmento presente
na placa fágica com resultado positivo) e corremos em electroforese de modo a separá-los por peso
molecular. De seguida transferimos o conteúdo do gel para uma membrana de nitrocelulose, esta tem
afinidade para DNA pelo que os fragmentos passam facilmente do gel para a membrana formando-se uma
réplica do gel.
De seguida incuba-se a membrana com a sonda usada no rastreio, esta vai ligar-se a alguns fragmentos
resultantes da segunda digestão por enzimas de restrição (início do Southern blot), esses fragmentos são os
fragmentos que correspondem ao nosso gene, os fragmentos a que ela não se ligar são zonas exteriores ao
gene.

ATENÇÃO
Durante a primeira clivagem com enzimas de restrição usa-se uma quantidade mínima destas enzimas de
modo a que a digestão seja parcial (incompleta). Isto faz com que alguns cromossomas de umas células
sejam cortados em pedaços mais pequenos e outros de outras células em pedaços maiores. Com isto o que
nós podemos ter (e teremos) são fragmentos do gene que nos interessa de vários tamanhos, cada um deles
proveniente de cromossomas de diferentes células que sofreram diferentes digestões.
115
Nós vamos tirar partido disto, porque após o primeiro Southern blot podemos não possuir a sequência
total do gene (muito dificilmente obtemos isso logo à primeira). Assim pegamos na informação que o
primeiro Southern blot nos dá, e construímos uma nova sonda para uma zona que não aquela que foi usada
na primeira sonda. Com esta nova sonda voltamos a fazer um rastreio da biblioteca genómica (membrana e
autoradiografia) provavelmente obtemos outras placas marcadas, e fazemos novo Southern blot. Isto repete-
se até se possuir toda a sequência do gene. A este processo de percorrer o gene chama-se Chromosome
Walking.
Pegando e comparando a informação obtida por cada Southern blot conseguimos alinhar toda a sequência
do gene. Para conhecer os exões e intrões basta comparar a sequência do gene com a do cDNA, ou então
procurar as sequência típicas, presentes nos intrões, reconhecidas pelo spliciossoma.

ANÁLISE DOS NÍVEIS DE EXPRESSÃO DE UMA PROTEÍNA
Já sabemos que uma proteína está presente, qual o seu cDNA e até mesmo qual o gene que a codifica,
mas e a quantidade desta? Será que ela é necessária em grande quantidade ou em pequena quantidade?
Existem várias maneira de analisar os níveis de expressão de uma proteína, desde formas qualitativas até
formas quantitativas. E esses estudos pode ser a nível da própria proteína ou por análise do mRNA que lhe
dá origem.
Uma das formas qualitativas de o fazer é por hibridização in
situ por análise de um gene repórter, criando um organismo
transgénico onde se associa o promotor dessa proteína (por isso é
necessário conhecer o gene que a codifica e não apenas o cDNA)
a um gene essencial à sobrevivência da célula, pelo que a
produção da proteína repórter não vai ser prejudicial à célula e
vai-nos ser útil pois o seu nível de expressão, ou o do seu mRNA
vai ser igual ao da proteína em estudo. Podemos ainda aproveitar
o facto de se conhecer a sequência do promotor para estudar em
que zona se ligam os factores de transcrição (eliminando
sequências deste), e analisando depois a expressão do gene
repórter. O uso de genes repórteres é bom porque não interfere com o desenvolvimento do organismo.
116
Outro processo para analisar os níveis de expressão é por Northern blot, o processo é equivalente ao
utilizado em Southern blot alterando apenas o início. Com Northern fazemos uma análise dos RNA em vez
de DNA, a sonda é feita a partir de sequências de cDNA conhecidas. Assim vemos qual a quantidade de
RNA marcado e tiramos conclusões.

RT-PCR
Mais um método indirecto para esta análise é por análise de PCR, em que cada as moléculas de RNA são
ampliadas de acordo com a sua concentração inicial. Isto é, na célula as quantidades destes RNAs podem ser
vestigiais e por isso não são detectadas, assim quando ampliadas elas vão ser ampliadas em proporção,
assim conhecendo a expressão do RNA de uma proteína podemos comparar com a expressão da nossa
proteína. No entanto esta técnica trás desvantagens como no caso das proteínas terem expressões muito
semelhantes, a diferença entre as duas bandas pode não ser muito notória visto o PCR ter uma amplificação
exponencial. Assim podemos fazer uma alteração a esta técnica (RT – PCR Real Time PCR) onde a
quantidade de mRNA é medida ao fim de cada ciclo. Assim podemos ver qual a relação entre os dois. Este
processa-se do seguinte modo:

1. Isolamento do mRNA;
2. Síntese do cDNA;
3. PCR usando primers específicos;
4. Quantidade do produto de PCR obtido reflecte níveis do mRNA para o transcrito amplificado;

DNA MICROARRAYS
O último meio de análise da expressão através da molécula de mRNA é o uso de microarrays. Esta
técnica permite a análise global de mRNA num ou mais tecidos ao mesmo tempo, através de Chips de DNA
(microarrays). Para fazer esta técnica prepara-se uma placa onde se depositam milhares de sondas (DNA
complementar – um tipo de sonda por divisão) para todos os mRNAs. De seguida por transcrição reversa
converte-se o mRNA celular em cDNA, durante esta transcrição marca-se o cDNA com fluróforos, que vai
incubar a nossa placa. Estes cDNAs vão-se ligar as sondas lá inseridas, e vão manifestar a cor verde ou
117
vermelha caso ligue apenas cDNA proveniente de um dos tipos celulares, ou amarelo caso ligue cDNA
proveniente de ambos os tecidos. Assim sabemos se determinado RNA é produzido unicamente num tipo
celular (tecido, estirpe, espécie, estado de desenvolvimento…) ou se em ambos.
Muitas vezes a análise de microarrays é feita por computadores, pois tornava-se impossível a leitura de
tão grande quantidade de dados e de tão reduzidas dimensões a olho nú. Além disso o computador é capaz
de detectar pequenas variações na fluorescência indicando que um RNA pode ser altamente transcrito num
tipo celular e muito pouco noutro tipo, não causando por isso grande variação de cor para o amarelo.
A produção das placas usadas em microarrays assim como das sondas lá hibridizadas é feita pela industria
bastando ao investigador encomendar e comprar.

Existem outras técnicas de análise da expressão proteica que tiram partido da própria proteína, métodos
mais directos que os anteriores.

WESTERN BLOT
Não varia muito de todos os outros blots falados até agora. A principal diferença é a análise de proteínas
em vez de DNA Southern ou de RNA Northern, a sonda usada é um anticorpo específico para a
proteína.
Começa-se por se desnaturar as proteínas pois a proteína nativa pode esconder a zona reconhecia pelo
anticorpo. De seguida faz-se um a electroforese (em condições desnaturantes) e faz-se um blot (passagem
do resultado da electroforese para uma membrana, e incubamos com o anticorpo. Para visualizarmos
incubamos esta membrana com um anticorpo secundário, marcado radioactivamente, específico para o
primeiro. O uso do anticorpo secundário tem vantagens nosentido em que pode ser usado várias vezes em
várias experiências, diminuindo o gasto económico, assim como a produção de vários anticorpos marcados
(um para cada experiência, cada blot).

118
ACTIVAÇÃO DE GENES
Para o estudo de uma proteína podemos efectuar estudos bioquímicos, ou então produzir proteína
recombinante. É importante conhecer o DNA que codifica determinada proteína, a identidade da sequência
de aminoácidos passa pelo conhecimento da sequência de nucleótidos que lhe dá origem.
Mas todos estes estudos informam-nos sobre a estrutura e alguma função da proteína, mas na realidade
não nos revelam os seus efeitos no organismo. Normalmente esta informação é-nos fornecida naturalmente
por organismos mutantes para a forma nativa da proteína. Assim podemos induzir alguns organismos a
produzirem proteínas mutantes não funcionais, através da mutagénese dirigida, onde se altera
especificamente a sequência de aminoácidos e se estuda as consequências dessa mutação.

MUTAGÉNESE DIRIGIDA
A mutagénese dirigida assenta sobre o principio do PCR: temos um plasmídeo recombinante (clonagem
do DNA que nos interessa) isolado de bactérias.
Fazemos um PCR tendo como molde o plasmídeo
usando primers com a mutação a inserir, estes são
complementares das cadeias de DNA do
plasmídeo. O PCR não será muito eficiente nos
primeiros ciclos porque os primers são
complementares entre si e não são completamente
complementares da cadeia do plasmídeo. Mas
mesmo assim ocorrerá amplificação e o gene sofre
mutação, nos ciclos mais avançados a eficiência do
PCR já será maior.
De seguida elimina-se o plasmídeo original
recorrendo a uma enzima de restrição (DnpI), que
digere DNA metilado. As cadeias sintetizadas de
novo foram sintetizadas in vitro e por isso n
sofreram o processo de metilação que sofreu o
plasmídeo produzido em bactérias. Logo o novo
plasmídeo (mutado) não é digerido. No final
introduz-se este plasmídeo mutado em bactérias e
elas replicam-no.
É importante que a concentração de primers não
seja muito elevada visto que eles emparelham entre
si, deste modo usam-se primers muito longos, estes
não vão ligar completamente porque têm porção
não complementar, contudo a ligação destes ao
plasmídeo é mais eficiente se forem maiores do que
119
se forem menores. Por outro lado convém que a porção que não emparelha esteja localizada no entro do
primer de forma a garantir o emparelhamento das extremidades e aumentar a eficiência na ligação e
mutação do DNA.
A nível do estudo podemos introduzir mutações pontuais (alteração num único nucleótido), inserções
(inserir porções que vão ligar ou interagir com outros componentes), ou delecções (retirar parte da
sequência, por exemplo podemos querer retirar um domínio de ligação Zink–finger, ou outro qualquer).
Se pretendermos retirar/inserir uma sequência do gene o plasmídeo/primer vai ter no centro uma
sequência de nucleótidos que não vão emparelhar, assim quando ocorre a ligação das extremidades
complementares forma-se um loop e o produto resultante do 1º ciclo do PCR não contém/contém a
sequência do loop, nos ciclos seguintes o emparelhamento dos primers é mais fácil visto que já existem
plasmídeos completamente complementares aos primers em uso.

TRANSFECÇÃO DE CÉLULAS EUCARIÓTICAS
Se é nosso objectivo estudar a acção da proteína numa célula então é necessário fazer a transfecção de
células eucarióticas em que se insere um plasmídeo recombinante com o DNA da proteína que queremos
estudar (equivalente à transfecção de bactérias). No entanto as células eucarióticas normalmente não
mantêm o plasmídeo e apenas um número muito pequeno de células inclui o plasmídeo no seu genoma.
Assim convém referir que existe transfecção transitória (eucariotas) e transfecção permanente ou
transformação (eu procariotas). O plasmídeo deve por isso possuir um promotor eucariótico e origem de
replicação também eucariótica (normalmente usa-se a origem de replicação de um vírus que infecte células
eucarióticas). O plasmídeo entra nas célula por electroporação (choques eléctricos), contudo só 20-40% das
células deixam o plasmídeo entrar no seu núcleo, e depois de 48h já ele foi eliminado. É neste espaço de
tempo que a proteína mutada é produzida, e também é neste curto espaço de tempo que temos de fazer o
nosso estudo sobre esta proteína.
Existe no entanto um reduzido número de células que incorporaram o plasmídeo no seu genoma, neste
caso podemos esperar as 48h e de seguida seleccionar, por uso de um antibiótico, quais as células que o
incorporaram. Nestes casos obtemos uma colónia de células que expressa continuamente a nossa proteína.

120
TRANSFECÇÃO DE UM MUTANTE COM EFEITO DOMINANTE NEGATIVO
No caso de querermos inactivar um gene fazemos a transfecção de um gene mutado que não seja activo.
Por exemplo a proteína Ran só está activa quando liga GTP, e possuem uma baixa actividade de GTPase.
Quando essa actividade aumenta elas passam a ligar-se a GDP e ficam inactivas. As proteínas Ran e outras
da sua família são activadas por GEF.
Se introduzirmos nas células uma forma mutante de Ran, que liga GEF mas que não liga GTP, sob a
influencia de um promotor forte vai haver grande expressão desta proteína. Esta proteína mutada vai ligar
GEF mas não liga GTP, e impede a ligação de Ran normais a GEF, pelo que estas também n são activadas.
Esta é uma forma de inactivar proteínas.

RNA DE INTERFERÊNCIA
Nos últimos anos surgiu uma técnica alternativa ao efeito dominante negativo para inactivar um gene:
RNA de interferência (iRNA). Com esta técnica verificou-se que uma molécula de RNA em cadeia dupla é
capaz de inactivar genes com grande eficiência. Nas plantas isto surge como uma defesa contra ataques
retrovirais.
O RNA em cadeia dupla quando entra na célula é clivado pela acção de RNAses em cadeias mais
pequenas (small interference RNA siRNA) que vão levar à degradação do mRNA devido às associações que
criam com um complexo proteico (RISC). Este complexo possui endonucleases e helicase que vão fazer
com que as cadeias de siRNA se desliguem formando siRNA em cadeias simples ligadas ao complexo
RISC. O complexo resultante vai-se ligar a moléculas de mRNA com sequência complementar ao siRNA e
provocar a sua degradação por parte das endonucleases.
Podemos assim silenciar genes de uma forma rápida e barata por inserção de iRNA, ou então podemos
combinar as duas técnicas e transfectar as células com DNA codificante de iRNA.

121

RATINHOS TRANSGÉNICOS
Como se produz um organismo em que há produção de genes
estranhos que normalmente não fazem parte do genoma?
Pode-se fazer que a partir de um ovo fecundado, mas ainda numa
fase muito precoce quando ainda não ocorreu fusão dos dois
pronúcleos, se injecte DNA estranho num dos núcleos. E repete-se
este procedimento em vários ovos que vão ser introduzidos numa
fêmea. EM 10-30% dos casos ocorre recombinação eficiente entre o
DNA injectado e o genoma, gerando-se um individuo que expressa
genes adicionais, produzindo proteínas codificadas pelos
transgéneros. Não existe, no entanto, qualquer controlo sobre em que
parte do genoma o DNA estranho é inserido, o gene é transcrito
sempre que estiver presente o factor de transcrição associado ao
promotor do gene.

RATINHOS “KNOCKOUT”
Esta técnica consiste na inactivação de genes de um
organismo, introduzindo-se um gene estranho numa
células mas de modo a promover a recombinação
homóloga entre o gene a inserir e o que se pretende retirar.
O que se faz é substituir um gene endógeno de células de
um blastócito com células estaminais transportadoras da
mutação.
Mas de que maneira se faz a mutação nestas células? É
uma técnica que tenta inserir um gene semelhante ao
endógeno mas não funcional (mutado por métodos
referidos anteriormente), a ladear a sua sequência existem
sequências que servem como marcadores, permitindo saber
se o processoocorreu ou não. Essas sequências
normalmente são genes de resistência a antibióticos
(neomicina). Contudo quando se faz esta técnica há
sempre o perigo de ocorrer recombinação aleatória com
outros genes no genoma (recombinação não homóloga). É
necessário fazer então uma distinção, assim o DNA a inserir
transporta também uma zona que codifica uma cinase que
confere sensibilidade a um antibiótico (ganciclovir). Esta
pequena fracção que confere sensibilidade não é inserida no
caso de ocorrer recombinação homóloga pois só a zona
homóloga do fragmento é que se insere, enquanto que na
recombinação não homóloga todo o fragmento se insere no
genoma, incluindo a zona de sensibilidade.
Para distinguir umas células das outras basta aplicar a
neomicina as células que sobreviverem é porque sofreram
recombinação, mas quais as que sofreram recombinação
homóloga? Junta-se ganciclovir e aquelas que morrerem é
porque sofreram recombinação não homóloga, sobrevivendo
assim as células que apenas sofreram recombinação homóloga.
122
De seguida transferem-se estas células para alguns
blastócitos que serão inseridos no útero de uma fêmea
pseudo-grávida. Geralmente utilizam-se marcadores
genéticos como as células dadoras do blastócito e as células
estaminais modificadas serem de ratinhos com colorações
diferentes, de modo a distinguir com maior facilidade os
ratinhos quiméricos e normais. Espera-se ver os
descendentes e analisam-se. Depois seguem-se uma série de
cruzamentos entre os descendentes de forma a obtermos
ratinhos homozigóticos para este gene mutado (ratinho
Knockout).
Contudo existem algumas limitações a esta técnica, nos
organismos Knockout, as proteínas que se pretende estudar
pode ser importante na fase embrionária (clivagem ou
formação de algum tecido) e nunca se chega a ter ratinhos
viáveis. Para contornar este perigo podemos tentar inactivar
o gene especificamente numa fase do desenvolvimento do
organismo ou apenas num tecido.
Para isso podemo-nos inspirar no que se passa comum
vírus e a sua proteína Cre (recombinase) que reconhece
sequências nas extremidades de cada monómero de genoma
de um vírus na replicação do vírus formam-se várias
cópias ligadas que têm de ser quebrada, essa clivagem é
levada a cabo pela proteína Cre que cliva nas sequências
LoxP. Assim tirando partido desta informação podemos
criar um ratinho transgénico para a proteína Cre, associado
a um promotor específico que apenas é activado em
determinada fase do desenvolvimento e/ou em certo tecido.
Depois criamos um ratinho pela técnica do Knockout onde
inserimos o gene funcional ladeado de sequências LoxP. E
depois cruzamos estes dois ratinhos.
No final vamos obter um ratinho normal para a maioria
das células, contudo naquelas células em que existem
factores de transcrição que activem o promotor associado à
proteína Cre, esta vai ser traduzida e actuar sobre as
sequências LoxP clivando-as e retirando o gene de interesse.
Deste modo é possível estudar a acção de determinada proteína no desenvolvimento de um só tipo de
células (tecido, órgão…), mesmo que esta afecte todo o organismo, sem que o organismo todo seja alterado.
Hugo Soares 2004/2005pelo
pH do meio), permitindo a formação correcta de pontes de hidrogénio com um parceiro incorrecto. In vivo,
a razão de erros diminui graças a mecanismos enzimáticos adicionais.
Um mecanismo intrínseco a, virtualmente, todas as DNA polimerases é uma actividade separada de
exonuclease no sentido 3’ 5’ que pode rever cada nucleótido após a sua inserção. Esta actividade de
nuclease permite à enzima renovar uma nova base adicionada incorrectamente e é altamente específico para
pares de bases mal ligados.

Se a polimerase adicionar um nucleótido errado, a translocação da enzima para a posição onde o próximo
nucleótido esta para ser adicionado é inibido. Esta pausa cinética providencia a oportunidade para a
correcção do erro. A actividade de exonuclease na direcção 3’ 5’ remove o nucleótido mal emparelhado, e
a polimerase inicia de novo a sua função. Esta actividade, conhecida como Revisão, não é simplesmente o
contrário da reacção de polimerização, porque não envolve pirofosfato.
Quando a selecção de bases e a revisão são combinadas, a DNA polimerase “deixa para trás” uma taxa de
erros na ordem dos 106 a 108 pares de bases. Ainda assim a exactidão medida em E. coli é maior. A
exactidão adicional é devido a um sistema separado de enzimas que reparam as bases mal emparelhadas
após a replicação.

OUTROS TIPOS DE DNA POLIMERASE
Mais de 9% da actividade de DNA polimerase observada em estratos de E. coli são da responsabilidade
da DNA polimerase I. Pouco depois do isolamento desta enzima em 1955, contudo, começaram-se a
acumular evidências de que esta não era apropriada para a replicação que ocorre no largo cromossoma de E.
coli :
1. A velocidade a qual ela actua (600 nucleótidos/min.) é muito baixa (cerca de 100x ou mais) para ser
responsável pela velocidade à qual o garfo de replicação se move numa célula bacteriana.
2. DNA polimerase I tem uma processividade relativamente baixa.
3. Estudos genéticos demonstraram que muitos genes, e portanto muitas proteínas, estão envolvidas na
replicação: DNA polimerase I claramente não actua sozinha.
4. Finalmente a mais importante, em 1969 John Cairns isolou uma cadeia bacteriana com um gene
alterado para a DNA polimerase I que produzia uma enzima inactiva. Contudo esta cadeia era
anormalmente sensível a agentes que danificavam o DNA.
A procura de outra DNA polimerase levou à descoberta da DNA polimerase II e DNA polimerase III
no início dos anos 70. DNA polimerase II é uma enzima envolvida num tipo de reparação do DNA, contudo
a sua função ainda não está muito bem definida. A enzima DNA polimerase III é a principal responsável
pela replicação em E. coli.
15

A DNA polimerase I, então, não é a enzima primária na replicação; em vez disso ela desempenha uma
gama de funções importantes como recombinação e reparação. As funções especiais desta polimerase são
engrandecidas pela sua actividade de exonuclease 5’ 3’, distinta da sua actividade de exonuclease 3’ 5’
de revisão, que está localizada num domínio estrutural que pode ser separado da enzima através de um leve
tratamento com uma protease. Quando o domínio de exonuclease 5’ 3’ é removido, o restante fragmento
(largo ou de Klenow), retém ainda a capacidade de polimerização e de revisão.
A actividade de exonuclease 5’ 3’ da DNA polimerase I intacta pode substituir o segmento de DNA (ou
RNA) emparelhados a cadeia molde, num processo conhecido como a translação de Nick. Muitas outras
enzimas possuem a actividade de exonuclease 5’ 3’.

A DNA polimerase III é muito mais complexa do que a I, possuindo 10 tipos de subunidades.

16
As funções de polimerização e de revisão residem, respectivamente, nas subunidades α e ε (épsilon). As
subunidade θ associa-se as duas subunidades anteriores e forma um núcleo que consegue polimerizar DNA
mas com baixa processividade. Dois núcleos podem ser ligados por uma outra série de subunidades, o
complexo γ, consistindo em cinco subunidades de quatro tipos diferentes τ2γδδ’. Os núcleos são ligados
pelas subunidades τ (tau), duas outras subunidades χ(chi) e φ(psi) estão ligadas ao complexo γ. Todo o
conjunto de 13 subunidades proteicas (9tipos) e chamado de DNA polimerase III*.

DNA polimerase III* pode polimerizar DNA, mas com muito menor processividade que aquela esperada
para uma replicação organizada. O aumento necessário da processividade é providenciado pela adição de
subunidades β, quatro das quais completam a DNA polimerase III. As subunidade β associam-se em pares
para formar uma estrutura em forma de donut que circundam a molécula de DNA e actuam como uma
braçadeira. Cada dímero associa-se com um núcleo da polimerase III*. A braçadeira de subunidades β
previne a dissociação da DNA polimerase III da molécula de DNA, aumentando dramaticamente a sua
processividade – para mais de 500.000. (tabela pag.15)
As células eucarióticas possuem 5 tipos de DNA polimerases: α, β, γ, δ e ε. Polimerase γ está localizada
nas mitocôndrias e é responsável pela replicação do DNA mitocondrial as outras localizam-se no núcleo e
estão portanto envolvidas na replicação do DNA nuclear. As polimerases α, β e ε estão mais activas em
células que se dividem, sugerindo que têm função na replicação. A polimerase δ tanto activa em células que
se dividem como naquelas que não se dividem mais, consistindo a sua função em reparar danos no DNA.

O garfo de replicação
A síntese de novas cadeias de DNA complementares a ambas as cadeias parentais que lhes deram origem
conferiu um importante problema para o entendimento da bioquímica da replicação. Dado que as duas
cadeias de DNA correm em direcções opostas (antiparalelas), a replicação contínua das duas novas cadeias
requer que uma seja sintetizada na direcção 5’ 3’, enquanto a síntese da outra cadeia correria em sentido
oposto 3’ 5’. Mas a DNA polimerase cataliza a polimerização de dNTP’s apenas na direcção 5’ 3’.
Como poderia então a outra cadeia ser sintetizada?
Este enigma foi resolvido com experiências que mostravam que apenas uma cadeia de DNA é
sintetizada de uma forma contínua na direcção 5’ 3’; enquanto que a outra era formada por curtos
fragmentos (1-3kb) de DNA que eram sintetizadas “para trás” respeitando o garfo de replicação.

17
Estes novos pedaços de DNA sintetizados (chamados fragmentos de Okazaki) ligam-se pela acção de
DNA ligases, formando uma nova cadeia de DNA intacta. A cadeia de DNA que possui uma síntese
contínua é chamada de cadeia líder, visto que o seu prolongamento em direcção ao garfo de replicação
expõe o molde usados para a síntese dos fragmentos de Okazaki ( a cadeia seguidora).
Apesar da descoberta da síntese descontínua da cadeia seguidora providenciar o mecanismo para o
alongamento de ambas as cadeias de DNA, isso suscitou outra questão: se a DNA polimerase precisa de
primers e não consegue iniciar a síntese a partir do nada, como é que a síntese dos fragmentos de Okazaki se
inicia? A resposta é que pequenos fragmentos de RNA servem como primers para a replicação de DNA

Ao contrário da síntese de DNA a síntese de RNA pode
começar do zero, e uma enzima chamada primase sintetiza
pequenos fragmentos de RNA (entre 3 a 10 nucleótidos)
complementares da cadeia seguidora molde. Fragmentos de
Okazaki são então sintetizados via extensão destes primers de
RNA pela DNA polimerase. Cada fragmento separado é então
estabilizado por SSB (Single Strand DNA Binding proteins).
Uma importante consequência de tais primers de RNA é que
novos fragmentos de Okazaki contém uma ligação RNA-DNA. A
descoberta disto providenciou evidências críticas para entender o
papel dos primers de RNA na replicação de DNA.
Para formar uma cadeia contínua de DNA, os primers de RNA
necessitam ser removidos e substituídos por nucleótidos de DNA,
isto é feito pela DNA polimerase I, e a ligação entre os
fragmentos é promovida pela enzima DNA ligase.
Não só polimerases e primases mas também um número de outrasproteínas estão envolvidas no garfo de
replicação. Uma classe dessas proteínas liga-se à DNA polimerase aumentando a sua actividade e fazendo
com que esta permaneça ligada a cadeia de DNA molde de modo a que
a síntese continue. Outras proteínas destorcem as cadeias de DNA e
estabilizam regiões de cadeia simples. Helicases são enzimas que
catalizam o
desdobramento de
cadeias de DNA
parentais,
associadas à
hidrólise de ATP,
estas colocam-se à
frente do garfo de
replicação. As SSB de seguida estabilizam das cadeias
molde agora desentrelaçadas, mantendo-as esticadas e
separadas para que a replicação possa prosseguir.
À medida que a replicação avança “a frente” da
replicação é forçada a rodar sobre si. Se nada
acontecesse essa rotação causaria que moléculas circulares de DNA (como as existentes em alguns vírus e
18
bactérias) se entrelaçassem sobre si mesmas, bloqueando com isto a replicação. Este problema é então
resolvido pela presença de topoisomerases, enzimas que catalizam a quebra reversível e re-ajuntamento das
duas cadeias.
Apesar dos organismos eucariontes serem compostos de cadeias lineares em vez de cadeias circulares de
DNA, na sua replicação estas enzimas também intervêm, caso contrario todo o cromossoma teria de rodar
continuamente durante a síntese de DNA.

A REPLICAÇÃO EM E. coli
A síntese de DNA pode ser dividida em três partes: iniciação, alongamento e terminação, distinguindo
cada uma delas pelas reacções que ocorrem e pelas enzimas que actuam.

Iniciação:
O ponto de origem da replicação em E. coli chama-se de oriC, consiste em 245 pares de bases, e carrega
segmentos altamente conservados na origem da replicação bacteriana. Um arranjo geral das sequências
conservadas é ilustrado na figura.

As sequências chave com interesse são duas séries de pequenas repetições: três repetições de 13 pares de
bases e quatro repetições de 9 pares de bases.
Pelo menos nove tipos diferentes de proteínas participam no início da fase de replicação. Elas abrem a
hélice de DNA no ponto de origem e estabilizam um complexo pré-iniciador das subsequentes reacções.
Um componente crucial na iniciação deste processo são as proteínas DnaA.
1. Um simples complexo de quatro ou cinco proteínas DnaA liga-se às quatro repetições de 9 pares de
bases na origem;
2. Depois reconhecem e sucessivamente desnaturam o DNA na região de três repetições de 13 pares
de bases, a qual é rica em ligações A=T; este processo requer o uso de ATP e a proteína HU - parecida
com uma histona;
3. DnaC liga as DnaB na região desnaturada. Dois anéis de hexâmeros DnaB ligam-se cada um a uma
cadeia de DNA, actuando como helicases que desligam as moléculas de DNA bidireccionalmente
criando dois potenciais garfos de replicação.
Quando outras proteínas são adicionadas, num sistema in vitro, como as SSB (Single-stranded DNA-
binding protein) e DNA girases (DNA topoisomerases II) milhares de pares de bases são separados pelas
DnaB helicases nos garfos de replicação.

O início da replicação é a única fase da replicação onde é conhecida a sua regulação, e é regulada de tal
forma que a ela ocorre apenas suma vez em cada ciclo celular. O mecanismo de regulação ainda não é muito
bem compreendido mas a genética e a bioquímica já providenciaram algumas luzes sobre o assunto.
19
Alongamento:

Nesta fase ocorre basicamente o processo descrito atrás. A complexidade reside sobretudo na
coordenação da cadeia líder com a cadeia seguidora: ambas as cadeias são produzidas por um único dímero
assimétrico de DNA polimerase III.
A síntese dos segmentos de Okazaki na cadeia seguidora concerne uma elegante coreografia.
• A helicase DnaB e a primase DnaG constituem uma unidade funcional no complexo de replicação, o
primossoma;
• DNA polimerase III utiliza uma série das suas subunidades para sintetizar a cadeia líder, e outra série
para sintetizar os fragmentos de Okazaki;
• A helicase DnaB desnatura o DNA no garfo de replicação à medida que ele atravessa a cadeia molde
na direcção 5’ 3’;
• DNA primase ocasionalmente associa-se com DnaB e sintetiza pequenos primers de RNA; (a e b)
• Uma nova braçadeira β é então posicionada no primer; (c)
• Quando a síntese de um fragmento de Okazaki está completa, a replicação “descansa” e um núcleo de
subunidades da DNA polimerase II dissocia-se da sua braçadeira β (e do fragmento de Okazaki inteiro),
e associa-se com uma nova braçadeira. (e)
• Isto inícia a síntese de um novo fragmento de Okazaki;
• Todo o complexo de proteínas intervenientes na síntese de DNA na zona do garfo de replicação é
conhecido como replissoma;

20
POLIMERASE CHAIN REACTION
Um método para isolar grandes quantidades de moléculas simples de DNA é a reacção em cadeia da
polimerase (PCR - polymerase chain reaction), desenvolvida por Kary Mullis em 1988 e que lhe valeu um
prémio Nobel. Provido de algumas sequências conhecidas da molécula de DNA, esta técnica pode atingir
uma alta amplificação de DNA através de reacções inteiramente in vitro. Essencialmente, a DNA
polimerase é usada para repetir a replicação de um determinado segmento. O número de moléculas de DNA
aumenta exponencialmente, dobrando em cada ciclo de replicação; assim uma significante quantidade de
DNA pode ser obtida a partir de pequenas amostras. Por exemplo, uma simples molécula submetida a 30
ciclos de replicação originaria, teoricamente, 230 (cerca de 1 bilião) moléculas copiadas.
A técnica de PCR desenrola-se com uma elegante simplicidade. Dois oligonucleótidos sintéticos são
preparados, eles são complementares às sequências nas cadeias opostas do DNA alvo na posição adjacente
ao final (3’) do segmento a ser amplificado. Estes oligonucleótidos servem como primers para a replicação.
As extremidades 3’ de uma sonda híbrida encontram-se orientadas de frente uma para a outra e posicionadas
de forma a iniciar a síntese de todo o segmento de DNA pretendido.
O DNA isolado com a sequência a replicar é ligeiramente aquecido de maneira a desnaturá-lo e depois
arrefecido na presença de um número excessivo de primers (oligonucleótidos sintéticos). De seguida é
adicionado à mistura grande quantidade de desoxinucleósidos trifosfatados para que a replicação do primer
possa então ter início. O ciclo de aquecimentos e arrefecimentos é repetido 25 a 30 vezes no decorrer de
algumas horas num processador automático, amplificando os segmentos de DNA até que eles possam ser
prontamente analisados. O PCR usa uma DNA polimerase resistente ao calor, tal como a Taq-polimerase
(derivada de uma bactéria que vive a uma temperatura de 90ºC) que permanece activa após todos os passos
de aquecimento e não necessita ser substituída. Uma escolha cuidadosa do primer a ser usado, assim como o
uso de endonucleases de restrição facilita o subsequente processo de clonagem do DNA amplificado.
Esta tecnologia é muito sensível: PCR consegue detectar e amplificar a mais pequena molécula de DNA
numa amostra de qualquer tipo. Apesar do DNA se degradar com o tempo a reacção de PCR já foi capaz de
copiar segmentos com mais de 40.000 anos.

21
Alguns conceitos práticos para o processo de PCR:
• Desnaturação das duas cadeias da molécula de DNA faz-se a 95ºC;
• Emparelhamento dos primers: 50-60ºC; calcular em cada experiência a temperatura ideal para os
primers a usar
• Extensão das cadeias pela DNA polimerase faz-se a uma temperatura de 72ºC (Taq polimerase);

Características dos primers a usar no PCR?
• ~20 nucleótidos de DNA em cadeia simples;
• Emparelhamento com o terminal 3’ de cada uma das cadeias a amplificar:
• Específicos para o fragmento a amplificar:
• Temperatura de emparelhamento semelhante para os dois primers do par;
• Não devem formar dímeros consigo próprios ou entre si

Cálculo da temperatura de fusão (Tm) de um primer:
Tm = (4×[G+C]) + (2×[A+T])

Nota: Usar na reacção de PCR temperatura de emparelhamento dos primers 4ºC inferior à TmCLONAGEM E DNA RECOMBINANTE

Um Clone é, por definição, uma população de células geneticamente idênticas. A Clonagem de um
organismo significa a formação de um organismo geneticamente igual a outro organismo. Mas pode-se falar
de clonagem de um gene, ou seja a produção de cópias múltiplas de um gene.
Clone de um gene: células contendo moléculas idênticas de DNA recombinante (DNA não original
daquele organismo), contendo o gene de interesse.

Quais são os objectivos da clonagem de um gene?

• Interesse em conhecer a sequência de DNA que codifica uma proteína, não é possível saber a
identidade de uma proteína sem se conhecer a sua sequência de aminoácidos, conhecer a sequência de
nucleótidos que codificam essa proteína possibilita essa e outras informações;
• Produção de proteína recombinante – produção de grandes quantidades da proteína codificada pelo
gene inserido, com o objectivo de estudá-la melhor, ou utilizá-la na medicina;
• Inserção do DNA clonado noutro organismo – produção de OGM;

Sequência de DNA que codifica a proteína – utilidade?

• Dedução da sequência de aminoácidos da proteína
• Comparação com a sequência de aminoácidos de outras proteínas
• Reconhecimento de domínios funcionais
• Previsão da função
• Previsão da estrutura
• Mutagénese – com o facto de se mutar uma proteína numa certa sequência e isso inactivar a sua
actividade podemos tirar conclusões acerca da proteína em estudo;
• Produção de anticorpos (proteínas produzidas por linfócitos B com função de reconhecer organismos
estranhos) – podemos utilizar esta capacidade de maneira a produzir anticorpos específicos para proteínas
específicas. Isso ajuda em outros estudos como de citologia, desenvolvimento, bioquímica,
metabolismo… pois providencia a criação de marcadores ou sondas.

22
Produção de proteína recombinante – utilidade?
• Proteína recombinante – proteína produzida num organismo onde ela, naturalmente, não existiria. Por
exemplo produção de insulina por parte de bactérias;
• Aplicações na medicina e na biotecnologia
• Caracterização da proteína
o Produção de anticorpos
o Actividade da proteína
o Estrutura da proteína
o Interacções da proteína com outras macromoléculas
o Cristalização – muito útil para determinara a sua estrutura.

Como se faz a clonagem de um gene?
Como já referido, estudos detalhados sobre a estrutura e função de um gene a nível molecular requer uma
larga quantidade de genes puros. Uma variedade de técnicas, muitas vezes referidas como técnicas de DNA
recombinante, são usadas para clonar DNA, o que permite aos investigadores um grande número de técnicas
idênticas. DNA recombinante é simplesmente qualquer molécula de DNA composta de sequências
derivadas de uma fonte diferente daquela onde se encontra.
A chave para clonar o fragmento de DNA de interesse é ligá-lo
a um vector, que se pode replicar dentro de uma célula hospedeira.
Após uma simples molécula de DNA recombinante (composta por
um vector mais o fragmento de DNA inserido) ser introduzida
numa célula hospedeira, o DNA replica-se juntamente com o
vector, gerando um largo número de moléculas de DNA idênticas.
A base para este esquema é indicada ao lado. Apesar das
numerosas variações este esquema indica os passos essenciais da
clonagem de genes.

PROCESSO ENZIMÁTICO DA CLONAGEM
Apenas moléculas de DNA relativamente pequenas podem ser clonadas em qualquer dos vector
disponíveis. Por esta razão a grande cadeia de DNA que constitui o genoma de um organismo necessita ser
clivada em fragmentos menores de modo a que estes possam ser inseridos no vector de DNA. dois tipos de
enzimas – enzimas de restrição e DNA ligases – facilitam a produção de tais moléculas de DNA
recombinante.
Cortando as moléculas de DNA em pequenos fragmentos as enzimas de restrição são endonucleases,
produzidas por bactérias, que tipicamente reconhecem sequências especificas de 4 a 8 nucleótidos (sendo o
mais comum 6), chamados de locais de restrição. Os locais de restrição são normalmente palindromas,
isto é a sequência é igual nas duas cadeias de DNA quando lidas
na direcção 5’ 3’, são simétricos em relação a um eixo.
As enzimas de restrição provocam cortes confusos nas duas
cadeias de DNA no seu local de restrição, gerando fragmentos
que possuem uma cauda em cadeia simples nas duas
extremidades. A cauda formada num fragmento é complementar
da formada noutro fragmento pela mesma enzima de restrição.
À temperatura ambiente as regiões em cadeias simples são
capazes de emparelhar entre si.
O DNA isolado de um organismo individual possui uma
sequência específica, que puramente por acaso vai conter uma
série de locais de restrição. Deste modo uma dada enzima de
restrição vai cortar o DNA (de uma fonte particular) numa série de fragmentos reproduzíveis ou fragmentos
de restrição. Várias enzimas de restrição já foram isoladas de várias espécies de bactérias, permitindo
cortar as moléculas de DNA num largo número de sequências diferentes, correspondendo ao local de
reconhecimento da enzima. (ver tabela)
23

Os fragmentos de DNA podem ser inseridos no vector de DNA com a adição de DNA ligases. Durante a
replicação normal do DNA, as DNA ligases catalizam a ligação da extremidade 3’ à extremidade 5’
adjacentes dos fragmentos de Okazaki. No caso da clonagem esta enzima promove a ligação entre as
extremidades dos fragmentos de restrição e os vectores que possuem extremidades complementares. O
vector e o fragmento de restrição ligam-se covalentemente por ligações fosfodiéster padrão.

PLASMÍDEOS DE E. COLI
Plasmídeos são cadeias duplas de DNA circular separadas do cromossoma da célula. Este DNA
extracromossomal que ocorre naturalmente em bactérias e em eucarióticos inferiores (leveduras) existem
em relações de parasitismo ou simbiose com a sua célula hospedeira. Tal como o cromossoma bacteriano o
plasmídeo é replicado antes de cada divisão celular. Durante a divisão, cópias do plasmídeo segregam para
cada célula filha, assegurando a continuidade do plasmídeo através de sucessivas gerações.
Os plasmídeos mais usados em tecnologia de DNA
recombinante são os de E. coli. Investigadores conseguiram já
manipular estes plasmídeos de forma a optimizar o seu uso como
vectores na clonagem de DNA. Assim, alterações em porções
desnecessárias para o funcionamento normal dos plasmídeos de E.
coli produz um vector de aproximadamente 1.2 – 3 kb em
comprimento circunferencial, que contém três regiões essenciais à
clonagem: uma origem de replicação, um marcador que permite a
selecção, usualmente um gene de resistência a antibióticos e a
região de inserção dos fragmentos de DNA exógenos. Enzimas de
replicação da célula hospedeira promovem a replicação do plasmídeo a partir da origem (ORI, uma
sequência com 50 a 100 nucleótidos). Uma vez que a replicação do DNA tenha começado ela continua à
24
volta do plasmídeo circular qualquer que seja a sua sequência de nucleótidos. Deste modo qualquer
sequência de DNA num plasmídeo é replicada durante a replicação deste.
A figura que se segue ilustra a clonagem de DNA
utilizando um plasmídeos de E. coli como vectores. Quando
células de E. coli são misturadas com vectores de DNA
recombinantes, sob determinadas condições, uma pequena
fracção das células vai tomar o plasmídeo, este processo é
conhecido como transformação. Tipicamente uma célula
em cada 10.000 incorpora um único plasmídeo, esta célula
diz-se transformada. Após o vector ser incubado em E. coli
, aquelas células que incorporaram o plasmídeo podem ser
facilmente seleccionadas do outro elevado número de
células. Agora, se o plasmídeo transportar um gene de
resistência a um determinado antibiótico (p.e. ampicilina), as
células transformadas podem ser seleccionadas fazendo-as
crescer num meio contendo ampicilina, só aquelas que
incorporaram o gene de resistência sobrevivem.
Fragmentos de DNA de poucos pares de bases, cerca de
20 kb, são comummenteinseridos no vector. Se precauções
especiais forem tomadas para evitar manipulações que
possam mecanicamente partir o DNA, até longos fragmentos
de DNA podem ser inseridos no plasmídeo. Quando um
plasmídeos recombinante com um fragmento de DNA
inserido transforma uma célula de E. coli todos os genes de
resistência presentes na progenia será transmitida a os seus
descendentes e todas as células que surjam desta linha
possuirão plasmídeos com os mesmos genes inseridos. O
DNA inserido é replicado ao longo da replicação do
plasmídeo e segregado para as células filhas à medida que a
colónia cresce. Desta maneira o fragmento de DNA inicial é
replicado na colónia num largo número de cópias idênticas.
Visto que todas as células na colónia originaram-se de uma
única célula parental transformada, elas constituem clone da
célula parental, e o segmento inserido no plasmídeo parental
é referido como clone de DNA, ou DNA clonado.
A versatilidade de um vector de plasmídeo de E. coli
aumenta com a incorporação de um polilinker, uma
sequência sintética que contém uma cópia de vários locais de restrição que não estão presentes em mais
nenhum local do plasmídeo. Quando tal vector é tratado com uma enzima de restrição que reconhece um
desses locais de restrição, o vector é cortado apenas uma vez (dentro do polilinker). Subsequentemente
qualquer fragmento de DNA de tamanho apropriado produzido utilizando a mesma enzima de restrição
pode ser introduzido nesta zona utilizando DNA ligase. Plasmídeos que possuem uma região polilinker
permitem ao investigador clonar fragmentos de DNA gerados com diferentes enzimas de restrição usando o
mesmo plasmídeo, o que simplifica o procedimento experimental.

UTILIZAÇÃO DA CLONAGEM DE GENES NA BIOTECNOLOGIA
Muitas hormonas, proteínas sinalizadoras ou reguladoras são normalmente expressas em quantidades
muito baixas, impedindo o seu isolamento e purificação em grandes quantidades por técnicas bioquímicas
básicas. O uso terapêutico difuso de tais proteínas, assim como pesquisas na sua estrutura e função, depende
da eficiência dos processos para produzir grandes quantidades a custo razoável. A técnica de DNA
recombinante que transforma células de E. coli em fábricas para a síntese de proteínas pouco abundantes é
agora utilizada para a produção do factor VIII (factor de coagulação do sangue), factores estimulantes das
25
colónias de granulócitos (G-CSF), insulina, hormonas de crescimento e outras proteínas humanas com usos
terapêuticos. Por exemplo, G-CSF estimula o crescimento de granulócitos glóbulos brancos fagocíticos
essenciais para a defesa contra infecções bacterianas. A administração de G-CSF a doentes com cancro
ajuda à redução da produção de granulócitos provocados pela quimioterapia, protegendo os pacientes contra
infecções serias enquanto eles fazem quimioterapia.
O primeiro passo na produção de grandes
quantidades de proteínas pouco abundantes é obter
clones de cDNA que codifiquem para a proteína em
interesse através do PCR. O segundo passo é de fabricar
plasmídeos que vão expressar largas quantidades de
proteínas codificadas quando inseridos nas células de E.
coli. A chave para desenhar tais vectores de expressão é
adicionar um promotor, uma sequência de DNA a partir
da qual a transcrição de cDNA pode começar, como por
exemplo o processo para expressar G-CSF mostrado na
figura. Neste caso, G-CSF é expresso em E. coli
transformada com plastídeos que contenham promotores
lac adjacentes ao cDNA que codifica para G-CSF. A
transcrição do promotor lac ocorre a alta velocidade
apenas quando a lactose, ou análogos (IPTG), são
adicionadas ao meio de cultura.
Para ajudar a purificação de uma proteína eucariótica
produzida em E. coli, os investigadores muitas vezes
modificam o cDNA que codifica a proteína
recombinante para facilitar a sua separação de proteínas
endógenas de E. coli. Uma modificação comum deste
tipo é adicionar uma curta sequência de nucleótidos no
final do cDNA, de modo a que a proteína expressa tenha seis resíduos de histidina no terminal C. As
proteínas modificadas deste modo liga-se levemente a uma matriz com átomos de níquel, enquanto que a
maioria das proteínas endógenas não se irão ligar a esta matriz. As proteínas ligadas podem ser libertadas
dos átomos de níquel por um decréscimo no pH do meio. Na maioria dos casos, este procedimento retém
uma proteína pura recombinante que é funcional, visto que a adição de pequenas sequências de aminoácidos
a qualquer dos extremos de uma proteína não interfere com a actividade bioquímica da proteína.

ORGANIZAÇÃO DO GENOMA
No início do século 21, os biólogos moleculares já haviam
sequenciado o genoma inteiro de centenas de vírus, uma data
de bactérias, e a levedura da cerveja S. cerevisiae. Além disto
uma vasta gama de genomas de eucariótas multicelulares são
também já conhecidos, incluindo o nemátode C. elegans, a
mosca da fruta D. melanogaster e o genoma humano.
Análises detalhadas destas sequências revelaram que uma
larga porção do genoma de organismos superiores não
codifica mRNA ou qualquer tipo de RNA. Espantosamente
tal DNA não codificante constitui mais de 95% do genoma
humano.
O DNA não codificante em organismos multicelulares
contém muitas regiões que são similares mas não iguais.
Variações dentro de algumas extensões destes DNA
repetitivos são tão grandes que cada pessoa individual pode
ser distinguida por uma impressão digital do DNA. Além disso algum DNA repetitivo não é encontrado
constantemente na mesma posição no DNA de indivíduos da mesma espécie. Tais elementos de DNA
26
móvel, presentes tanto em eucariontes como em procariontes, podem causar mutações quando alteram o seu
local no genoma. Mesmo pensando que eles geralmente não possuem qualquer função no ciclo de vida de
um organismo individual, estes provavelmente desempenharam um papel evolução dos organismos.
Em eucariótas superiores, regiões de DNA que codificam proteínas – isto é, os genes - residem entre
esta expansão de aparente DNA não funcional. Em adição ao DNA não funcional entre os genes, intrões
não codificantes são comuns dentro dos genes. Os intrões são menos comuns mas por vezes estão presentes,
em organismos eucarióticos unicelulares e são muito raros em bactérias. Sequências do mesmo gene
codificante para determinada proteína numa variedade de espécies eucarióticas mostrou que as pressões
evolutivas seleccionam sequências relativamente similares na região codificante, ou exões. Em contraste,
amplas variações nas sequência que ocorrem entre os intrões (mesmo incluindo perda total), sugerem que a
maioria das sequências de intrões têm pouca significância funcional.

O TAMANHO DO GENOMA DE UM ORGANISMO NÃO ESTÁ DIRECTAMENTE
RELACIONADO COM A SUA COMPLEXIDADE BIOLÓGICA
Através de dados avaliados por computador com algoritmos de pesquisa de genes através da sequência
genómica foi elaborado um inventário completo dos genes codificantes de proteínas para uma grande
variedade de organismos. A figura abaixo mostra o número total de genes codificantes de proteínas em
vários genomas eucarióticos que já foram totalmente sequenciados. A função de cerca de metade das
proteínas descodificadas nestes genomas são conhecidas ou já foram previstas com base na comparação de
sequências. Uma das características surpreendentes desta comparação é que o número de genes codificantes
em diferentes organismos não parece proporcional ao nosso senso intuitivo da sua complexidade biológica.
Por exemplo C. elegans, aparentemente tem mais genes que a mosca da fruta D. melanogaster que é,
intuitivamente, mais complexa a nível estrutural e de comportamento. E os humanos possuem pouco mais
do dobro dos genes de C. elegans, o que parece completamente inexplicável dada a enorme diferença entre
os organismos.
Claramente, simples diferenças quantitativas nos genomas de diferentes organismos são inadequadas
para explicar diferenças na sua complexidadebiológica. Contudo, muitos fenómenos podem gerar maior
complexidade nas proteínas expressas por eucariótas superiores do que aquilo previsto pelos seus genomas.
Primeiro, um splicing alternativo do pré-mRNA pode conter múltiplos mRNA funcionais correspondendo a
um gene em particular. Segundo, variações nas modificações pós-tradução de algumas proteínas pode
produzir diferenças funcionais. Finalmente, diferenças qualitativas nas interacções entre as proteínas e a sua
integração nas vias (metabólicas e outras) pode contribuir significativamente para diferenças na
complexidade biológica dos organismos. A função específica de muitos genes e proteínas identificados pela
análise do genoma ainda não é conhecida.

27
DEFINIÇÃO MOLECULAR DE GENE
Em termos moleculares, um gene normalmente é definido como uma sequência inteira de ácidos
nucleicos que é necessária para a síntese de um produto funcional (polipéptido ou RNA). De acordo com
esta definição um gene inclui mais do que os nucleótidos que codificam a sequência de aminoácidos,
referido como a região codificante. Um gene também inclui toda a sequência de DNA necessária para a
síntese de determinado RNA de transcrição. Em genes eucarióticos, as regiões de controlo de transcrição
conhecidos como “enhancers” podem conter 50kb ou mais da região codificante. Outras regiões não
codificantes importantes nos genes eucarióticos são as sequências que especificam a clivagem 3’ e a
poliadenilação, conhecida como local poly(A), e o splicing do transcrito primário de RNA, conhecidos como
locais de splicing. Mutações nestes sinais de processamento de RNA impede a expressão de mRNA
funcional e deste modo do polipéptido codificado.
Apesar da maioria dos gene serem transcritos em mRNAs, os quais codificam proteínas, claramente
algumas sequências de DNA são transcritas em RNAs que não codificam proteínas (rRNA e tRNA).
Contudo, porque o DNA que codifica tRNAs e rRNAs pode causar fenótipos específicos quando é mutado,
estas regiões de DNA geralmente são referidas como genes de rRNA e tRNA, mesmo apesar do produto
final não serem proteínas. Muitas outras moléculas de RNA são transcritas em genes não codificantes de
proteínas.
Ao contrário dos genes das bactérias e das leveduras, em que geralmente faltam intrões, muitos genes em
animais e plantas multicelulares contêm intrões que são removidos durante o processamento do RNA. Em
muitos casos, os intrões num gene são consideravelmente mais longos do que os exões. Por exemplo, dos
~50.000 pares de bases que compõem os genes humanos que codificam proteínas de tamanho vulgar, mais
de 95% do gene é constituído por intrões e regiões não codificantes. Muitas proteínas de grande tamanho
em organismos superiores possuem domínios repetidos e são codificadas por genes constituídos por exões
repetidos ou semelhantes separados por intrões de tamanho variável.

ORGANIZAÇÃO CROMOSSOMAL DE GENES E DE DNA NÃO CODIFICANTE
Comparações feitas entre o DNA total nos cromossomas de várias espécies sugeriu que muito DNA em
alguns organismos não codificava RNA ou possuía qualquer função reguladora ou estruturante aparente. Por
exemplo as leveduras, a mosca da fruta, galinhas e os humanos possuem, sucessivamente, mais DNA nas
suas séries haplóides de cromossomas (12, 180, 1300, e 3300MB, respectivamente) do que aquele que seria
esperado de acordo com a sua complexidade. Mesmo assim os anfíbios são aqueles com maior quantidades
de DNA por célula, os quais são, certamente, menos complexos que os humanos tanto em estrutura como
em comportamento. Ainda mais surpreendente, os protozoários unicelulares da espécie Amoeba dubia
possuem 200x mais DNA por célula que os humanos. Por exemplo, as túlipas possuem 10 vezes mais DNA
nas suas células que os humanos. A percentagem de DNA por célula também varia entre organismos
relativamente relacionados. Todos os insectos e todos os anfíbios parecem ser semelhantemente complexos,
mas a quantidade de DNA haplóide em espécies dentro destas classes filogenéticas varia em factor de 100.
As sequências detalhadas e a identificação dos exões no DNA cromossomal providenciou evidencias
directas que o genoma de eucariótas elevados contém grande quantidade de DNA não codificante. Por
28
exemplo, apenas uma pequena fracção da família de genes da β-globina em humanos codifica para uma
proteína, cerca de 80kb.

Ainda mais, quando comparado com outras regiões do DNA de vertebrados, a família das ß-globinas é
anormalmente rica em sequências codificadoras de proteínas, e os intrões na família de genes são
consideravelmente curtos daqueles em muitos outros genes humanos. Em contraste, uma sequência tio de
80kb de DNA da levedura S. cerevisiae, contém muitos espaços, próximos, codificantes de proteínas sem
intrões e relativamente muito menos DNA não codificante.

A densidade dos genes varia consideravelmente em diferentes regiões do DNA cromossomal humano,
desde regiões ricas de genes, tais como a família das ß-globinas até largos desertos pobres em genes. Do
total do genoma humano já sequenciado apenas ~1.5% corresponde a sequências codificadoras de proteínas
(exões). A maioria dos exões humanos contém 50-200 pares de bases, contudo os exões 3’ em muitas
unidades de transcrição é muito maior. Os intrões humanos variam consideravelmente em tamanho. Apesar
de alguns terem ~90pb de tamanho alguns são bem maiores. O tamanho médio é 3,3 kb. Pensa-se que
aproximadamente um terço do genoma humano é transcrito em percursores de pré-mRNA mas alguns 95%
destas sequências são intrões, os quais são removidos durante o splicing.
Pressões selectivas diferentes durante a evolução podem ter contribuído, pelo menos em parte, para a
notável diferença na quantidade de DNA não funcional em organismos unicelulares e multicelulares. Por
exemplo, os microrganismos devem competir por quantidades limitadas de nutrientes no seu ambiente, e a
economia metabólica é uma característica critica. Visto que a síntese de DNA não codificante requer tempo
e energia, presumivelmente houve pressões para eliminar aquelas zonas de DNA não codificantes durante a
evolução. Por outro lado, a selecção natural nos vertebrados depende consideravelmente do seu
comportamento. A energia investida na síntese de DNA é trivial comparada com a energia metabólica
necessária para o movimento dos músculos; assim houve muito poucas pressões para eliminar DNA não
funcional nos vertebrados.

GENES CODIFICANTES PODEM SER SOLITÁRIOS OU PERTENCER A UMA FAMÍLIA
A sequência de nucleótidos no DNA cromossomal podem ser classificados na sua estrutura básica e
função, tal como mostrado na tabela 10-1.
Em organismos multicelulares, ~25-50% dos genes codificantes de proteínas são representados apenas
uma vez no genoma haplóide e por isso são chamados de genes solitários. Um exemplo bem estudado de
um gene solitário é o gene de lisozimas das galinhas. A sequência de 15 kb que codifica a lisozima constitui
uma simples unidade de transcrição contendo 4 exões e 3 intrões. As regiões laterais, estendendo-se cerca
de 20kb acima e abaixo da unidade de transcrição, não codificam qualquer mRNAs detectável. E lisozima é
uma enzima que se encontra no ovo da galinha assim como nas lágrimas humanas, em ambos os casos ela
serve para manter a superfície, do ovo ou do olho, esterilizadas.
Genes duplicados constituem o segundo grupo de genes codificantes de proteínas. Estes são genes com
sequências aproximadas mas não idênticas que geralmente se encontram localizadas de 5 a 50 kb um do
outro. No genoma dos vertebrados genes duplicados constituem provavelmente metade das sequências
codificantes. Uma série de genes duplicados que codifiquem proteínas com semelhantes, mas não idênticas,
sequências de aminoácidos é chamada uma família de genes; as proteínas codificadas, relacionadas e
homólogas constituem uma família de proteínas. Uma gama de família de proteínas, tal como as cinases,
factores

Cópia de Sebenta Bio Mol_Hugo Soares

Outros

Ferramentas de estudo

Conteúdos escolhidos para você

3 LIVRO GENETICA HUMANA AVA

BIOLOGIA MOLECULAR EXER SIMULA

RESPOSTAS - Biologia Molecular Aplicada À Biomedicina

Resumo Livro Genética Humana - Maria R

EBOOK Genética e Biologia Molecular_240909_122547

Perguntas dessa disciplina

Questão 05 Proteínas controlam praticamente todos os processos que ocorrem em uma célula, exibindo uma quase infinita diversidade de funções. Para exp

Questao 09 O DNA serve como um manual de instrucoes da vida. So que alteracoes ao acaso podem modificar esse manual. Fatores como radiacao e variacao

oi Todas as alternativas estão erradas, EXCETO: Selecione a resposta: aUm determinado ribossomo pode fazer apenas um tipo de proteína.bAs subuni...

AJUDAR LISTA EXERCICIOS 1) Todas as alternativas estão erradas, EXCETO: A) Um determinado ribossomo pode fazer apenas um tipo de proteína. B) As ...

3 Desmarcar para revisão 00 45 3 hora min S Algumas estruturas são fundamentais às células bacterianas, estando presentes em todas as bactérias. So...

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Conteúdos escolhidos para você

3 LIVRO GENETICA HUMANA AVA

BIOLOGIA MOLECULAR EXER SIMULA

RESPOSTAS - Biologia Molecular Aplicada À Biomedicina

Resumo Livro Genética Humana - Maria R

EBOOK Genética e Biologia Molecular_240909_122547

Perguntas dessa disciplina

Questão 05 Proteínas controlam praticamente todos os processos que ocorrem em uma célula, exibindo uma quase infinita diversidade de funções. Para exp

Questao 09 O DNA serve como um manual de instrucoes da vida. So que alteracoes ao acaso podem modificar esse manual. Fatores como radiacao e variacao

oi Todas as alternativas estão erradas, EXCETO: Selecione a resposta: aUm determinado ribossomo pode fazer apenas um tipo de proteína.bAs subuni...

AJUDAR LISTA EXERCICIOS 1) Todas as alternativas estão erradas, EXCETO: A) Um determinado ribossomo pode fazer apenas um tipo de proteína. B) As ...

3 Desmarcar para revisão 00 45 3 hora min S Algumas estruturas são fundamentais às células bacterianas, estando presentes em todas as bactérias. So...

Mais conteúdos dessa disciplina