Buscar

regulação da expressão

Prévia do material em texto

EXPRESSÃO GÊNICA
Ao completar este capítulo, você deve ser capaz de: 
* Descrever um ciclo de replicação geral para cada um dos sete tipos de genoma de vírus;
* Explicar como é determinado o padrão de expressão gênica de um vírus pela  estrutura do genoma do vírus e como ele é replicado;
* Compreender o papel dos eventos pós-transcricionais no controle da expressão gênica dos vírus.
EXPRESSÃO DA INFORMAÇÃO GENÉTICA
A interação mais importante entre um vírus e sua célula hospedeira é a dependência do vírus pelo aparelho celular de síntese de ácidos nucléicos e proteínas. O curso de replicação do vírus é determinado por um rigoroso controle da expressão gênica. Existem diferenças fundamentais no controle desses processos entre células procariotas e eucariotas. Estas diferenças, inevitavelmente, afetam ao vírus que as utilizam como hospedeiras. Além disso, a relativa simplicidade e tamanho compacto do genoma do vírus (em comparação com os das células mais simples) impõem restrições adicionais. As células tiveram que desenvolver mecanismos variados e complexos para controlar a expressão gênica, utilizando a sua ampla capacidade genética. Em contrapartida, os vírus têm alcançado um alto controle quantitativo, temporal e espacial específico da expressão com recursos genéticos muito mais limitados, como foi discutido antes. 
Os vírus têm combatido as suas limitações genéticas com a evolução de uma série de soluções para estes problemas. Estes mecanismos incluem:
* Poderosos sinais positivos e negativos que promovem ou reprimem a expressão gênica;
* Genomas altamente comprimidos nos quais as fases abertas de leitura (ORF) se sobrepõem ocupando lugares comuns;
* Os sinais de controle frequentemente estão localizados dentro de outros genes;
* Diversas estratégias destinadas a criar múltiplos polipeptídios a partir de um único RNA mensageiro.
A expressão genética envolve ciclos de regulação mediados por sinais que atuam tanto em cis (afetando a atividade de regiões genética contíguas) quanto em trans (dando origem a produtos difusíveis que atuam em sítios de regulação contíguos ou não ao sítio no qual eles são produzidos). Por exemplo, promotores são sequências que atuam em cis e estão localizados adjacentes aos genes cuja transcrição controlam, enquanto as proteínas como os fatores de transcrição se ligam em sequências específicas presentes em qualquer sequência de ácido nucléico presente na célula e, portanto, são exemplos de fatores que atuam em trans. A relativa simplicidade de genomas de vírus e a elegância dos seus mecanismos de controle são os modelos que formam a base da nossa compreensão atual da regulação gênica. Este capítulo assume a familiaridade com os mecanismos celulares envolvidos no controle da expressão gênica, porém, para ilustrar os detalhes da expressão dos gene virais, um breve resumo de alguns aspectos será dado à continuação.
CONTROLE DA EXPRESSÃO GÊNICA EM PROCARIONTES
As células bacterianas ficam na segunda posição quando comparadas aos vírus quanto à especificidade e economia nos mecanismos de controle genéticos e, eventualmente, em relação à intensidade com que estes mecanismos têm sido estudados. O controle genético é exercido tanto no nível de transcrição como nos estágios subsequentes de expressão gênica (pós-transcricional).
O início da transcrição é regulado principalmente de forma negativa pela síntese de proteínas repressoras que atuam em trans ligando-se às sequências do operador
à montante das sequências codificadoras de proteínas. Coleções de genes metabolicamente relacionados são agrupados e controlados coordenadamente como "operons”. A transcrição desses operons normalmente produz um mRNA policistrônico que codifica várias proteínas diferentes. Durante as fases subsequentes de expressão, a transcrição é regulada por
uma série de mecanismos que atuam, na famosa frase de Mark Ptashne, como "interruptores genéticos” ligando ou desligando a transcrição de genes diferentes. Tais mecanismos incluem a antiterminação, que é controlada por fatores que atuam em trans e que promovem
a síntese de longos transcritos que codificam informação genética adicional, e por várias modificações da RNA polimerase. Os fatores σ (sigma) bacterianos são apoproteínas
que afetam a especificidade da holoenzima RNA polimerase para ligar-se em diferentes promotores. Vários bacteriófagos (por exemplo, o fago SP01 de Bacillus subtilis) codificam proteínas que funcionam como fatores σ alternativos que sequestram a RNA polimerase e alteram a taxa na qual os genes do fago são transcritos. O fago T4 de Escherichia coli codifica uma enzima que realiza uma modificação covalente (adenosina difosfato [ADP] ribosilação) da RNA polimerase da célula hospedeira. Acredita-se que isto elimina a exigência da holoenzima polimerase pelo fator σ e consegue um efeito semelhante ao da produção de fatores σ modificados por outros bacteriófagos. 
No nível pós-transcricional a expressão gênica em bactérias também é regulada pelo controle na tradução. Os exemplos de vírus mais conhecidos que utilizam este fenômeno vêm a partir do estudo de bacteriófagos da família Leviviridae, tais como o R17, MS2, e Qβ. Nestes fagos, a estrutura secundária no RNA genômico de fita simples  do fago, não só regula a quantidade de diferentes proteínas do fago que são traduzidas, mas também opera no controle temporal de um interruptor (switch) que regula a relações entre as diferentes proteínas produzidas nas células infectadas.
CONTROLE DA EXPRESSÃO NO BACTERIÓFAGO ʎ
O genoma do fago ʎ tem sido estudado em grande detalhe e ilustra alguns dos mecanismos descritos acima, incluindo a ação de proteínas repressoras na regulção de replicação lisogênica ou lítica e a antiterminação da transcrição por fatores, codificado pelo fago, que atuam em trans. Tal foi o impacto dessas descobertas que nenhuma discussão sobre o controle da expressão gênica do vírus poderia ser considerada completa sem uma análise pormenorizada deste fago.
O fago ʎ foi descoberto por Esther Lederberg, em 1949. As experiências no Instituto Pasteur por André Lwoff em 1950 mostraram que algumas cepas de Bacillus megaterium pararam de crescer quando irradiadas com luz ultravioleta e, posteriormente, lisadas, liberando uma cultura de partículas do bacteriófago. Junto com François Jacob e Jacques Monod, Lwoff posteriormente mostrou que as células de algumas linhagens bacterianas possuíam um bacteriófago em uma forma dormente, conhecido como profago, e que o fago poderia ser feito para alternar entre os estágios de crescimento lisogênico (improdutivo) e lítico (produtivo). Depois de muitos anos de estudo, a nossa compreensão de ʎ foi refinada em uma imagem que representa um dos mais conhecidos e mais elegantes sistemas de controle da expressão gênica já investigado. Um mapa genético simplificado de ʎ é mostrado na Figura 5.1. Para a regulação do ciclo de crescimento do fago, os genes estruturais que codificam os componentes da cabeça e cauda do capsídeo viral podem ser ignorados. Os componentes pertinentes envolvidos no controle genético são os seguintes: 
1. PL é o promotor responsável pela transcrição do lado esquerdo do genoma de ʎ, incluindo N e cIII.
2. OL é uma pequena região (cerca de 50 pb) não codificante do genoma do fago que se situa entre os genes cI e N próximo a PL.
3. PR é o promotor responsável pela transcrição do lado direito do genoma de ʎ, incluindo cro, cII, e os genes que codificam as proteínas estruturais.
4. OR é uma pequena região (cerca de 50 pb) não codificante do genoma do fago que se situa entre os genes IC e cro próximo a PR.
5. cI é transcrito a partir do seu próprio promotor e codifica uma proteína repressora de 236 aminoácidos que se liga a OR, impedindo a transcrição de cro, mas permitindo a transcrição de cI e em OL, impedindo a transcrição dos genes N e os outros genes na extremidade esquerda do genoma.
6. cII e cIII codificam proteínas ativadoras que se ligam no genoma aumentando a transcrição do genecI.
7. cro codifica uma proteína de 66 aminoácidos que se liga a OR, bloqueando a ligação do 
repressor neste sítio.
8. N codifica uma proteína antiterminadora que atua como um fator ρ (rho) alternativo, 
para a RNA polimerase da célula hospedeira, modificando sua atividade e permitindo a 
transcrição a partir de PL e PR.
9. Q é um antiterminador semelhante ao N, mas este só permite a transcrição a partir de PR.
Em uma célula recém infectada, N e cro são transcritos a partir de PL e PR, respectivamente (Figura 5.2). A proteína N permite que a RNA polimerase transcreva uma série de genes do fago, incluindo os responsáveis pela recombinação do DNA e da integração do pro-fago, bem como cII e cIII. A proteína N atua como um regulador positivo da transcrição.  Na ausência da proteína N, a holoenzima RNA polimerase para em certas sequências localizadas no final dos genes N e Q, conhecidas como sítios nut e qut, respectivamente. No entanto, complexos entre a proteína N e a RNA polimerase  são capazes de superar essa limitação e permitir a transcrição completa a partir de PL e PR. Complexos entre a proteína Q e a RNA polimerase resultam na transcrição extensiva só a partir de PR. Enquanto os níveis das proteínas cII e cIII aumentam na célula, a transcrição do gene repressor cI a partir do seu próprio promotor é ligada. 
É neste momento que ocorre o evento crítico que determina o resultado da infecção. A proteína cII é constantemente degradada por proteases presentes na célula. Se os níveis de cII permanecerem abaixo de um nível crítico a transcrição a partir de PR e PL continua e o fago sofre um ciclo de replicação produtiva que culmina na lise da célula e a liberação das partículas do fago. Esta é a sequência de eventos que ocorre na grande maioria das células infectadas. Entretanto, em alguns casos raros, a concentração de proteína cII aumenta, a transcrição da cI é reforçada e os níveis intracelulares da proteína repressora cI aumenta. O repressor liga-se a OR e OL que impede a transcrição de todos os genes do fago (particularmente cro, veja abaixo), exceto ele mesmo. O nível de proteína cI é mantido automaticamente por um mecanismo de feedback negativo, quando está em altas concentrações o repressor liga-se também ao final do flanco esquerdo de OR e impede a transcrição da cI (Figura 5.3). Esta auto-regulação da síntese de cI mantém a célula em um estado estável de lisogenia. Se este for o caso, como é que essas células nunca deixam esse estado e passam para um ciclo de replicação lítico? Estresse fisiológico e irradiação ultravioleta  em particular resultam na indução de proteína RecA na célula hospedeira. Esta proteína, cuja função normal é induzir a expressão de genes celulares que permitem à célula adaptar-se e sobreviver em condições ambientais alteradas, cliva a proteína repressora cI. Em si, isso não seria suficiente para impedir que a célula volte ao estado lisogênico. No entanto, quando a proteína repressora não está ligada em OR, cro é transcrita a partir PR. Cro também se liga a OR, mas ao contrário de cI, que preferencialmente  liga-se ao final do lado direito de OR, a proteína cro liga-se preferencialmente no lado esquerdo de OR, impedindo a transcrição da cI e reforça sua própria transcrição em um ciclo de feedback positivo. Assim, o fago fecha um ciclo lítico e não pode retornar ao estado lisogênico. 
Esta descrição é uma versão muito simplificada do controle genético da expressão em fago λ. Uma grande quantidade de detalhes é conhecida sobre os mecanismos moleculares  pelos quais o sistema acima explicado funciona, mas devido ao fato de que este tema poderia facilmente preencher todo um livro sobre a regulação em λ existiria espaço insuficiente para contá-lo todo aqui. Os detalhes moleculares  do sistema de λ não são apenas de interesse particular, mas também colaboraram com a nossa forma  de compreender a regulação genética em células procariotas e eucariotas.
A determinação das estruturas das proteínas envolvidas no esquema acima permitiu identificar os princípios fundamentais por trás da observação de que muitas proteínas de organismos independentes são capazes de reconhecer e se ligar a sequências específicas na
moléculas de DNA. Os conceitos de proteínas que se ligam independente ao DNA e possuem domínios de dimerização, cooperatividade na ligação de proteínas ao DNA, e “contorção” do DNA que permite que proteínas ligadas a locais distantes possam interagir umas com as outras têm surgido a partir do estudo de λ. 
CONTROLE DA EXPRESSÃO GÊNICA EUCARIONTE 
O controle da expressão gênica em células eucarióticas é muito mais complexo do que em 
células procariotas e envolve uma abordagem de várias etapas na qual diversos mecanismos de controles exercem seus efeitos em vários níveis. O primeiro nível de controle ocorre antes da transcrição e depende da configuração local do DNA. O DNA nas células eucarióticas possui uma estrutura elaborada, formando uma associação complexa e dinâmica com numerosas proteínas para constituir a cromatina. 
Embora o conteúdo do núcleo das células eucarióticas pareça amorfo em micrografias eletrônicas (pelo menos em interfase), ele é altamente organizado. A cromatina interage com a base estrutural do núcleo, a matriz nuclear, e essas interações são importantes no controle da expressão gênica. Localmente, a configuração do nucleossomo e conformação do DNA, particularmente a formação helicoidal Z, também são importantes.  A digestão da cromatina com DNAse I não dá um mesmo padrão de digestão uniforme, mas revela sítios especiais de hipersensibilidade à DNAse que indicam diferenças na função de várias regiões da cromatina. É possível, por exemplo, que os retrovírus sejam mais propensos a se integrar nestes locais do genoma da célula hospedeira do que em outros lugares. DNA transcricionalmente ativo é também hipometilado, ou seja, há uma relativa escassez de nucleotídeos modificados pela ligação covalente de grupos metil destas regiões em comparação com a frequência de metilação em regiões transcricionalmente inativas do genomas. A metilação de sequências do vírus Moloney da leucemia murina em embriões de camundongos pré-implantados tem mostrado suprimir a transcrição do genoma do pró-vírus. 
O segundo nível de controle encontra-se no processo de transcrição em si, que mais uma vez é muito mais complexo do que em procariontes. Há três formas de RNA polimerase nas células eucarióticas que podem ser distinguidas pela sua sensibilidade em relação à droga α-amanitina e que apresentam especificidades para diferentes classes de genes (Tabela 5.1). A taxa na qual a transcrição é iniciada é um ponto-chave de controle na expressão de genes eucarióticos. A iniciação é influenciada significativamente por sequências à montante do sítio de iniciação da transcrição que funcionam atuando como sítios de reconhecimento para famílias de proteínas altamente específicas de ligação ao DNA conhecidas coloquialmente como fatores de transcrição. No local imediatamente à montante do início de transcrição existe uma região relativamente pequena conhecida como o promotor. É neste local que os complexos de transcrição, compostos por RNA polimerase mais proteínas acessórias que se ligam ao DNA dando início à transcrição; porém, as sequências mais à montante da área do promotor influenciam a eficiência com que os complexos de transcrição se formam. A taxa de iniciação depende da combinação de fatores de transcrição ligados a estes “enhancers”. As propriedades dessas sequências enhancers são notáveis, na medida em que  podem ser invertidas e/ou movidos, em relação à posição do sítio de início da transcrição, sem perder a sua atividade e podem exercer sua influência mesmo a uma distância de kilobases. Isto enfatiza a flexibilidade do DNA, que permite que proteínas ligadas em locais distantes possam interagir umas com as outras, como também mostrado pela interação proteína-proteína vista na regulação da expressão gênica no fago λ  (acima). A transcrição de genes eucarióticosresulta na produção de mRNAs monocistrônicos, cada qual é transcrito a partir do seu próprio promotor. 
Na fase seguinte, a expressão do gene é influenciada pela estrutura do mRNA produzido. A estabilidade dos mRNAs eucarióticos varia consideravelmente, alguns tem meia-vida relativamente longa na célula (por exemplo, várias horas). A meia-vida de outros, normalmente aqueles que codificam proteínas reguladoras, pode ser muito curta (por exemplo, um minuto). A estabilidade dos mRNAs eucarióticos depende da velocidade com 
que são degradados. Isso é determinado por fatores tais como as suas sequências terminais, que consistem de uma estrutura CAP metilada na extremidade 5’ e ácido poliadenílico na extremidade 3’, bem como sobre a estrutura secundária geral do mensageiro. No entanto, a expressão do gene pode também ser regulada por splicing alternativo de precursores de RNA heterogêneo (pesado) nuclear (hnRNA) no núcleo, que pode alterar o significado genético de diferentes transcritos de mRNAs a partir do mesmo gene. Em células eucarióticas, o controle é exercido também durante a exportação do RNA do núcleo para o citoplasma. 
Finalmente, o processo de tradução oferece novas oportunidades para o controle da expressão. A eficiência com que diferentes mRNAs são traduzidos varia muito. Estas diferenças resultam em grande parte da eficiência com que os ribossomos se ligam aos diferentes mRNAs e reconhecem o codon de iniciação da tradução AUG em diferentes contextos de sequência, bem como a velocidade com que diferentes sequências são convertidas em proteínas. Certas sequências podem agir como promotores de tradução, desempenhando uma função análoga a de promotores de transcrição. 
O ponto de proporcionar essa extensa lista de mecanismos de expressão de genes eucarióticos é que todos eles são utilizados pelos vírus para controlar a sua expressão gênica. Exemplos de cada tipo são apresentados nas seções abaixo. Se isso parece notável, deve ser lembrado que o controle da expressão gênica em células eucarióticas foi desvendado 
em grande parte pela utilização de vírus como sistema modelo, portanto, encontrar exemplos desses mecanismos em vírus somente é na realidade uma profecia auto-realizável.
ESTRATÉGIAS DE CODIFICAÇÃO DO GENOMA
No capítulo sobre os genomas, a estrutura do genoma foi um elemento arbitrário usado  para classificar os vírus em sete grupos. A outra parte desse sistema é a maneira pela qual a informação genética de cada classe de genomas virais é expressa.  A replicação e expressão do genoma do vírus são indissociáveis, e isso é particularmente verdade no caso dos vírus que tem RNA no seu genoma. Aqui, os genomas das sete classes de vírus descritas anteriormente são revistos, desta vez examinadas da maneira pela qual a informação genética de cada classe é expressa. 
Classe I: DNA Dupla fita
Já foi dito que esta classe de vírus pode ser subdividida em outros dois grupos: aqueles em que a replicação do genoma é exclusivamente nuclear (por exemplo, Adenoviridae, Polyomaviridae, Herpesviridae) e aqueles em que a replicação ocorre no citoplasma (Poxviridae). Em certo sentido, todos esses vírus podem ser considerados como semelhantes, porque todos os seus genomas se assemelham ao DNA dupla fita celular, eles são essencialmente transcritos pelos mesmos mecanismos dos genes celulares. No entanto, há profundas diferenças entre eles relacionadas com o grau em que cada família é dependente da máquina da célula hospedeira. 
Poliomavírus e papilomavírus
Poliomavírus são fortemente dependentes da maquinaria celular para a replicação e expressão gênica. Estes codificam fatores que atuam em trans (antígenos T) que estimulam a transcrição (e replicação do genoma). Papilomavírus, em particular, são dependentes da célula para a replicação, que ocorre apenas em queratinócitos terminalmente diferenciados e não em outros tipos celulares, embora eles codifiquem várias proteínas de regulação em trans. 
Adenovírus
Adenovírus também são fortemente dependentes do aparelho celular para a transcrição, mas eles possuem vários mecanismos que regulam especificamente a expressão gênica do vírus. Estes incluem ativadores da transcrição que atuam em trans, como a proteína E1A, e regulação pós-transcricional da expressão conseguida por splicing alternativo de mRNAs e os RNAs VA codificados pelo vírus . A infecção de células por Adenovírus é dividida em duas fases, precoce e tardia, a última fase começa no momento em que ocorre a replicação do genoma; porém, no adenovírus essas fases diferem menos do que em herpesvírus (abaixo). 
Herpesvírus 
Estes vírus são menos dependentes das enzimas celulares que os grupos anteriores. Eles 
codificam muitas enzimas envolvidas no metabolismo do DNA (por exemplo, timidina quinase) e vários fatores que atuam em trans que regulam a expressão temporal de genes do vírus 
controlando as fases da infecção. A transcrição do genoma grande e complexo é sequencialmente regulada em forma de cascata (Figura 5.4). Pelo menos 50 proteínas codificadas pelo vírus são produzidas após a transcrição do genoma pela RNA polimerase II da célula hospedeira. Três classes distintas de mRNAs são feitos:
  α: mRNAs Imediatamente precoces (IE) que codificam cinco reguladores da transcrição do vírus que atuam em trans;
  β: (atrasados) mRNAs iniciais que codificam proteínas reguladoras não estruturais e algumas proteínas estruturais menores;
  γ: mRNAs tardios que codificam as proteínas estruturais mais importantes.
A expressão gênica em herpesvírus está fortemente regulada e coordenada, como indicado pelas seguintes observações (ver Figura 5.4):
Se a tradução é bloqueada, por exemplo, logo após a infecção (por tratamento de células com cicloheximida), mRNAs precoces imediatamente se acumulam no núcleo, mas não são transcritos mais mRNAs virais.
Síntese do produto gênico precoce desliga o produto precoce imediato e 
inicia a replicação do genoma.
Algumas das proteínas estruturais tardias (g1) são produzidas independentemente da replicação do genoma; outras (G2) só são produzidos após a replicação. 
Tanto as proteínas precoces quanto as imediatamente precoces são necessárias para iniciar a replicação do genoma. A DNA polimerase DNA-dependente codificada pelo vírus e as proteínas de ligação ao DNA estão envolvidas na replicação do genoma, juntamente com uma série de enzimas  (por exemplo, timidina quinase) que alteram a bioquímica celular. A produção de todas estas proteínas é rigorosamente controlada. 
Poxvírus
A replicação do genoma e a expressão gênica em poxvírus são quase independentes dos mecanismos celulares (exceto a exigência de ribossomos da célula hospedeira). O genoma dos poxvírus codifica várias enzimas envolvidas no metabolismo do DNA, na transcrição de genes virais, e na modificação pós-transcricional de mRNAs. Muitas destas enzimas são empacotadas no interior da partícula do vírus (que contém> 100 proteínas), permitindo  que a transcrição e replicação do genoma possam ocorrer no citoplasma (em vez de no núcleo, assim como todas as famílias acima descritas), quase totalmente sob o controle do vírus. A expressão gênica é realizada por enzimas do vírus associadas ao núcleo da partícula e é dividida em duas fases indistintas: 
Genes precoces: Estes representam cerca de 50% do genoma do poxvírus e se expressam antes da replicação do genoma dentro de um núcleo de partículas parcialmente revestidas, resultando na produção de mRNAs sem splicing, com CAP 5’ e extremidade 3’ poliadenilada;
Genes tardios: Estes são expressos após replicação do genoma no citoplasma, mas 
sua expressão também é dependente de proteínas codificadas pelo vírus em vez de proteínas celulares (que estão localizadas no núcleo). Como nos genes de herpesvírus, os promotores tardios são dependentes de replicação do DNA antes da atividade. 
Classe II: DNA simples fita 
Tanto o parvovírus autônomo quanto o dependente de vírus helper são altamente dependentes de ajuda externa para a expressão dosgenes e replicação do genoma. Isto acontece, presumivelmente, porque o tamanho do seu genoma é muito pequeno e não lhes permite codificar o aparelho bioquímico necessário; portanto, eles parecem ter evoluído como uma forma extrema de parasitismo, utilizando as funções normais presentes no núcleo das células do hospedeiro tanto para a expressão quanto para a replicação (Figura 5.5). Os membros do gênero com replicação defeituosa Dependovirus de Parvoviridae são inteiramente dependente de adenovírus ou superinfecção com herpesvírus para o “empréstimo” de outras funções auxiliares essenciais para sua replicação.  Os genes do adenovírus necessários como helpers são os genes precoces, reguladores da transcrição como E1A em vez de genes estruturais tardios, mas tem sido demonstrado que o tratamento de células com luz ultravioleta, cicloheximida, ou algumas substâncias cancerígenas podem substituir a exigência de vírus helper. Portanto, a ajuda necessária parece ser uma modificação do ambiente celular (provavelmente afetando a transcrição do genoma defeituoso de parvovírus) ao invés de uma proteína específica do vírus. 
A familia Geminiviridae também se enquadra nesta classe de estruturas genômicas (Figura 3.15). A expressão do seu genoma é muito diferente do parvovírus, mas no entanto, ainda depende muito das funções das células hospedeiras. Existem fases abertas de leitura (ORFs) em ambas as orientações do DNA do vírus, o que significa que tanto as fitas com sentido (+) e (-) são transcritas durante a infecção. Os mecanismos envolvidos no controle da expressão gênica não foram totalmente investigados, mas pelo menos alguns geminivírus (Subgrupo I) podem utilizar o splicing.
Classe III: RNA dupla fita 
Todos os vírus com genoma de RNA diferem fundamentalmente das células do hospedeiro, que possuem DNA dupla fita no genoma; portanto, embora cada um dos vírus deva ser bioquimicamente "compatível" com a sua célula hospedeira, existem diferenças fundamentais nos mecanismos de expressão gênica entre os vírus e a célula hospedeira. Reovírus têm genomas múltiplos e replicam-se no citoplasma da célula hospedeira. Caracteristicamente, nos vírus com genomas segmentados de RNA, um mRNA separado monocistrônico é produzido a partir de cada segmento (Figura 5.6). 
No início da infecção, a transcrição dos segmentos dos genomas dsRNA ocorre pela atividade da transcriptase específica do vírus dentro das partículas de subvírus parcialmente revestidas. Pelo menos cinco atividades enzimáticas estão presentes nas partículas de reovírus para realizar este processo, embora estes não sejam necessariamente realizados por peptídeos separados (Tabela 5.2, Figura 2.12). Esta transcrição primária, resulta na transcrição de RNAs com CAP 5’ mas que não são poliadenilados e que deixam o núcleo do vírus para serem traduzidos no citoplasma. Os diversos segmentos de genoma são transcritos/traduzidos em diferentes frequências,  que é talvez a principal vantagem de um genoma segmentado. RNA é transcrito conservadoramente; ou seja, apenas fitas com sentido (-) são utilizadas, resultando na síntese de mRNAs com sentido (+), aos quais é adicionado o CAP 5’ ainda no interior do núcleo (tudo isso ocorre sem que haja síntese de novas proteínas). Transcrição secundária ocorre mais tarde na infecção dentro das novas partículas produzidas nas células infectadas e resulta em transcritos sem CAP nem cauda poliadenilada. O genoma é replicado de forma conservativa. Excesso de fitas com sentido (+) é produzido e servem como mRNAs tardios e como modelos para síntese de fitas com sentido (-) (ou seja, cada fita (-) produz muitas fitas (+), e não um para um como na replicação semiconservativa do DNA).
Classe IV: RNA simples fita sentido (+)
Este tipo de genoma viral ocorre em muitos vírus de animais e plantas. Em termos do número de diferentes famílias como no número de vírus individuais, esta é a maior classe de genoma viral. Fundamentalmente, esses genomas virais agem como RNA mensageiros e se traduzem imediatamente após a infecção da célula hospedeira. Não é de surpreender que com tantos representantes esta classe de genoma mostre um leque muito diversificado de estratégias de controle expressão gênica e da replicação do genoma; no entanto, em termos muito gerais, os vírus desta categoria pode ser subdivididos em dois grupos como segue:
Produção de uma poliproteína que engloba a totalidade da informação genética do vírus, que posteriormente é clivada por proteases para produzir polipeptídeos precursores e maduros: essas clivagens podem ser uma forma sutil de regular a expressão da informação genética. Clivagens alternativas resultam na produção de várias proteínas com propriedades distintas a partir de um único precursor (por exemplo, em picornavírus e potivírus) (Figura 5.7). Alguns vírus de plantas com genomas multipartidos utilizam uma estratégia muito semelhante para controlar a expressão gênica, embora uma única poliproteína seja produzida por cada um dos segmentos genômicos. O exemplo melhor estudado é o comovírus, cuja organização do genoma é muito semelhante ao do picornavírus e pode representar um outro membro desta "Superfamília" (Figura 5.7).
A produção de mRNAs subgenômicos, resultante de duas ou mais rodadas de tradução
do genoma: Essa estratégia é usada para obter a separação temporal das fases de replicação essencialmente "precoces" e "tardias", nas quais proteínas não estruturais, incluindo uma replicase do vírus, são produzidas durante a fase “precoce” seguidas
por proteínas estruturais na fase “tardia” (Figura 5.8). As proteínas produzidas
em cada uma destas fases podem resultar de um processamento proteolítico
de uma poliproteína precursora, embora este abranja apenas uma parte do genoma do vírus ao invés de todo o genoma, como acima. O processamento proteolítico oferece mais oportunidades para a regulação da relação dos diferentes polipeptídeos produzidos em cada fase de replicação (por exemplo, em togavírus e tymovírus). Além da proteólise, alguns vírus utilizam outra estratégia para a produção de polipeptídeos alternativos a partir de um mRNA subgenômico, quer pela fuga na leitura através de um códon de parada da tradução (por exemplo, tobamovírus como TMV, ver Figura 3.12), ou deliberada pelo ribossomo na mudança da fase de leitura em um sítio específico.
Todos os vírus desta classe desenvolveram mecanismos que lhes permitiram regular a expressão de genes tanto em termos das relações entre as diferentes proteínas codificadas pelo vírus quanto no estágio do ciclo de replicação nos quais são produzidas. Comparados com as duas classes de genoma dos vírus de DNA descrito anteriormente, estes mecanismos operam, em grande parte, independentemente dos mecanismos da célula hospedeira. O poder e a flexibilidade dessas estratégias são refletidas de forma muito clara para o sucesso global do vírus desta classe, conforme determinado pelo número de diferentes representantes conhecidos e os número de diferentes hospedeiros que infectam.
Classe V: RNA simples fita com sentido (-)
Conforme discutido anteriormente, os genomas desses vírus podem ser segmentados
ou não segmentados. O primeiro passo para a replicação do genoma segmentado de ortomixovírus é a transcrição do vRNA com sentido (-) pela RNA polimerase dependente de RNA de vírus associados para produzir, predominantemente, mRNAs monocistrônicos que servem também como modelo para a subseqüente replicação do genoma (Figura 5.9). Como com todos os vírus com RNA de sentido (-) o empacotamento destas transcriptases/replicases específicas do vírus dentro do nucleocapsídeo viral é essencial, porque nenhuma célula hospedeira contém qualquer enzima capaz de decodificar e copiar o RNA genômico. Em outras famílias que têm genomas não segmentados, mRNAs monocistrônicos também são produzidos. Aqui, no entanto, esses mensageiros devem ser produzidos a partir de uma única e longa molécula de RNA com sentido (-). O modo exato que explica como isso é conseguido ainda não é claro.É possível que um único transcrito com o comprimento do genoma seja clivado posteriormente para formar os distintos mRNAs, mas é mais provável que estes sejam produzidos individualmente por um mecanismo de parada e início de transcrição regulados pelas sequências intergênicas conservadas que existem entre cada um dos genes virais. Mecanismos de splicing não podem ser utilizados porque esses vírus se replicam no citoplasma. 
Superficialmente, esse sistema de expressão gênica pode parecer que oferece poucas
oportunidades para a regulação das quantidades relativas das diferentes proteínas virais. Se isso fosse verdade, seria uma grande desvantagem já que todos os vírus requerem muito mais cópias das proteínas estruturais (por exemplo, a proteína do nucleocapsídeo) do que as proteínas não estruturais (por exemplo, da polimerase) por cada vírus produzido. Na prática, a relação das diferentes proteínas é regulada tanto durante a transcrição quanto depois. Em paramixovírus, por exemplo, há uma clara polaridade da transcrição do da extremidade 3’ do genoma do vírus para a extremidade 5’ o que resulta na síntese de muito mais mRNAs que codificam proteínas estruturais na extremidade 3’ do genoma do que para as proteínas não estruturais localizadas na extremidade 5’ (Figura 5.10). Da mesma forma, a vantagem da produção de mRNAs monocistrônicos é que a eficiência da tradução de cada mensageiro pode variar em relação aos outros.
Classe VI: RNA simples fita com sentido (+) e intermediário de DNA 
Os retrovírus são possivelmente o último caso de dependência da maquinaria de transcrição da célula hospedeira. Seu RNA genômico constitui o molde para a transcrição reversa do DNA (estes são os únicos vírus com RNA de sentido (+) cujo genoma não serve como mRNA ao entrar na célula hospedeira). Uma vez integrado no genoma da célula hospedeira, o DNA do pró-vírus fica sob o controle da célula hospedeira e é transcrito exatamente assim como qualquer outro gene celular. Alguns retrovírus, no entanto, desenvolveram uma série de mecanismos de controle da transcrição e pós-transcricionais que lhes permitem controlar a expressão da sua informação genética. 
Classe VII: DNA dupla fita com intermediário de RNA
A expressão dos genomas destes vírus é complexa e relativamente pouco conhecida. Os hepadnavírus contem um número de ORFs claramente  sobrepostas projetadas para apertar o máximo possível a codificação da informação gênica em um genoma compacto. O gene X codifica um ativador transcricional que atua em trans, possivelmente análogo à proteína tax do vírus humano da leucemia de células T (HTLV). Pelo menos dois mRNAs são produzidos a partir de promotores independentes, cada um codifica proteínas diferentes e o maior dos mRNAs também serve de molde para a transcrição reversa durante a formação da partícula viral. A expressão dos genomas dos caulimovírus é igualmente complexa, embora haja similaridades com hepadnavírus em que dois grandes transcritos são produzidos, 35S e 19S. Cada um destes codifica vários polipeptídeos, e o transcrito de 35S é o modelo para a transcrição reversa durante a formação do genoma viral. 
CONTROLE TRANSCRICIONAL DA EXPRESSÃO GÊNICA
Tendo analisado as estratégias gerais usadas por diferentes grupos de vírus para regular
a expressão gênica, o resto deste capítulo irá concentrar-se em explicações mais detalhadas de exemplos específicos de alguns dos vírus mencionados anteriormente, começando com o controle da transcrição em SV40, um membro de Poliomaviridae. Poucos outros genomas, virais ou celulares, têm sido estudados em tanto detalhe como o do SV40, que tem sido um paradigma para o estudo dos mecanismos de transcrição eucariótica (particularmente na replicação) por muitos anos.
 Nesse sentido, SV40 fornece um paralelo eucarionte com o genoma do bacteriófago λ. Sistemas in vitro existem tanto para transcrição e replicação do genoma do SV40, e acredita-se que todas as proteínas virais e celulares de ligação ao DNA envolvidas em ambos os processos são conhecidas. O genoma de SV40 codifica dois antígenos T (antígenos tumorais) conhecidos como antígeno T grande e antígeno T pequeno devido aos tamanhos das proteínas (Figura 5.11). A replicação do DNA genômico dupla fita do SV40 ocorre no núcleo da célula. A transcrição do genoma hospedeiro é realizada pela RNA polimerase II da célula hospedeira, e o antígeno T grande desempenha um papel vital na regulação da transcrição do genoma viral. O antígeno T pequeno não é essencial para a replicação do vírus, mas não permitem que o DNA do vírus se acumule no núcleo. Ambas as proteínas contêm "sinais de localização nuclear" que resultam na sua acumulação no núcleo, para onde elas migram após serem sintetizadas no citoplasma. 
Logo após a infecção das células permissivas, são expressos mRNAs precoces a partir do 
promotor precoce, que contém um elemento enhancer forte (as sequências repetidas de 72 bp), permitindo que ele seja ativo em células infectadas (Figura 5.12). As proteínas precoces sintetizadas são os dois antígenos T. Conforme a concentração do antígeno T grande se acumula no núcleo, a transcrição dos genes precoces é reprimida pela ligação direta da proteína na região da origem de transcrição do genoma viral, impedindo a transcrição a partir do promotor precoce e causando a mudança para a fase tardia da infecção. Como já mencionado, o antígeno T grande é também necessário para a replicação do genoma. Depois que a replicação do DNA ocorreu, a transcrição dos genes tardios ocorre a partir do promotor tardio resultando na síntese das proteínas estruturais VP1, VP2 e VP3; portanto, o papel do antígeno T do SV40 no controle da transcrição do genoma é comparável ao de um 'switch' (interruptor) e os leitores devem comparar o funcionamento deste sistema com a descrição do controle da expressão gênica do bacteriófago λ dada anteriormente.
Outra área onde o controle da transcrição do vírus tem recebido muita atenção está nos retrovírus humanos, o vírus da leucemia de células T humanas (HTLV), e o vírus da imunodeficiência humana (HIV). O DNA integrado dos provírus é formado pela transcrição reversa do RNA genômico dos retrovírus. A presença de numerosos sítios de ligação para fatores de transcrição celulares nas repetições longas terminais (LTRs) destes vírus tem sido analisada por "DNAse I footprinting" e ensaios do tipo "gel-shift” (Figura 5.13). Juntos, os elementos "distais" (como os sítios de ligação de NF-kB e SP1) e elementos "proximais" (tais como o TATA Box) constituem um promotor da transcrição funcional na região U3 da LTR. No entanto, a atividade basal dos promotores é relativamente fraca e resulta apenas na transcrição limitada do genoma do provírus pela RNA polimerase II. Tanto HTLV quanto HIV codificam proteínas que são reguladores positivos da transcrição que atuam em trans: a proteína Tax de HTLV e a proteína Tat do HIV (Figura 5.14). Estas proteínas agem aumentando a transcrição da LTR do vírus em um fator de, pelo menos, 5 a 10 vezes maior do que a taxa basal do promotor nu. Ao contrário do antígeno T e o promotor precoce de SV40, nem a proteína Tax nem a proteína Tat (que não têm semelhança estrutural uma com a outra) ligam-se diretamente às suas respectivas LTR. Trabalhos recentes têm demonstrado como agem essas proteínas. 
A proteína Tax do HTLV liga-se diretamente a três sequências de 21 pb na LTR do vírus conhecidas como: glicocorticóide (GC), adenosina monofosfato cíclico (cAMP) e elemento de resposta (CRE); no entanto, Tax também realiza interações proteína-proteína com um número considerável de diferentes fatores de transcrição celulares (por exemplo, p105, um precursor inativo do fator de transcrição NF-kB). NF-kB desempenha um papel central na transcrição ao controlar e ativar imunologicamente as células linfóides. Por inibição de NF-kB pela tecnologia antisense tem sido mostrada a inibição do crescimento de células tumorais geradas pela transformação com Tax em ratos transplantados, indicando a importância destaproteína na função de Tax. A natureza promíscua  da transativação de Tax também é explicada por um relato de que Tax estimula a dimerização das proteínas "bZIP” que se ligam ao DNA através de um domínio básico do tipo zipper de leucina. Estas proteínas incluem uma série de fatores sabidamente envolvidos na transcrição do genoma do HTLV. Dimerização destas proteínas é necessária para a ligação ao DNA e a ativação transcricional, e Tax estimula este processo, mesmo na ausência de DNA. 
A proteína Tat do HIV liga-se a uma estrutura do tipo stem-loop no final 5’ dos mRNAs 
transcritos a partir da LTR, conhecida como elemento resposta ativado em trans (TAR). Diversas proteínas celulares também se ligam a TAR, embora a forma como elas interagem 
com Tat não foi claramente definida. Tat é o primeiro exemplo documentado da regulação da expressão gênica viral por meio do controle da fase de alongamento pela RNA polimerase II. Na ausência de Tat, o início a partir da LTR é eficiente, mas a transcrição é prejudicada, pois o promotor faz um complexo com a polimerase mal processado, que sai prematuramente do DNA molde. Na presença de Tat esta liga-se a TAR e o início da transcrição forma diferentes complexos que são competentes para completar a transcrição do genoma do HIV. A proteína Tax de HTLV e a proteína Tat de HIV são reguladores positivos do promotor basal na LTR do provírus e estão sob o controle do vírus, já que a síntese dessas proteínas é dependente dos promotores que elas mesmas ativam (Figura 5.15). Por si só, este seria um sistema insustentável porque resultaria em um feedback positivo não regulado, o que pode ser aceitável em um ciclo de replicação lítico, mas não seria adequado para um retrovírus integrado no genoma da célula hospedeira e, portanto, cada um desses vírus codifica uma proteína adicional (Rex e Rev em HTLV e HIV, respectivamente), que regula a expressão gênica em um nível pós-transcricional.
O controle da transcrição é uma etapa crítica na replicação do vírus e em todos os casos é
finamente regulado. Mesmo alguns dos genomas virais mais simples, tais como o do SV40, codificam proteínas que regulam a transcrição. Muitos genomas virais codificam fatores que atuam em trans que modificam e/ou dirigem o aparelho da transcrição celular. Exemplos disto incluem HTLV e HIV, como descrito anteriormente, mas também a proteína X do hepadnavírus,
proteína Rep do parvovírus, proteína E1A de adenovírus, e as proteínas precoces dos herpesvírus.  A expressão do RNA genômico dos vírus é igualmente bem controlada, mas este processo é realizado pelas transcriptases codificadas pelo vírus e é menos estudado, motivo pelo qual geralmente é muito menos conhecido do que a transcrição de DNA genômico.
CONTROLE PÓS-TRANSCRICIONAL DA EXPRESSÃO
Em adição ao controle do processo de transcrição em si, a expressão da informação genética do vírus também é governada em um número de etapas adicionais entre a formação do transcrito de RNA primário e a conclusão do polipeptídeo acabado. Muitos controles sutis generalizados, como a estabilidade diferencial de mRNAs diferentes, são, sem dúvida, empregados pelos vírus para regular o fluxo de informação genética de seus genomas em proteínas. Esta seção, entretanto, descreve apenas alguns exemplos específicos, bem-pesquisados, de regulação pós-transcricional. Muitos vírus de DNA que se replicam no núcleo codificam mRNAs que devem sofrer splicing através de mecanismos celulares para remover sequências intervenientes (introns), antes de serem traduzidos. Este tipo de modificação se aplica somente aos vírus que replicam no núcleo (e não, por exemplo, a poxvírus), já que exige o processamento dos mRNAs pelo aparato nuclear antes de serem transportados para o citoplasma para tradução. No entanto, várias famílias de vírus têm aproveitado essa capacidade de suas células hospedeiras para comprimir mais informação genética em seus genomas. Um bom exemplo de tal dependência de splicing são os parvovírus; a transcrição do quais resulta em múltiplos transcritos poliadenilados e que sofreram splicing no citoplasma das células infectadas, permitindo que eles produzam múltiplas proteínas a partir de seus genomas de 5 kb (Figura 5.5), e, similarmente, polyomavírus tais como SV40 (Figura 5.11). Em contrapartida, a grande capacidade genética dos herpesvírus torna possível que esses vírus produzam principalmente mRNAs monocistrônicos sem splicing, cada qual e expresso a partir do seu próprio promotor, tornando assim desnecessário um splicing extenso para produzir o repertório necessário de proteínas.
Um dos exemplos mais estudados de splicing de mRNAs do vírus é a expressão do genoma do adenovírus (Figura 5.16). Várias "famílias" de genes de adenovírus são produzidas via splicing alternativo de transcritos precursores do tipo hnRNA. Isto é particularmente verdade para os genes iniciais que codificam proteínas regulatórias que atuam em trans expressas imediatamente após a infecção. As primeiras proteínas a serem expressas, E1A e E1B, são codificadas por uma unidade transcricional na fita-r na extremidade esquerda do genoma do adenovírus (Figura 5.16). Essas proteínas são basicamente proteínas transcricionais trans-regulatórias comparáveis às proteínas Tax e Tat acima descritas, mas também estão envolvidas na transformação de células infectadas por adenovírus (Capítulo 6). Cinco mRNAs poliadenilados, que sofreram splicing são produzidos (13S, 12S, 11S,10S, 9S) e codificam cinco polipeptídeos E1A relacionados (contendo 289, 243, 217, 171 e 55 aminoácidos, respectivamente) (Figura 5.17). Todas essas proteínas são traduzidas a partir da mesma fase de leitura e têm os mesmos terminais amino e carboxi. As diferenças entre eles são uma consequência de splicing alternativo da unidade transcricional EA1 e resultam em grandes diferenças em suas funções. Os peptídeos de 289 e 243 aminoácidos são ativadores da transcrição. Embora estas proteínas ativem a transcrição de todos os promotores iniciais de adenovírus, foi descoberto que eles também parecem ser "promíscuos", ativando a maioria dos promotores que contêm um TATA box e respondem à RNA polimerase II. Não há sequências comuns óbvias, presentes em todos estes promotores, e não há evidências de que proteínas E1A se ligam diretamente ao DNA. Proteínas E1A de diferentes sorotipos de adenovírus contêm três domínios conservados: CR1, CR2 e CR3. As proteínas E1A interagem com muitas outras proteínas celulares, primariamente através da ligação com os três domínios conservados. Pela ligação aos componentes da maquinaria basal de transcrição - proteínas de ativação que se ligam ao promotor à montante, sequências enhancer e proteínas regulatórias que controlam a atividade de fatores de ligação ao DNA - E1A tanto pode ativar ou reprimir a transcrição.
A síntese de E1A inicia uma cascata de ativação transcricional ativando a transcrição de outros genes iniciais de adenovírus: E1B, E2, E3 e E4 (Figura 5.16). Depois que o genoma do vírus foi replicado, esta cascata eventualmente resulta na transcrição dos genes tardios que codificam as proteínas estruturais. A transcrição de E1A é, em si só, um sistema equilibrado, de auto-regulação. Os genes imediatos precoces dos vírus de DNA tipicamente têm elementos enhancers fortes à montante de seus promotores. Isto porque, em uma célula recém-infectada, não há proteínas do vírus presentes e o enhancer é necessário para dar o "pontapé de saída” da expressão do genoma do vírus. As proteínas precoces imediatas sintetizadas são ativadoras da transcrição que ativam a expressão de outros genes do vírus, e as funções de E1A exatamente desse modo; no entanto, embora E1A trans-ative seu próprio promotor, a proteína reprime a função do elemento enhancer à montante e assim, em altas concentrações, ela também regula sua própria expressão diminuindo a transcrição (Figura 5.18). 
A próxima etapa na qual a expressão pode ser regulada é durante a exportação do mRNA do núcleo e tradução preferencial no citoplasma.Novamente, o exemplo mais estudado desse fenômeno vem de Adenoviridae. Os genes associados aos vírus (VA) codificam dois pequenos (~ 160 nt) RNAs transcritos a partir da fita-r do genoma pela RNA polimerase III (cuja função normal é transcrever RNAs pequenos, tais como RNA ribossomal 5S e tRNAs) durante a fase final da replicação do vírus (Figura 5.16). Ambos RNA VA I e VA II têm um alto grau de estruturas secundárias, e nenhuma das duas moléculas codifica qualquer polipeptídeo - nestes dois aspectos eles são semelhantes aos tRNAs - e se acumulam em níveis elevados no citoplasma de células infectadas pelo adenovírus. A forma pela qual estes dois RNAs atuam não é totalmente entendida, mas o seu efeito é impulsionar a síntese de proteínas tardias do adenovírus. A infecção viral das células estimula a produção de interferons (Capítulo 6). Uma das ações de interferons é ativar uma proteína quinase conhecida como PKR que inibe o início da tradução. VA RNA I liga-se a esta quinase, impedindo sua atividade e aliviando a inibição da tradução. Os efeitos dos interferons na célula são generalizados (discutido no Capítulo 6) e resultam na inibição da tradução de ambos os mRNAs celulares e do vírus. Os RNAs VA podem ser capazes de promover seletivamente a tradução de mRNAs de adenovírus às custas de mRNAs celulares cuja tradução permanece inibida. 
As proteínas Rex HTLV e HIV Rev mencionadas anteriormente também agem para promover a tradução seletiva de mRNAs de vírus específicos. Essas proteínas regulam a expressão diferencial do genoma do vírus, mas não tanto quanto se sabe, substancialmente alteram a expressão de mRNAs celulares. Ambas as proteínas parecem funcionar de maneira semelhante e, embora não relacionadas entre si em termos de suas sequências de aminoácidos, a proteína HTLV Rex tem demonstrado ser capaz de substituir funcionalmente a proteína Rev de HIV. Sequências regulatórias-negativas nos genomas do HIV e HTLV causam a retenção de mRNAs de vírus no núcleo da célula infectada. Essas sequências estão localizadas nas regiões de introns que são removidos de mRNAs que sofreram splicing codificando as proteínas Tax/Tat e Rex/Rev (Figura 5.14); portanto, estas proteínas são expressas imediatamente após a infecção. Tax e Tat estimulam a transcrição do LTR viral (Figura 5.15); porém, mRNAs que não sofreram splicing codificando os produtos dos genes gag, pol, env são expressos somente quando proteína Rex/Rev suficiente está presente na célula. Ambas as proteínas ligam-se a uma região de estrutura secundária formada por uma sequência específica no mRNA e se transportam entre o núcleo e o citoplasma já que contêm tanto um sinal de localização nuclear quanto um sinal de exportação nuclear, aumentando a exportação para o citoplasma os mRNAs do vírus que não sofreram splicing, onde são traduzidos e atuam como o genoma do vírus durante a formação da partícula. 
A eficiência com a qual diferentes mRNAs são traduzidos varia consideravelmente e é determinada por uma série de fatores, incluindo a estabilidade e a estrutura secundária do RNA, mas o principal parece ser a sequência de nucleotídeos particular em torno do códon de início da tradução AUG que é reconhecido pelos ribossomos. A sequência mais favorável para a iniciação é GCC(A/G)CCAUGGG, embora possa haver uma considerável variação dentro desta sequência. Um número de vírus utilizam variações dessa sequência para regular a quantidade de proteínas sintetizadas a partir de um único mRNA. Exemplos incluem as proteínas Tax e Rex do HTLV, que são codificadas pela sobreposição de quadros de leitura no mesmo mRNA de 2,1 kb que sofre dois splicing (Figura 5.14). O códon de iniciação AUG para a proteína Rex está à montante de Tax, mas prevê um contexto menos favorável para a iniciação da tradução do que a sequência em torno do codon AUG de Tax. Isto é conhecido como o mecanismo "fuga de fase de leitura" porque acredita-se que os ribossomos fazem uma varredura no mRNA antes de iniciar a tradução. Portanto, a abundância relativa das proteínas Rex nas células infectadas pelo HTLV é consideravelmente menor do que a proteína Tax, mesmo que ambas sejam codificadas pelo mesmo mRNA. 
Genomas de picornavírus ilustram um mecanismo alternativo para o controle da iniciação da tradução. Embora esses genomas sejam geneticamente econômicos (ou seja, descartaram mais elementos de controle atuando em cis e expressam toda a sua capacidade de codificação como uma única poliproteína), eles mantiveram por muito tempo regiões não codificantes (NCRs) em suas extremidades 5´, compreendendo aproximadamente 10% do genoma inteiro. Essas sequências estão envolvidas na replicação e, eventualmente, no empacotamento do genoma do vírus. A tradução da maioria dos mRNAs celulares é iniciada quando os ribossomos reconhecem a extremidade 5´ do mRNA e fazem uma varredura ao longo da sequência de nucleotídeos, até chegarem a um códon de iniciação AUG. Os genomas dos Picornavírus não são traduzidos dessa forma. A extremidade 5´ do RNA não recebe o CAP e, portanto, não é reconhecida pelos ribossomos, da mesma forma como outros mRNAs, mas é modificada pela adição da proteína VPg (ver capítulos 3 e 6). Existem múltiplos códons AUG na NCR 5´ à montante do início das sequências codificantes de poliproteínas que não são reconhecidas pelos ribossomos. Em células infectadas por picornavírus, uma protease do vírus cliva o “complexo de ligação ao CAP” (CBC) de 220 kDa, envolvido na ligação da estrutura m7G CAP na extremidade 5´do mRNA durante a iniciação da tradução. A tradução de mRNAs picornavírus transformados artificialmente in vitro e a construção de genomas picornavírus bicistrônicos carregando sinais 5´ NCR adicionais no meio da poliproteína resultaram no conceito do ribossomo "almofada de aterrissagem”, ou sítios internos de entrada ribossomal (IRES). Ao invés de varredura ao longo do RNA a partir da extremidade 5´, os ribossomos se ligam ao RNA através do IRES e começam a tradução internamente. Este é um método preciso para controlar a tradução de proteínas dos vírus. Muito poucos mRNAs celulares utilizam este mecanismo, mas foi mostrado ser usado por uma variedade de vírus, incluindo os picornavírus, vírus de hepatite C, coronavírus e flavivírus. 
Muitos vírus pertencentes a famílias diferentes comprimem sua informação genética codificando diferentes polipeptídeos em quadros de leitura sobrepostos. O problema desta estratégia reside na decodificação das informações. Se cada polipeptídeo é expresso a partir de um mRNA monocistrônico transcrito a partir de seu próprio promotor, as sequências adicionais atuaando em cis necessárias para controlar e coordenar a expressão podem anular qualquer vantagem genética adquirida. Mais importante, há o problema da regulação coordenada da transcrição e tradução de várias mensagens diferentes e, portanto, é altamente desejável expressar diversos polipeptídeos de um único transcrito de RNA, e os exemplos acima ilustram vários mecanismos pelos quais isso pode ser alcançado, ou seja, splicing diferencial e controle da exportação do RNA do núcleo ou início de tradução. 
Um mecanismo adicional conhecido como "frameshifting ribossômico” é usado por vários grupos de vírus para atingir o mesmo fim. Os exemplos mais estudados deste fenômeno vêm de genomas de retrovírus, mas muitos vírus usam um mecanismo similar. Essa mudança da fase de leitura foi descoberta pela primeira vez em vírus, mas agora se sabe que ocorre também em células de procariotos e eucariotos. Genomas de retrovírus são transcritos para produzir pelo menos dois mRNAs com CAP 5´ e poliadenilados 3´. mRNAs que sofrem splicing codificam as proteínas do envelope, bem como, em retrovírus mais complexos como HTLV e HIV, proteínas complementares, tais como Tax/Tat e proteínas Rex/Rev(Figura 5.14). Um transcrito longo e sem sofrer splicing codifica os genes gag, pro, e pol e também forma o RNA genômico empacotado em virions. O problema enfrentado pelos retrovírus é como expressar três diferentes proteínasa partir de um longo transcrito. O arranjo dos três genes varia em diferentes vírus. Em alguns casos (por exemplo, HTLV), eles ocupam três quadros de leitura diferentes, enquanto em outros (por exemplo, HIV), o gene da protease (pro) faz uma extensão na extremidade 5´ no final do gene pol (Figura 5.19). Neste último caso, a protease e polimerase (ou seja, a transcriptase reversa) são expressas como uma poliproteína que é autocataliticamente clivada nas proteínas maduras em um processo que é semelhante à clivagem das poliproteínas nos picornavírus. 
Na fronteira entre cada um dos três genes está uma sequência especial, que geralmente consiste de uma região de nucleotídeos repetidos, como UUUAAAC (Figura 5.20). Notavelmente, esta sequência é raramente encontrada em sequências que codificam proteínas e, portanto, parece ser utilizada especificamente para este tipo de regulação. A maioria dos ribossomos encontra essa sequência que irão traduzir sem dificuldade e continuam ao longo do transcrito até o códon de parada da tradução ser atingido. No entanto, uma parte dos ribossomos que tentam traduzir essa sequência vai escorregar para trás por um nucleotídeo antes de continuar a traduzir a mensagem, mas agora em uma diferente fase de leitura (ou seja, -1). Por causa disso, a sequência UUUAAAC foi denominada de sequência "escorregadia", e o resultado desta 21 mudança da fase de leitura é a tradução de uma poliproteína que contém informações alternativas de um quadro de leitura diferente. Esse mecanismo também permite ao vírus controlar as proporções entre as proteínas produzidas. Como apenas uma parte dos ribossomos sofre mudança da fase de leitura em cada sequência escorregadia, existe um gradiente de tradução a partir dos quadros de leitura na extremidade 5´ do mRNA para as da extremidade 3´. A sequência escorregadia sozinha, porém, resulta em apenas uma frequência baixa de mudança da fase de leitura, que parece ser insuficiente para produzir a quantidade das proteínas protease e transcriptase reversa exigidas pelo vírus e, portanto, há sequências adicionais que além disso regulam este sistema e aumentam a frequência de eventos de mudança da fase de leitura. Uma curta distância à jusante da sequência escorregadia está uma repetição invertida, que permite a formação de uma estrutura de stem-loop no mRNA (Figura 5.20). Um pouco mais adiante existe uma sequência adicional complementar aos nucleotídeos no laço que permite o pareamento de bases entre estas duas regiões do RNA. O resultado desta combinação de sequências é a formação do que é conhecido como um RNA pseudoknot. Esta estrutura secundária do mRNA faz com que os ribossomos traduzindo a mensagem façam uma pausa na posição da sequência escorregadia à montante, e este abrandamento ou a pausa do ribossomo durante a tradução aumenta a frequência com que ocorre mudança da fase de leitura, assim, aumenta as quantidades relativas de proteínas codificadas pelos quadros de leitura à jusante. É fácil imaginar como este sistema pode ser aperfeiçoado por mutações sutis que alterem a estabilidade da estrutura pseudoknot e, portanto, a expressão relativa dos diferentes genes. 
O último método de controle da tradução a ser considerado é a supressão de terminação. Este é um mecanismo similar em muitos aspectos à mudança da fase de leitura que permite múltiplos polipeptídios serem expressos a partir de quadros de leitura individuais em um único mRNA. Em alguns retrovírus, como o vírus da leucemia murina (MLV), o gene pró está separado do gene gag por um códon de terminação UAG e não por uma sequência escorregadia e pseudoknot (Figura 5.19). Na maioria dos casos, a tradução do mRNA MLV termina nesta sequência, dando origem às proteínas Gag; no entanto, em poucos casos, o códon de término UAG é suprimido e a tradução continua, produzindo uma poliproteína Gag-Pro-Pol, que subsequentemente cliva ela própria para produzir as proteínas maduras. O efeito global deste sistema é o mesmo que a mudança da fase de leitura ribossômica, com as proporções relativas das proteínas Gag e Pro/Pol sendo controladas pela frequência com a qual os ribossomos atravessam ou terminam ao códon de parada UAG.
SUMARIO
O controle da expressão gênica é um elemento vital da replicação do vírus. A expressão coordenada de grupos de genes dos vírus resulta em fases sucessivas da expressão gênica. Normalmente, genes precoces imediatos codificam proteínas “ativadoras”, os genes precoces codificam proteínas regulatórias e genes tardios codificam proteínas dos vírus. Os vírus fazem uso do aparato bioquímico das suas células hospedeiras para expressar sua informação genética como proteínas e, consequentemente, utilizar a linguagem bioquímica adequada reconhecida pela célula. Assim, os vírus de procariontes produzem mRNAs policistrônicos, enquanto os vírus com hospedeiros eucariontes produzem principalmente mRNAs monocistrônicos. Alguns vírus de eucariotos produzem mRNA policistrônicos para ajudar com a regulação coordenada de múltiplos genes. Além disso, os vírus dependem de mecanismos específicos atuando em cis e trans para manipular a biologia das células do hospedeiro e para reforçar e coordenar a expressão de sua própria informação genética.

Continue navegando