Buscar

Genomas Virais: Estrutura e Composição

Prévia do material em texto

GENOMAS
Objetivos desta aula
Ao completar este capítulo, você deve ser capaz de: reconhecer as possíveis estruturas e composições que compreendem a série de genomas virais; compreender os principais mecanismos genéticos que afetam os vírus; descrever os diversos genomas de vírus típicos.
A ESTRUTURA E COMPLEXIDADE DOS GENOMAS VIRAIS
As composições e estruturas dos genomas dos vírus são mais variadas do que qualquer
uma das vistas em todos os reinos das plantas, bactérias, ou animais. O ácido nucléico que compreende o genoma pode ser fita simples ou dupla fita e pode ter uma configuração linear, circular, ou segmentada. Genomas de vírus fita simples podem ter sentido positivo (+) (isto é, da mesma polaridade, ou seqüência de nucleotídeos, como no mRNA), sentido negativo (-), ou ambisentido (uma mistura dos dois). Genomas de vírus variam em tamanho de cerca de 3500 nucleotídeos (nt) (por exemplo, bacteriófagos da família Leviviridae, como MS2 e Qβ) a aproximadamente 1,2 milhões de bp (2.400.000 nt), como o recém-descoberto Mimivírus, maior que o menor genoma bacteriano (por exemplo, Mycoplasma). Ao contrário dos genomas de todas as células, que são compostos de DNA, genomas de vírus podem conter a sua informação genética codificada no DNA ou RNA.
Seja qual for a composição específica de um genoma viral, ele deve estar em conformidade com uma condição. Como os vírus são parasitas intracelulares obrigatórios apenas capazes de se replicar no interior da célula hospedeira apropriada, o genoma deve conter informações codificadas em uma forma que possa ser reconhecida e decodificada por um determinado tipo de célula parasitada. O código genético empregado pelo vírus deve corresponder, ou pelo menos ser reconhecido pelo organismo hospedeiro. Da mesma forma, os sinais de controle que dirigem a expressão de genes do vírus devem ser adequados para o hospedeiro. O capítulo 4 descreve os meios pelos quais os genomas virais são replicados, e o capítulo 5 trata com mais detalhes dos mecanismos que regulam a expressão da informação genética do vírus. O propósito deste capítulo é descrever a diversidade de genomas de vírus e analisar como e por que essa variação pode ter surgido.
Embora a biologia molecular tenha desenvolvido muitas técnicas para a manipulação
das proteínas, o poder dessa tecnologia é concentrado nos principais ácidos nucléicos. Tem existido uma relação forte e sinérgica entre os avanços em virologia dependentes desta nova tecnologia e as oportunidades que os vírus oferecem para desenvolver novas técnicas de investigação. Assim, o primeiro genoma completo a ser sequenciado (em 1977) foi de um vírus, o bacteriófago φX174. Este vírus foi escolhido por uma série de razões. Primeiro, ele tem um dos menores genomas (5386 nt). Segundo, grandes quantidades de fago podem ser propagadas em Escherichia coli, facilmente purificados, e o DNA genômico extraído. Em terceiro lugar, o genoma do fago consiste em DNA de fita simples que poderia ser diretamente sequenciado por métodos de terminação de cadeia. Embora os métodos de sequenciamento de DNA fita dupla também estavam sendo desenvolvidos neste momento, ΦX174 provou a utilidade de bacteriófagos com genomas fita simples como vetores de clonagem para sequenciamento de DNA e fagos como M13 tem sido muito desenvolvidos para esta finalidade.
Estruturas genômicas e sequências nucleotídicas de vírus têm sido intensamente estudadas nos últimos anos, porque o poder da tecnologia do DNA recombinante tem concentrado muita atenção nesta área. Seria errado apresentar a biologia molecular como
a única forma de abordar os problemas sem resposta em virologia, mas seria
igualmente insensato ignorar as oportunidades que ela oferece e a explosão do
conhecimento que resultou em décadas recentes.
Alguns dos bacteriófagos mais simples têm sido citados acima como exemplos dos
menores e menos complexos genomas conhecidos. No outro extremo da escala, os
genomas dos vírus de DNA dupla fita maiores, como herpesvírus e poxvírus são suficientemente complexos para ter escapado da análise funcional completa
até à presente data (mesmo que a sequência completa de nucleotídeos do genoma
de um grande número de exemplos é conhecida agora). Muitos dos vírus de DNA
de eucariontes se assemelham a células do hospedeiro em termos de biologia de seus
genomas.
Alguns genomas de vírus de DNA são complexados com histonas celulares para formar uma estrutura como da cromatina no interior da partícula do vírus. Uma vez dentro do núcleo da célula hospedeira, estes genomas se comportam como cromossomos satélites em miniatura, seguindo os ditames das enzimas celulares e do ciclo celular:
mRNAs do vírus Vaccinia foram descobertos como sendo poliadenilados em suas extremidades 3’ por Kates em 1970, a primeira observação do fenômeno.
Genes que sofrem splicing contendo introns não codificantes, exons codificadores de proteínas, foram descobertos em adenovírus por Roberts e Sharp em 1977.
Íntrons em procariontes foram descobertos pela primeira vez no genoma do bacteriófago T4, em 1984. Vários exemplos desse fenômeno já foram descobertos
em T4 e em outros fagos. Todos são semelhantes, sendo do tipo auto-splicing classe I, no entanto, esta constatação levanta um ponto importante. O ponto de vista convencional é que os genomas de procariotos são menores e replicam mais rapidamente do que os de
eucariotos e, portanto, podem ser considerados como "simplificados". O genoma do fago
T4 é composto de 160 kbp de DNA dupla fita e é altamente comprimido, por
exemplo, promotores e sequências de controle de tradução estão agrupadas dentro da região codificante e sobrepostas na região 5´ dos genes. A presença de íntrons em genomas de bacteriófagos, que estão sob constante pressão para excluir "sequências lixo", indica que esses elementos genéticos devem ter evoluído mecanismos para fugir ou neutralizar essa pressão e persistir como parasitas dentro de parasitas.
Todos os genomas de vírus experimentam pressão para minimizar o seu tamanho. Por exemplo, vírus com hospedeiros procariotos devem ser capazes de se replicar de forma suficientemente rápida para manter o contato com suas células hospedeiras, e isso se reflete na natureza compacta de muitos (mas não todos os bacteriófagos). Genes sobrepostos são comuns, e a capacidade genética máxima é comprimida em um tamanho mínimo de genoma. Em vírus com hospedeiros eucariotos há também a pressão sobre o tamanho do genoma. Aqui, no entanto, a pressão é principalmente para o tamanho de empacotamento da partícula do vírus (ou seja, a quantidade de ácido nucléico que pode ser incorporada no virion). Portanto, esses vírus comumente apresentam compressão tremenda de informação genética, quando comparados com a baixa densidade de informação no genoma das células eucarióticas.
Como já foi dito, existem exceções a esta regra simples. Alguns bacteriófagos
(por exemplo, a família Myoviridae, como T4) têm genomas relativamente grandes, até
170 kbp. O maior genoma de vírus conhecido atualmente é de Mimivírus, com aproximadamente 1,2 Mbp, contendo cerca de 1200 fases de leitura aberta (ORFs), onde apenas 10% dos quais mostram qualquer semelhança com proteínas de função conhecida. Entre os vírus de eucariontes, herpesvírus e poxvírus também têm genomas relativamente grandes, até 235 kbp. É notável que esses genomas de vírus contêm vários genes envolvidos em sua própria replicação, particularmente enzimas envolvidas com o metabolismo dos ácidos nucléicos; portanto, estes vírus escapam parcialmente das restrições da bioquímica da
da célula hospedeira através da codificação de um aparato bioquímico adicional. A penalidade é que eles têm que codificar toda a informação necessária para uma partícula grande e complexa para empacotar o genoma - também uma pressão a mais sobre o tamanho do genoma. As últimas seções deste capítulo contêm descrições pormenorizadas genomas dos vírus, pequenos, compactos e grandes, complexos.
GENÉTICA MOLECULAR
Comojá foi descrito, as novas técnicas de biologia molecular têm sido uma importante
influência em concentrar muita atenção sobre o genoma do vírus. Está além do
escopo deste livro dar conta de detalhes dessa tecnologia. Com efeito, presume-se
que os leitores já têm uma boa compreensão dos princípios por trás dessas técnicas, bem como o jargão envolvido. No entanto, talvez valha a pena dedicar algum tempo aqui
para ilustrar como algumas dessas técnicas foram aplicadas à virologia, lembrando
que essas novas técnicas são complementares e não substituem as técnicas clássicas de virologia. Inicialmente, qualquer investigação sobre o genoma viral vai geralmente incluir perguntas sobre o seguinte:
Composição - DNA ou RNA, de fita simples ou fita dupla, linear ou circular;
Tamanho e número de segmentos;
Estruturas terminais;
Sequência nucleotídica;
Capacidade de codificação - fases de leitura aberta;
Sinais regulatórios - potenciadores de transcrição (enhancers), promotores e terminadores.
É possível separar a análise molecular de genomas de vírus em dois tipos
de abordagem: a análise da estrutura física e de seqüência de nucleotídeos, essencialmente realizadas in vitro, e uma abordagem mais biológica para examinar as relações estrutura-função de genomas de vírus intactos e elementos genéticos individuais, geralmente
envolvendo a análise do fenótipo do vírus in vivo.
O ponto de partida convencional para a análise física dos genomas de vírus foi o isolamento de ácidos nucléicos a partir de preparações de vírus de diferentes graus de
pureza. Em certa medida, isso ainda é verdade de biologia molecular, embora a ênfase
em purificação extensiva diminuiu assim que as técnicas de clonagem molecular tornaram-se mais avançadas. Genomas de vírus de DNA podem ser analisados diretamente pela digestão com endonucleases de restrição, sem recorrer à clonagem molecular, e esta abordagem foi realizada pela primeira vez com o DNA SV40 em 1971. Os primeiros “pedaços” de DNA a ser clonados molecularmente foram fragmentos de restrição do DNA de bacteriófago λ
que foram clonados no genoma de DNA de SV40 por Berg e colegas
em 1972. Assim, genomas de vírus foram os primeiros vetores de clonagem e os primeiros ácidos nucléicos analisados por estas técnicas! Como já mencionado, o genoma
de φX174 foi o primeiro replicon a ser completamente sequenciado.
Posteriormente, genomas de fago tais como M13 foram altamente modificados para utilização como vetores em sequenciamento de DNA. A enzimologia de nucleases específicas de RNA estava comparativamente avançada neste momento, de forma que um espectro de enzimas, com sítios de clivagem específicos podem ser usadas para analisar e até mesmo determinar a sequência de genomas de vírus de RNA (a primeira sequência nucleotídica curta de tRNA foi determinada em meados da década de 1960). Entretanto, a análise direta do RNA por esses métodos foi laboriosa e notoriamente difícil. A análise da sequência de RNA não começou a avançar rapidamente até a utilização generalizada da transcriptase reversa (isoladas do vírus de mieloblastose de aves) para converter RNA em cDNA na década de 1970. Desde a década de 1980, a reação em cadeia da polimerase (PCR) acelerou ainda mais a investigação dos genomas virais (Capítulo 1).
Além da clonagem molecular, outras técnicas de análise molecular também foram de grande valia em virologia. A análise direta por microscopia eletrônica, se calibrada com padrões conhecidos, pode ser usada para estimar o tamanho das moléculas de ácido nucléico. Talvez a técnica única mais importante tenha sido de eletroforese em gel (Figura 3.1). A matriz de gel primeiramente utilizada para a separação de moléculas foi de amido e ofereceu uma resolução relativamente baixa. Agora é mais comum o uso de agarose em gel para separar grandes moléculas de ácido nucléico, que podem ser realmente muito grandes, de diversas megabases (milhões de pares de bases) no caso de técnicas como a eletroforese em gel de campo pulsado (PFGE), e eletroforese em gel de poliacrilamida (PAGE) para separar pedaços menores (abaixo do tamanho de poucos nucleotídeos). Além do fato de que o sequenciamento depende da capacidade de separar as moléculas que diferem umas das outras por um único nucleotídeo de comprimento, a eletroforese em gel tem sido de grande valor na análise de genomas de vírus intactos, particularmente a análise de vírus com genomas segmentados (ver discussão abaixo). Hibridação de sequências de nucleotídeos complementares também pode ser usada em uma série de maneiras de analisar os genomas de vírus (Capítulo 1).
A análise fenotípica de populações de vírus tem sido uma técnica padrão de 
virologia. O exame de vírus variantes e mutantes espontâneos naturalmente tem sido um método de longa data para determinar a função de genes dos vírus. A biologia molecular tem acrescentado a este a capacidade de projetar e criar mutações específicas, deleções e recombinações in vitro, o que é um instrumento muito poderoso. Embora a capacidade de codificação e algumas medidas de propriedades das proteínas podem ser determinadas in vitro pelo uso de extratos livres de células para traduzir mRNAs, a análise funcional completa dos genomas do vírus só pode ser feita com vírus intactos. Felizmente, a relativa simplicidade de genomas virais (comparado mesmo com o tipo celular mais simples) oferece uma grande vantagem aqui: a habilidade de 'resgate' de vírus infecciosos de ácidos nucléicos purificados ou clonados. A infecção de células causada por ácidos nucléicos sozinhos é referida como transfecção.
Genomas de vírus que consistem em RNA sentido(+) são infecciosos quando o RNA purificado (vRNA) é aplicado às células na ausência de proteínas do vírus. Isto acontece
porque vRNA sentido(+) é, essencialmente, mRNA, e o primeiro evento em uma célula infectada normalmente é traduzir o vRNA para fazer as proteínas do vírus responsáveis pela replicação do genoma. Neste caso, a introdução direta de RNA nas células constitui
as primeiras etapas do ciclo replicativo (Capítulo 4). Genomas de vírus que são compostos
de DNA dupla fita também são infecciosos. Os eventos que ocorrem aqui são um pouco mais complexos, já que o genoma do vírus deve primeiro ser transcrito por polimerases do hospedeiro para produzir mRNA. Isto é relativamente simples para os genomas de fagos introduzidos em procariotos, mas para os vírus que se replicam no núcleo das células eucarióticas, como herpesvírus, o DNA deve primeiro encontrar seu caminho para o compartimento celular adequado. A maior parte do DNA que é introduzido em células por transfecção é degradado por nucleases celulares, porém, independentemente de sua sequência, uma pequena proporção do DNA recém-introduzido encontra o seu caminho para o núcleo, onde é transcrito por polimerases celulares.
Inesperadamente, genomas de cDNA clonados de vírus de RNA sentido (+), (por exemplo, picornavírus) também são infecciosos, embora menos eficientes em infectar as células do que o vRNA. Isto ocorre presumivelmente porque o DNA é transcrito por enzimas celulares para fazer RNA; RNA transcrito in vitro a partir do molde de cDNA do genoma é
mais eficiente no início da infecção. Usando estas técnicas, o vírus pode ser resgatado
dos genomas clonados, incluindo aqueles que tenham sido manipulados in vitro.
Até recentemente, esse tipo de abordagem não era possível para análise de vírus com genomas sentido(-). Isto porque tais partículas virais contêm uma polimerase vírus-específica. O primeiro evento quando estes genomas de vírus entram na célula é que o
genoma sentido(-) é copiado pela polimerase, formando transcritos de sentido(+) que são usados diretamente como mRNA ou uma molécula de fita dupla, conhecida tanto como forma replicativa intermediária (RI) ou replicativa (RF), que serve como molde para novas rodadas de síntese de mRNA. Portanto, como genomas purificados sentido(-) não podem ser traduzidos diretamente e não são replicados na ausência da polimerase do vírus,estes genomas são inerentemente não-infecciosos. Tem sido recentemente desenvolvidos sistemas que permitem o resgate de vírus com genomas sentido(-) de ácidos nucléicos purificados ou clonados. Tais experimentos são frequentemente referidos como “genética reversa”, ou seja, a manipulação de um genoma RNA sentido(-) através de um intermediário de DNA. Todos esses sistemas contam com um complexo de ribonucleoproteína que pode servir como um molde para a replicação do genoma pela RNA polimerase dependente de RNA, mas caem em uma das duas abordagens:
Formação do complexo in vitro: as proteínas do vírus purificadas de células infectadas são misturadas com o RNA transcrito de cDNAs clonados para formar complexos que são então introduzidos em células suscetíveis para iniciar uma infecção. Este método tem sido utilizado para paramyxovírus, rhabdovírus e buniavírus.
Formação do complexo in vivo: complexos de ribonucleoproteína formados in vitro são introduzidos em células infectadas com uma estirpe do vírus auxiliar. Este método tem sido utilizado para o vírus influenza, buniavírus e vírus de RNA dupla fita, tais como reovírus e birnavírus.
Tais desenvolvimentos abrem possibilidades para a investigação de genética de RNA vírus negativos e dupla fita que não existia anteriormente.
GENÉTICA DO VÍRUS
Embora a seqüência de nucleotídeos domine agora a análise dos genomas dos vírus, a análise genética funcional dos vírus animais baseia-se em grande parte no isolamento e análise de mutantes, geralmente obtidos através da purificação de placa ("clonagem biológica"). No caso dos vírus para os quais não existem tais sistemas (porque não são citopáticos ou não se replicam em cultura), pouca análise genética foi possível antes do desenvolvimento da genética molecular, no entanto, certos truques tornam possível estender as técnicas genéticas padrão para vírus não-citopáticos:
Análise bioquímica: o uso de inibidores metabólicos para a construção de "mapas" genéticos; os inibidores da tradução (como puromicina e cicloheximida) e transcrição (actinomicina D) podem ser utilizados para decifrar mecanismos genéticos regulatórios 
Imunoensaios focais: replicação de vírus não-citopáticos visualizada por imunomarcação para produzir focos visuais (por exemplo, o vírus da imunodeficiência humana)
Biologia molecular: (por exemplo, o sequenciamento de nucleotídeos)
Análises físicas: o uso da eletroforese de alta resolução para identificação de polimorfismos genéticos de proteínas ou ácidos nucléicos dos vírus
Focos transformados: produção de "focos" transformados de células por vírus não-citopáticos "Formadores de focos", por exemplo, vírus tumorais de DNA e RNA).
Vários tipos de mapas genéticos podem ser derivados:
Mapas de recombinação: existe uma seqüência ordenada de mutações derivadas da probabilidade de recombinação entre dois marcadores genéticos, que é proporcional à distância entre elas, uma técnica de genética clássica. Este método funciona para vírus com genomas não segmentados (DNA ou RNA).
Mapas de rearranjo (ou grupos): Em vírus com genomas segmentados, a atribuição de mutações em determinados segmentos do genoma resulta na identificação de grupos de rearranjo geneticamente ligados equivalentes a segmentos de genoma individuais.
Outros tipos de mapas que podem ser construídos incluem o seguinte:
Mapas físicos: Mutações ou outras características podem ser atribuídas a locais físicos em um genoma viral usando o resgate de genomas mutantes por pedaços pequenos do genoma do tipo selvagem (por exemplo, a formação heteroduplex entre DNA mutante e selvagem), após a transfecção de células suscetíveis. Alternativamente, as células podem ser cotransfectadas com o genoma mutante mais fragmentos de restrição individuais para localizar a mutação. Da mesma forma, vários polimorfismos (tais como mobilidade eletroforética de proteínas) podem ser usados para determinar a estrutura genética de um vírus.
Mapas de restrição: a clivagem sítio-específica do DNA por endonucleases de restrição pode ser usada para determinar a estrutura do genoma do vírus. Genomas de RNA podem ser analisados dessa maneira após a clonagem do cDNA.
Mapas de transcrição: Mapas de regiões codificando vários mRNAs podem ser determinados pela hibridação de espécies de mRNA contra fragmentos específicos do genoma (por exemplo, fragmentos de restrição). O início/fim exato de mRNAs pode ser determinado por digestão, com nucleases específicas de simples fita, de sondas radiomarcadas. Proteínas codificadas por mRNAs individuais podem ser determinadas por tradução in vitro. Irradiação ultravioleta (UV) de genomas de vírus RNA também pode ser usada para determinar a posição de quadros de leitura aberta, porque os mais distantes, desde o início da tradução são os menos prováveis de ser expressos por tradução in vitro após a degradação parcial do RNA do vírus por luz UV.
Mapas de tradução: A Pactamicina (que inibe a iniciação da tradução) tem sido utilizada para mapear regiões codificadoras de proteínas de enterovírus. Resultados de pulso de marcação na incorporação de radioatividade apenas em proteínas iniciado antes da adição da droga. Proteínas mais próximas da extremidade 3´ do genoma são as mais fortemente marcadas, enquanto as da extremidade 5´ do genoma são o mínimo.
VÍRUS MUTANTES 
"Mutante", "linhagem", "tipo", "variante" e até "isolado" são termos usados indistintamente por virologistas para diferenciar vírus particulares um do outro e do original "parental", "tipo selvagem" ou isolado desse vírus. Mais precisamente, estes termos são geralmente aplicados como segue:
Linhagem: Diferentes linhagens ou isolados do mesmo vírus (por exemplo, de diferentes localizações geográficas ou pacientes)
Tipo: sorotipos diferentes do mesmo vírus (por exemplo, vários fenótipos de neutralização de anticorpos)
Variante: Um vírus cujo fenótipo difere da cepa do tipo selvagem original, mas a base genética para a diferença não é conhecida
A ORIGEM DE VÍRUS MUTANTES
Mutações espontâneas
Em alguns vírus, as taxas de mutação podem ser tão elevadas quanto 10-3 a 10-4 por nucleotídeo incorporado (por exemplo, em retrovírus, como o vírus da imunodeficiência humana, ou HIV), enquanto que em outros podem ser tão baixas quanto 10-8 a 10-11 (por exemplo, em herpesvírus), que é equivalente ao observado em taxas de mutação do DNA celular. Essas diferenças são devidas ao mecanismo de replicação do genoma, com taxas de erro em RNA polimerases RNA-dependentes em geral sendo maiores do que em DNA polimerases DNA-dependentes. Algumas polimerases de vírus de RNA têm funções de revisão de leitura (proof-reading), mas em geral taxas de mutação são consideravelmente mais elevadas na maioria dos vírus de RNA do que em vírus de DNA. Para um vírus, as mutações são uma faca de dois gumes. A capacidade de gerar variantes antigênicas que podem escapar da resposta imune é uma clara vantagem, mas a mutação também resulta em muitas partículas defeituosas, já que a maioria das mutações é deletéria. Nos casos mais extremos (por exemplo, HIV), a taxa de erro é de 10-3 a 10-4 por nucleotídeo incorporado.
O genoma do HIV possui aproximadamente 9,7 kb de comprimento; portanto, haverá 0,9 a 9,7 mutações em cada genoma copiado. Portanto, neste caso, o vírus tipo selvagem na verdade consiste de um tipo de maioria transitório que domina o equilíbrio dinâmico (ou seja, a população de genomas) presentes em todas as culturas do vírus. Estas misturas de variantes moleculares são conhecidas como quase-espécies e também ocorrem em outros vírus de RNA (por exemplo, picornavírus); porém, a maioria desses tipos será não-infecciosa ou seriamente desvantajosa e, portanto, rapidamente eliminados de uma população replicando. Este mecanismo é uma força importante na evolução do vírus (Ver Evolução e Epidemiologia).
Mutações induzidas
Historicamente, a maioria das análises genéticas dos vírus foi realizada em vírus mutantes isolados de populações tratadascom mutágenos. Substâncias mutagênicas podem ser divididas em dois tipos:
In vitro, mutágenos modificam quimicamente ácidos nucléicos e não necessitam de replicação para a sua atividade. Exemplos incluem o ácido nitroso, hidroxilamina, e agentes alquilantes(por exemplo, nitrosoguanidina).
In vivo, mutágenos exigem ácido nucléico metabolicamente ativo (ou seja, replicando) para sua atividade. Estes compostos são incorporados em ácidos nucléicos recentemente replicados e causam mutações ao serem introduzidos durante as rodadas subsequentes da replicação. Exemplos incluem análogos de base como o 5-bromouracil que resultam em pareamento errôneo das bases; agentes intercalantes (por exemplo, corantes acridina) que se acomodam entre as bases, causando inserções ou deleções, e radiação UV, que provoca a formação de dímeros de pirimidina, que são excisados do DNA por meio de mecanismos de reparo que são muito mais propensos a erros que as enzimas habituais utilizadas na replicação do DNA.
Experimentos envolvendo mutágenos químicos sofrem uma série de inconvenientes:
A segurança é uma preocupação, como mutágenos são geralmente cancerígenos são também frequentemente altamente tóxicos. Eles são compostos muito desagradáveis para trabalhar.
A dose de mutagênico utilizada deve ser escolhida com cuidado para dar uma média de 0,1 mutação por genoma; caso contrário, o vírus resultante irá conter múltiplas mutações que podem complicar a interpretação do fenótipo. Portanto, a maioria dos vírus que resultarão não conterão quaisquer mutações, o que é ineficiente como a seleção de mutantes pode ser muito trabalhosa.
Não há nenhum controle sobre onde as mutações ocorrem, e às vezes é difícil ou impossível isolar mutações em um gene específico ou região de interesse.
Por estas razões, métodos biológicos moleculares sítio-específicos, tais como mutagênese oligonucleotídeo-dirigida e mutagênese baseada em PCR são muito mais comumente usados. Juntamente com técnicas tais como digestão enzimática (para criar deleções) e pareamento de linkers (para criar inserções), agora é possível introduzir quase qualquer tipo de mutação precisamente e de forma segura em qualquer local específico de um genoma viral.
TIPOS DE VÍRUS MUTANTES
O fenótipo de um vírus mutante depende do tipo de mutação(s) que ele possui e também sobre a localização da mutação(s) dentro do genoma. Cada uma das classes de mutações abaixo pode ocorrer naturalmente no vírus ou pode ser artificialmente induzida para fins experimentais:
Marcadores bioquímicos: Esta categoria inclui as mutações de resistência às drogas; mutações específicas que resultam em virulência alterada; polimorfismos resultantes em alterações de mobilidade eletroforética de proteínas ou ácidos nucleicos e sensibilidade alterada para agentes inativantes.
Deleções: Estes são semelhantes em algumas maneiras aos mutantes sem sentido (veja abaixo), mas podem incluir um ou mais genes do vírus e envolver regiões de controle não codificantes do genoma (promotores, etc.). Mutantes de deleções espontâneas muitas vezes acumulam-se em populações de vírus como partículas defectivas interferentes (DI). Estes genomas não infecciosos, mas não necessariamente geneticamente inertes acredita-se serem importantes para estabelecer o curso e a patogenia de determinadas infecções virais (ver Capítulo 6). Deleções genéticas só podem reverter ao tipo selvagem por recombinação, o que geralmente ocorre em freqüências relativamente baixas. Mutantes de deleção são muito úteis para a atribuição de relações estrutura-função de genomas de vírus, assim como são facilmente mapeados por análise física.
Série de hospedeiros: Este termo pode se referir tanto aos hospedeiros de animais inteiros ou células do tipo permissivas in vitro. Mutantes condicionais desta classe têm sido isolados utilizando células supressoras (principalmente para fagos, mas também para os vírus em animais, utilizando sistemas in vitro).
Sem sentido: Estas resultam da alteração da sequência codificante de uma proteína para um dos três códons de parada da tradução (UAG, amarelo; UAA ocre; UGA, opala). A tradução é finalizada, resultando na produção de um fragmento amino-terminal da proteína. O fenótipo destas mutações pode ser suprimido pela propagação do vírus em uma célula (bactérias ou, mais recentemente, animais), com tRNAs supressores alterados. As mutações sem sentido raramente são puladas (i.e., a função normal da proteína é completamente obliterada) e só podem voltar ao tipo selvagem 
no sítio original (veja abaixo). Assim, geralmente mostram uma baixa freqüência de reversão.
Morfologia de placa: Mutantes podem ser mutantes de placa grande, que replicam mais rapidamente do que o tipo selvagem, ou de placa de pequena, que são o oposto. O tamanho da placa é muitas vezes relacionado a um fenótipo sensível à temperatura (t.s.) (veja abaixo). Esses mutantes são frequentemente úteis como marcadores não selecionados em cruzamentos multifatoriais.
Sensíveis à temperatura (t.s.): Este tipo de mutação é muito útil, pois permite o isolamento de mutações letais condicionais, um poderoso meio de análise de genes de vírus que são essenciais para a replicação e cuja função não possa ser interrompida. Mutações t.s. geralmente resultam de mutações com sentido trocado em proteínas (i.e., substituições de aminoácidos), resultando em proteínas de tamanho completo com
conformações sutilmente alteradas que podem funcionar em baixas temperaturas (permissivas), mas não em mais elevadas(não permissivas). Geralmente, as proteínas mutantes são imunologicamente inalteradas, o que frequentemente é um atributo útil. Estas mutações são geralmente fracas ou seja, uma parte da atividade normal é mantida mesmo em temperaturas não permissivas. Por outro lado, a função da proteína é muitas vezes prejudicada, mesmo em temperaturas permissivas e, portanto, uma alta frequência de reversão é muitas vezes um problema com este tipo de mutação, porque o vírus do tipo selvagem se replica mais rápido do que o mutante. Em alguns vírus (por exemplo, reovírus, vírus influenza), muitos mutantes t.s. foram obtidos ao longo dos anos para cada gene do vírus, o que permitiu a análise genética completa destes genomas antes do advento da biologia molecular.
Sensíveis ao frio: Estes mutantes são o oposto dos mutantes t.s. e muito úteis para bacteriófagos e vírus de plantas cujas células hospedeiras podem ser propagadas em baixas temperaturas, mas são menos úteis para os vírus de origem animal porque suas células hospedeiras geralmente não irão crescer em temperaturas significativamente inferiores ao normal.
Revertentes: A mutação reversa é um tipo válido de mutação em seu próprio direito. A maioria das classes acima pode sofrer mutações reversas, que podem ser simples "mutações de volta" (ou seja, correção da mutação original) ou “mutações compensatórias" de segundo sítio, que podem ser fisicamente distantes da mutação original e nem mesmo necessariamente no mesmo gene como a mutação original.
SUPRESSÃO
Supressão é a inibição de um fenótipo mutante por uma segunda mutação supressora,
que pode ser tanto no genoma do vírus como no da célula hospedeira. É importante ressaltar que este mecanismo de supressão não é o mesmo que a supressão das mutações finalizadoras de cadeia por tRNAs supressores codificados pelo hospedeiro (ver discussão acima), o que poderia ser chamado de "supressão de informação." Supressão genética resulta em um fenótipo aparentemente selvagem de um vírus que ainda é geneticamente mutante - um pseudorevertente. Esse fenômeno tem sido melhor caracterizado em sistemas procarióticos. Mais recentemente, alguns exemplos foram descobertos em vírus de animais, por exemplo, reoviruses, vaccinia, e influenza, onde a supressão foi observada em uma vacina atenuada, levando a um vírus aparentemente virulento, uma observação que pode ser clinicamente importante. Supressão também pode ser biologicamente importante, uma vez que permite ao vírus superar os efeitosnocivos das mutações e, portanto, ser positivamente selecionado. Vírus mutantes podem aparecer para reverter ao seu fenótipo original por três vias:
Uma segunda mutação devolve a mutação original para dar um genótipo/fenótipo do tipo selvagem (reversão verdadeira)
Uma segunda mutação compensatória, que pode ocorrer no mesmo gene que a mutação original, corrige a primeira, mas sem devolve-la ao estado selvagem por exemplo, uma segunda mutação muda a fase de leitura restabelecendo a fase de leitura original (supressão intragênica)
Uma mutação supressora em um gene diferente do vírus ou do hospedeiro (supressão extragênica)
INTERAÇÕES GENÉTICAS ENTRE VÍRUS
Interações genéticas entre os vírus frequentemente ocorrem naturalmente, como organismos hospedeiros são frequentemente infectados com mais de um vírus; no entanto, estas situações são, em geral, demasiado complicadas para serem analisadas com êxito. Experimentalmente, interações genéticas podem ser analisadas por infecção mista (superinfecção) de células em cultura. Dois tipos de informação podem ser obtidos de tais experimentos:
A designação de mutantes para grupos funcionais conhecidos como grupos de complementação
A ordenação dos mutantes em um mapa genético linear através da análise de frequências de recombinação
Resultados da complementação para a interação entre os produtos dos genes do vírus durante superinfecção que resulta na produção de um ou de ambos os vírus parentais são aumentados enquanto ambos os vírus permanecem geneticamente inalterados. Nesta situação, um dos vírus em uma infecção mista fornece um produto gênico funcional para
outro vírus que é defectivo para essa função (Figura 3.2). Se ambos mutantes são defectivos na mesma função, o aumento da replicação não ocorre e os dois mutantes são ditos estar no mesmo grupo de complementação. A importância deste teste é que ele permite a análise funcional de mutações desconhecidas se a base bioquímica de qualquer uma das mutações em um grupo de complementação particular é conhecida. Em teoria, o número de grupos de complementação é igual ao número de genes no genoma do vírus. Na prática, há geralmente menos grupos de complementação que genes, visto que mutações em alguns genes são sempre letais e outros genes são desnecessários e, portanto, não podem ser contados neste tipo de teste. Existem dois tipos possíveis de complementação:
Complementação alélica (intragênica) ocorre quando diferentes mutantes têm defeitos complementares na mesma proteína (por exemplo, em diferentes domínios funcionais) ou em diferentes subunidades de uma proteína multimérica (embora isso seja raro).
Complementação não alélica (intergênica) resulta de mutantes com defeitos em diferentes genes e é o tipo mais comum.
Complementação pode ser assimétrica; ou seja, apenas um dos (mutantes) vírus parentais irá replicar. Isso pode ser uma restrição absoluta ou parcial. Quando a complementação ocorre naturalmente, como é geralmente o caso em que um vírus de tipo selvagem com replicação competente resgata um mutante defeituoso para a replicação. Nestes casos, o tipo selvagem é referido como um "vírus helper", como no caso de retrovírus transformantes defectivos que contêm oncogenes (ver Figura 3.3 e Capítulo 7).
Recombinação é a interação física de genomas de vírus durante a superinfecção
que resulta em combinações de genes não presentes em qualquer um dos progenitores. Há três mecanismos pelos quais isto pode ocorrer, dependendo da organização do genoma viral:
Recombinação intramolecular por quebra da fita e re-ligação: Este processo ocorre em todos os vírus de DNA e vírus de RNA que se replicam por meio de um intermediário de DNA. Acredita-se ser mediada por enzimas celulares, já que nenhum vírus mutante com defeitos específicos de recombinação foi isolado.
Recombinação intramolecular por escolha de cópia: Esse processo ocorre em vírus de RNA (são conhecidos em picornavírus desde 1960, mas foram reconhecidos em outros grupos de vírus, como o coronavírus, apenas recentemente), provavelmente por um mecanismo no qual a polimerase do vírus troca fitas molde durante a síntese do genoma. Os detalhes moleculares deste processo não são bem compreendidos. Existem enzimas celulares que podem estar envolvidas (por exemplo, as enzimas de splicing), mas isso é improvável e o processo é pensado para ocorrer essencialmente como um evento aleatório. Partículas interferentes defectivas (DI) em infecções por vírus de RNA são frequentemente geradas deste modo (ver Capítulo 6).
Rearranjo: Em vírus com genoma segmentado, os segmentos do genoma podem ser misturados aleatoriamente durante a superinfecção. A progênie dos vírus recebe (pelo menos) um de cada um dos segmentos do genoma, mas provavelmente não a partir de um único parental. Por exemplo, o vírus influenza possui 8 segmentos genômicos, portanto, em uma infecção mista poderia haver 28=256 possíveis progênies virais. Os mecanismos de empacotamento nestes vírus não estão entendidos (ver Capítulo 2), mas podem estar envolvidos na geração de rearranjos.
Na recombinação intramolecular, a probabilidade que eventos de ruptura-reunião ou troca de fitas ocorram entre dois marcadores (resultando em recombinação) é proporcional à distância física entre eles e, portanto, pares de marcadores podem ser organizados em um mapa genético linear, com distâncias medidas em "unidades de mapa" (ou seja, o percentual de frequência de recombinação). No rearranjo, a frequência de recombinação entre dois marcadores é ou muito elevada (indicando que os marcadores estão em dois segmentos diferentes do genoma) ou relativamente baixa (o que significa que eles estão no mesmo segmento).
A reativação é a geração de descendentes infecciosos (recombinantes) de genomas de vírus parentais não infecciosos. Este processo tem sido demonstrado in vitro e pode ser importante in vivo. Por exemplo, tem sido sugerido que a recuperação de provírus HIV defectivos há muito adormecidos, durante o longo curso clínico da síndrome da imunodeficiência adquirida (AIDS) pode resultar em aumentada diversidade antigênica e contribuir para a patogênese da doença. Recombinação ocorre frequentemente na natureza, por exemplo, o rearranjo de vírus da gripe resultou em epidemias em todo o mundo (pandemias), que mataram milhões de pessoas (Capítulo 6). Isto torna essas interações genéticas de interesse prático considerável e não apenas uma matéria acadêmica.
INTERAÇÕES NÃO GENÉTICAS ENTRE VÍRUS
Um número de interações não genéticas entre vírus ocorrem e podem afetar os efeitos e interpretação dos resultados de cruzamentos genéticos. Células eucarióticas têm um genoma diplóide com duas cópias de cada cromossomo, cada uma com seu próprio alelo do mesmo gene. Os dois cromossomos podem diferir em marcadores alélicos em muitos loci. Entre os vírus, apenas os retrovírus são realmente diplóides, com duas cópias completas do genoma inteiro, mas alguns vírus de DNA, como herpesvírus, têm sequências repetidas e, portanto, parcialmente heterozigotas. Em alguns (a maioria envelopados) vírus, o empacotamento aberrante de genomas múltiplos pode, ocasionalmente, resultar em partículas multiplóides que são heterozigotas (por exemplo, até 10% das partículas do vírus da doença de Newcastle). Este processo é conhecido como heterozigose e pode contribuir para a complexidade genética das populações de vírus. Outra interação não genética entre vírus que é comumente vista é a interferência. Este processo resulta da resistência à superinfecção por um vírus detectado em células já infectadas por outro vírus. Interferência homóloga (ou seja, contra o mesmo vírus) geralmente resulta da presença de partículas D.I. que concorrem para os componentes celulares essenciais e bloqueiam a replicação. No entanto, a interferência pode resultar também de outros tipos de mutação (por exemplo, mutações t.s. dominantes) ou pelo sequestro de receptores virais, devido à produção de proteína de fixação a vírus por vírus já presentes dentro da célula(por exemplo, no caso dos retrovírus aviários).
Mistura fenotípica pode variar de casos extremos, onde o genoma de um vírus é completamente fechado dentro do capsídeo ou envelope de outro (pseudotipagem) aos casos mais sutis, onde o capsídeo/envelope da progênie contém uma mistura de proteínas de ambos os vírus. Essa mistura dá à descendência do vírus as propriedades fenotípicas (por exemplo, o tropismo celular) dependendo das proteínas incorporadas na partícula, sem qualquer alteração genética. As gerações subsequentes de vírus herdam e exibem os fenótipos parentais originais. Este processo pode ocorrer facilmente em vírus com capsídeos nus (não envelopados), que estão intimamente relacionados (por exemplo, diferentes cepas de enterovírus) ou em vírus com envelope, que não precisam ser relacionados entre si (Figura 3.4). Neste último caso, o fenômeno é devido à incorporação inespecífica de diferentes glicoproteínas do vírus dentro do envelope, resultando em um fenótipo misto. O resgate de retrovírus transformantes defectivos para replicação por um vírus helper na forma pseudotipada. A mistura fenotípica provou ser uma ferramenta muito útil para estudar as propriedades biológicas de vírus. O vírus da estomatite vesicular (VSV) prontamente forma pseudotipos contendo glicoproteínas do envelope de retrovírus, dando um vírus formador de placas com as propriedades do VSV, mas com o tropismo celular dos retrovírus. Este truque tem sido usado para estudar o tropismo celular do HIV e outros retrovírus.
“GRANDES” GENOMAS DE DNA
Um número de grupos de vírus tem genomas de DNA dupla-fita de considerável tamanho e complexidade. Em muitos aspectos, estes vírus são geneticamente muito semelhantes às células do hospedeiro que infectam. Dois exemplos são os membros das famílias Adenoviridae e Herpesviridae. Herpesviridae é uma grande família com mais de 100 membros diferentes, pelo menos um para a maioria das espécies animais que foram examinados até hoje. Existem oito herpesvírus humanos, que compartilham uma a estrutura conjunta do genoma comum, mas que diferem em pequenos detalhes da organização do genoma e ao nível da sequência de nucleotídeos. A família está dividida em três subfamílias, com base em sua sequência de nucleotídeos e propriedades biológicas (Tabela 3.1). 
Herpesvírus têm genomas muito grandes compostos de 235 kbp de DNA linear, dupla-fita e grandes e complexas partículas virais contendo cerca de 35 polipeptídeos no virion. Todos codificam uma variedade de enzimas envolvidas no metabolismo dos ácidos nucléicos, síntese de DNA, e processamento de proteínas (por exemplo, proteínas quinases). Os diferentes membros da família são amplamente separados em termos de sequência genômica e proteínas, mas todos são semelhantes em termos de estrutura e organização do genoma (Figura 3.5a). Alguns, mas não todos os genomas de herpesvírus são compostos por duas seções covalentemente ligadas, uma região única longa (UL) e uma única curta (US), cada uma delimitada por repetições invertidas. As repetições permitem rearranjos estruturais de regiões únicas, portanto, estes genomas existem como uma mistura de quatro isômeros, que são funcionalmente equivalentes (Figura 3.5b). Genomas de herpesvírus também contêm várias sequências repetidas e, dependendo do número destas, o tamanho do genoma de vários isolados de um vírus particular pode variar até 10 kbp.
O membro protótipo da família é o vírus do herpes simples (HSV), cujo genoma é composto de aproximadamente 152 bp de DNA dupla-fita, e a sequência completa dos nucleotídeos tem sido agora determinada. Esse vírus contém cerca de 80 genes, densamente empacotados e com sobreposição de quadros de leitura, no entanto, cada gene é expresso a partir do seu próprio promotor (ver discussão de adenovírus abaixo). A maioria dos oito genomas humanos herpesvírus já foi completamente sequenciado. Sequências de nucleotídeos são cada vez mais utilizadas como um critério importante na classificação dos herpesvírus, por exemplo, no caso do recém-descoberto herpesvírus 8 humano (HHV-8, veja Capítulo 8). Antes do desenvolvimento do sequenciamento de nucleotídeos, o genoma do HSV já havia sido amplamente mapeado por análise genética convencional, incluindo o estudo de um número muito grande de mutantes t.s. HSV é talvez o mais intensamente estudado genoma de vírus complexo.
Em contraste com o herpesvírus, os genomas de adenovírus são compostos por DNA linear, dupla-fita, de 30-38 kbp; o tamanho preciso varia entre os grupos. Esses genomas virais contêm de 30-40 genes (Figura 3.6). A sequência terminal de cada cadeia de DNA é uma repetição invertida de 100 a 140 pb e, portanto, as fitas únicas podem se desnaturar formando estruturas do tipo "Panhandle". Estas estruturas são importantes na replicação do DNA, já que uma proteína de 55 kDa, conhecida como proteína terminal, está ligada covalentemente à extremidade 5´ de cada fita. Durante a replicação do genoma, esta proteína atua como um primer, iniciando a síntese de novas cadeias de DNA. Embora os genomas de adenovírus sejam consideravelmente menores que os dos herpesvírus, a expressão da informação genética é muito mais complexa. Grupos de genes são expressos a partir de um número limitado de promotores compartilhados. Múltiplos mRNAs gerados a partir de padrões de splicing alternativo são usados para expressar uma variedade de polipeptídeos a partir de cada promotor (ver Capítulo 5).
“PEQUENOS” GENOMAS DE DNA
A enterobactéria fago M13 já foi mencionada no capítulo 2. O genoma deste fago é composto de 6,4 kb de DNA circular,fita-simples, sentido(+), e codifica dez genes. Diferentemente da maioria dos virions icosaédricos, o capsídeo filamentoso M13 pode ser expandido pela adição de novas subunidades da proteína. Assim, o tamanho do genoma também pode ser aumentado pela adição de sequências extras na região intergênica não essencial, sem se tornar incapazes de serem empacotados no capsídeo. Em outros bacteriófagos, as restrições do empacotamento são muito mais rígidas, por exemplo, no fago λ, apenas DNA de aproximadamente 95 e 110% (cerca de 46-54 kbp) do tamanho do genoma normal (49 kbp) podem ser empacotados na partícula viral. Nem todos os bacteriófagos têm genomas simples como M13, por exemplo, o genoma do fago λ é de cerca de 49 kbp e do fago T4 é de cerca de 160 kbp e DNA dupla-fita. Estes dois últimos bacteriófagos também ilustram outra característica comum de vírus de genoma linear, a importância das sequências presentes nas extremidades do genoma.
No caso do fago λ, o substrato embalado nas cabeças do fago durante a montagem consiste de longos concatâmeros do DNA do fago que são produzidos durante as fases posteriores da replicação vegetativa. O DNA é aparentemente fisgado pela cabeça do fago, e quando um genoma completo foi incorporado o DNA é clivado em uma sequência específica por uma endonuclease codificada pelo fago (Figura 3.7). Esta enzima deixa uma projeção de 12 pb 5´na extremidade de cada uma das fitas clivadas, conhecida como o sítio cos. A formação de pontes de hidrogênio entre as “extremidades coesivas” pode resultar na formação de uma molécula circular. Em uma célula recém infectada, as lacunas em ambos os lados do sítio cos são fechadas pela DNA ligase, e é esse DNA circular que sofre replicação vegetativa ou integração no cromossomo bacteriano.
A enterobactéria fago T4 ilustra outra característica molecular de certos genomas lineares de vírus – redundância terminal. A replicação do genoma T4 também produz longos concatâmeros de DNA. Estes são clivados por uma endonuclease específica, mas diferentemente do genoma λ, os comprimentos dos DNAs incorporados na partícula são um pouco mais longos que um comprimento de genoma completo (Figura 3.8); portanto, alguns genes são repetidos em cada extremidade do genoma, e o DNA empacotado nas partículas do fago contém informações reiteradas. Genomas de bacteriófagos não são necessariamente nem pequenos nem simples! 
Como outros exemplos de pequenosgenomas de DNA, considere aqueles de dois grupos de vírus animais: o parvovírus e poliomavírus. Genomas de parvovírus são lineares, não segmentados, de DNA fita-simples de cerca de 5 kb. A maioria das fitas empacotadas em virions são sentido(-), mas alguns parvoviruses empacotam quantidades iguais de fitas (+) e (-), e todos parecem empacotar pelo menos uma parte das fitas sentido(+). Estes são genomas muito pequenos, e até mesmo parvovírus replicação-competentes contém apenas dois genes: rep, que codifica proteínas envolvidas na transcrição e cap, que codifica as proteínas do revestimento. No entanto, a expressão destes genes é bastante complexa, semelhante ao padrão observado em adenovírus, com vários padrões de splicing vistos para cada gene (Capítulo 5). As extremidades do genoma tem sequências palindrômicas com cerca de 115 nt que formam "grampos de cabelo"(Figura 3.9). Estas estruturas são essenciais para a iniciação da replicação do genoma, mais uma vez enfatizando a importância das sequências nas extremidades do genoma.
Os genomas de poliomavírus consistem de moléculas de DNA circular, dupla-fita de cerca de 5 kbp. A arquitetura do genoma poliomavírus (isto é, número e arranjo dos genes e da função dos sinais e sistemas regulatórios) tem sido estudada em grande detalhe em um nível molecular. Dentro das partículas, o DNA do vírus assume uma forma superenrolada e está associado com quatro histonas celulares: H2A, H2B, H3 e H4 (ver Capítulo 2). A organização do genoma destes vírus evoluiu para empacotar o máximo de informação (seis genes) em um mínimo espaço (5 kbp). Isto foi conseguido através da utilização de ambas as fitas do DNA do genoma e genes sobrepostos (Figura 3.10). VP1 é codificada por um dedicado quadro de leitura aberta (ORF), mas os genes VP2 e VP3 se sobrepoem, de modo que VP3 está contido dentro de VP2. A origem de replicação é cercada por regiões não codificantes que controlam a transcrição. Poliomavírus também codificam "antígenos-T", que são proteínas que podem ser detectados no soro de animais com tumores induzidos por poliomavírus. Essas proteínas ligam-se à origem de replicação e mostram atividades complexas nas quais estão envolvidas, tanto na replicação do DNA e na transcrição de genes do vírus. Este tópico será discutido no Capítulo 7.
VÍRUS DE RNA FITA-POSITIVA
O tamanho máximo de genomas de RNA fita-simples é limitado pela fragilidade do RNA e tendência de longas cadeias à quebra. Além disso, genomas de RNA tendem a ter taxas de mutação maiores do que os compostos de DNA porque são copiados com menor precisão. Esta tendência acabou conduzindo os vírus de RNA a ter genomas menores. Genomas de RNA fita-simples variam em tamanho daqueles dos coronavírus,que tem aproximadamente 30 kb de comprimento, dos de bacteriófagos como MS2 e Qβ, com cerca de 3,5 kb. Embora membros de famílias distintas, a maioria vírus de RNA com sentido(+) de vertebrados partilham características comuns em termos de biologia de seus genomas. Em particular, vírus de RNA sentido(+) purificado são diretamente infecciosos quando aplicados a células do hospedeiro suscetíveis na ausência de proteínas do vírus (embora seja cerca de um milhão de vezes menos infeccioso do que as partículas do vírus). Ao examinar as características dessas famílias, embora os detalhes da organização do genoma variem, repetidos temas emergem (Figura 3.11).
Picornavírus
O genoma dos picornavírus é constituído de uma única molécula de RNA fita-simples, sentido(+) de 7,2 kb em rinovírus humanos (HRVs) a 8,5 kb no vírus da febre aftosa (FMDVs), contendo um número de características conservadas em todos os picornavírus:
Existe uma longa (600-1200 nt) região não traduzida (UTR) na extremidade 5´, que é importante na tradução, virulência e possivelmente encapsidação, bem como uma região mais curta não traduzida (50-100 nt) na extremidade 3´ que é necessária para a síntese da fita (-) durante a replicação.
A UTR 5´ contém uma estrutura secundária "folha de trevo" conhecida como o sítio de entrada interna ribossomal (IRES) (Capítulo 5).
O restante do genoma codifica uma poliproteína única entre 2100 e 2400 aminoácidos.
Ambas as extremidades do genoma são modificadas - a extremidade 5´ por uma pequena, covalentemente ligada e básica proteína VPg (23 aminoácidos); e a extremidade 3´ por poliadenilação.
Togavírus
O genoma dos togavírus é composto por RNA não segmentado, fita-simples, sentido(+), de aproximadamente 11,7 kb. Ele tem as seguintes características:
Assemelha-se a mRNAs celulares na medida em que tem um cap 5´ metilado e seqüências poli (A) 3´.
A expressão é alcançada por duas rodadas de tradução, produzindo primeiro as proteínas não-estruturais codificadas na parte 5´ do genoma e, posteriormente, as proteínas estruturais da parte 3´.
Flavivírus
O genoma dos flavivírus é composto por uma molécula de RNA fita-simples, sentido(+), de aproximadamente 10,5 kb e possui as seguintes características:
Tem um cap 5´ metilado, mas na maioria dos casos o RNA não é poliadenilado na extremidade 3´.
A organização genética difere da dos togavírus(acima) no qual as proteínas estruturais são codificadas na parte 5´do genoma e as proteínas não estruturais na parte 3´.
A expressão é similar a dos picornavírus, envolvendo a produção de uma poliproteína.
Coronavírus
O genoma dos coronavírus é composto por RNA não segmentado, fita-simples, sentido(+), de aproximadamente 27 a 30 kb de comprimento, que é o maior de qualquer vírus de RNA. E também tem as seguintes características:
Tem um cap 5´ metilado, poli (A) 3´, e o vRNA funciona diretamente como mRNA.
O segmento de 5´ de 20 kb do genoma é traduzido primeiro para produzir uma polimerase do vírus, que então produz uma fita completa com sentido (-). Essa é usada como um molde para produzir mRNA como um conjunto de transcritos, todos com uma idêntica sequência líder 5´não traduzida de 72 nt e extremidades coincidentes poliadeniladas 3´.
Cada mRNA é monocistrônico, os genes na extremidade 5´ sendo traduzidos a partir do mais longo mRNA e assim por diante. Estas estruturas incomuns citoplasmáticas são produzidas não por splicing (modificação pós transcricional), mas pela polimerase durante a transcrição. 
 
Vírus de plantas RNA sentido(+)
A maioria (mas não todas) das famílias de vírus de plantas tem genomas de RNA com sentido (+). O genoma do vírus do mosaico do tabaco tobamovírus (TMV) é um exemplo bem estudado (Figura 3.12):
O genoma TMV é uma molécula de RNA com 6,4 kb que codifica quatro genes.
Existe um cap 5´ metilado e a extremidade 3´ do genoma contém uma estrutura secundária extensa, mas não sequências poli (A).
O mecanismos de expressão lembra o da expressão dos togavírus, embora um pouco distinta, produzindo proteínas não estruturais pela tradução direta do fase de leitura aberta codificado na região 5´ do genoma e a proteína da capa do vírus e outras proteínas não-estruturais de dois RNAs subgenômicos codificados pela parte 3´.
As semelhanças e diferenças entre genomas nesta categoria serão mais consideradas na discussão da evolução do vírus abaixo e no Capítulo 5.
VÍRUS DE RNA FITA-NEGATIVA
Genomas de vírus de RNA sentido negativo são um pouco mais diversificados do que os vírus de sentido positivo discutidos anteriormente. Possivelmente devido às dificuldades de expressão, tendem a ter maiores genomas codificando mais informação genética. Devido a isso, a segmentação é uma característica comum, embora não universal, de tais vírus (Figura 3.13). Nenhum desses genomas é infeccioso como RNA purificado. Embora um gene que codifica uma RNA polimerase dependente de RNA tenha sido recentemente encontrado em algumas células eucarióticas, a maioria das células não infectadas não contêm atividade de RNA polimerase dependente de RNA suficiente para suportar a replicação do vírus e, como o genoma sentido(-) não pode ser traduzido como mRNA sem a polimerase do vírus empacotada em cada partícula, estes genomassão efetivamente inertes. Alguns dos vírus descritos nesta seção não são estritamente de sentido negativo, mas são ambisentido, pois são parte sentido(-)e parte sentido(+). Estratégias de codificação ambisentido ocorrem em vírus de plantas (por exemplo, do gênero Tospovirus dos buniavírus e tenuivírus tais como o vírus do arroz) e vírus animais (gênero Phlebovírus do buniavírus e arenavírus).
Bunyavírus
Os membros Bunyaviridae tem RNA segmentado fita-simples, sentido(-). O genoma tem as seguintes características:
O genoma é composto de três moléculas: L (8,5 kb), M (5,7 kb) e S (0,9 kb).
Todas as três espécies de RNA são lineares, mas no virion aparecem circulares porque as extremidades são mantidas juntas por pareamento de bases. Os três segmentos não estão presentes em preparações virais em quantidades equimolares.
Em comum com todos os RNAs de sentido(-), as extremidades 5´não possuem cap e as 3´ não são poliadeniladas.
Os membros dos gêneros Tospovírus e Phlebovírus diferem dos outros três gêneros na família (Bunyavírus, Nairovírus e Hantavírus), nos quais o segmento S do genoma é um pouco maior e com a organização geral do genoma diferente, ambisentido (i.e., na extremidade 5´ de cada segmento é sentido(+), mas no final 3´ é sentido(-)). O gênero Tospovírus também tem uma estratégia de codificação ambisentido no segmento M do genoma.
Arenavírus
Genomas de Arenavírus são compostos por RNA fita-simples lineares. Existem dois segmentos do genoma: L (5,7 kb) e S (2,8 kb). Ambos têm uma organização ambisentido, como acima.
Orthomyxovírus
Veja a discussão do genoma segmentado (abaixo).
Paramyxovírus
Os membros Paramyxoviridae têm RNA sentido(-) não segmentado de 15 a 16 kb. Tipicamente, seis genes são organizados em um arranjo linear (3´-NP-P/C/V-M-F-HN-L-5´) separados por sequências repetidas: um sinal de poliadenilação na extremidade do gene, uma sequência intergênica (GAA), e um sinal de início de tradução no início do próximo gene. 
Rhabdovírus
Vírus Rhabdoviridae tem RNA sentido(-) não segmentado de cerca de 11 kb. Existe uma região líder de cerca de 50 nt na extremidade 3´do genoma e uma região não traduzida (UTR)de 60 nt na extremidade 5´do vRNA. Em geral, o arranjo genético é semelhante ao dos paramyxovírus, com um sinal de poliadenilação conservado no final de cada gene e regiões intergênicas curtas entre os cinco genes.
GENOMAS DE VÍRUS SEGMENTADOS E MULTIPARTIDOS
Muitas vezes existe alguma confusão sobre estas duas categorias de estrutura do genoma. Genomas segmentados virais são aqueles que são divididos em duas ou mais moléculas fisicamente separadas de ácido nucleico, que são então empacotadas em uma única partícula viral. Em contraste, apesar de genomas multipartidos serem também segmentados, cada segmento do genoma é empacotado em uma partícula viral separada. Estas partículas discretas são estruturalmente similares e podem conter as mesmas proteínas, mas que muitas vezes diferem no tamanho dependendo do comprimento do segmento do genoma empacotado. Em certo sentido, genomas multipartidos são, naturalmente, segmentados, mas não é esse sentido estrito dos termos que será utilizado aqui.
A segmentação do genoma do vírus tem uma série de vantagens e desvantagens. Há um limite para o tamanho de um genoma de vírus não segmentado que resulta das propriedades físicas dos ácidos nucléicos, particularmente da tendência das moléculas longas de se quebrarem devido às forças de mecânicas (e, para cada vírus em particular, o comprimento de ácido nucléico que pode ser empacotado no capsídeo). O problema da ruptura da fita é particularmente relevante para o RNA de fita-simples, que é muito mais instável quimicamente que o DNA de fita dupla. Os genomas de RNA fita simples mais longos são os dos coronavírus, com aproximadamente 30 kb, mas os genomas de vírus de DNA fita dupla são consideravelmente mais longos (por exemplo, Mimivírus até 800 kbp). A quebra física do genoma resulta na sua inativação biológica, uma vez que não pode ser totalmente transcrito, traduzido, ou replicado. Segmentação significa que o vírus evita "ter todos os seus ovos na mesma cesta" e também reduz a probabilidade de rupturas devido à tensão de cisalhamento, aumentando assim o potencial total da capacidade de codificação do genoma inteiro. No entanto, a desvantagem desta estratégia é que todos os segmentos do genoma individual devem ser acondicionados em cada partícula do vírus ou o vírus vai ser defeituoso, como resultado da perda de informação genética. Em geral, não é entendido como esse controle do empacotamento é realizado. Separando os segmentos do genoma em diferentes partículas (a estratégia multipartida) elimina a exigência de classificação precisa, mas introduz um novo problema em que todas as partículas do vírus discretas devem ser tomadas por uma única célula hospedeira para estabelecer uma infecção produtiva. Esta é talvez a razão pela qual vírus multipartidos só são encontrados nas plantas. Muitas das fontes de infecção por vírus de plantas, como a inoculação por insetos sugadores de seiva ou após danos físicos aos tecidos, resultam em um grande inóculo de partículas de vírus infecciosas, proporcionando oportunidades para a infecção de uma célula inicial por mais de uma partícula. A genética de genomas segmentados é essencialmente a mesma que a de genomas não segmentados, com a adição de rearranjo de segmentos, como discutido acima. Rearranjo pode ocorrer se os segmentos são empacotados em uma única partícula ou estão em uma configuração multipartida. O rearranjo é um poderoso meio para atingir a geração rápida de diversidade genética, o que poderia ser outra razão possível para a sua evolução. A segmentação do genoma também tem implicações para a divisão da informação genética e da maneira pela qual se expressa, que serão consideradas no Capítulo 5. Para entender a complexidade destes genomas, considere a organização de um genoma viral segmentado (vírus influenza A) e um genoma multipartido (geminivírus). O genoma do vírus da gripe é composto por oito segmentos (em cepas A e B de influenza , sete em influenza C), de RNA fita simples, sentido(-)(Tabela 3.2). A identidade das proteínas codificadas por cada segmento do genoma foi determinada inicialmente através da análise genética da mobilidade eletroforética dos segmentos individuais de vírus rearranjados e pela análise de um grande número de mutantes que abrange todos os oito segmentos. Os oito segmentos têm sequências de nucleotídeos comuns nas extremidades 5´ e 3´ (Figura 3.14) que são necessárias para a replicação do genoma (Capítulo 4). Essas sequências são complementares uma à outra, e, no interior da partícula, as extremidades dos segmentos do genoma são mantidas juntas por pareamento de bases e formam uma estrutura “cabo de caçarola” que ainda acredita-se estar envolvida na replicação. Os segmentos do genoma RNA não são empacotados como ácido nucleico "nu", mas em associação com o produto do gene 5, a nucleoproteína, e são visíveis em microscopia eletrônica como estruturas helicoidais. Aqui, encontramos um paradoxo. Bioquimicamente e geneticamente, cada segmento do genoma se comporta como uma entidade individual, discreta; porém, em microscopia eletrônica de partículas do vírus da gripe rompidas com detergente não-iônico, o nucleocapsídeo tem a aparência física de uma hélice única longa. Claramente, existe alguma interação entre os segmentos do genoma e é isso que explica a habilidade das partículas do vírus da gripe para selecionar e empacotar os segmentos do genoma dentro de cada partícula com uma taxa de erro surpreendentemente baixa, considerando a dificuldade da tarefa (Capítulo 2). As sequências do genoma e a interação proteica que exploram este mecanismo sutil ainda não foram definidas. Em muitas regiões tropicais e subtropicais do mundo, geminivírus são importantes patógenos de plantas. Geminivírus são divididos em três gêneros com base em suas plantas hospedeiras (monocotiledôneas ou dicotiledôneas)e insetos vetores (cigarrinhas ou moscas brancas). Nos gêneros Mastrevirus e Curtovirus, o genoma é constituído por uma molécula de DNA fita simples de aproximadamente 2,7 kb. O DNA empacotado nestes virions foi arbitrariamente designado como sentido(+), embora ambos os sentidos (+) e (-) encontrados em células infectadas contenham sequências codificadoras de proteínas. O genoma dos geminivírus no gênero Begmovirus é bipartido e consiste de duas moléculas de DNA de fita simples circulares, cada qual embalada em uma partícula distinta (Figura 3.15). Ambas as fitas que compõem o genoma possuem aproximadamente 2,7 kb de comprimento e diferem uma da outra completamente em sequência de nucleotídeos, com exceção de uma sequência não codificante compartilhada de 200 nt envolvida na replicação do DNA. Os dois DNAs genômicos são empacotados em capsídeos inteiramente separados. Como o estabelecimento de uma infecção produtiva requer ambas as partes do genoma, é necessário um mínimo de duas partículas de vírus tendo uma cópia de cada um dos segmentos do genoma para infectar uma nova célula hospedeira. Embora geminivírus não se multipliquem nos tecidos de seus insetos vetores (transmissão não propagativa), uma quantidade suficientemente grande de vírus é ingerida e, posteriormente, depositada em uma nova planta hospedeira para favorecer tais superinfecções. Ambos os exemplos mostram uma alta densidade de codificação da informação. No vírus da gripe, os genes 7 e 8 codificam duas proteínas em quadros de leitura sobrepostos. Em geminivírus, ambas as fitas do DNA de vírus encontrados em células infectadas contêm informação codificada, algumas das quais está presente em quadros de leitura sobrepostos. É possível que esta alta densidade de informação genética seja a razão pela qual esses vírus recorreram a genomas divididos, a fim de regular a expressão dessa informação (Ver Capítulo 5).
TRANSCRIÇÃO REVERSA E TRANSPOSIÇÃO
Os primeiros sucessos da biologia molecular foram a descoberta da estrutura da dupla hélice do DNA e a elucidação da linguagem do código genético. A importância destes resultados não reside no simples fato da química, mas na sua importância em permitir que sejam feitas previsões sobre a natureza fundamental dos organismos vivos. A confiança de que fluiu a partir desses triunfos iniciais resultou no desenvolvimento de uma grande teoria universal, o chamado "dogma central da Biologia Molecular”, ou seja, que todas as células (e, portanto, vírus) trabalham em um princípio de organização muito simples: o fluxo unidirecional de informações do DNA, através de RNA, em proteínas. Em meados da década de 1960, no entanto, existiram rumores de que a vida poderia não ser tão simples. Em 1963, Howard Temin mostrou que a replicação de retrovírus, cujas partículas contêm genoma de RNA, foi inibida pela actinomicina D, um antibiótico que se liga apenas ao DNA. A replicação de outros vírus de RNA não é inibida por esta droga. Assim, o prazer da comunidade científica por usar um dogma abrangente provocou que esses fatos foram amplamente ignorados até 1970, quando Temin e David Baltimore publicaram simultaneamente a observação de que partículas retrovirais contêm uma DNA polimerase dependente de RNA: a transcriptase reversa. Esta constatação foi importante o suficiente, mas assim como as conclusões anteriores da biologia molecular, posteriormente teve repercussões para os genomas de todos os organismos, e não apenas umas poucas famílias de vírus. Sabe-se agora que retrotransposons com semelhanças aos genomas de retrovírus constituem uma parte substancial dos genomas de todos os organismos superiores, incluindo os seres humanos. Idéias anteriores de genomas como estruturas estáveis e constantes foram substituídas com a percepção de que elas são, na verdade, entidades dinâmicas e bastante fluidas. O conceito de elementos genéticos transponíveis - sequências específicas que são capazes de mover-se de uma posição a outra no genoma - foi apresentado por Barbara McClintock nos anos 1940. Tais transposons se dividem em dois grupos:
Transposons simples, que não sofrem transcrição reversa e são encontrados em procariotos (por exemplo, o genoma da enterobactéria fago Mu).
Retrotransposons, que se assemelham a genomas de retrovírus e são limitados por longas repetições diretas (repetições terminais longas, ou LTRs); movem-se por meio de um mecanismo de transcrição/ transcrição reversa/integração e são encontrados em eucariontes (Metaviridae e Pseudoviridae).
Ambos mostram um número de propriedades similares:
Acredita-se que sejam responsáveis por uma elevada percentagem de mutações aparentemente espontâneas.
Eles promovem uma ampla gama de rearranjos genéticos no genoma da célula hospedeira, tais como deleções, inversões, duplicações e translocações do DNA celular vizinho.
O mecanismo de inserção gera uma duplicação curta (3-13 pb) da sequência de DNA de ambos os lados do elemento inserido.
As extremidades do elemento transponível são constituídas por repetições invertidas, de 2 a 50 bp.
A transposição é frequentemente acompanhada pela replicação do elemento - necessariamente assim, no caso de retrotransposons, mas isso também ocorre frequentemente com a transposição procariótica.
Transposons controlam suas próprias funções de transposição, codificando proteínas que atuam sobre o elemento em cis (que afetam a atividade das sequências contíguas na mesma molécula de ácido nucléico) ou trans (codificando produtos difusíveis que agem em sítios regulatórios em qualquer trecho de ácido nucleico presente na célula).
Enterobactérias fago Mu infectam E. coli e consistem de uma partícula complexa com cauda, contendo um genoma linear de DNA, dupla fita de aproximadamente 37 kb, com sequências derivadas da célula hospedeira entre 0,5 e 2 kbp anexadas ao final do lado direito do genoma (Figura 3.16). Mu é um bacteriófago temperado cuja replicação pode prosseguir por duas vias: uma envolve a integração do genoma no da célula hospedeira e resulta em lisogenia, e a outra é a replicação lítica, que resulta na morte da célula (ver Capítulo 5). A integração do genoma do fago na bactéria hospedeira ocorre em locais aleatórios no genoma da célula. Genomas de fagos integrados são conhecidos como profagos, e a integração é essencial para o estabelecimento de lisogenia. Em intervalos em células bacterianas lisogênicas para Mu, o profago sofre transposição para um sítio diferente no genoma hospedeiro. O mecanismo levando à transposição é diferente do responsável pela integração inicial do genoma do fago (que é conservativo, pois não envolve replicação) e é um processo complexo que requer inúmeras proteínas codificadas pelo fago e célula hospedeira. A transposição está intimamente ligada à replicação do genoma do fago e resulta na formação de um "co-integrado", isto é, uma cópia duplicada do genoma do fago flanqueando uma sequência alvo na qual a inserção ocorreu. O genoma Mu original permanece no mesmo local onde ele primeiro se integrou e é acompanhado por um segundo genoma integrado em outro sítio. (Nem todos os transposons procarióticos usam esse processo; alguns, como o TN10, não são replicados durante a transposição, mas são retirados do local original de integração e integrados em outros lugares.) Há duas consequências de tal transposição: Primeiro, o genoma do fago é replicado durante este processo (vantajoso para o vírus) e, segundo, as sequências flanqueadas pelos dois genomas de fagos (que formam sequências repetidas) correm o risco de rearranjos secundários, incluindo deleções, inversões, duplicações e translocações (possivelmente, mas não necessariamente prejudiciais para a célula hospedeira). Os vírus Ty de leveduras são representativos de uma classe de sequências encontradas em leveduras e outros eucariotos conhecidas como retrotransposons. Ao contrário de enterobactérias fago Mu, esses elementos não são vírus verdadeiros, mas compartilham semelhanças com retrovírus. Os genomas da maioria das cepas de Saccharomycescerevisiae contém 30-35 cópias dos elementos Ty, que tem cerca de 6 kbp e contém repetições diretas de 245-371 pb em cada extremidade (Figura 3.17). Dentro desta sequência repetida está um promotor que conduz a transcrição de um mRNA terminalmente redundante de 5,6 kb. Este contém dois genes: Tya, que tem homologia ao gene gag dos retrovírus, e TYB, que é homólogo ao gene pol. A proteína codificada por TYA é capaz de formar uma "partícula semelhante a vírus" (VLP) aproximadamente esférica, com 60 nm de diâmetro. O transcrito de RNA de 5.6-kb pode ser incorporado em tais partículas, resultando na formação de estruturas intracelulares conhecidas como Ty-VLP. Ao contrário dos vírus verdadeiros estas partículas não são infecciosas para células de levedura, mas se acidentalmente tomadas por uma célula elas podem realizar a transcrição reversa do seu conteúdo de RNA para formar um elemento Ty de DNA dupla-fita, que pode se integrar no genoma da célula hospedeira (veja abaixo). A diferença mais significativa entre retrotransposons como Ty, copia (um elemento similar encontrado em Drosophila melanogaster), e os próprios retrovírus é a presença de um gene adicional em retrovírus, env, que codifica uma glicoproteína do envelope (Ver Capítulo 2). A proteína do envelope é responsável pela ligação ao receptor e permitiu aos retrovírus escaparem do estilo de vida intracelular de retrotransposons para formar uma partícula de vírus verdadeira e se propagar amplamente pela infecção de outras células (Figura 3.17). Os genomas de retrovirus têm quatro características únicas:
Eles são os únicos vírus que são verdedeiramente diplóides.
Eles são os únicos vírus de RNA cujo genoma é produzido pela maquinaria de transcrição celular (sem a participação de uma polimerase codificada pelo vírus).
Eles são os únicos vírus cujo genoma requer um RNA celular específico (tRNA) para replicação.
Eles são os únicos vírus de RNA sentido(+) cujo genoma não serve diretamente como mRNA imediatamente após a infecção.
Durante o processo de transcrição reversa (Figura 3.18), as duas moléculas de RNA sentido(+) fita simples que compõem o genoma do vírus são convertidas em uma molécula de DNA dupla-fita um pouco mais longa que o molde de RNA, devido à duplicação de seqüências repetidas diretas em cada extremidade - repetições terminais longas (LTRs) (Figura 3.19). Algumas das etapas na transcrição reversa permaneceram como mistérios, por exemplo, os saltos evidentes que a polimerase faz a partir de uma extremidade da fita molde para o outro. Na verdade, essas etapas podem ser explicadas pela observação de que a conversão completa do RNA do retrovírus em DNA dupla-fita só ocorre em uma partícula parcialmente revestida e não pode ser duplicada com precisão in vitro com os reagentes livres em solução. Isto indica que a conformação dos dois RNAs dentro do nucleocapsídeo do retrovírus dita o curso da transcrição reversa – por este motivo as extremidades das fitas são provavelmente mantidas juntas a uma outra no interior do núcleo. A transcrição reversa tem consequências importantes para a genética dos retrovírus. Primeiro, é um processo altamente propenso a erros, porque a transcriptase reversa não desempenha as funções de revisão realizada por DNA polimerases DNA-dependentes celulares. Isso resulta na introdução de muitas mutações no genoma dos retrovírus e, consequentemente, variação genética rápida (ver mutações espontâneas, acima). Além disso, o processo de transcrição reversa promove a recombinação genética. Como dois RNAs são empacotados em cada virion e usados como modelo para a transcrição reversa, a recombinação pode acontecer e acontece entre as duas fitas. Embora o mecanismo responsável por isto não seja claro, se uma das fitas do RNA difere das outras (por exemplo, pela presença de uma mutação) e recombinação ocorre, o vírus resultante será geneticamente diferente de qualquer um dos vírus parentais.
Após a transcrição reversa ser completada, o DNA dupla fita migra para o núcleo, ainda em associação com proteínas do vírus. Os produtos maduros do gene pol são, na verdade, um complexo de polipeptídeos que incluem três diferentes atividades enzimáticas: a transcriptase reversa e RNAse H, que estão envolvidos na transcrição reversa e integrase, que catalisa a integração do DNA do vírus na cromatina da célula hospedeira , após o que é conhecido como o pró-vírus (Figura 3.20). Três formas de DNA fita dupla são encontradas em células infectadas por retrovírus seguindo transcrição reversa: DNA linear e duas formas circulares que contêm uma ou duas LTRs. A partir da estrutura nas extremidades do provírus, se acreditava anteriormente que o círculo de duas LTRs foi a forma utilizada para a integração. Nos últimos anos, os sistemas que têm sido desenvolvidos para estudar a integração de retrovírus de DNA in vitro mostram que é a forma linear que se integra. Esta discrepância pode ser resolvida por um modelo no qual as extremidades das duas LTRs são mantidas em estreita proximidade pelo complexo de integrase-transcriptase reversa. O resultado da integração é que 1 a 2 bp são perdidos a partir do final de cada LTR e 4 a 6 bp de DNA celular são duplicados em ambos os lados do provírus. Não está claro se há alguma especificidade quanto ao local de integração no genoma celular. É óbvio que não há uma sequência alvo simples, mas é possível que possa haver (muitas) regiões ou locais no genoma eucariótico que são mais prováveis para ser sítios de integração que outros. Após integração, o genoma de DNA do pró-vírus torna-se essencialmente uma coleção de genes celulares e está à mercê da célula para expressão. Não há nenhum mecanismo para a excisão precisa de provírus integrados, alguns dos quais são conhecidos por terem sido fossilizados em genomas de primatas através de milhões de anos de evolução, apesar de provírus poderem às vezes ser perdidos ou alterados por modificações no genoma da célula. A única saída para o vírus é a transcrição, formando o que é essencialmente um mRNA de comprimento longo (menos as sequências terminais redundantes das LTRs). Este é RNA é o vRNA, e duas cópias são empacotadas em virions (Figura 3.19). Há, no entanto, duas diferentes estratégias genômicas utilizadas pelos vírus que envolvem a transcrição reversa. É neste ponto que a diferença entre eles se torna óbvia. Uma estratégia, como usada por retrovírus e acima descrita, culmina no empacotamento do RNA em virions como o genoma do vírus. A outra, usada por hepadnavírus e caulimovírus, troca as fases de replicação do RNA e DNA e resulta em genomas de vírus de DNA. Isto é conseguido através da utilização de transcrição reversa, não como um evento precoce na replicação como os retrovírus fazem, mas como uma etapa final durante a formação da partícula do vírus. O vírus da hepatite B (HBV) é o membro protótipo da família Hepadnaviridae. O vírus HBV são partículas contendo lipídeos, esféricas, de 42 a 47 nm de diâmetro, que contêm um genoma de DNA fita dupla parcial (interrompido), mais uma DNA polimerase RNA-dependente (ou seja, a transcriptase reversa) (Figura 3.21). Hepadnavírus têm genomas muito pequenos constituídos por um sentido(- )) fio de 3,0-3,3 kb(varia entre hepadnavírus diferentes) e um sentido (+) fio de 1,7-2,8 kb (varia entre diferentes partículas). Em uma infecção de células, três grandes transcritos do genoma são produzidos: 3.5, 2.4, e mRNAs 2,1 kb. Todos têm a mesma polaridade (isto é, são transcritos a partir da mesma fita do genoma do vírus) e os mesmos fins, mas tem três diferentes cinco pontas (ou seja, sítios de iniciação). Essas transcrições são heterogêneas em tamanho, e não está completamente claro o que proteínas de transcrição são codifica cada um deles, mas há quatro genes conhecidos do vírus:
C codifica a proteína nuclear (cerne).
P codifica a polimerase.
S codifica os três polipeptídeos do antígeno de superfície: pré-S1, pré-S2 e S (que são derivados de sítios de início alternativos).
X codifica um transativador da transcrição

Continue navegando