Buscar

Genes Estruturais de Eucariontes

Prévia do material em texto

Texto de apoio para “Genes Estruturais de Eucariontes” 
Fragmentos de: READ, ANDREW & DONNAI, DIAN. GENÉTICA CLÍNICA. Porto Alegre, ARTMED, 2008. 
 CAPÍTULO 3 – COMO OS GENES FUNCIONAM 
 
 “Como os genes funcionam é o objeto de duas hipóteses famosas. Nenhuma delas é completamente 
verdadeira, mas não obstante, ambas são ferramentas úteis para se ponderar sobre os genes. 
 Na década de 1940. Beadle e Tatum propuseram que a função de cada gene era especificar uma enzima 
particular (hipótese de um gene — uma enzima). Essa hipótese não é totalmente verdadeira, porque muitos genes 
codificam proteínas não enzimáticas, e alguns especificam moléculas de RNA funcional, em vez de proteínas — 
mas, na forma de “um gene — um polipeptídeo”. Ela permanece como uma primeira ferramenta útil para se refletir 
sobre o que os genes fazem. (página 56) 
 Alguns anos mais tarde, Francis Crick definiu a função essencial do DNA, no “Dogma Central” da Biologia 
Molecular (Figura 3.3). Os genes são as unidades funcionais do DNA, e a função usual de um gene é especificar a 
estrutura de uma proteína. Considera-se que existam cerca de 24000 genes codificadores de proteínas no genoma 
humano, embora essa estimativa seja apenas provisória. O Dogma Central é útil, mas não absolutamente 
verdadeiro. De vez em quando, o fluxo da informação do DNA para o RNA é revertido, quando uma enzima especial 
(a transcriptase reversa) faz uma cópia de DNA a partir de urna molécula de RNA. Essa é uma parte crítica do ciclo 
vital dos vírus de RNA. mas não faz parte do metabolismo comum de uma célula humana. Mais notavelmente, o 
RNA tem muitas funções, além de especificar a seqüência dos aminoácidos das proteínas. O RNA ribossômico 
(rRNA) e o RNA transportador (tRNA) são os exemplos mais bem conhecidos desses RNAS funcionais, mas 
existem muitos outros.”(página 56) 
 
A estrutura dos genes: éxons e íntrons 
A maioria dos genes dos seres humanos e de outros organismos superiores está organizada de modo estranho e 
inesperado. A seqüência de DNA que especificará, em última análise, a seqüência de aminoácidos de uma proteína 
é dividida em segmentos (éxons) interrompidos por seqüências não-codificadoras (íntrons ou seqüências 
intercalares). O número e o tamanho dos íntrons variam sem qualquer evidência lógica. O gene humano médio tem 
nove éxons, cada um com 145 pb em média, e íntrons com 3.365 pb cada um, em média, mas essa variação é 
muito ampla”. (página 58) 
 
Encadeamento do transcrito primário 
 “Quando uma célula precisa produzir uma proteína específica inicialmente faz uma cópia de RNA de uma 
das fitas do DNA, apenas do gene relevante (Figura 3.5a). A transcrição é um processo muito dinâmico, que envolve 
somente pequenos segmentos dispersos do genoma, a qualquer momento, mas varia de acordo com as 
necessidades da célula. O seu modo de funcionamento é descrito, com algum detalhe, na Seção 3.4. A seqüência 
inteira de éxons e íntrons é transcrita para formar o transcrito primário. No interior do núcleo celular, esse transcrito 
é, a seguir, processado por meio de remoção física dos íntrons e encadeamento dos éxons (Figuro 3.5b). O RNA 
composto pelos introns é destruído e aparentemente não tem utilidade alguma. O encadeamento é realizado no 
interior do núcleo celular por uma grande máquina multimolecular, denominada encadeossomo, que é um complexo 
de proteínas e pequenas moléculas de RNA. Podemos ignorar seguramente a maioria dos detalhes moleculares 
complicados, mas precisamos considerar como os íntrons são reconhecidos. 
 Quase todos os íntrons humanos iniciam com CU (GT no DNA da fita-sentido — sendo denominado sítio 
doador da emenda) e terminam com AG o sítio aceitador da emenda). Esses sinais, em si, não devem ser 
suficientes para definir os sítios de encadeamento, pois há inúmeros dinucleotídeos CU e AC nos éxons ou nos 
íntrons que não são usados como sítios de encadeamento. Para serem assim reconhecidos, os dinucleotídeos CU 
ou AC devem estar integrados a uma seqüência de consenso mais ampla. Um sítio de encadeamento funcional 
apresenta uma combinação adequada de pequenos motivos de seqüência que se ligam a proteínas ou pequenas 
moléculas de RNA, no encadeossomo. Esses motivos individuais são definidos apenas vagamente, dificultando a 
predição dos sítios de encadeamento pela análise das seqüências de DNA ou RNA. Isso é frustrante para os 
geneticistas clínicos, uma vez que, como veremos posteriormente, as variantes de seqüências que afetam a 
eficiência dos sítios de encadeamento são importantes causas de doenças.” (páginas 60-61) 
 
Os genes são muito maiores do que se pensa 
Um gene, definido como uma unidade funcional de DNA, é muito maior do que apenas sua seqüência codificadora 
de proteína. 
 Os éxons de um gene incluem as seqüências não-traduzidas 5’e 3’, que são importantes para a 
estabilidade do mRNA Essas seqüências perfazem, em média, 200 e 800 nucleotídeos, respectivamente, nos genes 
humanos. 
 O transcrito primário origina-se de seqüências de DNA intrônicas e exônicas. As primeiras são, muitas 
vezes. consideravelmente maiores do que os éxons. 
Generated by Foxit PDF Creator © Foxit Software
http://www.foxitsoftware.com For evaluation only.
 As seqüências a montante do sítio de início da transcrição (o promotor) são necessárias para que o gene 
se expresse. Veja adiante uma descrição do que os promotores fazem. As seqüências do promotor são adjacentes 
ao sítio de início da transcrição, em geral dentro de aproximadamente uma centena de pares de bases, embora 
outras seqüências mais distantes afetem, muitas vezes, a atividade de um promotor. 
 A expressão de alguns genes ou grupamentos gênicos é controlada por elementos de seqüências curtas, 
distantes a dezenas ou, mesmo, centenas de quilobases. A existência desses elementos controladores distantes é 
outra razão para que os genes ocupem segmentos de DNA muito mais longos do que sua seqüência codificadora. 
Atualmente, não temos meios de identificar sistematicamente essas regiões controladoras de lócus, que são 
descobertas por acaso, quando uma pequena deleção ou um ponto de quebra cromossômica, um pouco distante do 
gene, suprime a expressão desse gene, ainda que sua seqüência codificadora esteja intacta. E curioso que os 
genes essenciais ao controle do desenvolvimento inicial se localizem, freqüentemente, em “desertos gênicos”, 
regiões de tamanho correspondente a megabases que não contêm outros genes. E provável que tais regiões 
contenham elementos de controle de longa amplitude. O DNA intercalar possivelmente faz uma alça externa, de 
maneira que esses elementos se localizem realmente em proximidade física do gene que eles controlam, e as 
proteínas a esses ligadas possam interagir diretamente com as proteínas ligadas ao promotor do gene. (página 69) 
 
Um gene freqüentemente codifica mais de uma proteína 
 Contrariando a hipótese de um gene — uma enzima, com muita freqüência um único gene pode codificar 
várias proteínas diferentes (Figura 3.11). O principal mecanismo para isso é o encadeamento alternativo. Muitas 
vezes, há mais de um meio de encadear o transcrito primário. Certos éxons podem ser, variavelmente, incorporados 
ou omitidos no mRNA maduro, originando isoformas alternativas. Às vezes, há dois sítios de encadeamento 
alternativo assinalando o início ou o término de um éxon. Um gene também pode ter diversos promotores e 
primeiros éxons alternativos (o gene da distrofina tem oito). Todas essas variáveis significam que um gene pode 
codificar mais de uma proteína. O número médio de transcritos por lócus, em genes examinados pelo projeto 
ENCODE (veja Capítulo 6), é 5.4. Provavelmente um pouco dessa variabilidade constitui apenas ruído no sistema, 
no qual a célula se sai mal no reconhecimento do único sinal correto — mas em muitos casos essa variabilidade é 
funcional, com ambos os produtos possuindo diferentes funções. As mutações que afetam o equilíbrio das isoformas 
alternativas podem ser clinicamente significativas,mas difíceis de serem detectadas na seqüência de DNA. 
 
 
Figura 3.11 Como um gene pode codificar mais de uma proteína. (a) Os éxons podem ser, variavelmente, incorporados ou omitidos no 
mRNA maduro. (b) Um éxon pode ter dois sítios de encadeamento alternativo. (c) Um gene pode ter dois ou mais promotores e primeiros éxons 
alternativos (esse exemplo mostra o gene GNAS1,que codifica três proteínas com denominações diferentes). Qualquer um desses mecanismos 
pode resultar no uso de uma fase de leitura alternativa para as partes do gene que se encontram a jusante (descendentes). Cerca de 50% de 
todos os genes humanos usam um ou mais desses mecanismos para codificarem mais de uma proteína.(página 72) 
Generated by Foxit PDF Creator © Foxit Software
http://www.foxitsoftware.com For evaluation only.

Outros materiais