Baixe o app para aproveitar ainda mais
Prévia do material em texto
3ª edição Genética Humana Maria Regina Borges-Osório Wanyce Miriam Robinson Catalogação na publicação: Ana Paula M. Magnus – CRB 10/2052 B732g Borges-Osório, Maria Regina. Genética humana [recurso eletrônico] / Maria Regina Borges-Osório, Wanyce Miriam Robinson. – 3. ed. – Dados eletrônicos. – Porto Alegre : Artmed, 2013. Editado também como livro impresso em 2013. ISBN 978-85-65852-90-6 1. Genética humana. I. Robinson, Wanyce Miriam. II. Tí- tulo. CDU 608.1:575:612.6.05 9 A s B a se s M o le cu la re s d a H e re d ita rie d a d e Na década de 1970, pesquisadores descobriram um tipo de microrganismo até então desconhecido, ao qual denominaram Archaea pelo fato de pensarem que tal- vez pudesse ser o mais antigo tipo de célula existente, combinando características dos procariotos e eucario- tos, mas exibindo também características próprias. Os Archaea, inicialmente denominados Archaebactérias, são considerados uma subdivisão dos procariotos, mas colocados em um grupo separado das demais bactérias por conta de suas características distintivas: os compo- nentes de suas membranas e paredes celulares e as dife- renças em bases raras encontradas em seus RNAs trans- portadores e em estruturas diferentes nas subunidades da RNA-polimerase. Devido às diferenças moleculares que esses microrganismos apresentam em relação às demais bactérias, alguns cientistas tendem a chamá-los preferencialmente de Archaea, colocando-os em um subgrupo à parte dos procariotos. 1.2 O genoma, o DNA e os genes O genoma contém o conjunto completo de informações hereditárias de qualquer organismo, consistindo em uma longa sequência de um ácido nucleico, denominado ácido desoxirribonucleico, ou DNA, composto de nucleotídeos formados por bases nitrogenadas, açúcar e fosfato. O grande desenvolvimento dos estudos dos genomas de vá- rios organismos levou à criação de um termo específico: a genômica, que será tratada no Capítulo 18. O DNA constitui a sequência de subunidades indi- viduais, denominadas genes pelo biólogo dinamarquês Wilhelm Johannsen, em 1909. A função dos genes é ar- mazenar e codificar as informações genéticas que serão utilizadas para a produção das cadeias polipeptídicas das proteínas que compõem as células, tecidos e órgãos dos organismos. Os primeiros indícios de que o DNA é o material he- reditário surgiram de experiências realizadas com bacté- rias, sendo essas indicações estendidas posteriormente aos organismos mais complexos. Os genes são sequências de DNA que contêm a in- formação para codificar as cadeias polipeptídicas de uma proteína, sendo os responsáveis pela transmissão here- ditária das características de uma geração para outra. Tais sequências nem sempre são contínuas, podendo ser interrompidas por segmentos de DNA não relacionados com a codificação de uma cadeia polipeptídica específica. Os genes estão organizados em um número relativa- mente pequeno de cromossomos. O material genético de cada cromossomo consiste em uma fita muito longa de DNA, contendo muitos genes em uma ordem linear, em- bora nem sempre contínua. O conceito de gene modificou-se ao longo do tem- po; atualmente, o gene é definido como o segmento de DNA que codifica uma cadeia polipeptídica e inclui regiões flanqueadoras que antecedem (sequência-líder) e que seguem (cauda) a região codificadora, bem como sequências que não são traduzidas (íntrons) e que se intercalam com as sequências codificadoras individuais (éxons). 1.3 Ácidos nucleicos 1.3.1 Estrutura química A estrutura química dos ácidos nucleicos é simples e não varia entre os diversos organismos. Esses ácidos nucleicos são constituídos de sequên- cias de nucleotídeos. Cada nucleotídeo é formado por: uma base nitrogenada, que pode ser uma purina (adenina ou guanina) ou uma pirimidina (timina ou citosina, no DNA; uracil ou citosina, no RNA); um açúcar (pentose: desoxirribose, no DNA; ribose, no RNA); um grupo fosfato (PO4). Tabela 1.1 Caracterização de procariotos e eucariotos Características Procariotos Eucariotos Núcleo Não Sim Membrana nuclear Não Sim “Corpo nucleoide” Sim Não Material genético DNA, RNA DNA Cromossomos visíveis na divisão celular Não Sim Ribossomos Sim Sim Outras organelas Não Sim Parede celular rígida Sim Não Exemplos Bactérias, cianobactérias Fungos, protozoários, algas superiores, vegetais e animais superiores caraujo Retângulo caraujo Retângulo G e n é ti ca H u m a n a 10 O conjunto de base + açúcar denomina-se nucleo- sídeo, chamando-se nucleotídeo ao conjunto de base + açúcar + fosfato. De acordo com a pentose que apresentam, os ácidos nucleicos são de dois tipos: DNA (ácido desoxirribonu- cleico), que contém desoxirribose, e RNA (ácido ri- bonucleico), que contém ribose. Neste último não há timina, e sim uracil. O grupo fosfato apresenta-se inva- riável, tanto no DNA quanto no RNA. O DNA encontra-se principalmente nos cromossomos; o RNA é encontrado no nucléolo (estrutura nuclear) e no citoplasma, havendo muito pouco nos cromossomos. Na Figura 1.1 estão representadas as estruturas quí- micas dos componentes dos nucleotídeos (bases nitrogena- das, açúcares e grupo fosfato); a Figura 1.2 apresenta as estruturas química e molecular de uma sequência de DNA. PURINAS guanina adenina timina PIRIMIDINAS NUCLEOTÍDEO BASE FOSFATO AÇÚCAR MONOFOSFATO DIFOSFATO TRIFOSFATO RIBOSEDESOXIRRIBOSE A B C D uracil citosina O NH N C C C C HC N H NH2N H N N N N CHC C C HC NH2 NH2 O O H C3 C C CHC NH N H NHHC HC C C O ON H N H O HC HC C C N O OO O P R OO O O O O OP P R O O O O O O O O O OP P P R O OO O P CH2 O ON N NH2 OH H HH HH OH OHOH H HH O OHCH OH2 CH OH2 O OH Figura 1.1 Representação esquemá- tica das estruturas quí- micas dos componentes dos nucleotídeos, bem como de um nucleotídeo, mostrando as ligações entre esses componen- tes. A – Bases nitroge- nadas (purinas: adenina e guanina; pirimidinas: timina, citosina e uracil). B – Grupo fosfato (mo- nofosfato, difosfato e trifosfato). C – Açúcares (desoxirribose e ribose). D – Nucleotídeo. Fonte: Azevedo e Astolfi Filho.1 11 A s B a se s M o le cu la re s d a H e re d ita rie d a d e A O O OO O O P T N N CH 3 H O OO OO P O CH2 H H H H H N NN O H N N O H H H N C O N H N N N H H C2 O O O O P CH2 H N N H N G O H C2 O O P OO OO O O O O O O O O O H C2 P H CH 3 O O NNH H H H H H H H T A H H N N H N A NH N OO O O P CH2 O O O O OO O H N N N N N N N N CH2 P OH G P H C2 C 3’5’ 3’ 5’ B HO C H C 4’ H O5’ H OH 3’ C OH H C 2’ H C 1’H H Figura 1.2 Representação esquemática das estruturas química e molecular do DNA e de seus nucleotídeos. A – Seg- mento de uma fita dupla de DNA, mostrando alguns pares de nucleotídeos adjacentes e considerando a lo- calização dos carbonos 5' e 3' no açúcar (desoxirribose); pode ser notada a orientação oposta das fitas, por isso denominadas antiparalelas. A fita da esquerda corre da direção 5' (acima) para a direção 3' (abaixo), a fita da direita corre em direção oposta: de 5' (abaixo) para 3' (acima). Pode-se observar também a estrutura química dos componentes da molécula de DNA, bem como o pareamento entre as bases nitrogenadas ade- nina (A) e timina (T), ligadas por duas pontes de hidrogênio, e entre as bases nitrogenadas guanina (G) e citosina (C), ligadas por três pontes de hidrogênio. B – Numeração dos carbonos do açúcar (desoxirribose) na estrutura açúcar-fosfato da molécula de DNA. Fonte: Lewis.2 G e n é ti ca H u m a n a 12 1.3.2 Estrutura molecular Além das diferenças em sua composição química, o DNA e o RNA mostram diversidade quanto à sua estrutura mo- lecular. É necessário que o DNA tenha uma estrutura sufi- cientemente versátil para explicar a grande variedade de genes e, ao mesmo tempo, ser capaz de reproduzir-sede tal maneira que se forme uma cópia idêntica em cada cé- lula com capacidade de se dividir. Em 1953, J. D. Watson e F. C. Crick, com base em estudos de difração aos raios X, propuseram um modelo para a estrutura molecular do DNA que atendia a esses requisitos: (a) a molécula de DNA é uma longa fita ou fita de nucleotídeos, formando uma configuração semelhante à de uma escada de corda, enrolada de forma helicoidal; (b) nessa escada, o açúcar e o fosfato são os componen- tes verticais (corrimãos) e as bases nitrogenadas são os degraus: para que estes se formem, as ligações entre as bases são feitas por pontes de hidrogênio, sendo duplas entre as bases adenina e timina, e triplas entre guanina e citosina; (c) tal modelo também requer que as duas fitas polinucleotídicas sejam antiparalelas, isto é, corram em direções opostas: uma na direção 5'→3' e a outra na di- reção 3'→5'. Na Figura 1.3 está representado o modelo original da molécula de DNA. Por seu trabalho, Watson e Crick receberam o Prêmio Nobel de Medicina e Fisiolo- gia, em 1962. Desse modo, o DNA é formado por duas fitas po- linucleotídicas que se dispõem em espiral em torno de um mesmo eixo imaginário, mas com polaridades opos- tas. Cada fita de DNA tem sua polaridade determina- da pela orientação dos componentes açúcar e fosfato. Quando uma fita termina no átomo de carbono 5' da molécula de desoxirribose, que constitui sua extremi- dade 5', a fita oposta termina no carbono 3' do açúcar, denominando-se extremidade 3 . Assim, a extremidade 5' de uma fita tem orientação oposta à extremidade 3' da outra, daí a denominação de fitas antiparalelas. A es- tabilização da dupla-hélice é dada pela interação entre as bases complementares oponentes e as bases que vão se superpondo. O espaço ocupado por duas bases opos- tas é pequeno, o que obriga a associação, por meio de pontes de hidrogênio, entre uma base grande (púrica) e outra pequena (pirimídica); duas bases grandes não caberiam nesse espaço e duas pequenas não se aproxi- mariam o suficiente para interagir. Essas associações complementares ocorrem entre adenina e timina e entre guanina e citosina, por serem combinações mais estáveis. Assim, as quantidades de bases púricas e pirimídicas são iguais, de tal forma que A+G � C+T. Verifica-se, igualmente, que as quantidades de adeni- na e timina são equivalentes e o mesmo ocorre com a guanina e a citosina, tendo-se, assim: A�T e G�C. Considerando-se uma fita hipotética, com a seguinte composição: 5'-ATGCGTCAG-3', sua fita complemen- tar deverá ser 3'-TACGCAGTC-5', com a estrutura em dupla-hélice completa sendo assim representada: 5'-ATGCGTCAG-3' 3'-TACGCAGTC-5' A relação G+C/A+T é igual em todos os indivíduos da mesma espécie, mas varia de uma espécie para outra. A estrutura molecular do DNA apresenta uma série de vantagens: (a) possibilita o armazenamento e a codi- ficação de imensa quantidade de informação, tendo em vista as bases nela contidas; assim, para uma molécula com N bases, há 4N sequências possíveis; (b) sugere um mecanismo para sua replicação, já que cada fita contém a informação completa da molécula de DNA, podendo servir como molde para a síntese de uma nova fita com- plementar; (c) fornece um mecanismo de defesa contra a perda de informação genética causada por um dano ao DNA (p. ex., se uma base de uma das fitas for danificada ou perdida, poderá ser substituída, já que sua fita com- plementar orienta essa substituição); (d) permite que as fitas de DNA, com a sua complementaridade, se identifi- quem e se juntem em uma mistura complexa de molécu- las, configurando o que se denomina hibridização, pro- cesso utilizado em algumas situações pelos mecanismos nucleares de regulação da expressão gênica. A forma original da dupla-hélice do DNA, proposta no modelo de Watson e Crick, é denominada B-DNA, mas ainda existem outras formas. A conformação que o DNA adota depende de vários fatores: nível de hidrata- ção, sequência de DNA, direção e grau do superenrola- mento, modificações químicas das bases, tipo e concen- tração de íons metálicos e presença de poliaminas em solução. Em condições fisiológicas, a maior parte do DNA de procariotos e eucariotos aparece com a forma desse modelo: uma hélice com giro para a direita (dextrógira) e entre 10 e 10,5 bases por giro, formando dois sulcos, um grande e profundo (sulco maior), outro pequeno, estreito ou raso (sulco menor). Essa estrutura pode transformar- -se no A-DNA, forma rara já conhecida quando surgiu o modelo de Watson e Crick, também dextrógira, que existe somente em condições salinas altas ou de desidratação, contendo 11 pares de bases por giro e diferindo do B-DNA por uma rotação de 20º em relação ao eixo perpendicular da hélice, o que causa mudança na aparência dos sulcos maior e menor. Existe ainda o Z-DNA, que apresenta instabilidade termodinâmica e contém 12 pares de ba- ses por giro. Sua orientação para a esquerda (levógira) resulta em maior distância entre seus pares de bases do que no B-DNA e em uma molécula de DNA em forma de zigue-zague, daí sua denominação. Um giro de 180º pode converter o B-DNA em Z-DNA com função biológica, mas ainda não se sabe exatamente se o Z-DNA ocorre in vivo. Segmentos de B-DNA cujas bases foram modificadas qui- micamente por metilação podem sofrer grande mudança em sua conformação e adotar a forma Z. Essas estruturas raras podem ser reconhecidas por proteínas específicas de ligação ao Z-DNA e podem estar envolvidas na regula- ção da transcrição. A Figura 1.4 mostra essas três formas da dupla-hé- lice do DNA. Foram descobertas outras formas de DNA 13 A s B a se s M o le cu la re s d a H e re d ita rie d a d e Legenda: hidrogênio oxigênio fosfato açúcar açúcar açúcar açúcar açúcar açúcar açúcar açúcar fosfato fosfato fosfato fosfato fosfato fosfato fosfato fosfato C D A B sulco maior sulco menor sulco maior sulco menor carbono na cadeia de açúcar+fosfato carbono e nitrogênio nas bases Figura 1.3 Modelo de Watson e Crick para a estrutura da molécula do DNA, em diferentes modos de representação. A – A dupla-hélice está desenrolada para mostrar os pares de bases (internamente, em laranja) e o esqueleto de açúcar-fosfato (externamente, em preto). Sua largura mantém-se constante porque as purinas pareiam sempre com as pirimidinas: A com T, unidas por duas pontes de hidrogênio, G com C, unidas por três pon- tes de hidrogênio. B – A dupla-hélice assemelha-se a uma escada, na qual os degraus são os pares de bases, situados perpendicularmente aos corrimãos formados pela estrutura de açúcar e fosfato. As setas indicam a orientação oposta das fitas. O enrolamento helicoidal das duas fitas faz surgir um sulco menor (~12Å de diâmetro) e um sulco maior (~22Å de diâmetro), assinalados na figura. C – Esta representação mostra as relações entre os átomos da molécula de DNA. D – O esquema de um segmento desenrolado da dupla-hélice mostra a relação entre as bases complementares, que representam o conteúdo informativo variável do DNA, e o esqueleto de açúcar-fosfato, que é idêntico em todo o DNA. Fonte: Lewis.3 G e n é ti ca H u m a n a 14 de hélices dextrógiras, quando investigadas em condições laboratoriais variadas. Essas formas são denominadas C-DNA, D-DNA, E-DNA e P-DNA. O C-DNA é encon- trado em condições de maior desidratação do que as ob- servadas durante o isolamento do A-DNA e do B-DNA. Apresenta somente 9,3 pares de bases por giro, por isso é menos compacto. Do mesmo modo que no A-DNA, os pa- res de bases do C-DNA não são planos, inclinando-se em relação ao eixo da hélice. O D-DNA e o E-DNA ocorrem em hélices que não contêm guanina em sua composição de bases e apresentam 8 e 7 pares de bases por giro, res- pectivamente. O P-DNA (denominação em homenagem a Linus Pauling) é mais longo e mais estreito do que a forma B, e seus grupos fosfato e bases nitrogenadas têm localização inversa à encontrada no B-DNA, pois os pri-meiros se encontram no interior da molécula e as últimas, na sua superfície externa. Há aproximadamente 2,6 bases por giro, em contraste ao maior número de bases por giro encontrado no B-DNA. O interesse em formas alternativas de DNA, tal como a forma Z e outras formas raras, decorre da possibilidade de que o DNA possa assumir uma estrutura diferente da existente na forma B para facilitar algumas de suas fun- ções genéticas. Como já foi mencionado, o RNA difere do DNA em sua composição química quanto a dois aspectos: o RNA possui ribose, no lugar da desoxirribose, e uracil, em vez de timina. Quanto à estrutura molecular, o RNA apresenta ape- nas uma fita de nucleotídeos, cuja composição de bases não está restrita às igualdades G�C e A�U. Em circuns- tâncias especiais, uma molécula de RNA pode formar uma fita dupla com outra parte de sua própria estrutura, como ocorre no RNA transportador, que será abordado mais adiante neste capítulo. Além disso, o DNA contém a informação que codifica uma cadeia polipeptídica, en- quanto o RNA utiliza essa informação. B-DNA A-DNA Z-DNA B-DNA A-DNA Figura 1.4 Principais formas do DNA. A – Modelos tridimensio- nais computadorizados de B-DNA, A-DNA e Z-DNA. B – Representação es- quemática de B-DNA e de A-DNA, exemplificando a orientação dos seus pares de bases: no B-DNA, são perpendiculares à hélice, enquanto no A-DNA são inclinados e afastados da hélice. 15 A s B a se s M o le cu la re s d a H e re d ita rie d a d e 1.4 O código genético O código para a produção dos diferentes tipos de proteí- nas que o organismo deve formar ao longo de sua vida está contido no zigoto de cada indivíduo. Todas as células de um determinado organismo, em um dado momento de sua vida, contêm o mesmo código ou informação genética do zigoto que as origi- nou, porém nem todos os genes estão funcionando em todas as células ao mesmo tempo e com a mesma inten- sidade. Isso varia com o tipo de célula e com a idade do indivíduo. O código genético descreve a relação entre a sequên- cia de bases nitrogenadas do DNA e a sequência de ami- noácidos na cadeia polipeptídica correspondente. Foi elucidado em 1966, graças à descoberta de que o RNA mensageiro transmite a informação entre genes e pro- teínas. A palavra-chave do código para um aminoácido consiste em uma sequência de três bases nitrogenadas adjacentes, que formam a unidade de informação genética ou códon. O código genético apresenta as se- guintes características: a. Sua leitura é feita em trincas de bases ou de nu- cleotídeos. b. É degenerado ou redundante. A sequência de nucleotídeos deve conter o número suficiente de unidades codificadoras para representar 20 ami- noácidos. Como o DNA possui apenas quatro bases distintas, são necessárias diversas combinações dessas bases para codificar os diferentes tipos de aminoácidos. Se a combinação das bases fosse 2 a 2 (42), haveria 16 arranjos; como são 20 os aminoá- cidos, essa combinação é, portanto, inadequada. Agrupando-se as bases 3 a 3 (43), resultam 64 ar- ranjos, número maior do que o necessário. Desde que há 64 combinações possíveis e apenas 20 ami- noácidos diferentes, deduz-se que somente algu- mas das trincas especificam aminoácidos ou que al- guns deles devem ser especificados por mais de um tipo de trinca ou por mais de um códon. Por exem- plo, o aminoácido fenilalanina pode ser codificado por dois códons diferentes: UUU e UUC. Os códons que representam os mesmos aminoácidos são de- nominados códons sinônimos, relacionando-se, em geral, por uma alteração de sua terceira base; a de- generação da terceira base minimiza os efeitos de possíveis mutações. c. É considerado não ambíguo, isto é, uma trinca só pode codificar um aminoácido. As trincas acima re- feridas só codificam a fenilalanina, e nenhum outro aminoácido. d. É um código sem superposição, ou seja, uma dada base pertence a uma só trinca ou códon. Ex- ceções: bacteriófago � X174 e outros vírus, em que há pontos de iniciação múltiplos, criando genes su- perpostos. e. É, também, contínuo, não existindo espaçamento entre os códons. f. É semiuniversal, ou seja, os mesmos aminoácidos são codificados pelos mesmos códons em quase to- dos os organismos, permitindo que um RNA mensa- geiro seja traduzido em uma célula de outra espécie, o que possibilitou a técnica do DNA recombinante (ver Cap. 17). Aparentemente, uma vez evoluído, o código genético vem mantendo-se quase intacto ao longo da história evolutiva da vida na Terra. No entanto, existem algumas exceções (certos genes da mitocôndria humana e de levedura, da bactéria Mycoplasma capricolum e dos protozoários ciliados Paramecium, Tetrahymena e Stylonychia), como mostra a Tabela 1.2. Em genomas mitocondriais, essas alterações são mais comuns; em genomas nu- cleares, são esporádicas e afetam geralmente os có- dons de finalização ou terminação. Tabela 1.2 Algumas exceções ao código genético universal Códon No código normal No código alterado Fonte UGA finalização trp Mitocôndria humana e de levedura Mycoplasma (bactéria) cys Euplotes (protozoário ciliado) sel Procariotos e eucariotos UAA finalização gln Paramecium, Tetrahymena, Stylonychia (protozoários ciliados) UAG finalização gln Tetrahymena pyr Archaea; bactéria AUA ile met Mitocôndria humana AGA arg finalização Mitocôndria humana AGG arg finalização Mitocôndria humana CUA leu thr Mitocôndria de levedura CUG leu ser Candida (levedura) Fonte: Klug e colaboradores4 e Lewin.5 G e n é ti ca H u m a n a 16 g. Há códons de iniciação e de finalização ou ter- minação. O início da síntese de um polipeptídeo, em procariotos, é assinalado pela presença de um códon iniciador específico, que é AUG no RNA men- sageiro, correspondendo ao aminoácido metionina. Há, também, códons finalizadores ou terminado- res, que indicam o término da síntese polipeptídica, como UAA, UAG e UGA, e em geral não correspon- dem a aminoácidos em eucariotos. A Figura 1.5 mostra o código genético completo, que geralmente é representado pelas bases contidas no RNA mensageiro, com uracil (U) em lugar de timina (T). Os aminoácidos selenocisteína (sel) e pirroli- sina (pyr), codificados respectivamente pelas trincas UGA e UAG, que correspondem a códons finalizadores na maioria dos organismos, são considerados os 21º e 22º aminoácidos, embora o primeiro ocorra em proca- riotos e eucariotos e o último apenas em bactérias e em Archaea. Esses casos são interpretados como um meio de facilitar a decodificação de sequências situadas depois do códon finalizador. 1.5 DNA: nuclear e mitocondrial O conteúdo de DNA das células humanas constitui o que se denomina de genoma humano. Esse genoma subdivi- de-se em duas partes: o genoma nuclear, que correspon- de à maior parte da informação genética total, e o geno- ma mitocondrial, que corresponde à informação genética restante (ver seção 1.5.2). 1.5.1 DNA nuclear O genoma humano nuclear apresenta em torno de 33% do conteúdo de DNA na forma de genes estruturais e se- quências a eles relacionadas, enquanto sua maior parte (67%) é encontrada como DNA extragênico, isto é, o con- Código genético no mRNA para todos os aminoácidos Código alfabético abreviado Início AUG Fim UAA UAG UGA A (Ala) GCU GCC GCG GCA R (Arg) CGU CGC CGG CAA AGG AGA D (Asp) GAU GAC N (Asn) AAU AACC (Cys) UGU UGC E (Glu) GAG GAA Q (Gln) CAG CAA G (Gly) GGU GGC GGG GGA H (His) CAU CAC I (Ile) AUU AUC AUA L (Leu) CUU CUC CUG CUA UUG UUA K (Lis) AAG AAA M (Met) AUG F (Phe) UUU UUC P (Pro) CCU CCC CCG CCA S (Ser) UCU UCC UCG UCA AGU AGC T (Thr) ACU ACC ACG ACA W (Trp) UGG Y (Tyr) UAU UAC V (Val) GUU GUC GUG GUA B (Asx) Asn ou Asp Z (Glx) Gln ou Glu Primeira Base nucleotídica Uracil (U) Citosina (C) Adenina (A) Guanina (G) Terceira Uracil (U) F Fenilalanina (Phe) F Fenilalanina (Phe) L Leucina (Leu) L Leucina (Leu) S Serina (Ser) S Serina (Ser) S Serina (Ser) S Serina (Ser) Y Tirosina (Tyr outyr) Y Tirosina (Tyr ou tyr) Códon finalizador Códon finalizador C Cisteína (Cys ou cys) C Cisteína (Cys ou cys) Códon finalizador W Triptofano (Trp) U C A G Citosina (C) L Leucina (Leu) L Leucina (Leu) L Leucina (Leu) L Leucina (Leu) P Prolina (Pro) P Prolina (Pro) P Prolina (Pro) P Prolina (Pro) H Histidina (His) H Histidina (His) Q Glutamina (Gln) Q Glutamina (Gln) R Arginina (Arg) R Arginina (Arg) R Arginina (Arg) R Arginina (Arg) U C A G Adenina (A) I Isoleucina (Ile) I Isoleucina (Ile) I Isoleucina (Ile) Início (Metionina) T Treonina (Thr) T Treonina (Thr) T Treonina (Thr) T Treonina (Thr) N Asparagina (Asn) N Asparagina (Asn) K Lisina (Lys ou lys) K Lisina (Lys ou lys) S Serina (Ser) S Serina (Ser) R Arginina (Arg) R Arginina (Arg) U C A G Guanina (G) V Valina (Val) V Valina (Val) V Valina (Val) V Valina (Val) A Alanina (Ala) A Alanina (Ala) A Alanina (Ala) A Alanina (Ala) D Ácido aspártico (Asp) D Ácido aspártico (Asp) E Ácido glutâmico (Glu) E Ácido glutâmico (Glu) G Glicina (Gly) G Glicina (Gly) G Glicina (Gly) G Glicina (Gly) U C A G Segunda Figura 1.5 O código genético. Além do código genético tradicional, representado pelas três primeiras letras de cada aminoácido, também é usado o có- digo alfabético abreviado, em que os aminoácidos são representados ape- nas por uma letra do alfabeto. Fonte: Passarge.6 17 A s B a se s M o le cu la re s d a H e re d ita rie d a d e teúdo de DNA que não faz parte dos genes nem das se- quências a eles relacionadas. A quantidade do DNA de uma célula diploide hu- mana é de aproximadamente 6.000 Mb (megabases). Se esse DNA consistisse apenas em genes estruturais, isto é, genes que codificam cadeias polipeptídicas, existiria cer- ca de 6 a 7 milhões de genes no genoma humano, número demasiadamente alto, uma vez que a análise de genomas eucarióticos tem revelado que a relação entre o tamanho do genoma e o número de genes não é linear. Segundo Lewin,5 estima-se que existam entre 20 e 25 mil genes estruturais, codificados por sequências de DNA não repe- titivo, sendo o restante do genoma constituído de outros tipos de DNA. De acordo com Passarge,6 essa estimativa é de aproximadamente 22 mil genes, portanto dentro do intervalo citado. A maior parte do DNA do genoma de organismos su- periores consiste em sequências de DNA repetitivo, sem função codificadora. Os genomas maiores, em um mesmo filo, não contêm mais genes, mas maiores quantidades de DNA repetitivo. 1.5.1.1 Tipos de sequências A Figura 1.6 apresenta os principais tipos de sequên- cias de DNA e alguns tipos de sequências repetitivas do genoma humano nuclear. O DNA nuclear dos eucariotos apresenta os seguintes tipos de sequências: DNA não repetitivo, que consiste em sequências individuais pre- sentes em apenas uma cópia no genoma haploide; e DNA repetitivo, que abrange sequências presentes em mais de uma cópia por genoma. DNA não repetitivo – Esse tipo de DNA consiste em sequências individuais presentes em apenas uma cópia por genoma, contendo os genes estruturais (55 Mb) e sequências relacionadas (945 Mb). A distribuição desses genes varia muito entre os diferentes cromos- Genes e sequências relacionadas 1.000 Mb 55 Mb ~22.000 genes Sequências relacionadas ao gene 945 Mb Íntrons UTRs ~20.000 pseudogenes DNA extragênico 2.000 Mb Repetições dispersas 1.400 Mb Microssatélites 90 Mb Outras regiões 600 Mb Outras 510 Mb A P ORF 1 ORF 2 LINE-1 LINE-2 LINE-3 ~600.000 cópias ~370.000 cópias ~44.000 cópias 6–8 kb 100–300 pb Família Alu MIR MIR3 ~1.200.000 cópias ~450.000 cópias ~85.000 cópias LTR gag pol (env) LTR 6–11 kb P Sequências retrovirais humanas endógenas (HERV) (várias classes; autônomas e não autônomas) ~240.000 cópias Transposase 2–3 kb Várias classes (autônomas e não autônomas) ~300.000 cópias Genoma humano 3.000 Mb LINE 640 Mb SINE 420 Mb LTR 250 Mb Transposons 90 Mb Elementos nucleares intercalares longos (LINEs) (autônomos) Elementos nucleares intercalares curtos (SINEs) (não autônomos) 3 - 2 - 1 - Elementos similares ao retrovírus (transposons LTR) 4 - Transposons de DNA B (A)n (A)n Figura 1.6 A – Principais tipos de sequên- cias do DNA. B – Alguns tipos de sequências repetitivas do DNA. G e n é ti ca H u m a n a 18 somos e em certas regiões cromossômicas, dado que as regiões centroméricas e heterocromáticas contêm poucos genes estruturais, estando a maioria deles lo- calizada em regiões subteloméricas (regiões cromossô- micas situadas entre o centrômero e as extremidades dos cromossomos; para mais detalhes, ver Cap. 4). Os genes estruturais codificam polipeptídeos que integram enzimas, hormônios, receptores e proteínas estruturais e reguladoras. Entre as sequências relacionadas aos genes, encon- tram-se os íntrons e aproximadamente 20 mil pseudo- genes. Os íntrons (“int” de interveniente) são sequências internas de DNA presentes entre as regiões codificadoras da maioria dos genes e no pré-mRNA, mas são removidos antes da tradução do mRNA maduro. Esses segmentos nucleotídicos são também chamados sequências interve- nientes, e os genes que as contêm são denominados genes interrompidos. Os pseudogenes são genes não funcionais, com se- quências homólogas às de genes estruturais funcionais, mas diferindo desses por apresentarem inserções, dele- ções e sequências flanqueadoras de repetição direta com 10 a 20 nucleotídeos, que impedem a sua expressão. Apa- rentemente, os pseudogenes surgiram por duplicação e aquisição de muitas mutações nos elementos codificado- res e reguladores, ou pela inserção de sequências de DNA complementares, às quais faltam as sequências promoto- ras necessárias para sua expressão. DNA repetitivo – Esse tipo de sequência constitui o DNA extragênico, que abrange 2.000 Mb sem informação genética conhecida. Alguns autores costumam classificar o DNA repetitivo em duas classes: 1a – DNA moderadamente repetitivo, que consiste em sequências relativamente pequenas que se repetem de 10 a mil vezes e estão dispersas por todo o genoma; esse subtipo inclui as famílias multigênicas, formadas por genes funcionais em múltiplas cópias, com funções simi- lares, tendo surgido por duplicação, com consequente di- vergência evolutiva. Alguns fazem parte de grupamentos, enquanto outros estão espalhados pelo genoma, consti- tuindo as referidas famílias multigênicas, que podem ser de dois tipos: (a) famílias gênicas clássicas, que apresen- tam alto grau de homologia em suas sequências, tendo se originado por duplicação. Exemplos: (1) os numerosos genes que codificam os diversos RNAs ribossômicos e agrupam-se nas regiões organizadoras de nucléolos, nos braços curtos dos cinco cromossomos autossômicos acro- cêntricos (cromossomos 13, 14, 15, 21 e 22; ver Cap. 4); (2) as famílias gênicas que codificam os diferentes RNAs transportadores, localizadas em numerosos conjuntos dispersos por todo o genoma; (b) superfamílias gênicas, compostas por genes com funções muito semelhantes que se originaram por duplicação a partir de um gene precur- sor e posterior divergência. Os exemplos mais conhecidos são: (1) superfamília do sistema HLA, localizada no braço curto do cromossomo 6; (2) superfamília dos receptores das células T, que têm homologia estrutural com os genes para as imunoglobulinas. 2a – DNA altamente repetitivo, que consiste em se- quências muito curtas (geralmente com menos de 100 pares de bases [pb]) presentes em milhares de vezes no genoma e não transcritas. O DNA altamente repetitivo consiste sobremaneira em sequências de DNA dispersas por todo o genoma (cerca de 1.400 Mb) e outras, como o DNA-satélite. Entre as repetições dispersas (não em tandem), muitas são elementos de transposição, que são móveis, podendo movimentar-se para diferentes regiões do genoma. A seguir, são descritos quatro tipos dessas repetições dispersas: 1. Longos elementos nucleares dispersos ou ele- mentos intercalares longos(LINEs, do inglês long interspread nuclear elements) – abrangendo cerca de 640 Mb do genoma humano, consistem, em sua forma mais comum (LINE-1 ou elemento L1), em sequências repetitivas de aproximadamente 6.500 pb, presentes em até 100 mil cópias. Um módulo de 6 a 8 kb de comprimento apresenta duas fases de leitura aberta, um promotor (P) na extremidade 5' e segmen- tos ricos em adenina na extremidade 3'. Há três tipos de LINEs (L1, L2 e L3) que se encontram dispersos em grande quantidade no genoma, do qual perfaz 15 a 20%. Uma pequena porção pode apresentar transpo- sição autônoma, cujo mecanismo já se conhece. A se- quência L1 é transcrita em uma molécula de RNA, que serve de molde para a síntese do DNA complementar, usando a enzima transcriptase reversa (enzima que transcreve inversamente o RNA em DNA, codificada por uma parte da sequência L1). A seguir, a nova có- pia de L1 é integrada ao DNA do cromossomo em um novo sítio. Devido à semelhança desse mecanismo de transposição ao utilizado pelos retrovírus, os LINEs são referidos também como retrotransposons. 2. Pequenos elementos nucleares dispersos ou elementos intercalares curtos (SINEs, do inglês short interspread nuclear elements) – abrangem cerca de 420 Mb, têm menos de 500 pb de extensão e consistem em mais de 500 mil cópias dispersas pelo genoma. Um dos tipos mais importantes de SINE é a família Alu ou repetições Alu, cuja denominação se deve ao fato de que essas repetições, com cerca de 300 pb de tamanho, contêm uma sequência de DNA que pode ser cortada pela enzima de restrição Alu I (ver Cap. 17). Uma característica importante das se- quências Alu é sua capacidade de autoduplicação, podendo inserir-se em outras regiões do genoma, interrompendo, às vezes, um gene que codifica uma dada proteína e acarretando, assim, uma doença ge- nética. Seu mecanismo de transposição é semelhante ao dos LINEs. As funções do DNA disperso ainda não são total- mente conhecidas. Os membros da família Alu são flan- queados por pequenas sequências de repetição direta e, portanto, se assemelham a sequências de DNA instáveis, denominadas elementos de transposição, elemen- tos transponíveis ou transposons. Tais elementos, identificados primeiramente no milho, movem-se espon- 19 A s B a se s M o le cu la re s d a H e re d ita rie d a d e taneamente ao longo de todo o genoma, de um cromos- somo para outro, tanto em plantas quanto em animais. Postula-se que tanto as repetições Alu como os elementos L1 acarretariam mutações patogênicas, encontradas em várias doenças humanas hereditárias, como, por exem- plo, a hipercolesterolemia familiar. 3. Repetições terminais longas (LTRs, do inglês long terminal repeats) – abrangem cerca de 250 Mb do genoma e dispõem de repetições diretas em ambas as extremidades. Como os retrovírus, as LTRs dos retrotransposons têm promotores para iniciar a transcrição da RNA-polimerase II e sinais de polia- denilação para processamento do mRNA. 4. Transposons de DNA – abrangem cerca de 90 Mb do genoma e apresentam várias classes (autônomas e não autônomas). Os transposons de DNA movem-se de uma parte a outra do genoma por meio de um me- canismo de corte-e-colagem, mediado pela enzima transposase. Ao contrário das LTRs, esses elemen- tos contêm repetições terminais com extremidades invertidas. As repetições em tandem (nas quais o início de uma repetição ocorre imediatamente adjacente ao final de outra) consistem em muitas repetições de sequências de DNA não codificadoras, que podem estar concentra- das em locais restritos ou muito dispersas no genoma. Podem dividir-se em três subgrupos: 1. DNA-satélite – abrange uma proporção variável do DNA total dos eucariotos (inexistindo em procariotos) e consiste em repetições curtas em tandem, situadas nas regiões flanqueadoras dos centrômeros, conhe- cidas como regiões heterocromáticas, de alguns cro- mossomos (p. ex., 1, 9, 16, Y). Não deve ser confun- dido com o satélite dos cromossomos acrocêntricos (ver Cap. 4); sua denominação origina-se do fato de, na centrifugação em gradiente de densidade de cloreto de césio, separar-se como um “satélite” do restante do genoma. Em humanos, uma das sequências de DNA- -satélite mais conhecidas é a família alfoide, com 171 pb, que é encontrada em arranjos de repetições em tandem do início ao fim e chega a totalizar 1 milhão de pares de bases. Não se conhece o papel exato desse tipo de DNA altamente repetitivo na função centromé- rica, mas se sabe que ele não é transcrito. 2. Minissatélites – consistem em duas famílias de re- petições curtas em tandem: (a) DNA telomérico, situado na porção terminal das extremidades cro- mossômicas (telômeros), consistindo em 10 a 15 kb de repetições em tandem de uma sequência de DNA de 6 pb (TTAGGG); esse DNA é necessário para a in- tegridade cromossômica na replicação e é adicionado ao cromossomo por uma enzima específica denomi- nada telomerase; (b) DNA minissatélite hiper- variável, que ocorre nas proximidades dos telôme- ros e em outros locais dos cromossomos. Um de seus exemplos é o DNA descrito como número variá- vel de repetições em tandem (VNTR, do inglês variable number tandem repeats), que consiste em repetições curtas (15 a 100 pares de bases) encontra- das no interior dos genes e entre eles. É altamente polimórfico, variando de um indivíduo para outro e criando regiões localizadas de 1 a 20 kb de extensão. Muitos grupamentos desse tipo estão dispersos ao longo do genoma, sendo referidos também como mi- nissatélites. A variação em comprimento dessas re- giões entre os humanos serviu de base para a técnica denominada impressões digitais de DNA (finger- printing), que se aplica à identificação de indivíduos e à medicina forense (ver Cap. 17). 3. Microssatélites – consistem em repetições cur- tas em tandem (< de 10 nucleotídeos, geralmente 1 a 5 nucleotídeos), dispersas no genoma e com alto grau de polimorfismo. São conhecidas também como STRs (do inglês short tandem repeats), utilizadas como marcadores moleculares na análise genômi- ca. Raramente ocorrem no interior das sequências codificadoras, mas repetições de três nucleotídeos próximos aos genes estão associadas a certas doen- ças hereditárias, como a doença de Huntington, a deficiência mental ligada ao X frágil e a distrofia miotônica (ver Cap. 5). Além dessas sequências, existem sequências de DNA com 1 a 4 pares de ba- ses, altamente polimórficas e de ampla distribuição no genoma, chamadas repetições de sequências simples e utilizadas como marcadores moleculares em diversos métodos. Essa terminologia, entretanto, não é precisamente definida. Por exemplo, a classificação em DNA modera- damente repetitivo e altamente repetitivo é variável na literatura específica, e alguns autores usam uma classi- ficação híbrida para o DNA repetitivo (DNA moderada- mente a altamente repetitivo). Certos autores utilizam a denominação microssatélite quando o tamanho da unida- de repetitiva é inferior a 10 pb, chamando-a minissatélite quando esse tamanho está entre 10 e 100 pb. Até o presente momento, não há uma explicação in- teiramente satisfatória para a vasta quantidade de DNA repetitivo no genoma humano, parecendo ter pouca ou nenhuma função e contribuindo pouco para o fenótipo. Daí sua denominação de “DNA egoísta”, que se preser- va a si próprio, com a autoperpetuação no genoma como sua única função, e contra o qual não agem as forças se- letivas. Outro termo utilizado para designar o aparente excesso de DNA é “DNA lixo”, que se refere a sequências genômicas sem qualquer função aparente. É provável que exista um equilíbrio no genoma entre a criação de novas sequências e a eliminação de sequências indesejadas, e que alguma proporção do DNA sem função aparente es- teja em processo de eliminação. 1.5.2 DNA mitocondrial (mtDNA) O DNA mitocondrial é uma molécula circular de fita dupla, com 16.569 pares de bases, existente no interior das mitocôndrias,organelas oriundas de bactérias e pro- G e n é ti ca H u m a n a 2 0 dutoras de energia localizadas no citoplasma de pratica- mente todas as células eucarióticas. Esse DNA não apre- senta íntrons (exceção: leveduras, que contêm grandes íntrons), nem crossing-over, arcabouço de histonas e sistema de reparo eficiente; existe em muitas cópias por mitocôndria e por célula, é de herança materna e sofre alta exposição aos radicais livres de oxigênio. As células eucarióticas contêm um número variável de mitocôndrias, dependendo da energia necessária para a realização de suas funções: quanto maior essa neces- sidade, como nos músculos e no cérebro, por exemplo, maior a quantidade de mitocôndrias existente no cito- plasma celular. As mitocôndrias apresentam, via de regra, forma ci- líndrica alongada, com diâmetro de 0,5 a 1,0 m�, mas são organelas dotadas de grande mobilidade e plasticidade, mudando constantemente de forma e podendo fundir-se umas às outras e separar-se posteriormente. Cada mitocôndria é formada por uma matriz limi- tada por duas membranas, uma externa e outra in- terna. Esta última apresenta dobramentos para dentro, formando cristas que aumentam internamente sua super- fície total (Fig. 1.7A). O genoma mitocondrial humano e de outros mamíferos apresenta 13 genes codificadores de proteínas, 22 genes de tRNA e 2 genes de rRNA. Os genes codificadores de proteínas encontram-se no complexo citocromo-c-oxidase (subunidades 1, 2 e 3) e nas regiões do citocromo b e das subunidades 6 e 8 do complexo da ATPase. Por meio de densidade, pode ser diferenciada uma fita simples leve (L) de uma pesada (H), na qual se encontra a maioria dos genes (Fig. 1.7B). Os genes mi- tocondriais utilizam um código genético diferente do usa- do pelos genes nucleares; em mamíferos, UGA para trp, AUA para met e AGA/AGG como códon de finalização. A taxa de mutação do mtDNA é quase 20 vezes mais alta do que a do DNA nuclear, provavelmente devido à grande produção de radicais livres de oxigênio (mutagê- nicos) nas mitocôndrias e à sua limitada capacidade de reparo. O mtDNA atraiu a atenção de muitos pesquisado- res, quando foi publicado um artigo por Cann e colabo- radores,8 em 1987, no qual era sugerido que a espécie humana descenderia de uma única mulher africana que teria vivido há 200 mil anos. Tal hipótese baseava-se no fato de que as mitocôndrias são exclusivamente herança materna e o acúmulo de mutações no mtDNA pode ser utilizado como um relógio evolutivo. Hoje, são conheci- das muitas variantes do mtDNA, atribuídas a diferentes A B Matriz Membrana interna Membrana externa Espaço intermembranar Thr-tRNA ori Alça D Phe-tRNA 12S-rRNA Val-tRNA 16S-rRNA ND 5 Fita H Leu-tRNA Ser-tRNA His-tRNA ND 4 ND 4L Arg-tRNA ND 3 Gly-tRNA Lys-tRNA Asp-tRNA Trp-tRNA ND 2 f-Met-tRNA Ile-tRNA ND 1 Leu-tRNA ATP-sintetase subunidade 6 ATP-sintetase subunidade 8 Fita L ND 6 Glu-tRNA Pro-tRNA Gln-tRNA Ala-tRNA Asn-tRNA Cys-tRNA Tyr-tRNA Ser-tRNA ori 16.569 pares de bases C it o cr o m o b C ito crom o-c-oxidase 3 C ito cr o m o -c -o x id a s e 1 Citoc rom o-c -o xid as e 2 Figura 1.7 Representação esquemática de uma mitocôndria e do DNA mitocondrial (mtDNA). A – Mitocôndria e seus principais componentes: matriz, membrana interna, membrana externa e espaço intermembranar. (Fonte: Alberts e colaborado- res.7) B – DNA mitocondrial (mtDNA) humano, mostrando os genes mitocondriais em seres humanos: 22 genes para tRNA, 2 para rRNA (12S rRNA e 16S rRNA) e 13 regiões codificadoras de proteínas relacionadas com a respiração (ND 1, ND2, CO 1, CO2, ATPase 8, ATPase 6, CO3, ND3, ND4L, ND4, ND5, ND6 e Cyt b). Alça D � região do mtDNA na qual um curto segmento de RNA pareia com uma das fitas de DNA; ND � NADH desidrogenase. 2 1 A s B a se s M o le cu la re s d a H e re d ita rie d a d e haplogrupos, de acordo com sua distribuição geográfica. Os principais grupos são denominados L1, L2 e L3 (na África), M e N (na Ásia) e R (na Europa), cada uma com diversos subgrupos, propiciando a reconstrução de sua árvore evolutiva. O mtDNA também é importante sob outros aspec- tos, como, por exemplo, o da sua relação com algumas doenças. Os bilhões de moléculas do mtDNA de qualquer indivíduo são geralmente idênticos e de herança materna, pois o espermatozoide contém escasso citoplasma, com poucas mitocôndrias; portanto, uma doença causada por mutação no mtDNA é herdada exclusivamente da mãe. Apenas as mulheres podem transmitir as doenças mito- condriais, passando as mutações para toda a sua prole de ambos os sexos. No entanto, essa transmissão não parece ser tão simples, pois a expressão de alguns genes mito- condriais depende da interação com genes nucleares. O genoma mitocondrial contém em torno de 1.500 genes, cuja maioria está distribuída no genoma nuclear. Muitas proteínas mitocondriais são agregadas de produtos gêni- cos nucleares e mitocondriais; esses produtos são trans- portados para as mitocôndrias após a transcrição nuclear e a tradução citoplasmática, formando proteínas funcio- nais com subunidades de produtos gênicos nucleares e mitocondriais. Portanto, algumas doenças genéticas de origem mitocondrial seguem as leis de Mendel, enquan- to as doenças puramente mitocondriais seguem somen- te a herança materna. Dado que o mtDNA se replica de forma independente do DNA nuclear e as mitocôndrias segregam-se nas células-filhas também de forma inde- pendente dos cromossomos nucleares, a proporção de mitocôndrias que porta uma mutação no mtDNA pode diferir entre as células somáticas. Essa heterogeneidade é denominada heteroplasmia e tem importante papel no fenótipo variável das doenças mitocondriais. Além disso, os tecidos diferem em sua dependência da fosforilação oxidativa, sendo mais dependentes o co- ração, os músculos esqueléticos e o sistema nervoso cen- tral. Portanto, as doenças mitocondriais caracterizam- -se com mais frequência por miopatias e encefalopatias, problemas dos músculos e do encéfalo, respectivamente. Por fim, a fosforilação oxidativa declina com a idade, tal- vez devido ao acúmulo de mutações no mtDNA. Assim, o fenótipo clínico, nas doenças mitocondriais (como LHON), cardiomiopatia hipertrófica com miopatia e diabetes com surdez de herança materna; ver Cap. 5), não está direta ou simplesmente relacionado ao genó- tipo do mtDNA, mas reflete vários fatores, como os já mencionados. 1.6 RNA: tipos Existem quatro tipos principais de RNA, todos trans- critos de moldes de DNA por RNA-polimerases e com a mesma estrutura química básica. Esses RNAs têm tama- nhos diferentes e possuem sequências de bases desiguais que determinam funções específicas. 1.6.1 RNA heterogêneo nuclear, pré-RNA mensageiro, RNA primário ou transcrito primário Esse tipo de RNA é encontrado apenas em eucario- tos e seu tamanho é variável, sendo sempre mais longo do que o RNA que é traduzido (mRNA) e praticamente correspondente à sequência do gene que é transcrito. É o primeiro passo da transcrição (por isso também é de- nominado de transcrito primário), forma-se a partir do DNA e grande parte dele nunca sai do núcleo. Fisicamen- te, mantém-se ligado a proteínas, formando partículas de ribonucleoproteínas heterogêneas nucleares (hnRNPs); in vitro, essas partículas tomam a forma de pequeninas contas ou glóbulos. O hnRNA é formado por regiões codificadoras que são transcritas e traduzidas (éxons) e regiões não codifi- cadoras que são transcritas, mas que não são traduzidas (íntrons), por isso ele é muito mais longo do que a infor- mação que codifica. Os íntrons são segmentos de hnRNA eliminados ainda no núcleo, como parte do processa- mento do RNA mensageiro. Essa eliminação é realizada por pequenas moléculas de RNA que funcionam como enzimas, denominadas ribozimas. Após a excisão dos íntrons, os segmentos remanescentes (os éxons) reúnem- -se para formar o RNA mensageiro. A excisão dos íntrons e areunião dos éxons fazem parte desse processamento, conforme mostrado na Figura 1.8. Entre 10 e 25% das moléculas de hnRNA são con- vertidos em RNA mensageiro, pois a maior parte do transcrito primário, constituída de íntrons, é degrada- da durante esse evento. Ainda são ignoradas as funções dos íntrons e as razões pelas quais os genes não são contínuos. Uma hipótese é a de que os íntrons sirvam como espaçadores para facilitar a recombinação entre os éxons. Sabe-se que somente mutações nos éxons podem afetar a sequência proteica; no entanto, mutações em ín- trons podem afetar o processamento do RNA mensagei- ro, impedindo, assim, a síntese da cadeia polipeptídica. A maioria dos genes que codificam proteínas provavel- mente surgiu como sequências interrompidas e, certa- mente, a organização de éxons e íntrons foi importante nos primórdios evolutivos dos genes, supondo-se que as sequências de íntrons tenham propiciado o surgimento de novas e úteis proteínas. O número de íntrons é alta- mente variável, mas nem todos os genes os possuem, como, por exemplo, os genes que codificam as histonas (proteínas básicas que, juntamente com o DNA e outros componentes, constituem os cromossomos). 1.6.2 RNA mensageiro O RNA mensageiro transfere a informação contida nos genes estruturais para as sequências de aminoácidos que formam os polipeptídeos. É responsável por aproximada- mente 5% do RNA total de uma célula. O mRNA, após ser processado a partir do pré-mRNA, constitui-se apenas de éxons, é relativamente estável e caraujo Retângulo caraujo Retângulo Encerra aqui o trecho do livro disponibilizado para esta Unidade de Aprendizagem. Na Biblioteca Virtual da Instituição, você encontra a obra na íntegra. Capa Iniciais Ficha catalográfica
Compartilhar