Baixe o app para aproveitar ainda mais
Prévia do material em texto
: $ "Zi Ú O Genoma Humano: Estrutura e Função dos Genes e Cromossomos Nos últimos 20 anos, um grande progresso foi feito em nossa compreensão sobre a estrutura e a função dos genes e cromosso mos no nivel molecular Mais recentemente, isto foi suplemen- tado por uma compreensão aprofundada da organízação do ge noma humano no nivel de sua seqüencia de DNA Estes avan- ços deveram~se em grande parte às aplicações da genética mole cular e da genômica a muitas situações clinicas, fornecendo as- sim os insirumentos para um enfoque novo e diferente à genéti- ca médica, Neste capítulo apresentamos uma visão geral da or- ganização do genoma humano e os aspectos da genética mole cular que são necessáríos para uma compreensão do enfoque genético à medicina, Este capítulo não pretende fornecer uma ampla descríção da abrangência das novas informações sobre a estrutura e a regulação gênica Para suplementar a informação discutida aqui, o Cap.. 4 descreve muitos enfoques experimen- tais da genética molecular moderna que estão se tornando cruciais para a prática e a compreensão da genética humana e médica, O aumento do conhecimento dos genes, bem como de sua organização no genoma, teve um enorme impacto na medicina e na nossa percepção da fisiologia humana. Como disse Paul Berg, ganhador do Prêmto Nobel, no Ínício desta nova era: Assim como nosso atual conhecimento e nossa práüca da medicina baseiam-se em um sofisticado conhecimento da anatomia humana, da fisiologia e da bioquimica, lidar com a doença no fuEuro demandarã uma compreensao detalhada da anatomia molecular, fisiologia e bioquimica do genoma humano . Precisaremos de um conhecimento mais detalhado sobre como os genes humanos são organizados e como eles funcionam e são regulados, Precisaremos também de medicos que conheçam a anatomia molecular e a fisiologia dos cromossomos e genes, como o cinirgião cardíaco conhece o funcionamento do coração. ESTRUTURA D O DNA: UMA BREVE REVISÃO O DNA é uma maçromqléçula polimérica de ácido nucleico com- posta de ties tipos de unidades: um açúcar de cinco carbonos, a desoxinibose, uma base nitrogenada e um_gnipp_Josfato (Fig. 3,1). As bases são de dois tipos, punnas e pirimidinas. No DNA, existem duas bases purinas, adenina (A) e guanina (G), e duas bases pirimidinas, timina (T) e citosina (C). Os nucleotideos, cada um composto de uma base, um fosfato e um açúcar, polimerizam- se em longas cadeias polinucleotídicas porligações fosfodiéster 5'-3' formadas entre unidades adjacentes de desoxirribose (Fig. 3.2). No genoma humano, estas cadeias polinucleotidicas (em sua forma de dupía hélice) têm centenas de miihoes de nucleotideos de tamanho longo, vaiiando de cerca de 50 miihoes de pares de bases (para o menor crornossomo, o 21) até 250 miihoes de pa res de bases (para o maior crornossomo, o 1). A estrutura anatômica do DNA leva a mformação química que permite a transmissao exata da informação genética de uma cé- lula para suas células fxihas e de uma geração para a seguinte. Ao mesmo tempo, a estrutura primária do DNA especifica as seqüências de aminoácidos das cadeias polipeptidicas das pro temas, como sera descrito mais adiante neste capítuío, 0 DNA tern caracteristicas especiais que lhe dão estas propriedades. O estado nativo do DNA, como esclarecido por James Watson e Francis Crick em 1953, é uma duplahélice (Fig, 3.3). A estrutu ra helicoidal assemelha-se a uma escada em caracol com giro para a direita, na qual suas duas cadeias polinucleotidicas correm em sentidos opostos, mantidas juntas por pontes de hidrogênio en tre os pares de bases: A em uma cadeia pareada com T da outra e G com C (ver Fig. 3 3). Conseqüentemente, o conhecimento da seqüência de nucleotideos em um filamento automaticamen- te nos permite determinar a seqüência de bases do outro filamento. A estrutura em dupla hélice das moléculas de DNA permite que elas se replíquem precisamente pela separação dos dois filamentos, seguida pela sintese de dois novos filamentos complementares, de acordo com a seqüência dos filamentos- molde originais (Fig 3.4) Similarmente, quando necessário, a complementariedade permite um repaio efíciente e correto das moléculas danificadas de DNA. O D O G M A CENTRAL; D N A ^ > R N A ^ PROTEÍNA A informação genética está contida no DNA dos cromossomos dentro do nucleo celular, mas a sintese de protemas, durante a qual a mformação codificada no DNA é usada, ocorre no citoplasma Esta compartimentaüzação reflete o fato de que o organismo hu mano é um eucarionte, Isto significa que as células humanas têm um núcleo genumo que contém o DNA, o qual é separado do cito plasma por uma membrana nuclear, Em contraste, nos procariontes, como na bacteria intestinal Escherichia coli, o DNA não está encer- 14 ' O GENOMA HUMANO: ESTRUTURA E FUNÇÂO DOS GENES E CROMOSSOMOS Purinas NH2 *S vc- HC / CH Adenina (A) HUM' HN -C ^ . -N X / CH Guanína (G) Pirimidinas O ÍI •CH3 0< N O' NT H Timina (T) I ^ X C H II / C H H Ciíosina (C) "O- - 0 - C H 2 Base. ^0* Fosfato H/? J I 1 OH H Desoxirribose Fig, 3.1 As quatro bases do DNAe a estrutura eeraldeumnucleoifdeo no DNA Cadauma das quatro bases Siga-seà desoxirribose (peio nítrogênio mostrado em vermelho) e a um grupo fosfato para formaros nucleotfdeos correspondentes rado dentro de um núcleo. Devido à compartimentalização das células eucarióticas, a transferência de informação do ntícleo para 0 citoplasma é um processo muito complexo, que tern sido foco da atenção dos biólogos moleculaies e celulares. Ponta 5' "O- =0 H > C -i-.BáséA"- H / í 1 H O I -o-p=o I o H2C 5- ^Q 3 I O I ~ 0 ~ P = 0 I o Base H / Y 1 H Ponta 3' H2C 51 0 s Base 1 OH H Fig. 3.2 Um trecho de uma cadeia polinucleotídica de DNA. mos- trando as ligações fosfodiéster 3'-5' que unern nucleotfdeos adja- centes A ligação molecular entre estes dois tipos relacionados de informação (0 código de DNA dos genes e 0 código de arninoá- cidos das proteinas) é 0 ácido ribonucleico (RNA), A estrutura química do RNA é similar à do DNA, exceto pelo fato de que cada nucleotideo no RNA tem um açúcar ribose em vez de de soxirribose. Além disso, uracil (U) substitui tirnina corno urna das pirimidinas do RNA (Fig. 3 5). Uma diferença adicional entre 0 RNA e 0 DNA é que na maioriaiiGrorgamsmos 0 RNA existe como uma molécula unifíl amen tar, enquanto o DNA existe como uma dupla hélice. A correlação informacional entre DNA, RNA e proteina está interligada: 0 DNA dirige a síntese e a seqüência do RNA, 0 RNA dirige a síntese e a seqüência dos polipeptídeos e especifica as proteinas que estão envolvidas na síntese e no metabolismo do DNA e do RNA. Este fluxo de informação é chamado de "dogma central" da biologia molecular, A informação genética é estocada no DNA por meio de um código (o código genético, discutido mais adiante), no qual V seqüência de bases adjacentes determina a seqüência de amino- ácidos no polipeptídeo codifícado. Primeiro, 0 RNA é sintetiza- do a partir de um molde de DNA por um processo conhecido como transcrição. 0 RNA, levando a informação codificada em uma foima chamada de RNA mensageiro (mRNA), é então transportado do nücleo para 0 citoplasma, onde a seqüêncía de RNA é decodificada, ou traduzida, para deterrninar a seqüência de aminoácidos na proteina que estã sendo sintetizada O pro cesso de traduçao ocorre nos ribossomos, que são organelas citoplasmáticas com sítios de ligação para todas as moléculas que interagem, incluindo 0 mRNA, envolvidas na sintese de protei nas. Os ribossomos são feitos de muitas proteinas estraturais diferentes em associação com um tipo especificode RNA, co nhecido como RNA ribossômico (rRNA). A tradução envolve ainda um terceiro tipo de RNA, 0 RNA transporiador (tRNA), que fornece a íigação molecular entre a seqüência de bases do rnRNA e a seqüência de bases da proteina Devido ao fluxo interdependente de infoimação representa- do pelo dogma central, podemos começar a discussao da geneti- O GENOMA HUMANO: ESTRUTURA E FUNÇÃO DOS GENES E CROMOSSOMOS I Í5 3,4 Á 34 Á Pontes de hidragênio Fig. 33 A estrutura do DNA Esquerda: Uma representação bidimensional dos dois filamentos complementares de DNA, mostrando os pares de bases AT e GC. Notar que a orientação dos dois filamentos é invertida Direita-. O modelo da dupia hélice de DNA. como propos- to por Watson e Crick Os "degraus" horizontais representam as bases pareadas A hélice é dita dextrógira porque o filamento que vai do canto inferior esquerdoparaosuperiordireitocruzaofiíamentooposto {Baseado em Watson} D.CrickF H C (1953)Molecularstructure of nucleic acids — A structure for deoxyribose nucleic acid Nature 171:737-738 ) ca molecular da expressão gênica em qualquer um dos três ni- veis informacionais: DNA, RNA ou proteína. Começaremos a examinar a estrutura dos genes como uma base para nossa dis- cussão do código genético, transcrição e tradução, Fig, 3.4 Replicação de uma dupla hélice de DNA que resulta em duas moléculas filhas idênticas, cada uma composta de um fiiamento parental (preto) e um recém-sintetizado {vermelfw) Estrutura e Organização do Gene ! Em sua forma simples, um gene pode ser visualizado como um segmento_de_uma rnolégul_a.deJCH^A contendp o codigo^arjaj sêqiiência de aminoácídos de uma cadeia poüpepridica e as seqüên- cias reguiadoras necessárias para a expressão Esta descrição, en- trêtánto, é inadequada para os genes do genoma humano (e, na verdade, para a maioria dos genomas eucarióticos), pois alguns genes existem como seqüências codificantes continuas. A grande maioria dos genes é interrompida por uma ou mais regiões não- codificantes Estas seqüências intercalares, chamadas íntrons, são inicialmente transcritas em RNA no nucleo, mas não estão pre- sentes no mRNA final no citoplasma Assim, a informação das seqüências intrônícas normalmente não é representada no produ- to proteico final. Os introns alternam-se corn seqüências codificantes, ou éxons, que finalmente codificam a seqüência de aminoácidos da proteina (Fig. 3.6). Embora alguns genes do ge- O HN' I H Uracil (U) ÇH CH ;':Base: Fosfato Ribose Fig. 3.5 A pirimidina uracil e a estrutura de um nucleotideo no RNA Notar que o açúcar ribose substitui o açúcar desoxirribose do DNA Compararcoma Fig 3 i / Í6 ' O GENOMA HUMANO: ESTRUTURA E FUNÇÃO DOS GENES E CROMOSSOMOS "Anterior" Promolor Início da íranscrição ▼ A Éxons (seqüêncías codificantes) \ \ ■ Códon inlciador região 5' não-traduzida íntrons (seqüências intercatares) "Posterior" .Códon finaíizador região 3' não-traduzida Sinal de poíiadenílação Seníido da íranscrição —J|>- Beta Giobína T "CAT" 0,5 1,0 1,.5 2,0 kb "TATA" Fator VIII 1 2 - 6 7-13 14 15-22 23-25 26 50 100 150 200 kb TATA"' HPRT 2 3 78 9 25 50 kb "rica em GC" Fig. 3.6 Estrutura geral de um gene humano tfpico As características individuals estão marcadas na figura e são discutidas no íexto Os exemplos de Erês genes humanos de imporíância médica são apresentados na parte inferior da figura Os éxons individuals são nume- rados Mutações diferentes no gene de p-globina causam uma variedade de hemoglobinopatias importantes As mutações no gene de fator VIII causam hernofilia A As mutações no gene de hipoxantina fosforibosiltransferase {HPRT) levam à sfndrome de Lesch-Nyhan noma humano não tenham introns, a maioria dos genes contém pelo menos um e em geral vários introns. Surpreendentemente, em muitos genes, o tamanho cumulativo dos introns é uma proporção muito maior do gene que o dos éxons. Embora alguns genes te nham apenas alguns quilobases (kb, em que 1 kb = 1.000 pares de bases) de tamanho, outros, como o gene de fator VUJ mostrado na Fig. 36, tern centenas de quilobases, Existem alguns genes excepcionalmente grandes, incluindo o gene de distrofina ligado ao X (mutação que leva à distrofia muscular Duchenne), que ocu- pa mais de 2 milhoes de pares de bases (2.000 kb), dos quais rne- nos de 1 % consiste em éxons codificantes, CARACTERISTSCAS ESTRUTURA1S DE UM GENE HUMANO TÍPICO Uma representação esquemática de uma paite do DNA cromos- sômico contendo urn gene tipico é mostrada na Fig. 3 6, juntamente com a estrutura de vários genes de relevância médica. Juntos, ilus- tram a gama de caracterísücas que caracteriza os genes humanos. Nos Caps. 1 e 2, definimos "gene" em termos gerais, Neste ponto, poderaos dar uma definição molecular de um gene. Em circuns- tâncias típicas, definimos gene como uma seqüência de DNA cro- mossômico que énecessáríapara aproduçao de umprodutofun- cional, seja um poüpeptídeo ou uma molécula funcional de KNA Como está claro na Fig. 3.6, um gene inclui não só as seqüências realmente codificantes, mas também as seqiiências nucleotídicas adjacenies necessárias para a expressão apropriada do gene—isto é, para a produção de uma molécula normal de mRNA, na quan- tidade correta, no local correto e no momento correto duiante o desenvolvimento ou durante o ciclo celular, As seqíiências adjacentes de nucleotideos fornecern os sinais moleculares de "im'cio" e "fim" para a sintese do mRNA trans- crito do gene. Na ponta 5' do gene estã uma região promotora, O GENOMA HUMANO: ESTRUTURA E FUNÇÃO DOS GENES E CROMOSSOMOS I 17 que inclui seqüências responsáveis peio inicio apropriado da transcrição. Dentro da regíão 5' estão váiios elementos do DNA cuja seqiiência é conservada entre rnuitos genes diferentes. Esta conservação, junto com os estudos funcionais da expressão gê- nica em muitos laboratórios, indica que estes elementos particu- lares de seqüência têrn urn papel impoitante na regulação Exis- tem vários típos diferentes de promotor encontrados no genoma humano, com diferentes propriedades reguladoras que especifi- cam os padrões de desenvolvimento, bem como os niveis de expressão de um determinado gene em tecidos diferentes. Os papéis dos elementos promotores individualmente conservados, identificados na Fig. 3.6, são discutidos em rnaiores detalhes na seção "Fundamentos da Expressão Gênica", Tan to os promoto res quanto outros elementos reguladores (situados em 5' ou 3' de um gene ou em seus introns) podern ser sítios de mutação nas doenças genéticas que podem interfeiir com a expressão normal de um gene Estes elementos reguladores, incluindo os acentuadores, os silenciadores e as regiões controladoras de locus (LCRs), serão discutidos mais amplamente mais adiante nestecapítulo. Na ponta 3' de um gene estã uma região não-traduzida de importância que contém um sinal de adição de uma seqüên- cia de unidades adenosina (a chamada cauda poliA) na ponta do mRNA final Embora em geral seja aceito que tais seqüên- cias reguladoras proximamente vizinhas são parte do que é chamado de "gene", as dimensões exatas de qualquer gene específico permanecerão um tanto incertas até que as funções potenciais das seqüências mais distantes sejam totalmente ca- racterizadas. FAMILIAS DE GENES Muitos genes pertencem a familias de seqüências de DNA pro ximamente relacionadas, reconhecidas como familias por cau sa da simijaridade da seqüêncía de nucleotideos dos própríos genes ou da seqüência de aminoácidos dos polipeptideos co- dificados. Uma família de genes pequena, mas medicamente impoitan te, é composta de genes que codificam as cadeias de proteina encontradas nas hemoglobinas, Os grupamentos gênicosde a- globina e de [3-giobina, nos cromossomos 16 e 11, respectiva- mente, são mostrados na Fig. 3 7 e são tidos como tendo surgi- do por dupiicação de um gene precursor primitivo há cerca de 500 milhões de anos Estes dois grupamentos contêm genes que codificam cadeias de globina proximamente relacionadas ex- pressas em estágios de desenvolvimento diferentes, do embríão até o adulto Os genes individuals dentro de cada grupamento são mais similares em seqüência uns aos outros que a genes de outros grupamentos. Assim, cada grupo é tido como tendo evo- luido de uma série de eventos seqüenciais de duplicação gêni- ca nos últimos 100 milhões de anos. Os padrões éxon-íntron de genes de globina parecem ter sido bastante conservados durante a evolução. Cada um dos genes funcionais de globina mostrados na Fig. 3.7 tern dois introns em locais similares, embora as seqüências contidas dentro dos introns tenham acu- mulado muito mais mudanças de bases nucleotidicas com o tempo que as seqüências codificantes de cada gene. 0 controle da expressão dos vários genes de globina, no estado normal bem como nas muitas hemoglobinopatias herdadas, serã considera- do em rnaiores detalhes tanto mais adiante, neste capitulo, quan to no Cap. 11, Varios genes de globina não produzem nenhum RNA ou pro- duto proteico e, portanto, é improvãvel que tenham alguma fun- ção. As seqüências de DNA que se assemelham muito a genes conhecidos mas não são funcionais são chamadas de pseudo- genes. Os pseudogenes estão disperses no genorna e são tidos como subprodutos da evolução, representando genes que já foram funcionais mas que agora são vestigiais, tendo sido ina- tivados por rnutações em seqüências codificantes ou regulado ras.. Em alguns casos, como nos genes de pseudo-a-gíobina e pseudo-p-globina, os pseudogenes supostamente surgiram por duplícação gênica, seguida da introdução de várias mutações nas cópias extras do gene que já foi funcional Em outros ca sos, os pseudogenes foram forrnados por um processo, chama do de retrotransposição, que envolve a transcrição, a geração de uma cópia de DNA do mRNA e, finalmente, da integração de tais cópias de DNA ao genoma Os pseudogenes criados por retrotransposição não têm íntrons e sao chamados de pseudo genes processados Eles não estão necessáiia ou usualmente no mesmo cromossomo (ou região cromossômica) que seu gene genitor. A maior família de genes conhecida no genoma humano é a chamada superfamflia de imunoglobulina, que inclui muitas centenas de genes envolvidos nos eventos de reconhecimento da superficie celular nos sistemas imune e nervoso, tais como os genes nos cromossomos 2, 14 e 22, que codificam as próprias cadeias pesada e leve de imunoglobulinas, os genes no cromos somo 6, que constituem o complexo principal de histocompati- bilidade, os genes nos cromossomos 7 e 14, cujos produtos cons tituem o receptor de células T, e os genes que são expressos pri- mariamente em tecidos neuráis, tais como os genes para molé- culas de adesão celular ou gíicoproteinas associadas à mielina A estiutura e a função de muitos destes genes serão examinadas em detalhes no Cap 14. t|/Ç t|/a a2 a1 genes tipo ce 5' Cromossomo 16 genes tipo j3 5' Gy Ay V P Cromossomo 11 20 40 60 kb Fig. 3 7 Organização cromossômica de dois grupos de genes de globina humana Os genes funcionais são indicados em vermelho Os pseudogenes são Indicados pelos boxes vazados {Redesenhado de Nienhuís A W.. ManiatisT j 1987J Structure and expression of giobin genes in erythroid cells In Stamatoyannopoulos G . Nienhuis A W , Leder P . Majerus P W |eds | t he Molecular Basis of Blood Disea ses W B Saunders. Philadelphia, pp 28-65 ) 18 ' O GENOMA HUMANO: ESTRUTURA E FUNÇÃO DOS GENES E CROMOSSOMOS FUNDAMENTOS DA EXPRESSÃO GENICA O fluxo de informações do gene para o polipeptideo envolve vãri- as etapas (Fig 3.8). O infcio da transcrição de um gene está sob a influencia dos promotores e de outros elementos reguladores, bem como de proteüias especificas, conhecidas como fatores de trans- crição, que interagem corn seqüências específicas dentro destas regiões. A transcrição de um gene é iniciada no "ponto de iru'cio" transcricional no DNA cromossômico antecedente às seqüências codificantes e conünua ao longo do crornossorno, indo desde vá- rias centenas de pares de bases a rnais de um milhão de pares de bases, ao longo tanto de introns quanto de éxons e além do final das seqiiências codificantes. Após a modificação tanto das pontas 5' quanto das pontas 3' do transcrito primário de RNA, as partes correspondentes a introns são lemovidas e os segmentos corres- pondentes a éxons são reunidos. Após a recomposição do RNA, o mRNA resultante (agora colinear as partes codificantes do gene) é ttansportado do núcleo para o citoplasma, onde o mRNA é fi- nalmente traduzido na seqüência de aminoãcidos do polipeptfdeo codificado. Cada uma das etapas desta via complexa está sujeita a erro, e as mutações que interferern nas etapas individuals foram implicadas em vários dismrbios genétícos (ver Caps, 5,11 e 12). Transcrição A transcríção de genes codificantes de proteinas pela RNA po~ limerase II (uma das várias classes de RNA polimerases) é inici ada um pouco antes da primeira seqüência codificante no pon to inicial de transcrição, o ponto que corresponde à ponta 5' do produto final de RNA (ver Figs, 3.6 e 3 8). A sintese do trans crito primário de RNA ocone no sentido 5' para 3', enquanto o filamento do gene transcrito é de fato lido no sentido 3* para 5' com relação à direção da estrutura desoxirribose fosfodiéster (ver Fig. 3.2). Como o RNA sintetizado corresponde tanto em polaridade quanto em seqiíência de bases (substituindo T por U) ao filamento do DNA 5' para 3', este filamento de DNA não- transcrito às vezes é chamado de "codificante" ou "com senti- do".. O filamento de DNA 3' para 5' transcrito é entao chama do de "não-codificante" ou "anti-sentido".* A trancrição con- tinua incluindo introns e éxons do gene, alem da posição no cro- mossomo que eventualmente corresponde à ponta 3' do mRNA final Não sabemos se a transcrição termina em ponto final 3' predeterminado. O transcrito primário de RNA é processado pela adição de uma estrutura quimica "cap" na ponta 5' do RNA e uma clivagem na ponta 3' em um ponto especffico ao final da informação codificante. Esta clivagem é seguida pela adição de uma cauda poliA na ponta 3' do RNA. A cauda poliA parece aumentar a estabilidade do RNA poliadenilado resultante. O ponto de poliadenilação é especificado em parte pela seqüência AAUAAA 'N T.: Esta inversão é uma causa constante de confusão por parte dos alunos Filamento não-transcrito Filamento transcrito ^n^^r3 ' | D t 1- Transcriçao 5' CAP ^%%,. 2- Pfocessamenío e ''í;%l?s, recomposição do RNA ^%^e-w Nücleo 3. T r a n s p o r t e d ^ ! >' Citopiasma 4 Tradução Ribossomos 5.. Montagem da proteina ..Cadeia polipeptfdica crescente A A A A 3' Polipeptideo completo Fig, 3.8 Fiuxo de informação do DNA para o RNA para a proteina de um gene hipotético com trés éxons e dois introns As etapas inciuem transcrição. processarnento e recornposição do RNA. transporte do nucleo para o citoplasma e tradução O GENOMA HUMANO: ESTRUTURA E FUNÇÃO DOS GENES E CROMOSSOMOS 1 19 (ou uma variance disto), em geral encontrada na pacte 3' não-tra- duzida do RNA transcrito. Estas modifícações pós-transcricionais ocorrem no núcíeo, assim como o processamento do RNA O RNA totalmente processado agora é chamado de mRNA e é trans- portado para o citoplasma, onde ocorre a tradução (ver Fig, 3,8) Tradução e o Código Genético No citoplasma, o mRNA é traduzido em proteina peia ação de uma vaiiedade de moiéculas de tRNA, cada uma especifica para urn determinado aminoácido.Estas moléculas, cada uma com apenas de 70 a 100 nucleotideos de tamanho, tern a função de transferir os aminoácidos corretos para suas posições ao longo do molde de mRNA, para que sejam adicionados à cadeia poli- peptidica crescents A sintese de proteinas ocorre nos ribosso- mos, complexos macromoleculares feitos de rRNA (codificados pelos genes de rRNA 18S e 28S) e várias dilzias de proteinas ribossomiais (ver Fig. 3.8). A chave para a tradução é um codigo que relaciona aminoá- cidos especificos a combinações de três bases adjacentes ao lon go do mRNA. Cada conjunto de três bases constitui um códon especifxco para um determinado aminoácido (Quadro 3.1), Em teoria, são possíveis variações quase infmitas na disposição das bases ao longo de uma cadeia poünucleotídica, Em qualquer posição existem quatro possibilidades (A, T, C ou G). Assim, existem 4" combinações possíveis em uma seqiiência de n ba ses . Paia três bases, há 43, ou 64, combínaçoes possíveis de trin- cas. Estes 64 códons constituem o código genétíco. Como existem apenas 20 aminoácidos e 64 possíveis códons, a maioria dos aminoácidos é especificada por mais de um códon Por isto o código é dito degenerado. Por exemplo, a base na terceiia posição da trinca pode ser uma purina (A ou G), ou uma pirimidina (T ou C) ou, em alguns casos, qualquer uma das qua tro bases, sem alterar a mensagem codífícada (ver Quadro 3 1). A leucina e arginina são especificadas por seis códons. Apenas a metionina e o triptofano são cada um deles especificado por um único códon. Três dos códons são chamados de códons finalizadores (ou sem seníido) porque designam o término da tradução do mRNA neste ponto. A tradução de um mRNA processado é sempre iniciada em um códon que especifica meuonina, A metionina é, portanto, o primeiro aminoácido codificado (amino-tenninal) de cada cadeia polipeptidica, embora em geral sejaremovido antes que a sinte se da proteina esteja completa. O códon para metionina (o códon QUADRO 3-1 0 Código Genético Primeira Base U C ■ A G Abrevíações aía (A) arg(R) asn (N) asp (D) cis (C) gin (Q) glu (E) gli (G) his (H) tie (Í) U uuu ÜUC UÜA UUG cuu cue CÜA CUG AUU AUC AUA AUG GUU GUC GUA GUG fen fen ieu leu leu ieu leu leu iie iie iie met val vaí val val dos aminoácidos: Oulra abreviação: fim alamna arginina asparagina ácido aspártico cisteína gluíamina ácido glutâmico glicina hisüdína isoleucina códon finalizador C ucu ucc UCA UCG ecu CCC CCA CCG ACU ACC ACA ACG GCU GCC GCA GCG Segunda Base ser ser ser ser pro pro pro pro tre tre tre tre ala ala ala ala leu (L) lis (K) met(M) fem(F) pro (P) ser(S) tre (T) trp(W) Ür(Y) val (V) A UAU UAC UAA UAG CAU CAC CAA CAG AAU AAC AAA AAG GAU GAC GAA GAG i tir tir fim fim his his gin gin asn asn us üs asp asp glu glu leucina lisina metionina fenilalanma proiina senna treonina triptofano tirosina valina G UGU UGC UGA UGG CGU CGC CGA CGG AGU AGC AGA AGG GGU GGC GGA GGG cis cis fim trp arg arg arg arg ser ser arg arg gu gH gli gli Terceira Base U C A G U C A G U C A G U c A G Os códons são mostrados em termos do mRNA, que são complementares aos códons cotrespondenies no DNA 20 ' O GENOMA HUMANO: ESTRUTURA £ FUNÇÃO DOS GENES E CROMOSSOMOS iniciador, AUG) estabelece a matriz de leitura do mRNA. Cada códon subseqiiente é lido, por sua vez, para prever a seqüência de aminoácidos da proteina. As ligações moleculares entre os codons e os aminoácidos são as moléculas especificas de tRNA. Urn determinado sitio de cada tRNA forma urn anticódon com ires bases que é complemeníar a um códon específíco no mRNA.. A ligação eníre o códon e o anticódon coloca o aminoácido apropriado na posição seguinte no ribossomo para a Hgação pela formação de uma ligação pepíídica com a ponta carboxila e a cadeía polipeptfdica crescen- te. O ribossomo então desliza ao longo do mRNA a cada três bases, alinhando o códon seguinte para o reconhecimento por outro tRNA com o aminoácido seguinte. Assim, as proteínas são sintetizadas a partir de seu terminal amino até o terminal carboxila, que corresponde à tradução do mRNA no sentido 5' para 3 V Como mencionado antes, a tradução termina quando um códon fmalizador (UGA, UAA ou UAG) é encontrado na mes- ma matriz de leitura que o códon iniciador. (Os códons fmalizadores em uma das matiizes de leitura não sao lidos e, portanto, não têm efeito na tradução,) O polipeptídeo completo é então liberado do ribossomo, que se torna disponivel para co- meçar a sintese de outra proteina. Processamento Pós-traducional Muitas proteínas sofrem amplas modificações pós-traducionais. A cadeia polipeptidica que é o produto primãrio da tradução é dobrada e associada em uma estrutura tridimensional especifica que é determinada pela própria seqüência de aminoácidos. Duas ou rnais cadeias polipeptidicas, produtos do mesmo gene ou de genes diferentes, podem se combinar para fòrmar um unico com- plexo proteico final. Por exemplo, duas cadeias de a-globina e duas cadeias de (3-globina associam-se de modo não convalente para forraar a rnolécula tetramérica de hemoglobina a2{3r Os produtos proteicos também podem ser modificados quimicamen- te por, por exemplo, adição de fosfato ou carboidratos em sftios especificos. Outras modificações podem envolver a clivagem da proteina, seja para remover seqüências amino-terminais especi- ficas após terem direcionado uma proteina para o seu local cor- reto dentro da célula (p. ex,, proteinas que funcionam dentro do núcleo ou mitocôndrias) ou para dividir a molécula em cadeias polipeptidicas menores. Por exemplo, as duas cadeias que cons- tituem a molécula de insulina, uma com 21 e a outra com 30 aminoácidos, originaímente são paite de uma tradução primária com 82 aminoácidos, charnada de pró-insulina, A Expressão Gênica em Açao: O Gene de Beta-Globina O fluxo de informações destacado nas seções anteriores pode ser mais bem apreciado com relação a um gene particularrnente bem estudado, o gene de (3-globina, A cadeia de p-globina é um polipeptideo com 146 aminoácidos, codifícada por um gene que ocupa aproximadamente 1,6 kb no braço cuito do cromossomo 11. O gene tem três éxons e dois introns (ver Fig. 3.6). 0 gene de p-globina, bem como outros genes no grupo de (3-globina (ver Fig. 3.7), é transcrito em uma direçao do cenrrômero para o telô- mero. Esta orientação, eníretanto, é diferente para outros genes no genoma e depende de qual filamento da dupía hélice cromos- sôrnica é o filamento codificante de um determinado gene. As seqüências de DNA necessárias para uma iniciação preci- sa da transcrição do gene de [3-globina estão situadas no promo- tor em cerca de 200 pares de bases antecedentes ao ponto de ini- cio da transcrição. A seqüencia de düpla hélice de DNA desta região do gene de p-globina, a seqüência correspondente de RNA e a seqüência traduzida dos 10 primeiros aminoácidos são rnos- tradas na Fig. 3.9 para ilustrar as relações entre estes três m'veis de informação. Como mencionado antes, é o filamento 3' para 5' do DNA que serve como molde e é transcrito, mas é o filamento 5' para 3' do DNA que corresponde mais diretamente à seqüência 5' para 3' do mRNA (e, de fato, é idêntica a ele, exceto por U substituindo T). Devido à sua correspondência, o filamento 5' para 3' do DNA de um gene (o filamento que não é transcrito) é o filamentoem geral relatado na Hteratura cientifi- ca ou nos bancos de dados. De acordo com esta convenção, a seqüência completa de apro ximadamente 2,0 kb do cromossomo 11 que inclui o gene de (3- globina é mostrada na Fig .3.10. (Vale a pena refletir que esta pá- gina de nucleotideos representa apenas 0,000067% da seqüência de todo o genoma humano). Dentro destes 2,0 kb está contida a maioria dos elementos de seqüência necessários para codificar e regular a expressão deste gene, mas não todos, Na Fig 3 10 são indicadas muitas das características importantes do gene de p- globina, incluindo os elementos de seqüência promotora conser- vados, os limites de introns e éxons, os sftios de corte do RNA, os códons iniciadores e finalizadores e o sinal de poliadenilação, to- dos os quais são conhecidos como estando mutados em vários defeitos herdados do gene de (3-globina (ver Cap. 11). iNfCIODATRANSCRIÇÂO O promotor de fJ-globina, como muitos outros promotores gê- nicos, consiste em uma série de elementos funcionais relati- DNA TATTQCTTAOATTTGCTTOTGACACAACTGTQTTCACTAGCAACCTDAAACAGACAOCATQGTGCACCTBACTCCTGAGGAGAAQTCTQCC 3' ATAACQAATGTAAACQAAGACTGTQTTGACACAAGTGATCGTTGGAGTTTGTCTQTQGTACCACGTGGACTaAGQACTCCTCTTGAGACGG s t Infcio Transcrição I Matriz de leitura i—i!—is—ii—ir mRNA s ACAUUUGCUyCUGACACAACUGÜGUUCACÜAGCAACCUCAAACAGACACCAUGGUGCACCUGACUCCUGAaGAGAAGUCUGCC Tradução \ p-giobina . ■ V n l H i o L o u T h i P i o G l u G l u L y B S e t A f B Fig. 3.9 Estrutura da seqüência de nucleotfdeos da ponta 5' do gene humano de {3-globina no braço curto do cromossomo 11 A trans- crição do filamento 3' para 5' (inferior) começa no ponto indicado para produzir o mRNA de p-globina A matriz de Seitura traducional é determinada pelo códon iniciador AUG (***); os côdons subseqüentes que especificam aminoácidos são indicados em vermelho As outras duas matrizes potenciais não são usadas O GENOMA HUMANO: ES1RÜTURA E FUNÇÃO DOS GENES E CROMOSSOMOS ! / 23 / cromossomos hurnanos. Como vimos na seção anterior, cada) crornossomo é tido como consistindo em uma única dupla he- lice continua de DNA. ísto é, cada crornossomo no núcleo é uma longa molêcülET&íHÍámentar e linear de DNA. Os cromossomos não são duplas helices nuas de DNA. A molécula de DNA de um crornossomo existe como um complexo, com uma farm'lia de proteinas crornossômicas básicas chamadas histonas e com um grupo heterogêneo de proteinas não-histônicas ácidas que não são tão bem caiacterizadas, mas que parecem ser cruciais para o estabelecimento de um ambiente apropriado para garantir o comportamento normal dos cromossomos e a expressão apro- priada dos genes. Em conjunto, este complexo de DNA e pro teinas, é chamado de cromatina. Existem cinco tipos principais de histonas que tern um papel crucial no acondicionamento da fibra de cromatina. Duas cópias de cada uma das quatro histonas cerne H2A, H2B, H3 e H4 cons tituent um octâmero, ao redor do qual se enrola um segmento da dupla hélice de DNA (Fig. 3.11), Cerca de 140 pares de base do DNA estão associados a cada cerne de histona, dando quase duas voltas ao redor do octâmero. Depois de um curto segmento (de 20 a 60 pares de bases) "espaçador" de DNA, forma-se um novo complexo de DNA, e assim por diante, dando à cromatina um aspecto de contas em um colar. Cada complexo de DNA com histonas ceme é chamado de um nucleossomo, que é a unidade estrutural básica da cromatina A quinta histona, a HI, parece ligar-se ao DNA em seguida a cada nucleossomo, na região espaçadora intemucleossômica, A quantidade de DNA associa- da ao cerne de nucleossomo, juntamente com a região espaçadora, tern cerca de 200 pares de bases. Durante o ciclo celular, como vimos no Cap. 2, os cromosso mos passam por etapas ordenadas de condensação e desconden- sação (ver Fig, 2,5). No núcleo inteifásico, os cromossomos e a cromatina estão bem descondensados em relação ao estado alta- mente condensado da cromatina na metáfase. Entretanto, mes- mo nos cromossomos interfásicos, o DNA na cromatina está substancialmente mais condensado do que estaria como uma dupla hélice nativa, livre de proteinas. Os longos filamentos de nucleossomos estão eles próprios mais compactados em uma estrutura secundária helicoidal de cromatina do que parece ao microscópio etetrônico, como uma fibra espessa de 30 nm (aproximadamente três vezes mais gros- sa que a fibra nucleossômica) (ver Fig, 3.11), Esta fibra "solenóide" (do grego solenoeides, "em forma de tubo") cilin- drica parece ser a unidade fundamental da organização da cro matina. Os solenóides são compactados em alças ou dominios ligados a intervalos de cerca de 100 kb a um arcabouço não- histônico de proteina ou matriz Tem-se especulado que as al- ças são, de fato, unidades funcionais de replicação do DNA ou de transcrição gênica, ou ambos, e que os pontos de ligação de cada alça são fixados ao longo do DNA cromossômico. Assim, um nivel de controle da expressão gênica pode depender de como o DNA e os genes são acondicionados nos cromossomos e de sua associação a proteinas da cromatina no processo de acondicionamento. Os váiios niveis hierárquicos de acondicionamento vistos em um crornossomo interfásico são ilustrados esquematicamente naFig. 3.11. A enorme quantidade de DNA embalada em um crornossomo pode ser apreciada quando os cromossomos sao tratados para remover a maioria das proteinas da cromatina a fim de se observar o arcabouço proteico (Fig. 3.12). Quando o DNA é liberado pelos cromossomos tratados deste modo, Ion- gas alças de DNA podem ser vistas, e o arcabouço residual pode ser visto reproduzindo uma estrutura de um tipico crornosso mo metafásico, 2 n m :10nm ±30 nm Cada alça contc-m 100.000 pb GO DNA Dupla héíice Fibra de nucleossomo Solenóide ("contas de um colar"} Fig.. 3,11 Níveis hierárquicos de acondicionamento da cromatina em um crornossomo humano Nucleo iníerfásico 22 l 0 GENOMA HUMANO: ESTRUTURA E FUNÇÃO DOS GENES E CROMOSSOMOS varnente curtos que sao tidos como interagindo com protef- nas especificas (em geral chamadas de fatores de transcri- ção) que regulam a transcrição, Jncluíndo, no caso dos genes de globina, as proteinas que restringem a expressão destes genes a células eritróides, as células nas quais é produzida a hernoglobina Uma seqüência promotora importante é o "TATA boxe", uma região conservada rica em adeninas e timinas que está cerca de 25 a 30 pares de bases antecedendo o ponto de inicio da ttanscrição (ver Figs. 3.6e.3.10) OTATA boxe parece ser importante para a determinação da posição do inicio da transcrição, que no gene de (3-globina está apro- ximadarnente a 50 pares de bases antecedentes ao ponto de inicio da tradução (ver Fig. 3.9). Assim, neste gene existern cerca de 50 pares de bases de seqüência que são transcritos mas não são traduzidos.. Em outros genes, esta região 5' trans- crita mas não traduzida (chamada de 5' UTR) pode ser muito rnaior e, de fato, pode ser interrompida por um ou mais s'n- trons. Uma segunda região conservada, o chamado CAT boxe (na verdade, CCAAT), está antecedente há algumas dezenas de pares de bases (ver Fig. 3.10) Tanto as mutações experi- mentalmente induzidas quanto aquelas de ocorrencia natural em um destes elementos de seqüência, bem como em outras seqüências reguladoras mais antecedentes, levam a uma in- tensa redução no nível de transcrição, demonstrando assim a Ímportância destes elementos para a expressão normal do gene. Muitas mutações nestes elementos reguladores foram identificadas em pacientes com o disturbio j3-talassernia (ver Cap.11) Nem todos os promotores gênicos contêm os dois elementos especificos descritos Em particular, os genes que são expressos constitutivarnente na maioria ou em todos os tecidos (chamados de "genes de manutenção" [housekeepinggenes}) em geral não tern o CAT e TATA boxes, que são mais tipicos de genes histoespecificos. Os promotores de muitos genes de rnanutençao em geral contêm uma alta proporção de citosinas e guaninas em relação ao DNA circundante (ver o promoter do gene de hipo- xantina fosforibosiltransferase na Fig 3 6) Tais promotores ri- cos em CG em geral estão situados nas regiões do genoma cha madas de ilhas de CG (ou de CpG), assim chamadas em função da alta concentração do dinucleotideo 5'-CG-3' que fica fora da região cromossôrnica mais geral rica em AT. Algumas das se- qüências ricas em CG encontradas nestes promotores são tídas como servindo como pontos de ligação para fatores especificos de transcrição Em adição às seqüências que constituern o próprio promoter, existem outros elementos de seqüência que podem alterar muito a eficiência da transcrição. As mais bem caracterizadas destas seqüências "ativadoras" são chamadas de acentuadores (enhancers) Os acentuadores são elementos de seqüência que podem agir à distância (era geral vários kb) de um gene para estimular a transcrição. Ao contrário dos promotores, os acentuadores são independentes de posição e orientação e podem estar localizados a 5' ou a 3' do ponto de inicio da transcrição. Os elementos acentuadores funcionam apenas em alguns tipos de células e, portanto, parecem estar envolvidos no estabeleci- mento da especificidade tissular e/ou o nivel de expressão de muitos genes, em conjunto com um ou mais fatores de transcri- ção. No caso do gene de (3-globina, vários acentuadores histoespecificos estão piesentes dentro do próprío gene e em suas regiões flanqueadoras. A interação de acentuadores com deter- rninadas proteinas leva a niveis aumentados de transcrição. A expressão normal do gene de [3-globina durante o desen- volvimento também requer uma seqüência mais distante, chama da de região controladora de locus (LCR) e situada anteceden do o gene de e-globina (ver Fig. 3.7), que é necessáiia para a expressão apropriada em alto nivel. Como esperado, as mutações que perturbam ou deletam as seqüências acentuadoras ou LCR interferem ou impedem a expressão do gene de (3-globina (ver Cap. 11). RECOMPOSIÇÃO DO RNA O transcrito primário de RNA do gene de [3-globina contém dois éxons, cerca de 100 e 850 pares de base de tamanho, que precisam ser reunidos O processo é exato e muitíssimo efici- ente Noventa e cinco por cento dos transcritos de (3-globina são tidos como sendo recompostos precisarnente para gerar um mRNA funcional de globina. As reações de recomposi- ção são guiadas por seqüências especificas tanto nas pontas 5' quanto nas pontas 3' dos introns, A seqliência 5' consiste em nove nucleotideos, dos quais dois (o dinucleotideo GT, situado no fntron imediatamente adjacente ao ponto de corte) são virtualmente invariantes entre os pontos de corte em ge nes diferentes (ver Fig. 3 10). A seqüência 3' consiste em cerca de uma duzia de nucleotideos, dos quais, mais uma vez, dois, os AG situados imediatamente a 5' do Hmite íntron/éxon, são obrigatórios para a recomposição normal- Os próprios pon tos de corte não estão relacionados com a matriz de leitura do mRNA em particular. Em alguns casos, como no do fntron 1 do gene de (3-globina, o fntron corta um códon especifico (ver Fig. 3.10). A Ímportância médica da recomposição do RNA é ílustrada pelo fato de que as mutações dentro das seqüências conservadas nos limites íntron/éxon comumente piejudicam a recomposição do RNA, com a redução concomitante da quantidade de rnRNA final normal de [3-globina; as mutações nos dinucleotfdeos GT ou AG mencionadas antes invariavelmente eliminam a remoção normal do fntron contendo a mutação. Várias mutações de sítio de corte, identificadas em pacientes com [3-talassemia, serão discutidas em detalhes no Cap.. 11.. POUADENiLAÇÃO O mRNA final de (3-globina contém aproximadamente 130 pa res de bases do material de 3' não-traduzido (3' UTR) entre o códon fmalizador e o local da cauda poliA (ver Fig. 3.10). Corao em outros genes, a clivagem da ponta 3' do mRNA e a adição da cauda poliA é controlada, pelo menos em parte, por uma seqüên- cia AAUAAA de cerca de 20 pares de bases antes do sitio de poliadenilação. As mutações neste sinal de poliadenilação nos pacientes com (3-talassemia (bem como rautações no sinal de poliadenilação correspondente no gene de a-globina nos paci entes com a-talassemia) documentam a importância deste sinal para a clivagem apropriada em 3* e a poíiadenilação (ver Cap.. 11) A região 3' não-traduzida de alguns genes pode ser bem longa, de até vários kb. Outros genes têm vários sítios de poliadenilação altemativa, e a seleção entre eles pode influenci- ar a estabilidade do mRNA resultante e, portanto, o estado de equilfbrio de cada mRNA ESTRUTURA DOS CROMOSSOMOS HUMANOS A composição de genes no genoma humano, bem como os de- terrninantes de sua expressão, é especificada no DNA dos 46 O GENOMA HUMANO: ESTRUIURA E FUNÇÃO DOS GENES E CROMOSSOMOS ! ■ 23/ cromossomos humanos. Como virnos na seção anterior, cada' cromossomo é tidocqmqcormstindo em uma ánicadupha he- lice continua de DNÀÃsto é, cada cromossomo no núcleo é uma ionga mõlecüIF&íiÍíàmentar e linear de DNA. Os cromossomos não são duplas helices nuas de DNA. A molécula de DNA de um cromossomo existe como um complexo, com uma famfiia de proteínas cromossômicas básicas chamadas histonas e com um grupo heterogêneo de protefnas não-histônicas ácidas que não são tão bem caracterizadas, mas que parecem ser cruciais para o estabeíecimento de um ambiente apropriado para garantir o comportamento normal dos cromossomos e a expressão apro- priada dos genes Em conjunto, este complexo de DNA e pro- teinas, é chamado de cromatina,. Existem cinco iipos principais de histonas que têm um papel crucial no acondicionamento da fibra de cromatina, Duas cópias de cada uma das quatro histonas ceme H2 A, H2B, H3 e H4 cons tituent um octâmero, ao redor do qual se enrola um segmento da duplahélicedeDNA(Fig. 3.11). Cerca de 140 pares de base do DNA estão associados a cada cerne de histona, dando quase duas voltas ao redor do octâmero. Depois de um curto segmento (de 20 a 60 pares de bases) "espaçador" de DNA, forma-se um novo complexo de DNA, e assim por diante, dando à cromatina um aspecto de contas em um colar. Cada complexo de DNA com histonas cerne é chamado de um nucleossomo, que é a unidade estrutuial básica da cromatina, A quinta histona, a HI, parece ligar-se ao DNA em seguida a cada nucleossomo, na região espaçadora inteniucleossômica. A quantidade de DNA associa- da ao ceme de nucleossomo, juntamente com a região espaçadora, tern cerca de 200 pares de bases. Durante o ciclo celuiar, como vimos no Cap, 2, os cromosso mos passam por etapas ordenadas de condensação e desconden- saçâo (verFig. 2.5). No núcleo interfásico, os cromossomos e a cromatina estão bem descondensados em relação ao estado alta- mente condensado da cromatina na metáfase. Entretanto, mes- mo nos cromossomos interfásicos, o DNA na cromatina esta" substancialmente mais condensado do que estaria como uma dupla hélice nativa, livre de protefnas, Os longos filamentos de nucleossomos estão eles próprios mais compactados em uma estrutura secundária heiicoidal de cromatina do que parece ao microscópio eíetrônico, como uma fibra espessa de 30 nm (aproximadamente três vezes mais gros- sa que a fibra nucleossômica) (ver Fig. 3.11). Esta fibra "solenoide" (do grego solenoeides, "em forma de tubo") cilin- drica parece set a unidade fundamental da organização da cro matina. Os solenóides são compactados em alças ou dominios ligados a intervalos de cerca de 100 kb a um arcabouço não- histônico de proteína ou matiiz. Tem-se especulado que as al- ças são, de fato, unidades funcionais de replicaçãodo DNA ou de transcrição gênica, ou ambos, e que os pontos de íigação de cada aíça são fixados ao longo do DNA cromossômico. Assim, um nivel de controle da expressão gênica pode depender de como o DNA e os genes são acondicionados nos cromossomos e de sua associação a protefnas da cromatina no processo de acondicionamento. Os vários níveis hierárquicos de acondicionamento vistos em um cromossomo inteifásico são ilustrados esquematicamente na Fig. 3.11. A enorme quantidade de DNA embalada em um cromossomo pode ser apreciada quando os cromossomos são tratados para remover a maioria das proteinas da cromatina a fim de se observai' o aicabouco proteico (Fig, 3,12), Quando o DNA é íiberado pelos cromossomos tratados deste modo, Ion- gas alças de DNA podem ser vistas, e o arcabouço residual pode ser visto reproduzindo uma estrutura de um tipico cromosso mo metafásico 2 n m 10 nm :30 nm Dupia hélice Cada alça conlérr ± 100 000pbdeDNA Fibra de nucleossomo ("contas de um colar") Solenoide Nücleo interfásico Fig 3.11 Niveis hierátquicos de acondicionamento da cromatina ern um cromossomo humano 24 1 O GENOMA HUMANO: ESTRUTURA E FUNÇÃO DOS GENES E CROMOSSOMOS -•at •*■% Fig 3.12 Micrografia eletrônica de um cromossomo metafásico sem proteína. mostrando o arcabouço cromossômico residual e as alças do DNA As fibras individuals do DNA podem ser mais bem visualizadas nas margens das alças de DNA Barra = 2u. (De Paulson | R - Laemmli U K |1977| The structure of histone-depleted metaphase chromosomes Cell 3 2:817-828 Reimpressocom permissaodosau- tores e Cell Press ) O GENOMA HUMANO: ESTRUTURA E FUNÇÃO DOS GENES E CROMOSSOMOS ! 25 O Cromossomo Mitocondrial Um subgrupo pequeno mas importante de genes codificados no genoma humano reside nas mitocôndrias do citoplasma, Os genes raitocondriais exibem herança exclusivamente mater- na (ver Cap.. 5). As células humanas têm centenas de mito- côndrias, cada uma delas contendo várias cópias de uma pe- quena molécuia circular, o cromossomo mitocondrial, A mo- lécula de DNA mitocondrial tern apenas 16 kb de tamanho (menos de 0,03% do menor cromossomo nuclear!) e codifica apenas algumas dezenas de genes Embora os produtos des- tes genes funcionern nas mitocôndrias, deve-se destacar que a grande rnaioria das proteinas encontradas nas mitocôndrias são, de fato, os produtos de genes nucleares. As mutações nos genes mitocondriais foram demonstradas em vários distúrbi- os herdados maternamente, bem como distúrbios esporádicos (ver Cap 12), ORGANIZAÇÂO DO GENOMA HUMANO As regiões do genoma com caractensticas similares ou organi- zação, replicação e expressão não são dispostas aleatoriamente, mas sim tendem a ser agrupadas. Esta organização funcional do genoma está muito bem correlacionada com sua organização estrutural, como revelado peío bandeamento dos cromossomos metafásicos (introduzido no Cap. 2 e discutido em detalhes no Cap. 9). O significado geral desta organização funcionaí é que os cromossomos não são uma coleção aleatória de tipos diferen- tes de genes e outras seqüências de DNA. Algumas regiões cro- mossômicas, ou mesmo cromossomos inteiros, são ricas em con- teúdo gênico, enquanto outras não são. Alguns tipos de seqüên- cias são característicos de diferentes marcos físicos de cromos- somos humanos. As conseqüências clínicas das anomalias de estrutura do genoma refletem a natureza específica dos genes e as seqüências envolvidas. Assim, as anomaíias dos cromossomos ricos em genes ou regiões cromossômicas tendem a ser muito mais graves cíixücamente do que os defeitos similares envolvendo partes do genoma pobres em genes. A medida que o Projeto do Genoma Humano vai ficando quase completo, toma-se aparente que a organização do DNA no genoma humano é muito mais complexa do que foi anted- pado, como ilustra a Fig„ 3.13 para a região totalmente carac- terizada do cromossomo 17 na vizinhança do gene BRCAl, cujas mutações são responsáveis por algumas formas de can cer de mama familiar (ver Cap. 16). Do DNA genôrnico, me nos de 10% codifica genes. Apenas de metade a três quartos do tamanho linear total do genoma consiste no chamado DNA de cópia iinica ou DNA único, isto é, DNA cuja seqüência de nucleotídeos é representada apenas uma vez (ou, no máximo, algumas vezes) por genoma hapíóide. 0 resto do genoma con siste em várias classes de DNA repetitivo e inciui DNA cuja seqüência de nucleotídeos é repetida, seja perfeitamente ou com alguma variação, de centenas a milhares de vezes no genoma. Embora a rnaioria (mas nao todos) dos 50.000 genes estima- dos no genoma esteja representada como DNA de cópia única, as seqüências na fração de DNA repetitivo contnbuem para manter a estrutura cromossômica. Seqüências de DNA de Cópia Única Embora o DNA de cópia única constitua a maior parte do DNA no genoma, grande parte de sua função permanece um mistério, pois, como mencionado, as seqiiências que de fato codificam proteinas (a parte codificante dos genes) constituem apenas uma pequena porção de todas as cópias únicas do DNA. Longos tre- chos de seqüências de DNA unico (> 25 kb) são bem raros no genoma. A rnaioria do DNA de cópia única é encontrada em pequenos trechos (vários kb ou menos), intercalados com mem- bros de várias familias de DNA repetitivo (ver Fig. 3.13). Genes: Éxons; 1 = 0 * 5-7 BRCA1 11 4 ^ pseudogene * 13 - 24 ■ Rho7 VAT1 IFP35 e<—1 1—*»6 / 1 1111. =»t# pseudogene Repeíição de DNA: -BB-n»-*-w«i-m>Mw-m»-t>-9m«mii HBH-^K-»^»H44H<h^^l(Mh^WIHHM«M»HH»HHIMHMtH-IH»HM (™*«-f4-(H H~ 10 kb Fig 3.13 Organização seqüenciaí da região do genoma humano próxima ao gene BRCAl. que é responsável por alguns casos de cancer de mama familiar deinicio precoce São encontrados quatro genes e dois pseudogenes nesta seqüência de 117 kb do cromossomo 17, e suas locaiizações e estruturas são indicadas acima do cromossomo. Quase metade da seqüência consiste ern vários elementos repe- titivos intercalados, incluindo 170 cópias das repetições AÍK e 8 cópias das repetições LI que são indicadas abaixo do cromossomo BRCAl contém um promotor rico em GC, com vários sftios de ligação de fatores de transcriçào específicos O gene RH07 codifica um membro da famfiia de proteinas de ligação de GTP VATi codifica uma protei'na de rnembrana encontrada nas vesfculas sinápticas Tan to RH07quanto VATi também tern promotores ricos em GC.1FP35 codifica uma protei'na cuja expressãopodeserinduzídaporintérferon (Baseada em Smith T M , LeeM K , Szabo C. 1 etal jl996| Complete genomic sequence and analysis of 117 kb human DNA containing the gene BRCAl Genome Research 6:1029- i049 } 26 ' O GENOMA HUMANO: ESTRUTURA E FUNÇÃO DOS GENES E CROMOSSOMOS Famiiias de DNA Repetitivo Váiias categorias diferentes de DNA repetitivo são reconhe- cidas. Uma caracten'stica distinta iStil é se as seqüências re- petídas ("repetições") estão agrupadas em um ou alguns pou- cos locais ou se estão dispersas pelo genoma, intercaladas com seqüências de cópia única ao longo do cromossomo, As seqiiências repetidas agrupadas constituem de 10% a 15% do genoma e consistem em arranjos de várias repetições curtas organizadas em tandem. Os diferentes tipos de tais repetições em tandem são coletivamente chamados de DNA satéíite, assim denominados porque muitas das famiiias de repetições originais em tandem podiam ser putificadas por densidade de centrifugação do lesto do genoma como frações "satélite" do DNA. As famiiias de DNA satélite variam com relação ao seu lo cal no genoma, ao tamanho total da disposição em tandem e ao comprimento das unidades repetidas constituintes do agru- pamento. Em geral, os arranjos-satélites podem ter vários mi- Ihoes de pares de bases ou rnais de tamanho e constituir até vários por cento do conteúdode DNA de um cromossomo humano. Muitas seqüências-satélites são importantes como ferramentas moleculares que revolucionaram a análise cito- genética clínica em função de sua relativa facilidade de de- tecção (ver Cap. 9). Algumas seqüências-satélites humanas são baseadas nas repetições (com alguma variação) de uma seqüência cuita, tal como um penianucleotj'deo. Longas dis- posiçoes de tais repetições são encontradas nas regiões heterocromáticas nos braços longos proximais dos cromosso- mos 1, 9 e 16 e em quase todo o braço longo do cromossomo Y (ver Cap, 9). Outros DNAs satélites são baseados em repe- tições um pouco mais longas. Por exemplo, a família a-saté- lite de DNA é composta de disposições em tandem de cópias diferentes de uma unidade de aproximadamente 171 pares de bases, encontrada na região centromérica de cada cromosso mo humano. Esta familia de repetições é tida como tendo um papel na função do centrômero, garantindo a segregação cro- mossõmica apropriada na raitose e na meiose. Além do DNA satélite, outra classe imporiante de DNA repetitivo no genoma consiste em seqüências relacionadas que são dispersas pelo genoma em vez de localizadas (ver Fig. 3.13). Embora muitas famiiias de DNA pequeno aten- dam a esta descrição geral, duas em particular garantem a discussão porque juntas constituem uma porção significati- va do genoma e porque foram irnplicadas em doenças gené- ticas. Os mais bem estudados elementos repetitivos disper- sos pertencem à chamada familia Alu. Os membros desta familia tern cerca de 300 pares de bases de tamanho e são reconhecivelmente relacionados uns aos outros, embora não sejara iguais em seqüência No total, existem cerca de 500 000 membros da familia Alu no genoma, constituindo pelo menos váríos por cento do DNA humano. Em algumas regiões do genoma, entretanto, incluindo aquela próxima ao gene BRCA1 como visto na Fig 3,13, eles constituem uma porcentagera muito mais alta do DNA Uma segunda fami lia importante de DNA repetitivo disperse é chamada de familia LI Os elementos LI são seqüências longas e repe- titivas (de até 6 kb de tamanho) que são encontrados em cerca de 100 000 cópias por genoma. Eles são abundantes em al gumas regiões do genoma, mas relativamente esparsos em outras As famiiias de repetições dispersas pelo genoma sao claramen- te de importância médica. Tanto as seqüências Alu quanto as LI fbram irnplicadas como a causa de mutações em doenças here- dítárias pelo processo de retrotransposição, introduzido em uma seção anterior. Pelo menos algumas cópias das famiiias LI e Alu ainda são transposecionalmente ativas e geram cópias de si mes- mas que podem se integral' em outras paries do genoma, ocasio- nalmente causando inativação insercionaí de um gene importante em termos medicos, A freqüência dos eventos de retrotransposi- ção que causam doenças genéticas em seres humanos atualmen- te é desconhecida, mas eles podem contribuir com até 1 em 500 mutações. Além disso, os eventos de recombinação aberrante entre cópias diferentes de repetições dispersas também podem ser uma causa de mutação em algumas doenças genéticas (ver Cap. 6). VAR1AÇÃO NA EXPRESSÃO GÊNSCA E SUA RELEVANCIA PARA A MEDÍCINA A expressão regulada dos cerca de 50.000 genes codificados nos cromossomos humanos envolve um conjunto de inter-re- lações complexas entre m'veis diferentes de controle, incluin do a dosagem gênica apropriada (controlada por mecanismos de replicação cromossômica e segregação), a estrutura gênica e, fmalmente, a transcrição, a estabilidade do mRNA, a tradu- ção, o processamento de proteinas e a degradação de proteinas, Para alguns genes, as flutuações no m'vel de produto gênico funcional, devidas ou à variação herdada na estrutura de um deterrninado gene ou às mudanças induzidas por fatores não- genéticos tais como dieta ou o ambiente, são relativamente de pouca importância. Para outros genes, as rnudanças no m'vel de expressão podem ter conseqüências clínicas, refletindo a im- portância destes produtos gênicos em determinadas vias bioíó- gicas. A natureza da variação herdada na estrutura e na função dos cromossomos e genes, bem como a influência desta varia- ção na expressão de caracterisiicas específicas, é a própria es- sência da genética médica e molecular e será tratada nos capi- tulos subseqiientes. Referênàas Gerais Abel T, Maniatis T (1994) .Mechanisms of eukaryotic gene regula tion In Stamatoyannopoulos G, Nienhuis AW, Majerus PW, Varmus H, (eils) The Molecular Basis of Blood Diseases WB Saunders, Philadelphia, pp .33-70. Alberts B, Bray D, Lewis J, et ai, (1994) Molecular Biology of the Cell, 3rd ed Garland Publishing, New York Bernardi G (1995) The human genome, organization, and evolu tionary history. Ann Rev Genet 29:445-476 Lewin B (2000) Genes VII, 7th ed Oxford University Press, Ox ford, England. Semenza G (1999) Transcription Factors and Human Disease 0 \ - ford University Press, New York Singer M, Berg P {1997) Exploring Genetic Mechanisms Univer sity Science Books, Sausalito, California. Wolffe A (3998) Chromatin Structure and Function, 3rd cá Acad emic Press, San Diego Referenda's Específicas aos Tópicos Particulares Berg P (1981) Dissections and reconstructions of genes and chro mosomes (Nobel Prize lecture) Science 213:296- 103 Kazazian HH, Moran JV {1998) The impact of LI rctrotrans- posonson the human genome. Nature Genetics 19:19-24 Lawn RM, Efstratiadis A, O'Conneli C, et al (19H0) The nu- cleotide sequence of the human |3-globin qcne Cell 21:647-651 Smith TM, Lee MK, Szabo Cl, et al (1996) Complete genomic se quence and analysis of 117 kb of human DNA containing; the gene BRCAI Genome Research 6:1029-1049 O GENOMA HUMANO: ESTRUTURA E FUNÇÃO DOS GENES E CROMOSSOMOS I 27 Wallace DC (1999) Mitochondria! discuses in man and mouse Sci ence 283:1482-1488 p15 Problemas 1 As seqüências de amínoácidos que se seguem representam paite de uma proteíha. São mostradas a seqüência normal e quatro forrnas mutantes. Consuitando o Quadro 3 1, determine a seqüência bifílamentar da seção correspondente do gene normal. Qual filamento a RNA polimerase irá ler ? Qual seria a seqüência do mRNA resul- tante? Que tipo de mutação é mais provável que cada protema mu- tante represente? Normal -lis-arg-his-his-tir-leu- Mutante 1 -lis-arg-his-his-cis-leu- Mutante 2 -Hs-arg-ile-ile-ile- Mutante 3 -lis-glu-tre-ser-leu-ser- Mutante 4 -asn-tk-Ieu- 2 Os itens que se seguem estão relacionados uns aos outros de modo hierárquico Quais são estas relações? Cromossomo, par de bases, nucleossomo, banda G, pares de kb, intron, gene, éxon, cromatina, códon, micleoüdeo. 3 0 desenho esquemáüco que se segue ilustra urn cromossomo 5 no qual a banda mais distal (banda p!5) no braço cuito está deietada. Este cromossomo deletado está associado à sfndrome do cri du chat (ver Caps. 9 e 10) Com o que você sabe sobre a organização dos cromossomos e do genoma, aproximadamente quanto 0NA foi de letado? Quantos genes? 5p- A matorparte do genoma humano consiste em seqüências que não são tnuiscritas e não codificam diretamente produtos gênicos. Para cada urn dos que se seguem, considere os modos pelos quais estes elementos genômicos podem contribuir para uma doença humana: fntrons, sequen cias repetitivas Alu ou L1, regiões controladoras de locus, pseudogenes.
Compartilhar