3 - O Genoma Humano

•
USP-SP

Virgílio Salvador
14/05/2018
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 15 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 15 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 15 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
E aí, curtiu este material?
Ajude a incentivar outros estudantes a melhorar o conteúdo
Gostou desse material? Compartilhe! 🧡
Anatomia Humana I

90.005 Materiais compartilhados
Baixe o app para aproveitar ainda mais
Leia os materiais offline, sem usar a internet. Além de vários outros recursos!
Prévia do material em texto
: $ 
"Zi Ú 
O Genoma Humano: Estrutura e 
Função dos Genes e Cromossomos 
Nos últimos 20 anos, um grande progresso foi feito em nossa 
compreensão sobre a estrutura e a função dos genes e cromosso
mos no nivel molecular Mais recentemente, isto foi suplemen-
tado por uma compreensão aprofundada da organízação do ge
noma humano no nivel de sua seqüencia de DNA Estes avan-
ços deveram~se em grande parte às aplicações da genética mole
cular e da genômica a muitas situações clinicas, fornecendo as-
sim os insirumentos para um enfoque novo e diferente à genéti-
ca médica, Neste capítulo apresentamos uma visão geral da or-
ganização do genoma humano e os aspectos da genética mole
cular que são necessáríos para uma compreensão do enfoque 
genético à medicina, Este capítulo não pretende fornecer uma 
ampla descríção da abrangência das novas informações sobre a 
estrutura e a regulação gênica Para suplementar a informação 
discutida aqui, o Cap.. 4 descreve muitos enfoques experimen-
tais da genética molecular moderna que estão se tornando cruciais 
para a prática e a compreensão da genética humana e médica, 
O aumento do conhecimento dos genes, bem como de sua 
organização no genoma, teve um enorme impacto na medicina e 
na nossa percepção da fisiologia humana. Como disse Paul Berg, 
ganhador do Prêmto Nobel, no Ínício desta nova era: 
Assim como nosso atual conhecimento e nossa práüca da 
medicina baseiam-se em um sofisticado conhecimento da 
anatomia humana, da fisiologia e da bioquimica, lidar com a 
doença no fuEuro demandarã uma compreensao detalhada da 
anatomia molecular, fisiologia e bioquimica do genoma 
humano . Precisaremos de um conhecimento mais detalhado 
sobre como os genes humanos são organizados e como eles 
funcionam e são regulados, Precisaremos também de medicos que 
conheçam a anatomia molecular e a fisiologia dos cromossomos e 
genes, como o cinirgião cardíaco conhece o funcionamento do 
coração. 
ESTRUTURA D O DNA: UMA BREVE REVISÃO 
O DNA é uma maçromqléçula polimérica de ácido nucleico com-
posta de ties tipos de unidades: um açúcar de cinco carbonos, a 
desoxinibose, uma base nitrogenada e um_gnipp_Josfato (Fig. 
3,1). As bases são de dois tipos, punnas e pirimidinas. No DNA, 
existem duas bases purinas, adenina (A) e guanina (G), e duas 
bases pirimidinas, timina (T) e citosina (C). Os nucleotideos, cada 
um composto de uma base, um fosfato e um açúcar, polimerizam-
se em longas cadeias polinucleotídicas porligações fosfodiéster 
5'-3' formadas entre unidades adjacentes de desoxirribose (Fig. 
3.2). No genoma humano, estas cadeias polinucleotidicas (em sua 
forma de dupía hélice) têm centenas de miihoes de nucleotideos 
de tamanho longo, vaiiando de cerca de 50 miihoes de pares de 
bases (para o menor crornossomo, o 21) até 250 miihoes de pa
res de bases (para o maior crornossomo, o 1). 
A estrutura anatômica do DNA leva a mformação química que 
permite a transmissao exata da informação genética de uma cé-
lula para suas células fxihas e de uma geração para a seguinte. 
Ao mesmo tempo, a estrutura primária do DNA especifica as 
seqüências de aminoácidos das cadeias polipeptidicas das pro
temas, como sera descrito mais adiante neste capítuío, 0 DNA 
tern caracteristicas especiais que lhe dão estas propriedades. O 
estado nativo do DNA, como esclarecido por James Watson e 
Francis Crick em 1953, é uma duplahélice (Fig, 3.3). A estrutu
ra helicoidal assemelha-se a uma escada em caracol com giro para 
a direita, na qual suas duas cadeias polinucleotidicas correm em 
sentidos opostos, mantidas juntas por pontes de hidrogênio en
tre os pares de bases: A em uma cadeia pareada com T da outra 
e G com C (ver Fig. 3 3). Conseqüentemente, o conhecimento 
da seqüência de nucleotideos em um filamento automaticamen-
te nos permite determinar a seqüência de bases do outro 
filamento. A estrutura em dupla hélice das moléculas de DNA 
permite que elas se replíquem precisamente pela separação dos 
dois filamentos, seguida pela sintese de dois novos filamentos 
complementares, de acordo com a seqüência dos filamentos-
molde originais (Fig 3.4) Similarmente, quando necessário, a 
complementariedade permite um repaio efíciente e correto das 
moléculas danificadas de DNA. 
O D O G M A CENTRAL; 
D N A ^ > R N A ^ PROTEÍNA 
A informação genética está contida no DNA dos cromossomos 
dentro do nucleo celular, mas a sintese de protemas, durante a qual 
a mformação codificada no DNA é usada, ocorre no citoplasma 
Esta compartimentaüzação reflete o fato de que o organismo hu
mano é um eucarionte, Isto significa que as células humanas têm 
um núcleo genumo que contém o DNA, o qual é separado do cito
plasma por uma membrana nuclear, Em contraste, nos procariontes, 
como na bacteria intestinal Escherichia coli, o DNA não está encer-
14 ' O GENOMA HUMANO: ESTRUTURA E FUNÇÂO DOS GENES E CROMOSSOMOS 
Purinas 
NH2 
*S vc-
HC / 
CH 
Adenina (A) 
HUM' 
HN 
-C ^ . 
-N 
X 
/ 
CH 
Guanína (G) 
Pirimidinas 
O 
ÍI 
•CH3 
0< 
N 
O' 
NT 
H 
Timina (T) 
I 
^ X C H 
II 
/ C H 
H 
Ciíosina (C) 
"O- - 0 - C H 2 
Base. 
^0* 
Fosfato 
H/? 
J I 1 
OH H 
Desoxirribose 
Fig, 3.1 As quatro bases do DNAe a estrutura eeraldeumnucleoifdeo no DNA Cadauma das quatro bases Siga-seà desoxirribose (peio 
nítrogênio mostrado em vermelho) e a um grupo fosfato para formaros nucleotfdeos correspondentes 
rado dentro de um núcleo. Devido à compartimentalização das 
células eucarióticas, a transferência de informação do ntícleo para 
0 citoplasma é um processo muito complexo, que tern sido foco 
da atenção dos biólogos moleculaies e celulares. 
Ponta 5' 
"O- =0 
H > C 
-i-.BáséA"-
H / í 
1 
H O I 
-o-p=o 
I 
o 
H2C 5- ^Q 
3 I 
O 
I 
~ 0 ~ P = 0 
I 
o 
Base 
H / Y 
1 
H 
Ponta 3' 
H2C 51 0 s 
Base 
1 
OH H 
Fig. 3.2 Um trecho de uma cadeia polinucleotídica de DNA. mos-
trando as ligações fosfodiéster 3'-5' que unern nucleotfdeos adja-
centes 
A ligação molecular entre estes dois tipos relacionados de 
informação (0 código de DNA dos genes e 0 código de arninoá-
cidos das proteinas) é 0 ácido ribonucleico (RNA), A estrutura 
química do RNA é similar à do DNA, exceto pelo fato de que 
cada nucleotideo no RNA tem um açúcar ribose em vez de de
soxirribose. Além disso, uracil (U) substitui tirnina corno urna 
das pirimidinas do RNA (Fig. 3 5). Uma diferença adicional entre 
0 RNA e 0 DNA é que na maioriaiiGrorgamsmos 0 RNA existe 
como uma molécula unifíl amen tar, enquanto o DNA existe como 
uma dupla hélice. 
A correlação informacional entre DNA, RNA e proteina está 
interligada: 0 DNA dirige a síntese e a seqüência do RNA, 0 RNA 
dirige a síntese e a seqüência dos polipeptídeos e especifica as 
proteinas que estão envolvidas na síntese e no metabolismo do 
DNA e do RNA. Este fluxo de informação é chamado de "dogma 
central" da biologia molecular, 
A informação genética é estocada no DNA por meio de um 
código (o código genético, discutido mais adiante), no qual V 
seqüência de bases adjacentes determina a seqüência de amino-
ácidos no polipeptídeo codifícado. Primeiro, 0 RNA é sintetiza-
do a partir de um molde de DNA por um processo conhecido 
como transcrição. 0 RNA, levando a informação codificada em 
uma foima chamada de RNA mensageiro (mRNA), é então 
transportado do nücleo para 0 citoplasma, onde a seqüêncía de 
RNA é decodificada, ou traduzida, para deterrninar a seqüência 
de aminoácidos na proteina que estã sendo sintetizada O pro
cesso de traduçao ocorre nos ribossomos, que são organelas 
citoplasmáticas com sítios de ligação para todas as moléculas que 
interagem, incluindo 0 mRNA, envolvidas na sintese de protei
nas. Os ribossomos são feitos de muitas proteinas estraturais 
diferentes em associação com um tipo especificode RNA, co
nhecido como RNA ribossômico (rRNA). A tradução envolve 
ainda um terceiro tipo de RNA, 0 RNA transporiador (tRNA), 
que fornece a íigação molecular entre a seqüência de bases do 
rnRNA e a seqüência de bases da proteina 
Devido ao fluxo interdependente de infoimação representa-
do pelo dogma central, podemos começar a discussao da geneti-
O GENOMA HUMANO: ESTRUTURA E FUNÇÃO DOS GENES E CROMOSSOMOS I Í5 
3,4 Á 
34 Á 
Pontes de 
hidragênio 
Fig. 33 A estrutura do DNA Esquerda: Uma representação bidimensional dos dois filamentos complementares de DNA, mostrando os 
pares de bases AT e GC. Notar que a orientação dos dois filamentos é invertida Direita-. O modelo da dupia hélice de DNA. como propos-
to por Watson e Crick Os "degraus" horizontais representam as bases pareadas A hélice é dita dextrógira porque o filamento que vai do 
canto inferior esquerdoparaosuperiordireitocruzaofiíamentooposto {Baseado em Watson} D.CrickF H C (1953)Molecularstructure 
of nucleic acids — A structure for deoxyribose nucleic acid Nature 171:737-738 ) 
ca molecular da expressão gênica em qualquer um dos três ni-
veis informacionais: DNA, RNA ou proteína. Começaremos a 
examinar a estrutura dos genes como uma base para nossa dis-
cussão do código genético, transcrição e tradução, 
Fig, 3.4 Replicação de uma dupla hélice de DNA que resulta em 
duas moléculas filhas idênticas, cada uma composta de um 
fiiamento parental (preto) e um recém-sintetizado {vermelfw) 
Estrutura e Organização do Gene ! 
Em sua forma simples, um gene pode ser visualizado como um 
segmento_de_uma rnolégul_a.deJCH^A contendp o codigo^arjaj 
sêqiiência de aminoácídos de uma cadeia poüpepridica e as seqüên-
cias reguiadoras necessárias para a expressão Esta descrição, en-
trêtánto, é inadequada para os genes do genoma humano (e, na 
verdade, para a maioria dos genomas eucarióticos), pois alguns 
genes existem como seqüências codificantes continuas. A grande 
maioria dos genes é interrompida por uma ou mais regiões não-
codificantes Estas seqüências intercalares, chamadas íntrons, são 
inicialmente transcritas em RNA no nucleo, mas não estão pre-
sentes no mRNA final no citoplasma Assim, a informação das 
seqüências intrônícas normalmente não é representada no produ-
to proteico final. Os introns alternam-se corn seqüências 
codificantes, ou éxons, que finalmente codificam a seqüência de 
aminoácidos da proteina (Fig. 3.6). Embora alguns genes do ge-
O 
HN' 
I 
H 
Uracil (U) 
ÇH 
CH 
;':Base: 
Fosfato Ribose 
Fig. 3.5 A pirimidina uracil e a estrutura de um nucleotideo no RNA 
Notar que o açúcar ribose substitui o açúcar desoxirribose do DNA 
Compararcoma Fig 3 i 
/ 
Í6 ' O GENOMA HUMANO: ESTRUTURA E FUNÇÃO DOS GENES E CROMOSSOMOS 
"Anterior" 
Promolor 
Início da 
íranscrição 
▼ 
A 
Éxons (seqüêncías 
codificantes) 
\ \ 
■ Códon 
inlciador 
região 5' 
não-traduzida 
íntrons 
(seqüências 
intercatares) 
"Posterior" 
.Códon finaíizador 
região 3' 
não-traduzida 
Sinal de 
poíiadenílação 
Seníido da íranscrição 
—J|>-
Beta Giobína 
T 
"CAT" 
0,5 1,0 1,.5 2,0 kb 
"TATA" 
Fator VIII 
1 2 - 6 7-13 14 15-22 23-25 26 
50 100 150 200 kb 
TATA"' 
HPRT 
2 3 78 9 
25 50 kb 
"rica em GC" 
Fig. 3.6 Estrutura geral de um gene humano tfpico As características individuals estão marcadas na figura e são discutidas no íexto Os 
exemplos de Erês genes humanos de imporíância médica são apresentados na parte inferior da figura Os éxons individuals são nume-
rados Mutações diferentes no gene de p-globina causam uma variedade de hemoglobinopatias importantes As mutações no gene de 
fator VIII causam hernofilia A As mutações no gene de hipoxantina fosforibosiltransferase {HPRT) levam à sfndrome de Lesch-Nyhan 
noma humano não tenham introns, a maioria dos genes contém 
pelo menos um e em geral vários introns. Surpreendentemente, em 
muitos genes, o tamanho cumulativo dos introns é uma proporção 
muito maior do gene que o dos éxons. Embora alguns genes te
nham apenas alguns quilobases (kb, em que 1 kb = 1.000 pares 
de bases) de tamanho, outros, como o gene de fator VUJ mostrado 
na Fig. 36, tern centenas de quilobases, Existem alguns genes 
excepcionalmente grandes, incluindo o gene de distrofina ligado 
ao X (mutação que leva à distrofia muscular Duchenne), que ocu-
pa mais de 2 milhoes de pares de bases (2.000 kb), dos quais rne-
nos de 1 % consiste em éxons codificantes, 
CARACTERISTSCAS ESTRUTURA1S DE UM GENE HUMANO TÍPICO 
Uma representação esquemática de uma paite do DNA cromos-
sômico contendo urn gene tipico é mostrada na Fig. 3 6, juntamente 
com a estrutura de vários genes de relevância médica. Juntos, ilus-
tram a gama de caracterísücas que caracteriza os genes humanos. 
Nos Caps. 1 e 2, definimos "gene" em termos gerais, Neste ponto, 
poderaos dar uma definição molecular de um gene. Em circuns-
tâncias típicas, definimos gene como uma seqüência de DNA cro-
mossômico que énecessáríapara aproduçao de umprodutofun-
cional, seja um poüpeptídeo ou uma molécula funcional de KNA 
Como está claro na Fig. 3.6, um gene inclui não só as seqüências 
realmente codificantes, mas também as seqiiências nucleotídicas 
adjacenies necessárias para a expressão apropriada do gene—isto 
é, para a produção de uma molécula normal de mRNA, na quan-
tidade correta, no local correto e no momento correto duiante o 
desenvolvimento ou durante o ciclo celular, 
As seqíiências adjacentes de nucleotideos fornecern os sinais 
moleculares de "im'cio" e "fim" para a sintese do mRNA trans-
crito do gene. Na ponta 5' do gene estã uma região promotora, 
O GENOMA HUMANO: ESTRUTURA E FUNÇÃO DOS GENES E CROMOSSOMOS I 17 
que inclui seqüências responsáveis peio inicio apropriado da 
transcrição. Dentro da regíão 5' estão váiios elementos do DNA 
cuja seqiiência é conservada entre rnuitos genes diferentes. Esta 
conservação, junto com os estudos funcionais da expressão gê-
nica em muitos laboratórios, indica que estes elementos particu-
lares de seqüência têrn urn papel impoitante na regulação Exis-
tem vários típos diferentes de promotor encontrados no genoma 
humano, com diferentes propriedades reguladoras que especifi-
cam os padrões de desenvolvimento, bem como os niveis de 
expressão de um determinado gene em tecidos diferentes. Os 
papéis dos elementos promotores individualmente conservados, 
identificados na Fig. 3.6, são discutidos em rnaiores detalhes na 
seção "Fundamentos da Expressão Gênica", Tan to os promoto
res quanto outros elementos reguladores (situados em 5' ou 3' 
de um gene ou em seus introns) podern ser sítios de mutação nas 
doenças genéticas que podem interfeiir com a expressão normal 
de um gene Estes elementos reguladores, incluindo os 
acentuadores, os silenciadores e as regiões controladoras de 
locus (LCRs), serão discutidos mais amplamente mais adiante 
nestecapítulo. 
Na ponta 3' de um gene estã uma região não-traduzida de 
importância que contém um sinal de adição de uma seqüên-
cia de unidades adenosina (a chamada cauda poliA) na ponta 
do mRNA final Embora em geral seja aceito que tais seqüên-
cias reguladoras proximamente vizinhas são parte do que é 
chamado de "gene", as dimensões exatas de qualquer gene 
específico permanecerão um tanto incertas até que as funções 
potenciais das seqüências mais distantes sejam totalmente ca-
racterizadas. 
FAMILIAS DE GENES 
Muitos genes pertencem a familias de seqüências de DNA pro
ximamente relacionadas, reconhecidas como familias por cau
sa da simijaridade da seqüêncía de nucleotideos dos própríos 
genes ou da seqüência de aminoácidos dos polipeptideos co-
dificados. 
Uma família de genes pequena, mas medicamente impoitan
te, é composta de genes que codificam as cadeias de proteina 
encontradas nas hemoglobinas, Os grupamentos gênicosde a-
globina e de [3-giobina, nos cromossomos 16 e 11, respectiva-
mente, são mostrados na Fig. 3 7 e são tidos como tendo surgi-
do por dupiicação de um gene precursor primitivo há cerca de 
500 milhões de anos Estes dois grupamentos contêm genes que 
codificam cadeias de globina proximamente relacionadas ex-
pressas em estágios de desenvolvimento diferentes, do embríão 
até o adulto Os genes individuals dentro de cada grupamento 
são mais similares em seqüência uns aos outros que a genes de 
outros grupamentos. Assim, cada grupo é tido como tendo evo-
luido de uma série de eventos seqüenciais de duplicação gêni-
ca nos últimos 100 milhões de anos. Os padrões éxon-íntron 
de genes de globina parecem ter sido bastante conservados 
durante a evolução. Cada um dos genes funcionais de globina 
mostrados na Fig. 3.7 tern dois introns em locais similares, 
embora as seqüências contidas dentro dos introns tenham acu-
mulado muito mais mudanças de bases nucleotidicas com o 
tempo que as seqüências codificantes de cada gene. 0 controle 
da expressão dos vários genes de globina, no estado normal bem 
como nas muitas hemoglobinopatias herdadas, serã considera-
do em rnaiores detalhes tanto mais adiante, neste capitulo, quan
to no Cap. 11, 
Varios genes de globina não produzem nenhum RNA ou pro-
duto proteico e, portanto, é improvãvel que tenham alguma fun-
ção. As seqüências de DNA que se assemelham muito a genes 
conhecidos mas não são funcionais são chamadas de pseudo-
genes. Os pseudogenes estão disperses no genorna e são tidos 
como subprodutos da evolução, representando genes que já 
foram funcionais mas que agora são vestigiais, tendo sido ina-
tivados por rnutações em seqüências codificantes ou regulado
ras.. Em alguns casos, como nos genes de pseudo-a-gíobina e 
pseudo-p-globina, os pseudogenes supostamente surgiram por 
duplícação gênica, seguida da introdução de várias mutações 
nas cópias extras do gene que já foi funcional Em outros ca
sos, os pseudogenes foram forrnados por um processo, chama
do de retrotransposição, que envolve a transcrição, a geração 
de uma cópia de DNA do mRNA e, finalmente, da integração 
de tais cópias de DNA ao genoma Os pseudogenes criados por 
retrotransposição não têm íntrons e sao chamados de pseudo
genes processados Eles não estão necessáiia ou usualmente 
no mesmo cromossomo (ou região cromossômica) que seu gene 
genitor. 
A maior família de genes conhecida no genoma humano é a 
chamada superfamflia de imunoglobulina, que inclui muitas 
centenas de genes envolvidos nos eventos de reconhecimento da 
superficie celular nos sistemas imune e nervoso, tais como os 
genes nos cromossomos 2, 14 e 22, que codificam as próprias 
cadeias pesada e leve de imunoglobulinas, os genes no cromos
somo 6, que constituem o complexo principal de histocompati-
bilidade, os genes nos cromossomos 7 e 14, cujos produtos cons
tituem o receptor de células T, e os genes que são expressos pri-
mariamente em tecidos neuráis, tais como os genes para molé-
culas de adesão celular ou gíicoproteinas associadas à mielina 
A estiutura e a função de muitos destes genes serão examinadas 
em detalhes no Cap 14. 
t|/Ç t|/a a2 a1 
genes tipo ce 5' Cromossomo 16 
genes tipo j3 5' 
Gy Ay V P 
Cromossomo 11 
20 40 60 kb 
Fig. 3 7 Organização cromossômica de dois grupos de genes de globina humana Os genes funcionais são indicados em vermelho Os 
pseudogenes são Indicados pelos boxes vazados {Redesenhado de Nienhuís A W.. ManiatisT j 1987J Structure and expression of giobin 
genes in erythroid cells In Stamatoyannopoulos G . Nienhuis A W , Leder P . Majerus P W |eds | t he Molecular Basis of Blood Disea
ses W B Saunders. Philadelphia, pp 28-65 ) 
18 ' O GENOMA HUMANO: ESTRUTURA E FUNÇÃO DOS GENES E CROMOSSOMOS 
FUNDAMENTOS DA EXPRESSÃO GENICA 
O fluxo de informações do gene para o polipeptideo envolve vãri-
as etapas (Fig 3.8). O infcio da transcrição de um gene está sob a 
influencia dos promotores e de outros elementos reguladores, bem 
como de proteüias especificas, conhecidas como fatores de trans-
crição, que interagem corn seqüências específicas dentro destas 
regiões. A transcrição de um gene é iniciada no "ponto de iru'cio" 
transcricional no DNA cromossômico antecedente às seqüências 
codificantes e conünua ao longo do crornossorno, indo desde vá-
rias centenas de pares de bases a rnais de um milhão de pares de 
bases, ao longo tanto de introns quanto de éxons e além do final 
das seqiiências codificantes. Após a modificação tanto das pontas 
5' quanto das pontas 3' do transcrito primário de RNA, as partes 
correspondentes a introns são lemovidas e os segmentos corres-
pondentes a éxons são reunidos. Após a recomposição do RNA, o 
mRNA resultante (agora colinear as partes codificantes do gene) 
é ttansportado do núcleo para o citoplasma, onde o mRNA é fi-
nalmente traduzido na seqüência de aminoãcidos do polipeptfdeo 
codificado. Cada uma das etapas desta via complexa está sujeita a 
erro, e as mutações que interferern nas etapas individuals foram 
implicadas em vários dismrbios genétícos (ver Caps, 5,11 e 12). 
Transcrição 
A transcríção de genes codificantes de proteinas pela RNA po~ 
limerase II (uma das várias classes de RNA polimerases) é inici
ada um pouco antes da primeira seqüência codificante no pon
to inicial de transcrição, o ponto que corresponde à ponta 5' do 
produto final de RNA (ver Figs, 3.6 e 3 8). A sintese do trans
crito primário de RNA ocone no sentido 5' para 3', enquanto 
o filamento do gene transcrito é de fato lido no sentido 3* para 
5' com relação à direção da estrutura desoxirribose fosfodiéster 
(ver Fig. 3.2). Como o RNA sintetizado corresponde tanto em 
polaridade quanto em seqiíência de bases (substituindo T por 
U) ao filamento do DNA 5' para 3', este filamento de DNA não-
transcrito às vezes é chamado de "codificante" ou "com senti-
do".. O filamento de DNA 3' para 5' transcrito é entao chama
do de "não-codificante" ou "anti-sentido".* A trancrição con-
tinua incluindo introns e éxons do gene, alem da posição no cro-
mossomo que eventualmente corresponde à ponta 3' do mRNA 
final Não sabemos se a transcrição termina em ponto final 3' 
predeterminado. 
O transcrito primário de RNA é processado pela adição de uma 
estrutura quimica "cap" na ponta 5' do RNA e uma clivagem na 
ponta 3' em um ponto especffico ao final da informação 
codificante. Esta clivagem é seguida pela adição de uma cauda 
poliA na ponta 3' do RNA. A cauda poliA parece aumentar a 
estabilidade do RNA poliadenilado resultante. O ponto de 
poliadenilação é especificado em parte pela seqüência AAUAAA 
'N T.: Esta inversão é uma causa constante de confusão por parte dos alunos 
Filamento não-transcrito 
Filamento transcrito ^n^^r3 ' | 
D 
t 
1- Transcriçao 5' CAP 
^%%,. 2- Pfocessamenío e 
''í;%l?s, recomposição do RNA 
^%^e-w Nücleo 
3. T r a n s p o r t e d ^ ! 
>' 
Citopiasma 
4 Tradução 
Ribossomos 
5.. Montagem da proteina 
..Cadeia polipeptfdica 
crescente 
A A A A 3' 
Polipeptideo completo 
Fig, 3.8 Fiuxo de informação do DNA para o RNA para a proteina de um gene hipotético com trés éxons e dois introns As etapas inciuem 
transcrição. processarnento e recornposição do RNA. transporte do nucleo para o citoplasma e tradução 
O GENOMA HUMANO: ESTRUTURA E FUNÇÃO DOS GENES E CROMOSSOMOS 1 19 
(ou uma variance disto), em geral encontrada na pacte 3' não-tra-
duzida do RNA transcrito. Estas modifícações pós-transcricionais 
ocorrem no núcíeo, assim como o processamento do RNA O 
RNA totalmente processado agora é chamado de mRNA e é trans-
portado para o citoplasma, onde ocorre a tradução (ver Fig, 3,8) 
Tradução e o Código Genético 
No citoplasma, o mRNA é traduzido em proteina peia ação de 
uma vaiiedade de moiéculas de tRNA, cada uma especifica para 
urn determinado aminoácido.Estas moléculas, cada uma com 
apenas de 70 a 100 nucleotideos de tamanho, tern a função de 
transferir os aminoácidos corretos para suas posições ao longo 
do molde de mRNA, para que sejam adicionados à cadeia poli-
peptidica crescents A sintese de proteinas ocorre nos ribosso-
mos, complexos macromoleculares feitos de rRNA (codificados 
pelos genes de rRNA 18S e 28S) e várias dilzias de proteinas 
ribossomiais (ver Fig. 3.8). 
A chave para a tradução é um codigo que relaciona aminoá-
cidos especificos a combinações de três bases adjacentes ao lon
go do mRNA. Cada conjunto de três bases constitui um códon 
especifxco para um determinado aminoácido (Quadro 3.1), Em 
teoria, são possíveis variações quase infmitas na disposição das 
bases ao longo de uma cadeia poünucleotídica, Em qualquer 
posição existem quatro possibilidades (A, T, C ou G). Assim, 
existem 4" combinações possíveis em uma seqiiência de n ba
ses . Paia três bases, há 43, ou 64, combínaçoes possíveis de trin-
cas. Estes 64 códons constituem o código genétíco. 
Como existem apenas 20 aminoácidos e 64 possíveis códons, 
a maioria dos aminoácidos é especificada por mais de um códon 
Por isto o código é dito degenerado. Por exemplo, a base na 
terceiia posição da trinca pode ser uma purina (A ou G), ou uma 
pirimidina (T ou C) ou, em alguns casos, qualquer uma das qua
tro bases, sem alterar a mensagem codífícada (ver Quadro 3 1). 
A leucina e arginina são especificadas por seis códons. Apenas 
a metionina e o triptofano são cada um deles especificado por 
um único códon. Três dos códons são chamados de códons 
finalizadores (ou sem seníido) porque designam o término da 
tradução do mRNA neste ponto. 
A tradução de um mRNA processado é sempre iniciada em 
um códon que especifica meuonina, A metionina é, portanto, o 
primeiro aminoácido codificado (amino-tenninal) de cada cadeia 
polipeptidica, embora em geral sejaremovido antes que a sinte
se da proteina esteja completa. O códon para metionina (o códon 
QUADRO 3-1 
0 Código Genético 
Primeira 
Base 
U 
C ■ 
A 
G 
Abrevíações 
aía (A) 
arg(R) 
asn (N) 
asp (D) 
cis (C) 
gin (Q) 
glu (E) 
gli (G) 
his (H) 
tie (Í) 
U 
uuu 
ÜUC 
UÜA 
UUG 
cuu 
cue 
CÜA 
CUG 
AUU 
AUC 
AUA 
AUG 
GUU 
GUC 
GUA 
GUG 
fen 
fen 
ieu 
leu 
leu 
ieu 
leu 
leu 
iie 
iie 
iie 
met 
val 
vaí 
val 
val 
dos aminoácidos: 
Oulra abreviação: 
fim 
alamna 
arginina 
asparagina 
ácido aspártico 
cisteína 
gluíamina 
ácido glutâmico 
glicina 
hisüdína 
isoleucina 
códon finalizador 
C 
ucu 
ucc 
UCA 
UCG 
ecu 
CCC 
CCA 
CCG 
ACU 
ACC 
ACA 
ACG 
GCU 
GCC 
GCA 
GCG 
Segunda Base 
ser 
ser 
ser 
ser 
pro 
pro 
pro 
pro 
tre 
tre 
tre 
tre 
ala 
ala 
ala 
ala 
leu (L) 
lis (K) 
met(M) 
fem(F) 
pro (P) 
ser(S) 
tre (T) 
trp(W) 
Ür(Y) 
val (V) 
A 
UAU 
UAC 
UAA 
UAG 
CAU 
CAC 
CAA 
CAG 
AAU 
AAC 
AAA 
AAG 
GAU 
GAC 
GAA 
GAG 
i 
tir 
tir 
fim 
fim 
his 
his 
gin 
gin 
asn 
asn 
us 
üs 
asp 
asp 
glu 
glu 
leucina 
lisina 
metionina 
fenilalanma 
proiina 
senna 
treonina 
triptofano 
tirosina 
valina 
G 
UGU 
UGC 
UGA 
UGG 
CGU 
CGC 
CGA 
CGG 
AGU 
AGC 
AGA 
AGG 
GGU 
GGC 
GGA 
GGG 
cis 
cis 
fim 
trp 
arg 
arg 
arg 
arg 
ser 
ser 
arg 
arg 
gu 
gH 
gli 
gli 
Terceira 
Base 
U 
C 
A 
G 
U 
C 
A 
G 
U 
C 
A 
G 
U 
c 
A 
G 
Os códons são mostrados em termos do mRNA, que são complementares aos códons cotrespondenies no DNA 
20 ' O GENOMA HUMANO: ESTRUTURA £ FUNÇÃO DOS GENES E CROMOSSOMOS 
iniciador, AUG) estabelece a matriz de leitura do mRNA. Cada 
códon subseqiiente é lido, por sua vez, para prever a seqüência 
de aminoácidos da proteina. 
As ligações moleculares entre os codons e os aminoácidos são 
as moléculas especificas de tRNA. Urn determinado sitio de cada 
tRNA forma urn anticódon com ires bases que é complemeníar 
a um códon específíco no mRNA.. A ligação eníre o códon e o 
anticódon coloca o aminoácido apropriado na posição seguinte 
no ribossomo para a Hgação pela formação de uma ligação 
pepíídica com a ponta carboxila e a cadeía polipeptfdica crescen-
te. O ribossomo então desliza ao longo do mRNA a cada três 
bases, alinhando o códon seguinte para o reconhecimento por 
outro tRNA com o aminoácido seguinte. Assim, as proteínas são 
sintetizadas a partir de seu terminal amino até o terminal 
carboxila, que corresponde à tradução do mRNA no sentido 5' 
para 3 V 
Como mencionado antes, a tradução termina quando um 
códon fmalizador (UGA, UAA ou UAG) é encontrado na mes-
ma matriz de leitura que o códon iniciador. (Os códons 
fmalizadores em uma das matiizes de leitura não sao lidos e, 
portanto, não têm efeito na tradução,) O polipeptídeo completo 
é então liberado do ribossomo, que se torna disponivel para co-
meçar a sintese de outra proteina. 
Processamento Pós-traducional 
Muitas proteínas sofrem amplas modificações pós-traducionais. 
A cadeia polipeptidica que é o produto primãrio da tradução é 
dobrada e associada em uma estrutura tridimensional especifica 
que é determinada pela própria seqüência de aminoácidos. Duas 
ou rnais cadeias polipeptidicas, produtos do mesmo gene ou de 
genes diferentes, podem se combinar para fòrmar um unico com-
plexo proteico final. Por exemplo, duas cadeias de a-globina e 
duas cadeias de (3-globina associam-se de modo não convalente 
para forraar a rnolécula tetramérica de hemoglobina a2{3r Os 
produtos proteicos também podem ser modificados quimicamen-
te por, por exemplo, adição de fosfato ou carboidratos em sftios 
especificos. Outras modificações podem envolver a clivagem da 
proteina, seja para remover seqüências amino-terminais especi-
ficas após terem direcionado uma proteina para o seu local cor-
reto dentro da célula (p. ex,, proteinas que funcionam dentro do 
núcleo ou mitocôndrias) ou para dividir a molécula em cadeias 
polipeptidicas menores. Por exemplo, as duas cadeias que cons-
tituem a molécula de insulina, uma com 21 e a outra com 30 
aminoácidos, originaímente são paite de uma tradução primária 
com 82 aminoácidos, charnada de pró-insulina, 
A Expressão Gênica em Açao: O Gene de 
Beta-Globina 
O fluxo de informações destacado nas seções anteriores pode ser 
mais bem apreciado com relação a um gene particularrnente bem 
estudado, o gene de (3-globina, A cadeia de p-globina é um 
polipeptideo com 146 aminoácidos, codifícada por um gene que 
ocupa aproximadamente 1,6 kb no braço cuito do cromossomo 
11. O gene tem três éxons e dois introns (ver Fig. 3.6). 0 gene 
de p-globina, bem como outros genes no grupo de (3-globina (ver 
Fig. 3.7), é transcrito em uma direçao do cenrrômero para o telô-
mero. Esta orientação, eníretanto, é diferente para outros genes 
no genoma e depende de qual filamento da dupía hélice cromos-
sôrnica é o filamento codificante de um determinado gene. 
As seqüências de DNA necessárias para uma iniciação preci-
sa da transcrição do gene de [3-globina estão situadas no promo-
tor em cerca de 200 pares de bases antecedentes ao ponto de ini-
cio da transcrição. A seqüencia de düpla hélice de DNA desta 
região do gene de p-globina, a seqüência correspondente de RNA 
e a seqüência traduzida dos 10 primeiros aminoácidos são rnos-
tradas na Fig. 3.9 para ilustrar as relações entre estes três m'veis 
de informação. Como mencionado antes, é o filamento 3' para 
5' do DNA que serve como molde e é transcrito, mas é o 
filamento 5' para 3' do DNA que corresponde mais diretamente 
à seqüência 5' para 3' do mRNA (e, de fato, é idêntica a ele, 
exceto por U substituindo T). Devido à sua correspondência, o 
filamento 5' para 3' do DNA de um gene (o filamento que não é 
transcrito) é o filamentoem geral relatado na Hteratura cientifi-
ca ou nos bancos de dados. 
De acordo com esta convenção, a seqüência completa de apro
ximadamente 2,0 kb do cromossomo 11 que inclui o gene de (3-
globina é mostrada na Fig .3.10. (Vale a pena refletir que esta pá-
gina de nucleotideos representa apenas 0,000067% da seqüência 
de todo o genoma humano). Dentro destes 2,0 kb está contida a 
maioria dos elementos de seqüência necessários para codificar e 
regular a expressão deste gene, mas não todos, Na Fig 3 10 são 
indicadas muitas das características importantes do gene de p-
globina, incluindo os elementos de seqüência promotora conser-
vados, os limites de introns e éxons, os sftios de corte do RNA, os 
códons iniciadores e finalizadores e o sinal de poliadenilação, to-
dos os quais são conhecidos como estando mutados em vários 
defeitos herdados do gene de (3-globina (ver Cap. 11). 
iNfCIODATRANSCRIÇÂO 
O promotor de fJ-globina, como muitos outros promotores gê-
nicos, consiste em uma série de elementos funcionais relati-
DNA TATTQCTTAOATTTGCTTOTGACACAACTGTQTTCACTAGCAACCTDAAACAGACAOCATQGTGCACCTBACTCCTGAGGAGAAQTCTQCC 3' ATAACQAATGTAAACQAAGACTGTQTTGACACAAGTGATCGTTGGAGTTTGTCTQTQGTACCACGTGGACTaAGQACTCCTCTTGAGACGG s 
t 
Infcio 
Transcrição I Matriz de leitura 
i—i!—is—ii—ir mRNA s ACAUUUGCUyCUGACACAACUGÜGUUCACÜAGCAACCUCAAACAGACACCAUGGUGCACCUGACUCCUGAaGAGAAGUCUGCC 
Tradução 
\ 
p-giobina . ■ V n l H i o L o u T h i P i o G l u G l u L y B S e t A f B 
Fig. 3.9 Estrutura da seqüência de nucleotfdeos da ponta 5' do gene humano de {3-globina no braço curto do cromossomo 11 A trans-
crição do filamento 3' para 5' (inferior) começa no ponto indicado para produzir o mRNA de p-globina A matriz de Seitura traducional é 
determinada pelo códon iniciador AUG (***); os côdons subseqüentes que especificam aminoácidos são indicados em vermelho As 
outras duas matrizes potenciais não são usadas 
O GENOMA HUMANO: ES1RÜTURA E FUNÇÃO DOS GENES E CROMOSSOMOS ! / 23 / 
cromossomos hurnanos. Como vimos na seção anterior, cada) 
crornossomo é tido como consistindo em uma única dupla he-
lice continua de DNA. ísto é, cada crornossomo no núcleo é uma 
longa molêcülET&íHÍámentar e linear de DNA. Os cromossomos 
não são duplas helices nuas de DNA. A molécula de DNA de 
um crornossomo existe como um complexo, com uma farm'lia 
de proteinas crornossômicas básicas chamadas histonas e com 
um grupo heterogêneo de proteinas não-histônicas ácidas que 
não são tão bem caiacterizadas, mas que parecem ser cruciais 
para o estabelecimento de um ambiente apropriado para garantir 
o comportamento normal dos cromossomos e a expressão apro-
priada dos genes. Em conjunto, este complexo de DNA e pro
teinas, é chamado de cromatina. 
Existem cinco tipos principais de histonas que tern um papel 
crucial no acondicionamento da fibra de cromatina. Duas cópias 
de cada uma das quatro histonas cerne H2A, H2B, H3 e H4 cons
tituent um octâmero, ao redor do qual se enrola um segmento da 
dupla hélice de DNA (Fig. 3.11), Cerca de 140 pares de base do 
DNA estão associados a cada cerne de histona, dando quase duas 
voltas ao redor do octâmero. Depois de um curto segmento (de 
20 a 60 pares de bases) "espaçador" de DNA, forma-se um novo 
complexo de DNA, e assim por diante, dando à cromatina um 
aspecto de contas em um colar. Cada complexo de DNA com 
histonas ceme é chamado de um nucleossomo, que é a unidade 
estrutural básica da cromatina A quinta histona, a HI, parece 
ligar-se ao DNA em seguida a cada nucleossomo, na região 
espaçadora intemucleossômica, A quantidade de DNA associa-
da ao cerne de nucleossomo, juntamente com a região espaçadora, 
tern cerca de 200 pares de bases. 
Durante o ciclo celular, como vimos no Cap. 2, os cromosso
mos passam por etapas ordenadas de condensação e desconden-
sação (ver Fig, 2,5). No núcleo inteifásico, os cromossomos e a 
cromatina estão bem descondensados em relação ao estado alta-
mente condensado da cromatina na metáfase. Entretanto, mes-
mo nos cromossomos interfásicos, o DNA na cromatina está 
substancialmente mais condensado do que estaria como uma 
dupla hélice nativa, livre de proteinas. 
Os longos filamentos de nucleossomos estão eles próprios 
mais compactados em uma estrutura secundária helicoidal de 
cromatina do que parece ao microscópio etetrônico, como uma 
fibra espessa de 30 nm (aproximadamente três vezes mais gros-
sa que a fibra nucleossômica) (ver Fig, 3.11), Esta fibra 
"solenóide" (do grego solenoeides, "em forma de tubo") cilin-
drica parece ser a unidade fundamental da organização da cro
matina. Os solenóides são compactados em alças ou dominios 
ligados a intervalos de cerca de 100 kb a um arcabouço não-
histônico de proteina ou matriz Tem-se especulado que as al-
ças são, de fato, unidades funcionais de replicação do DNA ou 
de transcrição gênica, ou ambos, e que os pontos de ligação de 
cada alça são fixados ao longo do DNA cromossômico. Assim, 
um nivel de controle da expressão gênica pode depender de 
como o DNA e os genes são acondicionados nos cromossomos 
e de sua associação a proteinas da cromatina no processo de 
acondicionamento. 
Os váiios niveis hierárquicos de acondicionamento vistos em 
um crornossomo interfásico são ilustrados esquematicamente 
naFig. 3.11. A enorme quantidade de DNA embalada em um 
crornossomo pode ser apreciada quando os cromossomos sao 
tratados para remover a maioria das proteinas da cromatina a 
fim de se observar o arcabouço proteico (Fig. 3.12). Quando o 
DNA é liberado pelos cromossomos tratados deste modo, Ion-
gas alças de DNA podem ser vistas, e o arcabouço residual pode 
ser visto reproduzindo uma estrutura de um tipico crornosso
mo metafásico, 
2 n m :10nm ±30 nm 
Cada alça contc-m 
100.000 pb GO DNA 
Dupla héíice Fibra de nucleossomo Solenóide 
("contas de um colar"} 
Fig.. 3,11 Níveis hierárquicos de acondicionamento da cromatina em um crornossomo humano 
Nucleo 
iníerfásico 
22 l 0 GENOMA HUMANO: ESTRUTURA E FUNÇÃO DOS GENES E CROMOSSOMOS 
varnente curtos que sao tidos como interagindo com protef-
nas especificas (em geral chamadas de fatores de transcri-
ção) que regulam a transcrição, Jncluíndo, no caso dos genes 
de globina, as proteinas que restringem a expressão destes 
genes a células eritróides, as células nas quais é produzida a 
hernoglobina Uma seqüência promotora importante é o 
"TATA boxe", uma região conservada rica em adeninas e 
timinas que está cerca de 25 a 30 pares de bases antecedendo 
o ponto de inicio da ttanscrição (ver Figs. 3.6e.3.10) OTATA 
boxe parece ser importante para a determinação da posição 
do inicio da transcrição, que no gene de (3-globina está apro-
ximadarnente a 50 pares de bases antecedentes ao ponto de 
inicio da tradução (ver Fig. 3.9). Assim, neste gene existern 
cerca de 50 pares de bases de seqüência que são transcritos 
mas não são traduzidos.. Em outros genes, esta região 5' trans-
crita mas não traduzida (chamada de 5' UTR) pode ser muito 
rnaior e, de fato, pode ser interrompida por um ou mais s'n-
trons. Uma segunda região conservada, o chamado CAT boxe 
(na verdade, CCAAT), está antecedente há algumas dezenas 
de pares de bases (ver Fig. 3.10) Tanto as mutações experi-
mentalmente induzidas quanto aquelas de ocorrencia natural 
em um destes elementos de seqüência, bem como em outras 
seqüências reguladoras mais antecedentes, levam a uma in-
tensa redução no nível de transcrição, demonstrando assim a 
Ímportância destes elementos para a expressão normal do 
gene. Muitas mutações nestes elementos reguladores foram 
identificadas em pacientes com o disturbio j3-talassernia (ver 
Cap.11) 
Nem todos os promotores gênicos contêm os dois elementos 
especificos descritos Em particular, os genes que são expressos 
constitutivarnente na maioria ou em todos os tecidos (chamados 
de "genes de manutenção" [housekeepinggenes}) em geral não 
tern o CAT e TATA boxes, que são mais tipicos de genes 
histoespecificos. Os promotores de muitos genes de rnanutençao 
em geral contêm uma alta proporção de citosinas e guaninas em 
relação ao DNA circundante (ver o promoter do gene de hipo-
xantina fosforibosiltransferase na Fig 3 6) Tais promotores ri-
cos em CG em geral estão situados nas regiões do genoma cha
madas de ilhas de CG (ou de CpG), assim chamadas em função 
da alta concentração do dinucleotideo 5'-CG-3' que fica fora da 
região cromossôrnica mais geral rica em AT. Algumas das se-
qüências ricas em CG encontradas nestes promotores são tídas 
como servindo como pontos de ligação para fatores especificos 
de transcrição 
Em adição às seqüências que constituern o próprio promoter, 
existem outros elementos de seqüência que podem alterar muito 
a eficiência da transcrição. As mais bem caracterizadas destas 
seqüências "ativadoras" são chamadas de acentuadores 
(enhancers) Os acentuadores são elementos de seqüência que 
podem agir à distância (era geral vários kb) de um gene para 
estimular a transcrição. Ao contrário dos promotores, os 
acentuadores são independentes de posição e orientação e podem 
estar localizados a 5' ou a 3' do ponto de inicio da transcrição. 
Os elementos acentuadores funcionam apenas em alguns tipos 
de células e, portanto, parecem estar envolvidos no estabeleci-
mento da especificidade tissular e/ou o nivel de expressão de 
muitos genes, em conjunto com um ou mais fatores de transcri-
ção. No caso do gene de (3-globina, vários acentuadores 
histoespecificos estão piesentes dentro do próprío gene e em suas 
regiões flanqueadoras. A interação de acentuadores com deter-
rninadas proteinas leva a niveis aumentados de transcrição. 
A expressão normal do gene de [3-globina durante o desen-
volvimento também requer uma seqüência mais distante, chama
da de região controladora de locus (LCR) e situada anteceden
do o gene de e-globina (ver Fig. 3.7), que é necessáiia para a 
expressão apropriada em alto nivel. Como esperado, as mutações 
que perturbam ou deletam as seqüências acentuadoras ou LCR 
interferem ou impedem a expressão do gene de (3-globina (ver 
Cap. 11). 
RECOMPOSIÇÃO DO RNA 
O transcrito primário de RNA do gene de [3-globina contém 
dois éxons, cerca de 100 e 850 pares de base de tamanho, que 
precisam ser reunidos O processo é exato e muitíssimo efici-
ente Noventa e cinco por cento dos transcritos de (3-globina 
são tidos como sendo recompostos precisarnente para gerar 
um mRNA funcional de globina. As reações de recomposi-
ção são guiadas por seqüências especificas tanto nas pontas 
5' quanto nas pontas 3' dos introns, A seqliência 5' consiste 
em nove nucleotideos, dos quais dois (o dinucleotideo GT, 
situado no fntron imediatamente adjacente ao ponto de corte) 
são virtualmente invariantes entre os pontos de corte em ge
nes diferentes (ver Fig. 3 10). A seqüência 3' consiste em cerca 
de uma duzia de nucleotideos, dos quais, mais uma vez, dois, 
os AG situados imediatamente a 5' do Hmite íntron/éxon, são 
obrigatórios para a recomposição normal- Os próprios pon
tos de corte não estão relacionados com a matriz de leitura do 
mRNA em particular. Em alguns casos, como no do fntron 1 
do gene de (3-globina, o fntron corta um códon especifico (ver 
Fig. 3.10). 
A Ímportância médica da recomposição do RNA é ílustrada 
pelo fato de que as mutações dentro das seqüências conservadas 
nos limites íntron/éxon comumente piejudicam a recomposição 
do RNA, com a redução concomitante da quantidade de rnRNA 
final normal de [3-globina; as mutações nos dinucleotfdeos GT 
ou AG mencionadas antes invariavelmente eliminam a remoção 
normal do fntron contendo a mutação. Várias mutações de sítio 
de corte, identificadas em pacientes com [3-talassemia, serão 
discutidas em detalhes no Cap.. 11.. 
POUADENiLAÇÃO 
O mRNA final de (3-globina contém aproximadamente 130 pa
res de bases do material de 3' não-traduzido (3' UTR) entre o 
códon fmalizador e o local da cauda poliA (ver Fig. 3.10). Corao 
em outros genes, a clivagem da ponta 3' do mRNA e a adição da 
cauda poliA é controlada, pelo menos em parte, por uma seqüên-
cia AAUAAA de cerca de 20 pares de bases antes do sitio de 
poliadenilação. As mutações neste sinal de poliadenilação nos 
pacientes com (3-talassemia (bem como rautações no sinal de 
poliadenilação correspondente no gene de a-globina nos paci
entes com a-talassemia) documentam a importância deste sinal 
para a clivagem apropriada em 3* e a poíiadenilação (ver Cap.. 
11) A região 3' não-traduzida de alguns genes pode ser bem 
longa, de até vários kb. Outros genes têm vários sítios de 
poliadenilação altemativa, e a seleção entre eles pode influenci-
ar a estabilidade do mRNA resultante e, portanto, o estado de 
equilfbrio de cada mRNA 
ESTRUTURA DOS 
CROMOSSOMOS HUMANOS 
A composição de genes no genoma humano, bem como os de-
terrninantes de sua expressão, é especificada no DNA dos 46 
O GENOMA HUMANO: ESTRUIURA E FUNÇÃO DOS GENES E CROMOSSOMOS ! ■ 23/ 
cromossomos humanos. Como virnos na seção anterior, cada' 
cromossomo é tidocqmqcormstindo em uma ánicadupha he-
lice continua de DNÀÃsto é, cada cromossomo no núcleo é uma 
ionga mõlecüIF&íiÍíàmentar e linear de DNA. Os cromossomos 
não são duplas helices nuas de DNA. A molécula de DNA de 
um cromossomo existe como um complexo, com uma famfiia 
de proteínas cromossômicas básicas chamadas histonas e com 
um grupo heterogêneo de protefnas não-histônicas ácidas que 
não são tão bem caracterizadas, mas que parecem ser cruciais 
para o estabeíecimento de um ambiente apropriado para garantir 
o comportamento normal dos cromossomos e a expressão apro-
priada dos genes Em conjunto, este complexo de DNA e pro-
teinas, é chamado de cromatina,. 
Existem cinco iipos principais de histonas que têm um papel 
crucial no acondicionamento da fibra de cromatina, Duas cópias 
de cada uma das quatro histonas ceme H2 A, H2B, H3 e H4 cons
tituent um octâmero, ao redor do qual se enrola um segmento da 
duplahélicedeDNA(Fig. 3.11). Cerca de 140 pares de base do 
DNA estão associados a cada cerne de histona, dando quase duas 
voltas ao redor do octâmero. Depois de um curto segmento (de 
20 a 60 pares de bases) "espaçador" de DNA, forma-se um novo 
complexo de DNA, e assim por diante, dando à cromatina um 
aspecto de contas em um colar. Cada complexo de DNA com 
histonas cerne é chamado de um nucleossomo, que é a unidade 
estrutuial básica da cromatina, A quinta histona, a HI, parece 
ligar-se ao DNA em seguida a cada nucleossomo, na região 
espaçadora inteniucleossômica. A quantidade de DNA associa-
da ao ceme de nucleossomo, juntamente com a região espaçadora, 
tern cerca de 200 pares de bases. 
Durante o ciclo celuiar, como vimos no Cap, 2, os cromosso
mos passam por etapas ordenadas de condensação e desconden-
saçâo (verFig. 2.5). No núcleo interfásico, os cromossomos e a 
cromatina estão bem descondensados em relação ao estado alta-
mente condensado da cromatina na metáfase. Entretanto, mes-
mo nos cromossomos interfásicos, o DNA na cromatina esta" 
substancialmente mais condensado do que estaria como uma 
dupla hélice nativa, livre de protefnas, 
Os longos filamentos de nucleossomos estão eles próprios 
mais compactados em uma estrutura secundária heiicoidal de 
cromatina do que parece ao microscópio eíetrônico, como uma 
fibra espessa de 30 nm (aproximadamente três vezes mais gros-
sa que a fibra nucleossômica) (ver Fig. 3.11). Esta fibra 
"solenoide" (do grego solenoeides, "em forma de tubo") cilin-
drica parece set a unidade fundamental da organização da cro
matina. Os solenóides são compactados em alças ou dominios 
ligados a intervalos de cerca de 100 kb a um arcabouço não-
histônico de proteína ou matiiz. Tem-se especulado que as al-
ças são, de fato, unidades funcionais de replicaçãodo DNA ou 
de transcrição gênica, ou ambos, e que os pontos de íigação de 
cada aíça são fixados ao longo do DNA cromossômico. Assim, 
um nivel de controle da expressão gênica pode depender de 
como o DNA e os genes são acondicionados nos cromossomos 
e de sua associação a protefnas da cromatina no processo de 
acondicionamento. 
Os vários níveis hierárquicos de acondicionamento vistos em 
um cromossomo inteifásico são ilustrados esquematicamente 
na Fig. 3.11. A enorme quantidade de DNA embalada em um 
cromossomo pode ser apreciada quando os cromossomos são 
tratados para remover a maioria das proteinas da cromatina a 
fim de se observai' o aicabouco proteico (Fig, 3,12), Quando o 
DNA é íiberado pelos cromossomos tratados deste modo, Ion-
gas alças de DNA podem ser vistas, e o arcabouço residual pode 
ser visto reproduzindo uma estrutura de um tipico cromosso
mo metafásico 
2 n m 10 nm :30 nm 
Dupia hélice 
Cada alça conlérr 
± 100 000pbdeDNA 
Fibra de nucleossomo 
("contas de um colar") 
Solenoide Nücleo 
interfásico 
Fig 3.11 Niveis hierátquicos de acondicionamento da cromatina ern um cromossomo humano 
24 1 O GENOMA HUMANO: ESTRUTURA E FUNÇÃO DOS GENES E CROMOSSOMOS 
-•at •*■% 
Fig 3.12 Micrografia eletrônica de um cromossomo metafásico sem proteína. mostrando o arcabouço cromossômico residual e as alças 
do DNA As fibras individuals do DNA podem ser mais bem visualizadas nas margens das alças de DNA Barra = 2u. (De Paulson | R -
Laemmli U K |1977| The structure of histone-depleted metaphase chromosomes Cell 3 2:817-828 Reimpressocom permissaodosau-
tores e Cell Press ) 
O GENOMA HUMANO: ESTRUTURA E FUNÇÃO DOS GENES E CROMOSSOMOS ! 25 
O Cromossomo Mitocondrial 
Um subgrupo pequeno mas importante de genes codificados 
no genoma humano reside nas mitocôndrias do citoplasma, Os 
genes raitocondriais exibem herança exclusivamente mater-
na (ver Cap.. 5). As células humanas têm centenas de mito-
côndrias, cada uma delas contendo várias cópias de uma pe-
quena molécuia circular, o cromossomo mitocondrial, A mo-
lécula de DNA mitocondrial tern apenas 16 kb de tamanho 
(menos de 0,03% do menor cromossomo nuclear!) e codifica 
apenas algumas dezenas de genes Embora os produtos des-
tes genes funcionern nas mitocôndrias, deve-se destacar que 
a grande rnaioria das proteinas encontradas nas mitocôndrias 
são, de fato, os produtos de genes nucleares. As mutações nos 
genes mitocondriais foram demonstradas em vários distúrbi-
os herdados maternamente, bem como distúrbios esporádicos 
(ver Cap 12), 
ORGANIZAÇÂO DO GENOMA 
HUMANO 
As regiões do genoma com caractensticas similares ou organi-
zação, replicação e expressão não são dispostas aleatoriamente, 
mas sim tendem a ser agrupadas. Esta organização funcional do 
genoma está muito bem correlacionada com sua organização 
estrutural, como revelado peío bandeamento dos cromossomos 
metafásicos (introduzido no Cap. 2 e discutido em detalhes no 
Cap. 9). O significado geral desta organização funcionaí é que 
os cromossomos não são uma coleção aleatória de tipos diferen-
tes de genes e outras seqüências de DNA. Algumas regiões cro-
mossômicas, ou mesmo cromossomos inteiros, são ricas em con-
teúdo gênico, enquanto outras não são. Alguns tipos de seqüên-
cias são característicos de diferentes marcos físicos de cromos-
somos humanos. As conseqüências clínicas das anomalias de 
estrutura do genoma refletem a natureza específica dos genes e 
as seqüências envolvidas. Assim, as anomaíias dos cromossomos 
ricos em genes ou regiões cromossômicas tendem a ser muito 
mais graves cíixücamente do que os defeitos similares envolvendo 
partes do genoma pobres em genes. 
A medida que o Projeto do Genoma Humano vai ficando 
quase completo, toma-se aparente que a organização do DNA 
no genoma humano é muito mais complexa do que foi anted-
pado, como ilustra a Fig„ 3.13 para a região totalmente carac-
terizada do cromossomo 17 na vizinhança do gene BRCAl, 
cujas mutações são responsáveis por algumas formas de can
cer de mama familiar (ver Cap. 16). Do DNA genôrnico, me
nos de 10% codifica genes. Apenas de metade a três quartos 
do tamanho linear total do genoma consiste no chamado DNA 
de cópia iinica ou DNA único, isto é, DNA cuja seqüência de 
nucleotídeos é representada apenas uma vez (ou, no máximo, 
algumas vezes) por genoma hapíóide. 0 resto do genoma con
siste em várias classes de DNA repetitivo e inciui DNA cuja 
seqüência de nucleotídeos é repetida, seja perfeitamente ou com 
alguma variação, de centenas a milhares de vezes no genoma. 
Embora a rnaioria (mas nao todos) dos 50.000 genes estima-
dos no genoma esteja representada como DNA de cópia única, 
as seqüências na fração de DNA repetitivo contnbuem para 
manter a estrutura cromossômica. 
Seqüências de DNA de Cópia Única 
Embora o DNA de cópia única constitua a maior parte do DNA 
no genoma, grande parte de sua função permanece um mistério, 
pois, como mencionado, as seqiiências que de fato codificam 
proteinas (a parte codificante dos genes) constituem apenas uma 
pequena porção de todas as cópias únicas do DNA. Longos tre-
chos de seqüências de DNA unico (> 25 kb) são bem raros no 
genoma. A rnaioria do DNA de cópia única é encontrada em 
pequenos trechos (vários kb ou menos), intercalados com mem-
bros de várias familias de DNA repetitivo (ver Fig. 3.13). 
Genes: 
Éxons; 1 
= 0 * 
5-7 
BRCA1 
11 
4 ^ 
pseudogene 
* 
13 - 24 ■ 
Rho7 VAT1 IFP35 
e<—1 1—*»6 / 
1 1111. =»t# 
pseudogene 
Repeíição 
de DNA: 
-BB-n»-*-w«i-m>Mw-m»-t>-9m«mii HBH-^K-»^»H44H<h^^l(Mh^WIHHM«M»HH»HHIMHMtH-IH»HM (™*«-f4-(H H~ 
10 kb 
Fig 3.13 Organização seqüenciaí da região do genoma humano próxima ao gene BRCAl. que é responsável por alguns casos de cancer 
de mama familiar deinicio precoce São encontrados quatro genes e dois pseudogenes nesta seqüência de 117 kb do cromossomo 17, 
e suas locaiizações e estruturas são indicadas acima do cromossomo. Quase metade da seqüência consiste ern vários elementos repe-
titivos intercalados, incluindo 170 cópias das repetições AÍK e 8 cópias das repetições LI que são indicadas abaixo do cromossomo 
BRCAl contém um promotor rico em GC, com vários sftios de ligação de fatores de transcriçào específicos O gene RH07 codifica um 
membro da famfiia de proteinas de ligação de GTP VATi codifica uma protei'na de rnembrana encontrada nas vesfculas sinápticas Tan to 
RH07quanto VATi também tern promotores ricos em GC.1FP35 codifica uma protei'na cuja expressãopodeserinduzídaporintérferon 
(Baseada em Smith T M , LeeM K , Szabo C. 1 etal jl996| Complete genomic sequence and analysis of 117 kb human DNA containing 
the gene BRCAl Genome Research 6:1029- i049 } 
26 ' O GENOMA HUMANO: ESTRUTURA E FUNÇÃO DOS GENES E CROMOSSOMOS 
Famiiias de DNA Repetitivo 
Váiias categorias diferentes de DNA repetitivo são reconhe-
cidas. Uma caracten'stica distinta iStil é se as seqüências re-
petídas ("repetições") estão agrupadas em um ou alguns pou-
cos locais ou se estão dispersas pelo genoma, intercaladas 
com seqüências de cópia única ao longo do cromossomo, As 
seqiiências repetidas agrupadas constituem de 10% a 15% do 
genoma e consistem em arranjos de várias repetições curtas 
organizadas em tandem. Os diferentes tipos de tais repetições 
em tandem são coletivamente chamados de DNA satéíite, 
assim denominados porque muitas das famiiias de repetições 
originais em tandem podiam ser putificadas por densidade de 
centrifugação do lesto do genoma como frações "satélite" do 
DNA. 
As famiiias de DNA satélite variam com relação ao seu lo
cal no genoma, ao tamanho total da disposição em tandem e 
ao comprimento das unidades repetidas constituintes do agru-
pamento. Em geral, os arranjos-satélites podem ter vários mi-
Ihoes de pares de bases ou rnais de tamanho e constituir até 
vários por cento do conteúdode DNA de um cromossomo 
humano. Muitas seqüências-satélites são importantes como 
ferramentas moleculares que revolucionaram a análise cito-
genética clínica em função de sua relativa facilidade de de-
tecção (ver Cap. 9). Algumas seqüências-satélites humanas 
são baseadas nas repetições (com alguma variação) de uma 
seqüência cuita, tal como um penianucleotj'deo. Longas dis-
posiçoes de tais repetições são encontradas nas regiões 
heterocromáticas nos braços longos proximais dos cromosso-
mos 1, 9 e 16 e em quase todo o braço longo do cromossomo 
Y (ver Cap, 9). Outros DNAs satélites são baseados em repe-
tições um pouco mais longas. Por exemplo, a família a-saté-
lite de DNA é composta de disposições em tandem de cópias 
diferentes de uma unidade de aproximadamente 171 pares de 
bases, encontrada na região centromérica de cada cromosso
mo humano. Esta familia de repetições é tida como tendo um 
papel na função do centrômero, garantindo a segregação cro-
mossõmica apropriada na raitose e na meiose. 
Além do DNA satélite, outra classe imporiante de DNA 
repetitivo no genoma consiste em seqüências relacionadas 
que são dispersas pelo genoma em vez de localizadas (ver 
Fig. 3.13). Embora muitas famiiias de DNA pequeno aten-
dam a esta descrição geral, duas em particular garantem a 
discussão porque juntas constituem uma porção significati-
va do genoma e porque foram irnplicadas em doenças gené-
ticas. Os mais bem estudados elementos repetitivos disper-
sos pertencem à chamada familia Alu. Os membros desta 
familia tern cerca de 300 pares de bases de tamanho e são 
reconhecivelmente relacionados uns aos outros, embora não 
sejara iguais em seqüência No total, existem cerca de 
500 000 membros da familia Alu no genoma, constituindo 
pelo menos váríos por cento do DNA humano. Em algumas 
regiões do genoma, entretanto, incluindo aquela próxima ao 
gene BRCA1 como visto na Fig 3,13, eles constituem uma 
porcentagera muito mais alta do DNA Uma segunda fami
lia importante de DNA repetitivo disperse é chamada de 
familia LI Os elementos LI são seqüências longas e repe-
titivas (de até 6 kb de tamanho) que são encontrados em cerca 
de 100 000 cópias por genoma. Eles são abundantes em al
gumas regiões do genoma, mas relativamente esparsos em 
outras 
As famiiias de repetições dispersas pelo genoma sao claramen-
te de importância médica. Tanto as seqüências Alu quanto as LI 
fbram irnplicadas como a causa de mutações em doenças here-
dítárias pelo processo de retrotransposição, introduzido em uma 
seção anterior. Pelo menos algumas cópias das famiiias LI e Alu 
ainda são transposecionalmente ativas e geram cópias de si mes-
mas que podem se integral' em outras paries do genoma, ocasio-
nalmente causando inativação insercionaí de um gene importante 
em termos medicos, A freqüência dos eventos de retrotransposi-
ção que causam doenças genéticas em seres humanos atualmen-
te é desconhecida, mas eles podem contribuir com até 1 em 500 
mutações. Além disso, os eventos de recombinação aberrante 
entre cópias diferentes de repetições dispersas também podem 
ser uma causa de mutação em algumas doenças genéticas (ver 
Cap. 6). 
VAR1AÇÃO NA EXPRESSÃO GÊNSCA E SUA 
RELEVANCIA PARA A MEDÍCINA 
A expressão regulada dos cerca de 50.000 genes codificados 
nos cromossomos humanos envolve um conjunto de inter-re-
lações complexas entre m'veis diferentes de controle, incluin
do a dosagem gênica apropriada (controlada por mecanismos 
de replicação cromossômica e segregação), a estrutura gênica 
e, fmalmente, a transcrição, a estabilidade do mRNA, a tradu-
ção, o processamento de proteinas e a degradação de proteinas, 
Para alguns genes, as flutuações no m'vel de produto gênico 
funcional, devidas ou à variação herdada na estrutura de um 
deterrninado gene ou às mudanças induzidas por fatores não-
genéticos tais como dieta ou o ambiente, são relativamente de 
pouca importância. Para outros genes, as rnudanças no m'vel de 
expressão podem ter conseqüências clínicas, refletindo a im-
portância destes produtos gênicos em determinadas vias bioíó-
gicas. A natureza da variação herdada na estrutura e na função 
dos cromossomos e genes, bem como a influência desta varia-
ção na expressão de caracterisiicas específicas, é a própria es-
sência da genética médica e molecular e será tratada nos capi-
tulos subseqiientes. 
Referênàas Gerais 
Abel T, Maniatis T (1994) .Mechanisms of eukaryotic gene regula
tion In Stamatoyannopoulos G, Nienhuis AW, Majerus PW, 
Varmus H, (eils) The Molecular Basis of Blood Diseases WB 
Saunders, Philadelphia, pp .33-70. 
Alberts B, Bray D, Lewis J, et ai, (1994) Molecular Biology of the 
Cell, 3rd ed Garland Publishing, New York 
Bernardi G (1995) The human genome, organization, and evolu
tionary history. Ann Rev Genet 29:445-476 
Lewin B (2000) Genes VII, 7th ed Oxford University Press, Ox
ford, England. 
Semenza G (1999) Transcription Factors and Human Disease 0 \ -
ford University Press, New York 
Singer M, Berg P {1997) Exploring Genetic Mechanisms Univer
sity Science Books, Sausalito, California. 
Wolffe A (3998) Chromatin Structure and Function, 3rd cá Acad
emic Press, San Diego 
Referenda's Específicas aos Tópicos Particulares 
Berg P (1981) Dissections and reconstructions of genes and chro
mosomes (Nobel Prize lecture) Science 213:296- 103 
Kazazian HH, Moran JV {1998) The impact of LI rctrotrans-
posonson the human genome. Nature Genetics 19:19-24 
Lawn RM, Efstratiadis A, O'Conneli C, et al (19H0) The nu-
cleotide sequence of the human |3-globin qcne Cell 
21:647-651 
Smith TM, Lee MK, Szabo Cl, et al (1996) Complete genomic se
quence and analysis of 117 kb of human DNA containing; the 
gene BRCAI Genome Research 6:1029-1049 
O GENOMA HUMANO: ESTRUTURA E FUNÇÃO DOS GENES E CROMOSSOMOS I 27 
Wallace DC (1999) Mitochondria! discuses in man and mouse Sci
ence 283:1482-1488 p15 
Problemas 
1 As seqüências de amínoácidos que se seguem representam paite de 
uma proteíha. São mostradas a seqüência normal e quatro forrnas 
mutantes. Consuitando o Quadro 3 1, determine a seqüência 
bifílamentar da seção correspondente do gene normal. Qual filamento 
a RNA polimerase irá ler ? Qual seria a seqüência do mRNA resul-
tante? Que tipo de mutação é mais provável que cada protema mu-
tante represente? 
Normal -lis-arg-his-his-tir-leu-
Mutante 1 -lis-arg-his-his-cis-leu-
Mutante 2 -Hs-arg-ile-ile-ile-
Mutante 3 -lis-glu-tre-ser-leu-ser-
Mutante 4 -asn-tk-Ieu-
2 Os itens que se seguem estão relacionados uns aos outros de modo 
hierárquico Quais são estas relações? Cromossomo, par de bases, 
nucleossomo, banda G, pares de kb, intron, gene, éxon, cromatina, 
códon, micleoüdeo. 
3 0 desenho esquemáüco que se segue ilustra urn cromossomo 5 no 
qual a banda mais distal (banda p!5) no braço cuito está deietada. 
Este cromossomo deletado está associado à sfndrome do cri du chat 
(ver Caps. 9 e 10) Com o que você sabe sobre a organização dos 
cromossomos e do genoma, aproximadamente quanto 0NA foi de
letado? Quantos genes? 
5p-
A matorparte do genoma humano consiste em seqüências que não são 
tnuiscritas e não codificam diretamente produtos gênicos. Para cada urn 
dos que se seguem, considere os modos pelos quais estes elementos 
genômicos podem contribuir para uma doença humana: fntrons, sequen
cias repetitivas Alu ou L1, regiões controladoras de locus, pseudogenes.