Buscar

biologia molecular

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 132 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 132 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 132 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Universidade Federal do Piauí
Centro de Educação Aberta e a Distância
BIOLOGIA 
MOLECULAR
Sérgio Emílio dos Santos Valente
Ministério da Educação - MEC
Universidade Aberta do Brasil - UAB
Universidade Federal do Piauí - UFPI
Universidade Aberta do Piauí - UAPI
Centro de Educação Aberta e a Distância - CEAD
Sérgio Emílio dos Santos Valente
BIOLOGIA MOLECULAR
Cleidinalva Maria Barbosa Oliveira
Ubirajara Santana Assunção
Zilda Vieira Chaves
Elis Rejane Silva Oliveira
Roberto Denes Quaresma Rêgo
Samuel Falcão Silva
Cleonildo F. de M. Neto
Ligia Carvalho de figueiredo
Maria da Penha Feitosa
PRESIDENTE DA REPÚBLICA
MINISTÉRIO DA EDUCAÇÃO
GOVERNADOR DO ESTADO
REITOR DA UNIVERSIDADE FEDERAL DO PIAUÍ
SECRETÁRIO DE EDUCAÇÃO A DISTÂNCIA DO MEC
PRESIDENTE DA CAPES
COORDENADOR GERAL DA UNIVERSIDADE ABERTA DO BRASIL
DIRETOR DO CENTRO DE EDUCAÇÃO ABERTA E A DISTÂNCIA DA UFPI
Dilma Vana Rousseff Linhares
Fernando Haddad
Wilson Nunes Martins
Luiz de Sousa Santos Júnior
Carlos Eduardo Bielshowsky
Jorge Almeida Guimarães
Celso Costa
Gildásio Guedes Fernandes
CONSELHO EDITORIAL DA EDUFPI
Prof. Dr. Ricardo Alaggio Ribeiro (Presidente)
Des. Tomaz Gomes Campelo
Prof. Dr. José Renato de Araújo Sousa
Profª. Drª. Teresinha de Jesus Mesquita Queiroz
Profª. Francisca Maria Soares Mendes
Profª. Iracildes Maria de Moura Fé Lima
Prof. Dr. João Renór Ferreira de Carvalho
COORDENAÇÃO DE MATERIAL DIDÁTICO
TÉCNICOS EM ASSUNTOS EDUCACIONAIS
EDIÇÃO
PROJETO GRÁFICO
DIAGRAMAÇÃO
REVISÃO
REVISÃO GRÁFICA
© 2011. Universidade Federal do Piauí - UFPI. Todos os direitos reservados.
A responsabilidade pelo conteúdo e imagens desta obra é dos autores. O conteúdo desta obra foi licenciado temporária e 
gratuitamente para utilização no âmbito do Sistema Universidade Aberta do Brasil, através da UFPI. O leitor se compromete 
a utilizar o conteúdo desta obra para aprendizado pessoal, sendo que a reprodução e distribuição ficarão limitadas ao âmbito 
interno dos cursos. A citação desta obra em trabalhos acadêmicos e/ou profissionais poderá ser feita com indicação da fonte. 
A cópia desta obra sem autorização expressa ou com intuito de lucro constitui crime contra a propriedade intelectual, com 
sansões previstas no Código Penal.
É proibida a venda ou distribuição deste material.
EQUIPE DE DESENVOLVIMENTO
COORDENADORES DE CURSOS
ADMINISTRAÇÃO
CIÊNCIAS BIOLÓGICAS
FILOSOFIA
FÍSICA
MATEMÁTICA
PEDAGOGIA
QUÍMICA
SISTEMAS DE INFORMAÇÃO
Francisco Pereira da Silva Filho
Maria da Conceição Prado de Oliveira
Zoraida Maria Lopes Feitosa
Miguel Arcanjo Costa
João Benício de Melo Neto
Vera Lúcia Costa Oliveira
Rosa Lima Gomes do Nascimento Pereira da Silva
Luiz Cláudio Demes da Mata Sousa
Este texto é destinado aos estudantes que participam do programa de 
Educação a Distância da Universidade Aberta do Piauí (UAPI) vinculada ao 
consórcio formado pela Universidade Federal do Piauí (UFPI), Universidade 
Estadual do Piauí (UESPI), Instituto Federal de Educação, Ciência e 
Tecnologia do Piauí (IFPI), com apoio do Governo do estado do Piauí, através 
da Secretaria de Educação e Cultura (SEDUC).
O texto é composto de quatro unidades, contendo itens e subitens, 
que discorrem sobre a importância da Biologia Molecular, apresentando 
conceitos fundamentais sobre a estrutura e função dos ácidos nucléicos, 
Engenharia Genética e Marcadores Moleculares.
Na Unidade 1 apresentamos a organização estrutural e funcional 
do material genético, fornecendo as bases necessárias à compreensão 
a respeito da estrutura e funcionamento do material genético nas células 
dos seres vivos. Na Unidade 2 comentamos a respeito dos mecanismos de 
isolamento e clonagem de um gene específico, oferecendo aos estudantes o 
aprendizado de como é construída a molécula de DNA Recombinante.
Na Unidade 3 abordamos sobre as vantagens e desvantagens da 
tecnologia do DNA recombinante, apresentando pontos positivos e negativos 
da manipulação genética. Na Unidade 4 elucidamos a parte referente às 
diferentes técnicas utilizadas na caracterização molecular, apresentando 
vantagens e desvantagens de cada uma.
UNIDADE 1
ESTRUTURA E FUNÇÃO DO MATERIAL GENÉTICO
Estrutura do material genético ...........................................................11
Código genético .................................................................................. 16
Síntese protéica .................................................................................. 18
Regulação da ação gênica...................................................................23
Mutação..............................................................................................30
UNIDADE 2
ISOLAMENTO E CLONAGEM DE UM GENE ESPECÍFICO
Isolamento de um gene específico .....................................................43
Clonagem de um gene específico .......................................................46
Enzimas de restrição ........................................................................... 52
Construção da molécula de DNA recombinante.................................54
UNIDADE 3
VANTAGENS E DESVANTAGENS DA TECNOLOGIA DO DNA RECOMBI-
NANTE
Vantagens e desvantagens da tecnologia do DNA recombinante ......63
UNIDADE 4
MARCADORES MOLECULARES EM ESPÉCIES VEGETAIS
Introdução aos marcadores moleculares ...........................................87
Eletroforese.......................................................................................88
Eletroforese de proteínas...........................................................89
Isoenzimas..................................................................................91
Polimorfismo NO COMPRIMENTO DE FRAGMENTOS DE 
RESTRIÇÃO – RFLP......................................................................94
Vntrs.........................................................................................104
9
41
61
85
polymerase chain reaction (PCR).............................................104
random amplified polymorphic DNA (RAPD).........................107
Microssatélites.........................................................................109
Aplicações dos marcadores moleculares.................................112
UNIDADE 01
Estrutura e Função do 
Material Genético
A disciplina Biologia Molecular versa sobre aspectos referentes à organização estrutural e funcional 
do material genético. Nesta unidade fornecemos as bases necessárias à compreensão da estrutura e 
funcionamento do material genético presente nas células dos seres vivos. Além disso, será oferecido ao 
estudante o aprendizado de termos utilizados na Área de Biologia Molecular. Esta unidade tem como meta 
principal oferecer uma visão sobre os mecanismos envolvidos na hereditariedade e variação genética.
BIOLOGIA MOLECULAR 11
EstRUtURA E FUNçãO DO 
MAtERIAL GENétICO
Estrutura do material genético 
Desde 1865, quando Gregor Mendel cruzava ervilhas e propôs as leis 
da hereditariedade, até o ano de 2003, quando foi anunciada a conclusão do 
Projeto Genoma Humano, a Biologia avançou enormemente, sendo a grande 
área do conhecimento que teve mais avanços no último século.
 Há quase 70 anos se definiu que o DNA era a molécula responsável 
pelo armazenamento e transmissão das características hereditárias. Em 
1953, James D. Watson e Francis H. Crick esclareceram a estrutura da 
molécula de DNA, determinando como uma macromolécula (polímero) era 
formada pela associação de vários nucleotídeos, que podiam ser de quatro 
tipos, dependendo da base nitrogenada presente: adenina (A), timina (T), 
citosina (C) e guanina (G).
A nossa informação hereditária é determinada pela sequência desses 
quatro tipos de nucleotídeos. Podemos dizer que a linguagem do mecanismo 
da hereditariedade é escrita com um alfabeto de apenas quatro letras. Em 
todos os organismos, com exceção de alguns vírus, a molécula responsável 
pelas características hereditárias é o DNA (ácido desoxirribonucléico).
O Genoma Humano é constituído de aproximadamente três bilhõesde pares de nucleotídios. As instruções genéticas de todas as outras formas 
de vida da Terra são escritas na mesma língua, usando o mesmo código 
genético. Na realidade, essa linguagem genética comum a todas as espécies 
constitui um ponto de apoio à teoria de que todos os organismos da Terra 
descendem de um único ancestral.
Um cromossomo humano típico possui apenas uma molécula de 
DNA, muito longa e que se enrola, de forma que o espaço ocupado é muito 
menor do que seria se não fosse a sua forma espiralada. A cromatina é o 
material de que são feitos os cromossomos, sendo composto de DNA e 
Código genético: O código 
pelo qual a informação 
genética, contida na 
sequência de nucleotídeos 
do DNA, relaciona-se com a 
sequência de aminoácidos 
da proteína. Cada três 
bases do DNA (tríplex) 
especificam um dos vinte 
aminoácidos na proteína.
Ácido desoxirribonucléico 
(DNA): Classe das 
macromoléculas que 
consiste de duas cadeias 
longas de nucleotídeos.
unidade 0112
proteínas. A unidade estrutural básica da cromatina é chamada nucleossomo 
(um conjunto de proteínas histônicas onde a molécula de DNA dá duas 
voltas, formando uma fibra com aspecto de contas de um colar). Um dos 
níveis de empacotamento do DNA nos cromossomos é obtido pelo fato da 
fibra de nucleossomos enrolar-se sobre si formando uma estrutura que pode 
ser visualizada ao microscópio eletrônico. Essa estrutura é chamada de 
Solenóide.
O conteúdo de informação de um cromossomo humano corresponde a 
cerca de 500 milhões de palavras. Se existem cerca de 300 palavras em uma 
página impressa comum, isso corresponde a mais ou menos dois milhões 
de páginas. Se um livro comum contém 500 páginas desse tipo, o conteúdo 
de informação de um único cromossomo humano corresponde a uns quatro 
mil volumes. Então, a sequência de bases contidas no DNA representa uma 
enorme quantidade de informação.
 A molécula de DNA apresenta dois filamentos, sendo semelhante 
a uma escada, em que a pentose e o grupo fosfato seriam o corrimão e 
as bases nitrogenadas, unidas por meio de pontes de H, representando os 
degraus (Figura 1).
 
BIOLOGIA MOLECULAR 13
Figura 1: Ligação de duas cadeias de nucleotídeos por pontes de hidrogênio formando a dupla 
hélice. Fonte: FARAH (1997).
 A Figura 2 ilustra as ligações que ocorrem entre os nucleotídeos que 
formam a molécula de DNA.
 
unidade 0114
Figura 2: A) A ligação fosfodiéster ocorre entre o grupo OH (no carbono 3’ do último nucleotídeo da 
cadeia) e o trifosfato (no carbono 5’do nucleotídeo recém-acoplado). B) A cadeia de nucleotídeos 
mostrando o terminal 5’(grupo fosfato) e 3’(grupo OH) em cada ponta. Fonte: FARAH (1997).
BIOLOGIA MOLECULAR 15
As células representam a unidade dos organismos vivos e são 
compostas por dois compartimentos básicos: o núcleo e o citoplasma. O DNA 
é encontrado principalmente no núcleo de células eucariontes e em pequenas 
quantidades nas mitocôndrias e nos cloroplastos (em células vegetais). Já o 
RNA é encontrado principalmente no citoplasma e, em menor quantidade, no 
interior do núcleo, mitocôndrias e cloroplastos (em células vegetais).
Em células procariontes o DNA está contido no cromossomo 
bacteriano e em uma molécula pequena denominada plasmídeo, que se 
situam dispersas no citoplasma bacteriano, já que essas células não possuem 
envoltório nuclear.
O DNA consegue armazenar a informação genética por 
conseguir produzir cópias perfeitas de si mesmo, por meio da replicação 
semiconservativa. Nesse modelo de replicação, uma molécula sintetiza duas 
idênticas a ela, com cada uma das moléculas filhas apresentando uma fita 
antiga (molde), oriunda da molécula original, e uma molécula nova, recém 
Figura 3: Duplicação 
da molécula de DNA 
(A) e a aparência do 
cromossomo antes e 
depois da duplicação 
(B). As cromátides 
irmãs, que compõem 
um cromossomo, são 
réplicas idênticas. 
Fonte: FARAH (1997).
unidade 0116
sintetizada (Figura 3).
O dogma central da Biologia Molecular consiste na transcrição das 
informações genéticas do DNA em moléculas de RNA, que por sua vez são 
traduzidas nas proteínas. Os genes seriam, em geral, sinônimos de proteínas, 
ladeados por sequências que regulam a atividade gênica.
A informação genética fica armazenada no DNA e no RNA (formados 
por nucleotídeos), porém, os organismos são constituídos basicamente por 
proteínas formadas por aminoácidos, ou seja, a sequência de nucleotídeos 
que descreve uma única proteína que precisa ser traduzida de uma forma 
semelhante à tradução do português para o chinês. 
O genoma humano apresenta 3 bilhões de pares de bases. 
Considerando-se o tamanho médio de um gene humano, essa quantidade de 
DNA seria suficiente para codificar 3 milhões de proteínas de tamanho médio, 
número muito maior do que a quantidade estimada de proteínas existentes 
nas células humanas. 
Código genético
Alguns anos se passaram para o homem esclarecer como ocorria a 
síntese de proteínas. Sabia-se que a molécula de DNA variava em apenas 
quatro tipos de nucleotídeos. Portanto, o código genético construído a partir 
de quatro letras deveria ser capaz de informar às células quais dos 20 
aminoácidos tinham de ser ligados, a fim de formar as milhares de proteínas 
constituintes de bilhões de formas de vida.
Combinações de duas letras possibilitariam apenas 16 possíveis 
“palavras” ou “códons”. Mas, combinações triplas produziriam 64 códons, 
quantidade mais que suficiente para a produção dos 20 aminoácidos. 
O código genético foi então decifrado na década de 1960, mostrando 
que os aminoácidos se organizam a partir de uma sequência de 3 bases 
nitrogenadas apenas. Cada três letras do DNA controlam a adição de um 
aminoácido na molécula da cadeia polipeptídica, segundo o código genético 
(Figura 4). Primeiramente, a informação genética do DNA é transcrita em um 
RNAm que leva essa informação do núcleo para o citoplasma, objetivando a 
tradução em uma sequência de aminoácidos. 
BIOLOGIA MOLECULAR 17
Figura 4: O código genético. Fonte: FARAH (1997).
Até 1965, os aminoácidos correspondentes de praticamente todos os 
64 códons possíveis haviam sido determinados em laboratório. Observou-
se que alguns códons eram redundantes, com certos aminoácidos sendo 
especificados por dois, quatro e até seis trincas diferentes. O código genético 
era então chamado degenerado. Surgem então algumas questões não 
esclarecidas ainda. Por que 20 e somente 20 aminoácidos padrão? Por que 
alguns aminoácidos têm seis códons correspondentes, enquanto outros têm 
só um ou dois?
Além disso, observou-se que o código genético não era ambíguo (não 
há mais de um códon para o mesmo aminoácido). 
Enzimas: são as proteínas 
que dirigem as reações 
químicas que acontecerão 
numa célula, definindo o 
trabalho que a célula vai 
desempenhar
unidade 0118
Em termos evolutivos, a distribuição de códons para aminoácidos 
seria obra do acaso. Porém, uma vez que o código havia surgido, tornou-se 
tão fundamental para a vida que qualquer modificação seria catastrófica.
Às vezes, uma mutação em um único gene pode ser benéfica, se 
permitir aos organismos um desempenho melhor. Porém, ao modificarmos 
a forma de leitura do código genético, estaríamos introduzindo alterações 
em inúmeros pontos de seu material genético, resultando em numerosas 
modificações em todas as enzimas de um indivíduo. Seria como trocarmos 
todas as letras de um texto ao acaso. O prejuízo seria enorme e a morte 
daquele organismo seria praticamente certa.
Foi observado que organismos tão diversos como os humanos e as 
bactérias empregavam exatamente as mesmas regras de codificação. O 
código genético seria universal, ou seja, o mesmo para todos os seres vivos. 
Porém, há aproximadamente 20 exceções na natureza que dão 
significados diferentes a alguns códons. A base continua a mesma: códons 
de trincas de nucleotídeos são traduzidos em aminoácidos. Mas, enquanto 
a maioria dos organismos leria o códon de RNA “CUG” como o aminoácido 
leucina, muitas espéciesdo fungo Candida o traduzem como serina.
As mitocôndrias possuem um genoma próprio, e modificaram o código 
genético em alguns aspectos. No genoma mitocondrial do fermento de pão 
ou levedura de cerveja (Saccharomyces cerevisiae), por exemplo, quatro dos 
seis códons que normalmente codificam a leucina significam treonina.
Podemos deduzir então que o código genético muito provavelmente 
evoluiu. Portanto, a relação entre códon e aminoácidos, preservada durante 
bilhões de anos por seleção natural, não é mera obra do acaso, mas uma 
forma de reduzir o efeito maléfico de grandes alterações provocadas por uma 
leitura alterada dos códons.
Salienta-se ainda que haja códons iniciadores e de término. Os 
iniciadores seriam a trinca AUG em eucariotos e procariotos. Os códons de 
término (fatores de liberação de proteína) seriam UAA, UAG e UGA.
Síntese protéica
Atualmente, sabe-se que são necessárias muitas etapas para que a 
sequência de genes seja convertida em uma sequência de aminoácidos. O 
gene é transcrito em uma molécula de RNA, que usa bases similares do DNA, 
com a exceção de que a timina do DNA é substituída pela uracila.
Esse RNA mensageiro é lido de três em três letras, origina-se no 
núcleo e leva para o citoplasma as informações do DNA nuclear, o qual ao 
se prender ao ribossomo, comanda a síntese protéica. Pequenas estruturas 
Leveduras: Organismos 
unicelulares que possuem 
núcleo verdadeiro 
(eucarioto) e que têm 
propriedades bioquímicas 
muito semelhantes aos 
organismos superiores. 
Extensivamente utilizado 
em engenharia genética.
BIOLOGIA MOLECULAR 19
celulares conhecidas como RNA transportadores carregam os aminoácidos 
que serão ligados na cadeia polipeptídica, que se origina nos ribossomos, 
local da síntese protéica.
Nos cromossomos humanos, os nucleotídeos estão ligados entre si 
em cada uma das duas fitas complementares, para formar a dupla hélice. 
Quando chega o momento em que as instruções do gene são expressas, o 
zíper de duas fitas do DNA se abre apenas pelo tempo suficiente para que 
a cópia de uma fita da sequência do gene possa produzir um RNA. Cada 
sequência de nucleotídeos de DNA que se transcreve na versão de RNA 
dessa maneira é chamada de gene.
Algumas das moléculas de RNA resultantes acabam nunca se 
traduzindo em proteínas, mas atuam nos mecanismos de regulação. As 
transcrições de RNA dos genes que realmente codificam proteínas são 
traduzidas na sequência correspondente de aminoácidos. Mas, primeiro, a 
transcrição preliminar tem que passar por um processo de edição.
Em 1977, Phillip Sharp e colegas do Instituto de Tecnologia de 
Massachusetts (MIT), descobriram que essas transcrições de RNA iniciais 
ou primárias são como livros que contêm muitos capítulos sem nenhum 
significado, inseridos em intervalos do texto. Os capítulos sem sentido, 
chamados íntrons, precisam ser extraídos para que os capítulos com sentido 
se liguem, permitindo ao RNA “contar uma história” coerente. No splicing, 
processo de corte-e-ligação ou processamento, os íntrons são removidos da 
transcrição inicial. Os segmentos da transcrição que contêm sequências que 
codificam proteínas, chamados éxons, os quais são ligados para formar a 
versão final da transcrição, conhecida como RNA mensageiro.
Mas em 1980, Randolph Wall, da Universidade da Califórnia de Los 
Angeles (UCLA), demonstrou que essa visão básica do processamento 
pré-RNAm, em que todos os íntrons são sempre descartados e todos os 
éxons são sempre incluídos, nem sempre é verdadeira. Na realidade, os 
mecanismos celulares podem “decidir” remover um éxon ou manter um íntron, 
ou partes dele na transcrição final do RNAm. Essa capacidade de editar de 
forma alternativa as transcrições de RNAm aumenta significativamente a 
versatilidade dos genes e dá ao mecanismo de processamento o enorme 
poder de determinar o quanto a célula produzirá de certo tipo de proteína em 
detrimento de outros, codificados pelo mesmo gene.
Em 1984, Tom Maniatis da Universidade de Harvard, desenvolveu um 
procedimento para revelar o mecanismo molecular que executa a retirada dos 
íntrons e a ligação dos éxons entre si. Os detalhes sobre seu funcionamento 
e sobre o sistema regulatório que o controla ainda são desconhecidos, porém 
bastante elaborados.
Nucleotídeo: A unidade 
das moléculas de ácidos 
nucléicos (DNA e RNA) é 
composta por uma molécula 
de açúcar um grupo fosfato 
e uma base nitrogenada.
Transcrição: Processo 
pelo qual a dupla hélice de 
DNA se desenrola, então a 
cópia de RNA é sintetizada 
a partir de uma das fitas 
complementares de um 
gene.
unidade 0120
Em organismos complexos, dois níveis diferentes estão envolvidos 
no splicing das transcrições do pré-RNAm. Um que é encontrado em todos 
os organismos cujos genomas possuem íntrons dos fungos até os seres 
humanos, sendo muito conservado ao longo da evolução. Ele consiste em 
cinco moléculas que se aliam a até 150 proteínas para formar um complexo 
chamado spliceossomo, responsável por reconhecer os locais onde os íntrons 
começam e terminam, removendo-os da transcrição do pré-RNAm e ligando 
os éxons para formar o RNAm.
Quatro curtas sequências de núcleotídeos dentro dos íntrons servem 
como sinal para indicar ao spliceossomo onde cortar. Um desses sinais fica 
no começo do íntron e é chamado de ponto de splicing 5’; outro, localizado na 
extremidade final do íntron, é conhecido como ponto de splicing 3’.
Outro sistema regulatório envolve a presença de proteínas reguladoras 
de splicing, onde cada uma pode ser expressa em estágios distintos do 
desenvolvimento dentro do mesmo tecido. Essas proteínas podem se ligar a 
sequências curtas de nucleotídeos localizadas dentro de regiões ativadoras 
ou supressoras dos éxons.
As consequências em deixar de fora um único éxon podem ser 
dramáticas para um organismo. Na mosca-das-frutas, por exemplo, o splicing 
alternativo controla o sistema que determina o sexo. A remoção de éxons é 
o tipo mais comum de splicing alternativo entre os mamíferos, respondendo 
por cerca de 40% desse tipo de processamento genético em humanos. Mas 
várias outras formas também já foram identificadas, como uma que faz os 
íntrons serem mantidos no RNAm maduro, mais comum em plantas e em 
formas inferiores de vida multicelular.
O splicing alternativo permite aos humanos produzir mais de 100 mil 
proteínas sem precisar manter 100 mil genes, pois esse mecanismo origina 
mais de um tipo de molécula de RNAm e, portanto, mais de uma proteína 
por gene. Em média, cada um de nossos genes dá origem a três RNAms por 
meio do splicing alternativo. Mesmo assim, esse número não explica nossa 
necessidade de ter tantos íntrons nem por que eles ocupam tanto território 
dentro dos genes, de modo que as sequências exônicas correspondam a 
apenas entre 1% e 2% do genoma humano. Defeitos de splicing podem estar 
associados ao câncer e doenças hereditárias. 
BIOLOGIA MOLECULAR 21
É provável que a retenção de íntrons seja, em termos evolutivos, a 
versão mais antiga do splicing alternativo. Mesmo hoje em dia, o mecanismo 
de splicing de organismos unicelulares, como os fungos, funciona por meio 
do reconhecimento de íntrons, sistema diferente das proteínas reguladoras 
de splicing dos organismos superiores.
Em organismos unicelulares, o mecanismo de splicing só reconhece 
sequências intrônicas menor que 500 nucleotídeos, o que funciona bem para 
os fungos, que têm poucos íntrons, em média com apenas 270 nucleotídeos 
de comprimento. Mas, conforme os genomas foram se expandindo ao 
longo da evolução, seus trechos intrônicos se multiplicaram e cresceram o 
mecanismo celular de splicing, provavelmente foi obrigado a mudar de um 
sistema que reconhecia sequências intrônicas curtas dentro dos éxons, para 
um que reconhecesse éxons curtos no meio de um mar de íntrons. Em média, 
um gene humano dos que codificam proteínas tem 28 mil nucleotídeos com 
8,8 éxons separados por 7,8 íntrons. Os éxons são relativamente curtos, em 
geral têm cerca de 120 nucleotídeos,enquanto os íntrons variam de 100 a 
100 mil nucleotídeos de comprimento.
O tamanho e a quantidade dos íntrons humanos - temos o maior 
número de íntrons por gene de todos os organismos - suscitam uma questão 
interessante. Manter os íntrons é um hábito caro. Uma grande proporção 
da energia que gastamos todo dia é dedicada à manutenção e ao reparo 
de íntrons na forma de DNA, à transcrição do pré-RNAm, à remoção dos 
íntrons até a sua ruptura ao final da reação de splicing. Além disso, o sistema 
pode causar equívocos com consequências graves. Cada erro no corte e na 
ligação do pré-RNAm leva a uma alteração na sequência de codificação da 
proteína da transcrição do gene, e possivelmente à síntese de uma proteína 
defeituosa.
Por exemplo, na síndrome de Riley Day há uma mutação em um único 
nucleotídeo de um gene que faz com que ele sofra splicing alternativo em 
tecidos do sistema nervoso. A redução da proteína produzida por esse gene 
causa desenvolvimento anômalo do sistema nervoso. Pelo menos 15% das 
mutações que provocam doenças genéticas e determinados tipos de câncer 
fazem isso ao afetar o splicing do pré-RNAm. Então, por que a evolução 
preservou um sistema tão complicado e que ainda pode causar doenças? 
Talvez porque as vantagens superem os riscos.
Por incrível que pareça, um camundongo possui o mesmo número 
de genes do homem. Embora tenham se passado 100 milhões de anos 
desde que ambos tiveram um ancestral comum, provavelmente um animal 
semelhante ao mussaranho atual, 99% dos genes dos camundongos e dos 
humanos derivam daquele ancestral. A maioria possui a mesma organização 
unidade 0122
em íntrons e éxons, e as sequências de nucleotídeos dentro de seus éxons 
também são altamente conservadas. Se há diferenças tão pequenas entre 
o genoma dos humanos e o dos camundongos, o que é que nos torna tão 
diferentes desses animais?
Um estudo recente revelou que um quarto dos éxons que sofrem 
splicing alternativo em ambos os genomas são específicos para os seres 
humanos ou camundongos. Esses éxons têm, portanto, o potencial de 
criar proteínas especiais para determinadas espécies, que podem ser 
responsáveis pela diferenciação entre elas. Uma das categorias dos éxons 
de processamento alternativo é realmente exclusiva dos primatas e pode ter 
contribuído para sua divergência em relação a outros mamíferos. Estudando 
o processo do nascimento de um éxon, podemos começar a enxergar as 
vantagens dos íntrons em geral, e a energia que gastamos para mantê-Ios 
parece se justificar.
Em 1977, Phillip A. Sharp e Richard J. Roberts mostrou de forma 
independente que os genes dos eucariontes não são blocos contíguos de 
elementos reguladores e codificadores de proteínas. Ao contrário, não passam 
de mosaicos de “éxons” (sequências de DNA que codificam fragmentos 
de proteínas) e sequências intermediárias ou “íntrons” que não codificam 
proteínas.
No núcleo, os genes são copiados em sua totalidade como transcritos 
de RNA primário; depois, o splicing remove os “íntrons”, une os “éxons” 
formando o RNA mensageiro, que é traduzido em proteína no citoplasma. 
Supõe-se que o RNA intrônico seja degradado e reciclado.
Como os íntrons não codificam proteínas, por que são tão abundantes 
nos eucariontes, mas inexistentes nos procariontes?
Embora os íntrons constituam 95% ou mais dos genes comuns que 
codificam proteínas nos seres humanos, a maioria dos biólogos moleculares os 
considera sobras evolucionárias ou DNA-lixo. Os íntrons foram considerados 
remanescentes de uma época anterior à evolução da vida celular, quando 
fragmentos de informações codificadoras de proteínas se reuniram nos 
primeiros genes. Porém, dados recentes indicam que essas sequências 
invadiram os genes dos organismos superiores em uma fase mais tardia. O 
mais provável é que tenham derivado de um tipo de elemento genético móvel 
semelhante aos transposons. Esses elementos são fragmentos parasitas de 
DNA com capacidade de se inserir em genomas hospedeiros e se remover 
quando transcritos em RNA.
Talvez os íntrons tenham sobrevivido nos organismos complexos 
porque tivessem uma utilidade secundária - facilitar o rearranjo de segmentos 
de proteínas em novas combinações úteis, por exemplo. Ou ainda, poderiam 
Diferenciação celular: 
Processo pelo qual a célula 
adquire funções mais 
especializadas.
BIOLOGIA MOLECULAR 23
proteger os organismos dos efeitos danosos das mutações (há uma maior 
chance das mutações ocorrerem em regiões não codificadoras, não gerando 
prejuízo aos organismos).
Da mesma forma, os biólogos supõem que a ausência de íntrons nos 
procariontes foi uma consequência de intensas pressões competitivas no 
ambiente microbiano: a evolução teria eliminado os íntrons tornando a célula 
procarionte mais eficiente do ponto de vista energético, por que dispender 
tempo e energia duplicando um DNA inativo?
Outra corrente afirma que, como as bactérias não têm núcleo, a 
transcrição e tradução ocorrem juntas: o RNA é traduzido em proteína com a 
mesma rapidez com que é transcrito. Não dá tempo para o RNA proveniente 
dos íntrons se remover do RNA codificador de proteína. Na maioria dos 
casos, um íntron incapacitaria o gene onde ele está contido causando graves 
consequências para a bactéria hospedeira. Nos eucariontes, a transcrição 
ocorre no núcleo e a tradução no citoplasma, no qual a separação abre 
uma janela de oportunidade para o RNA, originado a partir dos íntrons, ser 
removido.
Com o surgimento de uma estrutura conhecida como spliceossomo, 
não havia mais a necessidade dos íntrons se removerem. Dessa forma o 
spliceossomo teria proporcionado a proliferação e evolução dos íntrons. 
Qualquer mutação aleatória que se mostrasse benéfica para o hospedeiro 
teria sido preservada pela seleção natural. Os RNAs intrônicos, portanto, 
evoluiriam independentemente das proteínas e em paralelo com elas. Em 
vez de serem relíquias moleculares inúteis, os íntrons podem ter adquirido 
funções genéticas mediadas pelo RNA.
Se essa hipótese for verdadeira, os eucariontes (especialmente os 
mais complexos) podem ter desenvolvido um sistema operacional genético 
e redes reguladoras bem mais sofisticadas do que as dos procariontes. Tal 
organização se assemelharia aos sistemas avançados de processamento de 
informações que permitem controle de rede em computadores e no cérebro. 
As tarefas funcionais nas células, normalmente, cabem às proteínas, devido 
à sua grande diversidade química e estrutural. No entanto, os RNAs têm 
uma vantagem em relação às proteínas: eles conseguem codificar sinais 
curtos, como o sistema binário utilizado em computadores, tornando-os 
extremamente precisos. 
Regulação da ação gênica 
Durante a diferenciação das células e o desenvolvimento dos 
organismos, uma única célula fertilizada se transforma em um organismo 
Spliceossomo: 
Complexo de RNAs 
catalíticos pequenos e 
proteínas, cujo papel é 
remover RNA intrônico 
de precursores de RNA 
mensageiro.
Expressão gênica: 
Representa a ativação de 
um gene. A dupla hélice 
do DNA se desenrola e 
o RNAm correspondente 
é transcrito, o qual será 
posteriormente traduzido 
em proteína.
unidade 0124
complexo de 100 trilhões de células com milhões de formas e funções 
diferentes. O padrão de expressão gênica, em organismos procariontes e 
em eucariontes unicelulares e multicelulares é uma das grandes questões da 
Biologia que necessita de respostas.
Células simples, como por exemplo uma bactéria, apresentam um 
elevado número de diferentes proteínas sintetizadas, necessitando de um 
DNA com mais de 3 milhões de pares de bases (pb), DNA pequeno quando 
comparado a outros seres vivos unicelulares eucariontes. Por exemplo, uma 
bactéria (E. coli) apresenta um genoma com 4 milhões pb e 2350 genes no 
seu cromossomo único. Já um fungo (S. cerevisiae) apresenta um genoma 
com 13 milhões pb e 5200 genes.
Em resumo, os organismos simples têm menos complexidade e 
menos tarefas e, portanto, necessitam de menor quantidade de informação 
genética.Em uma célula humana, muito mais complexa, o DNA é 1000 vezes 
maior do que na bactéria, contendo aproximadamente 3 bilhões de pares 
de bases. A quantidade de DNA mostrada para os insetos é menor do que 
aquela para os mamíferos. A quantidade de DNA na mosca das frutas (D. 
melanogaster) é de 140 milhões pb onde se situam 13000 genes. Já na 
espécie humana, o genoma apresenta 3 bilhões pb e aproximadamente 
23000 genes.
 Da mesma forma, a quantidade de DNA apresentada pelos mamíferos 
é menor do que aquela para os seres humanos, pois a maioria dos mamíferos 
possui menos informação genética que os seres humanos. 
Durante décadas, os pesquisadores acharam que o número de genes 
codificadores de proteínas tivesse maior correspondência com a complexidade. 
Desde então, os genomas de diversas espécies foram decifrados, e ficou 
claro que a correlação entre número de genes e complexidade é duvidosa. 
O verme nematoide Caenorhabditis elegans (que tem menos de mil células) 
possui 19 mil genes, enquanto os insetos possuem aproximadamente 13 mil 
e os seres humanos cerca de 20 mil genes.
Porém, há a existência de um paradoxo na Biologia. A quantidade de 
DNA de um organismo não corresponde exatamente à sua complexidade. 
Alguns anfíbios, por exemplo, têm cinco vezes mais DNA que os mamíferos 
e, por incrível que pareça, algumas amebas têm mil vezes mais. 
 Além disso, os organismos com maior complexidade apresentam 
grande parte do seu DNA não envolvido na síntese protéica. Nas células 
humanas, por exemplo, somente 2 a 3% do DNA constituem os genes 
(formados por “íntrons” e “éxons”).
 A evolução biológica tem sido acompanhada por um aumento 
BIOLOGIA MOLECULAR 25
na complexidade. Os mais complexos organismos da Terra hoje contêm 
consideravelmente mais informação armazenada do que os mais complexos 
organismos de 200 milhões de anos atrás, por exemplo. É possível que a 
bioquímica interna das bactérias contemporâneas seja mais eficiente que a 
bioquímica interna das primeiras bactérias a habitar o planeta Terra, porém 
a quantidade de DNA das bactérias atuais provavelmente não é maior que a 
de seus ancestrais bacterianos. É importante distinguir entre a quantidade de 
informação e a qualidade dessa informação.
 Uma bactéria, por ser um organismo unicelular, tem que produzir todas 
as enzimas necessárias para seu funcionamento. Mas elas não produzem 
essas enzimas ao mesmo tempo. A vantagem dos organismos multicelulares 
é que pode existir uma divisão de trabalho entre as células.
 No corpo humano, a diferenciação celular permite que as células 
do pâncreas produzam insulina, as do estômago secretem suco gástrico, 
enquanto as do cérebro são encarregadas de transmitir impulsos nervosos, 
e assim por diante. Todas as células de um organismo contêm os mesmos 
genes, embora em cada célula alguns genes estejam ativos e outros inativos, 
em um sistema semelhante ao interruptor que acende ou apaga a luz. Dentro 
das células, pequenas marcas químicas (como os grupos metil e acetil) 
podem se ligar a segmentos de DNA e às proteínas da cromatina e, assim, 
determinar quais genes serão transcritos ou permanecerão silenciados.
 Dessa forma, as enzimas necessárias em cada tipo celular são 
diferentes, e somente uma porcentagem do total dos genes presentes em 
uma pessoa será ativada em um determinado tecido. Além disso, diferentes 
genes se expressam em diferentes fases do desenvolvimento do organismo, 
do embrião ao adulto.
 É necessário que haja uma regulação da atividade gênica, de modo 
a definir quais genes serão ativados e quais proteínas serão produzidas em 
cada tecido, a cada momento do desenvolvimento. O controle da expressão 
gênica é feito por outras sequências de DNA por sítios promotores e os 
genes reguladores, que ativam um gene, informando o momento que ele será 
expresso, assim como controlando a quantidade de proteína a ser produzida. 
Um gene é ativado quando ele é transcrito em RNAm, sendo posteriormente 
traduzido em uma proteína.
 Um dos primeiros estudos sobre os mecanismos que regulam os 
genes foi desenvolvido por Jacob e Monod (recebendo o Prêmio Nobel na 
década de 1960). De acordo com esse modelo, a síntese de proteínas é 
obtida através do bloqueio da atividade do tetrâmero repressor, proteína esta 
produzida pelo gene regulador, o qual permite que o sítio operador fique livre. 
Dessa forma, a RNA polimerase se liga ao sítio promotor, ocorrendo então o 
Genes reguladores: Genes 
que codificam um RNA ou 
uma proteína cuja função 
é controlar a expressão de 
outros genes.
unidade 0126
processo de transcrição do RNA e posteriormente a tradução em proteínas. 
O bloqueio da atividade da proteína repressora era realizado pela lactose, 
chamada de indutora do processo de transcrição e tradução.
 Jacob e Monod, em um ano concluíram que as proteínas controlavam 
todas as informações genéticas em E. coli (bactéria), explicando em parte 
como ocorre a regulação gênica em organismos procariontes. O biólogo 
Jacques Monod sintetizou a universalidade do dogma central numa frase: “O 
que é verdade para a E. coli também é verdade para o elefante”, obviamente 
sendo verdade também para plantas, fungos, organismos multicelulares e 
unicelulares classificados como eucariontes (células que contêm núcleos). 
 Monod estava apenas certo apenas em parte. Um número crescente 
de resultados revela que o dogma central da Biologia Molecular é incompleto 
para elucidar como ocorre a regulação gênica em organismos eucariontes. 
As proteínas realmente ajudam a regular a expressão dos genes, mas um 
sistema regulador com base em RNAs que atuam diretamente sobre o DNA e 
outras moléculas também é importante.
 Os indícios de um sistema regulador generalizado baseado no RNA 
são fortes, embora ainda incompletos. Se tal sistema existe, seria de esperar 
que muitos genes tivessem evoluído somente para expressar sinais de RNA 
como reguladores. É o que parece acontecer: milhares de RNAs que nunca 
são traduzidos em proteína (RNAs não-codificadores) foram identificados em 
análises recentes de transcrição em mamíferos. Pelo menos metade de todos 
os transcritos de RNA enquadra-se nessa categoria.
 Resultados recentes indicam que a sinalização do RNA direciona a 
marcação da cromatina. De fato, vários processos cromossômicos complexos 
como a mitose (divisão celular) e a meiose (a formação dos precursores do 
espermatozóide e óvulo), parecem depender de cascatas bioquímicas que 
afetam o processamento de RNA.
 Centenas de “micro-RNAs” derivados de íntrons e transcritos de 
RNA não-codificadores maiores já foram identificados em plantas, animais 
e fungos. Muitos deles controlam o ritmo de processos que ocorrem durante 
o desenvolvimento como a manutenção de células-tronco, a proliferação de 
células e a apoptose (a morte celular programada). Esses RNAs poderiam 
ainda informar a vários genes que uma sequência codificadora específica 
está sendo transcrita.
 O splicing alternativo gera vários tipos de RNAs e proteínas nas 
células dos diferentes tecidos, embora todos compartilhem o mesmo conjunto 
de genes. A maioria dos transcritos codificadores de proteínas sofre splicing 
alternativo em mamíferos. Quando o RNA intrônico é removido do transcrito 
de um gene, as regiões de RNA codificador de proteína podem ser montadas 
BIOLOGIA MOLECULAR 27
de várias maneiras para produzir mais de um tipo de proteína. O fenômeno 
é fundamental para o desenvolvimento dos animais e das plantas, mas 
ninguém ainda entende como as células especificam qual forma de proteína 
será criada. Poucos fatores protéicos que controlam esse fenômeno foram 
encontrados. Em consequência, os pesquisadores costumam supor que 
combinações sutis de fatores gerais ativam ou reprimem o splicing alternativo 
em diferentes contextos, sem indício forte que respalde essa suposição.
 Uma possibilidade mais provável e mais atraente do ponto de vista dos 
mecanismos é que os RNAs regulem o processo de forma direta. Em princípio, 
essasmoléculas poderiam marcar ou capturar sequências específicas em 
transcritos primários e direcionar a montagem das peças. Confirmando 
parte dessas ideias, as sequências de DNA nas junções íntron-éxon, onde 
ocorre o splicing alternativo, costumam ser resistentes a mudanças durante a 
evolução. 
 Além dos íntrons, a outra grande fonte do suposto lixo genômico 
- representando cerca de 40% do genoma humano - compreende 
transposons e outros elementos repetitivos. Essas sequências, geralmente, 
são consideradas parasitas moleculares que, à semelhança dos íntrons, 
colonizaram nossos genomas em diferentes épocas da história evolutiva. 
Podem ter sido intrusas de início; porém, uma vez estabelecidas na 
comunidade, elas e seus descendentes progressivamente tornaram-se parte 
de sua dinâmica - mudando, contribuindo e evoluindo com ela.
 Uma série de indícios sugere que os transposons contribuem para 
a evolução e regulação genômica de organismos superiores e podem 
desempenhar um papel-chave na herança epigenética (a modificação dos 
traços genéticos).
 Além disso, em 2004, foi anunciada uma descoberta empolgante 
envolvendo o processo chamado edição A-para-I (adenosina-para-inosina), 
em que uma sequência de RNA muda em um local muito específico. Eles 
demonstraram que a edição A-para-I de transcritos de RNA é centenas de 
vezes mais generalizadas em seres humanos do que se pensava e ocorre 
predominantemente em sequências repetitivas, denominadas elementos Alu, 
que residem no RNA não-codificador. A edição A-para-I é particularmente ativa 
no cérebro e a edição aberrante foi associada a uma série de comportamentos 
anormais como epilepsia e depressão.
 Embora a edição de RNA ocorra, até certo ponto, em todos os animais, 
os elementos Alu são específicos dos primatas. Uma possibilidade intrigante 
é que a colonização da linhagem dos primatas por elementos Alu tornou 
possível o surgimento de um novo nível de complexidade no processamento 
de RNA e permitiu que a programação dos circuitos neurais se tornasse mais 
unidade 0128
dinâmica e flexível. Essa versatilidade, por sua vez, estabeleceu a base para a 
emergência da cognição, memória, pensamento conceitual, autoconsciência, 
aprendizado, arte, conhecimento e inovação de ordem superior na espécie 
humana.
 As moléculas que compõem os diferentes organismos são 
fundamentalmente iguais: 99% das proteínas nos seres humanos possuem 
equivalentes reconhecíveis em camundongos e vice-versa. Muitas dessas 
proteínas também são conservadas em outros animais, e as envolvidas em 
processos celulares básicos são conservadas em todos os eucariontes. 
Desse modo, as diferenças nas formas dos animais certamente procedem de 
diferenças nas informações arquitetônicas.
 Genes codificadores de proteínas obviamente especificam os 
componentes dos organismos, mas onde estão as informações arquitetônicas? 
A suposição predominante entre os biólogos é que as instruções de 
montagem de organismos complexos estão de algum modo embutidas nas 
diversas combinações de fatores reguladores dentro das células - ou seja, 
nas permutações das proteínas reguladoras interagindo umas com as outras, 
com o DNA e o RNA.
 Entretanto, embora essa matemática combinatória possa gerar 
possibilidades quase infinitas, a grande maioria será caótica e sem sentido - 
o que é problemático. Os organismos precisam navegar por rotas evolutivas 
precisas, que sejam lógicas e competitivas. Gerar complexidade é fácil; 
controlá-Ia é que é problemático.
 Descobriu-se que o número de reguladores de proteínas nos 
procariontes aumenta à razão do quadrado do tamanho do genoma. Além 
disso, haveria um ponto em que o número de novos reguladores não 
pudesse ultrapassar o número de novos genes funcionais. Este ponto estaria 
próximo do limite superior do tamanho dos genomas das bactérias. Durante 
a evolução, portanto, a complexidade dos procariontes pode ter sido limitada 
pela sobrecarga reguladora genética, e não por fatores ambientais ou 
bioquímicos, como se supunha antes.
 Essa conclusão também é compatível com o fato de que a vida na 
Terra consistiu unicamente em micro-organismos na maior parte de sua 
história. A combinação das proteínas não poderia por si só elevar o nível de 
complexidade dos organismos, a ponto de originar uma célula eucarionte a 
partir de uma célula procarionte.
 Os eucariontes devem ter encontrado uma solução para esse 
problema, que pode ter sido a transição para um novo tipo de controle baseado, 
em grande parte, em RNAs. Isso certamente ajudaria a explicar o fenômeno 
da explosão cambriana, há cerca de 525 milhões de anos, quando animais 
BIOLOGIA MOLECULAR 29
invertebrados de uma diversidade assombrosa evoluíram aparentemente de 
forma abrupta, a partir de formas de vida muito mais simples. Na verdade, 
esses resultados sugerem que a complexidade organizada é devido às 
regiões reguladoras.
 Em resumo, o RNA apresenta um importante papel no controle da 
atividade gênica. Esse papel do RNA permite às células animais, por exemplo, 
atingirem uma complexidade estrutural muito maior quando comparadas a 
uma bactéria. 
 A surpresa mais recente é que os genomas dos vertebrados contêm 
milhares de sequências não-codificadoras que permaneceram praticamente 
inalteradas por muitos milhões de anos. Essas sequências estão muito 
mais conservadas que aquelas que codificam proteínas, o que é totalmente 
inesperado. O mecanismo que congelou essas sequências é desconhecido, 
mas sua constância extrema sugere que estejam envolvidas em redes 
complexas essenciais à nossa Biologia.
 Desse modo, os genomas dos seres humanos e de outros organismos 
complexos, ao invés de serem vistos como portadores de sequências 
codificadoras no meio de muito DNA lixo, deveriam ser vistos como ilhas 
de informação de componentes de proteína em um mar de informações 
reguladoras. A maior parte dos genomas em organismos complexos não é 
DNA-lixo, ao contrário, é funcional e sujeita à seleção evolutiva.
A existência de um grande sistema regulador baseado no RNA também 
possui implicações na área da saúde. Doenças genéticas tradicionais como 
fibrose cística e talassemia são causadas por um dano em um componente: 
uma das proteínas do indivíduo simplesmente não funciona. No entanto, 
é provável que muitas, se não a maioria, das variações genéticas que 
determinam a suscetibilidade à maioria das doenças residam nas regiões 
reguladoras. RNAs não-codificadores já foram associados a diversas doenças 
como o linfoma de células B, câncer do pulmão, câncer da próstata, autismo 
e esquizofrenia.
 Sabemos que menos de 1% do genoma humano codifica proteínas, 
mas a maioria dele é transcrita em RNA. Podemos supor que o genoma 
humano (e o dos outros organismos complexos) está cheio de transcrições 
inúteis, ou que esses RNAs desempenham alguma função.
 Como dificilmente ocorrem eventos inúteis na Natureza, pois todos 
os eventos biológicos estão sob a ação de forças evolutivas constantemente, 
podemos sugerir que muitos genes em organismos complexos (e talvez até 
a maioria dos genes dos mamíferos) não codificam proteínas, mas originam 
RNAs com funções reguladoras. Essas moléculas podem apresentar um 
papel decisivo no desenvolvimento e na evolução dos organismos.
Fibrose cística: Doença 
genética de herança 
autossômica recessiva na 
qual as secreções mucosas 
são muito viscosas, 
resultando na obstrução 
dos pulmões, com infecções 
recorrentes, e na má 
absorção dos alimentos 
devido à insuficiência 
pancreática.
unidade 0130
 Estudos a respeito dos mecanismos envolvidos na regulação da 
atividade gênica permitirão a compreensão de porque uma célula, a partir de 
um dado momento, começa a se dividir de forma descontrolada originando 
um câncer. Também poderemos esclarecer por que envelhecemos e, quem 
sabe, como procedermos para retardar esse envelhecimento e até mesmo 
como impedir a evolução de um câncer.
Essas deficiências não serão fáceis de corrigir. Mas compreender 
esse sistema reguladorpoderá acabar sendo fundamental para entendermos 
o polimorfismo genético existente em várias espécies, além de possibilitar a 
criação de estratégias sofisticadas de intervenção médica e de transferência 
de genes funcionais entre espécies não aparentadas geneticamente.
Mutação 
 A mutação já é conhecida há bastante tempo. Darwin já havia 
relatado numerosos registros sobre animais domesticados em que apareciam 
repentinamente novas variedades ou “mutantes”. Porém, foi De Vries, em 
1910, que chamou estas grandes alterações de mutações, e certamente a 
palavra mutante tornou-se, até certo ponto, sinônimo popular de alterações 
flagrantes. 
 Mutação gênica é o processo pelo qual são produzidas novas 
variedades, ou alelos, de um gene. Elas representam alterações (substituições, 
adições ou perdas) que ocorreram ao nível de um ou de alguns nucleotídeos 
na molécula de DNA (Figura 5). Há a possibilidade também de haver o 
surgimento de um RNAt que adiciona um aminoácido por engano na proteína 
formada. 
Figura 5: Três tipos de mutações no DNA. Fonte: FARAH (1997).
Polimorfismo: Ocorrência 
em uma população de 
dois ou mais genótipos 
alternativos, quando a 
frequência de cada um 
deles é superior àquela 
que poderia ser mantida 
somente por mutações 
recorrentes. 
BIOLOGIA MOLECULAR 31
 As diferentes formas de vida que conhecemos possuem cromossomos 
que contêm o material genético, o qual é capaz de sofrer alterações (mutações) 
e ser transmitido através das gerações de forma praticamente perfeita. 
As mutações são causadas por radiações, substâncias mutagênicas 
como, por exemplo, o cigarro ou até mesmo por raios cósmicos vindos do 
espaço. Podemos ter também as mutações espontâneas, que ocorrem por 
rearranjos espontâneos dos nucleotídeos.
 O próprio organismo tem a capacidade de corrigir certos tipos de 
danos estruturais ocorridos no DNA. Há nas células um sistema de reparo do 
DNA representado por um conjunto de enzimas que desempenha funções de 
reconhecer uma mutação no DNA, retirando-a e consertando o erro. 
 Uma mutação que ocorre em uma molécula de DNA de um cromossomo 
de uma célula somática não influi sobre a hereditariedade, não apresentando 
importância evolutiva. As mutações que apresentam importância são as 
germinativas, que ocorrem nos gametas - óvulos e espermatozoides.
 A matéria-prima da evolução são as mutações, alterações herdáveis 
nas sequências de nucleotídeos que determinam as instruções hereditárias 
na molécula de RNAm; única forma de surgimento de novos genes. Portanto, 
esses reparos não devem ser totalmente eficientes. 
 É importante ressaltar que o fato das mutações provocarem 
alterações aleatórias nas bases nitrogenadas que compõem os nucleotídeos 
faz com que os indivíduos sofram mutações não para se adaptarem ao meio 
ambiente, essa alteração é ao acaso e posteriormente haverá uma seleção 
dos genótipos que apresentem uma reprodução diferencial, acarretando na 
evolução da população. Posteriormente, estudos bioquímicos dos efeitos das 
mutações levaram a avanços nesta área.
 Os organismos grandes como os seres humanos apresentam, em 
média, uma mutação para cada 10 gametas - ou seja, existe a probabilidade 
de 10% de que qualquer espermatozoide ou óvulo produzido possua uma 
alteração nova e hereditária nas instruções genéticas que determinam 
formação da geração seguinte.
 As mutações são quase todas deletérias, gerando alterações 
estruturais ou funcionais devastadoras aos seres vivos. A explicação para 
esse fato é que todas as espécies da Terra são fruto da seleção natural e do 
processo de evolução, sendo raro uma máquina de precisão ser aperfeiçoada 
por uma alteração aleatória nas instruções de sua fabricação.
 Dessa forma, o grande responsável pela variabilidade genética 
existente nos seres vivos é o crossing over ou permutação.
unidade 0132
 As mutações, em sua maioria, também são recessivas, ou seja, 
não se manifestam imediatamente. Mesmo em condições laboratoriais não 
conseguimos elevar em demasia os níveis de mutação, pois eles poderiam 
acarretar na morte do indivíduo. 
 O código genético de todos os seres vivos evoluiu por considerar a 
possibilidade de erros, reduzindo o prejuízo provocado por mutações. Como 
exemplo pode-se citar a existência de um código genético degenerado que 
faz com que alguns códons, ao serem modificados, continuem a codificar o 
mesmo aminoácido, não alterando a proteína.
 A capacidade de minimizar os efeitos deletérios das mutações, com 
seus códons sinônimos e com aminoácidos bioquimicamente semelhantes, 
faz com que as mutações de menor efeito, ao contrário das que acarretam 
em grandes modificações, tenham maior probabilidade de serem benéficas, 
tornando a proteína formada mais eficiente. Além disso, códons com duas 
ou três bases em comum são bem parecidos no que diz respeito à atração 
ou repulsão pela água. Essa propriedade é crucial para o funcionamento da 
proteína. 
 Demonstrou-se, em condições laboratoriais, que em 1 milhão de 
alternativas, apenas uma superou o desempenho do código genético natural 
(apresentava uma taxa de mutação menor que do código natural). Uma 
explicação simples e direta para a impressionante resistência do código 
genético é que resulte da seleção natural. Talvez tenham existido muitos 
códigos com vários graus de suscetibilidade a erros. Os organismos cujos 
códigos resistissem melhor às falhas tinham mais chances de sobreviver, 
e o código genético padrão, aquele utilizado por praticamente todos os 
seres vivos, foi o vencedor. Como variações do código são possíveis, essa 
suposição é razoável.
 Em resumo, uma alteração na sequência de nucleotídeos no DNA 
representa uma mutação, podendo acarretar na produção de uma enzima 
alterada, incapaz de realizar sua função.
 Há 60 anos, definiríamos gene como sendo um fragmento de DNA 
capaz de produzir uma enzima, mais tarde essa definição foi alterada para 
um fragmento capaz de produzir uma proteína. Alguns anos se passaram 
para que o conceito de gene fosse modificado para um segmento de DNA 
capaz de produzir uma cadeia polipeptídica, por possuir a informação para 
o sequenciamento de aminoácidos na fabricação desta cadeia. No caso de 
uma proteína ser composta por mais de uma cadeia polipeptídica, existem 
vários genes atuando no processo, cada um codificando uma cadeia.
 A função de uma enzima depende da forma de sua molécula, a qual 
é definida pela sequência de aminoácidos na cadeia polipeptídica. Como 
BIOLOGIA MOLECULAR 33
exemplo pode-se citar o caso da hemoglobina humana, uma proteína formada 
por quatro cadeias polipeptídicas, duas alfa e duas beta, onde as cadeias alfa 
são codificadas por um gene e as cadeias beta são codificadas por outro 
gene. 
 Um exemplo clássico de uma modificação em uma base de um gene 
que acarreta vários efeitos finais é o da anemia falciforme na espécie humana, 
que leva à produção de uma hemoglobina alterada (hemoglobina S) e a uma 
cascata de eventos, podendo, inclusive, culminar com a morte do indivíduo. 
 Uma molécula de hemoglobina humana é formada por dois pares 
de cadeias protéicas, alfa e beta, compostas por 141 e 146 aminoácidos, 
respectivamente. A sequência de aminoácidos das cadeias alfa de ambos os 
tipos de hemoglobina são iguais. A sequência na cadeia beta difere em um 
ponto somente: um ácido glutâmico da homoglobina A (hemoglobina normal) 
está substituído por uma valina na hemoglobina S.
 Uma cadeia de 141 aminoácidos como a cadeia da hemoglobina 
alfa é codificada por um número de nucleotídeos três vezes maior. Se cada 
nucleotídeo puder ser substituído por uma das três “letras” do código, então 
seriam possíveis 1269 eventos mutacionais diferentes, devido a simples 
substituições de nucleotídeos. Uma vez que o código genético é degenerado, 
o número total de possíveis substituições de aminoácidos é menor, mas ainda 
assim bastante grande. De fato, apenas 22 variantes diferentes da cadeia 
alfa foram registradas em populações humanas.
 Imagineuma grande população finita, composta só de homozigotos 
(AA) num determinado loco. Se ocorresse uma mutação (A → a), produzindo 
um único heterozigoto (Aa), qual seria o destino deste alelo nas gerações 
futuras? Dependeria de quantos descendentes o indivíduo Aa tivesse, sendo 
que a chance de cada descendente herdar o gene mutante seria de 50%.
 É sabido que as mutações ocorrem a uma taxa muito baixa (1 em 
10 milhões em média). Supondo que o novo fenótipo produzido pelo gene 
recessivo, quando em homozigose, seja vantajoso. Uma vez que o novo 
heterozigoto (Aa) deve cruzar com um homozigoto (AA), somente metade de 
seus descendentes deverá ter o novo alelo mutante. Quantas gerações seriam 
necessárias para que aparecesse um indivíduo homozigoto recessivo nessa 
espécie diploide? Certamente, várias gerações. Estudos teóricos calculam 
que, nas condições citadas anteriormente seriam necessários 200 mil anos 
para que houvesse 1% de indivíduos homozigotos recessivos (apresentando 
o fenótipo recessivo) nesta população hipotética. 
 Nesse aspecto, as bactérias possuem a vantagem de apresentarem 
uma reprodução extremamente rápida (uma colônia pode se duplicar a 
cada 20 minutos) e toda mutação que sofrer será expresso diretamente nos 
unidade 0134
descendentes (organismos haploides).
WEb-bibLioGRAFiA
http://www.lfdgv.ufsc.br/transcriptoma.pdf
http://pt.wikipedia.org/wiki/C%C3%B3digo_gen%C3%A9tico
http://www.coladaweb.com/biologia/codigo.htm
http://www.mundoeducacao.com.br/biologia/codigo-genetico.htm
http://www.portalbiologia.com.br/biologia/principal/conteudo.asp?id=6716
http://www.sobiologia.com.br/conteudos/Biotecnologia/recombinante.php
http://pt.wikipedia.org/wiki/Muta%C3%A7%C3%A3o
ExERCíCioS
1 - A respeito da natureza química e da funcionalidade do DNA, julgue as 
seguintes afirmações: 
a) “Moléculas de DNA isoladas de diferentes tecidos da mesma pessoa 
possuem a mesma composição de bases.” Sim ou Não? Justifique.
b) “O conteúdo informacional do DNA reside na sequência em que suas 
unidades monoméricas estão ordenadas.” Sim ou Não? Justifique.
2 - Cada célula do corpo humano contém 46 cromossomos.
a) Quantas moléculas de DNA isso representa?
b) Quantos tipos diferentes de moléculas de DNA isso representa?
3 - Por que o nível de compactação do DNA é maior em eucariontes que em 
procariontes?
4 - Em que estágio do ciclo celular eucariótico você espera que o DNA esteja 
mais compactado? E menos compactado? Explique.
5 - Qual a relação numérica aproximada entre contagem gênica e a contagem 
de proteínas? 
6 - O que acontece com as histonas durante a replicação?
7 - O crossing over ocorre antes ou após a síntese de DNA?
8 - Em que organismos o RNA é o único material genético?
BIOLOGIA MOLECULAR 35
9 - O RNA é sintetizado em que molde? Com que enzima? É necessário um 
primer?
10 - O gene para a proteína humana albumina ocupa uma região cromossômica 
de 25.000 pares de bases (25 quilobases ou kb) do começo da sequência 
codificante de proteínas até sua ponta, mas o RNA mensageiro para essa 
proteína tem apenas 2,1kb de tamanho. O que você imagina que explica esta 
grande diferença? 
11 – Marque a alternativa certa para mamíferos normais.
a) A proliferação e a diferenciação ocorrem em qualquer tipo celular, 
independentemente do seu grau de maturação, pois são processos controlados 
por fatores intracelulares restritos ao núcleo. As condições técnicas e as do 
meio, durante o processo de clonagem, modificam a expressão gênica.
b) A diferenciação depende do genoma, ocorrendo em qualquer tipo celular, 
independentemente do seu grau de maturação. Os fatores ambientais, 
portanto, podem, durante o processo de clonagem, modificar a expressão 
gênica.
c) A proliferação não está restrita às células-tronco, pois, no processo de 
clonagem de anfíbios utilizou-se o núcleo de uma célula especializada. As 
condições experimentais, portanto, não modificam a expressão gênica.
d) Todas as células, independentemente do seu grau de maturação, 
contêm o mesmo genoma. A proliferação e a diferenciação são processos 
controlados por fatores intra e extracelulares, assim é possível que condições 
experimentais do processo de clonagem modifiquem a expressão gênica.
e) A proliferação e a diferenciação ocorrem em qualquer tipo celular, 
independentemente do seu grau de maturação, pois são processos 
controlados por fatores nucleares. No processo de clonagem, a manipulação 
e O meio externo não modificam a expressão gênica, pois as condições 
experimentais são rigorosamente controladas.
12 – Dados mostram que a incidência de câncer devido a explosão da bomba 
atômica em Hiroshima e Nagasaki na década de 40 é muito alta.
a) Como a radiação está relacionada ao aumento na incidência de câncer?
b) Como se explica que muitos dos efeitos da bomba atômica se manifestem 
nos descendentes dos sobreviventes?
c) Por que algumas pessoas que foram viver nessas cidades tempos depois 
da explosão também foram afetadas?
13 - Atenção: Para responder à questão abaixo, considere o texto abaixo.
unidade 0136
A anemia falciforme é uma doença hereditária com herança autossômica 
recessiva, que tem grande incidência nas populações africanas negras. Os 
indivíduos afetados são homozigotos (HbS / HbS) em relação a uma alteração 
na hemoglobina. Os indivíduos heterozigotos (HbA / HbS) geralmente não 
manifestam os sintomas da doença e são denominados portadores do traço 
falcêmico. O pesquisador Vernon Ingram observou, em 1957, que a única 
diferença entre a hemoglobina mutante dos afetados e a hemoglobina normal 
é a presença do aminoácido valina em lugar do ácido glutâmico na posição 6 
em uma das cadeias da molécula.
Do ponto de vista histórico, é correto afirmar que o principal impacto da 
pesquisa de Ingram foi:
a) Decifrar o código genético.
b) Evidenciar a relação direta entre o RNA mensageiro e a cadeia de 
aminoácidos nas proteínas.
c) Comprovar que era possível sequenciar as bases do DNA por meio dos 
aminoácidos.
d) Demonstrar que as mutações podem causar alterações nas cadeias 
polipeptídicas.
e) Verificar que as mutações causam alterações nas moléculas de RNA 
mensageiro.
14 - Dentre quatro populações pequenas e geograficamente próximas de 
descendentes de escravos africanos, apenas uma foi detectada portador do 
traço falcêmico. Uma vez que nenhuma das populações está sujeita a fluxo 
gênico, a observação pode ser explicada por
a) Taxas de recombinação diferentes em cada população.
b) Taxas de mutação constantes em cada população.
c) Derivação genética e migração.
d) Altas taxas de endogamia em cada população.
e) Diferentes genótipos fundadores em cada população e em pequeno 
tamanho populacional.
15 - Na revista Science de 14 de dezembro de 2001, um grupo de 
pesquisadores relatou a cura da anemia falciforme em camundongos, através 
de terapia gênica. A partir de um retrovírus modificado, a equipe construiu 
um vetor para introdução do gene terapêutico. A estratégia do experimento 
baseou-se no fato de haver integração, ao genoma das células infectadas, 
de uma cópia do:
a) RNA viral, retrotranscrita em DNA.
b) DNA viral, transcrita em RNA.
BIOLOGIA MOLECULAR 37
c) RNA viral, retrotranscrita em RNA.
d) RNA viral, embora ambos os ácidos nucléicos tenham sido introduzidos 
nas células.
e) DNA viral, embora ambos os ácidos nucléicos tenham sido introduzidos 
nas células.
16 – A tuberculose figura como uma das doenças mais letais; isso se deve 
ao fato dos bacilos terem se tornado resistentes ao antibiótico usado para 
combatê-los. Considerando que a resistência de uma população de bactérias 
a um antibiótico é resultado de mutação ao acaso e que a taxa de mutação 
espontânea é muito baixa, foi proposto o uso simultâneo de diferentes 
antibióticos para o tratamento de doentes com tuberculose. Com relação a 
esse procedimento, foram levantados os seguintes argumentos:
I. O tratamento não será efetivo para o paciente, uma vez que a resistência 
ao antibiótico não é reversível.
II. O tratamento terá altachance de ser efetivo para o paciente, pois a 
probabilidade de que uma bactéria seja resistente a dois ou mais antibióticos 
é extremamente baixa.
III. O tratamento poderá apresentar riscos para a população, pois poderá 
selecionar linhagens bacterianas altamente resistentes a antibióticos. 
Analisando as informações contidas no texto, pode-se concluir que apenas
a) O argumento I é válido.
b) O argumento II é válido.
c) O argumento III é válido.
d) O argumento I e III é válido.
e) O argumento II e III é válido.
17 – Por que uma célula geneticamente idêntica a outra pode assumir forma 
e função tão distinta?
Atenção: Para responder às questões de números 18 a 20 considere o texto 
abaixo. 
João trabalha em uma confeitaria cujo proprietário é alemão. Toda manhã este 
deixa sobre a mesa da cozinha, uma receita em português e os ingredientes 
de um bolo que João deve preparar. A receita original, escrita em alemão, fica 
guardada no escritório da confeitaria. Somente o patrão de João pode abrir 
o escritório e escrever, em português, a receita a ser utilizada naquele dia.
18 - Para explicar a leigos o funcionamento de uma célula, fazendo uma 
analogia com o texto, o bolo, seus ingredientes, a receita em português e a 
unidade 0138
receita em alemão corresponderão, respectivamente, a: 
a) aminoácido, nucleotídeos, DNA e RNA.
b) nucleotídeo, aminoácidos, RNA e DNA.
c) polipeptídeo, aminoácidos, RNA e DNA.
d) DNA, RNA, polipeptídeo e aminoácido.
e) DNA, aminoácidos, nucleotídeo e polipeptídeo.
19 - Continuando a analogia, o escritório, a cozinha e João corresponderão, 
respectivamente, aos seguintes componentes de uma célula de eucarioto:
a) citoplasma, núcleo e cromossomo.
b) núcleo, citoplasma e ribossomo.
c) citoplasma, núcleo e membrana nuclear.
d) núcleo, citoplasma e cromossomo.
e) cromossomo, membrana nuclear e citoplasma.
20 - Alguns bolos são servidos assim que saem do forno, enquanto outros 
recebem acabamento especial. Na analogia considerada, o local da confeitaria 
onde os bolos recebem recheio e cobertura, corresponde:
a) à mitocôndria.
b) ao retículo endoplasmático rugoso.
c) ao peroxissomo.
d) ao lisossomo.
e) ao complexo de Golgi.
21 - As mitocôndrias possuem uma única molécula de DNA circular. Isto 
torna a organização do material genético dessas organelas semelhante à 
organização do material genético presente em:
a) bactérias e cloroplastos.
b) plantas e algas verdes.
c) fungos e vírus.
d) vírus e bactérias.
e) protozoários e cloroplastos.
22 – Explique o que é um gene.
23 - Existem três tipos de RNA: o que contém as informações para a síntese 
protéica: o que transporta aminoácidos para que ocorra a síntese e o que 
participa da maquinaria de síntese. Identifique a sequência respectiva:
a) RNA mensageiro, RNA transportador, RNA ribossômico.
b) RNA ribossômico, RNA transportador, RNA mensageiro.
c) RNA transportador, RNA ribossômico, RNA mensageiro.
BIOLOGIA MOLECULAR 39
d) RNA mensageiro, RNA ribossômico, RNA transportador.
e) RNA ribossômico, RNA mensageiro, RNA transportador.
24 - Qual o material genético do vírus?
a) DNA.
b) RNA.
c) DNA ou RNA.
d) nenhuma das alternativas.
25 - Assinale a alternativa falsa. O DNA:
a) é uma macromolécula.
b) contém informações que a célula utiliza para a síntese de proteínas.
c) em eucariotos o DNA se encontra no núcleo.
d) pode assumir a estrutura de dupla hélice.
e) é feito de apenas oito diferentes monômeros.
26 - Assinale a alternativa falsa. O RNA:
a) normalmente é dupla hélice.
b) contém uracila.
c) pode agir como catalisador.
d) é encontrado em todas as células.
e) tem três papéis importantes na síntese de proteínas.
27 - É falso afirmar. O código genético:
a) é um código triplo.
b) é degenerado.
c) das bactérias é totalmente diferente das plantas.
d) de um RNAm pode especificar duas sequências de aminoácidos se o 
código for lido em dois pedaços diferentes.
e) foi descrito entre 1950 e 1960.
28 - A respeito da natureza química e da funcionalidade do DNA, julgue a 
seguinte afirmação: “Espécimes de DNA isolados de diferentes tecidos da 
mesma pessoa possuem a mesma composição de bases.” SIM OU NÃO? 
(JUSTIFIQUE SUA RESPOSTA).
29 - “Durante a desnaturação do DNA são quebradas as ligações covalentes 
presentes em sua estrutura.” SIM OU NÃO? (JUSTIFIQUE SUA RESPOSTA).
30 - “Nas moléculas de DNA dos eucariotos, a ocorrência das bases G + 
C é aproximadamente igual à de T + A.” SIM OU NÃO? (JUSTIFIQUE SUA 
RESPOSTA).
unidade 0140
 
BIOLOGIA MOLECULAR 41
UNIDADE 02
Isolamento e Clonagem de 
um Gene Específico
Nesta unidade fornecemos as bases necessárias à compreensão dos mecanismos de isolamento e 
clonagem de um gene específico. Além disso, é oferecido ao estudante o aprendizado de como é 
construída a molécula de DNA Recombinante. 
unidade 0242
BIOLOGIA MOLECULAR 43
IsOLAMENtO E CLONAGEM DE 
UM GENE EsPECíFICO
Isolamento de um gene específico
A partir do momento em que a estrutura do DNA foi elucidada e se 
entendeu como ocorre a produção de proteínas pelas células, os pesquisadores 
sonham em poder controlar a síntese de proteínas com o intuito de produzir 
proteínas raras e valiosas para o homem. Ou seja, o homem almeja isolar 
um determinado gene, multiplicá-Io e conseguir quantidades razoáveis da 
proteína que este gene codifica.
Há trinta anos surgia a Tecnologia do DNA Recombinante e o homem 
começava a “brincar de Deus”, manipulando os genes e utilizando micro-
organismos como verdadeiras fábricas, no intuito de produzir, em larga escala, 
proteínas importantes como a insulina, hormônio de crescimento, interferon 
(proteína antiviral), etc. No passado estes produtos foram obtidos do sangue 
do doador e de outros animais. Sua obtenção e purificação eram lentas e 
caras. Os produtos gênicos criados geneticamente estão rapidamente ficando 
mais baratos e se tornando uma alternativa mais eficiente.
Houve um grande impulso nesta área, pois o apelo comercial é muito 
grande. Imaginemos o exemplo da insulina, onde indústrias farmacêuticas 
lançam esta proteína no mercado para o tratamento da diabetes, uma doença 
que afeta aproximadamente 1 a cada 200 indivíduos da raça branca, gerando 
um mercado consumidor na ordem de milhões de dólares diariamente.
A produção de moléculas através da Tecnologia do DNA Recombinante 
não é simples, pois o DNA é uma molécula muito regular, sendo variável apenas 
em quatro diferentes bases nitrogenadas, apresentando características 
químicas muito semelhantes. Regiões que participam da formação de uma 
proteína são semelhantes a regiões não codificadoras.
Além disso, a molécula de DNA, que compõe um cromossomo dos 
organismos superiores, é imensa (o tamanho do DNA existente em um 
núcleo humano representa 50000 vezes a viagem da Terra à Lua), contendo 
unidade 0244
milhares de genes. O genoma humano tem 3 bilhões de pares de bases, um 
gene pode conter menos do que 2000 pb. Isso significa que um gene pode 
ser um fragmento de DNA perdido entre 1,5 milhão de outros fragmentos 
praticamente iguais. 
O DNA, quando extraído da célula, é muito frágil e tende a se quebrar. 
Como a molécula se quebra casualmente, as quebras podem acontecer 
dentro dos genes, separando-o em dois ou mais fragmentos diferentes. 
Dessa forma, encontrar um gene específico entre o DNA total de 
uma célula é, certamente, mais difícil que encontrarmos uma agulha em um 
palheiro, já que a composição química da palha é diferente da agulha, bem 
como o seu aspecto morfológico.
Vale a pena salientar que há alguns anos, a localização de um 
gene específico era impossível. Essa situação só pôde ser superada 
com o desenvolvimento de métodos para se criar uma molécula de DNA 
recombinante (fragmento contendo DNAs de origens diferentes).
Quando se pretende analisar uma estrutura complexa como, por 
exemplo, o motor de um jato, e entender como cada peça funciona, fica 
muito mais fácil se o motor for desmontado e as peças separadas de forma 
organizada. É mais ou menos isso que se faz com o DNAtotal de um 
organismo, o genoma, quando se pretende isolar um gene específico.
Primeiramente, temos que obter um DNA em qualidade e quantidade 
adequadas de forma rápida e eficiente. Embora o homem tenha conseguido 
isolar DNA de múmias de 4000 anos, amostras herbarizadas, fósseis e de 
amostras com elevado nível de destruição (como no caso de um acidente 
aéreo, por exemplo), a quantidade e qualidade de DNA em geral são afetadas 
significativamente pela condição do tecido antes da extração.
Os cuidados iniciais durante a coleta e o armazenamento podem 
reduzir em muito os problemas encontrados posteriormente na qualidade do 
DNA, que em geral resultam na sua degradação.
Embora o DNA genômico possa ser obtido de qualquer tecido humano, 
na prática, as seguintes amostras são utilizadas principalmente: sangue, 
pela facilidade da coleta, sendo que o DNA é extraído dos glóbulos brancos 
(leucócitos), uma vez que as hemácias não possuem núcleo; cultura de 
fibroblastos, estabelecida a partir de biópsia de pele; culturas transformadas 
de linfócitos ou, no caso de diagnóstico pré-natal, fluido amniótico e vilosidades 
coriônicas, em que o DNA pode ser extraído diretamente do material coletado 
ou após a cultura de células. A extração e a purificação do DNA genômico 
compreendem vários passos que incluem a lise das células, extração das 
proteínas, RNA e precipitação do DNA. 
A maioria dos protocolos de extração de DNA vegetal envolve 
Diagnóstico pré-natal: 
Diagnóstico de uma 
doença realizado antes do 
nascimento.
BIOLOGIA MOLECULAR 45
uma fase onde objetiva-se romper as paredes e membranas celulares. A 
maceração de tecido fresco pode ser feita na presença de nitrogênio líquido 
ou com o auxílio de moinho elétrico se o tecido for liofilizado. Posteriormente, 
utiliza-se um tampão de extração, contendo algum detergente, antioxidante 
e agente tamponante, visando à solubilização de membranas lipoprotéicas e 
desnaturação de proteínas, enquanto o DNA é protegido da ação de enzimas 
de degradação. Esta suspensão é submetida a uma temperatura entre 50 e 
60ºC durante 15 a 60 minutos para facilitar a solubilização e homogeneização 
da suspensão.
Na terceira etapa, esta suspensão é submetida a uma extração com 
um solvente orgânico, clorofórmio-álcool isoamílico. As fases orgânicas e 
aquosas são separadas através de centrifugação. Nesta extração, lipídios, 
proteínas e a maioria dos polissacarídeos são retidas na fase orgânica 
inferior, enquanto que o DNA, RNA e alguns polissacarídeos são retidos na 
fase aquosa (superior). Na quarta etapa, um álcool (isopropanol ou etanol) 
é adicionado à fase aquosa. O DNA na presença de sal e álcool forma um 
precipitado, frequentemente visível, que pode ser “pescado” ou sedimentado 
por centrifugação. Após lavagens do precipitado com álcool, na quinta e 
última etapa este precipitado de DNA/RNA é ressuspendido em um tampão 
Tris-EDTA contendo RNAse para degradar o RNA, restando apenas o DNA 
genômico desejado.
Várias são as técnicas utilizadas na quantificação de DNA. Algumas 
dependem do emprego de equipamentos muitas vezes onerosos como 
espectrofotômetros, enquanto outras, menos precisas, são simples e baratas. 
A opção por um ou outro método depende basicamente da condição do 
laboratório e dos objetivos do experimento a ser realizado. 
Duas técnicas bastante utilizadas na quantificação de DNA para 
análises moleculares são a quantificação através de fluorímetro e a 
quantificação comparativa em géis corados com brometo de etídio.
A técnica de quantificação através de fluorímetro utiliza um equipamento 
bem menos oneroso que um espectrofotômetro. Esta técnica baseia-se na 
adição de um composto (DAPI) à solução de DNA e na quantificação do 
DNA com base na emissão de fluorescência deste composto. O DAPI é 
um composto que se liga à molécula de DNA como uma sonda e que emite 
fluorescência ao ser excitado pelo feixe de luz do fluorímetro. Quanto maior 
a fluorescência emitida, maior a concentração de DAPI associado a DNA, e, 
portanto, maior a concentração de DNA. 
Outra técnica bastante simples utilizada na quantificação de DNA é 
a análise comparativa de amostras coradas com brometo de etídio em géis 
de agarose. A técnica consiste simplesmente em se estimar, visualmente, 
Desnaturação do DNA: É 
o processo de separação 
das fitas complementares 
do DNA ou RNA, que rompe 
as pontes de hidrogênio 
através de temperaturas 
elevadas ou do tratamento 
com solução alcalina. 
unidade 0246
a concentração do DNA de concetração desconhecida, por meio da 
eletroforese do DNA-padrão e da amostra de concentração desconhecida em 
gel de agarose. A estimativa das concentrações das bandas é feita sob luz 
ultravioleta com base na fluorescência.
Como ocorre a separação de DNA e RNA durante a eletroforese, 
reduz a imprecisão do processo de quantificação quando o ácido nucléico 
analisado apresenta contaminantes que se ligam ao brometo de etídio. A 
observação da fotografia do gel sob luz ultravioleta ou da imagem digitalizada 
do gel, proporciona uma estimativa aproximada da concentração de DNA das 
soluções testadas.
Quando possível, é de extrema importância evitar a quantificação 
pela observação direta das bandas sob luz ultravioleta. Exposição prolongada 
à luz ultravioleta, mesmo com proteção de máscaras, deve ser evitada. A 
fotografia (ou imagem digitalizada), além de registrar a quantificação, evita os 
problemas com exposição prolongada à luz ultravioleta.
Clonagem de um gene específico
Posteriormente à extração do DNA, cortamos a molécula de DNA 
que contém o gene de interesse em fragmentos menores. Cada um desses 
fragmentos é então ligado a outra molécula de DNA capaz de transportá-Io 
separadamente para dentro de uma célula hospedeira apropriada. A célula 
que recebe a molécula híbrida (DNA recombinante) passa a funcionar como 
uma fábrica dessa molécula, duplicando-a a cada divisão celular (clonagem 
gênica). Assim, cada fragmento é produzido em larga escala, possibilitando 
a localização de qual fragmento está o gene que nos interessa e que 
posteriormente iremos isolar.
Quanto maior for o número de diferentes fragmentos produzidos, mais 
difícil será encontrar um determinado fragmento no qual o gene de interesse 
está presente. Por essa razão, bancos genômicos de organismos complexos, 
como o homem, devem ser construídos de preferência com fragmentos de 
DNA não muito pequenos. 
 Outra forma de se reduzir o número de clones que devemos analisar 
é diminuindo o tamanho daquilo que se deseja representar no banco. 
Por exemplo, quando se conhece previamente em qual dos 23 pares de 
cromossomos humanos está presente o gene que se pretende isolar, pode-
se construir um banco no qual somente esse cromossomo específico esteja 
representado, ao invés de todo o genoma humano. Nesse caso, trata-se de 
um banco cromossômico.
Podemos isolar um cromossomo particular de uma célula com o 
BIOLOGIA MOLECULAR 47
auxílio de um equipamento capaz de reconhecer diferenças mínimas entre os 
cromossomos. Tal equipamento, o flow sorter, funciona baseado no princípio 
de que cada cromossomo tem um conteúdo de DNA característico, o que 
permite seu reconhecimento. Cromossomos metafásicos são corados com 
corantes fluorescentes e passam através de raios laser. A fluorescência 
emitida depende do conteúdo de DNA, sendo, portanto, específica para 
cada cromossomo. Cromossomos que exibem a fluorescência desejada 
são marcados pela aquisição de cargas elétricas, e uma placa defletora do 
equipamento seleciona os cromossomos segundo as cargas elétricas que 
apresentam. Dessa forma, amostras praticamente puras de um cromossomo 
específico podem ser obtidas para, a partir daí, o banco cromossômico ser 
construído.
Embora todos os genes estejam presentes em todas as células de um 
organismo, somente um pequeno conjunto desses genes está ativo em um 
determinado tecido. A atividade de um gene resulta na produção da proteína 
que ele codifica. Quando um gene se expressa

Outros materiais