Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade Federal do Piauí Centro de Educação Aberta e a Distância BIOLOGIA MOLECULAR Sérgio Emílio dos Santos Valente Ministério da Educação - MEC Universidade Aberta do Brasil - UAB Universidade Federal do Piauí - UFPI Universidade Aberta do Piauí - UAPI Centro de Educação Aberta e a Distância - CEAD Sérgio Emílio dos Santos Valente BIOLOGIA MOLECULAR Cleidinalva Maria Barbosa Oliveira Ubirajara Santana Assunção Zilda Vieira Chaves Elis Rejane Silva Oliveira Roberto Denes Quaresma Rêgo Samuel Falcão Silva Cleonildo F. de M. Neto Ligia Carvalho de figueiredo Maria da Penha Feitosa PRESIDENTE DA REPÚBLICA MINISTÉRIO DA EDUCAÇÃO GOVERNADOR DO ESTADO REITOR DA UNIVERSIDADE FEDERAL DO PIAUÍ SECRETÁRIO DE EDUCAÇÃO A DISTÂNCIA DO MEC PRESIDENTE DA CAPES COORDENADOR GERAL DA UNIVERSIDADE ABERTA DO BRASIL DIRETOR DO CENTRO DE EDUCAÇÃO ABERTA E A DISTÂNCIA DA UFPI Dilma Vana Rousseff Linhares Fernando Haddad Wilson Nunes Martins Luiz de Sousa Santos Júnior Carlos Eduardo Bielshowsky Jorge Almeida Guimarães Celso Costa Gildásio Guedes Fernandes CONSELHO EDITORIAL DA EDUFPI Prof. Dr. Ricardo Alaggio Ribeiro (Presidente) Des. Tomaz Gomes Campelo Prof. Dr. José Renato de Araújo Sousa Profª. Drª. Teresinha de Jesus Mesquita Queiroz Profª. Francisca Maria Soares Mendes Profª. Iracildes Maria de Moura Fé Lima Prof. Dr. João Renór Ferreira de Carvalho COORDENAÇÃO DE MATERIAL DIDÁTICO TÉCNICOS EM ASSUNTOS EDUCACIONAIS EDIÇÃO PROJETO GRÁFICO DIAGRAMAÇÃO REVISÃO REVISÃO GRÁFICA © 2011. Universidade Federal do Piauí - UFPI. Todos os direitos reservados. A responsabilidade pelo conteúdo e imagens desta obra é dos autores. O conteúdo desta obra foi licenciado temporária e gratuitamente para utilização no âmbito do Sistema Universidade Aberta do Brasil, através da UFPI. O leitor se compromete a utilizar o conteúdo desta obra para aprendizado pessoal, sendo que a reprodução e distribuição ficarão limitadas ao âmbito interno dos cursos. A citação desta obra em trabalhos acadêmicos e/ou profissionais poderá ser feita com indicação da fonte. A cópia desta obra sem autorização expressa ou com intuito de lucro constitui crime contra a propriedade intelectual, com sansões previstas no Código Penal. É proibida a venda ou distribuição deste material. EQUIPE DE DESENVOLVIMENTO COORDENADORES DE CURSOS ADMINISTRAÇÃO CIÊNCIAS BIOLÓGICAS FILOSOFIA FÍSICA MATEMÁTICA PEDAGOGIA QUÍMICA SISTEMAS DE INFORMAÇÃO Francisco Pereira da Silva Filho Maria da Conceição Prado de Oliveira Zoraida Maria Lopes Feitosa Miguel Arcanjo Costa João Benício de Melo Neto Vera Lúcia Costa Oliveira Rosa Lima Gomes do Nascimento Pereira da Silva Luiz Cláudio Demes da Mata Sousa Este texto é destinado aos estudantes que participam do programa de Educação a Distância da Universidade Aberta do Piauí (UAPI) vinculada ao consórcio formado pela Universidade Federal do Piauí (UFPI), Universidade Estadual do Piauí (UESPI), Instituto Federal de Educação, Ciência e Tecnologia do Piauí (IFPI), com apoio do Governo do estado do Piauí, através da Secretaria de Educação e Cultura (SEDUC). O texto é composto de quatro unidades, contendo itens e subitens, que discorrem sobre a importância da Biologia Molecular, apresentando conceitos fundamentais sobre a estrutura e função dos ácidos nucléicos, Engenharia Genética e Marcadores Moleculares. Na Unidade 1 apresentamos a organização estrutural e funcional do material genético, fornecendo as bases necessárias à compreensão a respeito da estrutura e funcionamento do material genético nas células dos seres vivos. Na Unidade 2 comentamos a respeito dos mecanismos de isolamento e clonagem de um gene específico, oferecendo aos estudantes o aprendizado de como é construída a molécula de DNA Recombinante. Na Unidade 3 abordamos sobre as vantagens e desvantagens da tecnologia do DNA recombinante, apresentando pontos positivos e negativos da manipulação genética. Na Unidade 4 elucidamos a parte referente às diferentes técnicas utilizadas na caracterização molecular, apresentando vantagens e desvantagens de cada uma. UNIDADE 1 ESTRUTURA E FUNÇÃO DO MATERIAL GENÉTICO Estrutura do material genético ...........................................................11 Código genético .................................................................................. 16 Síntese protéica .................................................................................. 18 Regulação da ação gênica...................................................................23 Mutação..............................................................................................30 UNIDADE 2 ISOLAMENTO E CLONAGEM DE UM GENE ESPECÍFICO Isolamento de um gene específico .....................................................43 Clonagem de um gene específico .......................................................46 Enzimas de restrição ........................................................................... 52 Construção da molécula de DNA recombinante.................................54 UNIDADE 3 VANTAGENS E DESVANTAGENS DA TECNOLOGIA DO DNA RECOMBI- NANTE Vantagens e desvantagens da tecnologia do DNA recombinante ......63 UNIDADE 4 MARCADORES MOLECULARES EM ESPÉCIES VEGETAIS Introdução aos marcadores moleculares ...........................................87 Eletroforese.......................................................................................88 Eletroforese de proteínas...........................................................89 Isoenzimas..................................................................................91 Polimorfismo NO COMPRIMENTO DE FRAGMENTOS DE RESTRIÇÃO – RFLP......................................................................94 Vntrs.........................................................................................104 9 41 61 85 polymerase chain reaction (PCR).............................................104 random amplified polymorphic DNA (RAPD).........................107 Microssatélites.........................................................................109 Aplicações dos marcadores moleculares.................................112 UNIDADE 01 Estrutura e Função do Material Genético A disciplina Biologia Molecular versa sobre aspectos referentes à organização estrutural e funcional do material genético. Nesta unidade fornecemos as bases necessárias à compreensão da estrutura e funcionamento do material genético presente nas células dos seres vivos. Além disso, será oferecido ao estudante o aprendizado de termos utilizados na Área de Biologia Molecular. Esta unidade tem como meta principal oferecer uma visão sobre os mecanismos envolvidos na hereditariedade e variação genética. BIOLOGIA MOLECULAR 11 EstRUtURA E FUNçãO DO MAtERIAL GENétICO Estrutura do material genético Desde 1865, quando Gregor Mendel cruzava ervilhas e propôs as leis da hereditariedade, até o ano de 2003, quando foi anunciada a conclusão do Projeto Genoma Humano, a Biologia avançou enormemente, sendo a grande área do conhecimento que teve mais avanços no último século. Há quase 70 anos se definiu que o DNA era a molécula responsável pelo armazenamento e transmissão das características hereditárias. Em 1953, James D. Watson e Francis H. Crick esclareceram a estrutura da molécula de DNA, determinando como uma macromolécula (polímero) era formada pela associação de vários nucleotídeos, que podiam ser de quatro tipos, dependendo da base nitrogenada presente: adenina (A), timina (T), citosina (C) e guanina (G). A nossa informação hereditária é determinada pela sequência desses quatro tipos de nucleotídeos. Podemos dizer que a linguagem do mecanismo da hereditariedade é escrita com um alfabeto de apenas quatro letras. Em todos os organismos, com exceção de alguns vírus, a molécula responsável pelas características hereditárias é o DNA (ácido desoxirribonucléico). O Genoma Humano é constituído de aproximadamente três bilhõesde pares de nucleotídios. As instruções genéticas de todas as outras formas de vida da Terra são escritas na mesma língua, usando o mesmo código genético. Na realidade, essa linguagem genética comum a todas as espécies constitui um ponto de apoio à teoria de que todos os organismos da Terra descendem de um único ancestral. Um cromossomo humano típico possui apenas uma molécula de DNA, muito longa e que se enrola, de forma que o espaço ocupado é muito menor do que seria se não fosse a sua forma espiralada. A cromatina é o material de que são feitos os cromossomos, sendo composto de DNA e Código genético: O código pelo qual a informação genética, contida na sequência de nucleotídeos do DNA, relaciona-se com a sequência de aminoácidos da proteína. Cada três bases do DNA (tríplex) especificam um dos vinte aminoácidos na proteína. Ácido desoxirribonucléico (DNA): Classe das macromoléculas que consiste de duas cadeias longas de nucleotídeos. unidade 0112 proteínas. A unidade estrutural básica da cromatina é chamada nucleossomo (um conjunto de proteínas histônicas onde a molécula de DNA dá duas voltas, formando uma fibra com aspecto de contas de um colar). Um dos níveis de empacotamento do DNA nos cromossomos é obtido pelo fato da fibra de nucleossomos enrolar-se sobre si formando uma estrutura que pode ser visualizada ao microscópio eletrônico. Essa estrutura é chamada de Solenóide. O conteúdo de informação de um cromossomo humano corresponde a cerca de 500 milhões de palavras. Se existem cerca de 300 palavras em uma página impressa comum, isso corresponde a mais ou menos dois milhões de páginas. Se um livro comum contém 500 páginas desse tipo, o conteúdo de informação de um único cromossomo humano corresponde a uns quatro mil volumes. Então, a sequência de bases contidas no DNA representa uma enorme quantidade de informação. A molécula de DNA apresenta dois filamentos, sendo semelhante a uma escada, em que a pentose e o grupo fosfato seriam o corrimão e as bases nitrogenadas, unidas por meio de pontes de H, representando os degraus (Figura 1). BIOLOGIA MOLECULAR 13 Figura 1: Ligação de duas cadeias de nucleotídeos por pontes de hidrogênio formando a dupla hélice. Fonte: FARAH (1997). A Figura 2 ilustra as ligações que ocorrem entre os nucleotídeos que formam a molécula de DNA. unidade 0114 Figura 2: A) A ligação fosfodiéster ocorre entre o grupo OH (no carbono 3’ do último nucleotídeo da cadeia) e o trifosfato (no carbono 5’do nucleotídeo recém-acoplado). B) A cadeia de nucleotídeos mostrando o terminal 5’(grupo fosfato) e 3’(grupo OH) em cada ponta. Fonte: FARAH (1997). BIOLOGIA MOLECULAR 15 As células representam a unidade dos organismos vivos e são compostas por dois compartimentos básicos: o núcleo e o citoplasma. O DNA é encontrado principalmente no núcleo de células eucariontes e em pequenas quantidades nas mitocôndrias e nos cloroplastos (em células vegetais). Já o RNA é encontrado principalmente no citoplasma e, em menor quantidade, no interior do núcleo, mitocôndrias e cloroplastos (em células vegetais). Em células procariontes o DNA está contido no cromossomo bacteriano e em uma molécula pequena denominada plasmídeo, que se situam dispersas no citoplasma bacteriano, já que essas células não possuem envoltório nuclear. O DNA consegue armazenar a informação genética por conseguir produzir cópias perfeitas de si mesmo, por meio da replicação semiconservativa. Nesse modelo de replicação, uma molécula sintetiza duas idênticas a ela, com cada uma das moléculas filhas apresentando uma fita antiga (molde), oriunda da molécula original, e uma molécula nova, recém Figura 3: Duplicação da molécula de DNA (A) e a aparência do cromossomo antes e depois da duplicação (B). As cromátides irmãs, que compõem um cromossomo, são réplicas idênticas. Fonte: FARAH (1997). unidade 0116 sintetizada (Figura 3). O dogma central da Biologia Molecular consiste na transcrição das informações genéticas do DNA em moléculas de RNA, que por sua vez são traduzidas nas proteínas. Os genes seriam, em geral, sinônimos de proteínas, ladeados por sequências que regulam a atividade gênica. A informação genética fica armazenada no DNA e no RNA (formados por nucleotídeos), porém, os organismos são constituídos basicamente por proteínas formadas por aminoácidos, ou seja, a sequência de nucleotídeos que descreve uma única proteína que precisa ser traduzida de uma forma semelhante à tradução do português para o chinês. O genoma humano apresenta 3 bilhões de pares de bases. Considerando-se o tamanho médio de um gene humano, essa quantidade de DNA seria suficiente para codificar 3 milhões de proteínas de tamanho médio, número muito maior do que a quantidade estimada de proteínas existentes nas células humanas. Código genético Alguns anos se passaram para o homem esclarecer como ocorria a síntese de proteínas. Sabia-se que a molécula de DNA variava em apenas quatro tipos de nucleotídeos. Portanto, o código genético construído a partir de quatro letras deveria ser capaz de informar às células quais dos 20 aminoácidos tinham de ser ligados, a fim de formar as milhares de proteínas constituintes de bilhões de formas de vida. Combinações de duas letras possibilitariam apenas 16 possíveis “palavras” ou “códons”. Mas, combinações triplas produziriam 64 códons, quantidade mais que suficiente para a produção dos 20 aminoácidos. O código genético foi então decifrado na década de 1960, mostrando que os aminoácidos se organizam a partir de uma sequência de 3 bases nitrogenadas apenas. Cada três letras do DNA controlam a adição de um aminoácido na molécula da cadeia polipeptídica, segundo o código genético (Figura 4). Primeiramente, a informação genética do DNA é transcrita em um RNAm que leva essa informação do núcleo para o citoplasma, objetivando a tradução em uma sequência de aminoácidos. BIOLOGIA MOLECULAR 17 Figura 4: O código genético. Fonte: FARAH (1997). Até 1965, os aminoácidos correspondentes de praticamente todos os 64 códons possíveis haviam sido determinados em laboratório. Observou- se que alguns códons eram redundantes, com certos aminoácidos sendo especificados por dois, quatro e até seis trincas diferentes. O código genético era então chamado degenerado. Surgem então algumas questões não esclarecidas ainda. Por que 20 e somente 20 aminoácidos padrão? Por que alguns aminoácidos têm seis códons correspondentes, enquanto outros têm só um ou dois? Além disso, observou-se que o código genético não era ambíguo (não há mais de um códon para o mesmo aminoácido). Enzimas: são as proteínas que dirigem as reações químicas que acontecerão numa célula, definindo o trabalho que a célula vai desempenhar unidade 0118 Em termos evolutivos, a distribuição de códons para aminoácidos seria obra do acaso. Porém, uma vez que o código havia surgido, tornou-se tão fundamental para a vida que qualquer modificação seria catastrófica. Às vezes, uma mutação em um único gene pode ser benéfica, se permitir aos organismos um desempenho melhor. Porém, ao modificarmos a forma de leitura do código genético, estaríamos introduzindo alterações em inúmeros pontos de seu material genético, resultando em numerosas modificações em todas as enzimas de um indivíduo. Seria como trocarmos todas as letras de um texto ao acaso. O prejuízo seria enorme e a morte daquele organismo seria praticamente certa. Foi observado que organismos tão diversos como os humanos e as bactérias empregavam exatamente as mesmas regras de codificação. O código genético seria universal, ou seja, o mesmo para todos os seres vivos. Porém, há aproximadamente 20 exceções na natureza que dão significados diferentes a alguns códons. A base continua a mesma: códons de trincas de nucleotídeos são traduzidos em aminoácidos. Mas, enquanto a maioria dos organismos leria o códon de RNA “CUG” como o aminoácido leucina, muitas espéciesdo fungo Candida o traduzem como serina. As mitocôndrias possuem um genoma próprio, e modificaram o código genético em alguns aspectos. No genoma mitocondrial do fermento de pão ou levedura de cerveja (Saccharomyces cerevisiae), por exemplo, quatro dos seis códons que normalmente codificam a leucina significam treonina. Podemos deduzir então que o código genético muito provavelmente evoluiu. Portanto, a relação entre códon e aminoácidos, preservada durante bilhões de anos por seleção natural, não é mera obra do acaso, mas uma forma de reduzir o efeito maléfico de grandes alterações provocadas por uma leitura alterada dos códons. Salienta-se ainda que haja códons iniciadores e de término. Os iniciadores seriam a trinca AUG em eucariotos e procariotos. Os códons de término (fatores de liberação de proteína) seriam UAA, UAG e UGA. Síntese protéica Atualmente, sabe-se que são necessárias muitas etapas para que a sequência de genes seja convertida em uma sequência de aminoácidos. O gene é transcrito em uma molécula de RNA, que usa bases similares do DNA, com a exceção de que a timina do DNA é substituída pela uracila. Esse RNA mensageiro é lido de três em três letras, origina-se no núcleo e leva para o citoplasma as informações do DNA nuclear, o qual ao se prender ao ribossomo, comanda a síntese protéica. Pequenas estruturas Leveduras: Organismos unicelulares que possuem núcleo verdadeiro (eucarioto) e que têm propriedades bioquímicas muito semelhantes aos organismos superiores. Extensivamente utilizado em engenharia genética. BIOLOGIA MOLECULAR 19 celulares conhecidas como RNA transportadores carregam os aminoácidos que serão ligados na cadeia polipeptídica, que se origina nos ribossomos, local da síntese protéica. Nos cromossomos humanos, os nucleotídeos estão ligados entre si em cada uma das duas fitas complementares, para formar a dupla hélice. Quando chega o momento em que as instruções do gene são expressas, o zíper de duas fitas do DNA se abre apenas pelo tempo suficiente para que a cópia de uma fita da sequência do gene possa produzir um RNA. Cada sequência de nucleotídeos de DNA que se transcreve na versão de RNA dessa maneira é chamada de gene. Algumas das moléculas de RNA resultantes acabam nunca se traduzindo em proteínas, mas atuam nos mecanismos de regulação. As transcrições de RNA dos genes que realmente codificam proteínas são traduzidas na sequência correspondente de aminoácidos. Mas, primeiro, a transcrição preliminar tem que passar por um processo de edição. Em 1977, Phillip Sharp e colegas do Instituto de Tecnologia de Massachusetts (MIT), descobriram que essas transcrições de RNA iniciais ou primárias são como livros que contêm muitos capítulos sem nenhum significado, inseridos em intervalos do texto. Os capítulos sem sentido, chamados íntrons, precisam ser extraídos para que os capítulos com sentido se liguem, permitindo ao RNA “contar uma história” coerente. No splicing, processo de corte-e-ligação ou processamento, os íntrons são removidos da transcrição inicial. Os segmentos da transcrição que contêm sequências que codificam proteínas, chamados éxons, os quais são ligados para formar a versão final da transcrição, conhecida como RNA mensageiro. Mas em 1980, Randolph Wall, da Universidade da Califórnia de Los Angeles (UCLA), demonstrou que essa visão básica do processamento pré-RNAm, em que todos os íntrons são sempre descartados e todos os éxons são sempre incluídos, nem sempre é verdadeira. Na realidade, os mecanismos celulares podem “decidir” remover um éxon ou manter um íntron, ou partes dele na transcrição final do RNAm. Essa capacidade de editar de forma alternativa as transcrições de RNAm aumenta significativamente a versatilidade dos genes e dá ao mecanismo de processamento o enorme poder de determinar o quanto a célula produzirá de certo tipo de proteína em detrimento de outros, codificados pelo mesmo gene. Em 1984, Tom Maniatis da Universidade de Harvard, desenvolveu um procedimento para revelar o mecanismo molecular que executa a retirada dos íntrons e a ligação dos éxons entre si. Os detalhes sobre seu funcionamento e sobre o sistema regulatório que o controla ainda são desconhecidos, porém bastante elaborados. Nucleotídeo: A unidade das moléculas de ácidos nucléicos (DNA e RNA) é composta por uma molécula de açúcar um grupo fosfato e uma base nitrogenada. Transcrição: Processo pelo qual a dupla hélice de DNA se desenrola, então a cópia de RNA é sintetizada a partir de uma das fitas complementares de um gene. unidade 0120 Em organismos complexos, dois níveis diferentes estão envolvidos no splicing das transcrições do pré-RNAm. Um que é encontrado em todos os organismos cujos genomas possuem íntrons dos fungos até os seres humanos, sendo muito conservado ao longo da evolução. Ele consiste em cinco moléculas que se aliam a até 150 proteínas para formar um complexo chamado spliceossomo, responsável por reconhecer os locais onde os íntrons começam e terminam, removendo-os da transcrição do pré-RNAm e ligando os éxons para formar o RNAm. Quatro curtas sequências de núcleotídeos dentro dos íntrons servem como sinal para indicar ao spliceossomo onde cortar. Um desses sinais fica no começo do íntron e é chamado de ponto de splicing 5’; outro, localizado na extremidade final do íntron, é conhecido como ponto de splicing 3’. Outro sistema regulatório envolve a presença de proteínas reguladoras de splicing, onde cada uma pode ser expressa em estágios distintos do desenvolvimento dentro do mesmo tecido. Essas proteínas podem se ligar a sequências curtas de nucleotídeos localizadas dentro de regiões ativadoras ou supressoras dos éxons. As consequências em deixar de fora um único éxon podem ser dramáticas para um organismo. Na mosca-das-frutas, por exemplo, o splicing alternativo controla o sistema que determina o sexo. A remoção de éxons é o tipo mais comum de splicing alternativo entre os mamíferos, respondendo por cerca de 40% desse tipo de processamento genético em humanos. Mas várias outras formas também já foram identificadas, como uma que faz os íntrons serem mantidos no RNAm maduro, mais comum em plantas e em formas inferiores de vida multicelular. O splicing alternativo permite aos humanos produzir mais de 100 mil proteínas sem precisar manter 100 mil genes, pois esse mecanismo origina mais de um tipo de molécula de RNAm e, portanto, mais de uma proteína por gene. Em média, cada um de nossos genes dá origem a três RNAms por meio do splicing alternativo. Mesmo assim, esse número não explica nossa necessidade de ter tantos íntrons nem por que eles ocupam tanto território dentro dos genes, de modo que as sequências exônicas correspondam a apenas entre 1% e 2% do genoma humano. Defeitos de splicing podem estar associados ao câncer e doenças hereditárias. BIOLOGIA MOLECULAR 21 É provável que a retenção de íntrons seja, em termos evolutivos, a versão mais antiga do splicing alternativo. Mesmo hoje em dia, o mecanismo de splicing de organismos unicelulares, como os fungos, funciona por meio do reconhecimento de íntrons, sistema diferente das proteínas reguladoras de splicing dos organismos superiores. Em organismos unicelulares, o mecanismo de splicing só reconhece sequências intrônicas menor que 500 nucleotídeos, o que funciona bem para os fungos, que têm poucos íntrons, em média com apenas 270 nucleotídeos de comprimento. Mas, conforme os genomas foram se expandindo ao longo da evolução, seus trechos intrônicos se multiplicaram e cresceram o mecanismo celular de splicing, provavelmente foi obrigado a mudar de um sistema que reconhecia sequências intrônicas curtas dentro dos éxons, para um que reconhecesse éxons curtos no meio de um mar de íntrons. Em média, um gene humano dos que codificam proteínas tem 28 mil nucleotídeos com 8,8 éxons separados por 7,8 íntrons. Os éxons são relativamente curtos, em geral têm cerca de 120 nucleotídeos,enquanto os íntrons variam de 100 a 100 mil nucleotídeos de comprimento. O tamanho e a quantidade dos íntrons humanos - temos o maior número de íntrons por gene de todos os organismos - suscitam uma questão interessante. Manter os íntrons é um hábito caro. Uma grande proporção da energia que gastamos todo dia é dedicada à manutenção e ao reparo de íntrons na forma de DNA, à transcrição do pré-RNAm, à remoção dos íntrons até a sua ruptura ao final da reação de splicing. Além disso, o sistema pode causar equívocos com consequências graves. Cada erro no corte e na ligação do pré-RNAm leva a uma alteração na sequência de codificação da proteína da transcrição do gene, e possivelmente à síntese de uma proteína defeituosa. Por exemplo, na síndrome de Riley Day há uma mutação em um único nucleotídeo de um gene que faz com que ele sofra splicing alternativo em tecidos do sistema nervoso. A redução da proteína produzida por esse gene causa desenvolvimento anômalo do sistema nervoso. Pelo menos 15% das mutações que provocam doenças genéticas e determinados tipos de câncer fazem isso ao afetar o splicing do pré-RNAm. Então, por que a evolução preservou um sistema tão complicado e que ainda pode causar doenças? Talvez porque as vantagens superem os riscos. Por incrível que pareça, um camundongo possui o mesmo número de genes do homem. Embora tenham se passado 100 milhões de anos desde que ambos tiveram um ancestral comum, provavelmente um animal semelhante ao mussaranho atual, 99% dos genes dos camundongos e dos humanos derivam daquele ancestral. A maioria possui a mesma organização unidade 0122 em íntrons e éxons, e as sequências de nucleotídeos dentro de seus éxons também são altamente conservadas. Se há diferenças tão pequenas entre o genoma dos humanos e o dos camundongos, o que é que nos torna tão diferentes desses animais? Um estudo recente revelou que um quarto dos éxons que sofrem splicing alternativo em ambos os genomas são específicos para os seres humanos ou camundongos. Esses éxons têm, portanto, o potencial de criar proteínas especiais para determinadas espécies, que podem ser responsáveis pela diferenciação entre elas. Uma das categorias dos éxons de processamento alternativo é realmente exclusiva dos primatas e pode ter contribuído para sua divergência em relação a outros mamíferos. Estudando o processo do nascimento de um éxon, podemos começar a enxergar as vantagens dos íntrons em geral, e a energia que gastamos para mantê-Ios parece se justificar. Em 1977, Phillip A. Sharp e Richard J. Roberts mostrou de forma independente que os genes dos eucariontes não são blocos contíguos de elementos reguladores e codificadores de proteínas. Ao contrário, não passam de mosaicos de “éxons” (sequências de DNA que codificam fragmentos de proteínas) e sequências intermediárias ou “íntrons” que não codificam proteínas. No núcleo, os genes são copiados em sua totalidade como transcritos de RNA primário; depois, o splicing remove os “íntrons”, une os “éxons” formando o RNA mensageiro, que é traduzido em proteína no citoplasma. Supõe-se que o RNA intrônico seja degradado e reciclado. Como os íntrons não codificam proteínas, por que são tão abundantes nos eucariontes, mas inexistentes nos procariontes? Embora os íntrons constituam 95% ou mais dos genes comuns que codificam proteínas nos seres humanos, a maioria dos biólogos moleculares os considera sobras evolucionárias ou DNA-lixo. Os íntrons foram considerados remanescentes de uma época anterior à evolução da vida celular, quando fragmentos de informações codificadoras de proteínas se reuniram nos primeiros genes. Porém, dados recentes indicam que essas sequências invadiram os genes dos organismos superiores em uma fase mais tardia. O mais provável é que tenham derivado de um tipo de elemento genético móvel semelhante aos transposons. Esses elementos são fragmentos parasitas de DNA com capacidade de se inserir em genomas hospedeiros e se remover quando transcritos em RNA. Talvez os íntrons tenham sobrevivido nos organismos complexos porque tivessem uma utilidade secundária - facilitar o rearranjo de segmentos de proteínas em novas combinações úteis, por exemplo. Ou ainda, poderiam Diferenciação celular: Processo pelo qual a célula adquire funções mais especializadas. BIOLOGIA MOLECULAR 23 proteger os organismos dos efeitos danosos das mutações (há uma maior chance das mutações ocorrerem em regiões não codificadoras, não gerando prejuízo aos organismos). Da mesma forma, os biólogos supõem que a ausência de íntrons nos procariontes foi uma consequência de intensas pressões competitivas no ambiente microbiano: a evolução teria eliminado os íntrons tornando a célula procarionte mais eficiente do ponto de vista energético, por que dispender tempo e energia duplicando um DNA inativo? Outra corrente afirma que, como as bactérias não têm núcleo, a transcrição e tradução ocorrem juntas: o RNA é traduzido em proteína com a mesma rapidez com que é transcrito. Não dá tempo para o RNA proveniente dos íntrons se remover do RNA codificador de proteína. Na maioria dos casos, um íntron incapacitaria o gene onde ele está contido causando graves consequências para a bactéria hospedeira. Nos eucariontes, a transcrição ocorre no núcleo e a tradução no citoplasma, no qual a separação abre uma janela de oportunidade para o RNA, originado a partir dos íntrons, ser removido. Com o surgimento de uma estrutura conhecida como spliceossomo, não havia mais a necessidade dos íntrons se removerem. Dessa forma o spliceossomo teria proporcionado a proliferação e evolução dos íntrons. Qualquer mutação aleatória que se mostrasse benéfica para o hospedeiro teria sido preservada pela seleção natural. Os RNAs intrônicos, portanto, evoluiriam independentemente das proteínas e em paralelo com elas. Em vez de serem relíquias moleculares inúteis, os íntrons podem ter adquirido funções genéticas mediadas pelo RNA. Se essa hipótese for verdadeira, os eucariontes (especialmente os mais complexos) podem ter desenvolvido um sistema operacional genético e redes reguladoras bem mais sofisticadas do que as dos procariontes. Tal organização se assemelharia aos sistemas avançados de processamento de informações que permitem controle de rede em computadores e no cérebro. As tarefas funcionais nas células, normalmente, cabem às proteínas, devido à sua grande diversidade química e estrutural. No entanto, os RNAs têm uma vantagem em relação às proteínas: eles conseguem codificar sinais curtos, como o sistema binário utilizado em computadores, tornando-os extremamente precisos. Regulação da ação gênica Durante a diferenciação das células e o desenvolvimento dos organismos, uma única célula fertilizada se transforma em um organismo Spliceossomo: Complexo de RNAs catalíticos pequenos e proteínas, cujo papel é remover RNA intrônico de precursores de RNA mensageiro. Expressão gênica: Representa a ativação de um gene. A dupla hélice do DNA se desenrola e o RNAm correspondente é transcrito, o qual será posteriormente traduzido em proteína. unidade 0124 complexo de 100 trilhões de células com milhões de formas e funções diferentes. O padrão de expressão gênica, em organismos procariontes e em eucariontes unicelulares e multicelulares é uma das grandes questões da Biologia que necessita de respostas. Células simples, como por exemplo uma bactéria, apresentam um elevado número de diferentes proteínas sintetizadas, necessitando de um DNA com mais de 3 milhões de pares de bases (pb), DNA pequeno quando comparado a outros seres vivos unicelulares eucariontes. Por exemplo, uma bactéria (E. coli) apresenta um genoma com 4 milhões pb e 2350 genes no seu cromossomo único. Já um fungo (S. cerevisiae) apresenta um genoma com 13 milhões pb e 5200 genes. Em resumo, os organismos simples têm menos complexidade e menos tarefas e, portanto, necessitam de menor quantidade de informação genética.Em uma célula humana, muito mais complexa, o DNA é 1000 vezes maior do que na bactéria, contendo aproximadamente 3 bilhões de pares de bases. A quantidade de DNA mostrada para os insetos é menor do que aquela para os mamíferos. A quantidade de DNA na mosca das frutas (D. melanogaster) é de 140 milhões pb onde se situam 13000 genes. Já na espécie humana, o genoma apresenta 3 bilhões pb e aproximadamente 23000 genes. Da mesma forma, a quantidade de DNA apresentada pelos mamíferos é menor do que aquela para os seres humanos, pois a maioria dos mamíferos possui menos informação genética que os seres humanos. Durante décadas, os pesquisadores acharam que o número de genes codificadores de proteínas tivesse maior correspondência com a complexidade. Desde então, os genomas de diversas espécies foram decifrados, e ficou claro que a correlação entre número de genes e complexidade é duvidosa. O verme nematoide Caenorhabditis elegans (que tem menos de mil células) possui 19 mil genes, enquanto os insetos possuem aproximadamente 13 mil e os seres humanos cerca de 20 mil genes. Porém, há a existência de um paradoxo na Biologia. A quantidade de DNA de um organismo não corresponde exatamente à sua complexidade. Alguns anfíbios, por exemplo, têm cinco vezes mais DNA que os mamíferos e, por incrível que pareça, algumas amebas têm mil vezes mais. Além disso, os organismos com maior complexidade apresentam grande parte do seu DNA não envolvido na síntese protéica. Nas células humanas, por exemplo, somente 2 a 3% do DNA constituem os genes (formados por “íntrons” e “éxons”). A evolução biológica tem sido acompanhada por um aumento BIOLOGIA MOLECULAR 25 na complexidade. Os mais complexos organismos da Terra hoje contêm consideravelmente mais informação armazenada do que os mais complexos organismos de 200 milhões de anos atrás, por exemplo. É possível que a bioquímica interna das bactérias contemporâneas seja mais eficiente que a bioquímica interna das primeiras bactérias a habitar o planeta Terra, porém a quantidade de DNA das bactérias atuais provavelmente não é maior que a de seus ancestrais bacterianos. É importante distinguir entre a quantidade de informação e a qualidade dessa informação. Uma bactéria, por ser um organismo unicelular, tem que produzir todas as enzimas necessárias para seu funcionamento. Mas elas não produzem essas enzimas ao mesmo tempo. A vantagem dos organismos multicelulares é que pode existir uma divisão de trabalho entre as células. No corpo humano, a diferenciação celular permite que as células do pâncreas produzam insulina, as do estômago secretem suco gástrico, enquanto as do cérebro são encarregadas de transmitir impulsos nervosos, e assim por diante. Todas as células de um organismo contêm os mesmos genes, embora em cada célula alguns genes estejam ativos e outros inativos, em um sistema semelhante ao interruptor que acende ou apaga a luz. Dentro das células, pequenas marcas químicas (como os grupos metil e acetil) podem se ligar a segmentos de DNA e às proteínas da cromatina e, assim, determinar quais genes serão transcritos ou permanecerão silenciados. Dessa forma, as enzimas necessárias em cada tipo celular são diferentes, e somente uma porcentagem do total dos genes presentes em uma pessoa será ativada em um determinado tecido. Além disso, diferentes genes se expressam em diferentes fases do desenvolvimento do organismo, do embrião ao adulto. É necessário que haja uma regulação da atividade gênica, de modo a definir quais genes serão ativados e quais proteínas serão produzidas em cada tecido, a cada momento do desenvolvimento. O controle da expressão gênica é feito por outras sequências de DNA por sítios promotores e os genes reguladores, que ativam um gene, informando o momento que ele será expresso, assim como controlando a quantidade de proteína a ser produzida. Um gene é ativado quando ele é transcrito em RNAm, sendo posteriormente traduzido em uma proteína. Um dos primeiros estudos sobre os mecanismos que regulam os genes foi desenvolvido por Jacob e Monod (recebendo o Prêmio Nobel na década de 1960). De acordo com esse modelo, a síntese de proteínas é obtida através do bloqueio da atividade do tetrâmero repressor, proteína esta produzida pelo gene regulador, o qual permite que o sítio operador fique livre. Dessa forma, a RNA polimerase se liga ao sítio promotor, ocorrendo então o Genes reguladores: Genes que codificam um RNA ou uma proteína cuja função é controlar a expressão de outros genes. unidade 0126 processo de transcrição do RNA e posteriormente a tradução em proteínas. O bloqueio da atividade da proteína repressora era realizado pela lactose, chamada de indutora do processo de transcrição e tradução. Jacob e Monod, em um ano concluíram que as proteínas controlavam todas as informações genéticas em E. coli (bactéria), explicando em parte como ocorre a regulação gênica em organismos procariontes. O biólogo Jacques Monod sintetizou a universalidade do dogma central numa frase: “O que é verdade para a E. coli também é verdade para o elefante”, obviamente sendo verdade também para plantas, fungos, organismos multicelulares e unicelulares classificados como eucariontes (células que contêm núcleos). Monod estava apenas certo apenas em parte. Um número crescente de resultados revela que o dogma central da Biologia Molecular é incompleto para elucidar como ocorre a regulação gênica em organismos eucariontes. As proteínas realmente ajudam a regular a expressão dos genes, mas um sistema regulador com base em RNAs que atuam diretamente sobre o DNA e outras moléculas também é importante. Os indícios de um sistema regulador generalizado baseado no RNA são fortes, embora ainda incompletos. Se tal sistema existe, seria de esperar que muitos genes tivessem evoluído somente para expressar sinais de RNA como reguladores. É o que parece acontecer: milhares de RNAs que nunca são traduzidos em proteína (RNAs não-codificadores) foram identificados em análises recentes de transcrição em mamíferos. Pelo menos metade de todos os transcritos de RNA enquadra-se nessa categoria. Resultados recentes indicam que a sinalização do RNA direciona a marcação da cromatina. De fato, vários processos cromossômicos complexos como a mitose (divisão celular) e a meiose (a formação dos precursores do espermatozóide e óvulo), parecem depender de cascatas bioquímicas que afetam o processamento de RNA. Centenas de “micro-RNAs” derivados de íntrons e transcritos de RNA não-codificadores maiores já foram identificados em plantas, animais e fungos. Muitos deles controlam o ritmo de processos que ocorrem durante o desenvolvimento como a manutenção de células-tronco, a proliferação de células e a apoptose (a morte celular programada). Esses RNAs poderiam ainda informar a vários genes que uma sequência codificadora específica está sendo transcrita. O splicing alternativo gera vários tipos de RNAs e proteínas nas células dos diferentes tecidos, embora todos compartilhem o mesmo conjunto de genes. A maioria dos transcritos codificadores de proteínas sofre splicing alternativo em mamíferos. Quando o RNA intrônico é removido do transcrito de um gene, as regiões de RNA codificador de proteína podem ser montadas BIOLOGIA MOLECULAR 27 de várias maneiras para produzir mais de um tipo de proteína. O fenômeno é fundamental para o desenvolvimento dos animais e das plantas, mas ninguém ainda entende como as células especificam qual forma de proteína será criada. Poucos fatores protéicos que controlam esse fenômeno foram encontrados. Em consequência, os pesquisadores costumam supor que combinações sutis de fatores gerais ativam ou reprimem o splicing alternativo em diferentes contextos, sem indício forte que respalde essa suposição. Uma possibilidade mais provável e mais atraente do ponto de vista dos mecanismos é que os RNAs regulem o processo de forma direta. Em princípio, essasmoléculas poderiam marcar ou capturar sequências específicas em transcritos primários e direcionar a montagem das peças. Confirmando parte dessas ideias, as sequências de DNA nas junções íntron-éxon, onde ocorre o splicing alternativo, costumam ser resistentes a mudanças durante a evolução. Além dos íntrons, a outra grande fonte do suposto lixo genômico - representando cerca de 40% do genoma humano - compreende transposons e outros elementos repetitivos. Essas sequências, geralmente, são consideradas parasitas moleculares que, à semelhança dos íntrons, colonizaram nossos genomas em diferentes épocas da história evolutiva. Podem ter sido intrusas de início; porém, uma vez estabelecidas na comunidade, elas e seus descendentes progressivamente tornaram-se parte de sua dinâmica - mudando, contribuindo e evoluindo com ela. Uma série de indícios sugere que os transposons contribuem para a evolução e regulação genômica de organismos superiores e podem desempenhar um papel-chave na herança epigenética (a modificação dos traços genéticos). Além disso, em 2004, foi anunciada uma descoberta empolgante envolvendo o processo chamado edição A-para-I (adenosina-para-inosina), em que uma sequência de RNA muda em um local muito específico. Eles demonstraram que a edição A-para-I de transcritos de RNA é centenas de vezes mais generalizadas em seres humanos do que se pensava e ocorre predominantemente em sequências repetitivas, denominadas elementos Alu, que residem no RNA não-codificador. A edição A-para-I é particularmente ativa no cérebro e a edição aberrante foi associada a uma série de comportamentos anormais como epilepsia e depressão. Embora a edição de RNA ocorra, até certo ponto, em todos os animais, os elementos Alu são específicos dos primatas. Uma possibilidade intrigante é que a colonização da linhagem dos primatas por elementos Alu tornou possível o surgimento de um novo nível de complexidade no processamento de RNA e permitiu que a programação dos circuitos neurais se tornasse mais unidade 0128 dinâmica e flexível. Essa versatilidade, por sua vez, estabeleceu a base para a emergência da cognição, memória, pensamento conceitual, autoconsciência, aprendizado, arte, conhecimento e inovação de ordem superior na espécie humana. As moléculas que compõem os diferentes organismos são fundamentalmente iguais: 99% das proteínas nos seres humanos possuem equivalentes reconhecíveis em camundongos e vice-versa. Muitas dessas proteínas também são conservadas em outros animais, e as envolvidas em processos celulares básicos são conservadas em todos os eucariontes. Desse modo, as diferenças nas formas dos animais certamente procedem de diferenças nas informações arquitetônicas. Genes codificadores de proteínas obviamente especificam os componentes dos organismos, mas onde estão as informações arquitetônicas? A suposição predominante entre os biólogos é que as instruções de montagem de organismos complexos estão de algum modo embutidas nas diversas combinações de fatores reguladores dentro das células - ou seja, nas permutações das proteínas reguladoras interagindo umas com as outras, com o DNA e o RNA. Entretanto, embora essa matemática combinatória possa gerar possibilidades quase infinitas, a grande maioria será caótica e sem sentido - o que é problemático. Os organismos precisam navegar por rotas evolutivas precisas, que sejam lógicas e competitivas. Gerar complexidade é fácil; controlá-Ia é que é problemático. Descobriu-se que o número de reguladores de proteínas nos procariontes aumenta à razão do quadrado do tamanho do genoma. Além disso, haveria um ponto em que o número de novos reguladores não pudesse ultrapassar o número de novos genes funcionais. Este ponto estaria próximo do limite superior do tamanho dos genomas das bactérias. Durante a evolução, portanto, a complexidade dos procariontes pode ter sido limitada pela sobrecarga reguladora genética, e não por fatores ambientais ou bioquímicos, como se supunha antes. Essa conclusão também é compatível com o fato de que a vida na Terra consistiu unicamente em micro-organismos na maior parte de sua história. A combinação das proteínas não poderia por si só elevar o nível de complexidade dos organismos, a ponto de originar uma célula eucarionte a partir de uma célula procarionte. Os eucariontes devem ter encontrado uma solução para esse problema, que pode ter sido a transição para um novo tipo de controle baseado, em grande parte, em RNAs. Isso certamente ajudaria a explicar o fenômeno da explosão cambriana, há cerca de 525 milhões de anos, quando animais BIOLOGIA MOLECULAR 29 invertebrados de uma diversidade assombrosa evoluíram aparentemente de forma abrupta, a partir de formas de vida muito mais simples. Na verdade, esses resultados sugerem que a complexidade organizada é devido às regiões reguladoras. Em resumo, o RNA apresenta um importante papel no controle da atividade gênica. Esse papel do RNA permite às células animais, por exemplo, atingirem uma complexidade estrutural muito maior quando comparadas a uma bactéria. A surpresa mais recente é que os genomas dos vertebrados contêm milhares de sequências não-codificadoras que permaneceram praticamente inalteradas por muitos milhões de anos. Essas sequências estão muito mais conservadas que aquelas que codificam proteínas, o que é totalmente inesperado. O mecanismo que congelou essas sequências é desconhecido, mas sua constância extrema sugere que estejam envolvidas em redes complexas essenciais à nossa Biologia. Desse modo, os genomas dos seres humanos e de outros organismos complexos, ao invés de serem vistos como portadores de sequências codificadoras no meio de muito DNA lixo, deveriam ser vistos como ilhas de informação de componentes de proteína em um mar de informações reguladoras. A maior parte dos genomas em organismos complexos não é DNA-lixo, ao contrário, é funcional e sujeita à seleção evolutiva. A existência de um grande sistema regulador baseado no RNA também possui implicações na área da saúde. Doenças genéticas tradicionais como fibrose cística e talassemia são causadas por um dano em um componente: uma das proteínas do indivíduo simplesmente não funciona. No entanto, é provável que muitas, se não a maioria, das variações genéticas que determinam a suscetibilidade à maioria das doenças residam nas regiões reguladoras. RNAs não-codificadores já foram associados a diversas doenças como o linfoma de células B, câncer do pulmão, câncer da próstata, autismo e esquizofrenia. Sabemos que menos de 1% do genoma humano codifica proteínas, mas a maioria dele é transcrita em RNA. Podemos supor que o genoma humano (e o dos outros organismos complexos) está cheio de transcrições inúteis, ou que esses RNAs desempenham alguma função. Como dificilmente ocorrem eventos inúteis na Natureza, pois todos os eventos biológicos estão sob a ação de forças evolutivas constantemente, podemos sugerir que muitos genes em organismos complexos (e talvez até a maioria dos genes dos mamíferos) não codificam proteínas, mas originam RNAs com funções reguladoras. Essas moléculas podem apresentar um papel decisivo no desenvolvimento e na evolução dos organismos. Fibrose cística: Doença genética de herança autossômica recessiva na qual as secreções mucosas são muito viscosas, resultando na obstrução dos pulmões, com infecções recorrentes, e na má absorção dos alimentos devido à insuficiência pancreática. unidade 0130 Estudos a respeito dos mecanismos envolvidos na regulação da atividade gênica permitirão a compreensão de porque uma célula, a partir de um dado momento, começa a se dividir de forma descontrolada originando um câncer. Também poderemos esclarecer por que envelhecemos e, quem sabe, como procedermos para retardar esse envelhecimento e até mesmo como impedir a evolução de um câncer. Essas deficiências não serão fáceis de corrigir. Mas compreender esse sistema reguladorpoderá acabar sendo fundamental para entendermos o polimorfismo genético existente em várias espécies, além de possibilitar a criação de estratégias sofisticadas de intervenção médica e de transferência de genes funcionais entre espécies não aparentadas geneticamente. Mutação A mutação já é conhecida há bastante tempo. Darwin já havia relatado numerosos registros sobre animais domesticados em que apareciam repentinamente novas variedades ou “mutantes”. Porém, foi De Vries, em 1910, que chamou estas grandes alterações de mutações, e certamente a palavra mutante tornou-se, até certo ponto, sinônimo popular de alterações flagrantes. Mutação gênica é o processo pelo qual são produzidas novas variedades, ou alelos, de um gene. Elas representam alterações (substituições, adições ou perdas) que ocorreram ao nível de um ou de alguns nucleotídeos na molécula de DNA (Figura 5). Há a possibilidade também de haver o surgimento de um RNAt que adiciona um aminoácido por engano na proteína formada. Figura 5: Três tipos de mutações no DNA. Fonte: FARAH (1997). Polimorfismo: Ocorrência em uma população de dois ou mais genótipos alternativos, quando a frequência de cada um deles é superior àquela que poderia ser mantida somente por mutações recorrentes. BIOLOGIA MOLECULAR 31 As diferentes formas de vida que conhecemos possuem cromossomos que contêm o material genético, o qual é capaz de sofrer alterações (mutações) e ser transmitido através das gerações de forma praticamente perfeita. As mutações são causadas por radiações, substâncias mutagênicas como, por exemplo, o cigarro ou até mesmo por raios cósmicos vindos do espaço. Podemos ter também as mutações espontâneas, que ocorrem por rearranjos espontâneos dos nucleotídeos. O próprio organismo tem a capacidade de corrigir certos tipos de danos estruturais ocorridos no DNA. Há nas células um sistema de reparo do DNA representado por um conjunto de enzimas que desempenha funções de reconhecer uma mutação no DNA, retirando-a e consertando o erro. Uma mutação que ocorre em uma molécula de DNA de um cromossomo de uma célula somática não influi sobre a hereditariedade, não apresentando importância evolutiva. As mutações que apresentam importância são as germinativas, que ocorrem nos gametas - óvulos e espermatozoides. A matéria-prima da evolução são as mutações, alterações herdáveis nas sequências de nucleotídeos que determinam as instruções hereditárias na molécula de RNAm; única forma de surgimento de novos genes. Portanto, esses reparos não devem ser totalmente eficientes. É importante ressaltar que o fato das mutações provocarem alterações aleatórias nas bases nitrogenadas que compõem os nucleotídeos faz com que os indivíduos sofram mutações não para se adaptarem ao meio ambiente, essa alteração é ao acaso e posteriormente haverá uma seleção dos genótipos que apresentem uma reprodução diferencial, acarretando na evolução da população. Posteriormente, estudos bioquímicos dos efeitos das mutações levaram a avanços nesta área. Os organismos grandes como os seres humanos apresentam, em média, uma mutação para cada 10 gametas - ou seja, existe a probabilidade de 10% de que qualquer espermatozoide ou óvulo produzido possua uma alteração nova e hereditária nas instruções genéticas que determinam formação da geração seguinte. As mutações são quase todas deletérias, gerando alterações estruturais ou funcionais devastadoras aos seres vivos. A explicação para esse fato é que todas as espécies da Terra são fruto da seleção natural e do processo de evolução, sendo raro uma máquina de precisão ser aperfeiçoada por uma alteração aleatória nas instruções de sua fabricação. Dessa forma, o grande responsável pela variabilidade genética existente nos seres vivos é o crossing over ou permutação. unidade 0132 As mutações, em sua maioria, também são recessivas, ou seja, não se manifestam imediatamente. Mesmo em condições laboratoriais não conseguimos elevar em demasia os níveis de mutação, pois eles poderiam acarretar na morte do indivíduo. O código genético de todos os seres vivos evoluiu por considerar a possibilidade de erros, reduzindo o prejuízo provocado por mutações. Como exemplo pode-se citar a existência de um código genético degenerado que faz com que alguns códons, ao serem modificados, continuem a codificar o mesmo aminoácido, não alterando a proteína. A capacidade de minimizar os efeitos deletérios das mutações, com seus códons sinônimos e com aminoácidos bioquimicamente semelhantes, faz com que as mutações de menor efeito, ao contrário das que acarretam em grandes modificações, tenham maior probabilidade de serem benéficas, tornando a proteína formada mais eficiente. Além disso, códons com duas ou três bases em comum são bem parecidos no que diz respeito à atração ou repulsão pela água. Essa propriedade é crucial para o funcionamento da proteína. Demonstrou-se, em condições laboratoriais, que em 1 milhão de alternativas, apenas uma superou o desempenho do código genético natural (apresentava uma taxa de mutação menor que do código natural). Uma explicação simples e direta para a impressionante resistência do código genético é que resulte da seleção natural. Talvez tenham existido muitos códigos com vários graus de suscetibilidade a erros. Os organismos cujos códigos resistissem melhor às falhas tinham mais chances de sobreviver, e o código genético padrão, aquele utilizado por praticamente todos os seres vivos, foi o vencedor. Como variações do código são possíveis, essa suposição é razoável. Em resumo, uma alteração na sequência de nucleotídeos no DNA representa uma mutação, podendo acarretar na produção de uma enzima alterada, incapaz de realizar sua função. Há 60 anos, definiríamos gene como sendo um fragmento de DNA capaz de produzir uma enzima, mais tarde essa definição foi alterada para um fragmento capaz de produzir uma proteína. Alguns anos se passaram para que o conceito de gene fosse modificado para um segmento de DNA capaz de produzir uma cadeia polipeptídica, por possuir a informação para o sequenciamento de aminoácidos na fabricação desta cadeia. No caso de uma proteína ser composta por mais de uma cadeia polipeptídica, existem vários genes atuando no processo, cada um codificando uma cadeia. A função de uma enzima depende da forma de sua molécula, a qual é definida pela sequência de aminoácidos na cadeia polipeptídica. Como BIOLOGIA MOLECULAR 33 exemplo pode-se citar o caso da hemoglobina humana, uma proteína formada por quatro cadeias polipeptídicas, duas alfa e duas beta, onde as cadeias alfa são codificadas por um gene e as cadeias beta são codificadas por outro gene. Um exemplo clássico de uma modificação em uma base de um gene que acarreta vários efeitos finais é o da anemia falciforme na espécie humana, que leva à produção de uma hemoglobina alterada (hemoglobina S) e a uma cascata de eventos, podendo, inclusive, culminar com a morte do indivíduo. Uma molécula de hemoglobina humana é formada por dois pares de cadeias protéicas, alfa e beta, compostas por 141 e 146 aminoácidos, respectivamente. A sequência de aminoácidos das cadeias alfa de ambos os tipos de hemoglobina são iguais. A sequência na cadeia beta difere em um ponto somente: um ácido glutâmico da homoglobina A (hemoglobina normal) está substituído por uma valina na hemoglobina S. Uma cadeia de 141 aminoácidos como a cadeia da hemoglobina alfa é codificada por um número de nucleotídeos três vezes maior. Se cada nucleotídeo puder ser substituído por uma das três “letras” do código, então seriam possíveis 1269 eventos mutacionais diferentes, devido a simples substituições de nucleotídeos. Uma vez que o código genético é degenerado, o número total de possíveis substituições de aminoácidos é menor, mas ainda assim bastante grande. De fato, apenas 22 variantes diferentes da cadeia alfa foram registradas em populações humanas. Imagineuma grande população finita, composta só de homozigotos (AA) num determinado loco. Se ocorresse uma mutação (A → a), produzindo um único heterozigoto (Aa), qual seria o destino deste alelo nas gerações futuras? Dependeria de quantos descendentes o indivíduo Aa tivesse, sendo que a chance de cada descendente herdar o gene mutante seria de 50%. É sabido que as mutações ocorrem a uma taxa muito baixa (1 em 10 milhões em média). Supondo que o novo fenótipo produzido pelo gene recessivo, quando em homozigose, seja vantajoso. Uma vez que o novo heterozigoto (Aa) deve cruzar com um homozigoto (AA), somente metade de seus descendentes deverá ter o novo alelo mutante. Quantas gerações seriam necessárias para que aparecesse um indivíduo homozigoto recessivo nessa espécie diploide? Certamente, várias gerações. Estudos teóricos calculam que, nas condições citadas anteriormente seriam necessários 200 mil anos para que houvesse 1% de indivíduos homozigotos recessivos (apresentando o fenótipo recessivo) nesta população hipotética. Nesse aspecto, as bactérias possuem a vantagem de apresentarem uma reprodução extremamente rápida (uma colônia pode se duplicar a cada 20 minutos) e toda mutação que sofrer será expresso diretamente nos unidade 0134 descendentes (organismos haploides). WEb-bibLioGRAFiA http://www.lfdgv.ufsc.br/transcriptoma.pdf http://pt.wikipedia.org/wiki/C%C3%B3digo_gen%C3%A9tico http://www.coladaweb.com/biologia/codigo.htm http://www.mundoeducacao.com.br/biologia/codigo-genetico.htm http://www.portalbiologia.com.br/biologia/principal/conteudo.asp?id=6716 http://www.sobiologia.com.br/conteudos/Biotecnologia/recombinante.php http://pt.wikipedia.org/wiki/Muta%C3%A7%C3%A3o ExERCíCioS 1 - A respeito da natureza química e da funcionalidade do DNA, julgue as seguintes afirmações: a) “Moléculas de DNA isoladas de diferentes tecidos da mesma pessoa possuem a mesma composição de bases.” Sim ou Não? Justifique. b) “O conteúdo informacional do DNA reside na sequência em que suas unidades monoméricas estão ordenadas.” Sim ou Não? Justifique. 2 - Cada célula do corpo humano contém 46 cromossomos. a) Quantas moléculas de DNA isso representa? b) Quantos tipos diferentes de moléculas de DNA isso representa? 3 - Por que o nível de compactação do DNA é maior em eucariontes que em procariontes? 4 - Em que estágio do ciclo celular eucariótico você espera que o DNA esteja mais compactado? E menos compactado? Explique. 5 - Qual a relação numérica aproximada entre contagem gênica e a contagem de proteínas? 6 - O que acontece com as histonas durante a replicação? 7 - O crossing over ocorre antes ou após a síntese de DNA? 8 - Em que organismos o RNA é o único material genético? BIOLOGIA MOLECULAR 35 9 - O RNA é sintetizado em que molde? Com que enzima? É necessário um primer? 10 - O gene para a proteína humana albumina ocupa uma região cromossômica de 25.000 pares de bases (25 quilobases ou kb) do começo da sequência codificante de proteínas até sua ponta, mas o RNA mensageiro para essa proteína tem apenas 2,1kb de tamanho. O que você imagina que explica esta grande diferença? 11 – Marque a alternativa certa para mamíferos normais. a) A proliferação e a diferenciação ocorrem em qualquer tipo celular, independentemente do seu grau de maturação, pois são processos controlados por fatores intracelulares restritos ao núcleo. As condições técnicas e as do meio, durante o processo de clonagem, modificam a expressão gênica. b) A diferenciação depende do genoma, ocorrendo em qualquer tipo celular, independentemente do seu grau de maturação. Os fatores ambientais, portanto, podem, durante o processo de clonagem, modificar a expressão gênica. c) A proliferação não está restrita às células-tronco, pois, no processo de clonagem de anfíbios utilizou-se o núcleo de uma célula especializada. As condições experimentais, portanto, não modificam a expressão gênica. d) Todas as células, independentemente do seu grau de maturação, contêm o mesmo genoma. A proliferação e a diferenciação são processos controlados por fatores intra e extracelulares, assim é possível que condições experimentais do processo de clonagem modifiquem a expressão gênica. e) A proliferação e a diferenciação ocorrem em qualquer tipo celular, independentemente do seu grau de maturação, pois são processos controlados por fatores nucleares. No processo de clonagem, a manipulação e O meio externo não modificam a expressão gênica, pois as condições experimentais são rigorosamente controladas. 12 – Dados mostram que a incidência de câncer devido a explosão da bomba atômica em Hiroshima e Nagasaki na década de 40 é muito alta. a) Como a radiação está relacionada ao aumento na incidência de câncer? b) Como se explica que muitos dos efeitos da bomba atômica se manifestem nos descendentes dos sobreviventes? c) Por que algumas pessoas que foram viver nessas cidades tempos depois da explosão também foram afetadas? 13 - Atenção: Para responder à questão abaixo, considere o texto abaixo. unidade 0136 A anemia falciforme é uma doença hereditária com herança autossômica recessiva, que tem grande incidência nas populações africanas negras. Os indivíduos afetados são homozigotos (HbS / HbS) em relação a uma alteração na hemoglobina. Os indivíduos heterozigotos (HbA / HbS) geralmente não manifestam os sintomas da doença e são denominados portadores do traço falcêmico. O pesquisador Vernon Ingram observou, em 1957, que a única diferença entre a hemoglobina mutante dos afetados e a hemoglobina normal é a presença do aminoácido valina em lugar do ácido glutâmico na posição 6 em uma das cadeias da molécula. Do ponto de vista histórico, é correto afirmar que o principal impacto da pesquisa de Ingram foi: a) Decifrar o código genético. b) Evidenciar a relação direta entre o RNA mensageiro e a cadeia de aminoácidos nas proteínas. c) Comprovar que era possível sequenciar as bases do DNA por meio dos aminoácidos. d) Demonstrar que as mutações podem causar alterações nas cadeias polipeptídicas. e) Verificar que as mutações causam alterações nas moléculas de RNA mensageiro. 14 - Dentre quatro populações pequenas e geograficamente próximas de descendentes de escravos africanos, apenas uma foi detectada portador do traço falcêmico. Uma vez que nenhuma das populações está sujeita a fluxo gênico, a observação pode ser explicada por a) Taxas de recombinação diferentes em cada população. b) Taxas de mutação constantes em cada população. c) Derivação genética e migração. d) Altas taxas de endogamia em cada população. e) Diferentes genótipos fundadores em cada população e em pequeno tamanho populacional. 15 - Na revista Science de 14 de dezembro de 2001, um grupo de pesquisadores relatou a cura da anemia falciforme em camundongos, através de terapia gênica. A partir de um retrovírus modificado, a equipe construiu um vetor para introdução do gene terapêutico. A estratégia do experimento baseou-se no fato de haver integração, ao genoma das células infectadas, de uma cópia do: a) RNA viral, retrotranscrita em DNA. b) DNA viral, transcrita em RNA. BIOLOGIA MOLECULAR 37 c) RNA viral, retrotranscrita em RNA. d) RNA viral, embora ambos os ácidos nucléicos tenham sido introduzidos nas células. e) DNA viral, embora ambos os ácidos nucléicos tenham sido introduzidos nas células. 16 – A tuberculose figura como uma das doenças mais letais; isso se deve ao fato dos bacilos terem se tornado resistentes ao antibiótico usado para combatê-los. Considerando que a resistência de uma população de bactérias a um antibiótico é resultado de mutação ao acaso e que a taxa de mutação espontânea é muito baixa, foi proposto o uso simultâneo de diferentes antibióticos para o tratamento de doentes com tuberculose. Com relação a esse procedimento, foram levantados os seguintes argumentos: I. O tratamento não será efetivo para o paciente, uma vez que a resistência ao antibiótico não é reversível. II. O tratamento terá altachance de ser efetivo para o paciente, pois a probabilidade de que uma bactéria seja resistente a dois ou mais antibióticos é extremamente baixa. III. O tratamento poderá apresentar riscos para a população, pois poderá selecionar linhagens bacterianas altamente resistentes a antibióticos. Analisando as informações contidas no texto, pode-se concluir que apenas a) O argumento I é válido. b) O argumento II é válido. c) O argumento III é válido. d) O argumento I e III é válido. e) O argumento II e III é válido. 17 – Por que uma célula geneticamente idêntica a outra pode assumir forma e função tão distinta? Atenção: Para responder às questões de números 18 a 20 considere o texto abaixo. João trabalha em uma confeitaria cujo proprietário é alemão. Toda manhã este deixa sobre a mesa da cozinha, uma receita em português e os ingredientes de um bolo que João deve preparar. A receita original, escrita em alemão, fica guardada no escritório da confeitaria. Somente o patrão de João pode abrir o escritório e escrever, em português, a receita a ser utilizada naquele dia. 18 - Para explicar a leigos o funcionamento de uma célula, fazendo uma analogia com o texto, o bolo, seus ingredientes, a receita em português e a unidade 0138 receita em alemão corresponderão, respectivamente, a: a) aminoácido, nucleotídeos, DNA e RNA. b) nucleotídeo, aminoácidos, RNA e DNA. c) polipeptídeo, aminoácidos, RNA e DNA. d) DNA, RNA, polipeptídeo e aminoácido. e) DNA, aminoácidos, nucleotídeo e polipeptídeo. 19 - Continuando a analogia, o escritório, a cozinha e João corresponderão, respectivamente, aos seguintes componentes de uma célula de eucarioto: a) citoplasma, núcleo e cromossomo. b) núcleo, citoplasma e ribossomo. c) citoplasma, núcleo e membrana nuclear. d) núcleo, citoplasma e cromossomo. e) cromossomo, membrana nuclear e citoplasma. 20 - Alguns bolos são servidos assim que saem do forno, enquanto outros recebem acabamento especial. Na analogia considerada, o local da confeitaria onde os bolos recebem recheio e cobertura, corresponde: a) à mitocôndria. b) ao retículo endoplasmático rugoso. c) ao peroxissomo. d) ao lisossomo. e) ao complexo de Golgi. 21 - As mitocôndrias possuem uma única molécula de DNA circular. Isto torna a organização do material genético dessas organelas semelhante à organização do material genético presente em: a) bactérias e cloroplastos. b) plantas e algas verdes. c) fungos e vírus. d) vírus e bactérias. e) protozoários e cloroplastos. 22 – Explique o que é um gene. 23 - Existem três tipos de RNA: o que contém as informações para a síntese protéica: o que transporta aminoácidos para que ocorra a síntese e o que participa da maquinaria de síntese. Identifique a sequência respectiva: a) RNA mensageiro, RNA transportador, RNA ribossômico. b) RNA ribossômico, RNA transportador, RNA mensageiro. c) RNA transportador, RNA ribossômico, RNA mensageiro. BIOLOGIA MOLECULAR 39 d) RNA mensageiro, RNA ribossômico, RNA transportador. e) RNA ribossômico, RNA mensageiro, RNA transportador. 24 - Qual o material genético do vírus? a) DNA. b) RNA. c) DNA ou RNA. d) nenhuma das alternativas. 25 - Assinale a alternativa falsa. O DNA: a) é uma macromolécula. b) contém informações que a célula utiliza para a síntese de proteínas. c) em eucariotos o DNA se encontra no núcleo. d) pode assumir a estrutura de dupla hélice. e) é feito de apenas oito diferentes monômeros. 26 - Assinale a alternativa falsa. O RNA: a) normalmente é dupla hélice. b) contém uracila. c) pode agir como catalisador. d) é encontrado em todas as células. e) tem três papéis importantes na síntese de proteínas. 27 - É falso afirmar. O código genético: a) é um código triplo. b) é degenerado. c) das bactérias é totalmente diferente das plantas. d) de um RNAm pode especificar duas sequências de aminoácidos se o código for lido em dois pedaços diferentes. e) foi descrito entre 1950 e 1960. 28 - A respeito da natureza química e da funcionalidade do DNA, julgue a seguinte afirmação: “Espécimes de DNA isolados de diferentes tecidos da mesma pessoa possuem a mesma composição de bases.” SIM OU NÃO? (JUSTIFIQUE SUA RESPOSTA). 29 - “Durante a desnaturação do DNA são quebradas as ligações covalentes presentes em sua estrutura.” SIM OU NÃO? (JUSTIFIQUE SUA RESPOSTA). 30 - “Nas moléculas de DNA dos eucariotos, a ocorrência das bases G + C é aproximadamente igual à de T + A.” SIM OU NÃO? (JUSTIFIQUE SUA RESPOSTA). unidade 0140 BIOLOGIA MOLECULAR 41 UNIDADE 02 Isolamento e Clonagem de um Gene Específico Nesta unidade fornecemos as bases necessárias à compreensão dos mecanismos de isolamento e clonagem de um gene específico. Além disso, é oferecido ao estudante o aprendizado de como é construída a molécula de DNA Recombinante. unidade 0242 BIOLOGIA MOLECULAR 43 IsOLAMENtO E CLONAGEM DE UM GENE EsPECíFICO Isolamento de um gene específico A partir do momento em que a estrutura do DNA foi elucidada e se entendeu como ocorre a produção de proteínas pelas células, os pesquisadores sonham em poder controlar a síntese de proteínas com o intuito de produzir proteínas raras e valiosas para o homem. Ou seja, o homem almeja isolar um determinado gene, multiplicá-Io e conseguir quantidades razoáveis da proteína que este gene codifica. Há trinta anos surgia a Tecnologia do DNA Recombinante e o homem começava a “brincar de Deus”, manipulando os genes e utilizando micro- organismos como verdadeiras fábricas, no intuito de produzir, em larga escala, proteínas importantes como a insulina, hormônio de crescimento, interferon (proteína antiviral), etc. No passado estes produtos foram obtidos do sangue do doador e de outros animais. Sua obtenção e purificação eram lentas e caras. Os produtos gênicos criados geneticamente estão rapidamente ficando mais baratos e se tornando uma alternativa mais eficiente. Houve um grande impulso nesta área, pois o apelo comercial é muito grande. Imaginemos o exemplo da insulina, onde indústrias farmacêuticas lançam esta proteína no mercado para o tratamento da diabetes, uma doença que afeta aproximadamente 1 a cada 200 indivíduos da raça branca, gerando um mercado consumidor na ordem de milhões de dólares diariamente. A produção de moléculas através da Tecnologia do DNA Recombinante não é simples, pois o DNA é uma molécula muito regular, sendo variável apenas em quatro diferentes bases nitrogenadas, apresentando características químicas muito semelhantes. Regiões que participam da formação de uma proteína são semelhantes a regiões não codificadoras. Além disso, a molécula de DNA, que compõe um cromossomo dos organismos superiores, é imensa (o tamanho do DNA existente em um núcleo humano representa 50000 vezes a viagem da Terra à Lua), contendo unidade 0244 milhares de genes. O genoma humano tem 3 bilhões de pares de bases, um gene pode conter menos do que 2000 pb. Isso significa que um gene pode ser um fragmento de DNA perdido entre 1,5 milhão de outros fragmentos praticamente iguais. O DNA, quando extraído da célula, é muito frágil e tende a se quebrar. Como a molécula se quebra casualmente, as quebras podem acontecer dentro dos genes, separando-o em dois ou mais fragmentos diferentes. Dessa forma, encontrar um gene específico entre o DNA total de uma célula é, certamente, mais difícil que encontrarmos uma agulha em um palheiro, já que a composição química da palha é diferente da agulha, bem como o seu aspecto morfológico. Vale a pena salientar que há alguns anos, a localização de um gene específico era impossível. Essa situação só pôde ser superada com o desenvolvimento de métodos para se criar uma molécula de DNA recombinante (fragmento contendo DNAs de origens diferentes). Quando se pretende analisar uma estrutura complexa como, por exemplo, o motor de um jato, e entender como cada peça funciona, fica muito mais fácil se o motor for desmontado e as peças separadas de forma organizada. É mais ou menos isso que se faz com o DNAtotal de um organismo, o genoma, quando se pretende isolar um gene específico. Primeiramente, temos que obter um DNA em qualidade e quantidade adequadas de forma rápida e eficiente. Embora o homem tenha conseguido isolar DNA de múmias de 4000 anos, amostras herbarizadas, fósseis e de amostras com elevado nível de destruição (como no caso de um acidente aéreo, por exemplo), a quantidade e qualidade de DNA em geral são afetadas significativamente pela condição do tecido antes da extração. Os cuidados iniciais durante a coleta e o armazenamento podem reduzir em muito os problemas encontrados posteriormente na qualidade do DNA, que em geral resultam na sua degradação. Embora o DNA genômico possa ser obtido de qualquer tecido humano, na prática, as seguintes amostras são utilizadas principalmente: sangue, pela facilidade da coleta, sendo que o DNA é extraído dos glóbulos brancos (leucócitos), uma vez que as hemácias não possuem núcleo; cultura de fibroblastos, estabelecida a partir de biópsia de pele; culturas transformadas de linfócitos ou, no caso de diagnóstico pré-natal, fluido amniótico e vilosidades coriônicas, em que o DNA pode ser extraído diretamente do material coletado ou após a cultura de células. A extração e a purificação do DNA genômico compreendem vários passos que incluem a lise das células, extração das proteínas, RNA e precipitação do DNA. A maioria dos protocolos de extração de DNA vegetal envolve Diagnóstico pré-natal: Diagnóstico de uma doença realizado antes do nascimento. BIOLOGIA MOLECULAR 45 uma fase onde objetiva-se romper as paredes e membranas celulares. A maceração de tecido fresco pode ser feita na presença de nitrogênio líquido ou com o auxílio de moinho elétrico se o tecido for liofilizado. Posteriormente, utiliza-se um tampão de extração, contendo algum detergente, antioxidante e agente tamponante, visando à solubilização de membranas lipoprotéicas e desnaturação de proteínas, enquanto o DNA é protegido da ação de enzimas de degradação. Esta suspensão é submetida a uma temperatura entre 50 e 60ºC durante 15 a 60 minutos para facilitar a solubilização e homogeneização da suspensão. Na terceira etapa, esta suspensão é submetida a uma extração com um solvente orgânico, clorofórmio-álcool isoamílico. As fases orgânicas e aquosas são separadas através de centrifugação. Nesta extração, lipídios, proteínas e a maioria dos polissacarídeos são retidas na fase orgânica inferior, enquanto que o DNA, RNA e alguns polissacarídeos são retidos na fase aquosa (superior). Na quarta etapa, um álcool (isopropanol ou etanol) é adicionado à fase aquosa. O DNA na presença de sal e álcool forma um precipitado, frequentemente visível, que pode ser “pescado” ou sedimentado por centrifugação. Após lavagens do precipitado com álcool, na quinta e última etapa este precipitado de DNA/RNA é ressuspendido em um tampão Tris-EDTA contendo RNAse para degradar o RNA, restando apenas o DNA genômico desejado. Várias são as técnicas utilizadas na quantificação de DNA. Algumas dependem do emprego de equipamentos muitas vezes onerosos como espectrofotômetros, enquanto outras, menos precisas, são simples e baratas. A opção por um ou outro método depende basicamente da condição do laboratório e dos objetivos do experimento a ser realizado. Duas técnicas bastante utilizadas na quantificação de DNA para análises moleculares são a quantificação através de fluorímetro e a quantificação comparativa em géis corados com brometo de etídio. A técnica de quantificação através de fluorímetro utiliza um equipamento bem menos oneroso que um espectrofotômetro. Esta técnica baseia-se na adição de um composto (DAPI) à solução de DNA e na quantificação do DNA com base na emissão de fluorescência deste composto. O DAPI é um composto que se liga à molécula de DNA como uma sonda e que emite fluorescência ao ser excitado pelo feixe de luz do fluorímetro. Quanto maior a fluorescência emitida, maior a concentração de DAPI associado a DNA, e, portanto, maior a concentração de DNA. Outra técnica bastante simples utilizada na quantificação de DNA é a análise comparativa de amostras coradas com brometo de etídio em géis de agarose. A técnica consiste simplesmente em se estimar, visualmente, Desnaturação do DNA: É o processo de separação das fitas complementares do DNA ou RNA, que rompe as pontes de hidrogênio através de temperaturas elevadas ou do tratamento com solução alcalina. unidade 0246 a concentração do DNA de concetração desconhecida, por meio da eletroforese do DNA-padrão e da amostra de concentração desconhecida em gel de agarose. A estimativa das concentrações das bandas é feita sob luz ultravioleta com base na fluorescência. Como ocorre a separação de DNA e RNA durante a eletroforese, reduz a imprecisão do processo de quantificação quando o ácido nucléico analisado apresenta contaminantes que se ligam ao brometo de etídio. A observação da fotografia do gel sob luz ultravioleta ou da imagem digitalizada do gel, proporciona uma estimativa aproximada da concentração de DNA das soluções testadas. Quando possível, é de extrema importância evitar a quantificação pela observação direta das bandas sob luz ultravioleta. Exposição prolongada à luz ultravioleta, mesmo com proteção de máscaras, deve ser evitada. A fotografia (ou imagem digitalizada), além de registrar a quantificação, evita os problemas com exposição prolongada à luz ultravioleta. Clonagem de um gene específico Posteriormente à extração do DNA, cortamos a molécula de DNA que contém o gene de interesse em fragmentos menores. Cada um desses fragmentos é então ligado a outra molécula de DNA capaz de transportá-Io separadamente para dentro de uma célula hospedeira apropriada. A célula que recebe a molécula híbrida (DNA recombinante) passa a funcionar como uma fábrica dessa molécula, duplicando-a a cada divisão celular (clonagem gênica). Assim, cada fragmento é produzido em larga escala, possibilitando a localização de qual fragmento está o gene que nos interessa e que posteriormente iremos isolar. Quanto maior for o número de diferentes fragmentos produzidos, mais difícil será encontrar um determinado fragmento no qual o gene de interesse está presente. Por essa razão, bancos genômicos de organismos complexos, como o homem, devem ser construídos de preferência com fragmentos de DNA não muito pequenos. Outra forma de se reduzir o número de clones que devemos analisar é diminuindo o tamanho daquilo que se deseja representar no banco. Por exemplo, quando se conhece previamente em qual dos 23 pares de cromossomos humanos está presente o gene que se pretende isolar, pode- se construir um banco no qual somente esse cromossomo específico esteja representado, ao invés de todo o genoma humano. Nesse caso, trata-se de um banco cromossômico. Podemos isolar um cromossomo particular de uma célula com o BIOLOGIA MOLECULAR 47 auxílio de um equipamento capaz de reconhecer diferenças mínimas entre os cromossomos. Tal equipamento, o flow sorter, funciona baseado no princípio de que cada cromossomo tem um conteúdo de DNA característico, o que permite seu reconhecimento. Cromossomos metafásicos são corados com corantes fluorescentes e passam através de raios laser. A fluorescência emitida depende do conteúdo de DNA, sendo, portanto, específica para cada cromossomo. Cromossomos que exibem a fluorescência desejada são marcados pela aquisição de cargas elétricas, e uma placa defletora do equipamento seleciona os cromossomos segundo as cargas elétricas que apresentam. Dessa forma, amostras praticamente puras de um cromossomo específico podem ser obtidas para, a partir daí, o banco cromossômico ser construído. Embora todos os genes estejam presentes em todas as células de um organismo, somente um pequeno conjunto desses genes está ativo em um determinado tecido. A atividade de um gene resulta na produção da proteína que ele codifica. Quando um gene se expressa
Compartilhar