Baixe o app para aproveitar ainda mais
Prévia do material em texto
DOCÊNCIA EM SAÚDE BIOTECNOLOGIA 1 Copyright © Portal Educação 2013 – Portal Educação Todos os direitos reservados R: Sete de setembro, 1686 – Centro – CEP: 79002-130 Telematrículas e Teleatendimento: 0800 707 4520 Internacional: +55 (67) 3303-4520 atendimento@portaleducacao.com.br – Campo Grande-MS Endereço Internet: http://www.portaleducacao.com.br Dados Internacionais de Catalogação na Publicação - Brasil Triagem Organização LTDA ME Bibliotecário responsável: Rodrigo Pereira CRB 1/2167 Portal Educação P842b Biotecnologia / Portal Educação. - Campo Grande: Portal Educação, 2013. 211p. : il. Inclui bibliografia ISBN 978-85-8241-804-8 1.Biotecnologia. I. Portal Educação. II. Título. CDD 660.6 2 SUMÁRIO 1 HISTÓRIA DA BIOTECNOLOGIA E REVISÃO DE GENÉTICA ............................................... 5 1.1 DEFINIÇÃO E HISTÓRIA ........................................................................................................... 5 2 REVISÃO DE GENÉTICA .......................................................................................................... 8 2.1 ESTRUTURA DO DNA ............................................................................................................... 8 2.2 REPLICAÇÃO DO DNA ............................................................................................................. 13 2.3 MECANISMOS DE REPLICAÇÃO DO DNA ............................................................................. 16 2.4 TRANSCRIÇÃO ....................................................................................................................... 19 2.4.1 Estrutura do RNA ...................................................................................................................... 19 2.4.2 RNA como molécula mensageira .............................................................................................. 21 2.5 TRANSCRIÇÃO DO DNA .......................................................................................................... 22 2.5.1 Mecanismos envolvidos na transcrição gênica .......................................................................... 24 2.6 TRADUÇÃO .............................................................................................................................. 35 2.6.1 Código Genético ........................................................................................................................ 35 2.7 SÍNTESE PROTEICA ................................................................................................................ 39 2.7.1 Ribossomos ............................................................................................................................... 39 2.7.2 Iniciação da tradução em procariotos ........................................................................................ 41 2.7.3 Alongamento da síntese proteica em procariotos ...................................................................... 43 2.7.4 Tradução em eucariotos ............................................................................................................ 44 2.8 PROCESSAMENTO PROTEICO .............................................................................................. 46 2.9 REGULAÇÃO DA TRANSCRIÇÃO ........................................................................................... 47 2.9.1 Regulação da transcrição em procariotos ................................................................................. 47 2.9.2 Regulação genética em eucariotos............................................................................................ 52 3 A TECNOLOGIA DO DNA RECOMBINANTE .......................................................................... 59 3.1 ISOLAMENTO DE GENES ........................................................................................................ 62 3.1.1 Extração de DNA ...................................................................................................................... 62 3.1.2 Enzimas de restrição ................................................................................................................. 64 3.1.3 Ligação enzimática .................................................................................................................... 68 3.1.4 Diferença estrutural ente genes eucariotos e procariotos .......................................................... 70 3.1.5 Obtenção do inserto .................................................................................................................. 70 3 3.2 VETORES DE CLONAGEM ...................................................................................................... 84 3.2.1 Plasmídeos ................................................................................................................................ 84 3.2.2 Bacteriófagos ............................................................................................................................. 80 3.2.3 Cosmideos ................................................................................................................................. 91 3.2.4 BAC E YAC ............................................................................................................................... 93 3.2.5 Vetores de expressão ................................................................................................................ 96 3.3 TRANSFORMAÇÃO DA CÉLULA HOSPEDEIRA ..................................................................... 96 3.4 AMPLIFICAÇÃO DO DNA RECOMBINANTE ........................................................................... 99 3.5 SELEÇÃO DE CLONES TRANSFORMADOS COM O DNA HÍBRIDO .................................... 100 3.5.1 Seleção por hibridização de DNA ............................................................................................. 102 3.5.2 Busca por atividade imunológica .............................................................................................. 104 3.5.3 Busca por atividade proteica .................................................................................................... 106 3.6 CONFIRMAÇÃO DO INSERTO ............................................................................................... 107 4 EXPRESSÃO GÊNICA EM ORGANISMOS PROCARIOTOS E EUCARIOTOS ..................... 109 4.1 VETORES DE EXPRESSÃO .................................................................................................. 109 4.2 SEQUÊNCIAS PROMOTORAS ............................................................................................... 111 4.2.1 Isolamento de sequências promotoras ..................................................................................... 112 4.2.2 Promotores induzíveis .............................................................................................................. 116 4.3 INTEGRAÇÃO DO DNA NO CROMOSSOMO DA CÉLULA HOSPEDEIRA ............................ 126 4.4 EFICIÊNCIA DE TRADUÇÃO .................................................................................................. 128 4.5 ESTABILIDADE DE PROTEÍNAS ............................................................................................ 130 4.5.1 Espécie hospedeira .................................................................................................................. 130 4.5.2 Aumento da estabilidade proteica pela modificação da sua estrutura ...................................... 131 4.6 PROTEÍNAS DE FUSÃO ..........................................................................................................132 4.7 AUMENTO DA SECREÇÃO DE PROTEÍNAS RECOMBINANTES ......................................... 133 4.8 EXPRESSÃO EM SISTEMAS EUCARIOTOS ......................................................................... 136 4.8.1 Sistemas de expressão eucariotos ........................................................................................... 138 5 APLICAÇÕES DA BIOTECNOLOGIA .................................................................................... 157 5.1 PROJETOS GENOMA ............................................................................................................. 157 5.2 TERAPIA GÊNICA ................................................................................................................... 158 5.3 NOVAS VACINAS .................................................................................................................... 159 5.4 NOVOS PRODUTOS ............................................................................................................... 161 4 5.5 NOVOS KITS DE DIAGNÓSTICO ............................................................................................ 161 5.6 SELEÇÃO ASSISTIDA COM TESTES DE DNA E CLONAGEM .............................................. 164 5.7 ANIMAIS TRANSGÊNICOS ..................................................................................................... 166 5.7.1 Animais resistentes a doenças ................................................................................................. 167 5.7.2 Animais transgênicos como biorreatores .................................................................................. 169 5.7.3 Animais transgênicos e as características de interesse econômico ......................................... 171 5.7.4 Animais transgênicos na pesquisa biomédica e de xenotransplante ........................................ 172 5.8 ALIMENTOS GENETICAMENTE MODIFICADOS ................................................................... 174 5.9 BIORREMEDIAÇÃO ................................................................................................................. 176 6 INTRODUÇÃO À BIOINFORMÁTICA .................................................................................... 178 6.1 BANCO DE DADOS ................................................................................................................. 179 6.1.1 Bancos de dados públicos ........................................................................................................ 180 6.2 ALINHAMENTO DE SEQUÊNCIAS ........................................................................................ 181 6.3 A BIOINFORMÁTICA E OS PROJETOS GENOMA E TRANSCRIPTOMA ............................. 182 6.4 BASE CALLING ........................................................................................................................ 183 6.5 MASCARAMENTO DE VETORES ........................................................................................... 184 6.6 AGRUPAMENTO DE SEQUÊNCIAS ....................................................................................... 189 6.7 ANOTAÇÃO GÊNICA ............................................................................................................... 193 6.7.1 BLAST ...................................................................................................................................... 194 6.8 A BIOINFORMÁTICA E A ANÁLISE DA ESTRUTURA PROTEICA ......................................... 211 6.8.1 Análise da estrutura primária de proteínas ............................................................................... 211 6.8.2 Análise da estrutura secundária ............................................................................................... 219 6.8.3 Modelagem molecular .............................................................................................................. 222 6.9 MAPEAMENTO DE EPITOPOS ................................................................................................... 224 6.10 MÉTODOS EM FILOGENIA MOLECULAR .............................................................................. 225 REFERÊNCIAS BIBLIOGRÁFICAS .................................................................................................. 228 5 1 HISTÓRIA DA BIOTECNOLOGIA E REVISÃO DE GENÉTICA 1.1 DEFINIÇÃO E HISTÓRIA O termo biotecnologia pode ser definido como a aplicação de princípios científicos e tecnológicos no processamento de materiais por agentes biológicos, visando à produção de serviços e mercadorias. Nessa visão ampla, a biotecnologia tradicional é uma tecnologia utilizada desde os primeiros profissionais que utilizaram microrganismos em processos fermentativos para a geração de iogurtes e cervejas, por exemplo. No início da década de 70, a biotecnologia tradicional era uma disciplina confinada a departamentos de engenharia química e a programas de microbiologia. Em 1919, o termo “biotecnologia” foi criado pelo engenheiro húngaro Karl Ereky. Esse pesquisador utilizou o termo para descrever seu experimento que visava à produção em larga escala de suínos alimentados com beterrabas cultivadas com micro-organismos. Karl então definiu biotecnologia como todas as linhas de pesquisa que envolve a geração de produtos a partir de matérias-primas que receberam a adição de materiais vivos. Contudo, essa terminologia permaneceu bastante ambígua entre os cientistas e, somente em 1961, o termo foi então associado com o estudo da produção industrial de bens e serviços por procedimentos que utilizam organismos, sistemas ou processos biológicos. Isto se deve ao microbiologista sueco Carl Gören Hedén, que sugeriu a mudança de título de um jornal de publicação científica na área de microbiologia aplicada e fermentação industrial, intitulado de “Jornal de Microbiologia e Engenharia Bioquímica e Tecnologia” para “Biotecnologia e Bioengenharia”. A biotecnologia tradicional foca em três aspectos principais: (i) preparação da matéria- prima a ser utilizada como fonte para os microrganismos; (ii) o processo de fermentação do material em biorreatores, obtendo-se a biotransformação e produção do material desejado; e (iii) a purificação do produto final. A obtenção de um determinado produto em escalas industriais é o objetivo principal da biotecnologia. Então, muitas pesquisas foram realizadas visando melhorar e aperfeiçoar os três aspectos envolvidos no desenvolvimento da tecnologia. Com esta finalidade, foram realizados vários investimentos em desenhos de novos biorreatores e no controle e monitoramento dos 6 processos fermentativos. Apesar de se ter obtido um aumento de produção significativo, a otimização do processo de biotransformação ainda permanecia aquém do desejado. As linhagens de microrganismos capazes de sintetizar os produtos de interesse o faziam em níveis subótimos para uma escala industrial. Mutações aleatórias induzidas por mutágenos químicos e radiação ultravioleta algumas vezes eram capazes de aumentar os níveis de produção. Contudo, esse alcance é frequentemente limitado. Normalmente, a indução de mutações afeta não só a característica desejada, como outras importantes para o metabolismo celular. Por exemplo, mesmo que o microrganismo produza em maiores quantidades o produto desejado, a mutação pode afetar uma função biológica fundamental, resultando em um crescimento bacteriano mais lento. Além deste efeito indesejado, o processo de gerar linhagens é demorado e há a necessidade de selecionar e testar muitas descendentes até que se cheguem à amostra esperada, aumentado os custos. Outra desvantagem é que essa mutação só é capaz de aumentar a produção de um bem de interesse que o microrganismo já seja capaz de produzir. Assim, há a necessidade de pesquisas com diversos outros microrganismos para descobrir quais proteínas eles expressam. A revolução da biotecnologia tradicionalveio com o desenvolvimento da tecnologia do DNA recombinante, o que envolve um conhecimento multidisciplinar (Fig. 1). Além da sabedoria de microbiologistas e engenheiros químicos, a nível industrial, a tecnologia do DNA recombinante programou as descobertas advindas da biologia molecular e genética. Esta união passou então a ser denominada biotecnologia molecular. 7 FIGURA 1 Figura 1: Conhecimento multidisciplinar envolvido com a biotecnologia molecular. O aprimoramento da biotecnologia tradicional em biotecnologia molecular se deve a avanços em conhecimentos de diversas áreas, como a engenharia química, a bioquímica, a biologia molecular, a genética, a microbiologia e a biologia celular. A biotecnologia molecular abriu a perspectiva de mudanças rápidas. Atualmente, as novas técnicas permitem uma alta produção e a criação de novas fábricas biológicas em menor tempo, de forma mais eficiente e com menor custo. A expectativa de resultados promissores, com a capacidade de sintetizar importantes produtos comerciais é um campo fascinante. Apesar de a biotecnologia molecular ser uma ciência multidisciplinar, a genética é uma disciplina fundamental e que merece um grande destaque entre as outras. Ela é tão importante para o desenvolvimento da biotecnologia que alguns autores de livros mais recentes chegam até mesmo definir biotecnologia como “tudo da genética que se aplica comercialmente”. Por isso, este curso será iniciado com uma revisão básica de genética. 8 2 REVISÃO DE GENÉTICA 2.1 ESTRUTURA DO DNA Muitas descobertas na área de genética foram sendo feitas e acumuladas para responder a uma pergunta inicial: como ocorria a transmissão da informação genética entre as gerações e como esta era armazenada. Para a biotecnologia, a mesma pergunta pode ser feita de outra forma: como o conhecimento da informação genética pode ser aplicado para a geração de bem comerciais. Nos anos de 1950, os dados a respeito deste assunto eram: 1. Os genes são os fatores hereditários associados a características fenotípicas; contudo, sua natureza física não era conhecida; 2. A teoria de que um gene corresponde a uma enzima sugeria que eles codificavam a informação necessária para a síntese proteica; 3. Sabia-se que os genes faziam parte dos cromossomos; 4. Os cromossomos eram constituídos por DNA e proteínas; 5. Em 1958, experimentos com a bactéria Streptococcus pneumoniae feitos por Frederick Griffth e Oswald Avery, demonstraram que a bactéria expressava um fenótipo diferente da linhagem selvagem após capturarem DNA derivado de outra amostra. Estes pesquisadores então apontaram que o DNA era o material genético. Em 1953, James Watson e Francis Crick postularam o modelo da estrutura do DNA. Embora não se conhecesse ao certo como era esta estrutura, os elementos básicos constituintes da molécula de DNA eram conhecidos. Estudos de DNA purificado e parcialmente fragmentado mostraram que esta molécula é composta por quatro estruturas básicas, os nucleotídeos. Estas quatro subunidades são idênticas em estrutura, diferindo apenas em sua composição de bases. Cada nucleotídeo contém um grupo fosfato, um açúcar (a desoxirribose) e uma base nitrogenada. Estas podem ser de quatro tipos diferentes: adenina (A), guanina (G), citosina (C) e timina (T) (Fig. 2). Adenina e guanina são similares em sua estrutura e são conhecidas como as bases purínicas. O mesmo ocorre com as bases citosina e timina, que são as pirimidinas. Na ausência do grupo fosfato, com o açúcar associado à base nitrogenada, a estrutura básica é então denominada nucleosídeo. 9 FIGURA 2: ESTRUTURA QUÍMICA DAS QUATRO BASES NITROGENADAS Os nomes completos dos nucleotídeos são: desoxiadenosina 5´ monofosfato (desoxiadenilato, dAMP), desoxiguanosina 5´ monofosfato (dGMP), desoxitimidina 5´ monofosfato (dTMP) e desoxicitidina 5´ monofosfato (dCMP). Contudo, por conveniências as bases são denominadas simplesmente pelas abreviações A, G, T e C, respectivamente. Após a descoberta de que o DNA desempenha um papel central na hereditariedade, cientistas então passaram a pesquisar e a propor modelos sobre a estrutura desta molécula. No decorrer de sua história, dois experimentos são reconhecidos como cruciais para o estabelecimento da estrutura aceita atualmente. Rosalina Franklin e Maurice Wilkins realizaram uma difração de raios X da estrutura do DNA. Os resultados destes experimentos sugeriram que o DNA é uma molécula longa e fina Deoxiadenilato (dAMP) Deoxiguanilato (dGMP) Deoxitimidilato (dTMP) Deoxicitidilato (dCMP) Deoxiadenilato (dAMP) Deoxiguanilato (dGMP) Deoxitimidilato (dTMP) Deoxicitidilato (dCMP) Deoxiadenilato (dAMP) Deoxiguanilato (dGMP) Deoxitimidilato (dTMP) Deoxicitidilato (dCMP) 10 composta por duas fitas similares que correm ao longo da molécula de maneira paralela a outra. Os dados ainda demonstraram que a molécula é helicoidal. Outro experimento trouxe dados complementares aos obtidos por Franklin e Wilkins. Após anos de pesquisa com DNA de diferentes microrganismos, Erwin Chargaff juntou suas informações e fez hipóteses a respeito da quantidade em que os componentes do DNA estão presentes na estrutura: I. A quantidade total de nucleotídeos compostos por pirimidinas (T + C) sempre equivale aos daqueles compostos por purinas (A + G); II. A quantidade de T sempre equivale à quantidade de A, sendo que o mesmo se faz verdadeiro para a proporção entre C e G. Por outro lado, a quantidade de A + T não é necessariamente igual à de G + C. Esta variação é característica de cada micro-organismo que esteja sendo utilizado como modelo experimental. Em 1953, Watson e Crick analisaram estes dois experimentos prévios e juntaram as informações por eles geradas. Então, esses pesquisadores propuseram o modelo da dupla hélice de DNA (Fig. 3). Neste, cada fita que a compõe é formada por uma cadeia de nucleotídeos unidos por ligações fosfodiéster. A figura também demonstra que o empilhamento dos pares de bases na dupla hélice resulta na formação de dois sulcos na sequência ose-fosfato: o sulco maior e o sulco menor. 11 FIGURA 3: MODELO DA DUPLA HÉLICE DO DNA. A figura é um modelo simplificado da estrutura helicoidal do DNA, mostrando o sulco maior e o sulco menor. A cuidadosa análise entre as proporções de bases na molécula de DNA feita por Chargaff foi a base da hipótese gerada por Watson e Crick para explicar como as duas fitas que correm paralelamente uma a outra são mantidas juntas. Esta união se dá por meio de pontes de hidrogênio entre pares de bases. Uma regra foi estabelecida para que estas interações ocorram: cada par de bases é composto por uma purina e por uma pirimidina. Ainda considerando o experimento de Chargaff, foi proposto que o pareamento se dava de G com C e de A com T. Estas ligações entre as pontes de hidrogênio estão representadas na Fig. 4. A Fig. 4 ainda demonstra que as fitas que compõem a dupla hélice correm em direções opostas: uma se inicia no grupo fostato (5´) e termina no grupo OH (3´). A outra fita, por sua vez, corre no sentido inverso, de 3 para 5´. Por esta característica, afirma-se que o pareamento entre as fitas de DNA é antiparalelo. 12 FIGURA 4: DUPLA HÉLICE DO DNA EM FORMA PLANA Cada fita é formada pela união de nucleotídeos, sendo que a dupla hélice é constituída pela união entre duas fitas de DNA que se orientam em sentidos opostos: uma corre no sentido 3´ - 5´ e a outra, de 5´ - 3´. Para o pareamento de bases, cada par contém uma base purínica (adenina – A – ou guanina – G), e uma base pirimidínica (timina – T – ou citosina – C), ligadas por ponte de hidrogênio. As setas amplificam e demonstram com mais detalhes como ocorre o pareamento entre as bases. Basicamente,adenina e timina se pareiam pela formação de duas pontes de hidrogênio; já a citosina e guanina, ligam-se por três pontes de hidrogênio. As pontes de hidrogênio estão representadas por três barras em azul. (Figura modificada de Griffiths et al., 2002). As relações entre as bases durante o pareamento demonstraram que T se pareia somente com A e C somente com G. Outros tipos de pareamento não ocorrem naturalmente no DNA. Para explicar esse achado, Watson e Crick demonstraram que este pareamento restrito permite a formação mais eficiente de pontes de hidrogênio entre as bases, o que implica na relação ótima para a manutenção da estabilidade da molécula de DNA. Além disso, G e C são 13 unidas por três pontes de hidrogênio, enquanto a relação entre A e T envolve a formação de somente duas pontes. Assim, genomas que apresentem um alto conteúdo de GC em sua constituição são mais estáveis que aqueles onde há maior proporção de AT. Estas observações têm implicações diretas em muitas técnicas utilizadas rotineiramente em procedimentos biotecnológicos. A descoberta da estrutura do DNA causou grande impacto na genética e em outras áreas da biologia. Isto se deve a duas razões principais. Primeiramente, a própria relação entre os componentes na estrutura sugere como o material genético é duplicado ou replicado. Com a restrição imposta pelo pareamento específico de bases, provavelmente a fita molde expõe suas bases que determinam qual nucleotídeo deve ser incorporado à nova molécula filha. Em segundo lugar, como a informação genética está contida no DNA, a sequência de nucleotídeos então poderia ditar de alguma forma a sequência de aminoácidos que formariam uma proteína específica. Assim, um tipo de código genético estaria representado na sequência nucleotídica do DNA, que seria então traduzida para uma diferente linguagem que compõe as proteínas, os aminoácidos. 2.2 REPLICAÇÃO DO DNA A transmissão precisa da informação genética que é um processo essencial para a manutenção da vida e de sua integridade. Portanto, há a necessidade de que um procedimento extremamente específico tenha sido desenvolvido durante a evolução. Para desvendá-lo, inicialmente foram propostos modelos da replicação do DNA baseados na complementaridade de bases. A fidelidade entre o pareamento específico de bases permitiria então que a fita molde fizesse uma réplica antiparalela (Fig. 5). 14 FIGURA 5: O MODELO DA REPLICAÇÃO DO DNA PROPOSTO POR WATSON E CRICK As fitas parentais são desnaturadas, permitindo que as bases dos nucleotídeos sejam expostas. A formação das fitas filhas se deve à especificidade de bases impostas pelas fitas parentais. Ao final do processo, são geradas duas fitas filhas de sequências complementares à das fitas parentais utilizadas como molde. O modelo de replicação do DNA proposto por Watson e Crick baseado na especificidade de bases não explica, contudo, de que maneira a molécula de DNA parental pode ser relacionada às moléculas filhas. Há três possibilidades distintas: semiconservativa, conservativa e dispersiva. Na replicação semiconservativa, cada dúplex é formado por uma fita parental e por outra fita filha recém-sintetizada. Na conservativa, a replicação produz dois dúplex: um formado por duas fitas molde, e outro, por duas fitas filhas. A terceira hipótese, a replicação dispersiva, cada dúplex é formada por fragmentos de dupla fita contendo apenas segmentos de DNA parental e, na mesma molécula, há também fragmentos de dupla fita contendo apenas segmentos recém-sintetizados. 15 Para discriminar entre as hipóteses sugeridas como modelo para à replicação do DNA, Matthew Meselson e Franklin Stahl realizaram um elegante experimento em 1958. Esses pesquisadores analisaram várias gerações de culturas bacterianas que tiveram como fonte de nitrogênio duas moléculas que apresentam densidades diferentes, o N15 e o N14. Inicialmente, as culturas foram supridas somente com N15, os quais foram incorporados às bases nitrogenadas que estavam sendo formadas durante a replicação do DNA. Após a divisão celular de algumas gerações, as mesmas células bacterianas foram cultivadas em meio contendo somente o N14. O padrão de replicação foi diferenciado após a separação do DNA em gradiente de cloreto de césio (Fig. 6). O resultado obtido após a centrifugação demonstrou a presença de uma banda intermediária entre os dois nitrogênios na primeira geração com N14, e uma intermediária e outra correspondente a somente o N14. Esse experimento confirmou que a replicação do DNA é semiconservativa. Os mesmos resultados foram obtidos em experimentos posteriores, validando então o modelo. FIGURA 6: PADRÃO DE BANDAS ESPERADO APÓS A REPLICAÇÃO SEMICONSERVATIVA, CONSERVATIVA OU DISPERSIVA DO DNA EM CLORETO DE CÉSIO. 16 Dupla fita em vermelho representa fitas compostas somente por N15; as duas fitas azuis seriam compostas por somente N14. Após a primeira seta da esquerda, são representadas a primeira e a segunda geração de células crescidas em meio contendo somente N14. O padrão de bandas da legenda se refere ao obtido após a centrifugação em cloreto de césio. (Figura modificada de Griffiths et al., 2002). Diversos modelos experimentais foram propostos para explicar como é a estrutura do DNA. O modelo da dupla hélice explicou bem alguns processos envolvidos com a estrutura do DNA e o mesmo ainda é aceito atualmente. Após se chegar a este modelo, os cientistas então passaram a outros processos envolvendo a molécula, como a replicação. 2.3 MECANISMOS DE REPLICAÇÃO DO DNA No período de 1950, o cientista Arthur Kornberg identificou e purificou uma das enzimas envolvidas na replicação do DNA, a DNA polimerase I. Esta enzima tem três atividades: I. Atividade de polimerase, catalisando o crescimento da cadeia na direção 5´- 3´; II. Atividade exonucleásica 3´- 5´, removendo o pareamento de bases incorretas; III. Atividade exonucleásica 5´ - 3´, que degrada o DNA dupla fita. Outras duas DNAP foram descobertas posteriormente. Postula-se que a DNAP II esteja envolvida no reparo de DNA; contudo, ainda não há uma função específica atribuída a esta enzima. A DNAP III atua na replicação do DNA, juntamente com a DNAP I. A DNAP III completa a replicação do DNA fita simples, isto é, se já existir um pequeno fragmento de DNA dupla fita. Este oligonucleotídeo é conhecido como “primer”. O ponto específico da sequência de DNA no qual a replicação se inicia é denominado origem de replicação. Em Escherichia coli, há uma origem de replicação. Uma vez iniciada, a replicação prossegue de forma bidirecional. Para que se inicie o processo, há a ligação da proteína DNA A e, em seguida, há a desnaturação do DNA. Em eucariotos, a replicação é mais complexa. Experimentos com moléculas de DNA marcadas demonstraram a existência de inúmeras regiões de replicação dentro de um único braço cromossomal. Estima-se que haja cerca de 400 origens de replicação distribuídas entre os 17 cromossomos de levedura e 10.000 para humanos. Além disso, a replicação em eucariotos é 17 um processo altamente coordenado dentro de um mesmo cromossomo e em todo o conjunto celular destas estruturas. Em presença de nucleotídeos trifosfatos, a DNAP polimeriza uma nova molécula de DNA dupla fita. Contudo, este procedimento de extensão da fita é dependente da prévia existência de um pequeno oligonucleotídeo de aproximadamente 30 pb. Este “primer” pode ser sintetizado tanto por uma RNA polimerase (RNAP) como pela enzima denominada primase. Portanto, somente após a síntese do “primer” complementar a uma determinada sequência de DNA, haverá a extensão da cadeia pela DNAP. A síntese de novas cadeias pela DNAP ocorre na direção 5´ - 3´. Pela natureza antiparalela da fita de DNA, a enzima se move sobre a fita molde na direção 3´ - 5´. Asíntese de uma nova fita, designada “leading” é contínua. Por outro lado, a desnaturação do DNA também expõe outra fita molde que corre no sentido 5´- 3´, a “lagging”. Então, a forquilha de replicação – ponto em que as duas fitas de DNA se separam para permitir a replicação de cada fita – tem de seguir no sentido contrário da outra fita para que a polimerização seja de 5´- 3´. Para que a replicação ocorra ao mesmo tempo nas duas fitas, a polimerização na “lagging” é realizada em pequenos segmentos descontínuos. Inicialmente, um “primer” de RNA é sintetizado de forma complementar ao DNA. Em seguida, ocorre então a polimerização e elongação da fita de DNA pela DNAP. Estes fragmentos de DNA foram identificados pela primeira vez por Reiji Okazaki e, por isso, são denominados fragmentos de Okazaki. A atividade exonucleásica no sentido 5´- 3´da DNAP I remove os “primers” de RNA e preenche esta sequência com um segmento fita simples de DNA. Estes são então selados pela enzima DNA ligase, que catalisa a ligação do fosfato 5´ a um grupo 3´ OH adjacente. Esta ligação ocorre assim que a forquilha expõe a fita “lagging” e prossegue até que o fragmento precedente seja alcançado. Para que a replicação seja simultânea, entre as duas fitas do DNA, foi proposto um modelo que está demonstrado na Fig. 7. A fita “lagging” sofre uma volta sobre o complexo enzimático responsável pela replicação do DNA. Esta volta permite que a RNAP III sintetize ambas as fitas filhas. Depois de percorridos aproximadamente 1.000 pb, o fragmento dupla fita de DNA da fita “lagging” é liberado pela DNAP III, permitindo que uma nova volta seja formada sobre a molécula de DNA. 18 FIGURA Figura 7: Modelo proposto para a replicação do filamento descontínuo. Este modelo possibilita que a holoenzima de DNAP III sintetize ambos os filamentos filhos. A replicação do DNA envolve um complexo enzimático. Além da DNAP e da primase, há outras enzimas envolvidas, como as helicases. Essas são essenciais para o início da replicação do DNA, pois são as responsáveis por romper as pontes de hidrogênio que mantêm as duas fitas de DNA unidas. Esta fita simples é estabilizada pela ligação da proteína SSB, que se liga à fita simples de DNA e, com isso, retarda a formação do dúplex. 19 Ambas as DNAP I e III possuem atividade exonucleásicas 3´ - 5´, o que permite verificar e editar bases inseridas erroneamente ou mal pareadas. Esta atividade é fundamental para a manutenção da fidelidade da informação genética. Mutantes deficientes nesta atividade apresentam maior taxa de mutação. Muitos questionamentos foram feitos após a descoberta da estrutura e de outros processos que envolvem o DNA. Entre eles, o que realmente intrigava e fascinava os pesquisadores era a descoberta de como a informação genética presente em sequências de DNA são transmitidas até a síntese de proteínas. O primeiro passo para atingir este objetivo foi entender o processo de transcrição. 2.4 TRANSCRIÇÃO Após a descoberta do DNA, os pesquisadores então queriam entender como a informação genética contida nesta sequência de bases era traduzida em proteínas. A primeira especulação poderia ser que esta transferência era realizada diretamente do DNA em proteínas. Contudo, a união da genética e da citologia permitiu elucidar muitos fatos. A observação de que o material genético em células eucariotas se encontrava no núcleo e as proteínas no citoplasma demonstravam a necessidade de uma molécula intermediária. Posteriormente, o processo foi elucidado e o intermediário nesta transferência de informações é o RNA. 2.4.1 Estrutura do RNA A estrutura básica do RNA é bem semelhante a do DNA. Ambos são formados por uma cadeia constituída pela união de nucleotídeos por meio de ligações fosfodiésteres. Apesar da semelhança, o RNA apresenta algumas diferenças estruturais se comparado ao DNA: I. A primeira diferença está na composição dos nucleotídeos. No DNA, eles podem ser compostos por quatro bases distintas: adenina, citosina, guanina e timina. No RNA, três bases nitrogenadas são as mesmas daquelas encontradas no DNA: adenina, citosina e guanina. 20 Contudo, ao invés da timina, a base denominada uracila compõe um dos tipos de nucleotídeos de RNA. Apesar desta diferença, a uracila forma pontes de hidrogênio com a adenina, assim como o faz a timina. II. A segunda diferença ainda está relacionada com o tipo de açúcar que compõe o nucleotídeo. O açúcar que compõe o DNA é a desoxirribose e no RNA é a ribose. A única diferença entre estes açúcares é a presença ou a ausência de um átomo de oxigênio na posição do carbono 2, como demonstrado na Fig. 8; FIGURA 8: DIFERENÇA ESTRUTURAL ENTRE RIBOSE E DESOXIRRIBOSE III. Por fim, o RNA é constituído por uma fita simples e não por uma fita dupla como o DNA. Consequentemente, o RNA não forma a estrutura de dupla hélice observada no DNA. Pelo contrário, a fita simples permite que haja diversas combinações no pareamento de bases. Assim, a estrutura tridimensional do RNA pode formar diferentes complexos, que são apresentados sob variados aspectos. Esta característica é importante sobre o ponto de vista tecnológico, pois a fita simples interfere negativamente com muitos processos de interesse biotecnológico. Um exemplo é a dificuldade em produzir em larga escala proteínas de interesse farmacêutico quando o RNA assume uma conformação inadequada. O conhecimento da estrutura dos ácidos nucleicos foi o primeiro passo para as pesquisas subsequentes. Apesar do DNA e RNA apresentarem algumas diferenças em sua estrutura, o que se observa é a grande semelhança quanto a sua constituição. A partir disso, foi sugerido pelos cientistas que o RNA pudesse ser então a molécula intermediária na 21 transferência da informação genética contida no DNA em proteínas. Então, estudos foram dirigidos neste sentido para elucidar o papel do RNA na expressão de proteínas. 2.4.2 RNA como molécula mensageira Para verificar se o RNA poderia funcionar como mensageiros elegantes estudos genéticos foram realizados. Inicialmente, precursores de RNA marcados radioativamente foram capturados por células em cultura. A localização deste material a ser utilizado na síntese de moléculas de RNA foi então observada durante um curto intervalo de tempo por autorradiografia. Após receberem precursores marcados, em um primeiro momento este material se encontrava no núcleo. Após certo tempo, o material também pôde ser visualizado no citoplasma (Fig. 9). Portanto, aparentemente o RNA é sintetizado no núcleo e, em seguida, segue para o citoplasma. FIGURA 9: SÍNTESE DE RNA O uso de precursores de RNA pré-marcados demonstrou que o RNA é sintetizado no núcleo e em seguida, segue para o citoplasma. O experimento inicial com os precursores pré-marcados foi ainda reforçado com estudos realizados por Elliot Volkin e Lawrence Astrachan em 1957. O modelo experimental adotado por estes pesquisadores partiu de estudos de infecção da bactéria E. coli com o fago 22 T2. Este fago é capaz de inserir seu material genético no cromossomo desta bactéria (profago) e utilizar a maquinaria da célula infectada para a produção de suas próprias proteínas. Os pesquisadores então compararam a sequência do RNA sintetizado após a infecção da E. coli com o DNA do fago inserido no genoma da bactéria e descreveram a grande similaridade entre os dois. Assim, foi possível concluir que o RNA é sintetizado a partir do DNA e que, de alguma maneira, o mensageiro é utilizado na síntese proteica. Vale ressaltar que os transcritos podem ter diferentes funções. Alguns RNA têm função estrutural. O RNA ribossômico (RNAr) é um dos constituintes dos ribossomos. O RNA transportador (RNAt) tem função de molécula carreadora, transportando os aminoácidos. O RNAm,por fim, é a molécula intermediária que serve como molde para a síntese proteica. As semelhanças entre a estrutura do DNA e do RNA foram então os pontos que os pesquisadores tiveram como hipótese de que o RNA pudesse ser o mensageiro para a síntese proteica. Após obterem esta confirmação pelos experimentos com precursores marcados, o passo seguinte é entender o mecanismo da cópia fiel do DNA em RNA. 2.5 TRANSCRIÇÃO DO DNA O processo em que a sequência de DNA é copiada em um RNA mensageiro (RNAm) é denominado transcrição. Apesar de ter sido elucidado o papel que desempenha na transferência da informação, outra dúvida a ser respondida foi: como se dá a cópia do DNA em um RNAm? Ao analisar a similaridade estrutural entre o RNA e o DNA e já se tendo conhecimento a respeito da replicação do DNA, sugeriu-se então que a transcrição se baseia também na complementaridade de bases. Esta suposição foi posteriormente confirmada pela síntese in vitro de RNA, utilizando uma molécula de DNA como molde. O experimento foi analisado a partir da correlação de bases entre o DNA e o transcrito. Observou-se que a proporção de bases (A + U)/(C + G) do RNAm transcrito é similar à proporção (A + T)/(C +G) referente ao DNA molde utilizado. Portanto, a hipótese de que o RNA era sintetizado a partir do DNA por meio da especificidade do pareamento de bases era um bom modelo experimental. A complementaridade de bases entre DNA e RNA ainda pôde ser comprovada em estudos de hibridização. Inicialmente, a dupla fita de DNA é desnaturada e uma região 23 complementar a uma determinada sequência é então estudada. Para isso, as moléculas que se deseja estudar, no caso o RNA, são postas em solução às fitas de DNA. A molécula de RNA neste tipo de experimento é denominada sonda. Esta mistura é então submetida a condições que permitem a renaturação das fitas híbridas. Como o dúplex de DNA tem densidade diferente daquele formado por DNA/RNA, estes híbridos podem ser separados por ultracentrifugação em cloreto de césio. Após a realização deste experimento, foi possível observar a presença da banda correspondente à formação do híbrido DNA/RNA. Este resultado confirma então a complementaridade de bases entre DNA e RNA, pois a formação de híbridos ocorre somente quando há uma grande região com similaridade de bases. O estudo de complementaridade de bases ainda permitiu elucidar outro aspecto da transcrição: se o RNAm é ou não transcrito a partir das duas fitas de DNA. As duas fitas constituintes do dúplex de DNA apresentam diferentes proporções das bases purinas e pirimidinas. Considerando este fato, Mamur e colaboradores, em estudos com o fago SP8 de Bacillus subtilis, foram capazes de manter as duas fitas de DNA desnaturadas e então verificar a quais fitas o RNAm se hibridizava. Os cientistas verificaram que o transcrito se hibridizava a somente uma das fitas. Devido a esta revelação, a transcrição é dita assimétrica. Os estudos iniciais sobre a transcrição esclareceram, portanto, que a síntese de RNA se dá de maneira assimétrica e que a base para a sua realização é a especificidade de pareamento de bases. O passo seguinte foram então estudos que permitiram desvendar como ocorre o mecanismo da transcrição de genes. 2.5.1 Mecanismos envolvidos na transcrição gênica TRANSCRIÇÃO EM PROCARIOTOS Para a síntese da molécula de RNAm, é necessária a ação da enzima RNA polimerase (RNAP). Na maioria dos procariotos, a RNAP transcreve todos os tipos de RNA e é constituída por cinco subunidades diferentes. Ela possui duas subunidades alfa, duas subunidades beta diferentes (β e β´) e um fator sigma. Quando constituída por todas estas subunidades, a enzima 24 é denominada como holoenzima; esta é necessária para o reconhecimento do sítio adequado onde a transcrição deve iniciar. Entretanto, o fator sigma pode se dissociar do complexo após o início da transcrição. O complexo sem o fator sigma é então denominado cerne da enzima. Após o reconhecimento da sequência a ser transcrita e após o início do processo, o cerne é capaz de finalizar a transcrição. Didaticamente, a transcrição pode ser dividida em três estágios distintos: início, elongação e terminação. INICIAÇÃO DA TRANSCRIÇÃO Para iniciar a transcrição de um gene, a holoenzima da RNAP percorre o DNA e deve reconhecer o ponto onde a transcrição deve iniciar. Esta sequência é denominada promotor. Sequências promotoras de alguns genes de Escherichia coli foram isoladas e identificadas. Estudos comparativos entre elas permitiram o alinhamento de bases similares. O que se observou foi que, apesar de haver certa variação de bases entre as sequências, algumas são conservadas, o que gerou então uma sequência consenso. Além disso, observou-se que há duas sequências consenso descontínuas: uma a -35 e outra a -10. Esses números se referem ao posicionamento da região em relação ao primeiro nucleotídeo a ser transcrito (denominado +1) (Fig. 9). Sequências que se localizam antes do nucleotídeo +1 recebem numerações negativas e são ditas como estando à jusante ou “upstream” do sítio de início da transcrição. Sequências que se localizam depois do nucleotídeo +1 recebem numerações positivas e se diz que as mesmas estão “downstream” do sítio de início. Para finalizar, estudos demonstraram que a RNAP reconhece a sequência promotora e interage com ambas as sequências - 35 e - 10. 25 FIGURA 10: SEQUÊNCIA PROMOTORA (A) o promotor antecede o sítio de início da transcrição e a sequência codificadora. (B) o alinhamento de sequências promotoras diferentes isoladas de E. coli demonstra que o promotor é formado por duas regiões de sequências similares, -35 e -10. A partir disso, (C) foi criada uma sequência consenso para estas duas regiões. (Figura modificada de Griffiths et al., 2002). A associação do fator sigma ao cerne da RNAP está ligada ao reconhecimento específico de um promotor. Assim, ele está diretamente relacionado com a regulação gênica, permitindo que somente determinados genes de interesse sejam expressos em um momento específico. Inicialmente, a holoenzima reconhece as regiões -35 e -10. Este complexo é denominado complexo promotor fechado. Após esta ligação, ocorre a separação de bases na 26 região -10. Quando a RNAP causa esta desnaturação, este complexo é denominado complexo promotor aberto. Até a formação do último complexo, ainda é necessária a ligação do fator sigma. Após a formação do complexo aberto, inicia-se então a elongação da transcrição (Fig. 10) FIGURA 10: INÍCIO DA TRANSCRIÇÃO A holoenzima da RNAP procura um sítio promotor. Ao reconhecê-lo, liga-se fortemente e forma o complexo fechado. A enzima desnatura o DNA, formando o complexo aberto. A transcrição finalmente se inicia e o fator sigma é liberado. (Figura modificada de Griffiths et al., 2002). 27 ELONGAÇÃO DA TRANSCRIÇÃO A continuidade da polimerização da cadeia de RNA não requer o fator sigma. Assim, o fator sigma se dissocia da enzima no início da elongação da transcrição. A síntese do RNAm ocorre sempre na direção 5' - 3'; ou seja, os nucleotídeos são sempre adicionados na posição 3' do primeiro nucleotídeo. Como o pareamento de nucleotídeos se dá de maneira antiparalela, isto significa que o RNAm é sintetizado a partir da fita molde de DNA a qual está orientada de 3´ - 5´. O substrato para esta reação são os nucleotídeos trifosfatos. A energia necessária para o processo deriva do rompimento do grupo trifosfato de alta energia. A continuação da elongação é dependente da manutenção da abertura entre as fitas de DNA. TERMINAÇÃO DA TRANSCRIÇÃO A terminação da transcrição ocorre após o reconhecimento de sinais, o que resulta na liberação do DNA nascente e da enzima. Em E.coli, são descritos principalmente dois tipos de sinais:a formação do grampo ou a terminação dependente do fator rho. O primeiro mecanismo envolve uma terminação direta, onde a sequência terminadora de mais ou menos 40pb termina em uma sequência rica em GC seguida de seis ou mais nucleotídeos compostos por adenina em seu final. As sequências GC são capazes de se complementarem e formar uma estrutura denominada “hairpin loop”. As sequências de A ao final acrescentam U ao RNAm, o que representa uma ligação mais fraca. Isto facilita a liberação da RNAP do complexo de transcrição (Fig. 11). 28 FIGURA 11: ESTRUTURA EM GRAMPO PARA A FINALIZAÇÃO DA TRANSCRIÇÃO A estrutura forma-se devido ao pareamento de bases complementares dentro da própria fita de RNAm. O segundo mecanismo é dependente de uma proteína adicional, o fator rho. Esta proteína é um hexâmero de seis subunidades idênticas que se liga a um sítio específico do RNA, denominado rut. Após a ligação ao seu sítio específico, a proteína rho se transloca, ou seja, se move, sobre o RNAm, retirando-o da RNAP (Fig. 12). FIGURA 12: MODELO DA TERMINAÇÃO DA TRANSCRIÇÃO PELA AÇÃO DA PROTEÍNA RÔ 29 (A) a síntese da fita de RNA prossegue e o sítio rho é transcrito o que permite que (B) a proteína rho o reconheça e se ligue a ele. (C) a ligação desta proteína separa o RNA da RNAP após se translocar ao longo da molécula de RNAm. (Figura modificada de Griffiths et al., 2002). A eficiência de ambos os processos envolvidos na terminação da transcrição é influenciada por outros elementos, tais como sequências próximas ou fatores proteicos. Contudo, os dois processos são eficientes e acabam permitindo a liberação do RNAm do complexo enzimático e do DNA molde. TRANSCRIÇÃO EM EUCARIOTOS A transcrição em eucariotos é um processo similar ao de procariotos. Entretanto, há alguns aspectos peculiares aos eucariotos e que são significativos para processos biotecnológicos. A primeira diferença nos processos se refere à constituição e função da RNAP. Enquanto uma única representante desta enzima em procariotos é responsável pela síntese de todos os tipos de moléculas de RNA, há três enzimas diferentes em eucariotos. As RNAP de eucariotos ainda apresentam funções distintas, como: I- RNA polimerase I: sintetiza o RNA ribossômico (RNAr); II- RNA polimerase II, responsável pela síntese do RNAm; III- RNA polimerase III, que sintetiza RNA transportador (RNAt) e outros RNAs e suas moléculas. Em relação à constituição da enzima, algumas das subunidades constituintes da RNAP são similares em procariotos e eucariotos. Entretanto, a dos últimos possui outras subunidades diferentes e são consideradas como macromoléculas mais complexas. Outra característica distinta entre eucariotos e procariotos que interfere na transcrição se refere à estrutura do RNAm. Esta diferença estrutural se deve à organização gênica distinta de procariotos e de eucariotos. Em procariotos, o RNAm frequentemente apresenta mais de uma sequência codificadora de proteínas diferentes e são denominados RNA policistrônicos. Isso decorre da organização gênica nestes organismos, onde genes relacionados à mesma função se encontram organizados em um operon. Assim, facilita-se que todos os genes relacionados com a mesma via metabólica sejam expressos simultaneamente. O RNAm de eucariotos, por sua vez, 30 apresenta a sequência codificadora de somente uma determinada proteína e é chamado de RNA monocistrônico (Fig. 13). FIGURA 13: (A) RNAM MONOCISTRÔNICO E (B) RNAM POLICISTRÔNICO. O RNAm de eucariotos ainda sofre diversos tipos de processamento não observados em procariotos. Logo após o início da transcrição, um resíduo de guanosina metilado é adicionado à porção 5´ do transcrito. Esta modificação é conhecida como cap (Fig. 14). Posteriormente, resíduos de adenosina são então adicionados à porção 3´ do RNAm de eucariotos. Esta cauda poliA é constituída de 150 a 200 resíduos (Fig. 15). Estes processamentos estão relacionados com o aumento da estabilidade do RNAm, afetando assim a vida útil dos mesmos. 31 FIGURA 14: ADIÇÃO DA 7–METILGUANOSINA À PORÇÃO 5´ DO RNAM. Essa modificação do transcrito primário do RNAm é conhecida como cap. (laguna.fmedic.unam.mx). FIGURA 15: ACRÉSCIMO DA CAUDA DE POLI A A PORÇÃO 3´DO RNAM 32 O RNAm de eucariotos também é submetido a outro tipo de processamento. Estruturalmente, o gene de eucariotos é constituído por duas sequências contíguas distintas: os exons, que representam segmentos codificadores, e os introns, que são sequências não codificadoras. Inicialmente, o transcrito primário possui tanto exons como introns. Entretanto, posteriormente há um processamento em que os introns são removidos. Este processo é denominado de “splicing” e é uma importante descoberta da genética molecular. O “splicing” foi descoberto a partir de estudos com transcritos de DNA viral de mamíferos. Analisando a complementaridade de bases entre o material derivado da integração viral e de seus respectivos transcritos, observou-se que não havia correspondência fiel entre eles. Esta conclusão se deve à visualização da estrutura que se formou com a presença de alças no material genético referente ao DNA. Portanto, conclui-se que o transcrito final representava apenas determinados seguimentos referentes ao material genético do qual o RNAm se originou. O mecanismo de “splicing” envolve duas reações consecutivas de transesterificações Estas reações são catalisadas por um complexo ribonucleoproteico, o qual é constituído por RNAs nucleares pequenos (snRNPs), pelo transcrito primário e pela associação de outros fatores proteicos. Este complexo recebe a denominação de spliceossomo. Uma característica interessante do “splicing” é que o mesmo RNAm pode sofrer diferentes processamentos. Nesse caso, ocorrem junções de exons diferentes do mesmo RNAm ou mesmo entre exons derivados de diferentes RNAm. O resultado final é que os RNAm maduros são constituídos por sequências diferentes, o que consequentemente resultará na geração de proteínas distintas. Este processo é conhecido como “splicing” alternativo (Fig. 16). As diferentes proteínas geradas por este mecanismo são frequentemente utilizadas em diferentes tipos celulares, ou mesmo em diferentes estágios de desenvolvimento. 33 FIGURA 16: “SPLICING” ALTERNATIVO Os exons são unidos de diferentes maneiras, o que proporciona a geração de proteínas totalmente diferentes. O processo de transcrição, onde o intermediário para a síntese proteica é gerado, é apenas um dos pontos de interesse biotecnológico: a expressão de proteínas em larga escala. Portanto, o passo seguinte à geração do RNAm é o entender como ocorre a interpretação da sequência de nucleotídeos que compõem o transcrito pela maquinaria celular, até a sua biotransformação em um polipetídeo. Estudos posteriores vieram então elucidar como ocorre este processo. 34 2.6 TRADUÇÃO O conhecimento de que os genes são sequências de DNA e que o RNAm é a estrutura intermediária e mensageira da informação para a síntese proteica foi o primeiro passo para a biotecnologia molecular. Para a síntese de proteínas, surge então uma primeira pergunta: se os genes são segmentos de DNA e se este é formado por uma sequência de nucleotídeos compostos por somente quatro bases distintas, como esta sequência de bases determina a sequência de uma proteína? Uma comparação simples para desvendar este dilema é associar cada um dos quatro nucleotídeos como se fossem letras do alfabeto. A combinação destas letras formaria palavras; estas então seriam os constituintes das proteínas. Para entender como se dá a combinação das letras, o ponto de partida é conhecera estrutura proteica. A estrutura primária de proteína é formada por diferentes aminoácidos ligados entre si por ligações peptídicas. Se o RNAm é constituído por uma sequência de nucleotídeos, as letras, os aminoácidos corresponderiam então às palavras formadas por nucleotídeos. O conjunto de palavras que os diferentes códons especificam é denominado código genético. 2.6.1 Código Genético Outro dilema em relação à tradução é como as letras se combinam para constituir as palavras. Portanto, se cada nucleotídeo representa um aminoácido, a proteína seria composta por somente quatro aminoácidos. Contudo, são conhecidos 20 aminoácidos naturais. Por esta insuficiência, supôs-se que um aminoácido é representado no RNAm por uma combinação de nucleotídeos. A combinação de nucleotídeos que representasse os aminoácidos foi teoricamente feita por análises combinatórias. Assim, se o aminoácido fosse composto por duas das quatro bases que compõem a sequência do RNAm, seria possível então 42, o que daria um total de dezesseis aminoácidos. Dezesseis combinações ainda seriam insuficientes para representar os 20 aminoácidos existentes. Se as letras fossem compostas de três bases, então as combinações possíveis seriam 43, o que daria 64 aminoácidos distintos. Esta combinação, portanto, proveriam 35 mais que os 20 aminoácidos naturais. Assim, supôs-se que um aminoácido é traduzido a partir de pelo menos três nucleotídeos. Esta trinca de nucleotídeos é denominada códon. Esta suposição foi posteriormente confirmada em 1961 por Francis Crick e Sidney Brenner e colaboradores em análises de mutantes do fago T4. A partir da descoberta do códon, outras questões ainda intrigavam os pesquisadores. A combinação de três nucleotídeos que compõe o códon pode fornecer 64 combinações diferentes; contudo, há na natureza somente 20 aminoácidos. Se cada códon representasse um aminoácido distinto, então haveria 44 combinações extras que não teriam função ou que simplesmente não codificariam aminoácidos? Esta suposição é improvável, pois mutações de ponto, ou seja, que alterem apenas um único nucleotídeo, poderiam então representar um dos códons que não codificariam aminoácidos. Consequentemente, a síntese proteica seria interrompida. Isto é inviável sob o ponto de vista evolutivo, já que a interação parasita- hospedeiro, por exemplo, demonstram que a natureza desenvolveu mecanismos que permitissem a evolução e a adaptação dos organismos frente às diversas situações. Por outro lado, se todas as trincas codificam um aminoácido, este pode ser representado por mais de um códon. Neste caso, mutações de bases que compõem o códon induziriam uma alteração de aminoácidos, permitindo mesmo assim a síntese proteica e possivelmente a geração de variantes. Assim, Crick postulou que os aminoácidos são codificados por um ou mais códons diferentes. Esta hipótese foi posteriormente confirmada por análises bioquímicas e, por isso, o código genético é dito degenerado. Estas descobertas iniciais a respeito do código genético geraram grande entusiasmo no mundo científico. Com isso, muitas pesquisas foram realizadas com o intuito de desvendá-lo cada vez mais. Decifrar qual aminoácido é especificado por cada códon foi um dos feitos mais excitantes da genética nos últimos 50 anos. Isso se deve à descoberta inicial de como sintetizar um RNAm sintético. Este fato possibilitou a oportunidade de criar sequências variadas de RNAm, o que permitiu verificar quais aminoácidos as diferentes combinações especificavam. O uso da matemática nas análises combinatórias permitiram deduzir a frequência de aminoácidos obtidas a partir da síntese de RNAm realizadas com misturas de diferentes proporções fixas dos quatro nucleotídeos distintos. Em outras palavras, se os códons codificam diferentes aminoácidos, espera-se que os aminoácidos gerados a partir desta mistura particular de nucleotídeos estejam a uma taxa similar àquela das possíveis combinações de códons. Apesar da redundância do código genético, esta hipótese foi posteriormente comprovada em 36 experimentos subsequentes. Contudo, este experimento não permitia distinguir a sequência específica de cada códon em relação a um aminoácido. Para correlacionar a sequência específica do códon relativo a um determinado aminoácido, foram utilizados mini RNAs sintéticos. Inicialmente, foram utilizadas sequências específicas compostas por somente três aminoácidos. Assim, por exemplo: I. GUU: codifica valina; II. UUG codifica leucina; III. UGU codifica cisteína. A produção destes mini RNAs possibilitou a síntese das 64 combinações possíveis de códons, o que demonstrou que certos aminoácidos podem ser codificados por uma única trinca ou até mesmo por seis combinações diferentes. Portanto, estes estudos comprovaram a degeneração do códon. O estudo com os mini RNAs ainda permitiu outra correlação entre as bases que compõem o códon e seu papel na degeneração do código genético. A terceira base que compõe o códon é a mais variável; assim, mudanças nestas bases frequentemente não alteram o aminoácido codificado. Esta característica é extremamente importante para a biotecnologia, pois previne mutações espontâneas a que as culturas relacionadas com a produção de proteínas de interesse estão submetidas não alterem, necessariamente, as cadeias polipeptídicas. As pesquisas com os mini RNAs, por fim, também demonstraram outro aspecto interessante do código genético. Apesar da sua redundância, há alguns códons que não especificam nenhum aminoácido e funcionam como pontos finais no RNAm. Estas trincas são denominadas códons de parada. A partir de experimentos baseados na combinação de nucleotídeos em RNAs sintéticos, foi possível estabelecer qual aminoácido é representado por cada trinca. A Fig. 17 demonstra as possíveis combinações de três nucleotídeos a partir dos quatro existentes em RNA com os aminoácidos que cada códon codifica. 37 FIGURA 17: CÓDIGO GENÉTICO FONTE: Os experimentos iniciais com o objetivo de desvendar o código genético foram realizados em organismos procariotos; entretanto, estudos posteriores demonstraram que ele é universal. Isto quer dizer que o código genético é comum a todos os organismos, desde os vírus e bactérias até organismos eucariotos e multicelulares, como os humanos. Mesmo sendo o código genético considerado universal, esta generalidade apresenta exceções. No DNA mitocondrial, por exemplo, dois códons são traduzidos diferentemente na mitocôndria. Enquanto AUA representa geralmente isoleucina, na mitocôndria ele é lido como metionina. Além desse, UGA que normalmente especifica um códon de parada, na mitocôndria ele codifica o triptofano. A explicação para esta diferença está nas propriedades dos RNAt que estão confinados ao sistema mitocondrial. Outras exceções foram também observadas quanto a determinados códons de levedura e de alguns representados por alguns protozoários. Outra característica do código genético é que a leitura dos códons não ocorre de maneira sobreposta. Isto tem importância sob o ponto de vista evolutivo e biotecnológico. Mutações de ponto podem ou não alterar um aminoácido da proteína; contudo, esta variante pode ainda ser funcional. Se a leitura se desse de maneira sobreposta, uma mutação alteraria não só um aminoácido, como também toda a proteína. Neste caso, a chance de uma mutação gerar uma proteína específica e ativa seria extremamente baixa. 38 O conhecimento mais aprimorado a respeito das características do código genético permitiu deduzir como é o seu funcionamento. O passo seguinte e essencial para a sua utilização na biotecnologia é a síntese de proteínas. 2.7 SÍNTESE PROTEICA A síntese de proteínas a partir de um RNAm é dependente da ação conjunta de diversas estruturas, como: ribossomos, RNAts e uma grande diversidade de fatores proteicos. 2.7.1Ribossomos Os ribossomos constituem um complexo importantíssimo para a tradução. Ele é constituído por muitas moléculas de RNAr diferentes associadas a mais de 50 proteínas. Para a formação do ribossomo, este complexo se organiza em duas subunidades distintas, a subunidade maior e a menor. A diferença entre as duas subunidades, além do tamanho relativo, refere-se aos componentes que formam cada estrutura. A subunidade menor contém uma única molécula de RNAr. No caso da subunidade maior, esta é formada por outro tipo de RNAr de alto coeficiente de sedimentação (“S”) associado com outros RNAr de menor “S”. “S” é a medida da taxa de sedimentação após a centrifugação de partículas postas em solução. O tipo de RNAr que compõe cada subunidade difere entre procariotos e eucariotos. Em procariotos, a subunidade maior é denominada 50S e a menor, 30S. A subunidade maior é composta pelo RNAr 23S e por um menor, 5S. A subunidade menor contém em sua composição somente o RNAr 16S. Ao se associarem, formam o ribossomo completo, também conhecido como 70S. Em eucariotos, as subunidades 60S e 40S se associam e formam o ribossomo 80S. A subunidade maior é formada pelo RNAr 28S associado a dois outros RNAr menores, o 5,8S e o 39 5S. A subunidade menor, assim como em procariotos, é constituída por um único tipo de RNAr. O que difere é que em eucariotos o RNAr que constitui esta subunidade é o 18S. Os ribossomos de procariotos e eucariotos diferem não só pelo tamanho das moléculas de RNAr e do complexo em si. Outros aspectos também são diferentes, como a quantidade de proteína que compõe cada subunidade. Contudo, apesar desta diferença estrutural, um fato intrigante é a grande similaridade estrutural e funcional entre os ribossomos de todas as espécies (Fig. 18). FIGURA 18: ESTRUTURA DOS RIBOSSOMOS Cada ribossomo contém sítios específicos que permitem a ligação de todos os fatores associados à síntese proteica, como o RNAm, os RNAt e os fatores proteicos. Além disso, a subunidade maior do ribossomo possui dois compartimentos, o sítio A e o sítio P. O sítio A é o local de acesso do RNAt contendo o aminoácido a ser inserido na cadeia proteica. O sítio P é ocupado pelo RNAt que carrega a cadeia polipeptídica que está sendo formada. Assim que a polimerização da cadeia polipeptídica prossegue e há a translocação do ribossomo, ou seja, esta estrutura se move sobre um códon, o RNAt que se encontra no sítio P é liberado do complexo. 40 Isto permite a transferência do RNAt do sítio A ao P. Para fins didáticos, a síntese proteica é dividida em três passos distintos: iniciação, alongamento e término. 2.7.2 Iniciação da tradução em procariotos Em procariotos, o primeiro passo da iniciação ocorre com o reconhecimento do códon de início, que em E. coli pode ser representado tanto por AUG, como por GUG e UUG. Dentre eles, o mais representativo é o AUG, sendo que os outros dois são denominados códons alternativos. Observa-se que a escolha de um ou outro códon varia com o gene em questão; contudo, sequências que contenham códons de início diferentes possuem taxas de tradução diferenciadas. Antes de iniciar a tradução, as subunidades ribossômicas encontram-se separadas. Para iniciar a síntese, a subunidade menor 30S se liga primeiramente ao RNAm. Esta ligação é estimulada pelo fator proteico de iniciação IF3 e IF1. O fator IF1 se liga somente ao complexo inicial, sendo que a sua localização impede a ligação da subunidade maior. Um detalhe interessante é como esta subunidade reconhece o códon de início correto. Apesar de a maioria dos genes terem como códon de início o AUG, que codifica uma metionina, a sequência do RNAm possui outros representantes desta mesma trinca, inclusive em locais a jusante do códon de início. Então, como se dá esse reconhecimento do correto códon? A questão do reconhecimento do verdadeiro códon de início foi respondida após estudos realizados por John Shine e Lynn Dalgarno. Estes pesquisadores notaram que o verdadeiro códon de início era precedido por uma sequência de aproximadamente oito nucleotídeos, sendo complementar à porção 3´ final do RNAr 16S da subunidade menor do ribossomo. Em uma homenagem a estes pesquisadores, essa sequência foi denominada de Shine-Dalgarno. Este passo é fundamental para a síntese correta de uma determinada proteína. O reconhecimento do códon de início permite que a tradução ocorra na fase de leitura correta que especifica a sequência de aminoácidos da proteína. O início da tradução é dependente da disponibilidade de RNAt carregados com seu respectivo aminoácido. A ligação do aminoácido ao RNAt é dependente da ação específica de enzimas denominadas aminoacil-sintetase. Assim que o aminoácido se liga ao RNAt, este 41 complexo passa a ser denominado aminoacil-RNAt. Posteriormente, esta estrutura pode reconhecer o códon correspondente ao aminoácido que o RNAt carrega. Este procedimento se dá por uma sequência presente no RNAt que é complementar ao códon, o anticódon. Ao códon de início é adicionado o primeiro aminoácido. Contudo, este é uma metionina transformada, a N-formilmetionina. Este aminoácido se liga ao códon de início auxiliado por outro fator proteico, o IF-2. Posteriormente, a subunidade maior se liga a esta estrutura, formando então o ribossomo completo. O interessante é que este aminoácido inicial se liga inicialmente ao sítio P, e não ao A como ocorre com os aminoácidos seguintes que serão incorporados à cadeia proteica nascente. Os fatores IF-3 e IF-2 são liberados durante o estágio de formação da estrutura ribossomal (Fig. 19). FIGURA 19: INICIAÇÃO DA TRANSCRIÇÃO EM PROCARIOTOS (A) subunidade 30S se liga ao RNAm com o auxílio dos fatores IF1 e IF3; (B) IF2 se liga ao RNAt ligado à N-formilmetionina e controla a sua entrada no ribossomo; (C) os fatores de iniciação são liberados e a subunidade maior se liga ao complexo inicial, formando o ribossomo completo. (Figura modificada de Lewin, 2004). 42 2.7.3 Alongamento da síntese proteica em procariotos O alongamento da cadeia proteica é dependente de três fatores proteicos: EF-Tu, Ef- Ts e EF-G. O EF-Tu medeia a entrada do RNAt contendo o aminoácido correspondente ao códon que se encontra no sítio A do ribossomo, um processo dependente de energia. Em seguida, há a ação do fator EF-Ts, responsável pela liberação do primeiro fator do ribossomo. Este fator ainda consegue regenerar a energia gasta no processo com o fator EF-Tu. No passo da translocação, a cadeia polipeptídica é transferida ao RNAt carregado com aminoácido e presente no sítio A. O ribossomo então se move sobre o RNAm na direção 5´ - 3´do mesmo. Este passo é mediado pelo fator de elongação EF-G. Assim, há a liberação do RNAt presente no sítio P e que não se encontra mais carregado. Posteriormente, há a transferência do RNAt contendo a cadeia polipeptídica em formação do sítio A para o P. O término da síntese proteica ocorre quando o códon seguinte ao processo de translocação, presente no sítio A, é um códon de parada. Estes códons não são reconhecidos por RNAt, mas sim por fatores proteicos que são designados pelas abreviações RF1, RF2 e RF3. A diferença entre estes fatores se deve ao reconhecimento diferencial dos códons de parada. O RF1 reconhece UAA e UAG; o RF-2, os códons UAA e UGA. O RF-3 auxilia em processos de catálise envolvidos com a terminação da cadeia. O fator de liberação então se liga ao códon no sítio a e o polipeptídeo é então liberado do sítio P. A finalização do processo se dá com a dissociação do ribossomo em suas subunidades maior e menor. 2.7.4 Tradução em eucariotos A tradução em eucariotos ocorre de maneira bastante similar à de procariotos. Entretanto, alguns detalhes desta etapa são diferentes, como as diferenças quantitativas e qualitativas dos fatores proteicos. Aetapa de maior interesse para o desenvolvimento de procedimentos em biotecnologia é o início da tradução de eucariotos. INICIAÇÃO DA TRADUÇÃO EM EUCARIOTOS 43 Inicialmente, a primeira diferença do início da tradução em eucariotos em comparação à de procariotos, além de requererem diferentes e mais diversificados fatores proteicos, refere-se ao códon de início. Em eucariotos, a única trinca reconhecida com este propósito é o AUG. Em relação ao reconhecimento do verdadeiro códon de início presente no RNAm, este frequentemente é o primeiro AUG que se encontra logo após ao CAP 5´. A interação da subunidade menor com a estrutura do CAP metilado presente em todos os RNAm de eucariotos requer um grupo de proteínas genericamente conhecidas como eIF4. Após o reconhecimento do CAP pelo eIF4F, qualquer estrutura secundária na região 5´ é removida por uma atividade de helicase. A subunidade menor realiza então um escaneamento sobre o RNAm, parando assim que encontra o primeiro AUG (Fig. 20). FIGURA 20: INICIAÇÃO DA TRADUÇÃO EM EUCARIOTOS A figura apresenta a complexidade da transcrição em eucariotos em comparação a procariotos. Muitos fatores de transcrição diferentes estão envolvidos no processo. 44 Apesar de o primeiro AUG ser o verdadeiro códon de início, foram identificadas outras estruturas que facilitam seu reconhecimento. Assim como em procariotos, há determinadas sequências que se localizam na vizinhança do AUG, denominadas sequências de Kozak. Esta é representada por uma sequência consenso: RNAm 5´ACCAUGG 3´. Apesar de este consenso ser importante, a eficiência da tradução é afetada pela adenina e pela guanina presentes antes e após o AUG, respectivamente. Após a montagem do complexo ribossomo-RNAm, há a adição da primeira metionina ao códon de início. Contudo, ao códon inicial, há a incorporação de uma metionina sem a modificação por um grupo formil. O processo restante é semelhante ao de procariotos. Depois de finalizar o processo de tradução, a cadeia polipeptídica ainda passa por outros processos de transformação. Assim, para obter uma proteína nativa, a cadeia polipeptídica obtida após a tradução do RNAm é submetida a uma outra etapa, o processamento proteico. 2.8 PROCESSAMENTO PROTEICO Após a síntese da proteína, esta ainda pode sofrer várias transformações. Este processamento é extremamente importante sob o ponto de vista biotecnológico, pois a partir deste passo final há a geração de proteínas funcionais. Vários são os tipos de processamento que a proteína pode sofrer o que também dependerá do tipo celular em que a macromolécula está sendo expressa. Um exemplo de grande aplicação na biotecnologia é o endereçamento proteico. Este processo pode ocorrer tanto em procariotos como em eucariotos. Para isso, algumas cadeias proteicas apresentam em sua porção N-terminal uma sequência de 15 a 25 aminoácidos. Esta estrutura é denominada peptídeo sinal. Seu reconhecimento por fatores e receptores proteicos medeia o transporte e o acoplamento à membrana celular. Para que a proteína seja secretada, o peptídeo sinal é reconhecido pela maquinaria celular, mais especificamente uma peptidase. Esta enzima cliva a cadeia polipeptídica, separando a proteína de seu peptídeo sinal e permitindo que a proteína seja finalmente liberada da célula. 45 Aliado ao peptídeo sinal, a proteína pode conter na sua porção C-terminal uma sequência conhecida como sinal de ancoramento. Assim, o peptídeo sinal endereça a proteína até a membrana celular. O sinal de ancoramento, ao contrário do peptídeo sinal, não será clivado. Por possuir características hidrofóbicas compatíveis com a da membrana celular, permite que a proteína permaneça ancorada à membrana. Outros tipos de processamento extremamente importantes para obter proteínas funcionais são processamentos que certas proteínas sofrem quando são expressas em células eucariotas. Exemplos são sequências que sinalizam a glicosilação. Além da importância deste processo para gerar proteínas funcionais, este requerimento é uma das preocupações da indústria farmacêutica. A glicosilação é essencial para a geração de uma resposta imunológica eficaz, por exemplo. 2.9 REGULAÇÃO DA TRANSCRIÇÃO As células não expressam todas as proteínas por períodos de tempo indeterminados. O gasto de energia é demasiadamente alto, prejudicando a homeostase celular. Por isso, as células desenvolveram mecanismos que permitem que a célula reconheça o momento em que genes relacionados a uma determinada função sejam expressos. 2.9.1 Regulação da transcrição em procariotos A obtenção de determinados produtos gênicos é essencial para a biotecnologia. Apesar de se ter o conhecimento de que a informação genética que determina estes produtos ser representada por uma sequência de nucleotídeos e que a combinação destes é traduzida em uma proteína, outro esclarecimento é necessário: como ocorre o controle da síntese proteica? O controle da expressão gênica é um passo fundamental para a manutenção da homeostase celular. Um exemplo pode ser observado em bactérias quanto à expressão de determinados genes envolvidos com o metabolismo de açúcares. Os açúcares constituem uma 46 fonte de carbono essencial para a produção de energia. Diversos tipos podem ser utilizados com este propósito, como lactose, glicose, maltose, galactose e xilose. O metabolismo de cada açúcar é dependente da produção de diferentes enzimas. Se a célula sintetizar todas as enzimas, mesmo que não haja necessidade, isto representa um gasto energético desnecessário e inviável para o organismo. Portanto, o controle estrito da síntese de enzimas é um dos passos chaves para a viabilidade celular e manutenção de culturas responsável pela síntese de produtos biotecnológicos. A regulação da expressão gênica pode ser obtida pelo controle tanto da transcrição como de processos subsequentes. Entretanto, normalmente este controle é feito a nível transcricional, para que a célula evite gastos energéticos e de precursores. Dois passos chaves são fundamentais para a inibição da síntese de proteínas desnecessárias em determinado momento: I. As células precisam ser capazes de inibir a transcrição de um determinado gene ou de um grupo deles; II. As células precisam reconhecer determinadas condições ambientais na qual ela deva ativar ou reprimir a transcrição de genes. O modelo clássico que esclareceu muitos dados a este respeito foi obtido com estudos sobre o metabolismo da lactose em E. coli, em 1950. François Jacob e Jacques Monod estudavam os mecanismos envolvidos com o metabolismo da lactose. Os pesquisadores compararam os níveis de expressão proteica sob condições fisiológicas e após a adição de lactose. Após a adição desta molécula, observou-se que havia um aumento de cerca de 1.000 vezes da expressão de algumas proteínas além do que se observava sob condições fisiológicas. Assim, substâncias que agem como a lactose foram genericamente denominadas indutores. Jacob e Monod seguiram com outros experimentos. O objetivo destes cientistas era o de responder como a bactéria é capaz de reconhecer especificamente quando deve haver a expressão de uma determinada proteína e qual seria o papel dos indutores neste processo. Para que a bactéria consiga se adaptar frente a esta mudança no suplemento de lactose, duas enzimas são requeridas: uma permease, responsável pelo transporte da lactose para dentro da célula, e a beta galactosidase, uma enzima que cliva a molécula de lactose em galactose e glicose. Estas duas enzimas são codificadas por dois genes distintos e contínuos, o lacZ e o lacY, respectivamente. Neste metabolismo, um terceiro gene, o lacA, também está envolvido. 47 Este último codifica uma transacetilase; entretanto, sua função específica ainda não está bem elucidada. Uma hipótese que os pesquisadores levantaram
Compartilhar