Baixe o app para aproveitar ainda mais
Prévia do material em texto
FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DO PORTO Manipulação molecular e Biotecnologia Sebenta Sandra Isabel Cunha Silveira Ano lectivo 2010/2011 Professora: Susana Vieira 2 Plasmídeos Plasmídeos, pequenos fragmentos de DNA, são conhecidos em quase todas as células bacterianas. Encontram-se separados do material DNA principal da bactéria, representando 2% da informação genética total do organismo. Contem de dezenas a centenas de genes, comparando com o material DNA principal , que contém milhares de genes. O plastídeo é uma molécula de DNA extra cromossómico separado do DNA cromossómico, que é capaz de replicar-se independentemente do DNA cromossómico. Em muitos casos, é circular e de dupla cadeia. Os plasmídeos ocorrem naturalmente em bactérias, mas, por vezes, são encontrados em organismos eucarióticos (ex: Saccharomyces cerevisiae) Os plasmídeos são: Fechados e peças circulares de DNA; Capazes de auto – replicação; São transportados por muitas bactérias; Fornecem funções únicas à bactéria, permitindo-as replicarem-se sexualmente e na passagem de material genético entre elas; Responsáveis pelos factores genéticos que facultam a resistência a antibióticos e fornecem enzimas necessárias para quebrar os recursos alimentares pouco metabolizados. Os plasmídeos são, tipicamente moléculas circulares de dsDNA com tamanho entre 2kb e 100b. Estes plasmídeos serão super enrolados na célula. Os plasmídeos possuem uma origem de replicação, que é uma sequência de DNA que permite copiar as moléculas de DNA. 3 Dois plasmídeos diferentes que são originados da mesma origem de replicação não coexistem. Alguns plasmídeos são capazes de replicar num número limitado de espécies bacterianas; eles têm um estreito intervalo hospedeiro. Exemplos como os plasmídeos ColE1, pBR322, pUC18 são limitados para E. coli e para algumas espécies. Outros plasmídeos são capazes de replicar numa largo intervalo de espécies bacterianas; têm um amplo intervalo hospedeiro. Controlo das cópias do plasmídeo O número de cópias do plasmídeo pode variar de 1 (o plasmídeo F) a centenas (pUC18). Este número é uma propriedade do plasmídeo e depende do mecanismo que regula a sua própria replicação. Exemplo: Replicação do plasmídeo ColE1 ColE1 é um pequeno e circular plasmídeo que codifica uma toxina (proteína) de 57 kDal que consegue matar outra E.coli por despolarização da membrana bacteriana. O plasmídeo ColE1 carrega os seguintes genes: 4 Transferência de plasmídeo Alguns plasmídeos conseguem auto transferir-se entre células bacterianas por conjugação bacteriana. Esses plasmídeos codificam todas as funções proteicas que são necessárias e que requerem mobilização e transferência de célula hospedeira para a célula receptora. Alguns plasmídeos são incapazes. Não codificam as proteínas necessárias. Contudo, coexistem na células com plasmídeo que automobiliza-se. Assim, eles podem conseguir mobilizar-se, se transportarem a sequencia correcta ou sítios que são reconhecidos pelas proteínas que são sintetizadas do outro plasmídeo. O plasmídeo ColE1 é um bom exemplo de um plasmídeo mobilizador. Ele contém uma região bom (base da mobilização) com local nic que é ligado por proteínas codificadas na região mob (mobilização). Quando as bactérias juntam-se, a estreita ligação forma um complexo com a proteína mob que lida através do canal de conjugação para a célula receptora. Como estudar um gene? Cada cromossoma é uma molécula contínua de DNA, que pode ser de milhares ou de milhões pares de base. O vasto tamanho dos cromossomas coloca um problema para os cientistas que tentam isolar e estudar porções de DNA que compõe os genes. Um cromossoma é uma de DNA contínua. Pode ter milhares ou milhões de pares de bases. Tesouras moleculares Em 1962, Werner arber, um bioquímico suíço, forneceu a primeira existência de “tesouras moleculares” que conseguem cortar DNA. Ele mostrou que a bactéria E.coli possui um sistema imunológico enzimático que reconhece e destrói DNA estranho, e modifica o DNA nativo para o prevenir de auto- destruição. Arber e os seus associados denominam o grupo que corta DNA de enzimas de restrição endonucleases. Eles mostraram que as endonucleases de restrição são específicas no seu corte. Uma enzima dada irá cortar o DNA apenas quando reconhece a sequência certa. Utilizamos endonucleases de restrição para podermos estudar os genes individualmente e, para cortar DNA. 5 Bacteriófago é um vírus que infecta bactérias. O DNA do vírus que entrava, era cortado, levando assim á descoberta das enzimas de restrição. Cola molecular Não muito depois das descobertas de Arber, Arthur Kornberg identificou um mecanismo de colar para a o DNA, uma enzima denominada ligase. Kornberg estava a tentar construir um DNA viral artificial de fragmentos virais, mas não consegui criar uma molécula activa, biologicamente. Depois de ele adicionar ligase, descobriu que a enzima torna possível colar as extremidades da molécula de DNA. A DNA ligase torna possível ligar as extremidades da molécula de DNA. Fazer mais cópias… Pelo fim de 1960, a molécula de DNA podia ser cortada e colada. Mas os cientistas necessitavam de um mecanismo de cópia a fim de manter uma grande amostra para trabalhar. Essa descoberta veio em 1971, quando cientistas descobriram uma maneira eficiente de introduzir pequenos loops de DNA chamados de plasmídeos na bactéria e.coli. estes loops de DNA plasmídico consegue transportar um “pacote” de DNA estranho para as células hospedeiras, e conferir um benefício como a resistência a drogas. Cientistas conseguem importar plasmídeos que contêm uma parte selectiva do DNA para uma bactéria. A reprodução normal de bactérias produz uma grande quantidade do DNA desejado. A revolução recombinante A etapa foi definida pela revolução tecnológica. Cientistas descobriram como cortar, colar e copiar DNA. O que ficou por fazer foi como aplicar estas técnicas para editar e personalizar DNA. Esta criação de “DNA recombinante” poderia manipular coisas vivas no seu nível mais básico. Poderão os cientistas criar organismos que combinem os genes de diferentes espécies? Poderá ajudar a salvar vidas, ou pode ameaçá-la? 6 Técnica de transformação/células competentes A transformação é a introdução de plasmídeos num organismo, como por exemplo bactérias. A bactéria ao multiplicar-se origina milhares de cópias de DNA – clonagem de genes seleccionados. Esta técnica induz a bactéria a incorporar o DNA plasmídico. Espalhamos a bactéria transformada numa placa de petri que contém tretaciclina e Canamicina. Apenas as bactérias transformadas contendo os dois genes de resistência poderão crescer na presença de ambos antibióticos. O resultado foi consistente com a bactéria ter sido transformada com um plasmídeo com os genes tetr e kanr. Contudo, também é possível que algumas bactérias possam ter sido duplamente transformadas por versões re-ligadas do plasmídeo original. Estas bactérias vivas deixam entrar as moléculas porque não as reconhecem como desconhecidas. Extracção de DNA plasmídico e electroforese em gel de agarose Análise da restrição mostra que algumas colónias foram transformadas pelo plasmídeo recombinante. É permitido saber quando cortamos o plasmídeoe corremo-lo em gel de agarose. Crescimento do fago Existem dois tipos de bacteriófagos, o fago lamda e o fago M13. O fago lambda pode existir em pró-fago (integrado no genoma bacteriano, lisogénico) ou como um elemento genético independente (lítico). O fago lambda é um bacteriófago linear de cadeia dupla quando carrega no fago uma película proteica. 7 Durante a infecção, um fago ataca a bactéria e injecta o material genético no citoplasma da bactéria. A informação genética do fago assume maquinaria da bactéria, desligando a síntese dos componentes da bactéria e redirecciona a síntese do material bacteriano para fazer mais componentes fágicos. No ciclo de infecção do fago, a lise é quando a célula rebenta para libertar os componentes. Depois da lise, os fagos descendentes infectam as células vizinhas. Este é um fenómeno exponencialmente explosivo (causa um crescimento exponencial do numero de células que sofrem lise). Como quantificar o crescimento do fago? Existe uma camada contínua de bactérias (filmes) e são colocados os fagos em baixa. Cada roda clara foi um fago que lisaram a bactéria e os pontos são as bactérias que foram destruídas e são fagos que ficaram – placa fágica. Restrição do crescimento de fagos É conhecido desde 1950, de que as partículas dos fagos crescem bem e eficientemente infectam uma linhagem de bactérias que frequentemente são incapazes de crescer bem e infectam outras linhagens da mesma espécie bacteriana. Em adição, as partículas fágicas que conseguem, com sucesso, infectar uma segunda linhagem, frequentemente demonstram um padrão oposto. Estes são capazes de 8 infectar, eficientemente uma segunda linhagem enquanto crescem pobremente na linhagem original. Uma série de estudos mostra que as partículas fágicas que crescem eficientemente e infectam a célula hospedeira têm moléculas de DNA que são quimicamente modificadas pela adição de grupos metilo em algumas das suas bases adeninas e/ou citosinas, enquanto o DNA do fago que pobremente infecta não mostra este tipo de modificação química ou metilação. Partículas fágicas sem metilação do DNA não crescem e nem infectam eficientemente porque as suas moléculas de DNA são clivadas e degradadas por enzimas da célula hospedeira, enquanto as que possuem DNA metilado estão protegidas da degradação. Este fenómeno da degradação do DNA não metilado destrói a habilidade de crescimento do fago e é responsável pelo padrão de restrição do crescimento. Descoberta dos sistemas de modificação-restrição Apesar do fenómeno biológico do sistema de modificação-restrição crescer das observações dos microbiologistas, a variedade das células hospedeiras dos fagos é influenciada pela estirpe bacteriana em que o fago se propagou. Apesar dos fagos produzirem numa estirpe de Escherichia coli, poderão infectar uma cultura da mesma estirpe, eles não alcançam uma infecção de sucesso em células de estirpes diferentes da E.coli. Esta descoberta implica que os fagos transportam um “imprint” que identifica as suas proveniências imediatas. Testes biológicos simples demonstram que a infecção com sucesso numa estirpe diferente resulta na produção de fagos que perderam os seus “imprint” e adquiriram um novo. Observação: Fagos produzidos numa estirpe de E. coli, infectavam a mesma estirpe. Mesmos fagos não infectavam eficazmente SEGUNDA estirpe: PORQUÊ? Em 1960, experiências moleculares demonstraram que o “imprint” de um DNA modificado foi perdido quando o DNA fágico numa estirpe bacteriana diferente. Esses fagos, que conservam uma parte original da cadeia de DNA retêm o imprint, ou a modificação, enquanto fagos que contêm as duas cadeias de um novo DNA sintetizado não retêm o imprint. A modificação fornece protecção contra a endonuclease, a barreira que previne a replicação do genoma fágico. Mais tarde, foi comprovado que as enzimas de modificação e de restrição reconhecem o mesmo alvo, uma sequência nucleótica especifica. 9 1960: o “imprint” é uma MODIFICAÇÃO do DNA perdida na nova estirpe bacteriana Os fagos com UMA das cadeias modificadas retinham o “imprint” Os fagos com DNA completamente novo perdiam o “imprint” A MODIFICAÇÃO deveria dar PROTECÇÃO contra uma ENDONUCLEASE Mais tarde: A modificação e a restrição reconheciam o mesmo alvo (sequência nucleotídica) Nota: Nesta altura não estavam caracterizados os sistemas de Modificação/Restrição As enzimas de modificação são um DNA metiltransferase que metila bases específicas da sequência alvo e na ausência da metilação específica , o DNA da sequência alvo é sensível às enzimas de restrição. Quando falta no DNA o imprint de modificação apropriado, entra a célula competente da restrição que reconhece o DNA como estranho e é degradado por uma endonuclease. A barreira controlo-hospedeiro para uma infecção com sucesso pelos fagos que não possuem uma correcta modificação foi referida como “restrição” e as endonucleases adquiriram o nome de enzimas de restrição. Similarmente, as metiltransferases são, normalmente, denominadas de enzimas de modificação. Classicamente, a enzimas de restrição é acompanhada pela enzima de modificação e as duas compreendem o sistema de modificação-restrição. O hospedeiro “barra” uma infecção por fagos = restrição não protegidos pela modificação correcta. E.coli C aparentemente não apresenta sistema R- M. Prever: eficiência de fagos crescido em C quando infectam K-12. Fagos crescidos em K-12: diferenças quando infectam K-12 e C? Prever eficiência na formação de lambda K em E.coli B. E.coli B possui um sistema R-M com especificidade diferente de K-12. Eschericia coli K-12 possui, enquanto a Escherichia coli C tem em falta, o sistema Restrição – Modificação do tipo I. o fago λ (lambda) propagado na E.coli C. (λ.C) não é protegido da restrição pela Eco KI e assim, forma placas com eficiência reduzida de plaqueamento (EOP) na E.coli K-12 em comparação com a E.coli C. os fagos que nai sofrem restrição são modificadas pela Eco KI metiltransferase (λ.K) e, consequentemente, forma placas com a mesma eficiência na E.coli K-12 e C. DNA modificado é indicado por “hatch marks”. 10 A descoberta de uma barreira para a infecção do seu hospedeiro natural, E.coli k-12, se o fago foi, previamente, propagado em E.coli C. isto leva a um fenómeno do sistema R-M. Eschericia coli K-12 possui um sistema M-R, Eco KI, ausente na E.coli C. o fago propagado na E. coli C não é protegido da restrição pela Eco KI e forma placas de baixa eficiência na E.coli K-12 em comparação com a E.coli C. Bertani e Weigle: uma barreira para a infecção do bacteriófago no seu hospedeiro natural, Escherichia coli K-12, que pode “lifted” pela variação hospedeiro – controlo do vírus. Arber e um aluno de doutoramento Dussoix mostram que o DNA foi rejeitado e degradado depois da infecção de diferentes hospedeiros bacterianos, a não ser que transporta-se a modificação específica do DNA, e assim, dando fundamentos para o fenómeno da restrição e modificação (R- M). A enzima de restrição da E.coli k-12, Eco KI, foi purificada em 1968 e necessita de S-adenosilmetionina (AdoMet) e ATP como cofactores. Pelo fim da década, houve uma evidência substancial para um locus do cromossoma hsdk com três genes que codificam as subunidades da restrição (C), modificação (M) e especificidade (S) que reúnem num grande complexo de mais de 400 kDa. Em 1970 trouxeram a mensagem de que a Eco KI cortam longe do local de reconhecimento do DNA, no local onde a enzima permanece ligada enquanto a translocaçãodo próprio DNA passado, com hidrólise de ATP, e subsequente com espaços na cadeia dupla. Esta translocação DNA loops, claramente, visível no microscópio electrónico. A restrição ocorre quando uma sequência alvo específica (sequência de DNA a azul escuro que é mostrada como um tubo) sem a metilação apropriada (locais amarelos) em ambas as cadeias de DNA é reconhecida pela enzima. Uma enzima de restrição do tipo II, tipicamente uma proteína dimérica, cliva o DNA num local definido dentro ou perto da sequência alvo específica e dissocia do DNA deixando duas terminações livres. Alvos não metilados causa à enzima de restrição do 11 tipo I a segurar o alvo e activa a translocação do DNA (direcção mostrada pelas setas vermelhas) pelas subunidades motor. Múltiplos contactos com o DNA que expandem loops são extrusados a partir da enzima como bobinas no DNA. Adiando a translocação por colisão com, por exemplo, com outra enzima de restrição do tipo I, activa a clivagem no local da colisão. Depois da clivagem do DNA, a enzima de restrição do tipo I permanece ligada ao DNA e não vira na reacção de restrição. A enzima de restrição do tipo I compreende as sequências de DNA da subunidade (S), duas subunidades metiltransferase (M) e duas subunidades de restrição (R). O núcleo do M2S é responsável pela (i) manutenção da metilação do cromossoma hospedeiro pela modificação sequência específica hemimetilada produzida pela replicação do DNA e (ii) activação da reacção de restrição caso a sequência especifica do DNA reconhecida é não metilada em ambas as cadeias e a partir da fonte estranha. Esta reacção de restrição compreende ATPases dependentes da translocação do DNA pelos motors, que são membros da SF2, que é da família das helicases, e cliva o DNA. A reacção de restrição é transportada pela subunidade R, em que cada uma contém um motor e um domínio de clivagem do DNA. Eco KI tornou-se na arquetípica enzima tipo I do sistema R-M com a translocação do DNA com propriedades reminiscentes das helicases, reconhecendo o local assimétrico bipartido AAC(N6)GTGC. Endonuclease de restrição Quando um bacteriófago é transferido do crescimento em um hospedeiro para um hospedeiro diferente, a sua eficiência é, frequentemente, comprometido várias vezes. Contudo, quando o fago que sobreviveu e multiplica-se é usado para reinfectar um segundo hospedeiro, eles agora crescem normalmente. O pobre crescimento inicial é causado pela acção sobre o DNA do fago numa sequência específica da endonuclease bacteriana (conhecida como endonuclease de restrição porque restrita o crescimento do fago). Seguido da clivagem inicial, o DNA do fago é rapidamente degradado a nucleótidos por acção da exonuclease, embora algumas regiões possam ser resgatadas pela recombinação. O DNA do hospedeiro não é degradado porque a sequência de nucleótidos que é reconhecida pelas enzimas de restrição foi modificada (geralmente por metilação). As poucas moléculas do DNA do fago que sobrevivem à infecção inicial é devido a estas modificarem-se pela metilase do hospedeiro antes da enzima de restrição actuar. Esta metilação do DNA dos descendentes torna-os resistentes a uma segunda infecção. Um processo inverso é a degradação da citosina no DNA na E.coli infectada com T dos bacteriófagos em que o seu próprio DNA contém hidroximetilocitosina. Os cromossomas de E.coli codificam a endonuclease de restrição do tipo I, conhecida por Eco B (na E.coli na estirpe B). outras enzimas de restrição são codificadas por 12 plasmídeos e são na maioria enzimas do tipo II, mas alguns fagos e plasmídeos codificam enzimas do tipo III que são conhecidas por intermediarias em propriedades entre as enzimas do tipo I e do tipo II. Enzimas do tipo I e do tipo II catalisam ambas endonucleotídeos. Enzimas do tipo I São proteínas complexas multifuncionais que clivam DNA mão modificado na presença de S-adenosil-l.metionina (AdoMet), ATP e Mg2+. São multisubunidades de enzimas, que, são, também DNA metilases e ATPases. As subunidades estão presentes em diferentes proporções nas enzimas EcoB e na EcoK. Elas são codificadas por três genes contíguos conhecidos como hsdM (modificação) e hsdS (espicificidade). As três subunidades são, respectivamente, responsáveis pela acção das nucleases, pela metilação e pela especificidade da sequência da enzima. Os locais de reconhecimento para as enzimas de restrição EcoK e EcoB do tipo I são mostrados na imagem. As adeninas com um asterisco na sequência EcoB é metilada pela enzima EcoB e as adeninas correspondentes á sequência EcoK são os locais da metilação pela metilase de restrição EcoK. As sequências de reconhecimento consistem num grupo de três bases e num grupo de quatro bases separadas por seis (EcoK) ou oito (EcoB) bases inespecíficas. Sistemas de modificação-restrição Metilase e nuclease No fim de 1960, o cientista Stewart Linn e Werner Arber isolaram amostras de dois tipos de enzimas responsáveis pelo crescimento restrito de fagos na Escherichia coli. Uma destas enzimas metilaram DNA, enquanto que a outra cortou DNA não metilado uma grande variedade de locais ao longo do comprimento da molécula. O primeiro tipo de enzimas foram chamadas de metilases enquanto as outras são chamadas de nucleases de restrição. Estas ferramentas enzimáticas eram importantes para os cientistas que estavam a reunir as ferramentas necessárias para “cortar e colar” moléculas de DNA. 13 O que era necessário agora era uma ferramenta que cortaria o DNA em locais específicos, em vez de locais ao acaso ao longo do comprimento da molécula, para que os cientistas podessem cortar DNA numa forma previsível e reprodutível. Breve história: o Década de 50 – descoberta de um sistema imunitário primitivo em bactérias – algumas estirpes de E.coli eram resistentes à infecçao por vários bacteriófagos. o Década de 60 – descoberta de um sistema enzimático bacteriano que reconhecia e destruía selectivamente DNA estranho, enquanto que modificava o DNA endógeno, prevenindo a sua destruição. Extractos bacterianos capazes de clivar DNA fágico devido à presença de nucleases as quais eram capazes de reconhecer e cortar DNA. Endonucleases – cortam DNA em posições internas Exonucleases – cortam DNA externamente Para além da actividade nuclease, algumas enzimas apresentavam a capacidade de modificar o DNA por metilação de nucleótidos dentro da sequência por elas reconhecida: Modificação do DNA – Metilação 14 Exemplos de metilação Metilações mais frequentes M6A-N6-metiladenina M5C-C5-metilcitosina M4C-C4-metilcitosina Hm5C-C5-hidroximetilcitosina O DNA metilado pode ser passado à descendência. O X está protegido, ou seja, o seu DNA está protegido pelo sistema de metilação. As bactérias que se protegem os fagos pela metilação. Os sistemas de modificação-restrição são e metilação são específicos para cada estirpe. O sistema de modificação-restrição e metilação têm que reconhecer uma sequência da estirpe em locais específicos. Se ocorrer um erro na metilação, o próprio fago pode ser metilado e fica protegido. Tipos de Sistemas de restrição‐metilação com base na composição das subunidades, tipo de clivagem, tipo de especificidade, necessidade de co‐factores Tipo I – são enzimas complexas, multiméricas, combinando as duas actividades de restrição e modificação, e cortam o DNA em locais aleatórios e distantes do local de reconhecimento. Consomem ATP na reacção da hidrólise.Não têm aplicação prática no laboratório. Tipo II – cortam o DNA dentro ou próximo da sequência de reconhecimento, produzem fragmentos de DNA discretos, que formam padrões de bandas característicos, e são as únicas usadas no laboratório para análise de DNA e clonagem. Não necessitam de ATP para a hidrólise, apenas Mg++. Tipo III – são também enzimas com actividade de restrição e modificação. Cortam fora da sequência de reconhecimento e necessitam de duas dessas sequência em 15 orientações opostas, numa mesma molécula de DNA, para executar a clivagem. Raramente produzem digestões completas, e também consomem ATP. Características das enzimas dos Sistemas de Modificação-Restrição de tipo I, II, III Enzimas de tipo I ligam-se à sequencia alvo, metilando-a, ou clivando o DNA, consoante o estado de metilação deste Tipo I Para clonagem de sequências de DNA desconhecido na E.coli, a mais importante é o sistema tipo I, codificado por hsdR, hsdM e hsdS, o sistema de restrição EcoK. Os produtos dos três genes formam uma enzima multimérica capaz de clivar ou metilar um sequência alvo particular (5’-AAC[N6]GTGC-3’ na E.coli estirpe K-12). O sistema de restrição EcoK do tipo I é codificado pelos genes hsdSMR. (hsd significa “especificidade para o DNA hospedeiro). O gene hsdS produz a subunidade de especificidade que reconhece a sequência de DNA: 16 Se a sequência alvo é hemimetilada (apenas uma cadeia é metilada e ocorre durante a replicação do DNA no cromossoma do hospedeiro), então a enzima actua como metilase e protege a sequência da clivagem. Se a sequência não é metilada em nenhuma cadeia, então a enzima actua como uma endonuclease de restrição e corta a sequência alvo. Normalmente, o DNA de outro organismo não será metilado na sua sequência alvo e será degradada quando introduzida na cadeia os tipos dos três genes. O sistema de restrição EcoK codifica proteínas que degradam DNA estranho que não é, propriamente, metilado na sequência 5’-AAC-(N)5-GTGC-3’ que irá ocorrer no DNA clonado. Quais são os efeitos do sistema de modificação-restrição do DNA bacteriano na clonagem e manipulação do DNA da E.coli? O gene hsdR é necessário apenas para a clivagem da sequência alvo pela endonuclease. Os genes hsdM e hsdS são necessários e suficientes para a metilação da sequência alvo. As estirpes de E.coli que são mutadas pelo gene hsdR são denominadas de minus restrição, modificação mais fenótipo (r-, m+). Genótipos e fenótipos de mutantes hsd no sistema EcoK A subunidade hsdM é indispensável à função de restrição por hsdR 17 O tipo II inclui as típicas enzimas de restrição utilizadas na biologia molecular. Sequências de reconhecimento das enzimas de restrição O segundo tipo do sistema modificação-restrição consiste das endonucleases que clivam, directamente, o DNA alvo que é metilado em certas sequências. Na E.coli existe dois tipos de sistema de restrição metil-citosina denominados de McrA e McrBC. Nenhum destes sistemas cliva DNA que foi metilado por enzimas do tipo I (codificadas pelos genes hsdRMS), sistemas Dcm ou Dam. Ambos os sistemas McrA e McrBC restringem DNA hemimetilado assim como DNA metilado nas duas cadeias. O DNA que foi metilado pela metilase Sss (metila as citosinas do dinucleótido CG) e pela metilase Hpa II (metila a segunda citosina da sequência 5’-CCGG-3’) são restringidas pelo sistema McrA (4,5). O segundo tipo de sistema de modificação é o complexo mcrA/mcrB/mrr que degrada o DNA estranho e que não é propriamente metilado, como o DNA metilado obtido de células do rato ou humanas que contêm CpG DNA metilado. 18 Quais os efeitos do sistema modificação-restrição do DNA bacteriano na clonagem e manipulação do DNA na E.coli? O DNA de mamíferos tende a metilar as citosinas nas sequências CG e DNA de plantas nas citosinas das sequências CNG. É recomendado em estirpes que são mutadas por esses sistemas (mcrA/mcrB/mrr) para aumentar a recuperação do DNA genómico propagado na E.coli durante as experiências de clonagem. E.coli K12 (MG1655) – sistemas de restrição Segundo a informação do Ecocyc e Escherichia coli e Salmonella, o seguinte sistema de restrição é encontrado na E.coli K12. Contém enzimas de restrição EcoK do tipo I codificadas pelo hsdR que cliva na sequência AAC(N6)GTCG, se o segundo A é não metilado. Contém também o sistema Mcr. Este sistema de restrição não parece ter uma sequência, apenas corta nos resíduos metilados. O sistema mrr, também contido nesta bactéria, que cliva resíduos de m6A e m5C. a sequência de especificidade é desconhecida. A presença do gene hsdR no MG1655 pode explicar porque é que plasmídeos (exemplo pSB4A3 e pCH1497-ASD1) que contêm sequência de reconhecimento para a função da EcoK incerta na MG1655. Pelo contraste, constrói o que não contém a sequência para a função da EcoK na MG1655. Metilação do DNA A maioria das estirpes de E.coli contém duas enzimas que metilam o DNA: 1. dam metiltransferase (DNA Adenina Metilase) Responsável por mais de 90% da metilação do DNA; Introduz grupos metilo na posição N6 da adenina na sequência 5’ GATC 3’ As estirpes bacterianas mutantes nesta enzima designam-se por dam- 19 2. dcm metiltransferase (DNA Citosina Metilase) Introduz grupos metilo na posição C5 da citosina mais interna da sequência 5’ CCAGG 3’; As estirpes bacterianas mutantes nesta enzima designam-se por dcm- As estirpes bacterianas mais correntemente usadas em Biologia molecular são geralmente dam- e dcm-, em simultâneo, de modo a garantir que o DNA clonado não seja metilado e possa ser processado pela maioria das enzimas de restrição disponíveis. Ao pegar num plasmídeo e coloca-lo numa bactéria Rk- Mk-. Purifica-o e coloca-o numa estirpe Rk + o plasmídeo propaga-se ? Sim, o plasmídeo propaga-se porque está protegido pois foi metilado pela bactéria. Sequências de reconhecimento sobrepostas total ou parcialmente às sequências de metiltransferases são um indicador de que bases metiladas podem impedir a acção das enzimas de restrição. 20 Quadro resumo: Marcadores moleculares Os marcadores específicos serve para estudar as variações a nível das populações, espécie, ou seja, estudar os polimorfismos (variações fisiológicas). Usando polimorfismos visíveis Vantagens Desvantagens Pouco dispendioso para contar Polimorfismos visíveis raros Passíveis de experimentar nas populações naturais Maioria das variações genéticas difíceis de visualizar Base da variação genética pode ser complexa e não é necessariamente fácil de determinar Espécies secretas Porque é que nos preocupamos com as variações? Estudamos as variações para estudar: As diferenças fenótipicas subjacentes; O que causa doenças hereditárias; Para permitir o historial humano (antigo e moderno) 21 Polimorfismos bioquímicos Marcadores bioquímicos Proteínas aloenzimas Variâncias electroforéticas das proteínas produzidas por diferentes alelos dos genes codificantes de proteínas. Método: 1. Homogenizar o tecido; 2. Separar o extracto por electroforese num gel de amido. Coloca-se o gel numa solução com reagentes que necessitam de actividade enzimática da enzima que estamos a monitorizar. 3. Mancha-se o gel com um corante que a enzima pode catalisar num reagente com cor que mancha a proteína. Usando polimorfismos proteicos Vantagens Desvantagens Pouco dispendioso Apenas revela uma pequena proporção da variação de DNA Marcadores são co-dominantes (marcadoresco-dominantes analisa um locus Muitas variâncias de DNA não resultam em mudanças na sequência de aminoácidos (e.x. substituições sinónimas) Algumas mudanças na sequência de aminoácidos não resultam em mudanças na mobilidade no gel. Polimorfismos moleculares Marcadores moleculares Marcadores moleculares são baseados em polimorfismos que ocorrem naturalmente na sequência de DNA (e.x. delecções de par de bases, substituições, inversões, adições e repetições). Existe vários métodos para detectar e amplificar estes polimorfismos: RFLP RAPD AFLP Existe cinco condições que caracterizam um marcador molecular adequado: Tem que ser polimórfico; De preferência co-dominante; Distribuído pelo genoma frequentemente e aleatoriamente; 22 Fácil e barato de detectar; Reprodutível Um primer amplificando um marcador dominante pode amplificar vários loci na mesma amostra de DNA com uma única reacção de PCR. Um marcador co-dominante analisa um apenas um locus. Um primer que amplifica um marcador co-dominante produziria o produto pretendido. Os marcadores moleculares podem ser utilizados em diferentes aplicações: Caracterização do germplasma (colecção de recursos genéticos de um organismo); Diagnóstico genético (doenças, etc.); Caracterização de transformantes (e.x. análise e detecção GMO); Estudos de paternidade e forenses; Estudos do presente e do passado sobre a distribuição e ecologia das populações; Genética da população e fluxo de genes; Estudo do genoma; Delimitação de espécies e análise filogénica. Técnicas usadas para a análise de marcadores moleculares As técnicas utilizadas para a análise de marcadores moleculares são: Digestão por enzimas de restrição; Electroforese; PCR; Por vezes a combinação de todas (RFLP-PCR) Técnicas de marcadores moleculares Restriction fragment length polymorphism (RFLP) Esta técnica envolve a digestão do DNA genómico por enzimas de restrição. As enzimas de restrição são isoladas de bactérias e consistem em cortar o DNA em locais específicos na sequência de par de bases, em que são denominados de locais de restrição. Os locais de restrição não estão associados a nenhum tipo de gene e encontram-se distribuídos aleatoriamente pelo genoma. Quando o DNA genómico é digerido por uma ou mais enzimas de restrição, uma série de fragmentos são produzidos em vários comprimentos. Os fragmentos são separados por electroforese em gel de agarose ou em gel de poliacrilamida (PAGE) produzem certas características. As variações das características da digestão de RFLP pode ser causados por: o Delecções de par de bases; o Substituições; 23 o Inversões; o Translocações e transposições Os resultados são perda ou ganho de locais de reconhecimento, resultando num fragmento de diferente tamanho e polimorfismo. Os locais de restrição são, muitas vezes, palindrómicos Usando RFPL polimorfismos Vantagens Desvantagens Variantes são co-dominantes Trabalho intensivo Variações das medidas ao nível da sequência de DNA, não na sequência da proteína Requere grandes quantidades de DNA PCR baseado nos marcadores moleculares Randomly amplified polymorphormic DNA markers (RAPD) RAPD foram os primeiros PCR baseados em marcadores moleculares desenvolvidos e os mais simples; Pequenos primers de PCR (aproximadamente de 10 bases) são aleatoriamente e arbitrariamente seleccionados para amplificarem segmentos de DNA do genoma; Os produtos da amplificação são criados na região que flanqueia os locais dos 10 bp na orientação apropriada; RADP, muitas vezes mostram relações dominantes devido ao primer ser incapaz de ligar-se a alelos recessivos; Os produtos de RAPD são, normalmente, visualizados em gel de agarose corado com brometo de etídio, SYBR Safe, Gel Red ou outros corantes de DNA. 24 Vantagens Desvantagens Rápido Marcadores são dominantes Pouco dispendioso Presença de uma banda pode significar que o indivíduo é ou heterozigótico ou homozigótico para a sequência Grande variedade Análise da informação mais complicada Simple sequence repeats / microssatélites São repetições de pequenas sequências do genoma de todos os eucariontes e consiste em várias a centenas de repetições de 1 a 4 motivos nucleóticos. Amplified fragment lenght polymorphism (AFLP) AFLP é um método altamente sensível baseado na combinação dos conceitos RFLP e RAPD; Esta técnica é aplicada a todas as espécies, dando resultados reprodutíveis; A base do AFLP é o amplificação por PCR com corte dos fragmentos do DNA genómico com enzimas de restrição. Fragmentos restritos produzidos por um cortar frequente (MseI) e um cortador raro (EcoRI). Os adaptadores consistem na sequência núcleo mais enzimas específicas para a sequência. A sequencia núcleo é um segmento de DNA conhecida (20 nucleótidos) que vai ser utilizado como primer no próximo PCR. Adaptadores usados como primers. Para uma primeira selecção dos fragmentos apenas amplificamos DNA que tenha um adaptador ligado em ambas as extremidades. Em adição, os primers têm uma base adicional permitindo a amplificação de um quarto com o adaptador em ambas as extremidades. 25 Três mais nucleótidos são adicionados ao primer da amplificação anterior. A amplificação é mais selectiva e os fragmentos restritos diminuem. Um dos primers é marcado com fluorescentes para futura visualização. Electroforese Um capilar fino contendo um polímero substitui o usual gel de acrilamida. As condições da electroforese podem ser resolver a diferenciação de fragmentos de DNA apenas com um par de bases. As amostras são carregadas numa faixa e correm uma atrás das outras através do capilar. Todos os fragmentos são separados pelo tamanho. Depois de passarem o laser, um corante liga-se ao primer, que excita e emite um sinal fluorescente que é recolhido por computador. O resulta da fluorescência é visualizado no computador. Vantagens Desvantagens Rápido Marcador é dominante Barato A presença de uma banda significa que o individuo ou é heterozigótico ou homozigótico para a sequência Grande variedade Variable number tandem repeats (VNTR) Regiões não codificantes; Várias cópias da mesma sequência; Grande quantidade de variações entre indivíduos no número de cópias; Usado para DNA fingerprinting; Microssatélites, minissatélites, short tandem repeats (STR), simple sequence repeats (SSR); ISSR – inter-simple sequence repeats O desenho de primers para flanquear a região é necessário. 26 Microssatélites VNTRs mais útil; 2, 3 ou 4 par de bases repetidas; De algumas a 100 cópias tandem; Grande variedade; Vários microssatélites loci (1000s) diferentes em várias espécies. Vantagens Desvantagens Grande variedade Relativamente dispendioso e com consumo de tempo para desenvolver Grande evolução Co-dominante Usado em estudos de populações; Não muito entre estudos entre populações que evoluem muito; Análise de paternidade ou outros estudos de parentesco Single nucleotide polymorphisms -SNP Variação da sequência de DNA ocorre quando um único nucleótido, no genoma (ou outra sequência partilhada) difere entre membros da espécie ou emparelhados; Exemplo: duas sequências de fragmentos de DNA de diferentes individuos. AAGCCTA para AAGCTTA, contém a diferença num único nucleótico. Neste caso são dois alelos : C e T. Quase todosos SNPs têm apenas dois alelos. Conceitos chaves de SNP Definição – mais do que uma base alternativa ocorre numa frequência apreciável; Disponibilidade - mais de 10 milhões de SNPs têm sido identificados no genoma humano; Função – maioria dos SNPs são neutros e menos de 1% presente em regiões codificantes de proteínas. Os SNP são os: O polimorfismo genético mais comum Distribuído pelo genoma com grande densidade Grande causa da diversidade genética entre diferentes indivíduos, como por exemplo, resposta a drogas, susceptibilidade a doenças. Facilita uma grande escala genética associado a estudos como marcadores genéticos. Maioria dos SNPs não alteram a síntese proteica nem causam doenças directamente. Servem como marcadores, uma vez que podem ser fisicamente 27 semelhantes ao local da mutação no cromossoma. Por causa desta proximidade, os SNPs podem ser partilhados entre grupos de pessoas com características comuns. Analisando o padrão de SNP entre diferentes grupos de pessoas podem esclarecer a evolução da raça humana e compreender grupos étnicos e raças. Locais SNP SNPs ligado ou iSNPs não residem entre genes e não afectam o funcionamento da proteína. Contudo, eles correspondem a uma resposta a uma droga particular ou ao risco de apanhar uma certa doença. SNPs causativos afecta a forma como uma proteína funciona, correlacionando a doenças ou influenciando a resposta de uma pessoa à medicação. SNPs causativos acontecem em duas formas: o Coding SNPs ou cSNPs localizados entre regiões codificantes de um gene, alterando a sequência de aminoácidos do produto do gene da proteína. o Non-coding SNPs or rSNPs, localizados entre a sequencia regulatória do gene, alterando o nível da expressão genica e, portanto, quanto RNA e proteína é produzida. pUC19 – um plasmídeo de engenharia genética 2,7KB (pequeno tamanho permite grande espaço para inserir DNA) DNA não genómico circular o DNA do fago lambda é linear e muito maior (48,5kb) Tem uma origem de replicação e um grande número de cópias (200/célula) Gene resistente à ampicilina o Codifica uma enzima que liga e degrada a ampicilina Gene Lac Z (parte do operão Lac) o Codifica a β-galactosidase o Uma enzima que degrada a lactose em glucose e galactose 28 o Local múltiplo de clonagem dentro do LacZ Contém sequências de reconhecimento para várias enzimas de restrição A ruptura deste local previne a produção de β-galactosidase Digestão restrita do plasmídeo pUC19 e fago lambda (λ) Usa a enzima de restrição Hind III para cortar tanto o plasmídeo pUC19 e o fago lambda. A sequência de restrição para o Hind III é A.AGCTT. esta sequência específica ocorre uma vez no pUC19 e sete vezes no fago lambda. Um local do pUC19 cria uma porção de DNA linear quando cortada. Sete locais do lambda origina oito fragmentos quando cortado. Os fragmentos de DNA serão separados e analisados em gel de agarose. Enzimas de restrição Na base das experiências clássicas de Berg e de Boyer-Cohen-Chang estão as enzimas de restrição. Os cientistas logo se aperceberam que as enzimas de restrição podiam constituir uma ferramenta notável para investigar a organização, função e expressão génicas. As enzimas de restrição clivam o DNA em locais específicos: 1. Produzindo fragmentos de tamanho discreto que podem ser analisados por electroforese. 2. Constituindo um auxiliar precioso na clonagem de DNA e permitindo a manipulação de fragmentos de DNA relativamente pequenos 29 As enzimas de restrição (ou endonucleases de restrição) foram descobertas em 1970 durante investigações sobre o fenómeno de modificação e restrição de bacteriófagos pelo hospedeiro. A restrição à infecção resulta da acção de “enzimas de restrição” em combinação com DNA-metiltransferases. Estas metilam o DNA bacteriano próprio, tornando-o por sua vez resistente à acção das endonucleases, que assim actuam unicamente sobre o DNA viral. Endonuclease + metilase: sistema que protege o DNA do hospedeiro e digere o DNA viral Nomenclatura das enzimas de restrição Mais de 250 enzimas de restrição com diferentes especificidades de sequência foram já caracterizadas. A maioria reconhece sequências simétricas, palindrómicas (porque se ligam ao DNA como homodímeros), e portanto que se lêem de igual modo em ambas as cadeias. Taq I Microrganismo: Thermusaquaticus A sequência de reconhecimento é simétrica (palindrómica), composta por 4 pares de bases. A enzima produz extremidades coesivas (em cadeia simples), de 2 bases, 5’- protuberantes. As duas extremidades deixadas pelo corte da enzima são iguais? Palindrómica – molécula de DNA que dá para ler igualmente nos dois sentidos. Tem simetria 30 Hha I Microrganismo: Haemophilushaemolyticus A enzima produz extremidades coesivas 3’- protuberantes. Sma I Microrganismo: Serratiamarcescens A sequência de reconhecimento é composta por 6 pares de bases. A enzima produz extremidades não coesivas (em cadeia dupla). BbvCI Microrganismo: Bacillusbrevis A enzima tem uma sequência de reconhecimento assimétrica (não palindrómica). A forma activa da enzima é um heterodímero. DdeI Microrganismo: Desulfovibrio desulfuricans N pode ser qualquer base. Esta enzima reconhece em cada uma das cadeias qualquer das 4 sequências CTAAG, CTTAG, CTGAG, CTCAG (contudo, estas representam apenas 2 locais de ligação diferentes). MboII Microrganismo: Moraxellabovis A sequência de reconhecimento é contínua e assimétrica. A enzima corta o DNA fora da sequência de reconhecimento. Possui dois domínios, um de ligação ao DNA, outro de clivagem. Extremidade coesiva de uma base (N-3’). SfiI Microrganismo: Streptomycesfimbriatus A sequência de reconhecimento é descontínua. As metades da sequência de reconhecimento encontram-se separadas por 5 bases. 31 NotI Microrganismo: Nocardia otitidiscaviarum A enzima tem uma sequência de reconhecimento de 8 pares de bases, e corta o DNA, em média, muito raramente. Extremidades coesivas de 4 bases. Isoesquizómeros são a mesma sequência de reconhecimento e mesmo local de corte. Por ex. EcoRIe FunII Neoesquizómeros são um subconjunto dos isoesquizómeros: a mesma sequência de reconhecimento mas local de corte diferente. Por ex. SacIe Ecl136II Nos neoesquizómeros, a mesma sequência de reconhecimento mas local de corte diferente. Por ex. ApaI e Bsp120I As enzimas Bsp120I , EaeI e EagI têm sequências de reconhecimento diferentes da de NotI, e diferentes entre si, mas originam extremidades compatíveis(Y=Py=pirimidina; R=Pu=purina) 32 Nomenclatura para bases específicas incompletas nos ácidos nucleicos Sequences Nomenclature Committee of the International Union of Biochemistry (NC-IUB), 1984 A sequência de reconhecimento das enzimas de restrição representa-se normalmente em cadeia simples A sequência de reconhecimento da HindIII é 5’-aagctt e portanto não corta na sequência representada abaixo. A frequência de corte das enzimas de restrição depende essencialmente do número de bases da sequência de reconhecimento, mas é desviado fortemente pela composição de bases do DNA e da presença de bases metiladas 4 bp-> 256 bp em média (44) 6 bp-> 4096 bp em média (46) 8 bp-> 65 536 bp em média (48) Afectado por: Composição de bases do DNA Presença de bases metiladas 33 Star activity Staractivity é quando algumas enzimas apresentam relaxamento de especificidade sob certas condições experimentais in vitro. Por ex. BamHI, em condições de baixa força iónica, reconhece e cliva, para além de G/GATCC: o N/GATCC o G/RATCC o G/GNTCC Condições que contribuem para a actividade “star” de algumas enzimas de restrição Concentração elevada de glicerol [>5% v/v] Proporção Enzima/DNA elevada [Variável para diferentes enzimas, normalmente >100 U/μg] Força iónica baixa [<25 mM] pH alto [>pH 8.0] Presença de solventes orgânico s[DMSO, etanol, etilenoglicol, dimetilacetamida, dimetilformamida] Substituição de Mg++ por outros catiões divalentes [Mn++, Cu++, Co++, Zn++] Subtipos de enzimas de restrição de tipo II SalI e SacI originam extremidades compatíveis? SacI: GAGCTC SalI: GTCGAC BamHI, PsuIe BglII têm extremidades compatíveis? Depois de ligar dois fragmentos de DNA, um cortado com BamHI, o outro com PsuI, pode-se voltar a cortar com BamHI? Depois de ligar dois fragmentos de DNA, um cortado com BamHI, o outro com BglII, pode-se voltar a cortar com BamHI ? E com BglII? 34 Exemplo de um mapa de restrição Frequentemente as enzimas de restrição não são eficientes na reacção de hidrólise quando a sequência de reconhecimento se encontra demasiado perto da extremidade da molécula A DNA ligase cataliza a formação de ligações fosfodiéster entre grupos terminais 5’- fosfato e 3’-hidroxilo justapostos, em moléculas de DNA em cadeia dupla, com extremidades coesivas ou não. Não tem actividade sobre ácidos nucleicos de cadeia simples. 35 Reacção catalisada pela DNA ligase: ATP + (desoxirribonucleótido)n + (desoxirribonucleótido)m= AMP + PPi+ (desoxirribonucleótido)n+m Ligação A ligação é a junção de fragmentos de DNA no vector molecular, como um plasmídeo ou um bacteriófago, que pode ser replicado pela célula hospedeira depois da transformação. A junção ou ligação dos fragmentos de DNA é realizado por uma enzima conhecida como DNA ligase. O papel natural da DNA ligase é reparar espaços numa cadeia no ligação açúcar – fosfato de uma cadeia dupla de DNA, tal como ocorre através de danos no ADN. A actividade catalítica da enzima necessita da presença de ATP e Mg++. DNAs em que falta os resíduos de fosfato, podem ser capazes da ligação por fosforilação da cinase polinucleótica T4. A enzima, também, cataliza uma reacção adicional de fosfato entre a pirofosfato e ATP. 1. Ligação do DNA, por complementariedade, a terminações coesivas 36 2. Reacção de reparação A acção de ligação necessita que o espaço (nick) exponha o grupo 3’OH e 5’-fosfato. A digestão com endonucleases de restrição corta o DNA dessa forma, por exemplo, deixa o fosfato na posição 5’ da desoxirribose. O emparelhamento instável dos dois fragmentos de restrição com extremidades compatíveis podem, portanto, ser consideradas como moléculas de DNA de cadeia dupla com espaços em cada cadeias e, por isso, um substrato para a acção da DNA ligase. A T4 DNA Ligase pode ligar extremidades “blunt” mas com menor eficiência. Algumas DNA ligases, como a T4 DNA ligase (codificada pelo bacteriófago T4), é, também, capaz de ligar extremidades “blunt”, embora com menos eficiência, enquanto outras (a E.coli ligase) não são capazes. Apenas se considera a acção da T4 DNA ligase, que é, de longe, a mais extensível de se usar. Referimos-nos à enzima como T4 ligase (ou só ligase) embora é também T4 RNA ligase. A T4 ligase necessita de ATP como co-substrato. No primeiro passo, a ligase reage com o ATP para formar uma enzima covalente, o AMP complexo, que por sua vez reage com 5’-fosfato no local do espaço (nick), transferindo o AMP para o grupo fosfato. O ultimo passo é o ataque pelo grupo 3’OH, formando uma nova ligação fosfodiéster covalente (que restaura a integridade do açúcar-fosfato) e liberta o AMP. A absoluta exigência para o 5’-fosfato é extremamente importante; pela remoção do 5’-fosfato, consegue-se a prevenção da ocorrência de ligações indesejadas. 37 Exemplo de remoção do fosfato para impedir ligação (religação de vectores) Qual a enzima utilizada para remoção do fosfato? Desde a reacção, que se que quer, normalmente, envolver duas moléculas diferentes de DNA (ligação intermolecular), que se espera ser extremamente sensível para a concentração de DNA. Portanto, é importante usar altas concentrações de DNA, mas que componente de DNA? Temos dois componentes, o vector e o insert (ignorando por momento, o facto do insert pode ser, ele próprio, uma mistura de fragmentos). Existe, portanto, uma variedade de possibilidades de reacções que podem ocorrer, assim como, a concentração global de DNA, que se pode influenciar a probabilidade destas diferentes reacções. Qual a probabilidade de qualquer destes produtos de reacção ocorrer preferencialmente? Podemos influenciar o tipo de produto preferencialmente obtido manipulando a quantidade e a concentração do DNA? (que DNA?) A baixas concentrações de DNA, é mais provável ter a junção (por reacção intramolecular) de duas extremidades da mesma molécula, desde que a taxa da reacção que envolve uma reacção será linearmente relacionado com a concentração, assim como, a taxa com dois componentes diferentes, será proporcional ao produto das duas concentrações. (ou a reacção que envolve duas moléculas do mesmo substrato, a taxa será proporcional ao quadrado da concentração). Portanto, aumentando a concentração, será dado um maior aumento da taxa da reacção intermolecular (entre duas moléculas) do que numa reacção intramolecular. Se aumentar-mos a concentração do vector mas não do insert, teremos um maior aumento da ligação entre dois vectores (que não pretendemos) do que na produção 38 de vector-insert recombinante. Reciprocamente, aumentando a concentração do insert, teremos um aumento dos níveis de dímeros insert-insert (que, também, não pretendemos, apesar de serem de menor problema como não vão dar origem a transformados. Assim, não só precisamos de manter a concentração de DNA alta, mas também criar um óptima relação vector:insert. Não é fácil prever que relação deve ser, mas tipicamente será no intervalo de 3:1 a 1:3. De notar que são as relações molares e tem que se ter em conta o tamanho relativo do vector e do insert. Por exemplo, se o vector tem 5kb e o insert tem 500 bases, então uma relação molar de 1:1 envolveria 10 vezes mais vector, por peso, do que insert (e.x. 500ng de vector e 50 ng de insert). Reciprocamente, para o mesmo vector mas um vector com tamanho de 50kb, se usarmos 500ng de vector, precisaríamos de 5µg de insert para alcançar a relação molar de 1:1. No geral, para converter a quantidade de DNA por peso num valor que pode ser usado para calcular a relação molar, dividimos a quantidade usada (por peso) pelo tamanho do DNA. Assim, se Wv e Wt são os pesos usados para o vector e para o insert de DNA, respectivamente, e Sv e St para o tamanho do vector e do insert (e.x. em kilobases (kb)), então, a relação vector:insert é (Wv/Sv):(Wt/St). Exercício Qual a massa de vector e insert respectivamente com 5 kb e 500 bp, para obter uma ligação na proporção molecular de 1:1 (partindo de uma massa de 500 ng de vector)? Estimada a concentração do vector e do insert pelo gel de agarose ou por manuseamento OD. Testa-se várias relações vector:insert para descobrir a melhor relação. Na maioria dos casos, as melhores relações são de 1:1 ou 1:3. Formula: ((ng vector) X (tamanho do insert em kb)) / ((tamanho do vector em kb) X (relaçãomolar do vector:insert) = (ng do insert) Exemplo: 500bp de insert vão ser ligados com 100ng de um vector com 3,0kb numa relação de 3:1 ((100ng vector) X (0,5kb de insert) / (3,0 kb de vector) X (3/1)) = (50ng insert) 39 Algumas reacções de ligação possíveis Recombinante Sem insert Fragmentos Sem ligação Clonagem de fragmentos de DNA 1. Extremidades protuberantes Compromisso - usar concentrações equimolares de plasmídeo e de insert na reacção de ligação. Não respeitando esta relação: Maior quantidade de plasmídeo religados; Maior quantidade de insert – maior quantidade de plasmídeos contendo repetições do insert (insert em tandem) Verificar que resultados foram obtidos: Análise do DNA recombinante com enzimas de restrição; Sequenciação do DNA recombinante PCR Necessidade de verificar a orientação do insert inserido Uma equação para calcular as relações volumétricas necessárias na reacção de ligação A reacção de ligação é fundamente importante para a Biologia Molecular, activando a junção do vector e dos fragmentos do insert de DNA para criar um novo plasmídeo de moléculas de DNA. É importante obter a relação correcta de vector:insert para uma óptimo geração de plasmídeos recombinantes e para reduzir a formação de ligações entre fragmentos, vectores religados, dímeros de plasmídeos e plasmídeos contendo múltiplos inserts. A ligação de reacção é, normalmente, realizada num volume total de 10-20µL a 4-37ºC (muitas vezes em temperatura ambiente) usando a enzima T4 DNA ligase, e um tampão que contém Mg2+ e ATP ( tipicamente de uma concentração stock 10 vezes maior com a que vamos trabalhar). A T4 DNA ligase cataliza a junção de terminações de DNA adjacentes por formação de ligações fosfodiéster usando ATP como cofactor e consegue ligar extremidades “blunt” ou coesivas compatíveis. Numa óptima reacção de ligação, o objectivo é inserir um único insert num vector, e as concentrações de 40 insert e vector que devemos utilizar que desfavorecem a formação de um anel monomolecular ou concamerico. Existentes equações de ligação apenas permite calcular uma relação molar vector:insert. Como o tamanho da molécula de DNA é directamente proporcional ao seu peso molecular, como equações que não oferecem nenhuma desvantagem sobre a simples determinação da relação do tamanho dos fragmentos. As equações descritas permite calcular facilmente o volume dos componentes dados na concentração do DNA e no tamanho dos fragmentos, tal como a relação molar vector:insert dada é alcançada e a reacção consiste nas soluções de DNA ligase, tampão, insert e vector DNA se forem necessárias. Na relação óptima, teórica, insert:vector que se deve-se ter em conta da relação da concentração em toda a reacção (i) com a concentração de uma extremidade de uma molécula de DNA num volume ocupado por outra extremidade da mesma molécula (j). o valor de j é inversamente proporcional ao tamanho do fragmento de DNA e independente da concentração do DNA, então, só será fixada para uma ligação dada. As variáveis são o total da concentração de DNA e a relação inser:vector. Para extremidades coesivas recomenda-se que j:i seja entre 1:1 e 1:3 (20-60ng/µL para clonar um vector do tamanho do pUC18) e a relação insert:vector seja 2:1 para o máximo rendimento de recombinantes úteis. Exemplo: Quanto insert de DNA 0,5kb deve ser adicionado para uma ligação em que 100ng de 3kb de vector deve ser usado? A relação vector:insert desejada será 1:3 Ligações de DNA podem ser frustantes A ligação de reacção tem dois passos básicos: 1. Primeiro as extremidades de DNA têm de colidir por acaso e estarem juntas tempo suficiente para que a ligase as ligue. Este é a parte mais ineficiente da reacção. 2. O segundo passo é a reacção enzimática, onde a DNA ligase cataliza a ligação de 3’OH com 5’-fosfato. Primeiro, os nucleótidos da AMP, que estão ligados aos resíduos de lisina na zona activa da enzima, são transferidos para o 5’-fosfato. 41 Depois, a ligação AMP-fosfato é ligado pela 3’OH, formando uma ligação covalente e libertando AMP. DNA ligase A ligação ocorre entre extremidades “blunt” ou extremidades pegajosas (sticky). As ligações das extremidades blunt não são eficientes. A ligase espera por um encontro. As ligações das extremidades “blunt” são, usualmente, feitas a altas concentrações. A ligação das extremidades “sticky” é mais eficiente. Pontes de hidrogénio forma um estado estável. Adicionando extremidades “sticky” (linkers) Linkers – são fragmentos de DNA pequenos de cadeia dupla e com extremidades “blunt”. Contém local de restrição de extremidades “sticky”. Linkers são, facilmente, adicionados no fim de uma extremidade “blunt” da molécula porque conseguem adicionar grandes quantidades. Clivagem resulta em extremidades “sticky na molécula. Potencial problema com os linkers Adição de uma cauda homopolímera 42 O terminal da enzima desoxinucleótidos transferase (ou terminal transferase) adiciona nucleótidos na extremidade 3’ do DNA sem necessidade de um padrão. Desfosforilação Quando o DNA é tratado com a enzima alcalina fosfatase, os grupos 5’-fosfato são removidos. Se um vector linearlizado é desfosforilado, ele não consegue religar-se porque a enzima T4 DNA ligase necessita do grupo 5’- fosfato presente. O fragmento de DNA em que o grupo 5’-fosfato encontra-se presente consegue formar uma ponte entre a extremidade desfosforilada e a inserção é favorecida. 43 Quando se tenta combinar duas moléculas, o grupo 5’-fosfato retirado não permite religar-se e estraga a construção. O que temos no fim: existe dois grandes espaços (nick) no produto final, porque duas das quatro ligações são prevenidas pela falta de 5’fosfato. A bactéria irá fixar os espaços depois do DNA ser transformado. DNA circular fechado covalentemente e DNA supercoiled O DNA de cadeia dupla circular fechado covalentemente é mostrado esquematicamente. A não ser uma das duas cadeias de DNA que fica com espaços, a torção da cadeia da hélice dupla não pode relaxar e a tensão induz uma formação espontânea de uma estrutura super enrolada mostrada à direita. O espaçamento de outra cadeia de DNA, alivia a tensão permitindo a rotação na extremidade livre. Clonagem de vectores plasmídicos Clonagem É a inserção de DNA de interesse num vector de clonagem capaz de replicação independente, e da respectiva propagação em células hospedeiro. Há muitos tipos de vectores de clonagem mas os mais usados são os plasmídeos. Os plasmídeos mais usados são aqueles que se multiplicam em Escherichia coli Moléculas circulares de dsDNA 1,2–3kbp (máx.20kbp) Capacidade de duplicação independente 44 Recombinação de plasmídeos 1. Plasmídeo e DNA a clonar são cortados com a(s) mesma(s )enzima(s) de restrição 2. Plasmídeo pode ser tratado com fosfatasealcalina que remove os grupos fosfato das extremidades 5’ do DNA, gerando grupos hidroxilo, impedindo assim a religação das duas extremidades do plasmídeo na presença da ligase. 3. Incuba-se o DNA e o plasmídeo, na presença de ligase. Transformação É incubação de uma suspensão de E. coli competentes (células tratadas de modo a incorporarem mais facilmente DNA) com a reacçãode ligação. Selecção de células transformadas com gene de resistência a um antibiótico 45 Características básicas dos plasmídeos Origem de replicação (ORI) – permite a replicação do plasmídeo independentemente do DNA genómico. Local múltiplo de clonagem (MCS) – permite a inserção do fragmento a clonar–grande número de locais únicos de restrição. Marcador de selecção – permite seleccionar os hospedeiros que incorporaram o DNA “estranho” (ex: gene que confere resistência a um antibiótico, como a ampicilina) O controlo do número de cópias de plasmídeo/célula é feito pela origem de replicação: 1 a mais de 100 cópias/célula. De um modo geral, os plasmídeos contêm uma só ORI, à qual estão associados elementos reguladores, que constituem uma “unidade genética” designada por Replicão. A maioria dos plasmídeos em uso possui um replicão derivado do pMB1 ou do ColE1, e que permite a manutenção de mais de 15 plasmídeos/célula – plasmídeos de controlo relaxado (ou “High-copyplasmids”) Plasmídeos de controlo restrito ou “Low-copy plasmids” 1 a 5 cópias/célula São menos utilizados na biologia molecular, mas são úteis quando a presença de um número elevado de plasmídeos ou dos seus produtos é deletéria para o hospedeiro. Marcadores de selecção São genes, localizados no plasmídeo, que codificam proteínas relacionadas com a selecção das células transformadas. O mais comum é a resistência a antibióticos – quando as células são crescidas em meios de cultura, contendo um determinado antibiótico, apenas as que contêm o plasmídeo que confere resistência a esse antibiótico é que sobrevivem. 46 Os antibióticos não podem ser autoclavados. Habitualmente as soluções de antibióticos são esterilizadas por filtração (tamanho de poro 0,22 μm) e guardadas em alíquotas a -20 °C. São adicionados aos meios de cultura a temperaturas inferiores a 65 °C Antibióticos e genes resistentes a antibióticos Clonagem de fragmentos de DNA 1. Extremidades protuberantes São os mais fáceis de clonar, uma vez que as extremidades foram criadas pela mesma enzima de restrição, deixando 1 a 6 nucleótidos em cadeia simples, que emparelharão com outros existentes no outro fragmento de DNA a) Usando uma enzima de restrição O DNA alvo pode ser introduzido no plasmídeo numa determinada orientação ou na orientação oposta. As moléculas de DNA recombinantes formadas correspondem a inúmeros produtos formados durante a reacção de ligação, entre os quais: plasmídeo vazio, produtos lineares ou circulares de plasmídeo/insert; plasmídeo/plasmídeo; insert/insert; plasmídeo/insert/insert; entre outros... Nos plasmídeos recombinantes o local de restrição usado deixa de ser único. 47 Compromisso – usar concentrações equimolares de plasmídeo e de insert na reacção de ligação. Não respeitando esta relação: maior quantidade de plasmídeo Maior quantidade de plasmídeos religados maior quantidade de insert - maior quantidade de plasmídeos contendo repetições do insert (inser tem tandem). Verificar que resultados foram obtidos: Análise do DNA recombinante com enzimas de restrição Sequenciação do DNA recombinante PCR Necessário verificar a orientação do DNA inserido. b) Usando duas enzimas de restrição com extremidade incompatíveis (clonagem direccional) Permite aumentar o rendimento de moléculas recombinantes com inserção de um só fragmento Clonagem direccional usando enzimas de restrição com extremidades compatíveis Qualquer DNA alvo cortado com BamHI e com BglII pode entrar no plasmídeo em qualquer direcção, se este também tiver sido cortado com ambas as enzimas. Contudo, se uma das enzimas de restrição for incluída na reacção de ligação (ou se a enzima for usada para digerir o plasmideo recombinante antes da transformação) só as ligações BamHI/BglII (e vice-versa) darão origem a produtos recombinantes em E. coli 48 Extremidades 3’-A protuberantes de produtos de PCR obtidos com Taq DNA polimerase (TA cloning) A Taq DNA polimerase adiciona extremidades protuberantes 3’-A a cada extremidade dos produtos formados. Estes podem ser usados para inserirem vectores TA os quais possuem extremidades protuberantes 3’-T 2. Extremidades em cadeia dupla (blunt-end cloning) Comparativamente às anteriores é bastante menos eficiente. Se razão molar plasmídeo/DNA alvo muito alta >> plasmídeos vazios Se plasmídeo/DNA alvo >> muito baixa >> homo- e heteropolímeros de composição e orientação várias. (A orientação e número de inserts em cada plasmideo recombinante têm sempre que ser validados por análise de restrição ou por qualquer outro processo) Melhores resultados podem ser obtidos com quantidades equimolares de plasmídeo e de DNA alvo, com concentração total de DNA < 100μg/ml O pBR322 foi o primeiro plasmídeo a ser largamente usado pela comunidade científica: uma origem de replicação, um local de clonagem (BamHI), e dois genes de resistência a antibióticos. Permitiu identificar recombinantes por selecção negativa. 49 Os plasmídeos de clonagem pUC constituíram um novo grande avanço nos métodos de clonagem. São derivados do pBR322 pela substituição do gene de resistência à tetraciclina por um segmento génico que codifica para parte da enzima beta-galactosidase. Podem ser usados em estirpes de E. coli que expressem a região carboxi-terminal da beta-galactosidase Regulação negativa do operão lac Indutores do operão lac, tais como o IPTG, inactivam a proteína repressora, resultando numa des-repressão transcricional do operão. A função enzimática da beta-galactosidase pode ser reconstituída a partir de dois fragmentos polipeptídicos artificiais. Estes fragmentos não são funcionais por si só. A reconstituição é conhecida por alfa-complementação. Este sistema de complementação tem sido usado para monitorizar a clonagem de fragmentos de DNA em plasmídeos que contêm locais de restrição na sequência codificante do segmento alfa (lac Z’). Estrutura de uma única sub-unidadeda beta-galactosidase evidenciando a região alfa N-terminal (azul) e a região ómega C- terminal (amarelo). A enzima funcional é um tetrâmero (à direita). 50 X-Gal (5-bromo-4-cloro-3-indolil-β-D-galactósido), um substrato cromogénico da β- galactosidase. Desenvolvimento de vectores plasmídicos Três fases do deseenvolvimento de plasmídeos vectores de clonagem 1. Na primeira fase, os vectores que se encontravam disponíveis em 1973-1976 incluíam pSC101, Co1E1 e pCR1, e todos eles sofriam com dos seguintes inconvenientes: i. Replicação pobre; ii. Realizavam uma selecção inadequada de marcadores; iii. Transportavam não mais que dois locais de restrição para a clonagem Esses inconvenientes forma tomados em conta no pBR313, mas era desnecessariamente grande, sendo metade do DNA não essencial. O tamanho foi reduzido, dando origem ao pBR322 (4,362kB; ambos pBR313 e pBR322 foram produzidos em 1977), que se tornaram populares durante vários anos. 2. Na segunda fase, o tamanho do plasmídeo for grandemente reduzido, porque a eficiência da transformação é inversamente relacionado com o tamanho do vector, e, também, porque grandes plasmídeos replicam um menor número de cópias. Um número de derivados do pBR322 foram lançados, que incluía pA TI53, pXf3, pBR327, etc. Fizeram uso em resistência a antibióticos para a selecção de clones recombinantes.3. A terceira fase do desenvolvimento de vectores incluía: i. Incorporação do fragmento de HindI do gene da β-galactosidase para permitir a selecção de colónias azuis/branas devido à α- complementação. (e.x. vectores pUC); 51 ii. Incorporação de sequências de DNA de uma cadeia simples do fago M 13, para geração de modelos de DNA de cadeia simples para sequenciação. iii. Incorporaçao do promotor de sequências de DNA para transcrição in vitro (e.x. vectores pGEM); iv. Incorporação de promotores de alta expressão para expressão de grandes quantidades de proteínas estranhas (e.x. variedade de vectores de expressão) Alfa- complementação Representação - pUC8 Os plasmídeos da serie pUC foram construídos por Jeffrey Vieira e Joachim Messing e sao derivadosdo pBR322. A região do gene de resistência a tetraciclina foi substituído por um segmento de um gene que codifica parte da enzima , dentro do qual foi inserida uma série de locais únicos de restrição (The multiple cloning site, MCS). A β- galactosidase é uma enzima tetramérica que contém quatro cadeias idênticas com uma sequência conhecida, cada uma com 1021 aminoácidos. Descobriu-se que um extracto de uma mutante de escherichia coli com delecção na região proximal (a região que codifica para a extremidade N-terminal da β- galactosidase) do gene lacZ, produz β-galactosidase inactiva. Mas, extractos da espécie de Escherichia coli com pontos de mutação fora do segmento restauram a actividade. Um pequeno péptido LacZ a é codificado pelo plasmídeo enquanto o grande LacZ é codificado em trans pelo cromossoma bacterial. O processo de α-complementação é uma restauração da actividade que ocorre quando os extractos de mutantes do operador proximal 52 LacZ tal como lacZM15 e lacZM122 (aceptores) são misturados com extractos de mutantes de terminação LacZ (dadores) que têm uma região operador proximal intacta. Quando os fragmentos de DNA são inseridos no vector, a produção de LacZ é activada e as células exibem acrtividade de β-galactosidase. IPTG é o indutor do operão Lac que inactiva o repressor X- gal e o substrato análogo a galactose e quando desdobrado produz cor azul Monómeros N- terminal e C-terminal quando unidos, codificam β- galactosidase, x-gal e desdobrado (actividade enzimática). O resultado final é Vectores de expressão Promotores bacterianos são sequências de DNA às quais se ligam as RNA polimerases. Os promotores determinam a polaridade duma sequência determinando qual das duas cadeias deve ser transcrita, e são em regra reguláveis, de tal forma que afectam fortemente a capacidade de expressar proteínas. As proteínas podem ser produzidas em grandes quantidades através da utilização de vectores de expressão: uma sequência promotora e uma sequência de ligação aos ribossomas são inseridas no vector a montante do MCS. Agar+ampicilina+X-gal 53 Os primeiros vectores de expressão desenvolvidos para E. coli usavam o promotor regulável lacP Simples expressão do vector em E.coli. utilizando o promotor lac. a) O vector de expressão (plasmídeo) contém um fragmento do cromossoma de E.coli, que contém o promotor Lac e o gene vizinho LacZ. Na presença do análogo de lactose IPTG, a RNA polimerase, normalmente, transcreve o gene LacZ, produzindo LacZ mRNA, que é traduzido para proteína, a β-galactosidase. b) O gene LacZ pode ser cortado do vector de expressão com enzimas de restrição e substituído pelo G-CSF cDNA. Quando o plasmídeo resultante é transformado na E.coli, a adição de IPTG e a subsequente transcrição do promotor Lac produz G-CSF mRNA, que traduz a proteína G-CSF. Sistema de expressão procariótico baseado na RNA polimerase do fagoT7 e no promotor tardio T7 O cromossoma de uma E.coli (engenharia genética) contém uma cópia do gene da T7 RNA polimerase debaixo do controlo transcricional do promotor lac. Quando a transcrição do promotor lac é induzido pela adição de IPTG, o gene da T7 RNA polimerase é transcrito e o mRNA traduzido em enzima. As moléculas da T7 RNA polimerase produzidas, iniciam, então, a transcrição, numa grande taxa, do promotor tardio T7 no vector de expressão. Cópias múltiplas do vector de expressão estão presentes nas células, apesar de que apenas uma cópia encontra-se esquematizado aqui. A grande quantidade de mRNA transcrito do cDNA clonado próximo do promtor tardio T7 é traduzida, em abundância, em produto proteico. Vectores de expressão eucarióticos precisam conter sequências regulatórias que sejam reconhecidas pelas células de destino. Abaixo, o vector pVKH18En6 contém vários elementos regulatórios: melhorador de transcriçãox6, promotor 35S do vírus do 54 mosaico da couve-flor, sequência líder do vírus do mosaico do tabaco (a montante do MCS) e o terminador do gene da nopalina sintase (a jusante do MCS). Vectores de expressão frequentemente incluem um sistema repórter. Os genes repórter podem ser usados para estudar a actividade de um promotor ou para monitorizar a expressão de um gene em estudo. O sinal das proteínas fluorescentes é detectável à escala subcelular. Beta-Glucoronidase (GUS) GUS é um gene repórter, particularmente usado em plantas na biologia molecular. Vários ensaios do gene repórter encontram-se disponíveis, dependendo do substrato que se utiliza. O termo GUS refere-se á mais comum técnica histoquímica. O susbstrato mais comum da β-glucoronidase é 5-bromo-4-chloro-3-indolyl glucuronide (X-Gluc) e o produto de reacção tem uma cor azul clara. “Tags” são pequenas sequências de aminoácidos que se fundem a uma proteína de interesse através de técnicas de DNA recombinante. (Fusão: justaposição de duas sequências codificantes “in frame” com o codão de iniciação único, e sem codão de terminação intermédio). Vantagem dos “tags”: mais anticorpos disponíveis. 55 Proteínas de fusão São as proteínas criadas com a junção de dois ou mais genes do qual codificou originalmente para proteínas separadas A inserção de DNA alvo no MCS provoca a respectiva fusão com a sequência codificante do gene lacZ. O IPTG induz o promotor lacP, resultando na produção de uma proteína híbrida. As proteínas de fusão têm vantagens e desvantagens relativamente ao uso de tags. Desvantagens Vantagens Perda de actividade biológica/função da proteína (e/ou do repórter) Não são necessários anticorpos Alteração da localização subcelular nativa Processamento da proteína defeituoso Toxicidade Sobre-expressão Sobre-expressão - Experimentalmente, uma proteína pode ser expressa em quantidades elevadas. Isto pode ser atingido aumentando o número de cópias de um gene, ou colocando o gene sob a acção de um promotor constitutivo forte. 1. Estudar a função de uma proteína (normalmente endógena) 2. Produção de uma dada proteína em quantidades acrescidas para purificação (proteína endógena ou não, normalmente se eucariótica usam-se sistemas de expressão eucarióticos: leveduras, plantas). Reacção em cadeia de polimerase (PCR) A reacção em cadeia de polimerase é: Um processo para multiplicar selectivamente um determinado segmento de DNA; Esse segmento pode representar uma pequena parte de uma mistura complexa de DNAs (por ex. um determinado exão numa preparação de DNA genómico total), Através da PCR podemos obter uma quantidade abundante de DNA em cerca de 2 horas, A preparação de DNA alvo não precisa ser pura, Pode amplificar-se uma única cópia de DNA alvo (por ex. uma sequência específica em uma única célula haplóide). 56 A reacção de
Compartilhar