Text Material Preview
Genes podem ser isolados por clonagem de DNA O pesquisador deve cortar o gene de um cromossomo, colocá-lo em um pedaço de DNA carreador muito menor, e fazer com que micro-organismos produzam muitas cópias dele. Cinco procedimentos são geralmente necessários para a clonagem: 1. Obter o segmento de DNA a ser clonado: usando enzimas de restrição (endonucleases) para clivar o DNA em sítios específicos; amplificar diretamente em PCR, para regiões com sequências já conhecidas; síntese do DNA com sequência conhecida. 2. Seleção de uma molécula de DNA com replicação autônoma: escolha de vetores de clonagem. 3. Ligação covalente dos dois fragmentos de DNA: pela enzima DNA ligase. Forma o DNA recombinante. 4. Mover o DNA recombinante para um organismo hospedeiro com a maquinaria para replicação de DNA. 5. Selecionar ou identificar células hospedeiras com o DNA recombinante. Uso de E. Coli como célula hospedeira - metabolismo de DNA bem conhecido, muitos vetores existentes naturalmente associados com E. Coli (como plasmídeos e bacteriófagos) são bem conhecidos; técnicas disponíveis para mover DNA de uma célula bacteriana para outra. Enzimas de restrição e DNA ligase Endonucleases de restrição reconhecem e clivam o DNA em sequências especificas, gerando fragmentos menores. Os fragmentos de DNA são então ligados ao vetor de clonagem pela DNA ligase, formando o vetor recombinante que é introduzido na célula hospedeira para amplificação. Enzimas de restrição do tipo I clivam o DNA em sítios aleatórios, podendo estar em até 1000 pb da sequência de reconhecimento. Já as do tipo III clivam aproximadamente 25 pb da sequência de reconhecimento. Esses dois tipos precisam de ATP. Endonucleases de restrição do tipo II são mais simples, não necessitam de energia do ATP e realizam a clivagem na própria sequência de reconhecimento. Essas sequências tem geralmente 4 a 6 pares de base e são palindrômicas. As enzimas de restrição podem clivar o DNA deixando pontas adesivas/coesivas em cada fi ta simples, ou seja, podem se complementar com outras fi tas de DNA. Outras enzimas de restrição fazem cortes abruptos, não deixando nenhuma base não pareada, não sendo o tipo mais ideal para a clonagem. Após a clivagem da molécula de DNA em fragmentos, um fragmento específico de tamanho conhecido pode ser parcialmente purificado por eletroforese em gel de agarose ou de poliacrilamida ou por HPLC. Se a clivagem pela enzima de restrição gerar muitos fragmentos, é necessária a construção de uma biblioteca de DNA. Após o isolamento do fragmento de DNA de interesse, a DNA ligase pode ser utilizada para a união dele com um vetor que foi tratado com a mesma enzima de restrição. A ligase catalisa a formação de ligações fosfodiéster usando ATP ou cofator similar. O pareamento complementar de bases entre o fragmento e o vetor facilita muito essa reação. Extremidades abruptas podem também ser ligadas, mas com menos eficiência. Polylinkers são fragmentos de DNA com várias sequências de reconhecimento para diferentes enzimas de restrição, que são frequentemente adicionados a vetores para auxiliar a clonagem. Vetores de clonagem permitem a amplificação de insertos de DNA Os vetores devem conter: - Origem de replicação (ori): necessária para replicação do próprio plasmídeo, mantendo um nível de 10 a 20 cópias dele por célula. Plasmídeos diferentes presentes em mesma célula devem ter diferentes origens de replicação. - Genes que conferem resistência a antibióticos como tetraciclina e ampicilina: permitir a seleção de células que contém o plasmídeo recombinante. - Vários sítios únicos de restrição: fornecer sítios para a inserção do DNA externo. - Tamanho pequeno: facilitar a entrada nas células e a manipulação do DNA. Transformação: introdução do plasmídeo em células bacterianas - Química: bactérias (geralmente E. Coli) e o plasmídeo são incubados a 0°C em uma solução de cloreto de cálcio e então são submetidas a um choque térmico pela mudança da temperatura para 37 a 43°C. - Eletroporação: células bacterianas são incubadas com o plasmídeo e então submetidas a um pulso de alta voltagem, que faz a membrana celular permeável a móleculas grandes como o plasmídeo. Em qualquer uma das abordagens, relativamente poucas células recebem o plasmídeo. Assim, são necessários métodos para identificar aquelas que estão com o plasmídeo. - Marcadores seletivos: um ou dois tipos de genes já presentes no plasmídeo. Vai permitir o crescimento da célula na presença do plasmídeo (seleção positiva) ou mata a célula (seleção negativa) em determinadas condições. - Marcadores 'selecionáveis': gene que codifi ca proteínas que fazem com que a célula com o plasmídeo produza uma molécula colorida ou fl uorescente. (IMAGEM) Cromossomos bacterianos artificiais (BACs): para a clonagem de fragmentos de DNA maiores (100 a 300 mil pb). Possuem origens de replicação estáveis que mantém 1 a 2 cópias do vetor por célula. Isso é útil pois limita reações de recombinações que podem alterar o DNA clonado ao longo do tempo. Possuem genes par que codifi cam proteínas que direcionam a distribuição do cromossomo recombinante às células fi lhas, aumentando a chance que cada uma delas só possua uma copia dele. Possui marcadores seletivos (resistência a cloranfenicol) e selecionáveis (sistema lacZ). Sistema lacZ (exemplo de alfacomplementação): esse gene é necessário para a síntese da enzima beta-galactosidase, que converte a molécula X-gal (incolor) em um produto azul. O gene lacI também faz parte do operou lac, inibindo a expressão de beta-galactosidase. O IPTG inativa essa inibição , permitindo a expressão da enzima. O inserto de DNA pode ser colocado no meio do gene lacZ, interrompendo a síntese de beta-galactosidase. Para o experimento de seleção, as células são cultivadas em meio com IPTG e X-gal. As células com o plasmídeo recombinante correto não vão expressar a enzima que produziria a molécula azul, assim colônias recombinantes de interesse apresentariam a cor branca. Se a colônia tiver a cor azul, o inserto não está presente corretamente nela, assim essas colônias não devem ser selecionadas para os seguintes passos da pesquisa. Cromossomos artificiais de levedura (YACs): o genoma de Saccharomyces cerevisae é quatro vezes menor que o de E. Coli e sua sequência é toda conhecida. O crescimento e manutenção de leveduras em labo é fácil. Esses plasmídeos contêm uma origem de replicação, dois marcadores de seleção e sequência especializadas necessárias para a estabilidade e segregação adequada dos cromossomos na divisão celular. São utilizados para a clonagem de segmentos muito grandes de DNA. Podem, ainda ser usados para o estudo da função de sequencias especializadas de metabolismo cromossômico, mecanismos de regulação e expressão gênica e outros aspectos de biologia molecular de eucariotos. Clones podem ser expressados para amplificar produção de proteínas O produto do gene pode ser o interesse da pesquisa, ao invés do próprio gene. Células podem ser manipuladas para expressar genes clonados para que a proteína de interesse possa ser estudada. O objetivo geral é alterar sequências ao redor do gene clonado para enganar o organismo hospedeiro e fazer ele produzir a proteína em níveis aumentados. Genes eucarióticos não possuem promotores, sítios de ligação de ribossomos e outras sequências presentes em bactérias. Vetores de expressão: vetores de clonagem com sinais de transcrição e tradução necessários para a expressão regulada de um gene clonado. A taxa de expressão do gene clonado é controlada pela substituição do promotor normal do gene e das sequências de regulação por versões mais eficientes e convenientes contidas no vetor. Esses estão geralmente posicionados próximos a sítios de restrição onde o gene pode ser inserido e controlado por essas sequências. Ainda, os vetores podem ter sequências de ligação de ribossomo e sequências de terminação de transcrição.As proteínas podem ser superexpressadas ao ponto de representarem até 10% do conteúdo proteico total da célula, o que pode até matar a célula hospedeira. Por isso, essa superexpressão deve ser limitada a algumas horas antes da coleta das células para o experimento. Sistemas para expressão de proteínas recombinantes Bactérias: principalmente E. Coli. Sequências regulatórias bem compreendidas, de fácil crescimento e armazenamento, meio de cultivo barato, podem ser cultivadas em grande quantidade em fermentadores comerciais. No entanto, proteínas heterólogas (originadas de espécies diferentes) podem não dobrar corretamente, não receber mudanças pós-tradicionais ou clivagens proteolíticas necessárias para sua atividade. Algumas proteínas eucarióticas quando expressas em bactérias podem formar agregados e precipitados celulares insolúveis (corpos de inclusão) - Operon lactose: pode ser utilizado para a expressão na presença de lactose no meio de cultura. No entanto, esse sistema não é desligado completamente na ausência de lactose. - Promotor T7: usado o promotor e a RNA polimerase do bacteriófago T7. O gene da polimerase é clonado no DNA genômico da célula (regulação controlada). O promotor T7 vem com o plasmídeo e, quando ativado aumenta muito a eficiência da RNA pol T7. Leveduras: genes clonados devem estar ligados a promotores que podem direcionar a expressão em células de Saccharomyces cerevisae. Genes GAL1 e GAL10 são expressos quando as células são cultivadas em meio contendo galactose mas são ‘desligados’ quando cultivados em meio com glucose. Portanto, o gene heterólogo pode ser expresso usando essas mesmas sequências regulatórias e controlando os substratos no meio. Assim como em bactérias, as proteínas heterólogas expressas por leveduras podem não sofrer o dobramento apropriado, as leveduras podem não ter as enzimas necessárias para as modificações pós-traducionais das proteínas e algumas características das sequências do gene podem impedir sua expressão. No entanto, Saccharomyces cerevisae ainda pode ser mais eficiente que bactérias para a expressão de proteínas. Insetos e vírus de insetos (Baculovirus): são vírus de DNA genômico dupla fi ta. Infectam larvas, matando-as e transformando-as em fábricas para a produção de vírus. Duas proteínas nesse genoma, p10 e polyhedrin, não são necessárias para a produção de vírus e podem ser substituídas pelo gene da proteínas heteróloga. Essa pode ter uma superexpressão resultando em até 25% das proteínas totais no fi nal do ciclo de infecção. Bacmids são grandes DNAs circulares que incluem genomas totais de baculovírus junto com sequências que permitem a replicação dele em E.coli. O gene de interesse é clonado em um plasmídeo menor e combinado com o plasmídeo maior por recombinação sítio-específica in vivo. O bacmid recombinante é isolado e transfectado em células de inseto. Baculovírus não são bem sucedidos com todas as proteínas, no entanto, produzem proteínas eucarióticas corretamente modificadas. Células de mamíferos em cultura: genes clonados são introduzidos nessas células por vírus, sendo clonado para ser controlado por um promotor viral. O vírus usa seu mecanismo natural de infecção, introduzindo o genoma recombinante nas células. As proteínas podem ser expressas de maneira transiente (se o DNA viral estiver separado do genoma da célula hospedeira) ou permanentemente (DNA viral integrado no genoma do hospedeiro). Modifi cacoes pós-traducionais podem ser garantidas com a escolha correta da célula hospedeira. Essa estratégia é mais cara e usada para testar a função da proteína in vivo, ao invés de ter como objetivo a produção em larga escala da mesma. Alterações de genes clonados produz proteínas alteradas Mutagênese sítio-dirigida: mudança de um aminoácido na proteína para verificar alterações de estrutura, dobramento e atividade. Pode ser realizado pelo corte com uma enzima de restrição e substituição de um segmento por DNA sintético. Se não houver um sítio de restrição, pode ser realizada a mutagênese oligonucleotídeo-dirigida. O gene clonado é desnaturado, separando as duas fitas. Duas sequências complementares, cada uma com a mudança de base desejada, são aneladas a fitas opostas do DNA clonado (a falta de combinação em uma base em 30-40 pb não impede o apelamento). Ciclos de amplificação seletiva são realizador até que o DNA contendo a mutação seja predominante na população. Se necessário, o DNA sem a mutação pode ser removido pela enzima de restrição DpnI. O DNA molde tem um resíduo A metilado em cada cópia do palíndromo GATC. O DNA novo com a mutação não possui essa metilação, pois veio de uma replicação in vitro. DpnI cliva o DNA na sequência GATC somente se ela estiver mutilada, assim fragmenta somente o DNA molde sem a mutação. Partes de dois genes diferentes podem ser ligadas para criar novas combinações, gerando proteínas de fusão. Tags terminais fornecem “alças” para purificação por afinidade O gene que codifica a proteína alvo pode ser ligado ao gene que codifica um peptídeo ou proteína que liga a um composto simple e estável com alta afinidade e especificidade. Esse peptídeo ou proteína é chamado de tag (marcador) e pode ser adicionado nos terminais amino ou carboxi das proteínas alvo. - GST: glutationa-S-transferase (pequena enzima) se liga a glutationa que estará imobilizada na matriz (beads de agarose, por exemplo) da coluna de cromatografi a. O extrato de proteínas total obtido das células hospedeiras do vetor de expressão (bactérias, por exemplo) é passado pela coluna. A proteína alvo que está ligada a GST fi ca imobilizada na coluna pela ligação à glutationa. As proteínas que não são de interesse passam pela coluna e são descartadas. Para recuperar a proteína alvo ligada à coluna é possível fazer uma eluição com sais livres ou glutationa livre que compete com a da matriz pela ligação com a GST. - His-tag: sequência de seis ou mais resíduos de histidina que ligam especifi camente a íons de níquel. A tag pode ser removida parcial ou completamente por kits comerciais com uma protease que cliva próximo a tag na proteína alvo. PCR pode ser adaptada para clonagem conveniente DNA adicional pode ser adicionado em um segmento amplificado pelo desenho diferenciado dos primers usados na reação. Assim, sítios de restrição podem ser adicionados para facilitar a clonagem subsequente do DNA amplificado. RT-PCR: PCR de transcriptase reversa. Pode ser utilizado para amplifi car sequências de RNA utilizando a enzima transcriptase reversa que utiliza o RNA molde para a produção de DNA no primeiro ciclo de reação. A partir dele, os outros ciclos são realizados com DNA polimerase. PCR quantitativo (qPCR) ou real-time: estima a quantidade de cópias relativa de uma determinada sequência em uma amostra. O PCR é realizado com probes fl uorescentes que se ligam na sequência de interessse. RT-PCR e qPCR podem ser utilizados em conjunto para determinar a quantidade relativa de um mRNA específico em uma célula, podendo, então, monitorar a expressão desse gene. USANDO MÉTODOS BASEADOS EM DNA PARA ENTENDER FUNÇÕES DE PROTEÍNAS Função fenotípica: descreve o efeito da proteína no organismo como um todo. Função celular: descrição da rede de interações da qual a proteína participa, ajudando a defi nir a quais tipos de processos metabólicos a proteína está relacionada. Função molecular: atividade bioquímica precisa da proteína, como quais reações a enzima catalisa ou com quais ligantes um receptor interage. Métodos baseados em DNA podem fornecer informações nos três níveis descritos acima, determinando quando uma proteína é expressada, com que outras proteínas ela pode estar relacionada, sua localização na célula e o que acontece com a célula quando a proteína não está presente. Bibliotecas de DNA são catálogos especializados de informação genética Uma biblioteca de DNA é uma coleção de clones de DNA, usada para descobrir novos genesou determinar a função dele e de proteínas. Biblioteca genômica: a maior, produzida quando o genoma completo de um organismo é clivado em milhares de fragmentos e eles são clonados em vetores individuais. Isso se dá pela digestão do DNA com endonucleases de restrição, obtendo fragmentos de tamanhos específi cos para serem clonados em vetores BAC e YAC (fragmentos de tamanhos não desejados são removidos por eletroforese ou centrifugação). A mistura de fragmentos de DNA ligados em vetores é transformada em células de bactéria ou levedura, depois cultivadas e cada colônia representa um clone com um fragmento específi co do genoma. Biblioteca de cDNA: para estudar a expressão gênica. Os mRNAs são extraídos de um organismo, ou células especifi cas de um organismo e transformados em cDNA pela transcriptase reversa. Os fragmentos de DNA de dupla fi ta resultantes são inseridos em vetores e clonados. Relações estruturais ou de sequência fornecem informações sobre a função de proteínas Genômica comparativa: banco de dados genômico usado para comparar genomas e associar funções de genes. Biologia evolutiva. Novos genes são relacionados por homologia de sequência com genes já conhecidos na mesma ou em diferentes espécies Genes ortólogos: em diferentes espécies mas têm uma relação de sequência e de função clara. Genes parálogos: similares entre si em uma mesma espécie. Sintenia: ordem de genes conservada em um cromossomo em espécies relacionadas. Motivos estruturais: sequências de aminoácidos associadas com funções moleculares como, por exemplo, hidrólise de ATP, ligação ao DNA, formação de complexo com íons zinco. Sequências conservadas em sítios ativos enzimáticos são tipicamente associadas com a função catalítica de enzimas. Com o conhecimento do mecanismo de reação da enzima, é possível desenvolver novos agentes farmacêuticos que possam inibir essa enzima, por exemplo. Proteínas de fusão e imunofluorescência podem revelar a localização de proteínas na célula A localização de um produto de um gene pode ajudar a indicar sua função. A fusão de proteínas marcadores/genes reporter à proteína alvo do estudo fazem possível sua visualização na célula. GFP: proteína verde fl uorescente. A excitação do fl uoróforo para a geração de luz é autocatalítica e não necessita nenhum cofator além do oxigênio molecular. Realizando a fusão com a proteína-alvo, ela pode mostrar a localização dela na célula e, ainda, interação com outras proteínas que podem ser marcadas com fl uoróforo de cores diferentes. Imunofluorescência: visualização da proteína endógena, sem alterações. Necessita fi xação e, consequentemente, morte da célula. Pode ser usado um anticorpo primário que se liga à proteína alvo, com um anticorpo secundário marcado com fl uorocromos para revelar a localização da proteína. Outro método que pode ser empregado é realizar a fusão da proteína alvo com um marcador epítopo, uma sequência pequena que é reconhecida por um anticorpo bem caracterizado e comercialmente disponível. Em seguida, outro anticorpo com fluorocromos se liga especificamente ao primeiro. Uma outra abordagem é a ligação de moléculas de biotina ao primeiro anticorpo, e então adicionar estreptavidina (proteína que liga biotina) complexada com fluorocromos. Em todos os casos, a visualização microscópica da célula permite ver focos de luz que revelam a localização da proteína na célula. Interações proteína-proteína podem ajudar a elucidar a função proteica Imunoprecipitação/Cromatografia pro afinidade: a partir da fusão do gene que codifi ca a proteína alvo com o gene de um marcador epítopo, pode-se precipitar o produto proteico complexando-o com um anticorpo que se liga ao epítopo. Se a proteína marcada é expressa nas células, outras proteínas que interagem com ela vão ser precipitadas em conjunto. Um extrato dessas células é passado em uma coluna contendo o anticorpo imobilizado. A proteína marcada com o epítopo se liga ao anticorpo e proteínas que interagem com ela podem ficar retidas também na coluna. A ligação entre proteína e o epítopo pode ser clivada por uma protease e os complexos proteicos então eluídos para serem analisados. Purificação por afinidade em tandem (TAP): dois marcadores consecutivos são fusionados à proteína-alvo e a proteína de fusão é expressa em uma célula. O primeiro marcador é a proteína, que se liga fortemente a IgG de mamíferos. O segundo marcador é, geralmente, um peptídeo ligador de calmodulina. Um extrato proteico contendo a proteína de fusão marcada-TAP é passada em uma matriz em coluna com anticorpos IgG ligados. A proteína-alvo e outras que interagem com elas ficarão retidas na coluna. O primeiro marcador é clivado com TEV protease e a proteína-alvo com o segundo marcador e as proteínas complexada a ela são eluídas da coluna. O eluente é, então, passado em uma segunda coluna que possui calmodulina ligada a ela. Proteínas fracamente ligadas à proteína-alvo são lavadas. O segundo marcador é também clivado e a proteína-alvo com as proteínas associadas à ela são eluídas. Análise duplo-híbrido em leveduras: a proteína Gal4 ativa a transcrição de genes GAL (metabolismo de galactose). Ela possui dois domínios: um se liga especifi camente a sequência de DNA e outro ativa a RNA polimerase para transcrever o gene adjacente. Esses dois domínios são estáveis separados, mas a ativação da RNA polimerase necessita da interação com o domínio de ativação que, por sua vez, precisa do posicionamento pelo domínio que se liga ao DNA. Os genes que codificam as proteínas a serem analisadas são fusionados aos genes de leveduras do domínio que se liga ao DNA ou ao domínio de ativação da RNA polimerase. Se uma proteína fusionada ao domínio de ligação ao DNA interage com a proteína fusionada com o domínio de ativação, a transcricao de um gene repórter é ativada. Microarranjo de DNA revela padrões de expressão de RNA e outras informações Screening rápido e simultâneo de milhares de genes. Segmentos de genes de sequência conhecida de algumas dezenas até centenas de pares de base sintetizados diretamente em uma superfície sólida por fotolitografia. Milhares de sequencias ocupam um spot de uma superfície. Após essa construção, pode-se usar mRNAs ou cDNAs como probes para verificar quais genes estão sendo expressos por uma célula. Os mRNAs são convertidos em cDNA usando desoxirribonucleotídeos marcados fluorescentemente. Se estiver comparando expressão em dois estágios diferentes de uma célula, cada conjunto pode ser marcado com uma molécula que fluoresce na cor vermelha e outra verde. Assim, as diferenças de expressão podem ser visualizadas e se o mesmo gene estiver expresso com a mesma intensidade nos dois estágios, uma fluorescência amarela será vista. Inativando ou alterando um gene com CRISPR para revelar sua função CRISPR - clustered, regularly interspaced short palindromic repeats (repetições curtas palindrômicas, regularmente espaçadas e aglomeradas) no genoma bacteriano. As sequências CRISPR e a nuclease Cas fazem parte de um tipo de sistema imune que evoluiu para permitir a sobrevivência de bactérias em infecções por bacteriófagos. As sequências CRISPR são transcritas em RNA e sequências virais espaçadoras (entre as CRISPR) são clivadas para formar RNAs guia (gRNAs), que incluem algum RNA de repetição adjacente. Um gRNA forma um complexo com um ou mais proteínas Cas e, em alguns casos, com outro RNA chamado de RNA CRISPR transativador (tracrRNA). Esse complexo resultante se liga especificamente ao DNA do bacteriófago invasor, clivando-o e destruindo-o pelas atividades de nuclease da proteína Cas. sgRNA - gRNA e tracrRNA fusionados em um único RNA guia (single guide RNA). A sequência guia pode ser alterada para ter como alvo quase qualquer sequência genômica. Necessário para parear com a sequência alvo no DNA e para ativar os domínios nuclease para clivagem. A proteína Cas9 possui dois domínios nuclease separados:um cliva a fita de DNA pareada com o sgRNA, e o outro cliva a fita oposta do DNA. Inativando um desses domínios cria uma enzima que cliva somente uma fita, formando uma quebra de fita simples. Plasmídeos expressando a proteína necessária e os componentes de RNA do sistema CRISPR/Cas9 podem ser introduzidos nas células por eletroporação. Se o objetivo for provocar uma mutação ao invés da inativação de um gene, ela pode ser introduzida por recombinação quando um fragmento de DNA (com a mudança necessária) próximo ao sítio de clivagem entra na célula com os plasmídeos CRISPR/Cas9.