Baixe o app para aproveitar ainda mais
Prévia do material em texto
Curso de Ciências Biológicas Disciplina 2418 – Biologia Molecular Prof. Fernando A. Tcacenco A P O S T I L A 2 0 1 4 Índices para catálogo sistemático: 1. Biologia molecular 578.88 2. Genética molecular 574.873 28 3. DNA recombinante: Engenharia genética: Biotecnologia 660.65 Tcacenco, Fernando Adami Biologia Molecular: Apostila de Aula / Fernando Adami Tcacenco. Itajaí, SC: [s.n.], 2014, 218 p. (UNIVALI – Universidade do Vale do Itajaí, Curso de Ciências Biológicas, Disciplina 2418 – Biologia Molecular). 1. Biologia Molecular 2. DNA Recombinante 3. Engenharia Genética I. Tcacenco, F. A. II. Título DD II SS CC II PP LL II NN AA 22 44 11 88 -- BB II OO LL OO GG II AA MM OO LL EE CC UU LL AA RR 22 00 11 44 S U M Á R I O UNIDADE ZERO: VISÃO/REVISÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 UNIDADE 1: MATERIAL GENÉTICO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 Guia de estudos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 DNA ou proteína . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Características essenciais do material genético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Os experimentos clássicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 RNA como material genético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Os componentes das cadeias de DNA e RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 Porque o DNA é usado como material genético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Estrutura do DNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 Genes e a informação biológica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 Genomas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 Óperons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 Íntrons e éxons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 UNIDADE 2: REPLICAÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Guia de estudos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Replicação do DNA e os experimentos de Meselson-Stahl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 A origem e a bidirecionalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 As DNA polimerases de E. coli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 Os nove mandamentos da replicação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 Correção de erros: atividade de exonuclease . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 Replicação nos eucariontes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 Replicação do final dos cromossomas: telomerase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 UNIDADE 3: TRANSCRIÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 Guia de estudos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 Síntese dos RNAs e tipos de moléculas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 Visão geral da transcrição em Escherichia coli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 Os dez mandamentos da transcrição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 As RNAs polimerases de procariontes e eucariontes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 O RNA mensageiro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 A iniciação da transcrição de mRNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 O alongamento da cadeia de mRNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 A terminação da transcrição de mRNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 Os processamentos dos mRNAs de eucariontes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 O RNA ribossômico e os ribossomos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 O RNA transportador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 UNIDADE 4: TRADUÇÃO. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 Guia de estudos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 O código genético: descoberta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 O código genético: características . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 Tradução: uma visão geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 Os atores e os passos da tradução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 Síntese protéica: reconhecimento do códon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 Síntese protéica: translocações e finalização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 Tradução em eucariontes: particularidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 Acoplamentotranscrição/tradução e tradução simultânea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 Príons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 UNIDADE 5: O CONTROLE DA EXPRESSÃO GÊNICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 Guia de estudos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 Controle: porque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 Estrutura e domínios comuns . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 Regulação positiva e negativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 O óperon da lactose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 O óperon do triptofano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 Controle envolvendo ribossomos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 Resposta SOS e RNA antisentido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 Controle em eucariontes: particularidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 Controle da transcrição: ativadores e outras moléculas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 Controle por estabilidade do DNA e por interferência por RNAi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 Controle na tradução e elementos de resposta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 Controle do desenvolvimento: Drosophila . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 UNIDADE 6: MUTAÇÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 Categorias de mutações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 Mutações para a frente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 Mutações reversas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 Mutações supressoras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 Causas de mutações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 Correção de mutações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 Estudo de caso: fibrose cística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 i UNIDADE 7: GENOMAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 Vírus: as formas mais simples de vida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 Genomas procarióticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 Genomas eucarióticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 Genomas de organelas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 UNIDADE 8.1: TECNOLOGIA DO DNA RECOMBINANTE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 UNIDADE 8.2: ENZIMAS DE RESTRIÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 Dry-Lab 9.1: Fazendo DNA recombinante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 Dry-Lab 9.2: Fazendo plasmídios recombinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 UNIDADE 8.3: BIBLIOTECAS DE DNA E DE cDNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 Dry-Lab 9.3: Montando bibliotecas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 UNIDADE 8.4: VETORES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 UNIDADE 8.5: HIBRIDIZAÇÕES - SONDAS E BLOTS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 Demo 9.4: Montando um Southern blot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 UNIDADE 8.6: ANÁLISE DE EXPRESSÃO GÊNICA DIFERENCIAL . . . . . . . . . . . . . . . . . . . . . . . . . . 135 Dry-Lab 9.5: Fazendo diagnóstico por biochips. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 UNIDADE 8.7: MARCAÇÃO DE SONDAS E CORANTES PARA DNA . . . . . . . . . . . . . . . . . . . . . . . . . 144 UNIDADE 8.8: SÍNTESE QUÍMICA DE DNA IN VITRO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 UNIDADE 8.9: SEQÜENCIAMENTO DE DNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 Dry-Lab 9.6: Fazendo seqüenciamento por M&G . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 Dry-Lab 9.7: Fazendo seqüenciamento por didesoxi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 UNIDADE 8.10: OS PROJETOS “OMA” & DERIVADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 UNIDADE 8.11: AMPLIFICAÇÃO DE DNA – PCR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 Dry-Lab 9.8: Fazendo uma PCR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 Demo 9.9: Uso do termociclador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 UNIDADE 8.12: MARCADORES MOLECULARES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174 Dry-Lab 9.10: Fazendo um RFLP em plantas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 UNIDADE 8.13: ANÁLISE FORENSE DE DNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188 UNIDADE 8.14: TRANSFORMAÇÃO GENÉTICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 Dry-Lab 9.11: Kits de verificação de transgeníase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 UNIDADE 8.15: TERAPIA ANTISENSO E VACINAS DE DNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 Demo 9.12: DNA anti-senso . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208 UNIDADE 8.16: MUTAGÊNESE SÍTIO-DIRIGIDA/GENÉTICA REVERSA . . . . . . . . . . . . . . . . . . . . . 209 UNIDADE 8.17: EXTRAÇÃO E VISUALIZAÇÃO DE ÁCIDOS NUCLÉICOS . . . . . . . . . . . . . . . . . . . 210 Demo 9.13: Eletroforese de ácidos nucléicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218 Demo 9.14: Kits de extração de DNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218 ii O DNA é talvez uma das moléculas mais populares nos dias de hoje. Se não a sua estrutura – complexa, às vezes - pelo menos a sua abreviatura. E isto ficou ainda mais patente depois dos famosos “testes de paternidade” na televisão, da clonagem da ovelha “Dolly” e da conclusão do projeto “Genoma Humano”. Nos meios de comunicação, a citação de DNA é cada vez mais frequente, seja associada a eventos positivos - por exemplo: descoberta de novos tratamentos para doenças - seja associada a eventos negativos ou, no mínimo, polêmicos: plantas transgênicas e desastres com identificação de vítimas por teste de DNA são dois exemplos comuns. A Biologia Molecular – disciplina que estuda o DNA em seu âmago - é eclética, no sentido de incorporar conhecimentos de várias áreas da ciência, como Genética Molecular, Bioquímica, e Genômica/Proteômica. Os avanços verificados nas últimas décadas - digamos nas últimas cinco décadas, desde a descoberta da estrutura do DNA em 1953 - a tornam muito dinâmica, e informações estão sendo constantemente adicionadas ao seu cabedal. Difícil se torna, portanto, manter-se atualizado, posto que dia-a-dia novas descobertas são feitas. Um dos objetivos deste material é procurar uma atualização constante, com a incorporação de inovações sempre que possível. Alguns tópicos são aparentemente mais “conservadores”, por exemplo o fluxo da informação - DNA/RNA/Proteína, vale dizer, Replicação/Transcrição/Tradução - já vistos por todos desde o segundo grau e em várias disciplinas de nosso curso, como Genética, Bioquímica e Biologia Celular. No entanto, mesmo nesses tópicos pesquisas têm revelado novas facetas. Por exemplo, algumas DNA polimerases de procariontes já são conhecidas desde 1957, mas outras (IV e V) só foram descobertas no limiar do presente milênio. O Controle da Expressão Gênica é um tópico estudado geralmente em conjunto com o fluxo da informação, mas destaca-se por ser mais “dinâmico”, no sentido de ser objeto de mais pesquisas, já que controlar a expressão gênica é, em última instância, controlar o nascimento, crescimento e morte de um organismo. Outros tópicos são notoriamente “inovativos”, no sentido de não serem sequer mencionados em livros-texto do final da década de 1990. Dentre eles incluem-se os arranjos (chips ou arrays, em inglês) de DNA e o RNA interferente. Este último foi relatado pela primeira vez em 1998, em artigo publicado na revista Nature (Fire A., Xu S.Q., Montgomery M.K., Kostas S.A., Driver S.E., Mello C.C. Potent and specific genetic interference by double-stranded RNA in Caenorhabditis elegans. Nature 1998; 391:806-811), e já em 2006 rendeu a seus autores o Prêmio Nobel de Medicina pela relevância para a ciência, em particular para a medicina molecular. A Fundação Nobel relata que esses pesquisadores “descobriram um mecanismo para controlar o fluxo de informação genética”, já que a interferência de RNA destrói alguns RNA mensageiros, impedindo a síntese de proteínas, o que equivale a “desligar” os genes que produziram aquelas mensagens. Também no rol dos Prêmios Nobel ligados à nossa área está o de 2007, concedido a Mario R. Capecchi, Martin J. Evans e Oliver Smithies, pelas suas descobertas referentes ao nocaute de genes, uma dinâmica área ligada à terapia gênica. Na organização da disciplina, faremos inicialmente uma abordagem geral de todos os tópicos, para posteriormente entrarmos em detalhes sobre cada um deles. Estrutura do DNA e Replicação serão os primeiros tópicos vistos em detalhes, posto que muitas técnicas e métodos requerem esses conhecimentos básicos. Alguns conceitos básicos da organização de genomas em vários organismos também serão abordados. Em seguida, entraremos na unidade denominada “Métodos e Técnicas”, que abordará temas como enzimas de restrição, vetores de clonagem, eletroforese, seqüenciamento de DNA, PCR, marcadores moleculares, DNA forense, organismos transgênicos e outros. Finalmente, serão abordados os outros aspectos do fluxo da informação (Transcrição - Tradução - Controle da Expressão), bem como uma visão simplificada sobre Mutações. Para mais bem situarmos o acadêmico no contexto da biologia molecular, vamos listar, nas páginas seguintes, algumas das conquistas de Prêmios Nobel obtidas por cientistas nas áreas afetas à nossa disciplina (Medicina, Fisiologia e Química). Também faremos, a partir de uma publicação científica, o perfil de um projeto de pesquisa envolvendo biologia molecular, para que o acadêmico possa vislumbrar campos de aplicação dos conhecimentos adquiridos. VISÃO/REVISÃO – 1 CONTEÚDO E ORGANIZAÇÃO DA DISCIPLINA CONTEXTUALIZAÇÃO: SELEÇÃO DE PROMOTORES PARA TRANSFORMAÇÃO VEGETAL I. CONSTRUÇÃO DA BIBLIOTECA GENÔMICA Extração do DNA genômico de folhas Digestão com enzima de restrição Eletroforese e seleção por tamanho (10-23kb) Eluição e purificação Construção de biblioteca genômica em vetor lambda II. PREPARO DE SONDA DE cDNA Extração de RNA de folhas Seleção de mRNA por colunas oligo-dT Síntese da primeira fita de cDNA Marcação do cDNA (sonda) com α32P-dCTP III. SONDAGEM DA BIBLIOTECA GENÔMICA Plaqueamento da biblioteca genômica Transferência para membrana Sondagem da biblioteca com cDNA marcado RESULTADO: SELEÇÃO DE 12 CLONES POSITIVOS ANÁLISE DE SOUTHERN Digestão de DNA genômico dos 12 clones selecionados em III com várias E.R. Eletroforese, transferência de Southern e sondagem com sondas de cDNA derivadas de mRNA RESULTADO: CLONES POSITIVOS DEVEM CONTER GENES ALTAMENTE EXPRESSOS E SÃO CANDIDATOS PARA O ISOLAMENTO DOS PROMOTORES CONSTRUÇÃO E SONDAGEM DE BIBLIOTECA DE cDNA DE FOLHAS Seleção de mRNA de folhas e síntese de cDNA Construção de biblioteca de cDNA Sondagem com fragmentos de restrição marcados (sondas de cDNA) ISOLAMENTO E SEQÜENCIAMENTO DE cDNAs POSITIVOS Clonagem em vetor de seqüenciamento pBluescript SK Seqüenciamento por didesoxi marcado com Rhodamina, usando seqüenciador automático ABI 377 RESULTADOS: ALGUNS SEGMENTOS RELACIONADOS COM GENES DE FATORES DE ALONGAMENTO, TUBULINA, AQUAPORINA, E PROTEÍNA RICA EM PROLINA ANÁLISE DE NORTHERN Eletroforese de RNA de raízes, caules e folhas Transferência de northern Hibridização com sondas de cDNA RESULTADO: ALGUNS CLONES ACUMULARAM MAIS RNA MENSAGEIRO EM FOLHAS, OU EM CAULES, ETC... MOSTRANDO ONDE SÃO MAIS ALTAMENTE EXPRESSOS ISOLAMENTO, IDENTIFICAÇÃO E CARACTERIZAÇÃO DE DOIS GENES Busca por genes completos, com extremidades 3´ e 5´, mais regiões promotoras, através do seqüenciamento de clones positivos, alinhamento de seqüências parciais com overlapping e comparação com bancos de genes conhecidos RESULTADOS : QUATRO CLONES GENÔMICOS ENCONTRADOS Características da região promotora (1,8-kb) de um vetor com 8-kb: Box TATAAA localizado a -172 bp do códon de iniciação ATG e mais uma seqüência 5´-CCATC (provavelmente um CAAT box) 37 bp acima do box TATA Características de um outro vetor seqüenciado (correspondente a outro gene) de vetor com 9-kb: Correspondência de 100% com gene conhecido do milho Presença de dois íntrons com os característicos GT e AG nosextremos Início da transcrição localizado por análise de extensão de primer e seqüenciamento, indicando que o sítio de início da transcrição está situado 130 bp acima do sítio de início da tradução Presença de box TATA 33 bp acima do sítio de início da transcrição, e CAAT box mais 40 bp acima CONSTRUÇÃO DE PLASMÍDIOS COM PROMOTORES Substituição do promotor CaMV 35S por promotores-teste Construção dos plasmídios de substituição TRANSFORMAÇÃO POR MICROBOMBARDEAMENTO Transformação de calos com cada um dos promotores selecionados na etapa anterior (tungstênio, 0,7 µm; pressão de hélio de 0,6 Mpa (90 psi) ENSAIO PARA ATIVIDADE DOS PROMOTORES Verificação da expressão do gene repórter GUS (azul) [uso do gene repórter para antocianina (vermelho) como controle] RESULTADOS: OS NOVOS PROMOTORES MOSTRATAM ALTOS NÍVEIS DE EXPRESSÃO, INDICANDO SUA UTILIDADE NA CONSTRUÇÃO DE VETORES PARA TRANSFORMAÇÃO DE CANA-DE-AÇÚCAR COM GENES DE INTERESSE CONTROLE Uso de sondas de RNA poliA (-) para eliminar clones que se hibridizaram a rRNA ou outro RNA repetitivo Nesta publicação, exemplificando a aplicação de técnicas moleculares para a localização de promotores eficientes para a transformação genética de cana-de-açúcar, os autores aplicaram técnicas como construção de bibliotecas, uso de enzimas de restrição, preparo de sondas, seqüenciamento, Southern e northern blots, comparação de sequências em bancos de genes, dentre outras, nos seguintes passos: (1) Inicialmente, mRNA de tecidos específicos foi usado como sonda para escrutinar uma biblioteca genômica fágica. (2) Após, a região codificante desses clones foi identificada por análise de Southern de clones de DNA do fago lambda digerido com enzima de restrição; foi utilizada a primeira fita do cDNA como sonda, e os clones correspondentes foram isolados da biblioteca de cDNA. (3) O número de cópias de cada gene foi estimado por análise de Southern e o nível de expressão foi confirmado por análise de northern. (4) Por último, os promotores foram caracterizados por seqüenciamento do cDNA e dos clones genômicos, bem como por busca no GenBank, análise de extensão de iniciadores, e análise de expressão transiente. Cinco genes em particular se sobressaíram, e dois deles foram subclonados: SEF1-alfa (Fator de elongação 1-alfa) e SPRP1 (Proteína rica em prolina 1). A introdução e expressão de seus promotores fundidos ao gene da beta-glucoronidase (GUS) resultou em altos níveis de expressão tanto em cana de açúcar quanto em trigo. Essa estratégia pode ajudar a encontrar novos promotores para alta expressão de transgenes em cana ou outras monocotiledôneas para as quais ainda não se tem bons promotores. (1) Inicialmente, mRNA de tecidos específicos foi usado como sonda para escrutinar uma biblioteca genômica fágica. (2) Após, a região codificante desses clones foi identificada por análise de Southern de clones de DNA do fago lambda digerido com enzima de restrição; foi utilizada a primeira fita do cDNA como sonda, e os clones correspondentes foram isolados da biblioteca de cDNA. (3) O número de cópias de cada gene foi estimado por análise de Southern e o nível de expressão foi confirmado por análise de Northern. (4) Por último, os promotores foram caracterizados por seqüenciamento do cDNA e dos clones genômicos, bem como por busca no GenBank, análise de extensão de iniciadores, e análise de expressão transiente. Como resultado, cinco genes em particular se sobressaíram, e dois deles foram subclonados: SEF1-alfa (Fator de elongação 1-alfa) e SPRP1 (Proteína rica em prolina 1). A introdução e expressão de seus promotores fundidos ao gene da beta-glucoronidase (GUS) resultou em altos níveis de expressão tanto em cana de açúcar quanto em trigo. Essa estratégia pode ajudar a encontrar novos promotores para alta expressão de transgenes em cana ou outras monocotiledôneas para as quais ainda não se tem bons promotores. A seguir, um esquema dos passos experimentais adotados: VISÃO/REVISÃO – 2 PORQUE O DNA É O MATERIAL GENÉTICO “PREFERIDO”? COMPOSIÇÃO DO DNA/DUPLA HÉLICE A história do material genético remonta do século XIX (1833), quando o núcleo celular foi descrito por Brown. Alguns anos depois, em 1839, Shleiden e Schwan propõem a teoria celular. O famoso trabalho de herança genética realizado por Mendel foi inicialmente publicado em 1866, e três anos depois (1869) Miescher descobre a “nucleína” em núcleos de glóbulos brancos. Demonstrou-se posteriormente que a “nucleína” era na verdade composta por uma fração protéica e outra ácida, denominada de “ácido nucléico”. No entanto, somente alguns anos depois, no final do século, é que se passa a aceitar que o núcleo é o sítio físico onde se encontra o material genético, fato confirmado definitivamente em 1924. Na virada do século XIX, Albrecht Kossel descobre as bases nitrogenadas do DNA, e por volta de 1930 verifica-se que os ácidos nucléicos podem ser tanto ribonucléicos (RNA) quanto desoxiribonucléicos (DNA). A descoberta da estrutura tridimensional do DNA, em 1953, por Watson e Crick, foi um marco decisivo na história do material genético. Alguns anos depois, é descoberto o modo de atuação das enzimas de restrição, dando grande impulso à tecnologia do DNA recombinante e engenharia genética. Muitas são as características que fazem do DNA o material genético por excelência. Antes de listá-las, vamos dar uma olhada nas funções, ou características essenciais, que uma molécula deve possuir para que ela possa servir como material genético: • Estabilidade física e química de tal forma a não perder informação com o passar do tempo, mas: variação por mutação, para permitir a evolução e especiação • Grande variedade de formas, ligadas às múltiplas funções em um organismo, e portanto: habilidade de estocar grande quantidade de informação e de expressá-la nas células quando necessário • Habilidade de transferir a informação para células-filhas, através da: replicação de sua própria estrutura O DNA, melhor do que qualquer outra molécula orgânica (RNA, proteínas, açúcares, ...) desempenha bem esse papel posto que ele apresenta: •Estabilidade: O esqueleto de açúcar-fosfato é extremamente estável As ligações C-C no açúcar são resistentes ao ataque químico, exceto por ácidos sob altas temperaturas A ligação fosfodiéster é um pouco menos estável e pode ser hidrolizada a temperatura ambiente, sob pH 2 Nota: no RNA, a presença do OH extra no C 2’ facilita a hidrólise, e portanto o RNA é menos estável: organismos que usam o RNA como material genético precisam protegê-lo com uma capa protéica As bases também são bastante estáveis (exceto C, que se desamina para U, que pareia com A e não com G) •Segurança: A molécula é redundante, de tal forma que uma cópia pode servir como modelo para possíveis correções de erros; a dupla hélice também forma um ambiente hidrofóbico, de tal forma que a água é excluída e as bases e pontes de H sofrem pouco ataque Uma série de experimentos, iniciados por volta de 1930 pelo médico Griffith, definiu que o DNA é o material genético na maioria dos organismos, mas que alguns, particularmente vírus, apresentam o RNA como material genético. A dupla hélice de DNA é composta por um esqueleto açúcar-fosfato, que guarda as quatro bases nitrogenadas (A, T, G, C) no seu interior, protegendo-as do ambiente. Devido ao modo de arranjo das duas fitas, a polaridade de cada um dos nucleotídeos é invertida (5´-3´ e 3´-5´). No RNA, o açúcar é uma ribose, enquanto que no DNA o açúcar é uma desoxirribose, que perdeu a hidroxila do carbono 2. O ácido fosfórico Ligado ao carbono 5’ do açúcar; até três se ligam: , , e , servindo como fonte de energia para a formação da cadeia de DNA No ácido nucléico,o carbono forma uma ligação fosfodiéster, fazendo uma ponte entre dois açúcares adjacentes O H RNA 1´ 3´ 2´ 4´ 5´ O H O açúcar Uma pentose (5 átomos de carbono) na forma estrutural de Haworth. Note a numeração dos carbonos: 1´, 2´, 3´, 4´ e´5´ No DNA, a 2’-desoxirribose é uma estrutura padrão da ribose onde o 2’OH foi substituído por um H; no RNA, ambas hidroxilas permanecem As bases Podem ser purinas (Adenina e Guanina), com dois anéis, ou pirimidinas (Citosina ou Timidina), com apenas um anel; no RNA, uma terceira pirimidina, Uracila, é encontrada 5 ` 5 `3 ` 3 ` O O H O O O H O V I S Ã O / R E V I S Ã O Um nucleotídeo: Base + Açúcar + P VISÃO/REVISÃO – 3 REPLICAÇÃO O DOGMA CENTRAL O “Dogma Central” de Crick, proposto em 1958, postula que a informação biológica é primeiro transferida ao RNA e depois à proteína. O dogma também postulava que havia apenas uma direção nesse processo, e que o RNA não poderia orientar a síntese de DNA. Esta afirmativa foi provada errada em 1970, quando Temin e Baltimore descobriram que alguns vírus transmitem a informação do RNA para o DNA. Pela sua descoberta, Baltimore, Temim e Renato Dulbecco receberam o Prêmio Nobel de Medicina de 1975. A descoberta da transcriptase reversa foi, na época, considerada uma heresia, já que contrariava o Dogma Central proposto por Crick. Independentemente dessa incorreção, a transmissão da informação na maioria dos organismos ainda vai de DNA para RNA para proteína. A REPLICAÇÃO é um processo que ocorre sempre que a célula ou o organismo se divide, independentemente da transcrição ou tradução. A passagem de DNA para RNA se chama TRANSCRIÇÃO, enquanto que a passagem de RNA para proteína se chama TRADUÇÃO. A replicação é um processo essencial para que haja a multiplicação celular, já que as células-filhas precisam receber a informação genética. Ele parte de uma cadeia dupla de DNA para gerar duas novas cadeias duplas de DNA de um modo semi-conservativo: cada cadeia-filha contém metade da cadeia- mãe e metade recém-sintetizada. O processo é gerido pelas DNA polimerases. Além das DNA polimerases, várias outras enzimas participam do processo. Na figura ao lado, é apresentada uma visão geral da replicação. Note que, devido à polaridade inversa dos dois polinucleotídeos, e ao fato que a polimerização ocorre apenas no sentido 5´- 3´, uma das fitas deve ser “enrolada” na DNA polimerase. Os esquemas abaixo e ao lado representam alguns dos passos essenciais na replicação, tanto em procariontes quanto em eucariontes. DNA RNA Proteína 5 ´ 3 ´ 3 ´ 5 ´ 2 – Abertura das fitas nas duas direções, formando duas forquilhas de replicação por origem (uma em procariontes, várias em eucariontes), e manutenção das fitas abertas evitando a re-formação das pontes 3 – Colocação dos iniciadores, uma vez que as DNA polimerases são incapazes de iniciar a síntese; a enzima primase é uma RNA polimerase, e portanto o iniciador é de RNA e não DNA 4 – Remoção da torção à frente das forquilhas, por ação de topoisomerase da DNA girase; essa torção é resultado da deshelicoidização da dupla hélice nas forquilhas, e impõe uma restrição física à continuidade do processo 9 – Separação dos concatâmeros de DNA (procariontes) ou síntese dos telômeros, histonas e outras proteínas associadas ao DNA (eucariontes), permitindo a finalização do processo 8 – União dos fragmentos de Okazaki, pela DNA ligase; os fragmentos são formados em ambas as fitas e em ambas as direções, nas assim chamadas “fita contínua” e “fita descontínua” (“fita líder” e “fita retardada”) 7 – Remoção dos iniciadores e síntese de DNA no seu lugar, já que os mesmos são de RNA e não de DNA; a remoção se dá por ação de exonuclease 5´- 3´ da DNA polimerase I, no mesmo sentido da síntese do DNA 6 – Correção de erros ocasionados pela colocação de nucleotídeos errados; a correção é constante durante a síntese, e se dá por ação de exonuclease 3´- 5´ das DNA polimerases 1 – Localização da origem de replicação, uma sequência específica, com boxes ricos em As e Ts facilitando a quebra das pontes de hidrogênio 5 – Síntese propria mente dita VISÃO/REVISÃO – 4 TRANSCRIÇÃO A transcrição é o processo que gera um RNA a partir de um DNA, e é o primeiro passo na passagem da informação do material genético para a síntese de proteínas. As principais enzimas responsáveis pelo processo são as chamadas RNA polimerases, e mais uma vez há diferenças entre as enzimas de procariontes e de eucariontes. São gerados três tipos principais de RNAs: mRNA, tRNA e rRNA, cada um com uma função especializada. Em termos gerais, o processo é semelhante à replicação, mas apenas um pequeno segmento de uma fita de DNA é copiado: aquele correspondente ao gene que está sendo transcrito. Uma outra diferença é que o produto da transcrição é uma fita simples de RNA, que se libera do DNA após sintetizada, sendo que o DNA volta a se enrolar ao final do processo. A figura abaixo dá uma visão geral dos eventos que ocorrem na transcrição: 3 ´ 5 ´ RNA polimerase, composta pelas diversas subunidades; a enzima completa ocupa cerca de 100 pares de bases (pb) RNA nascente Híbrido DNA/RNA (cerca de 8 pb) “Bolha” de transcrição compreende cerca de 17 pares de bases (pb) Fita molde (serve de molde para a RNA polimerase) 3 ´ 5 ´ Direção da síntese do RNA e do movimento da bolha O DNA é novamente enrolado nesta extremidade, por ação de topoisomerase O DNA é desenrolado à frente da bolha, por ação de topoisomerase O CÓDIGO GENÉTICO O código genético pode ser definido como o conjunto de regras que ditam a sequência de aminoácidos de uma proteína a partir da sequência de nucleotídeos do mRNA que deu origem a essa proteína. Sua elucidação foi resultado de vários experimentos, e hoje se sabe que ele é composto por 64 códons de três bases, sendo que um dos códons indica o local de início da síntese (e também codifica para o aminoácido metionina) e três são específicos do término da tradução. Assim, existem 61 códons que codificam para aminoácidos; como há apenas 20 aminoácidos, então muitos deles são codificados por mais de um códon, sendo portanto o código genético denominado de “redundante”. Essa redundância permite o agrupamento dos códons em “famílias”; por exemplo, a valina é codificada por uma família de quatro membros: GUU, GUC, GUA e GUG. Olhando as características dessa família, percebe-se que todos os membros tem o mesmo sobrenome (GU), variando apenas no nome final: U, C, A, G. VISÃO/REVISÃO – 5 A síntese é complementar a uma das fitas do DNA, e cerca de 17 pb se encontram abertos em um determinado momento. A bolha de transcrição se move na medida em que o RNA é sintetizado, sendo que o DNA é aberto à frente da bolha e fechado novamente após a transcrição. Isto faz com que o DNA seja rotacionado, conforme demonstram as setas; é importante a ação de topoisomerases neste processo. Parte da RNA polimerase está em contato íntimo com o DNA ainda fechado, à frente da bolha, e o restante com a fita aberta, somando cerca de 100 pb. P A A cadeia polipeptídica já contém três resíduos de aminoácidos desligados de tRNAs, e mais um quarto, ainda ligado ao tRNA O quarto aminoácido ainda está ligado ao seu tRNA, mas já houve a formação da ligação peptídica pela enzima peptidil-transferaseUma nova ligação peptídica, entre os resíduos 4 e 5, forma-se, presumivelmente por ocasião da translocação do complexo para o próximo códon A tradução é o último passo na conversão da informação do DNA para proteína. Ela começa com a montagem do complexo, composto pelas duas subunidades ribossômicas com os seus três “sítios”: A (aminoácido), P (polipeptídeo) e S (saída). Uma vez reconhecido o códon de iniciação, geralmente AUG, conforme visto na tabela do código genético, os tRNAs começam a chegar, em resposta à leitura dos códons pelos ribossomos. Após o início da síntese, a adição de cada novo aminoácido passa por três etapas, envolvendo: (i) a formação de uma ligação peptídica entre o novo aminoácido e a cadeia peptídica; (ii) o rompimento da ligação de alta energia que foi feita durante a aminoacilação do tRNA; e (iii) a translocação de todo o sistema para o próximo códon. O ciclo é repetido várias vezes, até que um códon de finalização seja encontrado. Nos diagramas abaixo, é demonstrada uma translocação do complexo, com a adição do novo aminoácido “5” à proteína em formação. P A S P A 5 3 1 2 3 4 5 6 7 8 5 1 2 3 4 P A S 5 3 1 2 3 4 5 6 7 8 1 2 3 4 5 O quinto aminoácido com o seu tRNA ocupa o sítio A e ainda não está ligado à cadeia O tRNA do terceiro aminoácido agora está livre, ao mesmo tempo em que o quarto passou para o sítio S e em seguida se liberará A ligação entre o quarto aminoácido e seu tRNA rompe-se por hidrólise O próximo tRNA, com o resíduo de aminoácido 6, aproxima-se do sítio A para formar pares de bases com o seu códon P A S P A 5 3 1 2 3 4 5 6 7 8 5 1 2 3 4 As duas subunidades do ribossomo se movem um códon à frente; é possível que esse movimento seja descoordenado, no sentido em que a subunidade maior mova-se antes, deixando um desalinhamento transitório entre os sítios A e P das duas subunidades; a isso, seria seguido o movimento da subunidade menor TRADUÇÃO VISÃO/REVISÃO – 6 CONTROLE DA EXPRESSÃO GÊNICA MUTAÇÕES O que é controlar a expressão gênica? É decidir se: Um gene vai ser transcrito ou não, e em que nível Um determinado mRNA é traduzido ou não, e em que nível Quanto tempo um mRNA deve durar, e quantas vezes ele deve ser traduzido Quanto tempo a proteína deve durar OU: Uma combinação de um ou vários desses fatores Isto para uma determinada célula e/ou um determinado instante e/ou um determinado ambiente, e/ou .... Quem toma a decisão, e como ela é tomada? Primeiro, alguns genes não são regulados, ou são muito pouco Segundo, alguns genes precisam ser “empurrados” – induz a transcrição/tradução Terceiro, alguns genes precisam ser “segurados” – reprime a transcrição/tradução No fundo, são moléculas de ligação ao DNA que ativam ou desativam o processo. Quem são elas? Os ativadores, transativadores, repressores, fatores de transcrição, etc, ... Em que tipos de situação pode ocorrer a regulação – alguns exemplos: 1. um substrato está disponível para ser usado, e então induz a expressão de genes para enzimas que possam utilizá-lo (ex. lactose) 2. um substrato “melhor” está disponível para ser usado, e reprime a utilização do substrato “pior” (ex. glicose versus lactose) 3. uma determinada molécula é produzida, atinge os níveis que são necessários na célula, e então envia um sinal dizendo: “não precisa mais me fazer...” (ex. um aminoácido) 4. uma célula tenta traduzir um mRNA mas não consegue por falta de aminoácidos no meio, e então manda uma mensagem dizendo: “não há aminoácidos disponíveis para traduzir a mensagem, não a faça” 5. para fazer um conjunto (ex. os ribossomos) precisam-se de 1 unidade de cada a, b e c; se fizer 1.000 de a e somente 1 de b e c, sobram 999 destes dois últimos, então mande um sinal dizendo: “não faça mais a”; ou melhor ainda, regule de tal forma que a síntese de a, b e c seja coordenada 6. há erros ocorrendo na replicação do DNA, envie enzimas SOS para reparar os erros 7. há muita necessidade de uma determinada proteína, então aumente o número de duplas-hélices de DNA na região contendo o gene para esta proteína 8. a célula está se intoxicando com um metal pesado, e esse mesmo metal aumenta a transcrição de genes para proteínas que irão seqüestrá-lo do meio, detoxificando as células 9. como fazer com que um ovo de Drosophila recém posto se transforme em uma mosca das frutas? Genes maternais estabelecem gradientes; cada gene produz fatores de transcrição que irão ativar outros genes que produzem outros fatores que ativam outros genes que produzem outros fatores que ativam outros genes (...) que produzem outros fatores que fazem algo importante além de ativar outros genes... (exemplos Bicoid e Nanos controlam Caudal, Pumilio e Hunchback...) Genes de segmentação: estabelecem os segmentos (ex. Fushi-tarazu) – mesma situação acima Quando ocorrem mutações: Erros na replicação Efeito de um mutágeno Mutações na sequência de DNA: Ponto – substitui a por b Inversão – de a-b para b-a Inserção – de a-b para a-x-b Deleção – de a-x-b para a-b Toda a mutação é “visível” (expressa)? Não! Silenciosa – terceira posição de códons redundantes Sentido trocado – na primeira ou segunda posições --- Efeito? Sem sentido – finaliza uma proteína por introduzir códon de finalização Uma mutação pode ser revertida? Sim! Uma segunda mutação no mesmo sítio reverte a primeira (hot spot) Uma segunda mutação em outro sítio do mesmo gene reverte a primeira Uma mutação em um outro gene restaura o fenótipo Quem causa mutações? Mutágenos 5-Bromo-uracil, pareia com A ou G Agentes intercalantes como o brometo de etídio – mudança da matriz de leitura Luz ultra-violeta – dímeros de timina = deleções na replicação do DNA Como reparar as mutações? Excisão de bases, ex. remoção de U (citosina desaminada) do DNA, causando sítio apurínico que precisa ser reparado Mau pareamento – importância da metilação das fitas Excisão de segmentos O que é uma mutação? Em palavras simples, é a mudança na sequência de bases de um segmento de DNA, com a possível – mas não obrigatória... – mudança na composição dos aminoácidos de uma proteína (se a mutação ocorreu em um gene). Qual a diferença entre “mutações” e “recombinações”? A mutação é um evento localizado, geralmente indesejável, e de pequena extensão (mas às vezes grande efeito); já a recombinação é um evento de maior extensão, e envolve a troca (desejável – variação genética) entre material genético de gametas. VISÃO/REVISÃO – 7 TECNOLOGIA DO DNA RECOMBINANTE & TÓPICOS CORRELACIONADOS Ácido Nucléico mRNA isolado ou DNA genômico Transformação/transfecção Introdução do recombinante na célula hospedeira Replicação Obtenção de múltiplas cópias do vetor recombinante Avaliação Identificação do vetor desejado com inserido Isolamento e análise Seqüenciamento Mutagênese in vitro Expressão de proteína Vetor quimérico Corte do DNA do doador e do vetor, e recombinação A CLONAGEM ENVOLVE SETE ETAPAS VITAIS Qualquer estratégia com sucesso de clonagem, independente de sua complexidade geral, emprega um ciclo composto de seis etapas essenciais: (1) Obtenção e preparo de DNA em dupla-fita ou fragmentos de cDNA contendo extremidades5' e 3' compatíveis com sítios criados no interior de vetores de clonagem. (2) Inserção dos fragmentos de DNA em um vetor de clonagem, por associação, e ligação do vetor com as extremidades 3' e 5' do DNA. (3) Introdução do vetor recombinante recém-formado em uma célula hospedeira apropriada. (4) Replicação do vetor recombinante no interior de células hospedeiras. (5) Seleção primária dos vetores recombinantes através de genes repórteres ou de antibióticos. (6) Seleção e expansão de clones individuais de células portadoras dos recombinantes desejáveis. (7) Isolamento e análise dos inseridos de DNA e/ou seus produtos protéicos expressos. Seleção primária Identificação de vetores com inseridos (antibióticos, repórteres) OBTENÇÃO DO DNA O primeiro passo para se fazer DNA recombinante é a obtenção do DNA do organismo doador (aquele que será estudado) e do vetor (aquele que receberá o DNA clonado). O DNA poderá ser genômico, ou convertido em cDNA (DNA complementar) a partir de mRNA. Existem vários métodos de extração de DNA, desde os mais simples, que podem ser realizados inclusive em um ambiente doméstico, até métodos mais complexos, que demandam equipamentos laboratoriais mais sofisticados. A aplicação de um ou outro vai depender, dentre outros fatores, da pureza que se deseja para o DNA a ser obtido. Apesar das diferenças, a maioria dos protocolos seguem três passos: 1 – Rompimento das células e das membranas, o que permite a liberação do DNA. Os agentes mais comuns para a obtenção de lise das membranas são os detergentes. 2 – Separação dos restos celulares, tais como paredes e membranas. 3 – Eliminação de contaminantes, por tratamentos enzimáticos ou químicos, eliminando proteínas, fenóis e outras macromoléculas; se desejável, RNA “contaminante” poderá ser eliminado de preparações de DNA. ELETROFORESE E VISUALIZAÇÃO DO DNA O DNA de diferentes tamanhos e conformações pode ser separado por eletroforese, que é a migração de partículas eletricamente carregadas quando submetidas a um campo elétrico, útil para a separação de proteínas e de ácidos nucléicos. No caso do DNA, que é carregado negativamente por causa do esqueleto contendo resíduos de P negativos, o DNA migra para o pólo positivo; as moléculas menores correm mais rápido. Como suporte utilizam-se géis de agarose, ágar ou poliacrilamida. Para a visualização, o corante mais comum é o brometo de etídio; este corante se intercala entre as bases dos ácidos nucléicos e floresce em laranja quando iluminado por luz ultravioleta. Porém, ele é um mutagênico potente (assim como a luz ultravioleta!), portanto todo o cuidado deve ser tomado. Outros corantes são menos perigosos – por exemplo SyberSafe e nitrato de prata. VISÃO/REVISÃO – 8 A recombinação genética implica a nova combinação de genes, seja de forma natural, por exemplo por reprodução sexual, transfecção ou conjugação, seja artificialmente, através da tecnologia do DNA recombinante in vitro. Na tecnologia do DNA recombinante, as moléculas de DNA não têm que ser semelhantes, nem mesmo homólogas. A engenharia genética utiliza a tecnologia do DNA recombinante para fundir segmentos de DNA e vetores, e em seguida cloná-los em células hospedeiras. Isto se baseia na propriedade das endonucleases de restrição de cortar o DNA em sítios específicos, bem como na propriedade da DNA ligase de unir os fragmentos cortados. O desenvolvimento de outros métodos essenciais relacionados à química dos ácidos nucléicos teve importância fundamental nessa tecnologia. Dentre as várias aplicações desta tecnologia, podem ser citados: 1 – Produção de proteínas recombinantes, por exemplo insulina humana, vacina contra a hepatite B, interferon-alfa e hormônio do crescimento humano. 2 – Terapia gênica, para a cura de doenças genéticas. 3 – Solução de delitos, em laboratórios de investigações criminais, para comparar sangue, cabelo e esperma de supostos criminosos, e na antropologia, por exemplo para analisar genes de múmias. 4 – Projetos “genoma” de organismos, para clonar todo o DNA de um organismo, bem como seqüencia-lo, localizando assim genes, regiões gênicas de interesse, regiões que podem vir a servir como marcadores moleculares, etc... 5 – Criação de plantas e animais transgênicos, por exemplo, a quase totalidade das lavouras de soja já emprega sementes modificadas para resistência a herbicida. 6 – Estudo de estrutura de genomas e genes, para o estudo de genes localizados em genomas, a sua regulação e controle (o que ultimamente implica sua expressão) in vitro, através da criação de moléculas recombinantes. 7 – Diagnóstico de doenças, oferecendo alternativas biotecnológicas para o diagnóstico de doenças, utilizando a clonagem e seqüenciamento, para a identificação de mutações ligadas a doenças, os testes do tipo Southern e northern, os biochips, dentre tantas outras técnicas. 8 – Melhoramento genético assistido, permitindo avanços no melhoramento genético de plantas e animais através da seleção assistida por marcadores ligados a genes de interesse. CORTE DO DNA: ENZIMAS DE RESTRIÇÃO Um dos requerimentos para a tecnologia do DNA recombinante é a necessidade de se cortar o DNA de forma reprodutível, o que foi conseguido a partir de 1970 com a descoberta das enzimas de restrição. O que são enzimas de restrição? Enzimas que, na natureza, restringem a entrada de DNA estrangeiro em células bacterianas. Estas enzimas são um mecanismo natural das bactérias para se protegerem contra infecção por vírus, e agem através do corte do DNA invasor. EcoRI ↓ 5 ´ G A A T T C 3 ´ III II II II II III 3 ´ C T T A A G 5 ´ ↑ SmaI ↓ 5 ´ C C C G G G 3 ´ III III III III III III 3 ´ G G G C C C 5 ´ ↑ EcoRI ↓ 5 ´ G A A T T C 3 ´ III II II II II III 3 ´ C T T A A G 5 ´ ↑ SmaI ↓ 5 ´ C C C G G G 3 ´ III III III III III III 3 ´ G G G C C C 5 ´ ↑ Como essas enzimas funcionam? Elas geralmente têm um sítio palindrômico de reconhecimento, de 4 a 8 pb e, ao reconhecê-lo, promovem o corte do DNA, pela hidrólise do arcabouço açúcar- fosfato. Dois tipos de cortes e extremidades são feitos: -cortes em ziguezague, produzindo extremidades coesivas -cortes perpendiculares, produzindo extremidades rombas (“cegas”) O DNA É CLONADO EM VETORES Vetores podem ser descritos como veículos utilizados, em biologia molecular, para transportar, multiplicar ou expressar segmentos de DNA em vários organismos. Os mesmos são classificados segundo sua finalidade, conforme os próprios nomes explicam: Vetores de clonagem: para multiplicar DNA para estudos de genomas, localização de genes, etc... Vão desde plasmídios, fagos, cosmídios, BACs, YACs, até MACs; o que varia é o tamanho, facilidade de manipulação, tamanho do DNA clonado, .... Vetores de expressão: contém um sítio de clonagem logo abaixo de um promotor, direcionando a produção do produto codificado pelo gene clonado. Vetores de transformação: contém genes que direcionam o transporte e a inserção do DNA estrangeiro em um cromossomo eucarioto; exemplo é o plasmídio pTi de Agrobacterium tumefaciens. VISÃO/REVISÃO – 9 GENES SELETIVOS E REPÓRTERES AUXILIAM NA SELEÇÃO DOS TRANSFORMANTES Gene seletivo é definido como aquele que codifica para resistência a um antibiótico ou um composto tóxico, e que permite a seleção de sua presença em um organismo. A seleção para a eficiência da transformaçãoé feita pela adição do antibiótico ou do composto no meio de cultura. Os genes mais comuns conferem resistência a ampicilina, cloranfenicol, canamicina, neomicina e tetraciclina. Gene repórter é definido como aquele que, ao ser expresso em um organismo transformado, produz uma atividade facilmente detectável por meios histoquímicos ou visuais, atividade essa que não é normalmente expressa em organismos não transformados, permitindo portanto a diferenciação entre transformados e não transformados. Dois genes comumente utilizados são o gus (= uidA) e o lucA; para o primeiro, é produzida uma reação de cor azul facilmente detectável; já o gene luc produz uma luminescência detectável em plantas e bactérias transgênicas. UMA COLEÇÃO DE CLONES FORMA UMA “BIBLIOTECA” O que são bibliotecas? São coleções de fragmentos de DNA, utilizadas em processos tais como projetos genoma, localização de genes, etc... São feitas em vetores de clonagem, cada um recebendo um pequeno fragmento do todo; ao conjunto desses vetores com os fragmentos se chama biblioteca. Quais as fontes do DNA das bibliotecas? Pode ser o DNA genômico fragmentado, ou cDNA (mRNA convertido em DNA por ação enzimática). O que um e outro tipo de biblioteca contem? Bibliotecas genômicas: todo o DNA, seja codificante ou não; cDNA: apenas segmentos codificados em um determinado momento, ou determinado órgão, ou determinado ambiente (na verdade, uma combinação de todos – órgão (ou tecido), momento, ambiente, nível nutricional, etc...) – o que estava sendo expresso quando a biblioteca foi feita. SONDAS E HIBRIDIZAÇÃO A capacidade de duas cadeias complementares se hibridizarem (associarem) para formar um duplex estável constitui o cerne de muitos métodos de análise e manipulação do DNA recombinante. Esta característica dos ácidos nucléicos é explorada por métodos para detecção de sequências específicas, no interior de polinucleotídeos tanto do RNA como do DNA. Uma variedade de tais métodos de detecção de sequências específicas já foi desenvolvida. Cada um difere em seus requerimentos quanto ao tipo de molécula que detecta (por exemplo, RNA ou DNA) e comprimento (isto é, de oligonucleotídeos curtos a polinucleotídeos longos) de sondas de ácido nucléico, bem como quanto às estratégias empregadas de marcação/ detecção. Principais tipos de ensaios Southern: DNA, usando DNA/RNA como sonda Northern: RNA, usando DNA/RNA como sonda Western: proteínas, usando anticorpos como sonda Vantagens de transferências: a grande vantagem da transferência de DNA ou de RNA de um gel para uma membrana reside na durabilidade e versatilidade das membranas de nylon ou nitrocelulose, comparadas com agarose ou acrilamida. Assim, uma vez transferido para a membrana, o ácido nucléico pode ser fixado e testado repetidas vezes com sondas, o que não seria possível em géis. COMO SE DESENHA UMA SONDA E COMO ELA É TORNADA “VISÍVEL”? Sondas: como desenhar: para se desenhar uma sonda, deve-se ter alguma informação sobre a sequência desejada, o que pode vir de genes semelhantes, genes clonados, ou a partir do produto gênico, a proteína: A partir de ácido nucléico: clonar ou selecionar o segmento desejado. A partir de proteínas: escolher o segmento de menor redundância, e desenhar a sonda. Desenhado sondas de ácidos nucléicos a partir de proteínas Uma das situações possíveis é que se conheça a proteína, e se queira encontrar o gene que a codifica. Com o conhecimento da sequência de aminoácidos, várias sondas podem ser desenhadas a partir de regiões pouco degeneradas. H3N Gli Leu Pro Trp Glu Asp Met Trp Phe Val Arg (5´) GGU UUA CCU UGG GAA GAU AUG UGG UUU GUU AGA Polipeptídio conhecido GGC UUG CCC GAG GAC UUC GUC AGG GGA CUU CCA GUA CGU GGG CUC CCG GUG CGC CUA CGA Diferentes codons que codificam para essa seqüência CUG CGG GAA GAU UGG GAG GAC AUG UGG UU GAA GAU UUU UGG GAG GAC AUG UGG UUC GU Sondas com 17 nucleotídeos de comprimento; 4 possíveis sequências Sondas com 20 nucleotídeos de comprimento; 8 possíveis sequências Sondas: porque marcar? Como o DNA e o RNA são “invisíveis”, para que eles sejam visualizados os mesmos devem receber uma marca visível. Sondas: com o que marcar? Marcadores radioativos: por exemplo fósforo; problemas são com tempo (demora até dias para revelar), risco (radioatividade é mutagênica) e pouca sensibilidade. Marcadores não-radioativos: não apresentam risco, e está é a tendência atual na maioria dos protocolos. • Biotina: muito usada em protocolos de captura por conjugados de avidin ou streptavidin; são adicionados na extremidade 5´; múltiplos monômeros podem ser adicionados em protocolos de captura com conjugados anticorpo-enzima anti-biotina. • Digoxigenina: adicionada na forma de um único monômero na extremidade 5´; facilmente detectável por meio de conjugado anticorpo-enzima. • Dinitrofenil (DNP): adiciona uma cor amarelo-brilhante, e pode ser facilmente detectado por meio de conjugados anticorpo-enzima anti-DNP. • Corantes fluorescentes: o grupo mais promissor; adicionados como única cópia na extremidade 5´; há vários deles, por exemplo os baseados em rodamina, como ROX e TAMRA, e os derivativos de fluoresceina, como JOE, FAM, HEX e TET. Onde e como marcar: para os radioativos, marcação interna (ex. translação de corte, PCR, mRNA por vetor de expressão) ou nas extremidades (terminal transferase); para os não radioativos, marcação é geralmente na extremidade, por ligação cruzada. VISÃO/REVISÃO – 10 FISH: Fluorescent in situ hybridization A hibridação in situ é um método que permite identificar a posição, em um cromossomo, onde se localiza uma determinada sequência de DNA previamente conhecida, e se baseia no mesmo princípio do Southern blot, ou seja, complementariedade sonda-alvo. Para a sua realização, cromossomos em metáfase são fixados em uma superfície sólida (via de regra um slide de microscopia), desnaturados para fita-simples, e sondados com uma sonda marcada com um fluorocromo, o que permite a visualização da região cromossômica complementar à sonda. Quando se utiliza mais de uma sonda, cada qual marcada com um diferente fluoróforo, a técnica recebe a denominação de FISH multiplex. A técnica é muito potente para a detecção de mutações, particularmente deleções e inversões, bem como para a verificação de duplicações ou deleções de cromossomos inteiros, bem como outras formas de rearranjos cromossómicos. O que são “chips”? Uma miniaturização dos ensaios que envolvem transferência para membranas. O DNA a ser testado é imobilizado em uma superfície sólida, e testado com a sonda de interesse (ou vice-versa). Vão desde membranas de nylon de alta densidade (nylon macroarrays e microarrays) até os oligochips. O mRNA dos indivíduos a serem testados é extraído (ex.: mesma espécie, diferentes estádios de desenvolvimento) e convertido em cDNA utilizando fluoróforos diferentes A expressão gênica pode ser verificada pelo anelamento diferencial dos cDNAs a diferentes compartimentos do chip de DNA, após leitura com raio laser no equipamento apropriado. Isto indica genes que são expressos somente nas fases iniciais, genes expressos nas fases adultas, ou genes expressos constitutivamente Os dois cDNAs são vertidos sobre o microarray, que contém compartimentos onde diferentes DNAs conhecidos foram imobilizados VISÃO/REVISÃO – 11 Fonte: Wikipedia Na figura ao lado, o DNA expressopor células em diferentes estádios de desenvolvimento de aves foi convertido em cDNA usando dNTPs com diferentes corantes, enquanto que sequências de DNA do organismo foram imobilizadas no vidro. Os cDNAs fluorescentes anelam-se às suas sequências complementares. Após lavagem para remoção das sequências não hibridizadas, cada ponto com florescência representa uma sequência expressa. Os pontos verdes representam genes expressos nos estádios iniciais, enquanto que os pontos vermelhos representam sequências mais abundantes em estádios mais avançados do desenvolvimento. CHIPS DE DNA REPRESENTAM A “ÚLTIMA PALAVRA” EM ENSAIOS DE HIBRIDIZAÇÃO PARA VERIFICAÇÃO DA EXPRESSÃO DIFERENCIAL DE GENES A TÉCNICA “SAGE” TAMBÉM É COMUMENTE EMPREGADA PARA VERIFICAR A EXPRESSÃO DIFERENCIAL A técnica SAGE (Serial Analysis of Gene Expression) se baseia na captura do mRNA, sua conversão em cDNA, e a criação de uma “etiqueta” (“tag”) que o identifique de forma única e inequívoca. O que esta por trás da técnica SAGE na verdade é uma estimativa da frequência de ocorrência de cada um dos transcritos de mRNA no momento/tecido/ambiente onde a coleta foi feita. Vamos exemplificar com dois transcritos, alfa e beta, em uma célula normal e uma célula doente. Se capturarmos os mRNAs de alfa e beta, os convertermos em cDNA, e estimarmos sua abundância, podemos deduzir qual dos dois genes, alfa ou beta, esta ligado à doença em questão, conforme pode ser visto nos dois gráficos acima, que apresentam um conjunto maior de genes (7), sendo que os genes 2, 4 e 6 são claramente super-expressos no indivíduo doente; já o gene 7 é muito mais expresso no indivíduo sadio. DNA PODE SER “FABRICADO” IN VITRO, SEM AUXÍLIO DE ENZIMAS Para a síntese de sondas, síntese de iniciadores para PCR, síntese de chips, síntese de genes, e outras aplicações, é possível se fazer DNA sem um molde; isto é feito in vitro, em uma abordagem completamente diferente da síntese enzimática. Esta envolve uma base sólida, geralmente sílica (nome proposto: in silico) e o uso de nucleotídeos “protegidos”: coloca um por vez (escolhido a gosto do cliente), desprotege, coloca o seguinte, etc... Outra grande diferença é no sentido da síntese: 3´-5´ (geralmente), ao invés da síntese 5´-3´ enzimática. Vantagem: grande número de sequências em pequeno espaço; por exemplo, no chips tem-se até 1 milhão de elementos, cada um com 10.000.000 de cópias, em apenas cerca de dois centímetros quadrados... Principal uso: para verificar expressão diferencial; também úteis para quantificar expressão gênica (que é uma forma de expressão diferencial ...) – projetos transcriptoma. DNA TAMBÉM PODE SER SEQÜENCIADO IN VITRO: PROJETOS “GENOMA” E OUTRAS APLICAÇÕES Abordagens: duas estratégias: corte de DNA, ou amplificação de DNA •Corte: método de Maxam&Gilbert; envolve uso de produtos químicos (não são enzimas de restrição) base-específicos (ou quase) e resolução em gel •Amplificação: método de Sanger&outros; envolve uso de terminadores de cadeia (di-desoxi- nucleotídeos) e resolução em analisadores automáticos com eletroforese capilar Visualização: necessidade de marcação, radioativa ou por fluoróforos; o que se vê é a marca, não o DNA. Uso: principalmente para os projetos genoma; exemplo - genoma humano. Automação: o método da clivagem química foi abandonado, já que o método didesoxi conseguiu ser automatizado Cálculo do Manihatis (métodos tradicionais – versões iniciais): 1 pessoa: aproximadamente 2.100 nt/semana (1 dia para preparar DNA, 1 dia para seqüenciar, 1 dia para “ler” o gel, 2 dias para repetir/reanalisar; em média, repete a mesma sequência 5 vezes – sobreposição dos clones e repetições por resultados dúbios): E. coli: 42 anos; Drosófila: 1.510 anos; Humanos: 27.472 anos; Milho: 457.880 anos; Salamandra: 824.400 anos. Com a automação e vários laboratórios trabalhando ao mesmo tempo, hoje se pode seqüenciar praticamente todo o genoma humano em poucos meses... Acima, são vistas as etapas da análise de um gel de seqüenciamento pelo método didesoxi. No primeiro gel (1), cada uma das bases foi corrida em uma coluna diferente do gel. No entanto, com o advento dos marcadores coloridos, isto não é mais necessário, e se pode correr apenas uma coluna do gel com as quatro bases sequenciadas (2). De fato, os sequenciadores modernos possuem pentes capilares de eletroforese, que são interpretados por leitores laser (3), os quais gerarão os eletroforegramas coloridos, que podem ser facilmente reconvertidos na sequência de DNA que se deseja (4). Ao lado, são mostrados um sequenciador automático, e um pente com 16 capilares, que é capaz de sequenciar 16 DNAs ao mesmo tempo. Abaixo, uma sala de seqüenciamento de um grande laboratório. C G T T C G A A T G C 1 2 3 4 Fonte de laser Leitor Direção da eletroforese Um 2´, 3´, didesoxinucleotídeo trifosfato H H P-P-P- VISÃO/REVISÃO – 12 3´------- A T T C G C A T A G -5´ Amplificação com A* Amplificação com T* Amplificação com G* Amplificação com C* TA T TAAG TAAGC TAA TAAGCGT TAAGCG TAAGCGTATC TAAGCGTA TAAGCGTAT O Projeto Genoma Humano é um empreendimento internacional, iniciado formalmente em 1990 e projetado para durar 15 anos, com os seguintes objetivos: Identificar e fazer o mapeamento dos cerca de 80 mil genes que se calculava existirem no DNA das células do corpo humano; Determinar as sequências dos 3 bilhões de bases químicas que compõem o DNA humano. SITUAÇÃO EM 1990: 4.550 genes humanos haviam sido identificados; cerca de 1.500 genes haviam sido associados a localizações específicas nos cromossomos; apenas algumas, dentre cerca de 4.000 doenças genéticas existentes, haviam sido entendidas em um nível molecular. SITUAÇÃO EM 1998, 8 ANOS APÓS O INÍCIO: Mapeamento genético: mais de 7.000 genes foram mapeados a cromossomos particulares. Além destes, o Banco de Dados do Projeto Genoma guarda informação sobre outros genes identificados, cuja localização nos cromossomos ainda não foi inequivocamente determinada. Seqüenciamento: somente de 4% das bases do genoma humano foi sequenciado SITUAÇÃO EM FEVEREIRO DE 2001 – Versões-rascunho Em fevereiro de 2001, simultaneamente ao anúncio da empresa norte-americana Celera, o PGH anunciou as primeiras transcrições quase completas do código genético humano. O número de genes existentes, segundo os cálculos de ambas as equipes de pesquisadores, não chega a 40 mil. Os resultados foram publicados em duas revistas diferentes. A revista inglesa Nature publicou o trabalho dos pesquisadores do PGH, liderados por Francis Collins, e a norte- americana Science, o dos pesquisadores da Celera, liderados pelo empresário-cientista Craig Venter. AVANÇOS IMPORTANTES QUE CONTRIBUIRAM PARA O ACELERAMENTO DA GERAÇÃO DE INFORMAÇÕES: Avanço 1: método da terminação de cadeia, por Sanger e colaboradores, em 1977, que foi aperfeiçoado em 1986, por Hood e colaboradores, com a inclusão dos terminadores fluorescentes, permitindo assim a automação do método. Avanço 2: introdução dos cromossomos bacterianos artificiais (BACs), um sistema de clonagem que permite grandes insertos e que se mostrou mais estável do que os cosmídios ou os cromossomos artificiais de levedura (YACs). ESTRATÉRIAS ADOTADAS PARA O SEQÜENCIAMENTO: Shotgun, adotada pela Celera Genomics, baseia-se na obtenção de uma biblioteca completa, feita em plasmídios com uma variedade de tamanhos de insertos, representandoigualmente todas as partes do genoma. O DNA é completamente fragmentado e clonado nos plasmídios. Problemas com a versão-rascunho: A sequência do IHGSC, por exemplo, omitia cerca de 10% do genoma, era interrompida por 150.000 falhas, e não conseguia apresentar corretamente a ordem e a orientação de muitas sequências. Isto levou a esforços no sentido de completar uma versão final, que deveria ter no mínimo 95% das sequências, e ter um erro máximo de uma base em 10.000. O objetivo era ambicioso, posto que o genoma humano é repleto de sequências repetitivas e duplicações segmentais grandes, o que dificulta sobremaneira o seu seqüenciamento. Na versão final, uma sequência quase completa é apresentada, com apenas 314 falhas, a maioria associada a duplicações segmentais, cuja resolução vai requerer novas técnicas ainda não disponíveis. A taxa de erro é de cerca de uma base em 100.000, e a cobertura é superior a 90%. São ainda analisados os processos utilizados para o seqüenciamento, a acurácia do processo, e são apresentadas possíveis aplicações biológicas do projeto. No total, foram geradas sequências shotgun de 59.208 clones com grandes insertos, com o comprimento total de 5,84 Gb, sendo que para 45.742 delas as sequências foram completamente geradas, com um comprimento total de 3.67 Gb. Os clones consistiram primariamente de BACs, YACs, fosmídios e cosmídios. O genoma: a sequência consiste em 2.851.330.913 nucleotídeos, a maioria na região eucromática do genoma. Existem apenas 341 falhas, sendo que a maioria está em regiões heterocromáticas, que não eram o alvo do projeto (198 Mb de heterocromatina, contra 28 Mb de eucromatina); portanto, o genoma completo tem cerca de 3,08 Gb, com 2,88 Gb de eucromatina. A qualidade: a taxa de redundância das sequências é de cerca de 1.000 vezes, o que garante uma excelente cobertura do genoma. O controle de qualidade das sequências indica uma taxa de erro de 1,1 base por 100.000 bases para eventos pequenos (menos de 50 bp, com tamanho médio de 1,3 bp, particularmente SNPs) e de 0,03 bases por 100.000 bases para eventos grandes (particularmente VNTRs). Análise de cDNAs: a presença de 17.458 cDNAs conhecidos, dando um total de 925 Mb, foi testada. A grande maioria (99,74%) pode ser corretamente posicionada no novo mapa do genoma. Apenas 0,04% dos casos apresentaram diferenças substanciais (maiores do que 2%), quase sempre para genes relacionados a processos imunológicos (por exemplo loci de histocompatibilidade, e loci relacionados a imunoglobulina), já sabidamente com alto polimorfismo. Genes de proteínas: as estimativas iniciais do número de genes, antes do projeto genoma humano, chegavam à casa dos 100.000, e mesmo a versão inicial do genoma, produzida em 2001, estimou cerca de 30.000 genes, o que hoje pode ser considerado como uma estimativa demasiada. Talvez o fato mais marcante do seqüenciamento seja que apenas uma estimativa de 22.287 genes possa ser feita, dos quais 19.438 são genes já conhecidos e confirmados, e 2.188 são genes predizíveis. Esses genes tem um total de 231.667 éxons (cerca de 10,4 éxons por locus), que cobrem apenas 34 Mb, ou 1,2% do genoma eucromático; outros 21 Mb (0,7%) correspondem a regiões não- traduzidas dos genes. Pseudogenes: já foram identificados cerca de 20.000 pseudogenes, tanto processados quanto nativos; presume-se que esse número esteja muito aquém da realidade, já que os métodos disponíveis não conseguem identificar pseudogenes muito antigos ou que contém regiões não-transcritas; assim, pode-se seguramente predizer que o número de pseudogenes supere o número de genes. A VERSÃO FINAL DO GENOMA HUMANO – PROJETO PÚBLICO Resumo do artigo “Finishing the euchromatic sequence of the human genome”, pelo International Human Genome Sequencing Consortium, publicado na revista Nature n. 431, p. 931-945 (21 de outubro de 2004). Sites: www.ncbi.nih.gov; www.genome.ucsc.edu; www.ensebl.org Shotgun hierárquico, também conhecida como BAC-based ou clone-por-clone, envolve a geração e a organização de um conjunto de clones com insertos grandes (100-200 kb cada), cobrindo todo o genoma, e o seqüenciamento por shotgun de clones escolhidos. Como a informação da sequência é local, o problema de mal-composição é eliminado. SHOTGUN SHOTGUN HIERÁRQUICO VISÃO/REVISÃO – 13 VISÃO/REVISÃO – 14 OS PROJETOS “OMA” DERIVADOS DO PROJETO GENOMA HUMANO Como fruto do desenvolvimento de várias técnicas de biologia molecular, particularmente nas décadas de 1970 e 1980, a comunidade científica internacional mobilizou-se para a aplicação dessas técnicas em prol da ciência, surgindo então várias ideias, começando pelo projeto GENOMA HUMANO, e depois derivando para vários projetos correlatos, tais como os projetos PROTEOMA, EXOMA, 1.000 GENOMAS, e outros. A seguir veremos alguns detalhes mais significativos de cada um deles. Estudos de variação genética entre indivíduos continuaram após a finalização do projeto genoma, tendo sido criado o International HapMap Project, para identificar grupos populacionais que apresentam SNPs em comum, denominados haplótipos ou “haps”, identificando assim os padrões de variação genética humana, e procurando definir os padrões de variantes ligadas a doenças e a respostas a medicamentos e a fatores ambientais. O Personal Genome Project (PGP) é outra iniciativa para criar uma base de dados gratuita, com dados genômicos doados por voluntários. O projeto foi inciado em 2005, por George Church, da Harvard Medical School. Uma das premissas do projeto é que “o genoma é apenas parte da história: os genes interagem com o meio ambiente para formar as características individuais...”. Os participantes do projeto informam seus dados de saúde, e a equipe do projeto tenta conectar esses indivíduos e essas informações com outros centros de pesquisa. Abaixo alguns dos resultados até o momento obtidos. 1000 Genomes A Deep Catalog of Human Genetic Variation INTERNATIONAL CONSORTIUM ANNOUNCES THE 1000 GENOMES PROJECT Major Sequencing Effort Will Produce Most Detailed Map Of Human Genetic Variation to Support Disease Studies O 1000 Genomes Project é um consórcio internacional entre a Inglaterra, a China e os Estados Unidos que visa criar uma visão detalhada da utilidade médica com relação às variações genéticas humanas, através do sequenciamento do genoma de pelo menos 1.000 pessoas. Os participantes da primeira fase do projeto foram extraídos do Projeto Internacional HapMap. O projeto Encyclopedia of DNA Elements (ENCODE) foi criado em 2003 para mapear regiões de transcrição, de fatores associados a transcrição, de estrutura de cromatina e de modificações de histonas, permitindo que se associe funções bioquímicas a cerca de 80% do genoma, particularmente fora de regiões tipicamente associadas a genes codificantes de proteínas, o que não foi possível – e nem era o objetivo – no PGH. A meta é delinear todos os elementos funcionais que compõem o genoma humano. Esses elementos podem ser definidos como um segmento genômico que codifica um produto (por exemplo uma proteína ou um RNA não codificante), ou que mostra uma “assinatura bioquímica” (por exemplo, ligação a proteínas, ou uma estrutura de cromatina específica). A base de dados COSMIC (Catalogue Of Somatic Mutations In Cancer), ligada ao Wellcome Trust Sanger Institute, é uma base de dados de mutações somáticas ligadas ao câncer, e serve como um catálogo de dados de publicações científicas. Ela foi lançada em 2004, e em apenas seis anos já contava com dados de
Compartilhar