Prévia do material em texto
Curso de Ciências Biológicas
Disciplina 2418 – Biologia Molecular
Prof. Fernando A. Tcacenco
A P O S T I L A 2 0 1 4
Índices para catálogo sistemático:
1. Biologia molecular 578.88
2. Genética molecular 574.873 28
3. DNA recombinante: Engenharia genética: Biotecnologia 660.65
Tcacenco, Fernando Adami
Biologia Molecular: Apostila de Aula / Fernando Adami Tcacenco.
Itajaí, SC: [s.n.], 2014, 218 p. (UNIVALI – Universidade do Vale do Itajaí, Curso de Ciências
Biológicas, Disciplina 2418 – Biologia Molecular).
1. Biologia Molecular 2. DNA Recombinante 3. Engenharia Genética
I. Tcacenco, F. A. II. Título
DD II SS CC II PP LL II NN AA 22 44 11 88 -- BB II OO LL OO GG II AA MM OO LL EE CC UU LL AA RR 22 00 11 44
S U M Á R I O
UNIDADE ZERO: VISÃO/REVISÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
UNIDADE 1: MATERIAL GENÉTICO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Guia de estudos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
DNA ou proteína . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Características essenciais do material genético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Os experimentos clássicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
RNA como material genético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Os componentes das cadeias de DNA e RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Porque o DNA é usado como material genético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Estrutura do DNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Genes e a informação biológica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Genomas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Óperons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Íntrons e éxons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
UNIDADE 2: REPLICAÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Guia de estudos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Replicação do DNA e os experimentos de Meselson-Stahl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
A origem e a bidirecionalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
As DNA polimerases de E. coli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Os nove mandamentos da replicação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Correção de erros: atividade de exonuclease . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Replicação nos eucariontes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Replicação do final dos cromossomas: telomerase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
UNIDADE 3: TRANSCRIÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Guia de estudos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Síntese dos RNAs e tipos de moléculas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Visão geral da transcrição em Escherichia coli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
Os dez mandamentos da transcrição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
As RNAs polimerases de procariontes e eucariontes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
O RNA mensageiro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
A iniciação da transcrição de mRNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
O alongamento da cadeia de mRNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
A terminação da transcrição de mRNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
Os processamentos dos mRNAs de eucariontes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
O RNA ribossômico e os ribossomos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
O RNA transportador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
UNIDADE 4: TRADUÇÃO. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
Guia de estudos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
O código genético: descoberta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
O código genético: características . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
Tradução: uma visão geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
Os atores e os passos da tradução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
Síntese protéica: reconhecimento do códon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
Síntese protéica: translocações e finalização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
Tradução em eucariontes: particularidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
Acoplamentotranscrição/tradução e tradução simultânea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
Príons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
UNIDADE 5: O CONTROLE DA EXPRESSÃO GÊNICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Guia de estudos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Controle: porque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
Estrutura e domínios comuns . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
Regulação positiva e negativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
O óperon da lactose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
O óperon do triptofano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Controle envolvendo ribossomos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
Resposta SOS e RNA antisentido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
Controle em eucariontes: particularidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
Controle da transcrição: ativadores e outras moléculas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
Controle por estabilidade do DNA e por interferência por RNAi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
Controle na tradução e elementos de resposta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
Controle do desenvolvimento: Drosophila . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
UNIDADE 6: MUTAÇÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
Categorias de mutações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
Mutações para a frente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
Mutações reversas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
Mutações supressoras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
Causas de mutações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
Correção de mutações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
Estudo de caso: fibrose cística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
i
UNIDADE 7: GENOMAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
Vírus: as formas mais simples de vida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
Genomas procarióticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
Genomas eucarióticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
Genomas de organelas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
UNIDADE 8.1: TECNOLOGIA DO DNA RECOMBINANTE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
UNIDADE 8.2: ENZIMAS DE RESTRIÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
Dry-Lab 9.1: Fazendo DNA recombinante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
Dry-Lab 9.2: Fazendo plasmídios recombinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
UNIDADE 8.3: BIBLIOTECAS DE DNA E DE cDNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
Dry-Lab 9.3: Montando bibliotecas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
UNIDADE 8.4: VETORES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
UNIDADE 8.5: HIBRIDIZAÇÕES - SONDAS E BLOTS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
Demo 9.4: Montando um Southern blot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
UNIDADE 8.6: ANÁLISE DE EXPRESSÃO GÊNICA DIFERENCIAL . . . . . . . . . . . . . . . . . . . . . . . . . . 135
Dry-Lab 9.5: Fazendo diagnóstico por biochips. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
UNIDADE 8.7: MARCAÇÃO DE SONDAS E CORANTES PARA DNA . . . . . . . . . . . . . . . . . . . . . . . . . 144
UNIDADE 8.8: SÍNTESE QUÍMICA DE DNA IN VITRO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
UNIDADE 8.9: SEQÜENCIAMENTO DE DNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
Dry-Lab 9.6: Fazendo seqüenciamento por M&G . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
Dry-Lab 9.7: Fazendo seqüenciamento por didesoxi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
UNIDADE 8.10: OS PROJETOS “OMA” & DERIVADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
UNIDADE 8.11: AMPLIFICAÇÃO DE DNA – PCR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
Dry-Lab 9.8: Fazendo uma PCR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
Demo 9.9: Uso do termociclador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
UNIDADE 8.12: MARCADORES MOLECULARES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
Dry-Lab 9.10: Fazendo um RFLP em plantas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
UNIDADE 8.13: ANÁLISE FORENSE DE DNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
UNIDADE 8.14: TRANSFORMAÇÃO GENÉTICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
Dry-Lab 9.11: Kits de verificação de transgeníase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
UNIDADE 8.15: TERAPIA ANTISENSO E VACINAS DE DNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
Demo 9.12: DNA anti-senso . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208
UNIDADE 8.16: MUTAGÊNESE SÍTIO-DIRIGIDA/GENÉTICA REVERSA . . . . . . . . . . . . . . . . . . . . . 209
UNIDADE 8.17: EXTRAÇÃO E VISUALIZAÇÃO DE ÁCIDOS NUCLÉICOS . . . . . . . . . . . . . . . . . . . 210
Demo 9.13: Eletroforese de ácidos nucléicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
Demo 9.14: Kits de extração de DNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
ii
O DNA é talvez uma das moléculas mais populares nos dias de hoje. Se não a sua estrutura – complexa, às
vezes - pelo menos a sua abreviatura. E isto ficou ainda mais patente depois dos famosos “testes de
paternidade” na televisão, da clonagem da ovelha “Dolly” e da conclusão do projeto “Genoma Humano”. Nos
meios de comunicação, a citação de DNA é cada vez mais frequente, seja associada a eventos positivos - por
exemplo: descoberta de novos tratamentos para doenças - seja associada a eventos negativos ou, no
mínimo, polêmicos: plantas transgênicas e desastres com identificação de vítimas por teste de DNA são dois
exemplos comuns.
A Biologia Molecular – disciplina que estuda o DNA em seu âmago - é eclética, no sentido de incorporar
conhecimentos de várias áreas da ciência, como Genética Molecular, Bioquímica, e Genômica/Proteômica.
Os avanços verificados nas últimas décadas - digamos nas últimas cinco décadas, desde a descoberta da
estrutura do DNA em 1953 - a tornam muito dinâmica, e informações estão sendo constantemente
adicionadas ao seu cabedal. Difícil se torna, portanto, manter-se atualizado, posto que dia-a-dia novas
descobertas são feitas. Um dos objetivos deste material é procurar uma atualização constante, com a
incorporação de inovações sempre que possível.
Alguns tópicos são aparentemente mais “conservadores”, por exemplo o fluxo da informação -
DNA/RNA/Proteína, vale dizer, Replicação/Transcrição/Tradução - já vistos por todos desde o segundo grau
e em várias disciplinas de nosso curso, como Genética, Bioquímica e Biologia Celular. No entanto, mesmo
nesses tópicos pesquisas têm revelado novas facetas. Por exemplo, algumas DNA polimerases de
procariontes já são conhecidas desde 1957, mas outras (IV e V) só foram descobertas no limiar do presente
milênio. O Controle da Expressão Gênica é um tópico estudado geralmente em conjunto com o fluxo da
informação, mas destaca-se por ser mais “dinâmico”, no sentido de ser objeto de mais pesquisas, já que
controlar a expressão gênica é, em última instância, controlar o nascimento, crescimento e morte de um
organismo.
Outros tópicos são notoriamente “inovativos”, no sentido de não serem sequer mencionados em livros-texto
do final da década de 1990. Dentre eles incluem-se os arranjos (chips ou arrays, em inglês) de DNA e o RNA
interferente. Este último foi relatado pela primeira vez em 1998, em artigo publicado na revista Nature (Fire
A., Xu S.Q., Montgomery M.K., Kostas S.A., Driver S.E., Mello C.C. Potent and specific genetic interference
by double-stranded RNA in Caenorhabditis elegans. Nature 1998; 391:806-811), e já em 2006 rendeu a seus
autores o Prêmio Nobel de Medicina pela relevância para a ciência, em particular para a medicina molecular.
A Fundação Nobel relata que esses pesquisadores “descobriram um mecanismo para controlar o fluxo de
informação genética”, já que a interferência de RNA destrói alguns RNA mensageiros, impedindo a síntese de
proteínas, o que equivale a “desligar” os genes que produziram aquelas mensagens. Também no rol dos
Prêmios Nobel ligados à nossa área está o de 2007, concedido a Mario R. Capecchi, Martin J. Evans e Oliver
Smithies, pelas suas descobertas referentes ao nocaute de genes, uma dinâmica área ligada à terapia
gênica. Na organização da disciplina, faremos inicialmente uma abordagem geral de todos os tópicos, para
posteriormente entrarmos em detalhes sobre cada um deles. Estrutura do DNA e Replicação serão os
primeiros tópicos vistos em detalhes, posto que muitas técnicas e métodos requerem esses conhecimentos
básicos. Alguns conceitos básicos da organização de genomas em vários organismos também serão
abordados. Em seguida, entraremos na unidade denominada “Métodos e Técnicas”, que abordará temas
como enzimas de restrição, vetores de clonagem, eletroforese, seqüenciamento de DNA, PCR, marcadores
moleculares, DNA forense, organismos transgênicos e outros. Finalmente, serão abordados os outros
aspectos do fluxo da informação (Transcrição - Tradução - Controle da Expressão), bem como uma visão
simplificada sobre Mutações.
Para mais bem situarmos o acadêmico no contexto da biologia molecular, vamos listar, nas páginas
seguintes, algumas das conquistas de Prêmios Nobel obtidas por cientistas nas áreas afetas à nossa
disciplina (Medicina, Fisiologia e Química). Também faremos, a partir de uma publicação científica, o perfil de
um projeto de pesquisa envolvendo biologia molecular, para que o acadêmico possa vislumbrar campos de
aplicação dos conhecimentos adquiridos.
VISÃO/REVISÃO – 1
CONTEÚDO E ORGANIZAÇÃO DA DISCIPLINA
CONTEXTUALIZAÇÃO: SELEÇÃO DE PROMOTORES PARA TRANSFORMAÇÃO VEGETAL
I. CONSTRUÇÃO DA BIBLIOTECA GENÔMICA
Extração do DNA genômico de folhas
Digestão com enzima de restrição
Eletroforese e seleção por tamanho (10-23kb)
Eluição e purificação
Construção de biblioteca genômica em vetor lambda
II. PREPARO DE SONDA DE cDNA
Extração de RNA de folhas
Seleção de mRNA por colunas oligo-dT
Síntese da primeira fita de cDNA
Marcação do cDNA (sonda) com α32P-dCTP
III. SONDAGEM DA BIBLIOTECA GENÔMICA
Plaqueamento da biblioteca genômica
Transferência para membrana
Sondagem da biblioteca com cDNA marcado
RESULTADO: SELEÇÃO DE 12 CLONES POSITIVOS
ANÁLISE DE SOUTHERN
Digestão de DNA genômico dos 12 clones selecionados em III com várias E.R.
Eletroforese, transferência de Southern e sondagem com sondas de cDNA derivadas de mRNA
RESULTADO: CLONES POSITIVOS DEVEM CONTER GENES ALTAMENTE EXPRESSOS
E SÃO CANDIDATOS PARA O ISOLAMENTO DOS PROMOTORES
CONSTRUÇÃO E SONDAGEM DE BIBLIOTECA DE cDNA DE FOLHAS
Seleção de mRNA de folhas e síntese de cDNA
Construção de biblioteca de cDNA
Sondagem com fragmentos de restrição marcados (sondas de cDNA)
ISOLAMENTO E SEQÜENCIAMENTO DE cDNAs POSITIVOS
Clonagem em vetor de seqüenciamento pBluescript SK
Seqüenciamento por didesoxi marcado com Rhodamina, usando seqüenciador automático ABI 377
RESULTADOS: ALGUNS SEGMENTOS RELACIONADOS COM GENES DE FATORES DE
ALONGAMENTO, TUBULINA, AQUAPORINA, E PROTEÍNA RICA EM PROLINA
ANÁLISE DE NORTHERN
Eletroforese de RNA de raízes, caules e folhas
Transferência de northern
Hibridização com sondas de cDNA
RESULTADO: ALGUNS CLONES ACUMULARAM MAIS RNA MENSAGEIRO EM FOLHAS, OU EM
CAULES, ETC... MOSTRANDO ONDE SÃO MAIS ALTAMENTE EXPRESSOS
ISOLAMENTO, IDENTIFICAÇÃO E CARACTERIZAÇÃO DE DOIS GENES
Busca por genes completos, com extremidades 3´ e 5´, mais regiões promotoras, através do
seqüenciamento de clones positivos, alinhamento de seqüências parciais com overlapping e
comparação com bancos de genes conhecidos
RESULTADOS : QUATRO CLONES GENÔMICOS ENCONTRADOS
Características da região promotora (1,8-kb) de um vetor com 8-kb:
Box TATAAA localizado a -172 bp do códon de iniciação ATG e mais uma seqüência 5´-CCATC
(provavelmente um CAAT box) 37 bp acima do box TATA
Características de um outro vetor seqüenciado (correspondente a outro gene) de vetor com 9-kb:
Correspondência de 100% com gene conhecido do milho
Presença de dois íntrons com os característicos GT e AG nosextremos
Início da transcrição localizado por análise de extensão de primer e seqüenciamento, indicando que
o sítio de início da transcrição está situado 130 bp acima do sítio de início da tradução
Presença de box TATA 33 bp acima do sítio de início da transcrição, e CAAT box mais 40 bp acima
CONSTRUÇÃO DE PLASMÍDIOS COM PROMOTORES
Substituição do promotor CaMV 35S por promotores-teste
Construção dos plasmídios de substituição
TRANSFORMAÇÃO POR MICROBOMBARDEAMENTO
Transformação de calos com cada um dos promotores selecionados na etapa anterior
(tungstênio, 0,7 µm; pressão de hélio de 0,6 Mpa (90 psi)
ENSAIO PARA ATIVIDADE DOS PROMOTORES
Verificação da expressão do gene repórter GUS (azul)
[uso do gene repórter para antocianina (vermelho) como controle]
RESULTADOS: OS NOVOS PROMOTORES MOSTRATAM ALTOS NÍVEIS DE EXPRESSÃO,
INDICANDO SUA UTILIDADE NA CONSTRUÇÃO DE VETORES PARA TRANSFORMAÇÃO DE
CANA-DE-AÇÚCAR COM GENES DE INTERESSE
CONTROLE
Uso de sondas de RNA poliA (-)
para eliminar clones que se
hibridizaram a rRNA ou outro
RNA repetitivo
Nesta publicação, exemplificando a aplicação de técnicas moleculares para a localização de promotores eficientes para a transformação genética de cana-de-açúcar, os
autores aplicaram técnicas como construção de bibliotecas, uso de enzimas de restrição, preparo de sondas, seqüenciamento, Southern e northern blots, comparação de
sequências em bancos de genes, dentre outras, nos seguintes passos: (1) Inicialmente, mRNA de tecidos específicos foi usado como sonda para escrutinar uma biblioteca
genômica fágica. (2) Após, a região codificante desses clones foi identificada por análise de Southern de clones de DNA do fago lambda digerido com enzima de restrição;
foi utilizada a primeira fita do cDNA como sonda, e os clones correspondentes foram isolados da biblioteca de cDNA. (3) O número de cópias de cada gene foi estimado
por análise de Southern e o nível de expressão foi confirmado por análise de northern. (4) Por último, os promotores foram caracterizados por seqüenciamento do cDNA e
dos clones genômicos, bem como por busca no GenBank, análise de extensão de iniciadores, e análise de expressão transiente. Cinco genes em particular se sobressaíram, e
dois deles foram subclonados: SEF1-alfa (Fator de elongação 1-alfa) e SPRP1 (Proteína rica em prolina 1). A introdução e expressão de seus promotores fundidos ao gene
da beta-glucoronidase (GUS) resultou em altos níveis de expressão tanto em cana de açúcar quanto em trigo. Essa estratégia pode ajudar a encontrar novos promotores para
alta expressão de transgenes em cana ou outras monocotiledôneas para as quais ainda não se tem bons promotores. (1) Inicialmente, mRNA de tecidos específicos foi usado
como sonda para escrutinar uma biblioteca genômica fágica. (2) Após, a região codificante desses clones foi identificada por análise de Southern de clones de DNA do fago
lambda digerido com enzima de restrição; foi utilizada a primeira fita do cDNA como sonda, e os clones correspondentes foram isolados da biblioteca de cDNA. (3) O
número de cópias de cada gene foi estimado por análise de Southern e o nível de expressão foi confirmado por análise de Northern. (4) Por último, os promotores foram
caracterizados por seqüenciamento do cDNA e dos clones genômicos, bem como por busca no GenBank, análise de extensão de iniciadores, e análise de expressão
transiente. Como resultado, cinco genes em particular se sobressaíram, e dois deles foram subclonados: SEF1-alfa (Fator de elongação 1-alfa) e SPRP1 (Proteína rica em
prolina 1). A introdução e expressão de seus promotores fundidos ao gene da beta-glucoronidase (GUS) resultou em altos níveis de expressão tanto em cana de açúcar
quanto em trigo. Essa estratégia pode ajudar a encontrar novos promotores para alta expressão de transgenes em cana ou outras monocotiledôneas para as quais ainda não
se tem bons promotores. A seguir, um esquema dos passos experimentais adotados:
VISÃO/REVISÃO – 2
PORQUE O DNA É O MATERIAL GENÉTICO “PREFERIDO”?
COMPOSIÇÃO DO DNA/DUPLA HÉLICE
A história do material genético remonta do século XIX (1833), quando o núcleo celular foi descrito por Brown. Alguns anos depois, em 1839,
Shleiden e Schwan propõem a teoria celular. O famoso trabalho de herança genética realizado por Mendel foi inicialmente publicado em 1866, e três
anos depois (1869) Miescher descobre a “nucleína” em núcleos de glóbulos brancos. Demonstrou-se posteriormente que a “nucleína” era na verdade
composta por uma fração protéica e outra ácida, denominada de “ácido nucléico”. No entanto, somente alguns anos depois, no final do século, é que
se passa a aceitar que o núcleo é o sítio físico onde se encontra o material genético, fato confirmado definitivamente em 1924. Na virada do século
XIX, Albrecht Kossel descobre as bases nitrogenadas do DNA, e por volta de 1930 verifica-se que os ácidos nucléicos podem ser tanto
ribonucléicos (RNA) quanto desoxiribonucléicos (DNA). A descoberta da estrutura tridimensional do DNA, em 1953, por Watson e Crick, foi um
marco decisivo na história do material genético. Alguns anos depois, é descoberto o modo de atuação das enzimas de restrição, dando grande
impulso à tecnologia do DNA recombinante e engenharia genética.
Muitas são as características que fazem do DNA o material genético por excelência. Antes de listá-las, vamos dar uma olhada nas funções, ou
características essenciais, que uma molécula deve possuir para que ela possa servir como material genético:
• Estabilidade física e química de tal forma a não perder informação com o passar do tempo, mas:
variação por mutação, para permitir a evolução e especiação
• Grande variedade de formas, ligadas às múltiplas funções em um organismo, e portanto:
habilidade de estocar grande quantidade de informação e de expressá-la nas células quando necessário
• Habilidade de transferir a informação para células-filhas, através da:
replicação de sua própria estrutura
O DNA, melhor do que qualquer outra molécula orgânica (RNA, proteínas, açúcares, ...) desempenha bem esse papel posto que ele apresenta:
•Estabilidade:
O esqueleto de açúcar-fosfato é extremamente estável
As ligações C-C no açúcar são resistentes ao ataque químico, exceto por ácidos sob altas temperaturas
A ligação fosfodiéster é um pouco menos estável e pode ser hidrolizada a temperatura ambiente, sob pH 2
Nota: no RNA, a presença do OH extra no C 2’ facilita a hidrólise, e portanto o RNA é menos estável: organismos que usam o
RNA como material genético precisam protegê-lo com uma capa protéica
As bases também são bastante estáveis (exceto C, que se desamina para U, que pareia com A e não com G)
•Segurança:
A molécula é redundante, de tal forma que uma cópia pode servir como modelo para possíveis correções de erros; a dupla hélice
também forma um ambiente hidrofóbico, de tal forma que a água é excluída e as bases e pontes de H sofrem pouco ataque
Uma série de experimentos, iniciados por volta de 1930 pelo médico Griffith, definiu que o DNA é o material genético na maioria dos organismos,
mas que alguns, particularmente vírus, apresentam o RNA como material genético.
A dupla hélice de DNA é composta por um esqueleto
açúcar-fosfato, que guarda as quatro bases nitrogenadas
(A, T, G, C) no seu interior, protegendo-as do ambiente.
Devido ao modo de arranjo das duas fitas, a polaridade de
cada um dos nucleotídeos é invertida (5´-3´ e 3´-5´).
No RNA, o açúcar é uma ribose, enquanto que no DNA o
açúcar é uma desoxirribose, que perdeu a hidroxila do
carbono 2.
O ácido fosfórico
Ligado ao carbono 5’ do açúcar; até três se ligam:
, , e , servindo como fonte de energia para a
formação da cadeia de DNA
No ácido nucléico,o carbono forma uma ligação
fosfodiéster, fazendo uma ponte entre dois
açúcares adjacentes
O
H
RNA
1´
3´
2´
4´
5´
O
H
O açúcar
Uma pentose (5 átomos de carbono) na forma estrutural de Haworth.
Note a numeração dos carbonos: 1´, 2´, 3´, 4´ e´5´
No DNA, a 2’-desoxirribose é uma estrutura padrão da ribose onde o
2’OH foi substituído por um H; no RNA, ambas hidroxilas
permanecem
As bases
Podem ser purinas (Adenina e
Guanina), com dois anéis, ou
pirimidinas (Citosina ou
Timidina), com apenas um
anel; no RNA, uma terceira
pirimidina, Uracila, é
encontrada
5 `
5 `3 `
3 `
O
O
H
O
O
O
H
O
V I S Ã O / R E V I S Ã O
Um nucleotídeo:
Base + Açúcar + P
VISÃO/REVISÃO – 3
REPLICAÇÃO
O DOGMA CENTRAL
O “Dogma Central” de Crick, proposto em 1958, postula que a informação biológica é primeiro
transferida ao RNA e depois à proteína. O dogma também postulava que havia apenas uma
direção nesse processo, e que o RNA não poderia orientar a síntese de DNA. Esta afirmativa foi
provada errada em 1970, quando Temin e Baltimore descobriram que alguns vírus transmitem a
informação do RNA para o DNA. Pela sua descoberta, Baltimore, Temim e Renato Dulbecco
receberam o Prêmio Nobel de Medicina de 1975. A descoberta da transcriptase reversa foi, na
época, considerada uma heresia, já que contrariava o Dogma Central proposto por Crick.
Independentemente dessa incorreção, a transmissão da informação na maioria dos organismos
ainda vai de DNA para RNA para proteína. A REPLICAÇÃO é um processo que ocorre
sempre que a célula ou o organismo se divide, independentemente da transcrição ou tradução. A
passagem de DNA para RNA se chama TRANSCRIÇÃO, enquanto que a passagem de RNA
para proteína se chama TRADUÇÃO.
A replicação é um processo essencial para
que haja a multiplicação celular, já que as
células-filhas precisam receber a informação
genética. Ele parte de uma cadeia dupla de
DNA para gerar duas novas cadeias duplas
de DNA de um modo semi-conservativo:
cada cadeia-filha contém metade da cadeia-
mãe e metade recém-sintetizada. O processo
é gerido pelas DNA polimerases. Além das
DNA polimerases, várias outras enzimas
participam do processo. Na figura ao lado, é
apresentada uma visão geral da replicação.
Note que, devido à polaridade inversa dos
dois polinucleotídeos, e ao fato que a
polimerização ocorre apenas no sentido 5´-
3´, uma das fitas deve ser “enrolada” na
DNA polimerase.
Os esquemas abaixo e ao lado representam
alguns dos passos essenciais na replicação,
tanto em procariontes quanto em
eucariontes.
DNA
RNA
Proteína
5 ´
3 ´
3 ´
5 ´
2 – Abertura das fitas nas duas direções, formando duas forquilhas de replicação por origem (uma em procariontes,
várias em eucariontes), e manutenção das fitas abertas evitando a re-formação das pontes
3 – Colocação dos iniciadores, uma vez que as DNA polimerases são incapazes de iniciar a síntese; a enzima primase é
uma RNA polimerase, e portanto o iniciador é de RNA e não DNA
4 – Remoção da torção à frente das forquilhas, por ação de topoisomerase da DNA girase; essa torção é resultado da
deshelicoidização da dupla hélice nas forquilhas, e impõe uma restrição física à continuidade do processo
9 – Separação dos concatâmeros de DNA (procariontes) ou síntese dos telômeros, histonas e outras proteínas
associadas ao DNA (eucariontes), permitindo a finalização do processo
8 – União dos fragmentos de Okazaki, pela DNA ligase; os fragmentos são formados em ambas as fitas e em ambas as
direções, nas assim chamadas “fita contínua” e “fita descontínua” (“fita líder” e “fita retardada”)
7 – Remoção dos iniciadores e síntese de DNA no seu lugar, já que os mesmos são de RNA e não de DNA; a remoção
se dá por ação de exonuclease 5´- 3´ da DNA polimerase I, no mesmo sentido da síntese do DNA
6 – Correção de erros ocasionados pela colocação de nucleotídeos errados; a correção é constante durante a síntese, e
se dá por ação de exonuclease 3´- 5´ das DNA polimerases
1 – Localização da origem de replicação, uma sequência específica, com boxes ricos em As e Ts facilitando a quebra
das pontes de hidrogênio
5 –
Síntese
propria
mente
dita
VISÃO/REVISÃO – 4
TRANSCRIÇÃO
A transcrição é o processo que gera um RNA a partir de um DNA, e é o primeiro passo na passagem da informação do material genético para a
síntese de proteínas. As principais enzimas responsáveis pelo processo são as chamadas RNA polimerases, e mais uma vez há diferenças entre as
enzimas de procariontes e de eucariontes. São gerados três tipos principais de RNAs: mRNA, tRNA e rRNA, cada um com uma função
especializada.
Em termos gerais, o processo é semelhante à replicação, mas apenas um pequeno segmento de uma fita de DNA é copiado: aquele correspondente
ao gene que está sendo transcrito. Uma outra diferença é que o produto da transcrição é uma fita simples de RNA, que se libera do DNA após
sintetizada, sendo que o DNA volta a se enrolar ao final do processo. A figura abaixo dá uma visão geral dos eventos que ocorrem na transcrição:
3 ´
5 ´
RNA polimerase,
composta pelas
diversas subunidades;
a enzima completa
ocupa cerca de 100
pares de bases (pb)
RNA nascente
Híbrido DNA/RNA (cerca de 8 pb)
“Bolha” de transcrição
compreende cerca de 17 pares
de bases (pb)
Fita molde (serve de molde
para a RNA polimerase)
3 ´
5 ´
Direção da síntese do RNA e do movimento da bolha
O DNA é novamente enrolado
nesta extremidade, por ação de
topoisomerase
O DNA é
desenrolado à frente
da bolha, por ação
de topoisomerase
O CÓDIGO GENÉTICO
O código genético pode ser definido como o conjunto
de regras que ditam a sequência de aminoácidos de
uma proteína a partir da sequência de nucleotídeos do
mRNA que deu origem a essa proteína.
Sua elucidação foi resultado de vários experimentos, e
hoje se sabe que ele é composto por 64 códons de três
bases, sendo que um dos códons indica o local de início
da síntese (e também codifica para o aminoácido
metionina) e três são específicos do término da tradução.
Assim, existem 61 códons que codificam para
aminoácidos; como há apenas 20 aminoácidos, então
muitos deles são codificados por mais de um códon,
sendo portanto o código genético denominado de
“redundante”.
Essa redundância permite o agrupamento dos códons em
“famílias”; por exemplo, a valina é codificada por uma
família de quatro membros: GUU, GUC, GUA e GUG.
Olhando as características dessa família, percebe-se que
todos os membros tem o mesmo sobrenome (GU),
variando apenas no nome final: U, C, A, G.
VISÃO/REVISÃO – 5
A síntese é complementar a uma das fitas do DNA, e cerca de 17 pb se encontram abertos em um determinado momento.
A bolha de transcrição se move na medida em que o RNA é sintetizado, sendo que o DNA é aberto à frente da bolha e fechado novamente após a
transcrição. Isto faz com que o DNA seja rotacionado, conforme demonstram as setas; é importante a ação de topoisomerases neste processo.
Parte da RNA polimerase está em contato íntimo com o DNA ainda fechado, à frente da bolha, e o restante com a fita aberta, somando cerca de
100 pb.
P A
A cadeia
polipeptídica já
contém três
resíduos de
aminoácidos
desligados de
tRNAs, e mais um
quarto, ainda ligado
ao tRNA
O quarto aminoácido ainda está ligado ao seu
tRNA, mas já houve a formação da ligação
peptídica pela enzima peptidil-transferaseUma nova ligação peptídica, entre os resíduos 4 e
5, forma-se, presumivelmente por ocasião da
translocação do complexo para o próximo códon
A tradução é o último passo na conversão da informação do DNA para proteína. Ela começa com a montagem do complexo, composto pelas duas
subunidades ribossômicas com os seus três “sítios”: A (aminoácido), P (polipeptídeo) e S (saída). Uma vez reconhecido o códon de iniciação,
geralmente AUG, conforme visto na tabela do código genético, os tRNAs começam a chegar, em resposta à leitura dos códons pelos ribossomos.
Após o início da síntese, a adição de cada novo aminoácido passa por três etapas, envolvendo: (i) a formação de uma ligação peptídica entre o
novo aminoácido e a cadeia peptídica; (ii) o rompimento da ligação de alta energia que foi feita durante a aminoacilação do tRNA; e (iii) a
translocação de todo o sistema para o próximo códon. O ciclo é repetido várias vezes, até que um códon de finalização seja encontrado. Nos
diagramas abaixo, é demonstrada uma translocação do complexo, com a adição do novo aminoácido “5” à proteína em formação.
P A S
P A
5 3 1 2 3 4 5 6 7 8
5
1
2
3
4
P A S
5 3 1 2 3 4 5 6 7 8
1
2
3
4
5
O quinto aminoácido com o seu tRNA
ocupa o sítio A e ainda não está ligado à
cadeia
O tRNA do
terceiro
aminoácido
agora está
livre, ao
mesmo tempo
em que o
quarto passou
para o sítio S
e em seguida
se liberará
A ligação entre o quarto aminoácido e seu
tRNA rompe-se por hidrólise
O próximo tRNA, com
o resíduo de
aminoácido 6,
aproxima-se do sítio A
para formar pares de
bases com o seu
códon
P A S
P A
5 3 1 2 3 4 5 6 7 8
5
1
2
3
4
As duas subunidades do
ribossomo se movem um códon
à frente; é possível que esse
movimento seja descoordenado,
no sentido em que a subunidade
maior mova-se antes, deixando
um desalinhamento transitório
entre os sítios A e P das duas
subunidades; a isso, seria
seguido o movimento da
subunidade menor
TRADUÇÃO
VISÃO/REVISÃO – 6
CONTROLE DA EXPRESSÃO GÊNICA
MUTAÇÕES
O que é controlar a expressão gênica? É decidir se:
Um gene vai ser transcrito ou não, e em que nível
Um determinado mRNA é traduzido ou não, e em que nível
Quanto tempo um mRNA deve durar, e quantas vezes ele deve ser traduzido
Quanto tempo a proteína deve durar
OU: Uma combinação de um ou vários desses fatores
Isto para uma determinada célula e/ou um determinado instante e/ou um determinado ambiente, e/ou ....
Quem toma a decisão, e como ela é tomada?
Primeiro, alguns genes não são regulados, ou são muito pouco
Segundo, alguns genes precisam ser “empurrados” – induz a transcrição/tradução
Terceiro, alguns genes precisam ser “segurados” – reprime a transcrição/tradução
No fundo, são moléculas de ligação ao DNA que ativam ou desativam o processo.
Quem são elas? Os ativadores, transativadores, repressores, fatores de transcrição, etc, ...
Em que tipos de situação pode ocorrer a regulação – alguns exemplos:
1. um substrato está disponível para ser usado, e então induz a expressão de genes para enzimas que possam utilizá-lo (ex. lactose)
2. um substrato “melhor” está disponível para ser usado, e reprime a utilização do substrato “pior” (ex. glicose versus lactose)
3. uma determinada molécula é produzida, atinge os níveis que são necessários na célula, e então envia um sinal dizendo: “não
precisa mais me fazer...” (ex. um aminoácido)
4. uma célula tenta traduzir um mRNA mas não consegue por falta de aminoácidos no meio, e então manda uma mensagem dizendo:
“não há aminoácidos disponíveis para traduzir a mensagem, não a faça”
5. para fazer um conjunto (ex. os ribossomos) precisam-se de 1 unidade de cada a, b e c; se fizer 1.000 de a e somente 1 de b e c,
sobram 999 destes dois últimos, então mande um sinal dizendo: “não faça mais a”; ou melhor ainda, regule de tal forma que a
síntese de a, b e c seja coordenada
6. há erros ocorrendo na replicação do DNA, envie enzimas SOS para reparar os erros
7. há muita necessidade de uma determinada proteína, então aumente o número de duplas-hélices de DNA na região contendo o gene
para esta proteína
8. a célula está se intoxicando com um metal pesado, e esse mesmo metal aumenta a transcrição de genes para proteínas que irão
seqüestrá-lo do meio, detoxificando as células
9. como fazer com que um ovo de Drosophila recém posto se transforme em uma mosca das frutas?
Genes maternais estabelecem gradientes; cada gene produz fatores de transcrição que irão ativar outros genes que
produzem outros fatores que ativam outros genes que produzem outros fatores que ativam outros genes (...) que
produzem outros fatores que fazem algo importante além de ativar outros genes... (exemplos Bicoid e Nanos controlam
Caudal, Pumilio e Hunchback...)
Genes de segmentação: estabelecem os segmentos (ex. Fushi-tarazu) – mesma situação acima
Quando ocorrem mutações:
Erros na replicação
Efeito de um mutágeno
Mutações na sequência de DNA:
Ponto – substitui a por b
Inversão – de a-b para b-a
Inserção – de a-b para a-x-b
Deleção – de a-x-b para a-b
Toda a mutação é “visível” (expressa)? Não!
Silenciosa – terceira posição de códons redundantes
Sentido trocado – na primeira ou segunda posições ---
Efeito?
Sem sentido – finaliza uma proteína por introduzir códon
de finalização
Uma mutação pode ser revertida? Sim!
Uma segunda mutação no mesmo sítio reverte a
primeira (hot spot)
Uma segunda mutação em outro sítio do mesmo gene
reverte a primeira
Uma mutação em um outro gene restaura o fenótipo
Quem causa mutações? Mutágenos
5-Bromo-uracil, pareia com A ou G
Agentes intercalantes como o brometo de etídio –
mudança da matriz de leitura
Luz ultra-violeta – dímeros de timina = deleções na
replicação do DNA
Como reparar as mutações?
Excisão de bases, ex. remoção de U (citosina
desaminada) do DNA, causando sítio apurínico que
precisa ser reparado
Mau pareamento – importância da metilação das fitas
Excisão de segmentos
O que é uma mutação? Em palavras simples, é a mudança na sequência de bases de um segmento de DNA, com a possível – mas não
obrigatória... – mudança na composição dos aminoácidos de uma proteína (se a mutação ocorreu em um gene).
Qual a diferença entre “mutações” e “recombinações”? A mutação é um evento localizado, geralmente indesejável, e de pequena extensão
(mas às vezes grande efeito); já a recombinação é um evento de maior extensão, e envolve a troca (desejável – variação genética) entre
material genético de gametas.
VISÃO/REVISÃO – 7
TECNOLOGIA DO DNA RECOMBINANTE & TÓPICOS CORRELACIONADOS
Ácido Nucléico
mRNA isolado ou DNA genômico
Transformação/transfecção
Introdução do recombinante na
célula hospedeira
Replicação
Obtenção de múltiplas cópias do
vetor recombinante
Avaliação
Identificação do vetor desejado
com inserido
Isolamento e análise
Seqüenciamento
Mutagênese in vitro
Expressão de proteína
Vetor quimérico
Corte do DNA do doador e do
vetor, e recombinação
A CLONAGEM ENVOLVE SETE
ETAPAS VITAIS
Qualquer estratégia com sucesso de
clonagem, independente de sua
complexidade geral, emprega um ciclo
composto de seis etapas essenciais:
(1) Obtenção e preparo de DNA em
dupla-fita ou fragmentos de cDNA
contendo extremidades5' e 3'
compatíveis com sítios criados no interior
de vetores de clonagem.
(2) Inserção dos fragmentos de DNA em
um vetor de clonagem, por associação, e
ligação do vetor com as extremidades 3' e
5' do DNA.
(3) Introdução do vetor recombinante
recém-formado em uma célula hospedeira
apropriada.
(4) Replicação do vetor recombinante no
interior de células hospedeiras.
(5) Seleção primária dos vetores
recombinantes através de genes
repórteres ou de antibióticos.
(6) Seleção e expansão de clones
individuais de células portadoras dos
recombinantes desejáveis.
(7) Isolamento e análise dos inseridos de
DNA e/ou seus produtos protéicos
expressos.
Seleção primária
Identificação de vetores com
inseridos (antibióticos, repórteres)
OBTENÇÃO DO DNA
O primeiro passo para se fazer DNA recombinante é a obtenção do DNA do organismo doador (aquele que será estudado) e do vetor (aquele que receberá o
DNA clonado). O DNA poderá ser genômico, ou convertido em cDNA (DNA complementar) a partir de mRNA. Existem vários métodos de extração de
DNA, desde os mais simples, que podem ser realizados inclusive em um ambiente doméstico, até métodos mais complexos, que demandam equipamentos
laboratoriais mais sofisticados. A aplicação de um ou outro vai depender, dentre outros fatores, da pureza que se deseja para o DNA a ser obtido.
Apesar das diferenças, a maioria dos protocolos seguem três passos:
1 – Rompimento das células e das membranas, o que permite a liberação do DNA. Os agentes mais comuns para a obtenção de lise das membranas são os
detergentes.
2 – Separação dos restos celulares, tais como paredes e membranas.
3 – Eliminação de contaminantes, por tratamentos enzimáticos ou químicos, eliminando proteínas, fenóis e outras macromoléculas; se desejável, RNA
“contaminante” poderá ser eliminado de preparações de DNA.
ELETROFORESE E VISUALIZAÇÃO DO DNA
O DNA de diferentes tamanhos e conformações pode ser separado por
eletroforese, que é a migração de partículas eletricamente carregadas quando
submetidas a um campo elétrico, útil para a separação de proteínas e de ácidos
nucléicos. No caso do DNA, que é carregado negativamente por causa do
esqueleto contendo resíduos de P negativos, o DNA migra para o pólo
positivo; as moléculas menores correm mais rápido. Como suporte utilizam-se
géis de agarose, ágar ou poliacrilamida.
Para a visualização, o corante mais comum é o
brometo de etídio; este corante se intercala
entre as bases dos ácidos nucléicos e floresce
em laranja quando iluminado por luz
ultravioleta. Porém, ele é um mutagênico
potente (assim como a luz ultravioleta!),
portanto todo o cuidado deve ser tomado.
Outros corantes são menos perigosos – por
exemplo SyberSafe e nitrato de prata.
VISÃO/REVISÃO – 8
A recombinação genética implica a nova combinação de genes, seja de forma natural, por exemplo
por reprodução sexual, transfecção ou conjugação, seja artificialmente, através da tecnologia do
DNA recombinante in vitro. Na tecnologia do DNA recombinante, as moléculas de DNA não têm
que ser semelhantes, nem mesmo homólogas. A engenharia genética utiliza a tecnologia do DNA
recombinante para fundir segmentos de DNA e vetores, e em seguida cloná-los em células
hospedeiras. Isto se baseia na propriedade das endonucleases de restrição de cortar o DNA em sítios
específicos, bem como na propriedade da DNA ligase de unir os fragmentos cortados. O
desenvolvimento de outros métodos essenciais relacionados à química dos ácidos nucléicos teve
importância fundamental nessa tecnologia. Dentre as várias aplicações desta tecnologia, podem ser
citados:
1 – Produção de proteínas recombinantes, por exemplo insulina humana, vacina contra a hepatite
B, interferon-alfa e hormônio do crescimento humano.
2 – Terapia gênica, para a cura de doenças genéticas.
3 – Solução de delitos, em laboratórios de investigações criminais, para comparar sangue, cabelo e
esperma de supostos criminosos, e na antropologia, por exemplo para analisar genes de múmias.
4 – Projetos “genoma” de organismos, para clonar todo o DNA de um organismo, bem como
seqüencia-lo, localizando assim genes, regiões gênicas de interesse, regiões que podem vir a servir
como marcadores moleculares, etc...
5 – Criação de plantas e animais transgênicos, por exemplo, a quase totalidade das lavouras de
soja já emprega sementes modificadas para resistência a herbicida.
6 – Estudo de estrutura de genomas e genes, para o estudo de genes localizados em genomas, a
sua regulação e controle (o que ultimamente implica sua expressão) in vitro, através da criação de
moléculas recombinantes.
7 – Diagnóstico de doenças, oferecendo alternativas biotecnológicas para o diagnóstico de doenças,
utilizando a clonagem e seqüenciamento, para a identificação de mutações ligadas a doenças, os
testes do tipo Southern e northern, os biochips, dentre tantas outras técnicas.
8 – Melhoramento genético assistido, permitindo avanços no melhoramento genético de plantas e
animais através da seleção assistida por marcadores ligados a genes de interesse.
CORTE DO DNA: ENZIMAS DE RESTRIÇÃO
Um dos requerimentos para a tecnologia do DNA recombinante é a necessidade de se cortar o
DNA de forma reprodutível, o que foi conseguido a partir de 1970 com a descoberta das enzimas
de restrição.
O que são enzimas de restrição? Enzimas que, na natureza, restringem a entrada de DNA
estrangeiro em células bacterianas. Estas enzimas são um mecanismo natural das bactérias para se
protegerem contra infecção por vírus, e agem através do corte do DNA invasor.
EcoRI ↓
5 ´ G A A T T C 3 ´
III II II II II III
3 ´ C T T A A G 5 ´
↑
SmaI ↓
5 ´ C C C G G G 3 ´
III III III III III III
3 ´ G G G C C C 5 ´
↑
EcoRI ↓
5 ´ G A A T T C 3 ´
III II II II II III
3 ´ C T T A A G 5 ´
↑
SmaI ↓
5 ´ C C C G G G 3 ´
III III III III III III
3 ´ G G G C C C 5 ´
↑
Como essas enzimas funcionam? Elas geralmente têm um sítio palindrômico de reconhecimento,
de 4 a 8 pb e, ao reconhecê-lo, promovem o corte do DNA, pela hidrólise do arcabouço açúcar-
fosfato. Dois tipos de cortes e extremidades são feitos:
-cortes em ziguezague, produzindo extremidades coesivas
-cortes perpendiculares, produzindo extremidades rombas (“cegas”)
O DNA É CLONADO EM VETORES
Vetores podem ser descritos como veículos utilizados, em biologia molecular, para
transportar, multiplicar ou expressar segmentos de DNA em vários organismos. Os mesmos
são classificados segundo sua finalidade, conforme os próprios nomes explicam:
Vetores de clonagem: para multiplicar DNA para estudos de genomas, localização de genes,
etc... Vão desde plasmídios, fagos, cosmídios, BACs, YACs, até MACs; o que varia é o
tamanho, facilidade de manipulação, tamanho do DNA clonado, ....
Vetores de expressão: contém um sítio de clonagem logo abaixo de um promotor,
direcionando a produção do produto codificado pelo gene clonado.
Vetores de transformação: contém genes que direcionam o transporte e a inserção do DNA
estrangeiro em um cromossomo eucarioto; exemplo é o plasmídio pTi de Agrobacterium
tumefaciens.
VISÃO/REVISÃO – 9
GENES SELETIVOS E REPÓRTERES AUXILIAM NA SELEÇÃO DOS TRANSFORMANTES
Gene seletivo é definido como aquele que codifica para resistência a um antibiótico ou um composto tóxico, e que permite a
seleção de sua presença em um organismo. A seleção para a eficiência da transformaçãoé feita pela adição do antibiótico ou do
composto no meio de cultura. Os genes mais comuns conferem resistência a ampicilina, cloranfenicol, canamicina, neomicina e
tetraciclina.
Gene repórter é definido como aquele que, ao ser expresso em um organismo transformado, produz uma atividade
facilmente detectável por meios histoquímicos ou visuais, atividade essa que não é normalmente expressa em organismos não
transformados, permitindo portanto a diferenciação entre transformados e não transformados. Dois genes comumente utilizados
são o gus (= uidA) e o lucA; para o primeiro, é produzida uma reação de cor azul facilmente detectável; já o gene luc produz
uma luminescência detectável em plantas e bactérias transgênicas.
UMA COLEÇÃO DE CLONES FORMA
UMA “BIBLIOTECA”
O que são bibliotecas? São coleções de fragmentos de DNA,
utilizadas em processos tais como projetos genoma, localização de
genes, etc... São feitas em vetores de clonagem, cada um recebendo
um pequeno fragmento do todo; ao conjunto desses vetores com os
fragmentos se chama biblioteca.
Quais as fontes do DNA das bibliotecas? Pode ser o DNA
genômico fragmentado, ou cDNA (mRNA convertido em DNA por
ação enzimática).
O que um e outro tipo de biblioteca contem? Bibliotecas
genômicas: todo o DNA, seja codificante ou não; cDNA: apenas
segmentos codificados em um determinado momento, ou
determinado órgão, ou determinado ambiente (na verdade, uma
combinação de todos – órgão (ou tecido), momento, ambiente,
nível nutricional, etc...) – o que estava sendo expresso quando a
biblioteca foi feita.
SONDAS E HIBRIDIZAÇÃO
A capacidade de duas cadeias complementares se hibridizarem (associarem) para formar
um duplex estável constitui o cerne de muitos métodos de análise e manipulação do
DNA recombinante. Esta característica dos ácidos nucléicos é explorada por métodos
para detecção de sequências específicas, no interior de polinucleotídeos tanto do RNA
como do DNA.
Uma variedade de tais métodos de detecção de sequências específicas já foi
desenvolvida. Cada um difere em seus requerimentos quanto ao tipo de molécula que
detecta (por exemplo, RNA ou DNA) e comprimento (isto é, de oligonucleotídeos curtos
a polinucleotídeos longos) de sondas de ácido nucléico, bem como quanto às
estratégias empregadas de marcação/ detecção.
Principais tipos de ensaios
Southern: DNA, usando DNA/RNA como sonda
Northern: RNA, usando DNA/RNA como sonda
Western: proteínas, usando anticorpos como sonda
Vantagens de transferências: a grande vantagem da transferência de DNA ou de RNA de
um gel para uma membrana reside na durabilidade e versatilidade das membranas de
nylon ou nitrocelulose, comparadas com agarose ou acrilamida. Assim, uma vez
transferido para a membrana, o ácido nucléico pode ser fixado e testado repetidas vezes
com sondas, o que não seria possível em géis.
COMO SE DESENHA UMA SONDA E COMO ELA É TORNADA “VISÍVEL”?
Sondas: como desenhar: para se desenhar uma sonda, deve-se ter alguma informação sobre a sequência desejada, o que pode vir de genes semelhantes, genes
clonados, ou a partir do produto gênico, a proteína:
A partir de ácido nucléico: clonar ou selecionar o segmento desejado.
A partir de proteínas: escolher o segmento de menor redundância, e desenhar a sonda.
Desenhado sondas
de ácidos nucléicos
a partir de proteínas
Uma das situações
possíveis é que se
conheça a proteína, e
se queira encontrar o
gene que a codifica.
Com o conhecimento
da sequência de
aminoácidos, várias
sondas podem ser
desenhadas a partir
de regiões pouco
degeneradas.
H3N Gli Leu Pro Trp Glu Asp Met Trp Phe Val Arg
(5´) GGU UUA CCU UGG GAA GAU AUG UGG UUU GUU AGA
Polipeptídio
conhecido
GGC UUG CCC GAG GAC UUC GUC AGG
GGA CUU CCA GUA CGU
GGG CUC CCG GUG CGC
CUA CGA
Diferentes
codons que
codificam
para essa
seqüência
CUG CGG
GAA GAU
UGG
GAG GAC
AUG UGG UU
GAA GAU UUU
UGG
GAG GAC
AUG UGG
UUC
GU
Sondas com 17 nucleotídeos de comprimento; 4
possíveis sequências
Sondas com 20 nucleotídeos de comprimento; 8
possíveis sequências
Sondas: porque marcar? Como o DNA e o RNA são “invisíveis”, para que eles sejam visualizados os mesmos devem receber uma marca visível.
Sondas: com o que marcar?
Marcadores radioativos: por exemplo fósforo; problemas são com tempo (demora até dias para revelar), risco (radioatividade é mutagênica) e pouca
sensibilidade.
Marcadores não-radioativos: não apresentam risco, e está é a tendência atual na maioria dos protocolos.
• Biotina: muito usada em protocolos de captura por conjugados de avidin ou streptavidin; são adicionados na extremidade 5´; múltiplos monômeros
podem ser adicionados em protocolos de captura com conjugados anticorpo-enzima anti-biotina.
• Digoxigenina: adicionada na forma de um único monômero na extremidade 5´; facilmente detectável por meio de conjugado anticorpo-enzima.
• Dinitrofenil (DNP): adiciona uma cor amarelo-brilhante, e pode ser facilmente detectado por meio de conjugados anticorpo-enzima anti-DNP.
• Corantes fluorescentes: o grupo mais promissor; adicionados como única cópia na extremidade 5´; há vários deles, por exemplo os baseados em
rodamina, como ROX e TAMRA, e os derivativos de fluoresceina, como JOE, FAM, HEX e TET.
Onde e como marcar: para os radioativos, marcação interna (ex. translação de corte, PCR, mRNA por vetor de expressão) ou nas extremidades (terminal
transferase); para os não radioativos, marcação é geralmente na extremidade, por ligação cruzada.
VISÃO/REVISÃO – 10
FISH: Fluorescent in situ hybridization
A hibridação in situ é um método que permite identificar a posição, em um cromossomo, onde se localiza uma determinada sequência de DNA
previamente conhecida, e se baseia no mesmo princípio do Southern blot, ou seja, complementariedade sonda-alvo. Para a sua realização, cromossomos
em metáfase são fixados em uma superfície sólida (via de regra um slide de microscopia), desnaturados para fita-simples, e sondados com uma sonda
marcada com um fluorocromo, o que permite a visualização da região cromossômica complementar à sonda. Quando se utiliza mais de uma sonda, cada
qual marcada com um diferente fluoróforo, a técnica recebe a denominação de FISH multiplex. A técnica é muito potente para a detecção de mutações,
particularmente deleções e inversões, bem como para a verificação de duplicações ou deleções de cromossomos inteiros, bem como outras formas de
rearranjos cromossómicos.
O que são “chips”? Uma
miniaturização dos ensaios que
envolvem transferência para
membranas. O DNA a ser testado é
imobilizado em uma superfície
sólida, e testado com a sonda de
interesse (ou vice-versa). Vão desde
membranas de nylon de alta
densidade (nylon macroarrays e
microarrays) até os oligochips.
O mRNA dos indivíduos a serem testados é extraído
(ex.: mesma espécie, diferentes estádios de desenvolvimento)
e convertido em cDNA utilizando fluoróforos diferentes
A expressão gênica pode ser verificada pelo anelamento diferencial dos cDNAs a diferentes
compartimentos do chip de DNA, após leitura com raio laser no equipamento apropriado. Isto
indica genes que são expressos somente nas fases iniciais, genes expressos nas fases adultas,
ou genes expressos constitutivamente
Os dois cDNAs são vertidos sobre o microarray, que contém compartimentos onde diferentes
DNAs conhecidos foram imobilizados
VISÃO/REVISÃO – 11
Fonte:
Wikipedia
Na figura ao lado, o DNA expressopor células em diferentes estádios de
desenvolvimento de aves foi convertido em cDNA usando dNTPs com diferentes
corantes, enquanto que sequências de DNA do organismo foram imobilizadas no vidro.
Os cDNAs fluorescentes anelam-se às suas sequências complementares. Após lavagem
para remoção das sequências não hibridizadas, cada ponto com florescência representa
uma sequência expressa. Os pontos verdes representam genes expressos nos estádios
iniciais, enquanto que os pontos vermelhos representam sequências mais abundantes
em estádios mais avançados do desenvolvimento.
CHIPS DE DNA REPRESENTAM A “ÚLTIMA PALAVRA”
EM ENSAIOS DE HIBRIDIZAÇÃO PARA VERIFICAÇÃO DA
EXPRESSÃO DIFERENCIAL DE GENES
A TÉCNICA “SAGE” TAMBÉM É COMUMENTE EMPREGADA PARA VERIFICAR A EXPRESSÃO DIFERENCIAL
A técnica SAGE (Serial Analysis of Gene Expression) se
baseia na captura do mRNA, sua conversão em cDNA, e a
criação de uma “etiqueta” (“tag”) que o identifique de forma
única e inequívoca. O que esta por trás da técnica SAGE na
verdade é uma estimativa da frequência de ocorrência de cada
um dos transcritos de mRNA no momento/tecido/ambiente
onde a coleta foi feita.
Vamos exemplificar com dois transcritos, alfa e beta, em uma célula normal e uma célula doente. Se capturarmos os mRNAs de alfa e beta, os convertermos
em cDNA, e estimarmos sua abundância, podemos deduzir qual dos dois genes, alfa ou beta, esta ligado à doença em questão, conforme pode ser visto nos
dois gráficos acima, que apresentam um conjunto maior de genes (7), sendo que os genes 2, 4 e 6 são claramente super-expressos no indivíduo doente; já o
gene 7 é muito mais expresso no indivíduo sadio.
DNA PODE SER “FABRICADO” IN
VITRO, SEM AUXÍLIO DE ENZIMAS
Para a síntese de sondas, síntese de
iniciadores para PCR, síntese de
chips, síntese de genes, e outras
aplicações, é possível se fazer DNA
sem um molde; isto é feito in vitro,
em uma abordagem completamente
diferente da síntese enzimática. Esta
envolve uma base sólida, geralmente
sílica (nome proposto: in silico) e o
uso de nucleotídeos “protegidos”:
coloca um por vez (escolhido a gosto
do cliente), desprotege, coloca o
seguinte, etc...
Outra grande diferença é no sentido
da síntese: 3´-5´ (geralmente), ao
invés da síntese 5´-3´ enzimática.
Vantagem: grande número de sequências em pequeno espaço; por exemplo, no chips
tem-se até 1 milhão de elementos, cada um com 10.000.000 de cópias, em apenas
cerca de dois centímetros quadrados...
Principal uso: para verificar expressão diferencial; também úteis para quantificar
expressão gênica (que é uma forma de expressão diferencial ...) – projetos
transcriptoma.
DNA TAMBÉM PODE SER SEQÜENCIADO IN VITRO:
PROJETOS “GENOMA” E OUTRAS APLICAÇÕES
Abordagens: duas estratégias: corte de DNA, ou amplificação de DNA
•Corte: método de Maxam&Gilbert; envolve uso de produtos químicos (não são enzimas de
restrição) base-específicos (ou quase) e resolução em gel
•Amplificação: método de Sanger&outros; envolve uso de terminadores de cadeia (di-desoxi-
nucleotídeos) e resolução em analisadores automáticos com eletroforese capilar
Visualização: necessidade de marcação, radioativa ou por fluoróforos; o que se vê é a marca, não o DNA.
Uso: principalmente para os projetos genoma; exemplo - genoma humano.
Automação: o método da clivagem química foi abandonado, já que o método didesoxi conseguiu ser automatizado
Cálculo do Manihatis (métodos tradicionais – versões iniciais): 1 pessoa: aproximadamente 2.100 nt/semana (1 dia para preparar DNA, 1 dia para
seqüenciar, 1 dia para “ler” o gel, 2 dias para repetir/reanalisar; em média, repete a mesma sequência 5 vezes – sobreposição dos clones e repetições
por resultados dúbios): E. coli: 42 anos; Drosófila: 1.510 anos; Humanos: 27.472 anos; Milho: 457.880 anos; Salamandra: 824.400 anos.
Com a automação e vários laboratórios trabalhando ao mesmo tempo, hoje se pode seqüenciar praticamente todo o genoma humano em poucos
meses...
Acima, são vistas as etapas da análise de um gel de seqüenciamento pelo método didesoxi. No primeiro gel (1), cada uma das bases foi corrida em uma
coluna diferente do gel. No entanto, com o advento dos marcadores coloridos, isto não é mais necessário, e se pode correr apenas uma coluna do gel
com as quatro bases sequenciadas (2). De fato, os sequenciadores modernos possuem pentes capilares de eletroforese, que são interpretados por leitores
laser (3), os quais gerarão os eletroforegramas coloridos, que podem ser facilmente reconvertidos na sequência de DNA que se deseja (4).
Ao lado, são mostrados um
sequenciador automático, e um pente
com 16 capilares, que é capaz de
sequenciar 16 DNAs ao mesmo
tempo.
Abaixo, uma sala de seqüenciamento
de um grande laboratório.
C G T T C G A
A T G C
1 2 3
4
Fonte de laser Leitor
Direção da
eletroforese
Um 2´, 3´, didesoxinucleotídeo trifosfato
H H
P-P-P-
VISÃO/REVISÃO – 12
3´------- A T T C G C A T A G -5´
Amplificação com A* Amplificação com T* Amplificação com G* Amplificação com C*
TA T TAAG TAAGC
TAA TAAGCGT TAAGCG TAAGCGTATC
TAAGCGTA TAAGCGTAT
O Projeto Genoma Humano é um empreendimento internacional, iniciado formalmente em 1990 e projetado para durar 15 anos, com os seguintes objetivos:
Identificar e fazer o mapeamento dos cerca de 80 mil genes que se calculava existirem no DNA das células do corpo humano;
Determinar as sequências dos 3 bilhões de bases químicas que compõem o DNA humano.
SITUAÇÃO EM 1990:
4.550 genes humanos haviam sido identificados;
cerca de 1.500 genes haviam sido associados a localizações específicas nos cromossomos;
apenas algumas, dentre cerca de 4.000 doenças genéticas existentes, haviam sido entendidas em um nível molecular.
SITUAÇÃO EM 1998, 8 ANOS APÓS O INÍCIO:
Mapeamento genético: mais de 7.000 genes foram mapeados a cromossomos particulares. Além destes, o Banco de Dados do Projeto Genoma guarda
informação sobre outros genes identificados, cuja localização nos cromossomos ainda não foi inequivocamente determinada.
Seqüenciamento: somente de 4% das bases do genoma humano foi sequenciado
SITUAÇÃO EM FEVEREIRO DE 2001 – Versões-rascunho
Em fevereiro de 2001, simultaneamente ao anúncio da empresa norte-americana Celera, o PGH anunciou as primeiras transcrições quase completas do
código genético humano. O número de genes existentes, segundo os cálculos de ambas as equipes de pesquisadores, não chega a 40 mil. Os resultados foram
publicados em duas revistas diferentes. A revista inglesa Nature publicou o trabalho dos pesquisadores do PGH, liderados por Francis Collins, e a norte-
americana Science, o dos pesquisadores da Celera, liderados pelo empresário-cientista Craig Venter.
AVANÇOS IMPORTANTES QUE CONTRIBUIRAM PARA O ACELERAMENTO DA GERAÇÃO DE INFORMAÇÕES:
Avanço 1: método da terminação de cadeia, por Sanger e colaboradores, em 1977, que foi aperfeiçoado em 1986, por Hood e colaboradores, com a inclusão
dos terminadores fluorescentes, permitindo assim a automação do método.
Avanço 2: introdução dos cromossomos bacterianos artificiais (BACs), um sistema de clonagem que permite grandes insertos e que se mostrou mais estável
do que os cosmídios ou os cromossomos artificiais de levedura (YACs).
ESTRATÉRIAS ADOTADAS PARA O SEQÜENCIAMENTO:
Shotgun, adotada pela Celera Genomics, baseia-se na obtenção de
uma biblioteca completa, feita em plasmídios com uma variedade de
tamanhos de insertos, representandoigualmente todas as partes do
genoma. O DNA é completamente fragmentado e clonado nos
plasmídios.
Problemas com a versão-rascunho: A sequência do IHGSC, por exemplo, omitia cerca de 10% do genoma, era interrompida por 150.000 falhas, e não conseguia
apresentar corretamente a ordem e a orientação de muitas sequências. Isto levou a esforços no sentido de completar uma versão final, que deveria ter no mínimo 95% das
sequências, e ter um erro máximo de uma base em 10.000. O objetivo era ambicioso, posto que o genoma humano é repleto de sequências repetitivas e duplicações
segmentais grandes, o que dificulta sobremaneira o seu seqüenciamento.
Na versão final, uma sequência quase completa é apresentada, com apenas 314 falhas, a maioria associada a duplicações segmentais, cuja resolução vai requerer novas
técnicas ainda não disponíveis. A taxa de erro é de cerca de uma base em 100.000, e a cobertura é superior a 90%. São ainda analisados os processos utilizados para o
seqüenciamento, a acurácia do processo, e são apresentadas possíveis aplicações biológicas do projeto.
No total, foram geradas sequências shotgun de 59.208 clones com grandes insertos, com o comprimento total de 5,84 Gb, sendo que para 45.742 delas as sequências foram
completamente geradas, com um comprimento total de 3.67 Gb. Os clones consistiram primariamente de BACs, YACs, fosmídios e cosmídios.
O genoma: a sequência consiste em 2.851.330.913 nucleotídeos, a maioria na região eucromática do genoma. Existem apenas 341 falhas, sendo que a maioria está em
regiões heterocromáticas, que não eram o alvo do projeto (198 Mb de heterocromatina, contra 28 Mb de eucromatina); portanto, o genoma completo tem cerca de 3,08 Gb,
com 2,88 Gb de eucromatina.
A qualidade: a taxa de redundância das sequências é de cerca de 1.000 vezes, o que garante uma excelente cobertura do genoma. O controle de qualidade das sequências
indica uma taxa de erro de 1,1 base por 100.000 bases para eventos pequenos (menos de 50 bp, com tamanho médio de 1,3 bp, particularmente SNPs) e de 0,03 bases por
100.000 bases para eventos grandes (particularmente VNTRs).
Análise de cDNAs: a presença de 17.458 cDNAs conhecidos, dando um total de 925 Mb, foi testada. A grande maioria (99,74%) pode ser corretamente posicionada no
novo mapa do genoma. Apenas 0,04% dos casos apresentaram diferenças substanciais (maiores do que 2%), quase sempre para genes relacionados a processos
imunológicos (por exemplo loci de histocompatibilidade, e loci relacionados a imunoglobulina), já sabidamente com alto polimorfismo.
Genes de proteínas: as estimativas iniciais do número de genes, antes do projeto genoma humano, chegavam à casa dos 100.000, e mesmo a versão inicial do genoma,
produzida em 2001, estimou cerca de 30.000 genes, o que hoje pode ser considerado como uma estimativa demasiada. Talvez o fato mais marcante do seqüenciamento seja
que apenas uma estimativa de 22.287 genes possa ser feita, dos quais 19.438 são genes já conhecidos e confirmados, e 2.188 são genes predizíveis. Esses genes tem um
total de 231.667 éxons (cerca de 10,4 éxons por locus), que cobrem apenas 34 Mb, ou 1,2% do genoma eucromático; outros 21 Mb (0,7%) correspondem a regiões não-
traduzidas dos genes.
Pseudogenes: já foram identificados cerca de 20.000 pseudogenes, tanto processados quanto nativos; presume-se que esse número esteja muito aquém da realidade, já que
os métodos disponíveis não conseguem identificar pseudogenes muito antigos ou que contém regiões não-transcritas; assim, pode-se seguramente predizer que o número
de pseudogenes supere o número de genes.
A VERSÃO FINAL DO GENOMA HUMANO – PROJETO PÚBLICO
Resumo do artigo “Finishing the euchromatic sequence of the human genome”, pelo International Human Genome Sequencing Consortium, publicado na revista Nature
n. 431, p. 931-945 (21 de outubro de 2004).
Sites: www.ncbi.nih.gov; www.genome.ucsc.edu; www.ensebl.org
Shotgun hierárquico, também conhecida como BAC-based ou clone-por-clone, envolve a geração e a organização de um
conjunto de clones com insertos grandes (100-200 kb cada), cobrindo todo o genoma, e o seqüenciamento por shotgun de
clones escolhidos. Como a informação da sequência é local, o problema de mal-composição é eliminado.
SHOTGUN SHOTGUN HIERÁRQUICO
VISÃO/REVISÃO – 13
VISÃO/REVISÃO – 14
OS PROJETOS “OMA” DERIVADOS DO
PROJETO GENOMA HUMANO
Como fruto do desenvolvimento de várias técnicas de biologia molecular, particularmente nas décadas de 1970 e 1980, a comunidade científica internacional mobilizou-se
para a aplicação dessas técnicas em prol da ciência, surgindo então várias ideias, começando pelo projeto GENOMA HUMANO, e depois derivando para vários projetos
correlatos, tais como os projetos PROTEOMA, EXOMA, 1.000 GENOMAS, e outros. A seguir veremos alguns detalhes mais significativos de cada um deles.
Estudos de variação genética entre indivíduos continuaram após a finalização do projeto genoma, tendo
sido criado o International HapMap Project, para identificar grupos populacionais que apresentam
SNPs em comum, denominados haplótipos ou “haps”, identificando assim os padrões de variação
genética humana, e procurando definir os padrões de variantes ligadas a doenças e a respostas a
medicamentos e a fatores ambientais.
O Personal Genome Project (PGP) é outra iniciativa para criar uma base de dados gratuita, com dados genômicos doados por
voluntários. O projeto foi inciado em 2005, por George Church, da Harvard Medical School. Uma das premissas do projeto é que “o
genoma é apenas parte da história: os genes interagem com o meio ambiente para formar as características individuais...”. Os
participantes do projeto informam seus dados de saúde, e a equipe do projeto tenta conectar esses indivíduos e essas informações com
outros centros de pesquisa. Abaixo alguns dos resultados até o momento obtidos.
1000 Genomes
A Deep Catalog of Human Genetic Variation
INTERNATIONAL CONSORTIUM ANNOUNCES THE 1000
GENOMES PROJECT
Major Sequencing Effort Will Produce Most Detailed Map Of Human Genetic
Variation to Support Disease Studies
O 1000 Genomes Project é um consórcio internacional entre a Inglaterra, a China e os
Estados Unidos que visa criar uma visão detalhada da utilidade médica com relação às
variações genéticas humanas, através do sequenciamento do genoma de pelo menos 1.000
pessoas. Os participantes da primeira fase do projeto foram extraídos do Projeto
Internacional HapMap.
O projeto Encyclopedia of DNA Elements (ENCODE) foi criado em 2003 para mapear regiões de transcrição, de fatores
associados a transcrição, de estrutura de cromatina e de modificações de histonas, permitindo que se associe funções bioquímicas a
cerca de 80% do genoma, particularmente fora de regiões tipicamente associadas a genes codificantes de proteínas, o que não foi
possível – e nem era o objetivo – no PGH. A meta é delinear todos os elementos funcionais que compõem o genoma humano. Esses
elementos podem ser definidos como um segmento genômico que codifica um produto (por exemplo uma proteína ou um RNA não
codificante), ou que mostra uma “assinatura bioquímica” (por exemplo, ligação a proteínas, ou uma estrutura de cromatina
específica).
A base de dados COSMIC (Catalogue Of Somatic Mutations In Cancer), ligada ao Wellcome Trust
Sanger Institute, é uma base de dados de mutações somáticas ligadas ao câncer, e serve como um catálogo
de dados de publicações científicas. Ela foi lançada em 2004, e em apenas seis anos já contava com dados de2,76 milhões de experimentos em 500.000 tumores, 150.000 mutações documentadas
Várias iniciativas que se seguiram-se ao Projeto Genoma Humano estavam ligadas a pesquisas sobre o
câncer. O International Cancer Genome Consortium (ICGC) foi organizado para coordenar um grande
número de projetos de pesquisa que tem a mesma finalidade: elucidar as mudanças genéticas presentes nas
várias formas de câncer. Uma das metas é gerar um catálogo das mutações somáticas, das expressões gênicas
anormais e das modificações epigenéticas em 50 diferentes tipos de câncer. No momento, o ICGP está
associado a 67 projetos no mundo inteiro, que estão estudando, ao todo, 25.000 genomas de tumores.
Outro projeto correlato, o Cancer Genome Anatomy Project, busca determinar o perfil de expressão em células
cancerígenas. Os dados gerados por esses projetos, bem como pelo Cancer Genome Characterization Initiative
(CGCI), são tornados disponíveis a toda a comunidade científica ligada ao tratamento e prevenção do câncer. Este
último projeto (assim como os outros, igualmente) incorpora métodos de caracterização incluindo exoma,
transcriptoma e sequenciamento de última geração.
O Cancer Genome Atlas compila dados de cerca de meio milhão de mutações ligadas ao câncer.
Uma das metas desta iniciativa é procurar por “assinaturas” de mutações, ou seja, o tipo de mutação
que ocorre e qual a sequência de DNA que circunda a região mutada.
O Brasil desenvolveu algumas iniciativas na área da genômica. A Fapesp criou em 1997 a rede ONSA
(Organization for the Nucleotide Sequencing and Analysis) – uma brincadeira para se contrapor à rede
americana TIGR (The Institute for Genomic Research). Essa rede é um instituto virtual de genômica que
reúne cerca de 35 laboratórios de universidades paulistas (USP, Unicamp e Unesp).
A PARTICIPAÇÃO BRASILEIRA
Uma das participações brasileiras no Genoma Humano se deu em pesquisas avançadas na área do câncer, através de uma
parceria com o Ludwig Institute for Cancer Research (LICR), que está representado no Brasil pelo Centro de Oncologia
Molecular do Hospital Sírio-Libanês.
Foi desenvolvido o Projeto Genoma Humano do Câncer (Human Genome Cancer Project – HCGP), que sequenciou mais de 1
milhão de fragmentos gênicos expressos (expressed sequences tags, ESTs),de diferentes tumores humanos. Atualmente, diversos
projetos estão em desenvolvimento utilizando informações geradas no HCGP e abrangem observar a expressão diferenciada dos genes
em diferentes tumores, caracterização completa de genes específicos, assim como o estudo funcional e estrutural dos produtos protéicos.
O Brasil desenvolve ainda vários projetos de sequenciamento, tais como o Projeto Xylella fastidiosa. Esta foi
uma das mais importantes iniciativas científicas do Brasil, e foi o primeiro fitopatógeno a ser sequenciado no
mundo. Os trabalhos, iniciados em outubro de 1997, finalizaram em janeiro de 2000, sendo publicados na revista
Nature. Os cientistas da rede Onsa sequenciaram os 2,7 milhões de pares de bases químicas do DNA da bactéria.
Cada um dos 35 laboratórios recebeu uma parte do genoma.
Também foram desenvolvidas iniciativas tais como o Genoma da Cana-de-Açúcar , Genoma do Eucalipto e
Genoma da bactéria Xanthomonas citri. Recentemente, um consórcio de instituições iniciou o Projeto
Genoma Onça-Pintada, que visa ao sequenciamento completo do material genético da espécie Panthera onca,
incluindo caracterização integrada de diversos tipos de informação molecular.
O DNA PODE SER AMPLIFICADO IN VITRO POR AÇÃO ENZIMÁTICA: A PCR
A PCR é um método para a síntese in vitro de várias cópias de DNA (ou de RNA) a partir de uma sequência-molde. Basicamente, os mesmos passos
seguidos para a síntese in vivo de DNA são seguidos na PCR, com a diferença que, por se ter um DNA in vitro e geralmente de tamanho menor do que
o total do genoma, muitas das “complicações” da síntese de DNA observadas em um organismo não estão presentes na PCR. Assim, por exemplo,
enzimas como DNA helicases e girases não são normalmente incluídas nas reações de PCR. A abertura da fita de DNA é feita por ação de calor, que
rompe as pontes de H entre as bases. No entanto, esse mesmo calor (acima dos 90 oC!!) desativa as polimerases normais, e a automação da PCR não foi
conseguida senão após o isolamento de uma DNA polimerase termo-estável encontrada no microrganismo Thermus aquaticus, habitante natural de
fontes naturais de água quente. A Taq polimerase é capaz de permanecer ativa durante os processos de desnaturação por temperatura elevada
requeridos no início de cada ciclo de amplificação. Outros microorganismos que possuem DNA polimerases termoestáveis são Pyrococus furiosus
(Pfu), P. woesei (Pwo), Thermus brockianus (Tbr), T. flacus (Tfl), T. litoralis (Tli), T. maritima (Tma) e T. thermophilus (Tth).
Dentre as aplicações, encontram-se: detecção de transgênicos – bactérias, plantas, produtos; clonagem de genes; diagnóstico de doenças; melhoramento
genético assistido por marcadores moleculares; estudos de filogenia, identidade genética e outros das áreas forense, botânica, etc.; construção e
marcação de moléculas de DNA, particularmente vetores; quantificação de transcritos, por exemplo carga viral para HIV.
VISÃO/REVISÃO – 15
Já que a PCR nada mais é do que uma replicação in vitro, devemos nos
preocupar em simular o mais fidedignamente possível o que acontece na
replicação. Para tanto, inicialmente vamos criar o ambiente onde a PCR irá
ocorrer, através da inclusão de um tampão adequado à DNA polimerase
no tubo onde será realizado o processo. Posteriormente, vamos incluir o
DNA-molde a ser amplificado, lembrando que apenas segmentos curtos,
via de regra com até 5.000 pares de bases, são amplificados na PCR.
Também será incluída uma DNA polimerase (por exemplo, Taq), bem
como um ou mais iniciadores sintéticos; estes são importantes por duas
razões: a) porque as DNAs polimerases são incapazes de iniciar a síntese
sem os mesmos; e b) porque eles é que delimitam, à direita e à esquerda, o
segmento que será amplificado. Finalmente, são essenciais os
desoxinucleotídeos trifostato A, T, G e C, já que eles são os blocos de
construção do novo DNA a ser amplificado.
"RECEITA" BÁSICA DE UMA PCR
1. Tampão adequado, com Mg
2. DNA molde a ser
amplificado
3. DNA polimerase
termoestável
4. Iniciador(es)
5. Desoxinucleotídeos: A, T,
G, C
Diferentemente da replicação in vivo que
ocorre a temperatura constante, de acordo
com cada organismo, a PCR tradicional
ocorre através de ciclos repetitivos,
compostos por três etapas básicas:
1. Etapa de desnaturação: as seqüências
do gene alvo são tomadas disponíveis
através de desnaturação por temperatura
elevada (90-96 oC), geralmente por 1-2
minutos. Às vezes, uma desnaturação inicial
por 5-10 minutos é feita, para assegurar que
todas as fitas sejam desnaturadas e para
que a polimerase seja ativada, se a PCR é
“hot-start”.
2. Etapa de anelamento: as extremidades
da seqüência gênica a ser copiada são
definidas pelo anelamento (hibridização) de
dois oligonucleotídeos sintéticos curtos,
denominados iniciadores da amplificação
("amplimers", “primers”). O anelamento
ocorre por 30 segundos a 2 minutos, a 30-
60 oC. A temperatura é escolhida no sentido
de assegurar hibridização específica, de
acordo com o produto desejado.
3. Etapa de extensão: as seqüências são
copiadas através da adição de novas bases
às extremidades 3' livres. Isto é usualmente
realizado a 72°C, que representa a atividade
ótima da DNA polimerase termoestável. O
tempo vai de 30 segundos a 2 minutos.
Geralmente uma “extensão final” por 5-10minutos é realizada, para finalizar cadeias
truncadas.
A PCR É FEITA ATRAVÉS DE CICLOS COM TRÊS ETAPAS
Uma vez incluídos todos os componentes, os tubos ou as placas são levados ao "forno", neste caso um aparelho específico, denominado termociclador,
dotado de sistema de aquecimento e refrigeração que permite que as temperaturas desejadas sejam rapidamente alcançadas. Neste, as três etapas de cada ciclo
da PCR (desnaturação / anelamento / amplificação) são realizadas automaticamente. Entre 25 e 40 ciclos são realizados, cada um composto pelas três
etapas. O crescimento das cadeias de DNA é exponencial, o que confere o alto poder de amplificação da PCR. A fórmula para o cálculo do número de cadeias
é: (2no. de ciclos) - (no. de ciclos x 2). No início da reação, também cadeias mais longas são produzidas, mas estas crescem apenas geometricamente.
5´ 3´
5´ 3´
5´
5´ 3´
5´ 3´
5´
5´ 3´
5´ 3´
5´
5´ 3´
5´ 3´
5´
Fita-molde de DNA, com uma
região a ser amplificada
ETAPA 1
Desnaturação do DNA por alta temperatura (90 ºC a 96 oC)
ETAPA 2
Anelamento dos iniciadores (30 oC - 60 oC)
ETAPA 3
Extensão dos iniciadores (70 oC - 74 oC)
DEPOIS DE MONTADA A RECEITA, A PCR VAI AO "FORNO"
VISÃO/REVISÃO – 16
Na PCR, uma fita-molde inicial é amplificada de forma
exponencial, de tal maneira que ao final de alguns ciclos,
milhões de fitas são produzidas.
No entanto, no início do processo, apenas fitas com
nenhuma ou apenas uma das extremidades definidas são
produzidas. É apenas a partir do terceiro ciclo que as
moléculas de tamanho desejado (as duas extremidades
definidas) passam a ser produzidas. São estas que são
amplificadas exponencialmente. As outras – não definidas –
são amplificadas apenas duas a cada ciclo. Ao final do
processo, estas últimas estão em pequena quantidade e não
são visualizadas nos géis.
Quando nós queremos identificar um indivíduo qualquer de uma população, nós nos baseamos em “marcadores morfológicos”, por exemplo, estatura,
cor de cabelos e olhos, número de pétalas e sépalas, etc..., dependendo da espécie. Esses marcadores funcionam bem em muitas situações, mas têm o
grande defeito de serem “plásticos”, ou seja, maleáveis. Dois bons exemplos: (i) se procurarmos identificar um criminoso pela cor de seus cabelos, ele
poderá facilmente mudar a cor simplesmente pintando-os de outra cor; ou (ii) duas plantas clonadas, com um genoma idêntico, poderão apresentar vigor
completamente diferente se estiverem crescendo uma em um solo bem adubado e a outra em um solo pobre, ou uma em um ambiente quente, e a outra em
um ambiente frio.
Por outro lado, se olharmos diretamente no genótipo dos indivíduos, teremos um retrato fiel, independentemente da expressão desse genótipo (ou seja, o
fenótipo). A análise direta de certas regiões do genoma permite que se identifiquem marcadores que poderão servir como identificadores únicos desses
indivíduos. Os marcadores são, portanto, segmentos “reconhecíveis” de DNA ligados a segmentos “não-reconhecíveis” (aqueles que queremos localizar
ou identificar), obtidos por corte (exemplo: RFLP) ou amplificação de DNA (exemplo: PCR).
Portanto, os marcadores de DNA podem ser classificados pelo tipo de obtenção: Corte do DNA, Amplificação do DNA, ou ambos:
• CORTE: RFLP e Minissatélites
• AMPLIFICAÇÃO: RAPD, Microssatélites
• CORTE E AMPLIFICAÇÃO: AFLP, PCR-RFLP
Vamos exemplificar os marcadores através de uma simulação de uma aplicação forense para identificação de um criminoso que deixou uma “evidência”
na cena do crime (uma mancha de sangue – familiar para os apreciadores da série CSI...). Teremos o seguinte cenário, onde sequências “ALFA” e
“1234” significam o sítio de corte da enzima de restrição Alfa D1 e o sítio de anelamento do iniciador de PCR Onetwothreefour, respectivamente. :
“MARCADORES MOLECULARES” SÃO FERRAMENTAS COM AMPLA APLICAÇÃO, DESDE A SOLUÇÃO DE CRIMES
ATÉ O MELHORAMENTO GENÉTICO DE PLANTAS E ANIMAIS...
Evidência da cena do “crime” (mancha de sangue):
:::::ATGCATGC1234ATGCATGC4321ATGCATGCATALFAGCATGC1234ATGCATALFAGCAT4321ATGCGCATGCATGALFACATGCATGC:::::
:::::TACGTACG1234TACGTACG4321TACGTACGTAALFACGTACG1234TACGTAALFACGTA4321TACGCGTACGTACALFAGTACGTACG:::::
DNA do suspeito 1:
:::::ATGCATGC1234ATGCATGC9321ATGCATGCATALFAGCATGC1234ATGCATAXXAGCAT4321ATGCGCATGCATGALFACATGCATGC:::::
:::::TACGTACG1234TACGTACG9321TACGTACGTAALFACGTACG1234TACGTAAXXACGTA4321TACGCGTACGTACALFAGTACGTACG:::::
DNA do suspeito 2:
:::::ATGCATGC1234ATGCATGC4321ATGCATGCATALFAGCATGC1234ATGCATALFAGCAT4321ATGCGCATGCATGALFACATGCATGC:::::
:::::TACGTACG1234TACGTACG4321TACGTACGTAALFACGTACG1234TACGTAALFACGTA4321TACGCGTACGTACALFAGTACGTACG:::::
Ao escrutinarmos essas duas sequências, imediatamente poderemos identificar semelhança entre a evidência e o DNA do suspeito 2, enquanto que o DNA
do suspeito 1 difere de ambos. No entanto, este procedimento – o seqüenciamento completo do DNA – ainda é muito caro para aplicações rotineiras.
Portanto, podemos recorrer a algum artifício laboratorial para, a um custo mais baixo, tentarmos solucionar o caso. Aí é que surgem os marcadores
moleculares. Vamos inicialmente aplicar uma metodologia baseada em enzimas de restrição, clivando as três amostras com uma mesma enzima, no caso
uma que reconheça a sequência “ALFA”. Os resultados da clivagem seriam:
Sangue:
FAGCATGC1234ATGCATAL FAGCAT4321ATGCGCATGCATGAL
FACGTACG1234TACGTAAL FACGTA4321TACGCGTACGTACAL
Suspeito 1:
FAGCATGC1234ATGCATAXXAGCAT4321ATGCGCATGCATGAL
FACGTACG1234TACGTAAXXACGTA4321TACGCGTACGTACAL
Suspeito 2:
FAGCATGC1234ATGCATAL FAGCAT4321ATGCGCATGCATGAL
FACGTACG1234TACGTAAL FACGTA4321TACGCGTACGTACAL
Se separarmos esses segmentos
clivados em um gel de eletroforese e
procedermos a um Southern blot com a
sonda adequada, visualizaríamos o
seguinte perfil genético:
Sangue 1 2
VISÃO/REVISÃO – 17
Imediatamente, podemos verificar que a evidência deixada na cena do crime corresponde ao perfil do suspeito 2. Mas porque isto aconteceu? Note que
um dos sítios de corte da enzima de restrição Alfa D1 presente no sangue do suspeito 1 sofreu uma mutação (ALFA>AXXA) de tal forma que a enzima
não mais reconhece o sítio de corte.
Podemos também aplicar uma metodologia baseada em PCR, amplificando segmentos de DNA da evidência e dos dois filhos, utilizando os iniciadores
“1234”. Os resultados da amplificação seriam:
Sangue:
1234ATGCATGC4321 1234ATGCATALFAGCAT4321
1234TACGTACG4321 1234TACGTAALFACGTA4321
Suspeito 1:
1234ATGCATGC9321 1234ATGCATAXXAGCAT4321
1234TACGTACG9321 1234TACGTAAXXACGTA4321
Suspeito 2:
1234ATGCATGC4321 1234ATGCATALFAGCAT4321
1234TACGTACG4321 1234TACGTAALFACGTA4321
Sangue 1 2
Se separarmos esses segmentos
amplificados em um gel de
eletroforese e os visualizarmos
com um corante adequado,
obteremos o seguinte perfil
genético:
Poderíamos ainda fazer um terceiro teste, baseado nas duas metodologias: amplificação + corte.
Sangue:
1234ATGCATGC4321 1234ATGCATALFAGCAT4321
1234TACGTACG4321 1234TACGTAALFACGTA4321
Suspeito 1:
1234ATGCATGC9321 1234ATGCATAXXAGCAT4321
1234TACGTACG9321 1234TACGTAAXXACGTA4321
Suspeito 2:
1234ATGCATGC4321 1234ATGCATALFAGCAT4321
1234TACGTACG4321 1234TACGTAALFACGTA4321
Após
amplificação
por PCR, os
fragmentos são
clivados com a
enzima Alfa D1:
Sangue:
1234ATGCATGC4321 1234ATGCATAL FAGCAT4321
1234TACGTACG4321 1234TACGTAAL FACGTA4321
Suspeito 1:
1234ATGCATAXXAGCAT4321
1234TACGTAAXXACGTA4321
Suspeito 2:
1234ATGCATGC43211234ATGCATAL FAGCAT4321
1234TACGTACG4321 1234TACGTAAL FACGTA4321
x
x
Sangue 1 2 Mas qual a vantagem deste procedimento em relação aos anteriores? Note que no primeiro procedimento
(RFLP) foi necessária uma sonda, porque havia pouco DNA no canivete para ser observado diretamente no
gel. O segundo procedimento (PCR) permitiu a visualização direta em um gel. Este terceiro procedimento,
denominado PCR-RFLP, aumentou o nível de polimorfismo analisado, e ainda permitiu a visualização
direta em um gel. É, portanto, vantajoso, particularmente em algumas situações onde se procura apenas uma
diferença específica em uma região já conhecida do DNA.
O seguinte padrão é revelado:
Dentre os marcadores mais comuns encontram-se:
Na verdade, em sua definição mais ampla os marcadores moleculares incluem o fenótipo molecular gerado
por um gene de isoenzimas (no caso, mais especificamente denominados de MARCADORES
BIOQUÍMICOS), bem como o fenótipo molecular de uma sequência – expressa ou não – de DNA.
Corte do DNA com enzimas de restrição
Variação no comprimento dos fragmentos de DNA de dois ou mais indivíduos produzidos por uma enzima de restrição e visualizados através de Southern
blotting com sonda. Exemplo típico: RFLP (Restriction Fragment Length Polymorphism). Também os Minissatélites, VNTR – Variable Number of
Tandem Repeats (Número Variável de Repetições em Cadeia), ou Regiões Hipervariáveis, uma classe especial de RFLPs caracterizados por uma série de
repetições curtas (10 a 100 pb), com até 50 repetições por locus, arranjadas em cadeia (tandem) em plantas e animais. Os minissatélites apresentam uma
sequência-cerne de 10 a 35 pb, utilizada para a construção de sondas.
Amplificação do DNA por PCR
Amplificação de seqüencias de DNA através de iniciador aleatório, e visualização direta em gel de agarose. Exemplo típico: RAPD (Random
Amplification of Polymorphic DNA). Também se incluem os microssatélites ou STR (Short Tandem Repeat), SSR (Simple Sequence Repeats) ou RSS
(Repetitive Single Sequence), uma série de repetições muito curtas (2-10 pb), amplificados com iniciadores para PCR que se anelam no exterior das
sequências.
Corte seguido de amplificação
Variação no comprimento dos fragmentos resultantes do corte e da amplificação posterior de alguns fragmentos, após ligação de adaptadores específicos e
visualização em gel de acrilamida. Exemplo típico: AFLP (Amplified Fragment Length Polymorphism).
Amplificação seguida de corte
Amplificação de uma sequência específica de DNA e posterior corte, dos segmentos amplificados, com uma ou mais enzimas de restrição e visualização
em gel de agarose ou acrilamida. Exemplo típico: PCR-RFLP, também conhecida por CAPS (Cleaved Amplified Polymorphic Sequence).
Amplificação seguida de hibridização
Amplificação de um locus polimórfico com repetições separadas por espaçadores não repetitivos, e determinação por hibridização dos espaçadores
amplificados a um grupo de oligonucleotídeos imobilizados em uma membrana. Exemplo típico: Spolligotyping em Mycobacterium.
Seqüenciamento ou eletroforese à procura por SNPs (Polimorfismos de Nucleotídeos Únicos)
Um SNP ocorre quando há uma mutação de ponto no DNA analisado. Sua visualização pode ser por seqüenciamento, ou por eletroforese em géis com
gradiente de desnaturação (DDGE; ver abaixo), que irá revelar os dois alelos presentes para aquele lócus em particular.
PCR-SSCP (Polimorfismo Conformacional de Fita Simples)
É uma técnica de diferenciação de filamentos de comprimentos idênticos mas com diferenças nas sequências. As diferentes sequências, quando na forma
de fita-simples, podem adquirir conformações secundárias diferentes.
Polimorfismo em DGGE (Eletroforese em Gel com Gradiente de Desnaturação) ou TGGE (Gradiente de Temperatura)
É uma técnica semelhante à SSCP, baseada no fato que as propriedades de desnaturação de uma molécula de DNA fita-dupla dependem da sequência da
molécula, e que a mobilidade eletroforética dessa molécula depende do seu estado de desnaturação.
Polimorfismos de inserção/deleção (ins/del)
Um tipo de marcador bialélico, que analisa inserções e deleções de nucleotídeos. Pode ser verificado em regiões muito curtas de DNA, o que pode ser
vantajoso quando se tem DNA muito degradado.
Nos testes de paternidade e criminalidade comumente realizados nos dias atuais, são utilizados entre 13 e 15
marcadores padrão. O Bureau Federal de Investigações dos Estados Unidos (FBI) é um dos organismos que
dedicou bastante esforço no estabelecimento das bases para a utilização de marcadores moleculares na solução de
casos forenses. Assim, foi desenvolvido um padrão de marcadores utilizados no CODIS (Combined DNA Index
System), que é uma base de dados muito ampla para a estocagem e triagem de perfis de DNA. São utilizados 14
ou mais marcadores. Treze desses marcadores são microssatélites, e outro é um marcador que permite determinar
o gênero. Este último é baseado no gene da amelogenina, responsável pelo desenvolvimento de dentes nos fetos.
Há dois alelos, diferentes para os cromossomos X e Y, e portanto a identificação do alelo presente em uma
amostra imediatamente identifica o gênero do indivíduo.
Os passos adotados para a análise forense de DNA incluem:
Fonte de laser Leitor
Dire ç ão da
eletroforese
Fonte de laser Leitor
Dire ç ão da
eletroforese
TPOX
D18S51
VWA
TH01
D3S1358
D13S317
D16S539
CSF1PO
D7S820
D8S1179
D21S11
AMEL(SEX)
D5S818
FGA
Etapas da análise de microssatélites do sistema CODIS
1 – Inicialmente são feitas quatro reações, cada uma utilizando
iniciadores marcados com uma das quatro fluorescências.
2 – Posteriormente, os produtos são corridos em um gel capilar,
interpretado por um leitor a laser.
3 – Ao final, são gerados os eletroferogramas para cada uma das
fluorescências, indicando quais os alelos presentes nos
microssatélites analisados.
VISÃO/REVISÃO – 18
MARCADORES MOLECULARES TÊM AMPLA APLICAÇÃO FORENSE
PLANTAS E ANIMAIS TRANSGÊNICOS PODEM SER CRIADOS POR ENGENHARIA GENÉTICA
Os métodos clássicos de melhoramento genético baseiam-se na troca de alelos entre indivíduos da mesma espécie ou de espécies aparentadas, onde o
fluxo gênico é livre ou sofre pequenas restrições (uma restrição pode ser a dificuldade no desenvolvimento do embrião, após fertilização, em cujo caso
se deve proceder ao “salvamento [rescue] de embriões). Diz-se que as plantas utilizadas nos cruzamentos pertencem ao mesmo pool gênico, seja ele
primário ou secundário. Os métodos clássicos de melhoramento esbarram, portanto, na incompatibilidade sexual. Assim, por exemplo, não se
consegue transferir, via sexual, alelos de um mosquito para uma abóbora, e vice-versa. No entanto, esta transferência pode ser possível por métodos
“artificiais”, através da criação de organismos transgênicos.
“A transgênese, como uma biotecnologia aplicável em animais e vegetais, consiste em adicionar um gene, de origem animal ou vegetal ao genoma que
se deseja modificar. Denomina-se transgene o gene adicional. Assim, o transgene passa a integrar o genoma hospedeiro e o novo caráter dado por ele é
transmitido à descendência, o que significa que a transgênese é germinativa”.
“...a transgenicidade, obtida por meio da biotecnologia elimina as fronteiras entre espécies, possibilitando que qualquer ser vivo adquira novas
características de vegetais ou de animais ou humanas e com certeza provocará inúmeras alterações na vida biológica, social, política e econômica em
âmbito mundial, já que é fato inconteste que essa biotecnologia tem um enorme potencial de desequilíbrio de micro e macrossistemas.”
MELHORAMENTO TRADICIONAL
Pool gênico: plantas que se cruzamlivremente ou com auxílio de técnicas
biológicas (ex.: salvamento de embriões)
Cruzamento entre indivíduos escolhidos
Seleção para características de interesse
(geralmente vários anos)
Lançamento da cultivar
TRANSGENÍASE
Identificação, isolamento e clonagem do gene de
interesse
Transformação genética (geração zero)
Cruzamento entre indivíduos escolhidos
Seleção para características de interesse (de um
a vários anos, dependendo principalmente do
parental transgênico utilizado)
Lançamento da cultivar
Problema é
que o gene
para a
característica
de interesse
pode não ser
parte do pool
gênico da
espécie!
Há vários métodos de obtenção de plantas transgênicas, mas apenas dois têm aplicações comerciais:
Transformação mediada por Agrobacterium tumefaciens - esta é uma bactéria do solo responsável por uma doença neoplástica, que está associada à
presença de um plasmídio extracromossomal, o plasmídio Ti (Tumor-inducing). O plasmídio contém genes para a síntese de reguladores de
crescimento vegetal (auxinas e citocininas) e de opinas, que são transferidos para a planta e integrados em seu genoma, causando a doença. Se o
plasmídio for “desarmado”, isto é, tiver esses genes retirados e substituídos pelo(s) gene(s) de interesse, a bactéria continuará transferindo esse DNA,
mas agora não mais causando a doença, mas sim introduzindo o DNA de interesse no genoma vegetal. A planta que recebeu esse material tornou-se
transgênica.
Biolística - a introdução de substâncias em células e tecidos usando microprojéteis a alta velocidade. Neste procedimento, o DNA de interesse adere à
parede de microprojéteis constituídos de partículas de ouro ou tungstênio, os quais são acelerados a altíssima velocidade através de gás hélio. Alguns
microprojéteis irão entrar em células vegetais sem danificá-las, e o DNA de interesse poderá, em algumas delas, entrar no núcleo e ser inserido no
genoma tornando-a transgênica.
VISÃO/REVISÃO – 19
UNIDADE 1
O material genético: descoberta, estrutura e funções
OBJETIVO
Discorrer sobre os requisitos mínimos exigidos para um composto funcionar como o material genético, demonstrar como o DNA e o RNA foram
descobertos como sendo o material genético em diversos organismos, e comentar sobre a estrutura do material genético, como o mesmo se encontra
organizado, e como a informação genética é transferida e utilizada.
CONTEÚDO
O DNA e o RNA como materiais genéticos
A natureza química e características fundamentais do material
genético
Provas experimentais de que o DNA é o material genético na
maioria dos organismos
O RNA como material genético em alguns organismos
A estrutura do DNA
Os componentes do polímero do DNA e da dupla hélice
Genes e a informação biológica
Genes são segmentos de DNA
A organização dos genes na molécula de DNA e nos
cromossomos
GUIA DE ESTUDOS
Saiba quais são as características fundamentais e desejáveis do material genético.
Porque as proteínas foram consideradas durante muito tempo como as mais prováveis candidatas a material
genético?
No estudo do “princípio transformante” feito por Griffith, qual a importância da capa protéica de bactérias? Saiba
como a cápsula funciona no organismo. Saiba também interpretar os quatro experimentos conduzidos por ele.
O que acontece durante a transformação bacteriana? Saiba relacionar estes eventos com os achados de Griffith
sobre a natureza do material genético.
Qual o princípio geral dos experimentos de Avery, MacLeod e McCarty? Interprete os resultados à luz do que os
autores concluíram em seu trabalho (ver Box no texto de aula).
Qual o princípio geral dos experimentos de Hershey e Chase? Interprete os resultados até a 1a. geração. Porque foi
importante deixar as bactérias crescerem por mais uma geração?
Como você poderia provar que o RNA também pode servir como material genético?
Quais são os componentes básicos da cadeia de DNA? E de RNA? Saiba explicar qual a importância das hidroxilas
dos C2 e C3 do açúcar.
Saiba como diferenciar bases púricas de bases pirimídicas.
O que significa 5’-3’ e 3’-5’? Qual o sentido da vida? (aqui você pode até filosofar um pouco, mas não na prova...).
Porque as cadeias de DNA crescem somente em um sentido?
Saiba como um número relativamente pequeno de subunidades do DNA (por exemplo 10) pode fornecer tamanha
variabilidade genética (1.048.576 possíveis combinações).
Saiba quais as características do DNA que o fazem ideal para servir como material genético.
A proporção de bases de Chargaff auxiliou na elucidação da estrutura do DNA. Saiba descrever como.
Você tem alguma teoria para a extrema variabilidade entre as proporções de bases observada quando diferentes
organismos são comparados? Relacione isto com as teorias de evolução.
Porque os filamentos de uma cadeia de DNA têm sentidos opostos?
Descreva como seria um segmento de DNA que contivesse pareamentos entre purinas apenas. E entre pirimidinas.
Qual a contribuição de pontes de hidrogênio para a estabilidade do DNA? Elas são mais fortes entre pares AT ou
pares GC? Como isso influencia na hibridização e na desnaturação de cadeias de DNA?
É certo afirmar que a estrutura do RNA é mais simples do que a do DNA? Porque?
A hibridização, ou reassociação de moléculas desnaturadas de DNA segue alguns princípios. Quais são estes?
1: O MATERIAL GENÉTICO – 20
Independentemente de qual a composição do material genético, para que algum composto possa desempenhar seu papel como material genético ele deve
apresentar várias características, tais como:
Grande variedade de formas, ligadas às múltiplas funções em um organismo, E PORTANTO:
• habilidade de estocar grande quantidade de informação e de expressá-la nas células quando necessário
Habilidade de transferir a informação para células-filhas, ATRAVÉS DA:
• replicação de sua própria estrutura
Estabilidade física e química de tal forma a não perder informação com o passar do tempo, MAS:
• variação por mutação, para permitir a evolução e especiação
Proteínas
20 subunidades constituintes
Muito abundantes em células
(até 50% do peso de células)
DNA
Apenas 4 subunidades
Menos abundante
Modelo errado (na época)
Visão do DNA no início
do século
XX Modelo tetranucleotídeo incorreto para o DNA:
Todas as moléculas eram exatamente iguais
Modelo correto para as proteínas:
Uma variedade de formas e composição
DNA OU PROTEÍNA?
CARACTERÍSTICAS ESSENCIAIS DO MATERIAL GENÉTICO
INTRODUÇÃO: UM POUCO DE HISTÓRIA
A história do DNA, ou melhor dizendo, do material genético, remonta do século XIX quando, em 1833, Brown descreveu o núcleo celular pela primeira vez. Alguns
anos depois, em 1839, Shleiden e Schwan propõem a teoria celular. O famoso trabalho de herança genética realizado por Mendel foi inicialmente publicado em 1866, e
três anos depois (1869) Miescher descobre a “nucleína” em núcleos de glóbulos brancos (Miescher, F. Über die chemische Zusam-mensetzung der Eiterzellen. Hoppe-
Seyller´s Mediz.-Chem. Untersuch., v. 4, p 441-460, 1871). Demonstrou-se posteriormente que a “nucleína” era na verdade composta por uma fração protéica e outra
ácida, denominada de “ácido nucléico” (Altman, R. Über Nucleinsäuren. 1889. Citado em: A Century of DNA, F.H. Portugal e J. S. Cohen, 1977. MIT Press). No
entanto, somente alguns anos depois, no final do século, é que se passa a aceitar que o núcleo é o sítio físico onde se encontra o material genético, fato confirmado
definitivamente em 1924 (Feulgen, R;. Rossenbeck, H.Mikroskopisch-chemicher Nachweis einer Nucleinsäure vom Typus der Thymonucleinsäure und die darauf
beruhende selective Färbung von Zellkernen in miksodkopichen Präparaten. Hoppe-Seyler´s Z. Physiol. Chem, v. 135, p. 203-248, 1924). Na virada do século XIX,
Albrecht Kossel descobre as bases nitrogenadas do DNA, e por volta de 1930 verifica-se que os ácidos nucléicos podem ser tanto ribonucléicos (RNA) quanto
desoxiribonucléicos (DNA).
Conclusão: Na época, o melhor candidato a cumprir as funções de material genético eficientemente eram as
proteínas, embora não existisse ainda uma evidência experimental sólida
Como os estudos realizados indicavam que as bases ocorriam em proporções eqüimolares, em 1921 Phoebus Levene propôs a hipótese dos tetranucleotídeos: uma
organização muito simples dos nucleotídeos repetia-se inúmeras vezes no DNA, mantendo uma proporção de 1:1:1:1 (Levene, P. A. On the structure of thymus nucleic
acid and on its possible bearing on the structure of plant nucleic acid. J. Biol. Chem., v. 48, p 119-125, 1921). Houve imediata rejeição pela comunidade científica,
posto que a estrutura dessas unidades seria muito simples para cumprir as funções requeridas pelo material genético. Essa “simplicidade” não seria apresentada pelas
proteínas, muito mais complexas e capazes, portanto, de reter muito mais informação, sob este ponto de vista.
À luz dessa visão, ganhou corpo a aceitação da teoria de que as proteínas encontradas no núcleo, e não o DNA, seriam as portadoras da informação genética. Em 1928
Griffith demonstrou a transformação bacteriana, mas foi incapaz de determinar se ela era causada por proteínas ou por DNA. Essa dúvida perdurou por muitos anos,
pelo menos até 1944, quando Avery e colaboradores realizaram experimentos demonstrando que o DNA era o material responsável pela transformação bacteriana.
1: O MATERIAL GENÉTICO – 21
O PRINCÍPIO TRANSFORMANTE
Em 1880, Robert Koch define a existência de “espécies” de bactérias, no sentido taxonômico, no entanto deixa a descoberto as várias “formas” dentro de cada espécie
(por exemplo, virulentas e avirulentas). Em 1928, Frederick Griffith descobre a transformação bacteriana em Streptococcus pneumoniae. Essa bactéria apresenta várias
cepas, algumas virulentas, outras não. Griffith propõe “a ação de uma substância que altera a bactéria de um tipo para outro”.
Uma das características fundamentais do sistema de virulência
dessas bactérias é a presença de uma cápsula ou capa protéica
nas cepas virulentas. Um dos atributos importantes dessa cápsula
protéica é que ela protege as bactérias contra fagocitose, e
portanto cepas portadoras da cápsula protéica são virulentes, isto
é, causam doença e morte ao animal.
Composição: dependendo do sorotipo, polissacarídeos tais como
ramnose, glicose, galactose, ramnose.
Cápsulas conferem uma aparência suave (S) e brilhante às
células, enquanto que a sua ausência dá uma aparência rugosa
(R).
A transformação de um tipo virulento para um avirulento ocorre naturalmente, e isto chamou a atenção de Griffith:
pacientes que se recuperavam de pneumonia apresentavam sempre formas avirulentas na saliva.
OS EXPERIMENTOS DE GRIFFITH (1928)
GRIFFITH, F. The significance of pneumococcal types. J. Hyg., v. 27, p. 113-159, 1928.
1
2
3
4
Confirmação dos experimentos de Griffith
1931- Henry Dawson (Rockefeller Institute) confirmou as
observações de Griffith e as extendeu um passo a mais:
- transformação pode ocorrer in vitro: células IIIS mortas
por aquecimento incubadas com células IIR vivas
geravam células IIIS vivas.
1933 - Lionel Alloway refinou o sistema in vitro, através do uso de
extratos não purificados, e chegou à mesma conclusão
que os pesquisadores anteriores: Formas avirulentas
foram transformadas em formas virulentas.
Até aquele momento, no entanto, a transformação ainda era vista
mais como um evento fisiológico do que como um evento
genético.
1: O MATERIAL GENÉTICO – 22
Os quatro experimentos de Griffith (1928) com
transformação de S. pneumoniae
1 - Camundongo injetado com bactérias IS:
2 - Camundongo injetado com bactérias IIR:
3 - Camundongo injetado com bactérias IS mortas por
aquecimento:
4 - Camundongo injetado com bactérias IS mortas por aquecimento
() misturadas com tipo IIR vivas ():
e mais: formas IS vivas foram recuperadas dos animais
Formas não patogênicas foram transformadas em formas
patogênicas
Possível explicação: bactérias do tipo IIR recuperaram habilidade
de produzir cápsula.
Não, pois se isso fosse correto as bactérias seriam do tipo IIS, mas
as bactérias eram do tipo IS, do mesmo tipo das bactérias mortas
injetadas em conjunto com as IIR!
Conclusão: um componente das bactérias IS mortas por
aquecimento tinha “transformado” as células IIR em IS
OS EXPERIMENTOS DE AVERY, MACLEOD E McCARTY (1944)
AVERY, O.T.; MacLEOD, C.M.; McCARTY, M. Studies on the chemical nature of the substance inducing transformation of pneumococcal types:
Induction of transformation by a desoxyribonucleic acid fraction isolated from pneumococcus type III. J. Exp. Med., v. 79, p. 137-158, 1944.
Esses cientistas partiram praticamente do ponto onde Griffith havia parado: a transformação bacteriana. No entanto, eles foram um pouco adiante, ou melhor, bastante
adiante, pois a intenção deles era testar qual dos componentes celulares era o responsável pela transformação bacteriana. A estratégia adotada por eles foi preparar um
filtrado de vários litros (50 a 70) de células IIIS mortas por aquecimento, contendo o “princípio transformante”, e submeter os componentes a enzimas degradativas
específicas, utilizando o produto da degradação para testes da capacidade transformadora. Como, além do DNA e das proteínas, as células também contém grande
quantidade dos polissacarídeos capsulares e RNA, eles utilizaram quatro enzimas em seus experimentos: SIII, tripsina, RNAse e DNAse. Uma representação dos passos
seguidos é apresentada a seguir:
Conclusão: O princípio transformante deveria ser aquele que, ao ser destruído, não mais aferia ao filtrado a capacidade de transformar células: o DNA
A conclusão do trabalho original foi transmitida pelos próprios autores de forma bastante simples: “A evidência apresentada suporta a crença de que um ácido nucléico do
tipo desoxirribose é a unidade fundamental do princípio de transformação de Pneumococcus pneumoniae”.
Segundo os autores, “ácidos nucléicos deste tipo devem ser considerados não somente com função estrutural importante, mas também como uma função ativa em
determinar as atividades bioquímicas e as características específicas das células do coco”.
Isto sugere que o princípio transformante interage com as células IIR e desencadeia uma série de reações enzimáticas que culminam com a síntese da cápsula do tipo
IIIS. Ademais, quando a transformação ocorre, o polissacarídeo capsular é produzido em gerações sucessivas. Assim, a transformação é hereditária e o processo afeta o
material genético.
A partir de
um filtrado
de células
virulentas
mortas, são
retiradas
quatro
alíquotas
Cada alíquota
é tratada com
um produto
específico,
que degrada
apenas um de
seus
componentes
Enzima SIII – hidrólise de polissacarídeos
capsulares
Após a
degradação, o
filtrado é
utilizado para
transformar
células não
virulentas,
vivas,
simulando o
que Griffith
havia feito no
passo 4
Tripsina – degradação de proteínas
RNAse – degradação de RNA
DNAse – degradação de DNA
√ Transforma
√ Transforma
√ Transforma
Não transforma
R
E
S
U
L
T
A
D
O
OSEXPERIMENTOS DE ALFRED HERSHEY E MARTHA CHASE (1952)
HERSHEY, A.D.; CHASE, M. Independent functions of viral protein and nucleic acid in growth of bacteriophage. J. Gen. Phys., v. 36, p. 39-56, 1952.
Amostras radioativas do fago T2: proteínas marcada com 35S e DNA
marcado com 32P, extraídas de Escherichia coli cultivadas
com nutrientes marcados (duas culturas independentes,
uma para cada radioisótopo).
Fagos marcados, extraídos das culturas radioativas, foram usados
para infectar culturas não-radioativas por apenas alguns
minutos:
- tempo suficiente apenas para a introdução do material
genético dos fagos nas células bacterianas
- não permitiu a produção de novos fagos
- não ocasionou a morte das bactérias
Forte agitação (liquidificador) após o tempo determinado:
- remoção das partículas externas dos fagos aderidas às
bactérias
- retenção da substância injetada pelos fagos nas bactérias:
os genes do fago
Centrifugação das culturas:
- células bacterianas, relativamente mais pesadas, coletadas
no pellet no fundo do tubo
- partículas vazias do fago mantidas em suspensão
Informação 1: mais de 80% do 32P estavam presentes nos pellets
bacterianos
Bactérias deixadas para crescer e produzir novos fagos
Informação 2: quase metade do 32P, porém menos de 1% do 35S,
estavam presentes nestas novas partículas do fago
Conclusão: o material genético era o DNA e não a proteína
Baseados na radiomarcação e no uso de bacteriófagos. Proteínas podem ser marcadas com enxofre radioativo, que é incorporado aos aminoácidos cisteína e metionina;
DNA não tem enxofre, mas pode incorporar fósforo radioativo, que não será incorporado às proteínas (que não contém P). Os dois radioisótopos podem ser facilmente
diferenciados, pois emitem radiações com características diferentes.
1: O MATERIAL GENÉTICO – 23
E O RNA?
FRAENKEL-CONRAT, H.; SINGER, B. Virus reconstruction: II. Combination of protein and nucleic acid from different strains. Biochem. Biophys. Acta, v. 24, p. 530-548, 1957.
Alguns organismos têm
RNA como seu material
genético
1956 – Gierer e Schramm
- plantas inoculadas com o
RNA purificado do vírus do
mosaico do fumo (TMV)
desenvolveram lesões típicas
- plantas inoculadas com o
RNA purificado e tratado
com uma ribonuclease não
desenvolveram lesões.
1957 – Fraenkel-Conrat e
Singer
- isolamento de proteína e
RNA de dois diferentes
sorotipos de TMV e
construção de partículas
híbridas;
- inoculação de plantas com
as partículas híbridas;
- recuperação da progênie
viral das plantas infectadas.
Conclusão: cada progênie
isolada era do tipo
especificado pelo RNA, e
não pela capa protéica.
Demonstração que o RNA é o material genético no vírus do mosaico do fumo (VMF)
Partículas híbridas foram construídas a partir das proteínas da capa de uma cepa e do RNA de outra cepa, e utilizadas para
infectar folhas de fumo em dois diferentes experimentos. As progênies foram então isoladas das folhas e analisadas quanto às
suas características, e se observou que a proteína da capa era sempre do tipo determinado pelo RNA componente, indicando que
a capa híbrida em si não pode ser transmitida às gerações futuras.
UM POUCO MAIS DE HISTÓRIA, PARA FINALIZAR – E INCLUÍNDO A ERA DA GENÔMICA...
1833 – Brown
descreve o
núcleo celular
1839 – Shleiden
e Schan
propõem a
teroria celular
1865 –
Mendel
descobre as
leis genéticas
1889 – Altman
descobre as frações
protéica e ácida da
nucleína
1905 – Archibald Garrot
formula o conceito de
erros inatos do
metabolismo em humanos
1869 –
Mieschner
descreve a
nucleína
1900 – o
trabalho de
Mendel é
redescoberto
1913 – Alfred
Sturtevant faz o
primeiro mapa
linear
1924 – Feulgen e
Rosembeck propõem o
núcleo como a sede do
material genético
1921 – Levene
propõe a teoria
(incorreta) dos
tetranucleotídeos
1928 – Griffith
demonstra a
transformação
bacteriana
OS PRIMEIROS CENTO E POUCOS ANOS – 1833/1943
OS QUARENTA ANOS SEGUINTES – 1944/1983
1944 – Avery e
colaboradores
demonstram ser o
DNA o material
genético
1952 – Hershey e
Chase confirmam
o DNA como
sendo o material
genético
1953 – Watson e
Crick
descobrem a
estrutura da
dupla hélice
1957 – Fraenkel-Conrat
e Singer descobrem que
o RNA também pode ser
o material genético
1966 – Nuremberg,
Kholana e Holley
determinam a
natureza do código
genético
1972 – Cohen e
Boyer
desenvolvem a
tecnologia do DNA
recombinante
1977 – O
seqüenciamento do
DNA é desenvolvido
independentemente por
dois grupos
1982 – o Banco
de Dados
Genéticos
Mundial é
estabelecido
1983 – o primeiro
gene humano de
doença (Huntington)
é mapeado
geneticamente
OS ÚLTIMOS VINTE E POUCOS ANOS – 1984/2004...
1985 – a PCR
(reação em
cadeia da
polimerase) é
inventada
1984 – primeiras
discussões sobre
o seqüenciamento
do genoma
humano
1986 – o Consórcio
Internacional de
sequências de
Nucleotídeos é
estabelecido
1986 – o gene da
distrofia muscular
é descoberto por
clonagem
posicional
1986 – o primeiro
instrumento de
seqüenciamento
automático é
desenvolvido
1987 – um mapa
do genoma
humano, de
primeira geração, é
descrito
1988 – a
clonagem
baseada em
YACs é
desenvolvida
1988 – o consórcio
HUGO (Human
Genome
Organization) é
estabelecido
1989 – o conceito
do mapeamento
por STS
(Sequence-tagged
sites) é criado
1989 – o gene da
fibrose cística é
descoberto por
clonagem
posicional
1990 – o
projeto
Genoma
Humano é
lançado
1990 – primeiras
discussões
públicas sobre
ética e moral do
projeto genoma
1990 – o primeiro
gene responsável
por câncer
humano (BRCA1) é
descoberto
1991 – os
primeiros centros
de estudos
genômicos são
estabelecidos
1992 – um mapa
do genoma
humano de
segunda geração é
descrito
1993 – o plano de
estudos para os
próximos cinco anos
do Projeto Genoma
Humano é lançado
1994 – o mapa
físico do Projeto
Genoma
Humano é
produzido
1995 – o primeiro
genoma de bactéria
(Haemophilus
influenza) é
seqüenciado
1995 – primeira
legislação contra a
discriminação de
indivíduos com base
em seu genoma
1996– o plano
piloto para o
seqüenciamento
do genoma
humano é lançado
1996– o primeiro
genoma de archae e de
Saccharomyces
cerevisiae são
produzidos
1996 – o
primeiro mapa
genético
humano é
construído
1996– o mapeamento
do genoma do
camundongo, para
fins comparativos é
produzido
1996– são estabelecidos os
“Princípios de Bermudas”
para a disponibilização
rápida e livre de dados de
seqüenciamento
1997– o
genoma de
Escherichia
coli é
seqüenciado
1997– são estabelecidos
mais centros de
seqüenciamento na
França e nos Estados
Unidos
1998– são
incorporados mais
30.000 genes no
mapa do genoma
humano
1998– são
estabelecidos
centros de
seqüenciamento no
Japão e na China
1998– o
organismo
Caernohabditis
elegans é
seqüenciado
1998– o princípio
de SNP (single-
nucleotide
polymorphism) é
estabelecido
1999– o
seqüenciamento
do genoma
humano é
implementado
1999– a primeira
sequência completa
de um cromossoma
humano (22) já é
completada
2000 – a
primeira versão-
rascunho do
genoma é
publicada
2000 – os genomas da
mosca-das-frutas
(Drosophila melanogaster) e
da plantaArabdopsis
thaliana são sequenciados
2000 – são passadas legislações
em apoio ao livre acesso a dados
de projetos genomas e contra a
discriminação individual com
base em defeitosgenéticas
2001 – as versões-
rascunho do genoma
humano são publicadas
por dois grupos
independentes
2001 – 10.000
cDNAs
humanos
completos são
seqüenciados
2002 – a versão-
rascunho do
genoma do rato
é finalizada e
publicada
2002 – as versões-
rascunho dos genomas
do camundongo e do
arroz são finalizadas e
publicadas
2003 – a versão
“final” do genoma
humano é
finalizada e
publicada
1: O MATERIAL GENÉTICO – 24
O ácido fosfórico
Ligado ao carbono 5’ do açúcar; até três se
ligam: , , e , servindo como fonte de
energia para a formação da cadeia de DNA
No ácido nucléico, o carbono forma uma
ligação fosfodiéster, fazendo uma ponte entre
dois açúcares adjacentes
OS COMPONENTES DAS CADEIAS DE DNA E RNA
O
H
RNA
1´
3´
2´
4´
5´
O
H
O açúcar
Uma pentose (5 átomos de carbono) na forma estrutural de Haworth.
Note a numeração dos carbonos: 1´, 2´, 3´, 4´ e´5´
No DNA, a 2’-desoxirribose é uma estrutura padrão da ribose onde o
2’OH foi substituído por um H; no RNA, ambas hidroxilas
permanecem
As bases
Podem ser purinas (Adenina e Guanina), com dois anéis, ou
pirimidinas (Citosina ou Timidina), com apenas um anel; no
RNA, uma terceira pirimidina, Uracila, é encontrada
γ β α
0- 0- 0-
I I I
-0 – P – 0 – P – 0 – P – 0 –
II II II
0 0 0
Adenina Guanina
PURINAS
Citosina Timina Uracila
PIRIMIDINAS
P u l G A
P i T U C o
A nomenclatura das bases, dos nucleosídeos e dos nucleotídeos
Base Nucleosídeo Nucleotídeo (e sua forma no DNA/RNA)
Adenina Adenosina Ácido adenílico (2’-desoxiadenosina 5’-trifosfato)
Guanina Guanosina Ácido guanílico (2’-desoxiguanosina 5’-trifosfato)
Citosina Citidina Ácido citidílico (2’-desoxicitidina 5’-trifosfato)
Timina Timidina Ácido timidílico (2’-desoxicitidina 5’-trifosfato)
Uracila Uridina Ácido uridílico (uridina 5´-trifosfato)
Um nucleotídeo
Bases (A, T, G ou C)
Pontes de H (2 ou 3)
Esqueleto Açúcar-Fosfato
(repetitivo)
1: O MATERIAL GENÉTICO – 25
Ligações - Polinucleotídeo: formado pela união de vários nucleotídeos através dos grupamentos fosfato. Este é o passo essencial para a formação dos chamados
polímeros de nucleotídeos, ou polinucleotídeos. O DNA e o RNA são polinucleotídeos.
Ligação fosfodiéster: o grupamento -fosfato se
liga ao C 5’ de um nucleotídeo e ao C 3’ de outro
nucleotídeo, através de ação enzimática. A energia
requerida provém da quebra das ligações fosfato;
um pirofosfato inorgânico é gerado.
Fosfodiéster significa duas uniões éster (C-O-P) 5’
e 3’ em cada ligação.
POLINUCLEOTÍDEOS: LIGAÇÕES, TERMINAÇÕES E TAMANHOS
Tamanhos e combinações
Exemplo com 10 nucleotídeos apenas
Raciocínio: qualquer uma das 4 bases pode estar presente em uma determinada posição, e o número de combinações possíveis é: 410 = 1.048.576
Com isto se observa a grande variabilidade que pode ser encontrada no DNA, já que as possíveis combinações são virtualmente infinitas.
A- ESTABILIDADE
O esqueleto de açúcar-fosfato é extremamente estável
As ligações C-C no açúcar são resistentes ao ataque químico, exceto por ácidos sob altas temperaturas
A ligação fosfodiéster é um pouco menos estável e pode ser hidrolizada a temperatura ambiente, sob pH 2; esta não é, no entanto, condição encontrada
em seres vivos
Nota: no RNA, a presença do OH extra no C 2’ facilita a hidrólise, e portanto o RNA é menos estável: organismos que usam o RNA como
material genético precisam protegê-lo com uma capa protéica
As bases também são bastante estáveis [exceto C, que se desamina para U, que pareia com A e não com G; sistema de reparo substitui Us no DNA, e
por isso U não é utilizado no DNA (regra: sempre substitua U por C)]
B- SEGURANÇA
A molécula é redundante, de tal forma que uma cópia pode servir como modelo para possíveis correções de erros
A dupla hélice também forma um ambiente hidrofóbico, de tal forma que a água é excluída e as bases e pontes de H sofrem pouco ataque
PORQUE O DNA É USADO COMO MATERIAL GENÉTICO?
1 - no nucleotídeo (Açúcar+Fosfato+Base) que está
entrando na cadeia, a hidroxila do carbono 5` já havia
reagido com o ácido fosfórico, formando a primeira
ligação éster
2 - a hidroxila do carbono 3 ´reage com o fosfato alfa do
nucleotídeo entrante, formando a segunda ligação éster
3 - um pirofosfato
inorgânico é gerado
Terminação 3´
Nesta ocorre o inverso – o grupamento trifosfato perdeu os
fosfatos e , mas o grupo OH 3’ permanece intacto
Terminação 5´
Nesta, o grupamento trifosfato do C 5’ não participa da
ligação, mas sim o grupamento OH 3’
1: O MATERIAL GENÉTICO – 26
Chargaff, Visher e Zamenhof (1950): cromatografia em papel para determinar as quantidades de cada uma das bases em amostras de DNA de diferentes tecidos
animais e vegetais. Os resultados indicam um relação matemática simples, onde o número de adeninas é sempre igual ao número de timinas, e o número de guaninas é
sempre igual ao número de citosinas. Embora a proporção de A=T e de G=C, os conteúdos de A+T e conseqüentemente de G+C diferem entre organismos, o que pode
indicar maneiras como os genes são estruturados ou como a ação gênica é controlada.
Rosalind Franklin também obtivera boas fotografias de difração de raio-X do DNA, e determinara que as fibras poderiam apresentar duas formas: A e B; a ocorrência de
uma ou de outra dependia do grau de hidratação. Seu trabalho chegou às mãos de Watson e Crick através de um dos revisores, Perutz, com sua apreciação: diâmetro de 20
Å, mais de uma cadeia, distância entre bases de 3,4 Å, e altura de 34 Å (FRANKLIN, R.E.; GOSLING, R.G. Molecular configuration in sodium thymonucleate. Nature, v.
171, p. 740-741, 1953.).
A ESTRUTURA DO DNA
A DUPLA HÉLICE DE WATSON E CRICK (1953)
2 – As bases nitrogenadas estão no interior da hélice, e o arcabouço açúcar-
fosfato na parte externa.
Espécie Reino % G+C
Variação
intragenômica
Mycoplasma sualvi Bacteria 23,70
Mycoplasma genitalium Bacteria 31,64
Haemophilus influenzae Bacteria 37,50
Thermogota maritima Bacteria 46,45
Escherichia coli Bacteria 51,27
Treponema pallidum Bacteria 52,54
Deinococcus radiodurans Bacteria 67,24
Corynebacterium insidiosum Bacteria 77,10
baixa
Methanococcus jannaschii Archae 31,84
Pyrococcus horikoshii Archae 42,32
Archaeoglobus fulgidus Archae 49,37
Aeropyrum pernix Archae 57,49
baixa
Saccharomyces cerevisiae Eukarya 39,72
Caenorhabditis elegans Eukarya 42,58
Mus musculus Eukarya 52,79
Homo sapiens Eukarya 52,53
Alta
(presença de
isócoros)
Fontes; www.kazusa.or.jp.codon; ; www.msu.edu/~jhjacksn/Tools/dodefreq
A estrutura de dupla hélice foi proposta por James Watson e Francis Crick, com base nas evidências que eles recolheram na época, com as seguintes características:
3 – Os filamentos têm sentidos opostos: 5’-3’ e 3’-5’. Esse antiparalelismo é uma
consequência do favorecimento topológico e bioquímico da formação de pontes
de hidrogênio. Isto vale dizer que, se as fitas fossem paralelas, ainda poderiam se
formar pontes de hidrogênio, mas estas não seriam favoravelmenteenergéticas.
5 `
5 `3 `
3 `
O
O
H
O
O
O
H
O
Fonte de
Raio X
Filme
Amostra
de DNA
Raio X
Difração
dos raios
Revelação do filme
Proporção das bases nas
amostras de DNA
Organismo
A:T G:C
Vaca 1,04 1,00
Seres humanos 1,00 1,00
Salmão 1,02 1,02
Escherichia coli 1,00 0,99
Fonte: Chargaff and J. Davidson. Eds.
The Nucleic Acids. Academic Press, 1955
Chargaff, E. Chemical
specificity of nucleic acids
and mechanisms of their
enzymatic degradation.
Experientia, v. 6, p. 201-
240, 1950.
Em 1951, Watson viu pela primeira vez fotografias de difração de raio-X. As primeiras
imagens analisadas por ele foram as de Astbury, produzidas em 1938. Essas primeiras
imagens, que não eram muito boas, representavam a periodicidade de 0,34 nm, o que
corresponde às bases dos nucleotídeos, que aparentemente estavam empilhadas (Astbury,
W. T.; Bell, F. O. Some recent developments in the X-ray study of proteins and related
structures. Cold Spring Harbor Symp. Quant. Biol., v. 6, p. 109-119, 1938.). Segundo
Watson, o DNA demonstrava ter elementos estruturais regulares e analisáveis; o material
genético não era totalmente irregular, amorfo e insondável.
Além dessa proporcionalidade, também foram importantes dados sobre a ocorrência do
DNA sob a forma cetônica, e não enólica, como se pensava, e o fato de os nucleotídeos
do DNA estarem ligados por ligações 5´- 3´-fosfodiester (Brown, D. M.; Todd, A. R.
Nucleotides. Part X: some observations on the structure and chemical behaviour of the
nucleic acids. J. Chem. Soc., v. 24, p. 52-58, 1952). Todd recebeu o Prêmio Nobel de
Química em 1957, por essas descobertas.
O modelo da dupla hélice de Watson e Crick (1953) surgiu basicamente por modelagem; eles construíram um modelo em escala, baseado nas diversas evidências
existentes, bem como nas leis da química. Em particular, duas linhas de evidência foram utilizadas: (i) As proporções de base de Chargaff e outros dados químicos; (ii)
As análises de difração de raio X de Wilkins e Franklin.
Espécie Reino % G+C
Variação
intragenômica
Mycoplasma sualvi Bacteria 23,70
Mycoplasma genitalium Bacteria 31,64
Haemophilus influenzae Bacteria 37,50
Thermogota maritima Bacteria 46,45
Escherichia coli Bacteria 51,27
Treponema pallidum Bacteria 52,54
Deinococcus radiodurans Bacteria 67,24
Corynebacterium insidiosum Bacteria 77,10
baixa
Methanococcus jannaschii Archae 31,84
Pyrococcus horikoshii Archae 42,32
Archaeoglobus fulgidus Archae 49,37
Aeropyrum pernix Archae 57,49
baixa
Saccharomyces cerevisiae Eukarya 39,72
Caenorhabditis elegans Eukarya 42,58
Mus musculus Eukarya 52,79
Homo sapiens Eukarya 52,53
Alta
(presença de
isócoros)
Fontes; www.kazusa.or.jp.codon; ; www.msu.edu/~jhjacksn/Tools/dodefreq
1 – A dupla hélice contém dois polinucleotídeos, determinação esta feita
através da medida da densidade do DNA; um modelo errado (tripla
hélice) foi proposto por Linus Pauling alguns meses antes; nesse modelo,
o eixo açúcar-fosfato estava no meio da tripla hélice, com as bases
protundidas para o exterior – isso, na concepção de Pauling, tornaria as
bases acessíveis. Na verdade, as bases para fora, além de expô-las em
demasia, conferiria um caráter básico ao assim chamado ácido
nucléico....
4 – As bases interagem diretamente através de pontes de hidrogênio. Há também
interações hidrofóbicas entre as bases, através de forças de Vand der Walls entre elas,
devido ao seu “empilhamento”, e interações de cátions com o esqueleto açúcar-fosfato.
1: O MATERIAL GENÉTICO – 27
6 – Há dois tipos de sulcos: um
maior e outro menor (importantes
nas interações DNA - proteínas).
Os átomos C2’ e C3’ podem estar nas formas endo ou exo; as
rotações ao redor da ligação 4, e mais as possíveis forma anti e
sin (para purinas) e anti (para pirimidinas), contribuem para as
diferentes conformações do DNA.
Forma do DNA
A B C Z
Direção da hélice Direita Direita Direita Esquerda
Pb por giro 11 10 (10,5) 9,3 12
Distância entre pb (Å) 2,6 3,4 3,3 3,7
Diâmetro da hélice (Å) 23 20 19 18
Conformação do açúcar C3’ endo C2’ endo C2’ endo (pu)
C3’ endo (pi)
Conformação do glicosil Anti Anti Sin (pu)
Anti (pi0
A forma B é a convencional e a mais estável, para um DNA randômico sob condições fisiológicas.
A forma A é favorecida na ausência de água. Nesta forma, o sulco maior é mais profundo, ao
passo que o sulco menor é mais raso. A estrutura cristalina do DNA tende a ser a forma A.
A forma Z é mais radical, já que inverte a mão de giro. Algumas sequências de nucleotídeos, por
exemplo quando purinas se alternam com pirimidinas, particularmente G e C, tendem a adquirir
esta conformação. Nesta forma, o sulco maior é praticamente inexistente, e o sulco menor é mais
profundo. Não se sabe se o DNA A ocorre em células, mas a forma Z certamente ocorre e pode
estar associada à regulação da expressão gênica. A formação do Z-DNA é desfavorável do ponto
de vista energético e topológico. Na junção Z-B DNA, uma base fica “saltada”. Ainda perduram
muitas dúvidas sobre a importância do Z-DNA, mas acredita-se que ele se forme como
consequência da transcrição, para aliviar parte da torção que ocorre durante o processo, e assim
parece que o Z-DNA está associado a regiões de transcrição ativa alta.
A forma C ocorre sob condições extremamente severas de desidratação.
Já o A-DNA assemelha-se ao B-DNA mas apresenta um número maior de bases por giro,
resultando assim em uma molécula mais curta, com um sulco maior mais profundo e um sulco
menor mais raso, e corresponde ao DNA A desidratado em meio com baixa concentração de sais.
Outras formas incluem D, E, e P-DNA.
5 – O pareamento obedece a uma regra importante, que tem a ver com a
espessura da dupla hélice. Certas combinações (duas purinas ou duas
pirimidinas) não se encaixam.
7 – A dupla hélice gira para a direita (isto é, o “corrimão” da escada em
espiral está à direita de quem sobe...), mas há exceções.
8 – Existem formas alternativas da dupla hélice, por diferenças em
conformações do açúcar, e também devido a outras condições do meio
onde o DNA está.
DNA “A” DNA “B” DNA “Z”
± 11 Å
1: O MATERIAL GENÉTICO – 28
SULCO
MAIOR
SULCO
MENOR
The structure is an open one, and its water content is rather high. At lower water contents we would expect the bases to tilt so that the structure
could become more compact. The novel feature of the structure is the manner in which the two chains are held together by the purine and
pyrimidine bases. The planes of the bases are perpendicular to the fibre axis. They are joined together in pairs, a single base from one chain being
hydrogen-bonded to a single base from the other chain, so that the two lie side by side with identical z-co-ordinates. One of the pair must be a
purine and the other a pyrimidine for bonding to occur. The hydrogen bonds are made as follows : purine position 1 to pyrimidine position 1 ; purine
position 6 to pyrimidine position 6. If it is assumed that the bases only occur in the structure in the most plausible tautomeric forms (that is, with the
keto rather than the enol configurations) it is found that only specific pairs of bases can bond together. These pairs are : adenine (purine) with
thymine (pyrimidine), and guanine (purine) with cytosine (pyrimidine). In other words, if an adenine forms one member of a pair, on either chain,
then on these assumptionsthe other member must be thymine; similarly for guanine and cytosine. The sequence of bases on a single chain does
not appear to be restricted in any way. However, if only specific pairs of bases can be formed, it follows that if the sequence of bases on one chain
is given, then the sequence on the other chain is automatically determined.
It has been found experimentally3,4 that the ratio of the amounts of adenine to thymine, and the ration of guanine to cytosine, are always bery close
to unity for deoxyribose nucleic acid. It is probably impossible to build this structure with a ribose sugar in place of the deoxyribose, as the extra
oxygen atom would make too close a van der Waals contact. The previously published X-ray data5,6 on deoxyribose nucleic acid are insufficient for
a rigorous test of our structure. So far as we can tell, it is roughly compatible with the experimental data, but it must be regarded as unproved until
it has been checked against more exact results. Some of these are given in the following communications. We were not aware of the details of the
results presented there when we devised our structure, which rests mainly though not entirely on published experimental data and stereochemical
arguments.
It has not escaped our notice that the specific pairing we have postulated immediately suggests a possible copying mechanism for the genetic
material.
Full details of the structure, including the conditions assumed in building it, together with a set of co-ordinates for the atoms, will be published
elsewhere.
Acknowledgements: We are much indebted to Dr. Jerry Donohue for constant advice and criticism, especially on interatomic distances. We have also been stimulated by
a knowledge of the general nature of the unpublished experimental results and ideas of Dr. M. H. F. Wilkins, Dr. R. E. Franklin and their co-workers at King's College,
London. One of us (J. D. W.) has been aided by a fellowship from the National Foundation for Infantile Paralysis.
Figure 1
This figure is purely diagrammatic. The two ribbons symbolize the two phophate-sugar chains, and the horizonal rods the pairs of bases holding the
chains together. The vertical line marks the fibre axis.
CÓPIA DO PAPER ORIGINAL DE WATSON E CRICK, PUBLICADO NA REVISTA NATURE
WATSON, J.D.; CRICK, F.H.C. Molecular structure of nucleic acids. Nature, v. 171, p. 737-738, 1953.
Medical Research Council Unit for the Study of Molecular Structure of Biological Systems, Cavendish Laboratory, Cambridge.
A Structure for Deoxyribose Nucleic Acid
We wish to suggest a structure for the salt of deoxyribose nucleic acid (D.N.A.). This structure has novel features which are of considerable
biological interest. A structure for nucleic acid has already been proposed by Pauling and Corey1. They kindly made their manuscript available to us
in advance of publication. Their model consists of three intertwined chains, with the phosphates near the fibre axis, and the bases on the outside.
In our opinion, this structure is unsatisfactory for two reasons: (1) We believe that the material which gives the X-ray diagrams is the salt, not the
free acid. Without the acidic hydrogen atoms it is not clear what forces would hold the structure together, especially as the negatively charged
phosphates near the axis will repel each other. (2) Some of the van der Waals distances appear to be too small.
Another three-chain structure has also been suggested by Fraser (in the press). In his model the phosphates are on the outside and the bases on
the inside, linked together by hydrogen bonds. This structure as described is rather ill-defined, and for this reason we shall not comment on it. We
wish to put forward a radically different structure for the salt of deoxyribose nucleic acid. This structure has two helical chains each coiled round the
same axis (see diagram). We have made the usual chemical assumptions, namely, that each chain consists of phosphate diester groups joining ß-
D-deoxyribofuranose residues with 3',5' linkages. The two chains (but not their bases) are related by a dyad perpendicular to the fibre axis. Both
chains follow right- handed helices, but owing to the dyad the sequences of the atoms in the two chains run in opposite directions. Each chain
loosely resembles Furberg's2 model No. 1; that is, the bases are on the inside of the helix and the phosphates on the outside. The configuration of
the sugar and the atoms near it is close to Furberg's 'standard configuration', the sugar being roughly perpendicular to the attached base. There is
a residue on each every 3.4 A. in the z-direction. We have assumed an angle of 36° between adjacent residues in the same chain, so that the
structure repeats after 10 residues on each chain, that is, after 34 A. The distance of a phosphorus atom from the fibre axis is 10 A. As the
phosphates are on the outside, cations have easy access to them.
REFERENCES
1- Pauling, L., and Corey, R. B., Nature, 171, 346 (1953); Proc. U. S. Nat. Acad. Sci, 39, 84 (1953).
2- Furberg, S., Acta Chem. Scand., 6, 634 (1952).
3- Chargaff, E., for references see Zamenhof, S., Brawerman, G., and Chargaff, E., Biochim. et Biophys. Acta, 9, 402 (1952).
4- Wyatt, G. R., J. Gen. Physiol., 36, 201 (1952).
5- Astbury, W. T., Symp. Soc. Exp. Biol., 1, Nucleic Acid, 66 (Camb. Univ. Press, 1947).
6- Wilkins, M. H. F., and Randall, J. T. Biochim. et Biophys. Acta, 10, 192 (1953).
1: O MATERIAL GENÉTICO – 29
RNA
ALGUNS ASPECTOS DA QUÍMICA DE ÁCIDOS NUCLÉICOS
Extremos de pH ou temperaturas altas causam desnaturação do DNA pela quebra das pontes de
H entre as bases. A desnaturação é reversível (reanelamento). A tm é a temperatura no meio-
ponto da desnaturação, e depende do pH, do tamanho e da composição do DNA, mas
basicamente quanto maior o conteúdo de G≡C, maior é a temperatura necessária para
desnaturação.
A hibridização de diferentes moléculas de DNA ocorre sempre que há um grau suficiente de
similaridade entre as composições de bases das mesmas; esta particularidade do DNA forma a base
de algumas técnicas moleculares que serão vistas mais tarde.
Em fins de 1960 foi proposto que o RNA precedeu o DNA, com base na tripla função do RNA nas células
(mensageiro, transportador e ribossômico). Outras descobertas mais recentes corroboraram este fato: a existência de
ribozimas; a presença de cofatores semelhantes aos monômeros de RNA em todos os seres vivos; a flexibilidade do
RNA; as partículas de RNA interferentes; e a derivação do DNA a partir do RNA.
De particular importância são as ribozimas, que resolvem o dilema “o ovo ou a galinha”: ácidos nucléicos são
essenciais à vida mas necessitam de enzimas para funcionar; se o RNA tiver a função de ácido nucléico e de enzima,
o dilema está resolvido. Assim, o RNA é único na sua capacidade de estocar informação e de executar uma série de
ações catalíticas. Mais e mais estão surgindo evidências disso (ver por exemplo revisão de Eiras et al. (2006)
Viróides e virusóides: relíquias do mundo de RNA. Fitopatologia Brasileira, v. 31, n. 3, p. 229-246).
Há três tipos principais de moléculas de RNA: mRNA, tRNA e rRNA. Uma importante diferença diz respeito à
presença da base uracila (U) no RNA, ao invés da timidina (T). A uracila forma pares de bases com a adenosina (A).
Outros tipos de RNA, menos abundantes, são os snRNA, snoRNA, RNA 7SL, dentre outros.
MOLÉCULA INFORMACIONAL
MOLÉCULAS FUNCIONAIS
5’5’
3’3’
5’5’3’3’
8 9 10 11 12 1388 99 1010 1111 1212 1313
26
27
28
29
30
31
43
42
41
40
39
2626
2727
2828
2929
3030
3131
4343
4242
4141
4040
3939
38 32
37 33
36 3435
3838 32323737 3333
3636 34343535
4444
14
15
16
17
18
19
...
21
22232425
...
20
1414
1515
1616
1717
1818
1919
......
2121
2222232324242525
......
2020
4545
4646
4747
......
......
......
......
......
1
2
3
4
5
6
7
69
68
70
67
71
72
73
66
1
2
3
4
5
6
7
11
22
33
44
55
66
77
6969
6868
7070
6767
7171
7272
7373
6666
4848
65
4950
64
51
63
52
62 6565
49495050
6464
5151
6363
5252
6262
59 60
6158
53
54
56
55
57
5959 6060
61615858
5353
5454
5656
5555
5757
C
C
A
C
C
A
C
C
A
UNIDADE 3: TRANSCRIÇÃO - PÁG. 1
ONDE OS GENES ESTÃO LOCALIZADOS
Os organismos modernos provavelmente evoluíram de um organismo procarionte ancestral, através de uma série de modificações. Os eucariontes anaeróbicos antigos
deram origem aos eucariontes aeróbicos através da incorporação de bactérias endossimbióticas vermelhas, as quais vieram a se transformar em mitocôndrias. Por outro
lado, ciano-bactérias protossintéticas tornaram-se endossimbiontes de alguns eucariontes simbióticos, gerando os precursores fotossintéticos das modernas plantas e
algas. Portanto, além do DNA localizado nos cromossomos, os organismos superiores apresentam também DNA nas suas organelas (mitocôndrias e cloroplastos).
1: O MATERIAL GENÉTICO – 30
Genes são segmentos de DNA
Em sua definição mais simplista, um gene pode ser definido como um segmento da molécula de DNA separado por DNA intergênico, mas esta definição
não dá uma idéia exata do que seja um gene. Uma definição mais apropriada pode ser encontrada em alguns livros, tais como “Molecular Cell Biology”,
de Lodish e colaboradores: “Em termos moleculares, um gene é usualmente definido como toda a sequência de ácido nucléico que é necessária para a
síntese de um polipeptídeo funcional. De acordo com esta definição, um gene inclui mais do que os nucleotídeos que codificam a sequência de
aminoácidos de uma proteína, conhecida como a região codificadora. Um gene também inclui todas as sequências de DNA necessárias para a síntese de
um transcrito de RNA particular. Em alguns genes procarióticos, as sequências de DNA que controlam a iniciação da transcrição pela RNA polimerase
podem se encontrar a milhares de pares de bases da região codificadora”. O tamanho varia de cerca de 75 até mais de 2.300 pares de bases. Os genes
estão organizados de maneiras diferentes nos diferentes organismos. Em geral, eucariontes apresentam mais DNA intergênico do que procariontes. Alguns
vírus apresentam genes muito compactados, inclusive com a sobreposição de quadros de leitura.
A sequência de nucleotídeos é a característica fundamental do gene. O filamento molde é o que atua como modelo para a síntese do RNA complementar
(confusão com ‘codificante’ e ‘não-codificante’, e ‘sentido’ e ‘anti-sentido’).
A informação biológica de um determinado gene é levada por apenas um polinucleotídeo, mas ambas as fitas codificam para diferentes genes. Portanto, lembrar sempre
que A INFORMAÇÃO DE UM GENE ESTÁ EM APENAS UMA FITA, MAS AMBAS AS FITAS CODIFICAM (PARA DIFERENTES GENES...).
GENES E A INFORMAÇÃO BIOLÓGICA
Genes são segmentos de DNA?
Mesmo estando correta, esta afirmativa é uma super-simplificação do conceito de
“gene”, que pode ser definido sob várias óticas, desde a mais tradicional (um gene =
um produto) até outros conceitos mais modernos. O debate persiste, e pode bem ser
apreciado no artigo “Entre a cruz e a espada: a crise do conceito de gene”, publicado
em 2007 na revista da Sociedade Brasileira de Genética, cujo sumário é apresentado
abaixo.
Genes sobrepostos
Embora em geral um determinado segmento de DNA codifique apenas um gene, em alguns casos isto não é verdadeiro, formando os chamados genes sobrepostos; estes são
comuns em fagos e outros vírus, que apresentam um genoma pequeno. Esta estratégia possibilita um maior número de proteínas com menos material genético, e isto é
conseguido porque a matriz de leitura é diferente de um gene para outro, ou seja, um mesmo segmento é lido a partir de diferentes pontos de início (quadros de leitura). Um
bom exemplo com os genes A e B do fago X174, aqui representados de maneira hipotética. Note que o gene B está no interior do gene A, enquanto que o gene C divide uma
parte da região codificante com o gene A; a expressão de um ou de outro obedecerá ao controle celular ou viral.
Segundo Johnson e Chisholm (2004), a sobreposição de genes tem sido geralmente atribuída à minimização do tamanho do genoma, e também como um mecanismo
regulatório da expressão gênica. Originalmente descritos para genomas virais, mitocondriais e de elementos extranucleares, hoje eles tem sido encontrado mais freqüentemente
em DNA cromossomal de procariontes e de eucariontes; de fato, cerca de um terço de todos os genes de procariontes seqüenciados até o momento são sobrepostos (Johnson,
Z.I & Chisholm, S. W. Properties of overlapping genes are conserved across microbial genomes. Genome Research 14:2268-2272, 2004). No próprio genoma humano, já
foram relatados inúmeros genes sobrepostos, incluindo genes “aninhados” (“nested”).
O gene M encontra-se
completamente aninhado no gene N:
seu quadro de leitura inicia e
finaliza no interior daquele.
Os genes A, B e C apresentam uma topografia
“convencional”, por assim dizer: não há sobreposição entre
eles, e os mesmos estão separados por regiões intergênicas.
Neste e nos demais genes, a seta indica a direção da
transcrição (fita lida no sentido 3´-5´, com polimerização
ocorrendo no sentido 5´-3´.
Os genes K, L, M e N apresentam uma topografia menos comum.
K e L são genes sobrepostos: ambos são codificados pela mesma fita de DNA, e
o quadro de leitura de L inicia-se no interior do gene K (ver detalhe abaixo).
Por outro lado, M é um gene aninhado em N: seu quadro de leitura inicia-se e
finaliza no interior daquele.
M
N
Os genes W, X, Y e Z apresentam sobreposição parcial, mas são
codificados por fitas diferentes.
W e X são “convergentes”, ou seja, seus quadros de leituras, na fita
superior (W) e inferior (X) convergem entre si.
Por outro lado, Y e Z, cujos quadros de leitura também estão em
fitas diferentes, são “divergentes”.
1: O MATERIAL GENÉTICO – 31
Há duas grandes categorias de DNA:
(i) intragênico, associado com uma unidade
gênica funcional (íntrons, éxons, promotores)
ou genes não funcionais (por exemplo
pseudo-genes); e
(ii) extragênico, não envolvido com um gene
ou associado a sequências. A quantidade de
DNA extragênico varia (por exemplo, mais
de 70% em humanos) e também contém
múltiplas cópias de sequências denominadas
DNA repetitivo.
Dois grandes grupos de DNA ocorrem em
cópia única: os genes funcionais de cópia
simples e o DNA espaçador.
O DNA repetitivo se divide em sequências
funcionais e sequências não funcionais ou
cuja função ainda é desconhecida. Dentre as
sequências funcionais encontram-se as que
formam famílias gênicas. Em muitos casos, é
vantajoso organizar os genes em grupos,
como ocorre com os óperons e com as
famílias gênicas. Isto pode facilitar eventos
como a transcrição e a tradução.
ORGANIZAÇÃO DE GENOMAS
Famílias: genes correlacionados não por participarem de uma mesma rota, mas por possuírem sequências similares ou idênticas.
Famílias multigênicas simples: genes virtualmente idênticos aparecem agrupados em várias cópias (até 2.000 genes de rRNA 5S no cromossomo 1 de seres humanos); surgem
pela necessidade de grande expressãogênica. Na mosca da fruta e outros organismos, há várias repetições dos grupos.
Famílias multigênicas complexas: genes similares reunidos em segmentos de DNA. Um exemplo é a família dos genes da globina nos vertebrados. Em humanos, cada tipo de
polipeptídeo alfa e beta existe como uma família com pequenas modificações. A família multigênica alfa encontra-se no cromossomo 16, e a da beta no cromossomo 11.
Pseudogenes convencionais: genes funcionais inativos, produzidos por uma ou mais mutações capazes de introduzir um códon de parada ou de alterarem o quadro de leitura
da sequência codificante. Os pseudogenes são particularmente encontrados em loci de famílias multigênicas; por exemplo, na família do genes alfa e beta globina, os grupos
incluem genes funcionais e não-funcionais (pseudo-genes), denotados por psi.
Pseudogenes processados: representam a forma em mRNA do gene, ao invés da forma de DNA original; não têm, portanto, sequências de íntrons e de promotores. O
mecanismo de surgimento pode envolver transcriptase reversa, convertendo o mRNA processado em DNA que, então, pode ter sido inserido de volta no genoma.
Relíquias ou restos gênicos: representam truncagens das extremidades 3’ ou 5’ de um gene ancestral, que podem ter surgido por eventos de recombinação direcional ou
desigual.
Sequências não-codificantes mas funcionais: os telômeros, no final dos cromossomos, apresentam sequências que não codificam para proteína mas tem uma função muito
importante durante a replicação.
FILAMENTOS “MOLDE” E “NÃO-MOLDE”
PSEUDOGENES
No funcionamento normal dos genes (painel à esquerda), o DNA é
transcrito em RNA, que é então "processado" pela remoção dos íntrons (as
sequências não-codificantes entre as caixas em cinza) e pela adição de uma
cauda de poli (A). O RNA processado maduro é então traduzido em uma
cadeia de aminoácidos para formar uma proteína. Os paralelos à direita
ilustram os dois caminhos que geram pseudogene duplicado clássico (no
alto) e o pseudogene processado (abaixo). No caminho superior, a
duplicação do DNA gera duas cópias do gene inteiro (caixa no alto à
direita), mas mutações um uma das cópias (representadas pelos "x")
tornam-na um pseudogene. No outro caminho, uma transcrição de RNA
processado de um gene pode tornar-se transcrita reversamente em uma
cópia de cDNA (caixa abaixo à direita), que se insere de volta no DNA da
célula em uma posição aleatória no genoma, frequentemente --como
mostrado aqui-- no DNA separador entre os genes (caixas brancas na
figura).
Fonte: Edward E. Max, M.D., Ph.D. Erros plagiados e a genética
molecular: mais um argumento na controvérsia evolução-criação. Site:
http://www.str.com.br/Scientia/plagiados.htm. Acesso em 27/01/2007.
A informação de um gene é transportada pelo filamento molde (atua como modelo para a síntese de uma molécula complementar de RNA). A informação é lida no sentido
3’-5’, enquanto que a síntese da fita complementar de DNA ou RNA é sempre no sentido 5’-3’. Outros nomes para os filamentos incluem sentido vs. anti-sentido, e
codificante vs. não codificante. No entanto, a nomenclatura varia de autor para autor, e geralmente leva a erros na interpretação.
… T A T A A G C A T G T C T T T T A A A T G A
… A T A T T C G T A C A G A A A A T T T A C T
↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓
A U G U C U U U U A A A U G A
Promotor TATAA …… Início(Met) Serina Fenilalanina Lisina Fim
Regiões regulatórias Gene
3´ Fita não molde (sentido, não-codificante)
5´ Fita molde (anti-sentido, codificante)
3´ RNA mensageiro
5`
3´
5´
1: O MATERIAL GENÉTICO – 32
ÓPERONS
Um óperon pode ser descrito como uma unidade de cistrons adjacentes cuja expressão está sob controle de uma região única (por exemplo, um promotor e um
operador; ou um ativador e um promotor) e leva à síntese de um mRNA policistrônico único; os genes que compõe um óperon codificam para proteínas
funcionalmente relacionadas, que participam de uma mesma rota metabólica. Os óperons representam um mecanismo evolucionário muito comum em procariontes,
que permitem a máxima utilização de seus genomas limitados, bem como uma economia considerável de energia, uma vez que os genes controlados são expressos
apenas quando necessários, e de forma coordenada, ou seja, na quantidade adequada em que cada um é necessário. Por exemplo, se para fazer uma determinada
molécula são requeridas três enzimas na proporção 1:1:1, o mais lógico para o organismo é ligar um comando que induza à produção conjunta das enzimas; o mesmo é
válido para enzimas envolvidas no catabolismo de produtos, por exemplo na utilização da lactose por bactérias. Este, por sinal, foi o primeiro óperon a ser descoberto e
estudado, em 1960, por Jacques e Monod, do Instituto Pasteur, na França.
Para elucidar o conceito de óperon e os mecanismos envolvidos na regulação dos mesmos, podemos nos valer do modelo para o óperon da síntese do triptofano,
composto por cinco genes, cujos produtos (enzimas) convertem corismato em triptofano. O óperon é controlado por um repressor que, quando acionado pelo
triptofano, se liga ao DNA e impede sua transcrição; assim, quando o triptofano é abundante nas células, ele não precisa ser sintetizado, mas quando ele é escasso, a
célula precisa promover sua síntese e portanto o repressor não se liga, permitindo a transcrição e tradução do cístron.
Corismato Antranilato P-ribosil-antranilato Enol-C-fenilamino-P Indol-glicerol-P Triptofano
1 2 3 4 5
t r p E t r p D t r p C t r p B t r p A t r p L (Líder) TrpTrp Operador Promotor t r p R
ENZIMAS -> Antranilato sintase Fosfotransferase Isomerase Indol sintase Triptofano sintase
Organização do DNA do óperon da lactose em procariontes
Rota metabólica levando à produção de triptofano em procariontes
Opção 1 - SEM ÓPERON: cada gene é regulado individualmente; isto representa maior dispêndio, e pode levar à produção de quantidades
diferentes de cada um dos produtos gênicos
Opção 2 - COM ÓPERON: há somente um controle para todos os genes; as vantagens incluem economia de energia e a produção de quantidades
sempre equivalentes das cinco enzimas requeridas para a produção de triptofano (uma unidade de cada por evento de transcrição)
L
D
L
D
L
D
L
D
L
D
t r p E t r p D t r p C t r p B t r p A
L
D
t r p E t r p D t r p C t r p B t r p A
Os passos marcados de 1 a 5, acima, representam as reações realizadas pelas cinco enzimas, codificadas pelos cinco genes trp (A, B, C, D, E). Já que cinco enzimas são
necessárias para a síntese do triptofano, na proporção de 1:1:1:1:1, ou seja, uma de cada para realizar a rota completa do metabolismo, tem-se basicamente duas opções
para dar conta do processo de transcrição desses genes:
Na realidade, o segundo modelo prevaleceu, tendo sido favorecido em termos evolutivos. Estudos mais apurados demonstraram a estrutura do óperon do triptofano
demonstrada abaixo; note que além dos cinco genes “estruturais”, envolvidos nas reações de síntese do triptofano, o óperon contém ainda dois genes “regulatórios”,
envolvidos na regulação da expressão gênica do óperon, que será detalhada em um capítulo posterior.
Conforme comentado acima, o óperon da lactose foi o primeiroa ser descrito, e é um óperon bastante bem estudado. No entanto, diferentemente do triptofano, que
engloba genes que participam de uma via metabólica para a síntese de um produto, o óperon da lactose engloba genes envolvidos na degradação da lactose para
utilização como fonte energética por bactérias. Esse óperon contém três genes: lacZ, para beta-galactosidase, lacY para galactosidase permease, e lacA para
tiogalactosidase transacetilase; o óperon é traduzido como um policístron, e cada gene é precedido por sítios de ligação de ribossomos, que independentemente
direcionam a tradução. Além desses genes, chamados “estruturais”, o óperon contém ainda um gene “regulatório”, lacI.
Organização do DNA do óperon do triptofano em procariontes
l a c Z Operador Promotor l a c I Promotor I l a c Y l a c A
mRNA
Beta-galactosidase
Permease
Transacetilase
Enzimas
Lactose fora da célula Lactose dentro da célula
Permease Galactose
+
Glucose
Galactosidase
Transacetilase
O metabolismo da lactose em procariontes
Liga
Desliga
Liga
Desliga
1: O MATERIAL GENÉTICO – 33
Sequências com função desconhecida
DNA centromérico altamente repetitivo: contém sequências repetitivas em longos arranjos consecutivos (em tandem). Três tipos são reconhecidos:
Satélites: encontrados no DNA flanqueando a heterocromatina ao redor do centrômero, podendo ser observados quando da centrifugação de DNA em gradiente de
cloreto de césio.
Minissatélites ou variable number of tandem repeats (VNTR): em humanos, 1 a 5 kb consistindo de repetições variáveis de 15 a 100 nt, e utilizados para o DNA
fingerprinting.
Microssatélites: compostos por repetições variáveis de 2 nt (por exemplo CA-GT) ou mononucleotídeos (AT), e também úteis como marcadores moleculares.
Estruturas de grampo: sequências repetidas invertidas capazes de formar estruturas estáveis em grampo, com cerca de 200 pb. Apesar de terem função desconhecida,
são extremamente comuns, com cerca de 2 milhões de repetições no genoma humano.
sequências transpostas (transposons): DNA repetitivo que se propaga no genoma através de cópias de si mesmo, as quais podem se mover. Incluem os retro-
transposon, que podem se mover pela ação da transcriptase reversa.
SINES (Short interspaced elements): estão espalhados pelo genoma e variam em comprimento desde 130 até 300 pb, sendo repetidos até 7.000 vezes. Uma das
importantes sequências nos humanos é a chamada Alu (contém sítios de restrição para a enzima AluI), que compreende cerca de 5% do DNA humano, e que se
assemelham ao gene do RNA 7SL, relacionado com a secreção de proteínas.
LINES: geralmente encontrados como elementos truncados, acreditando-se serem propagados por eventos de retro-transposição. LINE1 representa um elemento
repetido cerca de 60.000 vezes e com capacidade de se mover no genoma.
Spacer DNA: tudo o que não é reconhecível em outras categorias.
Elementos repetitivos em arroz – utilizando um organismo para exemplificar
Microssatélites (1-7 pb), minissatélites (até 40 pb) e satélites (140 a 360 pb) são encontrados no genoma de arroz. Estima-se que o número de microssatélites nesse
genoma esteja em torno de 6 a 10 mil, com a frequência das diferentes repetições decrescendo com o aumento do tamanho do motivo.
sequências móveis, tais como transposons e retrotransposons, formam uma grande proporção de DNA medianamente repetitivo. Em milho, cerca de 50% do genoma
é constituído por esses elementos.
Em arroz, deve haver cerca de 1.000 retroelementos. Os retroelementos encontrados no genoma do arroz podem ser classificados em:
-sequências móveis com repetições terminais longas (LTR – Long Terminal Repeats)
-Retrotransposons sem LTR: LINEs (Long Interspersed Nuclear Elements) e SINEs (Short Interspersed Nuclear Elements)
-Elementos de transposição com único LTR: MITEs (Miniature Inverted-Repeat Transposable Elements); estes perfazem cerca de 5% do genoma do arroz,
encontrando-se prevalentemente em regiões flanqueando genes
-Transposons das famílias Mutator, En/Spm, e Ac/Ds
Os centrômeros do arroz também contém trechos com sequências repetitivas misturadas com sequências medianamente repetitivas. Pelo menos sete famílias de DNA
repetitivo exclusivas do arroz já foram encontradas: seis medianamente repetitivas, com 50 a 300 cópias, e uma com 168 pb denominada RCS2, estimada em cerca
de 6 mil cópias e que pode se estender por até cerca de 150 kbp ininterruptos e 550 kbp de repetições centroméricas com pequenos gaps.
O “Dogma Central” de Crick, proposto em 1958, postula que a informação biológica é primeiro transferida ao RNA e depois à proteína. O dogma também
postulava que havia apenas uma direção nesse processo, e que o RNA não poderia orientar a síntese de DNA. Esta afirmativa foi provada errada em 1970,
quando Temin e Baltimore descobriram que alguns vírus transmitem a informação do RNA para o DNA. Pela sua descoberta, Baltimore, Temim e Renato
Dulbecco receberam o Prêmio Nobel de Medicina de 1975. A descoberta da transcriptase reversa foi, na época, considerada uma heresia, já que contrariava
o Dogma Central proposto por Crick...
O DOGMA CENTRAL
DNA
RNA
Proteína
1: O MATERIAL GENÉTICO – 34
Em 1977 foi descoberto que as sequências codificadoras de vários genes (éxons) são interrompidas por sequências não codificantes (íntrons). Íntrons são comuns em
eucariontes, tanto no núcleo quanto nas organelas, mas também são encontrados em arqueobactérias, eubactérias e bacteriófagos. Há exceções: por exemplo a grande
maioria dos genes de leveduras não apresenta íntrons. À primeira vista, representam um notável dispêndio de energia para os organismos, posto que representam
sequências bastante longas dos genes transcritos. Uma hipótese plausível, e que sugere um benefício deste tipo de arranjo, é que éxons individuais codificam para domínios
funcionais discretos de proteínas, o que pode possibilitar que novas proteínas sejam rapidamente produzidas durante a evolução, por recombinação ou embaralhamento de
éxons em novas combinações. Alguns genes contém vários íntrons, por exemplo, o gene para ovalbumina tem sete íntrons, e o gene da alfa-tropomiosina tem 14 íntrons
(representados na figura abaixo, não desenhada em escala). Alguns íntrons são muito extensos; por exemplo, um dos dois únicos íntrons do gene para a subunidade beta da
hemoglobina contém mais do que a metade dos pares de bases do gene.
ÍNTRONS E ÉXONS
Região regulatória Região codificante Direção da transcrição
3´ 5´
GENES PROCARIOTOS
Região regulatória Direção da transcrição
3´ 5´
Exons: seqüências
expressas, mantidas após
o processamento
Introns: seqüências
intervenientes,
eliminadas após o
processamento
GENES EUCARIOTOS
A maioria dos genes de procariontes não contém íntrons, mas há exceções
A maioria dos genes de eucariontes contém íntrons, mas há exceções
GENE A GENE B
Exons do Gene A Exons do Gene B
3´ 5´
Proteína A Proteína B
Recomposição de Exons
Nova Proteína C
NOVO GENE C
Formado pela
recomposição de dois
exons dos genes A e B
Recomposição de éxons
Um possível mecanismo evolucionário,
através do qual novos genes são formados a
partir da recomposição de éxons de dois
diferentes genes ancestrais.
Splicing alternativo – embaralhamento de éxons
Conforme comentado anteriormente,uma das possíveis vantagens evolucionárias da existência de íntrons e éxons é a possibilidade de embaralhamento dos éxons,
formando várias proteínas a partir de um mesmo gene. Neste exemplo, o pré-mRNA do gene da alfa-tropomiosina é alternativamente processado em diferentes tipos de
células, gerando nove tipos de proteínas.
Músculo estriado
Músculo liso
Cérebro (1)
Cérebro (2)
Cérebro (3)
Fibroblasto (1)
Fibroblasto (2)
Fibroblasto (3)
Fibroblasto (4)
A C E F G I J K L M
A B E F G I J K O
A C E F G I J K
D E F G I J K M
D E F G I J K N O
A C E F G I J K O
A C E F G H J K O
D E F G I J K O
A B C D E F G H I J K L M N O
A 1 B 2 C 3 D 4 E 5 F 6 G 7 H 8 I 9 J 10 K 11 L 12 M 13 N 14 O
1: O MATERIAL GENÉTICO – 35
REVISÃO
UNIDADE 1 - O material genético
•Saiba quais são as características fundamentais e desejáveis do material genético (Variedade de formas, autorreplicação, estocagem de
informação, variação por mutação mas estabilidade física, transferência de informação sem perda de fidelidade)
•Porque as proteínas foram consideradas durante muito tempo como as mais prováveis candidatas a material genético? (Mais abundantes, maior
número de subunidades = mais variabilidade potencial)
•No estudo do “princípio transformante” feito por Griffith, qual a importância da capa protéica de bactérias? Saiba como a cápsula funciona no
organismo (A cápsula elícita uma reação imune, e protege contra fagocitose)
•Saiba interpretar os quatro experimentos conduzidos por Griffith (Bactérias IS matam, IIR não matam, IS mortas por aquecimento não matam, e a
mistura destas com IIR – que sozinhas não matam – mata)
•O que acontece durante a transformação bacteriana? Saiba relacionar estes eventos com os achados de Griffith sobre a natureza do material
genético (Transformação é a “absorção” de DNA livre do ambiente e expressão deste pelas células transformadas; as células IIR foram
transformadas pelo DNA da IS)
•Qual o princípio geral dos experimentos de Avery, MacLeod e McCarty? Interprete os resultados à luz do que os autores concluíram em seu
trabalho (Avery e colaboradores utilizaram-se de enzimas degradativas; aquele material que ao ser destruído não mais causasse a transformação
seria o material genético; quem destrói esse material é a desoxirribonuclease)
•Qual o princípio geral dos experimentos de Hershey e Chase? Interprete os resultados até a 1a. geração. Porque foi importante deixar as bactérias
crescerem por mais uma geração? (Radiomarcação de P e S – onde são encontrados?- e uso de bacteriófagos; eles seguiram o destino do isótopo
radioativo e verificaram que o P seguia em maior quantidade para as gerações seguintes)
•Como você poderia provar que o RNA também pode servir como material genético? (Experimentos de Fraenkel-Conrat e Singer com partículas
híbridas de um vírus RNA – as partículas-filhas eram do tipo codificado pelo material genético e não pela capa protéica)
•Quais são os componentes básicos da cadeia de DNA? E de RNA? Saiba explicar qual a importância das hidroxilas dos C2 e C3 do açúcar (açúcar
– uma pentose – o ácido fosfórico e uma das 5 bases – A T G C U; as hidroxilas servem de “ponto de reação” para a polimerização)
•Saiba como diferenciar bases púricas de bases pirimídicas (Purinas – A G- têm dois anéis, pirimidinas – T C- apenas 1 anel)
•O que significa 5’-3’ e 3’-5’? Qual o sentido da vida? Porque as cadeias de DNA crescem somente em um sentido? (Significa a direção em que as
cadeias são polimerizadas, sendo 5´-3´ o sentido da vida, exatamente porque, por restrições enzimáticas, as cadeias crescem somente nesse
sentido)
•Saiba como um número relativamente pequeno de subunidades do DNA (por exemplo 10) pode fornecer tamanha variabilidade genética -
1.048.576 possíveis combinações (porque estamos lidando com permutações e combinações – matemáticos, ajudem-nos...)
•Saiba quais as características do DNA que o fazem ideal para servir como material genético (O esqueleto açúcar-P é estável, as ligações são
resistentes a ataques, a molécula é redundante, há um ambiente hidrofóbico no interior da dupla-hélice, as bases são estáveis; o RNA, pela
hidroxila extra, é mais reativo)
•A proporção de bases de Chargaff auxiliou na elucidação da estrutura do DNA. Saiba descrever como (Essa proporção foi essencial para se
postular o pareamento específico entre bases; também ajudou na teoria da dupla hélice)
•Você tem alguma teoria para a extrema variabilidade entre as proporções de bases observada quando diferentes organismos são comparados?
Relacione isto com as teorias de evolução (Filosofe à vontade)
•Porque os filamentos de uma cadeia de DNA têm sentidos opostos? (Restrições físicas ao pareamento, sentido de polimerização, ...)
•Descreva como seria um segmento de DNA que contivesse pareamentos entre purinas apenas. E entre pirimidinas (Entre purinas – dois anéis –
ficaria muito grande; entre pirimidinas – um anel – ficaria muito pequeno)
•Qual a contribuição de pontes de hidrogênio para a estabilidade do DNA? Elas são mais fortes entre pares AT ou pares GC? Como isso influencia
na hibridização e na desnaturação de cadeias de DNA? (As pontes mantém as duas fitas unidas, sendo mais fortes nos pares GC; na desnaturação
e hibridização, o que vale é a especificidade e o número de pontes formadas)
•Saiba que a direção de giro da dupla hélice pode ser tanto para a esquerda quanto para a direita. Quais as respectivas conformações? (A, B e C
tem giro para a direita, Z para a esquerda; a forma B é a “convencional”)
•É certo afirmar que a estrutura do RNA é mais simples do que a do DNA? Porque? (Sim, se considerarmos que em geral o RNA é produzido como
fita simples, mas não se considerarmos que muitas espécies – particularmente tRNAs e rRNAs - podem ter extensa hibridização interna, tornando-
as mais complexas do que o DNA)
•A hibridização, ou reassociação de moléculas desnaturadas de DNA segue alguns princípios. Quais são estes? (A medida é dada pela temperatura
do meio-ponto da desnaturação, que é dependente do tamanho do DNA, do pH, mas principalmente – e isto diferencia um do outro – da
composição, ou seja, proporção de ATs e GCs)
•É pertinente se utilizar a terminologia “filamento molde” e “filamento não-molde”? (Não, apenas segmento molde e segmento não molde; note que
um gene é codificado por apenas uma das fitas – o segmento molde daquele gene)
•Genes são localizados apenas nos cromossomos? (Não, há genes em plasmídios e em organelas – mitocôndrias e cloroplastos; ver teorias sobre
evolução destas organelas)
•O que caracteriza um óperon? (Um conjunto de genes sob um controle único; quais as vantagens disto?)
•O que são introns e éxons? Porque eles existem, e em que organismos? (Íntrons são sequências intervenientes, presentes em eucariontes, e que
podem servir como “fonte de variabilidade”: ver recomposição de éxons e splicing alternativo)
•O que postula o Dogma Central. Ele está certo? (Postula que a informação genética vai de DNA para RNA para proteína; está errado, posto que
alguns organismos revertem o ciclo DNA-RNA para RNA-DNA – retrovírus)
1: O MATERIAL GENÉTICO – 36
UNIDADE 2
Replicação
OBJETIVO
Discorrer sobre a necessidade de replicação do material genético e sobre as estratégias utilizadas pelos diferentes organismos, com ênfase nas enzimas
envolvidas na replicação.
CONTEÚDO
Replicação do DNA
Padrão geral de replicação
Mecanismos de replicação em procariontes
Mecanismos de replicaçãoem eucariontes
Comparação entre replicação em procariontes e eucariontes
GUIA DE ESTUDOS
Porque é necessário aos organismos replicar o material genético?
Como Watson e Crick (1953) inicialmente postularam ser a replicação do DNA? Eles estavam certos?
Há três modelos hipotéticos de replicação. Saiba descreve-los e diferencia-los. Há mais de um correto?
O experimento de Meselson-Stahl (1958) elucidou o modo de replicação. Saiba como o experimento foi conduzido,
quais seus postulados, e como os resultados foram interpretados. Porque foi necessário conduzir uma segunda
geração de replicação para descrever o modelo corretamente?
O que são forcas de replicação? Há mais de uma forca atuando simultaneamente em um evento de replicação?
A DNA polimerase I foi a primeira polimerase descoberta. Ela é a mais importante? Porque? Saiba dizer qual a sua
principal função no processo de replicação.
Quais são as outras polimerases mais atuantes na replicação de procariontes? Descreva suas funções.
Saiba interpretar os diagramas de correção de erros pela DNA pol I, pela sua atividade de exonuclease 3´-5´. Qual
a função da atividade de exonuclease 5´-3´?
Quais são os passos fundamentais dentro do processo de replicação em organismos procariotos? Como os
organismos conseguem resolver o problema de polimerizar apenas no sentido 5´-3´, porém em qualquer direção –
isto é, formando segmentos de replicação contínua e segmentos de replicação descontínua.
A síntese sempre se inicia com a colocação de um primer. O que são eles e porque não é possível fazer a síntese
sem os mesmos?
Saiba quais são os outros convidados nessa complexa tarefa de replicação do DNA, além das DNA polimerases. O
que ocorreria na ausência de cada um desses convidados?
Topoisomerases desempenham uma função importante nesse processo. Que função é essa e como ela é realizada?
Como os eucariontes resolvem o problema de replicar uma enorme quantidade de DNA em tempos relativamente
curtos, quando comparados com procariontes?
Quais são as funções e localizações das principais enzimas participantes da replicação de organismos eucariotos?
A telomerase realiza uma importante função: saiba descreve-la, e saiba também qual a associação entre essa
enzima, o envelhecimento e o câncer.
2: REPLICAÇÃO– 37
Há três modelos plausíveis para a replicação:
Conservativo: a molécula-mãe serviria de molde, mas se manteria intacta no final do processo;
Dispersivo: as duas moléculas resultantes seriam híbridos aleatórios da molécula-mãe e da molécula filha; e
Semi-conservativo: cada molécula resultante no final seria um híbrido, com uma fita proveniente da molécula-mãe e a outra fita sintetizada durante a
replicação.
Para testar as hipóteses, um experimento utilizou o gradiente de centrifugação de cloreto de césio, no qual o material é centrifugado a velocidades
muito altas (100.000 rpm) por 50-60 horas, de tal forma que os íons de Cl- e Cs+ formam um gradiente. As moléculas de DNA são empurradas para o
fundo, mas se equilibram no ponto onde a sua densidade as faz boiar. Se um segmento de DNA contiver átomos “pesados” de 15N, ele poderá ser
distinguido de segmentos que contém apenas átomos “leves” de 14N.
Porque replicar? Na multiplicação celular, as células filhas necessitam receber a informação genética.
O padrão geral da replicação: “Não escapou da nossa percepção que o pareamento específico que postulamos sugere imediatamente um possível
mecanismo de cópia do material genético” (Watson e Crick, 1953), isto é, cada polinucleotídeo pode servir de molde para a síntese de seu
complemento.
REPLICAÇÃO DO DNA
O EXPERIMENTO DE MATHEW MESELSON E FRANKLIN STAHL (1958)
Neste experimento, células de E. coli cresceram em meio com isótopos pesados de 15N (15NH4Cl), os quais foram utilizados como precursores das
bases nitrogenadas incorporadas no DNA. Em seguida, as células foram removidas do meio, lavadas e transferidas para meio contendo apenas 14N,
onde foram deixadas para crescer por uma ou duas gerações. As amostras coletadas em cada etapa foram submetidas a gradientes de CsCl.
Interpretação do experimento
À vista dos três modelos teóricos, apenas o modelo semi-conservativo é compatível com os resultados do experimento:
• uma banda intermediária na primeira geração;
• uma banda intermediária e uma leve na segunda geração.
Note que os resultados não seriam conclusivos se apenas uma geração em 14N tivesse sido conduzida, ou se apenas a segunda geração tivesse sido
analisada. Ambas são essenciais para a interpretação correta do experimento.
Resultado das
centrifugações em
gradiente de CsCl:
Na geração “zero”,
apenas uma banda
pesada foi observada.
Na primeira geração
formou-se apenas uma
banda de DNA de
densidade intermediária
entre os controles 14N e
15N.
Na segunda geração,
duas bandas se
formaram, uma
intermediária e a outra
com a mesma densidade
de 14N.
CONSERVATIVO SEMI- DISPERSIVO
CONSERVATIVO
Resultado observado O que ocorreria em cada um dos modelos
Geração 0
15N
Geração 1
14N
Geração 2
14N
14N
14N/15N
15N
14N
14N/15N
15N
14N
14N/15N
15N
2: REPLICAÇÃO– 38
MODOS DE REPLICAÇÃO: A ORIGEM E A DIRECIONALIDADE
Sequências de origem e fim da replicação
Em E. coli, existe uma origem de iniciação da replicação (oriC),
composta por três sequências, com 13 pares de bases cada uma, e
mais quatro sequências, com 9 pares de base cada. Esses segmentos
de DNA são ricos em pares A=T, posto que nestes pares há apenas
duas pontes de hidrogênio, facilitando assim a abertura da fita.
A terminação se dá em uma de várias sequências Ter, localizadas em
duas regiões distais à região da ori, chamadas de “armadilhas de
terminação”, uma da esquerda e outra da direita. Quando uma
sequência é encontrada pela polimerase – e apenas uma delas –
forma-se um complexo envolvendo a proteína Tus (Terminus
utilization substance), que arresta o processo de replicação; a outra
polimerase (da outra direção da forquilha) continua então até
encontrar esse complexo, e aí sim a replicação termina.
O produto final é um concatâmero de duas moléculas, que devem ser
separadas por ação de uma topoisomerase do tipo 2 (topoisomerase
IV).
Origem única ou múltiplas origens?
Em procariontes, via de regra existe apenas uma origem de
replicação, ao passo que eucariontes são caracterizados por
múltiplas origens.
Origem
Pelo modelo teórico de W&C haveria uma forquilha na molécula de DNA durante a replicação. John Cairns (1963) testou a hipótese com
E. coli em meio tritiado. Após um ciclo de replicação, foram observados anéis radioativos, que representariam uma molécula circular
completa. Várias forquilhas, em diversos estádios de crescimento, foram observadas no segundo ciclo de replicação. Outros experimentos
demonstraram que a replicação em E. coli ocorre simultaneamente em ambas as forquilhas. Este é o modelo chamado de replicação teta,
pois, vista ao microscópio, simula a letra grega que tem esse nome.
Nos esquemas acima, pode-se observar que, a partir de uma origem de replicação, as forquilhas se movem em ambas as direções,
conforme demonstrado no diagrama superior. No modelo demonstrado no diagrama inferior, incorreto para a replicação na maioria dos
organismos, as forquilhas se movem apenas em umadireção. Este segundo modelo, no entanto, ocorre nas “bolhas” de transcrição, que
serão vistas mais tarde. Porque incorreto para a maioria dos organismos? Porque alguns vírus, bem como o Fator F de E. coli, apresentam
uma replicação circular unidirecional.
Consenso:
GATCTNTTNTTT
Consenso:
TAATCCACA
Número e tamanho de réplicons
Organismo
Número de
origens
Tamanho do
réplicon (bp)
Escherichia coli 1 4.200.0000
Saccharomyces cerevisae 500 40.000
Drosophila melanogaster 3.500 40.000
Xenopus laevis 15.000 200.000
Mus musculus 25.000 150.000
Fonte: Lewis, B. L. – Genes V
ori
TerG
TerB
TerA
TerE
TerD
TerF
TerC
E
D
2: REPLICAÇÃO– 39
DNA polimerase I
Em 1957, Arthur Kornberg descobre a DNA polimerase I, considerada como a única polimerase (peso molecular 103 kDa, 400 moléculas por célula –
90% da atividade total de polimerase). No entanto, em 1969 John Cairns descobre um mutante para essa enzima, que ainda sintetizava DNA mas era
pouco eficiente em reparar erros. Além da descoberta desse mutante, houve outros pontos de descrédito da polimerase I como a única ou principal
enzima responsável pela replicação: (i) a síntese in vitro pela pol I era muito lenta e não poderia ser a única enzima a replicar um cromossomo do
tamanho do encontrado em E. coli; (ii) a enzima era mais efetiva com DNA de fita simples; e (iii) a enzima podia também degradar DNA.
A descoberta de outras polimerases
Em 1972, a DNA polimerase III é descoberta; apresenta um alto peso molecular (830 Kda) e várias subunidades componentes, mas é uma enzima rara
(10-20 moléculas por célula). Experimentos demonstraram ser esta a principal sintetizadora de DNA em bactérias (o papel da pol I é importante na
fidelidade da replicação). Foi também descoberta a DNA polimerase II, envolvida no reparo de danos do DNA não inerentes à replicação mas sim
causados por agentes externos. Em 1999 foram descobertas a DNA polimerase IV e a DNA polimerase V, também envolvidas no reparo de DNA,
possivelmente como resposta ao sistema SOS.
A DNA polimerase III é a principal responsável pela polimerização
Ela funciona como um dímero, cada conjunto com dez subunidades
Pol III: dois conjuntos de dez subunidades
cada
“Core”: alongamento e correção da cadeia
– polimerização
– 3’-5’ exonuclease
– ainda desconhecido
Carregamento da enzima no DNA
, , ’, ,
Processividade e dimerização
– movimentação sobre o DNA (processividade)
- dimerização da unidade central
Alfa - Epslon - Theta - Gama - Delta - Chi - Psi - Beta - Thau
AS DNA POLIMERASES DE Escherichia coli
5 ´
3 ´
3 ´
5 ´
OS NOVE MANDAMENTOS DA REPLICAÇÃO
2 – Abertura das fitas nas duas direções, formando duas forquilhas de replicação por origem (uma em procariontes,
várias em eucariontes), e manutenção das fitas abertas evitando a re-formação das pontes
3 – Colocação dos iniciadores, uma vez que as DNA polimerases são incapazes de iniciar a síntese; a enzima primase é
uma RNA polimerase, e portanto o iniciador é de RNA e não DNA
4 – Remoção da torção à frente das forquilhas, por ação de topoisomerase da DNA girase; essa torção é resultado da
deshelicoidização da dupla hélice nas forquilhas, e impõe uma restrição física à continuidade do processo
5 –
Síntese
propriamente
dita
9 – Separação dos concatâmeros de DNA (procariontes) ou síntese dos telômeros, histonas e outras proteínas associadas
ao DNA (eucariontes), permitindo a finalização do processo
8 – União dos fragmentos de Okazaki, pela DNA ligase; os fragmentos são formados em ambas as fitas e em ambas as
direções, nas assim chamadas “fita líder” e “fita retardada”
7 – Remoção dos iniciadores e síntese de DNA no seu lugar, já que os mesmos são de RNA e não de DNA; a remoção se
dá por ação de exonuclease 5´- 3´ da DNA polimerase I, no mesmo sentido da síntese do DNA
6 – Correção de erros ocasionados pela colocação de nucleotídeos errados; a correção é constante durante a síntese, e se
dá por ação de exonuclease 3´- 5´ das DNA polimerases
1 – Localização da origem de replicação, uma sequência específica, com boxes ricos em As e Ts facilitando a quebra das
pontes de hidrogênio
2: REPLICAÇÃO– 40
PROCESSOS INICIAIS DA REPLICAÇÃO
Primosomo
DNA girase
(topoisomerase)
iniciador
(RNA)
Várias SSBP
Cada subunidade do dímero é
composta por 10 proteínas:
- alongamento
’ - carregamento
- processividade
Dímero
DNA
pol III
3´
3´
5´
5´
5´
3´
Síntese na fita líder e na fita retardada
A síntese é bidirecional, mas sempre no sentido 5’-3’. Na
fita líder, um iniciador é colocado e a síntese é contínua. Na
fita retardada, os fragmentos são sintetizados a intervalos, na
medida em que a forquilha avança. A síntese vai até que a pol
III encontre o fragmento anteriormente sintetizado, quando
pára e dá lugar a uma molécula de pol I, que remove o
fragmento de RNA; em seguida, outra molécula dessa mesma
enzima vem atrás e sintetiza DNA no lugar deixado pelo
fragmento retirado. A DNA ligase produz uma ligação
fosfodiéster para unir os fragmentos. A DNA girase, uma
topoisomerase, está constantemente ativa neste processo. A
síntese em ambas as fitas segue o mesmo princípio de
formação da ligação fosfodiéster, porém na fita retardada a
ligação dos fragmentos de Okazaki, pela DNA ligase, é um
processo adicional, que consome energia.
“Priming”
As DNA polimerases procariotas não têm capacidade
para iniciar a polimerização: necessitam de um iniciador
(primer) O iniciador, uma sequência de RNA com cerca
de 30 bases, é colocado pela primase. O primossomo é
um complexo formado pela primase mais várias
proteínas tais como DnaB, DnaT, PriA, PriB e PriC.
Vários iniciadores são colocados, particularmente na fita
retardada, onde a síntese é descontínua.
A síntese é direcionada por um dímero da DNA pol III
O processo é integrado com a DnaB helicase e outras enzimas. O filamento retardado está
enrolado no dímero, de tal forma que a síntese procede nos dois filamentos, no mesmo
sentido de polimerização (5´-3´), embora em direções opostas. No filamento líder, a
síntese é contínua: a DNA primase liga-se à DnaB, sintetiza um novo iniciador de RNA, e
se dissocia; esse processo é repetido várias vezes no filamento descontínuo (retardado),
sempre que um novo fragmento de Okazaki é iniciado. A união das duas subunidades da
polimerase é apenas transitória, e de tempos em tempos as duas subunidades se separam,
há movimentação sobre a fita, um novo enovelamento do filamento descontínuo, e o
processo se repete.
Deselicoidização da dupla hélice
400.000 giros da hélice a serem
deshelicoidizados em 20 minutos (hélice
girando a uma velocidade de 20.000 rpm!!!):
descrença no modelo de dupla hélice até a
descoberta das topoisomerases, incluindo a
DNA girase, aqui representada atuando à frente
da forquilha de replicação.
As fitas de DNA,
uma vez abertas,
são estabilizadas
por várias
subunidades das
SSBP (single-
strand binding
proteins –
proteínas de
ligação à fita
simples).
DNA
pol I
DNA
ligase
Primer
(RNA)
DNA helicase,
RNA primase, e
outras proteínas
Para que o DNA bacteriano seja replicado, inicialmente é
necessária sua abertura, o que ocorre na região denominada
oriC (em Escherichia coli). Várias enzimas participam,
conforme pode ser visto na figura ao lado. A primeira
proteína a atuar e a DNA-A, também conhecida por proteína
iniciadora, cuja função e identificar a origemde replicação e
iniciar o processo de replicação. Posteriormente, a DNA-B
entra em ação, com sua função de helicase, abrindo a dupla-
hélice pela quebra das pontes de hidrogênio. Neste processo,
a DNA-B e auxiliada pela DNA-C; esta facilita a ligação
daquela ao DNA.
A REPLICAÇÃO EM SI
2: REPLICAÇÃO– 41
Atividade de exonuclease 3’- 5’ das DNA pol I, II e III
Esta atividade, parte do fragmento de Klenow da DNA pol I, é
importante na remoção de iniciadores colocados no início de cada
segmento polimerizado. Esta enzima é a única com esta atividade em
procariontes, e portanto é essencial no processo, já que a pol III pára
sua atividade quando atinge um fragmento de Okazaki. Em [A], observa-
se uma cadeia cujo primeiro segmento foi já polimerizado pela DNA
polimerase III. Esta, ao encontrar o fragmento de Okazaki, pára e cede
lugar à polimerase I. Observe que a última A- antes do fragmento de
Okazaki não faz ligação fosfodiéster com o RNA do iniciador. Em [B],
observa-se que a polimerase I já iniciou sua atividade de exonuclease 5´-
3´, removendo o iniciador e substituindo por DNA. Em [C], a cadeia já
está quase completa, mas ainda falta remover a última base e promover a
união fosfodiéster. Em [D], a cadeia está completa e a união final foi
realizada pela DNA ligase.
Atividade de exonuclease
Além da atividade de polimerização, as DNA polimerases também possuem atividade de exonuclease, ligada à correção de erros e à finalização do
processo de replicação do DNA. A atividade pode ser no sentido 5´- 3´, ou seja, no mesmo sentido da polimerização, ou no sentido oposto, 3´- 5´,
quando a enzima retrocede, retira um ou mais nucleotídeos, e volta a polimerizar no sentido 5´- 3´.
CORREÇÃO DE ERROS DURANTE A REPLICAÇÃO: ATIVIDADE DE EXONUCLEASE 3´- 5´ E 5´- 3´
As DNA polimerases conseguem reconhecer o arranjo espacial das bases dentro da cadeia dupla de DNA. Quando uma geometria incorreta é
percebida, a base é removida e substituída pela base correta.
Metilação do DNA para reconhecimento das fitas
A metilação do DNA é um processo chave no reconhecimento de qual fita deve ser corrigida. Assim que
produzido, o DNA novo não é metilado, mas ao final do processo a Dam metilase metila a nova fita. A partir
daí, as polimerases não conseguem mais diferenciar as duas fitas da dupla hélice.
Durante a replicação, a
fita molde está metilada,
enquanto que a fita
recém sintetizada não
5´
3´
G T A G C C A T G
C A T C G G T A C
P
a
r
e
a
m
e
n
to
s c
o
r
r
eto
s
P
a
r
e
a
m
e
n
to
s in
c
o
r
r
e
to
s, q
u
e
p
r
e
c
isa
m
ser
c
o
r
r
ig
id
o
s
C A T C G G C A G T A G C C A T G
G T A G C C G T C A T C G G T A C
5´
3´
3´
5´
REPLICAÇÃO DO DNA
As metilações mais
comuns em procariontes
ocorrem em C, enquanto
que em eucariontes
ocorrem tanto em A
quanto em C
Ao final do processo, a
nova fita também é
metilada, e não pode
mais ser diferenciada da
outra
U C G G U C A C T T
5´
3´
G T A T C C G A G A A C A T C G G C A
G T A G C C G T
3´
5´
C A T C G G C A
G T A G C C G T
3´
5´ *
5´
3´
G T A T C C G A G A A
C A C T T
5´
3´
G T A T C C G A G A A C A T C G G C A
G T A G C C G T
3´
5´ G G U
C A C T T
5´
3´
G T A T C C G A G A A C A T C G G C A
G T A G C C G T
3´
5´
C A C T T
5´
3´
G T A T C C G A G A A C A T C G G C A
G T A G C C G T
3´
5´
A T C G
G T
A T
U
A T C G
C A T C G G C A
G T A G C C G T
3´
5´
5´
3´
G T A T C C G A G A A
C A T C G G C A
G T A G C C G T
3´
5´ C
5´
3´
G T A T C C G A G A A C A T C G G C A
G T A G C C G T
3´
5´ C A T C G G
5´
3´
G T A T C C G A G A A
Durante a replicação, houve um erro de incorporação de base, que
bloqueia o alongamento da cadeia
O erro é reconhecido pela polimerase, que retrocede para
posicionar o sítio epsilon (pol III) no par irregular
Este é removido, e a polimerase continua sua atividade de
polimerização
Atividade de exonuclease 5’- 3’ da DNA polimerase I
Fragmento de Okazaki
A-
C-
G-
A
B
C
D
X
*
2: REPLICAÇÃO– 42
As topoisomerases de E. coli
Topoisomerases constituem uma classe de enzimas que alteram o nível de enrolamento
de moléculas de DNA fita-dupla. Sua atuação se dá por cortes transientes em uma das
cadeias de DNA, ou em ambas as cadeias. As topoisomerases, dentre as quais se
incluem a girase, são capazes de adicionar ou de remover giros do DNA. Sua atuação é
essencial em processos como replicação e transcrição, nos quais a dupla hélice precisa
ser relaxada para permitir a ação de outras enzimas envolvidas nesses processos; na
replicação, em adição a isso, o DNA precisa ser superhelicoidizado ao final, para ser
compactado.
Dependendo do tipo de corte praticado, as topoisomerases bacterianas são classificadas
como:
Topoisomerases do tipo I: quebram somente um dos polinucleotídeos e passam o outro
através do espaço aberto pelo corte
- Tipo I-5’: a extremidade 5’ do polinucleotídeo forma uma ligação covalente com a
enzima no local do corte
- Tipo I-3’: a extremidade 3’ do polinucleotídeo é que forma uma ligação covalente
com a enzima
Topoisomerases do tipo II (incluindo a DNA girase): quebram ambos os nucleotídeos
em posições adjacentes
O mecanismo preciso da ação da topoisomerase II de E. coli (girase) demonstra que a
extremidade 5’ do DNA clivado permanece covalentemente ligado à enzima via um
grupamento OH da tirosina. A hidroxila 3´ na outra extremidade ataca, a seguir, o
DNA intermediário e refaz a forma circular do mesmo, em uma reação que envolve
hidrólise de ATP para recuperar a forma ativa da enzima (função de ATPase).
Além das topoisomerases I e II, já foram descobertas as topoisomerases III –
importantes na regulação da recombinação – e a IV – provavelmente regulando o
processo de segregação dos novos cromossomos bacterianos logo após a conclusão da
replicação, já que os mesmos formam dois círculos entrelaçados que precisam ser
separados.
A DNA girase corta ambas as fitas 4 bases aparte uma da outra, passa uma das
fitas ao redor da outra, e re-sela o DNA clivado, removendo giros.
A enzima é composta por duas subunidades.
Bacterial Chromosomes
A maioria das bactérias apresenta um único cromossomo circular, o que já foi demonstrado por várias técnicas. Além
do cromossomo, os plasmídios bacterianos também são circulares. As descobertas iniciais, apontando para a
circularidade dos cromossomos e dos plasmídos bacterianos e para a linearidade dos cromossomos eucarióticos serviu
como base para uma clara divisão entre essas duas classes de organismos. No entanto, na medida em que as pesquisas
foram avançando, ficou claro que essa dicotomia era incorreta ou, no mímino, uma supersimplificação dos fatos. Assim,
já foi verificado que algumas bactérias apresentam cromossomos e também plasmídios lineares; já foi verificado
também que muitas bactérias apresentam mais de um cromossomo, sendo que alguns podem ser circulares, outros
lineares - isto na mesma bactéria!
Os estudos apontando para essas evidências começaram no final da década de 1970, com a bactéria Rhodobacter
sphaeroides, que apresenta dois cromossomos circulares. Estudos posteriores verificaram o mesmo fenômeno em
Agrobacterium tumefaciens, Rhizobium, Brucella e Paracoccus denitrificans, para citar algumas espécies. Também se
verificou que espécies dos gêneros Borrelia e Streptomyces podem apresentar tanto cromossomosquanto plasmídios
lineares, o que pode ser, em algumas situações, um equilíbrio dinâmico decorrente da integração de um fato em um
cromossomo circular.
Quando um cromossomo bacteriano é linear, ele passa a apresentar algumas das mesmas restrições à replicação
apresentadas pelos cromossomos lineares de eucariontes. Essas restrições são resolvidas por telômeros bacterianos,
que podem ser de dois tipos: (i) grampo; e (ii) invertron. No primeiro caso, formam-se grampos palindrômicos no final do
cromossomo, euquanto que no segundo caso, proteínas se ligam à extremidade 5´, protegendo o cromossomo contra
ação de nucleases. Neste último, a replicação do final cromossômico se dá pela união da DNA polimerase com uma das
proteínas (chamada 5´-terminal protein, ou TP), e essa união favorece a ligação de um dNTP, que serve como iniciador
para o alongamento da cadeia.
Outras particularidades que assemelham os processos replicativos e transcritivos bacterianos do que normalmente é
atribuído somente a eucariontes são a presença de íntrons, e a adição de caudas de poli-A em mRNA procarioto.
3`- OH + P - 5`
3`- O P - 5`
P - 5` +
Dois fragmentos de Okazaki, um com a terminação 3´-OH e outro
com a terminação 5´-P, precisam ser unidos para promover a
continuidade da molécula de DNA sendo sintetizada; a DNA
polimerase não tem essa capacidade.
A DNA ligase obtém energia de um ATP livre, um pirofosfato
inorgânico é gerado, e a enzima se liga à terminação 5´. Neste
processo, foi consumida uma molécula de ATP do pool
energético da célula.
A energia gerada é usada para promover a ligação com a
extremidade 3´-OH, em processo semelhante ao realizado pelas
DNA polimerases.
AÇÃO DA DNA LIGASE PARA A UNIÃO DE
FRAGMENTOS DE OKAZAKI
2: REPLICAÇÃO– 43
Origens de replicação múltiplas
Esta é a diferença mais óbvia entre procariontes e eucariontes, e permite a replicação do genoma em tempo hábil, até 3 minutos (caso contrário
poderia levar vários dias!). A figura a cima representa um cromossomo de eucarionte com três origens de replicação. Durante a fase de replicação do
DNA, as três origens são replicadas simultaneamente, e ao final são geradas duas cromátides-irmãs, que eventualmente serão separadas, formando
dois novos cromossomos idênticos. Pela tabela, observa-se que o número de origens pode ser muito alto em alguns organismos eucariontes; no rato,
por exemplo, pode-se ter até vinte e cinco mil origens de replicação no genoma.
Em eucariontes, a divisão pode durar desde poucos minutos ou horas até 200 horas em algumas células. Os eucariontes têm que
resolver o problema de replicar vários cromossomos ao mesmo tempo, bem como replicar a própria estrutura dos cromossomos.
REPLICAÇÃO NOS EUCARIONTES
Número e tamanho de réplicons
Organismo
Número de
origens
Tamanho do
réplicon (bp)
Escherichia coli 1 4.200.0000
Saccharomyces cerevisae 500 40.000
Drosophila melanogaster 3.500 40.000
Xenopus laevis 15.000 200.000
Mus musculus 25.000 150.000
Fonte: Lewis, B. L. – Genes V
PPPrrroooppprrriiieeedddaaadddeeesss dddaaasss DDDNNNAAA pppooollliiimmmeeerrraaassseeesss dddeee eeeuuucccaaarrriiiooonnnttteeesss
Exonuclease
Nome
3´- 5´ 5´- 3´
Outras funções
α - alfa Não
Composta por duas subunidades, uma com atividade de primase (coloca
primers de RNA + segmento de DNA – 30 a 40 nt), e outra com atividade
de polimerase; participa, portanto, do início da síntese do DNA nuclear.
Tem pouca fidelidade pela falta de atividade de exonuclease 3´-5´.
β - beta Não Reparo e recombinação do DNA nuclear.
γ - gama Sim Replicação do DNA de mitocôndrias e cloroplastos.
δ - delta Sim
É a principal responsável pela síntese dos filamentos líder e retardado,
após ação de primase da polimerase alfa. Associa-se à PCNA
(proliferating cell nuclear antigen), cuja estrutura é semelhante à da
subunidade beta da polimerase III de procariontes, formando um grampo
que aumenta em muito a processividade. Apresenta atividade de
exonuclease 3´-5´, estando portanto envolvida em reparo do DNA.
Participa também da síntese translesão.
ε - épsilon Sim
Pela sua ação de exonuclease 5´-3´, está envolvida na remoção dos
primers. Além disso, toma o lugar da subunidade delta quando da
necessidade de reparos.
ζ - zeta Não Síntese de DNA translesão.
η - eta
Síntese de DNA translesão. Esta enzima insere duas adeninas em oposição
a dímeros de pirimidinas (que geralmente, mas não sempre, são dímeros
de timina); por essa razão, é uma polimerase especial, da classe das
polimerases de síntese translesão. No entanto, como ela insere somente A,
pode cometer erros (se o dímero de pirimidina for de citosinas).
θ - teta Reparo do DNA.
ι - iota Síntese de DNA translesão.
κ - kapa Síntese de DNA translesão.
λ - lambda Reparo do DNA.
μ - mi Reparo do DNA.
σ - sigma
Reparo do DNA e coesão de cromátides irmãs; provavelmente replicação
também.
Problemas:
A quantidade de DNA a ser replicado é muito maior do que em uma bactéria, e além disso, o DNA está complexado com proteínas;
Os cromossomos não são circulares (têm extremidades) e necessitam de processos especiais na terminação;
A eficiência da polimerase em eucariontes é 20 vezes menor do que em procariontes: apenas cerca de 50 nucleotídeos são
incorporados por segundo; e
Há necessidade de dissociação das histonas ligadas ao DNA, nos nucleossomos de cromatina, e sua síntese e reassociação após a
síntese do DNA.
O esquema geral é o mesmo descrito para procariontes, mas participando pelo menos treze enzimas já descobertas. Outras proteínas,
tais como a RPA, tem função primordial na replicação em organismos superiores; a RPA é provavelmente semelhante às SSBP.
2: REPLICAÇÃO– 44
REPLICAÇÃO DOS FINAIS DOS CROMOSSOMOS (TELÔMEROS):
A PARTICIPAÇÃO DA TELOMERASE
C A T C G G C A G T A G C C A T G
G T A G C C G T C A T C G G T A C
5´
3´
3´
5´
C A T C G G C A G T A X X X X X X
G T A G C C G T C A T C G G T A C
5´
3´
3´
5´
C A T C G G C A G T A G C C A T G
G T X X X X X X C A T C G G T A C
5´
3´
3´
5´
C A T C G G C A G T A G C C A T G
G T X X X X X X
5´
3´
3´
5´
C A T C G G C A G T A G C C A T G
G T A G C C G T C A T C G G T A C
5´
3´
3´
5´
C A T C G G C A G T A
G T A G C C G T C A T C G G T A C
5´
3´
3´
5´
X X X X X X
G T A G C C G T C A T C G G T A C
5´
3´
3´
5´
A síntese na fita líder é normal
A DNA polimerase alfa já havia colocado um iniciador, que é
posteriormente removido pela DNA polimerase épsilon, e
substituído por um segmento de DNA.
A síntese na fita retardada impõe um problema
O iniciador é colocado na extremidade, sendo que sua
remoção é impossível porque a DNA polimerase épsilon não
tem o “ponto de apoio” para remover RNA e colocar DNA. O
problema é resolvido por ação da DNA telomerase, uma
enzima que cataliza a síntese de sequências repetitivas no
final dos cromossomos. Esta enzima é uma transcriptase
reversa, que contém em si um iniciador de RNA que serve
como molde para a síntese do novo segmento de DNA, que
será adicionado ao telômero.
REPLICAÇÃO
TELOMERASE
G T A C A T C G G C A
G T A G C C G T C A T C G G T A C
3´
5´
C A A C C C 3´ 5´
T T G G G G
C A A C C C 3´ 5´
C A A C C C 3´ 5´
T T G G G G
G T A C A T C G G C A
G T A G C C G T C A T C G G T A C
3´
5´ T T G G G G
T
G T A C A T C G G C A
G T A G C C G T C A T C G G T A C
3´
5´
G T A
C A T C G G C A
G T A G C C G T
C A T C G G T A C
3´5´
T T G G G G
T T
T C C G A G A A 5´
3´
A telomerase direciona a síntese das
sequências TTGGGG (em humanos,
essa sequência seria TTAGGG).
Assim, são adicionadas várias
dessas sequências na extremidade
de cada cromossomo.
Após, há a formação de uma
estrutura em pino, de tal forma que a
DNA polimerase épsilon pode agora
remover o iniciador e sintetizar DNA
em seu lugar. Note as pontes de H
entre Gs.
A estrutura em pino é removida por
ação de endonucleases.
Após a remoção da estrutura em
pino e a síntese do DNA, o
cromossomo teve seu final
preservado, inclusive com a adição
de um pequeno segmento. Os
telômeros de um determinado
organismo são todos parecidos, e
formados por sequências repetitivas.
Telômeros, envelhecimento e câncer
As sequências teloméricas têm se mostrado altamente conservadas ao longo da evolução, refletindo sua importância. O encurtamento
dos telômeros tem sido associado aos mecanismos moleculares de envelhecimento. Em muitas células, a telomerase perde a
atividade, causando assim o encurtamento dos cromossomos e, com o tempo, a perda de capacidade de divisão. Por outro lado,
muitas células malignas têm telomerases altamente ativas, perpetuando-se assim. Esta última peculiaridade pode ser utilizada em
terapias anticâncer, por exemplo.
???????????
C A T C G G C A
G T A G C C G T
3´
5´
C A T C G G T A C T T
5´
3´
G T A T C C G A G A A
T G G G G A A
T T G G G G
T T G G G G T T
C C C C A A G
A A C C C C A A
T T G G G G T T
C C C C A A
2: REPLICAÇÃO– 45
REVISÃO
UNIDADE 2 - Replicação
•Porque é necessário aos organismos replicar o material genético? (Na replicação, as células filhas precisam receber toda a informação
genética)
•Como Watson e Crick (1953) inicialmente postularam ser a replicação do DNA? Eles estavam certos? (Não escapou da nossa
percepção que o pareamento específico que postulamos imediatamente sugere um possível mecanismo da cópia do material genético)
•Há três modelos hipotéticos de replicação. Saiba descreve-los e diferenciá-los. Há mais de um correto? (Conservativo, semi-
conservativo e dispersivo)
•O experimento de Meselson-Stahl (1958) elucidou o modo de replicação. Saiba como o experimento foi conduzido, quais seus
postulados, e como os resultados foram interpretados. Porque foi necessário conduzir uma segunda geração de replicação para
descrever o modelo corretamente? (O experimento utilizou 15N, que é mais pesado que o N normal, e centrifugação em gradiente de
cloreto de césio, foram observadas as bandas que se formaram, sendo que na primeira geração não se consegue diferenciar o modelo
semiconservativo do dispersivo)
•O que são forquilhas de replicação? Há mais de uma forquilha atuando simultaneamente em um evento de replicação? (Forquilha: local
aberto onde ocorre o evento (no caso, replicação); nome vem da forma; cada forquilha representa uma origem de replicação, sendo que
eucariontes apresentam origens múltiplas e portanto múltiplas forquilhas)
•A DNA polimerase I foi a primeira polimerase descoberta. Ela é a mais importante? Porque? Saiba dizer qual a sua principal função no
processo de replicação. (Depende; ela é importante mas não é a enzima que faz a maior parte do trabalho; ela entra quando a pol III
encontra um fragmento de Okazaki, usando sua função de exonuclease 5´-3´, sendo também vital na fidelidade, por sua função 3´-5´ -
retrocede e corrige)
•Quais são as outras polimerases mais atuantes na replicação de procariontes? Descreva suas funções. (A pol III é a principal
polimerizadora, somente parando quando encontra um fragmento de Okazaki, quando cede lugar à pol I; a pol II corrige erros do
sistema SOS, não inerentes à replicação; as pol IV e V , descobertas recentemente, também são importantes na correção de erros)
•Saiba interpretar os diagramas de correção de erros pela DNA pol I, pela sua atividade de exonuclease 3´-5´. Qual a função da
atividade de exonuclease 5´-3´? (3´-5´ retrocede e corrige; 5´- 3´ continua no mesmo sentido e faz excisão das bases do iniciador de
RNA)
•Quais são os passos fundamentais dentro do processo de replicação em organismos procariotos? Como os organismos conseguem
resolver o problema de polimerizar apenas no sentido 5´-3´, porém em qualquer direção – isto é, formando segmentos de replicação
contínua e segmentos de replicação descontínua. (Separação, colocação dos iniciadores, polimerização, remoção dos iniciadores,
união dos fragmentos de Okazaki, deshelicoidização da hélice, correção de erros, ...; a solução para o problema passa por
contorcionismos e malabarismos...)
•A síntese sempre se inicia com a colocação de um iniciador. O que são eles e porque não é possível fazer a síntese sem os mesmos?
(Um iniciador é um segmento curto de RNA; ele é essencial por uma deficiência da DNA polimerase em iniciar a síntese a partir do
nada)
•Saiba quais são os outros convidados nessa complexa tarefa de replicação do DNA, além das DNA polimerases. O que ocorreria na
ausência de cada um desses convidados? (helicase, topoisomerase, ligase, primase, SSBP, DnaA, DnaB, etc...; cada um tem sua
função vital, específica)
•Topoisomerases desempenham uma função importante nesse processo. Que função é essa e como ela é realizada? (Função é
deselicoidizar a dupla hélice, através de cortes e reunião de uma ou das duas fitas)
•Como os eucariontes resolvem o problema de replicar uma enorme quantidade de DNA em tempos relativamente curtos, quando
comparados com procariontes? (Enzimas são menos eficientes, e há mais atividades – por exemplo a “limpeza” dos cromossomos – e
o problema é resolvido com múltiplas origens – o trabalho é feito simultaneamente em vários pontos)
•Quais são as funções e localizações das principais enzimas participantes da replicação de organismos eucariotos? (As enzimas em
eucariontes recebem nomes gregos, e podem estar localizadas no núcleo ou em organelas; as funções são essencialmente as
mesmas – primase, polimerase, reparo, remoção dos iniciadores, etc... – ver quadro para mais detalhes)
•A telomerase realiza uma importante função: saiba descrevê-la, e saiba também qual a associação entre essa enzima, o
envelhecimento e o câncer. (Há o problema dos terminais dos cromossomos de eucariontes, não circulares; a solução passa por uma
enzima - a telomerase - que trás em si própria o molde para um segmento que será adicionada no final dos cromossomos, evitando
seu encurtamento; postula-se que na medida em que os organismos envelhecem, a telomerase perde eficiência e portanto há um
encurtamento dos cromossomos; infelizmente, há também evidências que em células malignas essa eficiência é preservada – talvez
aumentada? – causando sua perpetuação)
2: REPLICAÇÃO– 46
Primosomo: DNA
helicase + RNA
primase Topoisomerase
(DNA girase)
RNA
primer
Várias SSBP
DNA
pol I
DNA
ligase
Dímero
DNA
pol III
Cada dímero é composto
por 10 subunidades:
- alongamento
’ - carregamento
- processividade
Em eucariotos, o esquema geral
é o mesmo, mas participam
cinco enzimas:
- replicação descontínua
- replicação contínua
- reparo
- replicação na mitocôndria
- reparo?
Replicação em procariontes
Replicação em eucariontes
Transcrição em procariontes
Transcrição em eucariontes
RNA pol completa (’) escaneia o
DNA à procura dos promotores
(-)10 e (-)35 e forma um complexo
fechado quando sigma reconhece (-)35
Sigma se dissocia e as
subunidades ’ iniciam a
polimerização do RNATFIID
TBP
TFIIA
1. TBP, componente do
TFIID, se liga a TATA, e
TFIIA estabiliza a ligação
2. TFIIB se liga e catalisa
ligação da RNA poI II; TFIIF
direciona a polimerase
3. TFIIE, TFIIH
(helicase), e TFIIJ?
se juntam ao
complexo
RNA polimerase II:
transcrição de
genes de proteínas
B F
H
E
J
2: REPLICAÇÃO– 47
UNIDADE 3
Transcrição
OBJETIVO
Discorrer sobre os mecanismos gerais de transcrição e a formação das moléculas intermediárias, com ênfase nos processamentos emvolvidos.
CONTEÚDO
Mecanismos gerais e síntese do mRNA
Síntese do mRNA
Mecanismos de transcrição em procariontes e eucariontes
Modificações e processamento do mRNA
Síntese, características e processamento do rRNA e tRNA
Síntese do rRNA e do tRNA
Caracterização das moléculas de rRNA e tRNA
Modificações e processamento de rRNA e tRNA
GUIA DE ESTUDOS
RNAs são importantes no processo de transcrição e tradução. Saiba quais são as principais moléculas desse ácido
nucléico, e qual a função de cada uma.
Há várias propriedades fundamentais do RNA e da transcrição, das quais sete foram detalhadas em aula. Saiba o
que cada uma significa.
Porque a transcrição, ao contrário da replicação, não requer um primer?
Compare e contraste as principais RNA polimerases de organismos procariotos e eucariotos, e saiba como elas
atuam na transcrição
A transcrição em procariontes pode ser convenientemente dividida em três etapas; quais são estas e quais suas
particularidades? Como se dá a terminação?
Em eucariontes, mais fatores participam da transcrição, quando este processo é comparado ao de procariontes.
Quais são os principais fatores envolvidos? E como são divididas as tarefas para a transcrição de mRNAs, rRNAs e
tRNAs?
O que são ribossomos, e como se dá a síntese e o processamento dos rRNAs?
A síntese dos tRNAs é mais complexa do que a de rRNAs; saiba quais os principais passos e processos envolvidos.
No tocante a mRNAs, há mais processos ainda, incluindo autoprocessamentos. Saiba listar os processos, e suas
principais conseqüências para os organismos.
3: TRANSCRIÇÃO– 48
O fluxo da informação genética é, em qualquer organismo, um aspecto
de extrema importância. Através dele podemos “abrir” o livro fechado,
que é o DNA, para fazer uma “cópia de trabalho”, que é o RNA. Uma
grande diferença entre essas duas classes de moléculas – DNA e RNA – é
que a primeira abrange todo o repositório do genoma de um determinado
organismo, enquanto que a segunda se refere apenas a uma parte desse
genoma – parte essa geralmente muito pequena – que representa o que
está sendo expresso em um determinado momento da vida do organismo.
Assim, enquanto que o genoma pode ser visto como algo fixo,
“imutável” (não no sentido de ser livre de mutações, mas sim no sentido
de estar presente, com mínimas alterações, em todas as células, em todos
os momentos, em todos os ambientes onde o organismo está), o RNA é
algo extremamente dinâmico.
Já vimos em detalhes a REPLICAÇÃO, processo pelo qual uma cópia
integral do genoma do organismo é feita sempre que ocorre divisão
celular. Vamos nos ater agora ao segundo passo no fluxo da informação
gênica, a TRANSCRIÇÃO, processo pelo qual regiões específicas do
DNA, os genes, são copiados para uma fita de RNA para serem
posteriormente traduzidos em proteínas (os mRNAs) ou servirem como a
sede dessa tradução (os rRNAs e os tRNAs). A transcrição guarda muitas
semelhanças com a replicação, o que frequentemente nos leva a
confundir os dois processos.
TRANSCRIÇÃO: SÍNTESE DOS RNAs
DNA
RNA
Proteína
O fluxo da informação gênica passa de DNA para RNA para
proteínas. As moléculas intermediárias (RNA) podem apenas conter
informação (moléculas informacionais), ou podem exercer uma
função física, por assim dizer (moléculas funcionais). Estas últimas
não são traduzidas.
Mas em sua essência eles são radicalmente diferentes, pois servem a propósitos distintos. Apenas pequenos segmentos do genoma são transcritos, e
frequentemente, o que é transcrito em um determinado momento pode não ser transcrito em outro. O processo todo é orquestrado por um conjunto de
proteínas – conjunto menor em procariontes, muito maior e mais complexo em eucariontes – das quais as RNAs polimerases (cujo nome completo inclui
a terminologia DNA-dependentes) são as atrizes principais. Essas enzimas, assim como as DNA polimerases, adicionam um novo nucleotídeo a uma
cadeia já existente, através de uma ligação fosfodiéster, sempre no sentido 5´-3´. O tipo de nucleotídeo adicionado difere daquele adicionado pelas DNA
polimerases, já que na polimerização dos RNAs, ribonucleotídeos (e não desoxirribonucleotídeos) são usados; esses têm uma hidroxila adicional no
segundo carbono do açúcar.
A partir de apenas um segmento de apenas uma das fitas do DNA – o gene que está sendo transcrito – os RNAs são polimerizados sob a forma de fita-
simples. Portanto, esta é uma outra diferença fundamental entre o DNA fita-dupla e os RNAs fita-simples, embora frequentemente estes adquiram
conformações secundárias extremamente complexas, particularmente os tRNAs e os rRNAs, advindas de pareamento intramolecular. Essas conformações
transformam essas duas classes de RNAs em “ferramentas”, enquanto que o mRNA, que geralmente se mantém na forma linear, pode ser visto como
efetivamente uma página aberta de um livro, pronta para leitura e interpretação.
Para sistematizar o conteúdo deste capítulo, o mesmo será dividido nas três principais moléculas de RNA: mensageiros, ribossômicos e transportadores, e
dentro de cada uma dessas classes, serão vistos os processos referentes a procariontes e a eucariontes, comparando-os e contrastando-os. Como sói
acontecer, os processos em eucariontes são mais complexos e extensos, e espera-se que essas diferenças – e suas implicações – tornem-se claras ao longo
do capítulo.
RNAs informacionais: intermediários no processo de decodificação de
genes em proteínas. Podem ser os mRNA de procariontes,
ou os pré-mRNA de eucariontes.
RNAs funcionais: agem em nível de RNA e nunca são traduzidos em
proteínas. Duas classes estão presentes em todos os organismos – os
tRNAs e os rRNAs – e duas outras classes aparecem apenas em
eucariontes – os snRNAs e os scRNAs.
Outros tipos de RNA em eucariotos
nome função
--------------------------------------------------------------------------------
snRNA processamento de mRNA e rRNA
snoRNA processamento de rRNA
RNA 7SL secreção de proteínas
RNA 7SK função desconhecida
RNA 7SM função desconhecida
RNA Alu função desconhecida
--------------------------------------------------------------------------------
PRINCIPAIS TIPOS DE MOLÉCULAS DE RNA:
mRNA, rRNA, tRNA
MOLÉCULA INFORMACIONAL
MOLÉCULAS FUNCIONAIS
INFORMAÇÃO,
menos estável
FUNÇÃO,
estável
FUNÇÃO,
estável
No fluxo da informação gênica – de DNA para proteína – três principais moléculas posicionam-se no centro do ciclo; são elas o RNA ribossômico, o
RNA transportador e o RNA mensageiro. As duas primeiras moléculas são produtos finais da transcrição, e podem ser descritas como moléculas estáveis,
de vida longa, e que desempenham papel como moléculas funcionais na tradução. Por outro lado, o mRNA é “apenas” um intermediário entre o DNA e a
proteína que será produzida; essa molécula não tem função nenhuma além de ser um portador da mensagem decodificada do DNA. Em geral, sua duração
na célula é muito curta, ou seja, o mRNA é de alto turnover. Outras várias moléculas de RNA são também produzidas, mas neste capítulo nósvamos nos
concentrar nas três primeiras, que são as que efetivamente participam da tradução, que será vista mais adiante. Das três, o mRNA é a molécula mais
altamente processada, particularmente em eucariontes, e também a que sofre um controle da expressão muito mais acurado; isto porque o mRNA é
efetivamente o que determina quais as proteínas que vão ser expressas em uma determinada condição, em um determinado ambiente, em um determinado
órgão ou tecido, etc...
3: TRANSCRIÇÃO– 49
PROPRIEDADES DOS RNAs E DA TRANSCRIÇÃO
Em essência, a transcrição é o processo de construção de uma molécula de RNA a partir de um molde de DNA, processo este orquestrado por uma
enzima, a RNA polimerase, auxiliada por uma série de outras enzimas e fatores. A transcrição obedece a certas regras. Abaixo apresentamos uma visão
geral do processo, e após um conjunto daquelas regras (OS DEZ MANDAMENTOS DA TRANSCRIÇÃO), que norteiam o tipo de produto a ser
produzido no processo.
A síntese é complementar a uma das fitas do DNA, e cerca de 17 pb se encontram abertos em um determinado momento. A bolha de transcrição se
move na medida em que o RNA é sintetizado, sendo que o DNA é aberto à frente da bolha e fechado novamente após a transcrição. Isto faz com que o
DNA seja rotacionado, conforme demonstram as setas; é importante a ação de topoisomerases neste processo. Parte da polimerase está em contato com
o DNA ainda fechado, à frente da bolha, e o restante com a fita aberta, somando, no total, cerca de 100 pb. O movimento da polimerase é o equivalente
a cerca de 50 a 90 nt por segundo (DNAs polimerases: cerca de 20 para a I e de 250 a 1.000 para a III).
UMA VISÃO GERAL DA TRANSCRIÇÃO EM Escherichia coli
3 ´
5 ´
RNA polimerase,
composta pelas
diversas
subunidades; a
enzima completa
ocupa cerca de 100
pares de bases
RNA nascente
Híbrido DNA/RNA (cerca de 8 pb)
“Bolha” de transcrição
compreende cerca de 17
pares de bases
Fita molde (serve de molde para a
RNA polimerase)
3 ´
5 ´
Direção da síntese do RNA e do movimento da bolha
O DNA é novamente
enrolado nesta
extremidade, por ação de
topoisomerase
O DNA é desenrolado à
frente da bolha, por ação
de topoisomerase
1 – O RNA é produzido sob a forma de uma fita simples, o que tem duas implicações principais:
(i) Ele pode ser mais facilmente degradado, o que é particularmente sensível para o RNA mensageiro;
(ii) Ele pode formar estruturas secundárias e terciárias muito mais complexas que as do DNA, o que é notório para os RNAs ribossômicos e mais
ainda para os transportadores.
2 – O açúcar do RNA é uma ribose e não uma desoxirribose, como no DNA. Uma implicação é que o
RNA pode ser mais reativo do que o DNA.
3 – A composição de bases é semelhante entre o DNA precursor e o RNA, mas a base pirimídica uracila
(U) é encontrada em lugar da timina.
4 – Um determinado transcrito de RNA é originário de apenas uma fita do DNA, a fita-molde, mas ambas
as fitas podem produzir diferentes transcritos. Isto pode ser demonstrado por experimentos de hibridização
DNA-RNA.
B A S E
OS DEZ MANDAMENTOS DA TRANSCRIÇÃO
… T A T A A G C A T G T C T T T T A A A T G A
… A T A T T C G T A C A G A A A A T T T A C T
↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓
A U G U C U U U U A A A U G A
Promotor TATAA …… Início(Met) Serina Fenilalanina Lisina Fim
Regiões regulatórias Gene
3´ Fita não molde (sentido, não-codificante)
5´ Fita molde (anti-sentido, codificante)
3´ RNA mensageiro
5`
3´
5´
Note a semelhança de composição entre a
fita não-molde e o RNA, mas T é
substituída por U no RNA
3: TRANSCRIÇÃO– 50
Os genes 1, 3 e 4 são codificados pela fita de cima, enquanto que os genes 3 e 5 são codificados pela fita de baixo. Portanto, ambas as fitas são
codificantes, mas cada gene é codificado por um segmento diferente; o segmento da fita de baixo correspondente ao gene 1 não codifica nada, o
mesmo para os genes 2 e 4. Em geral, isto é verdadeiro para a maioria dos organismos, mas alguns vírus (e mesmo outros organismos) sobrepõem
genes. Há também extensas regiões (variáveis de organismo para organismo) de DNA espaçador, não ligado a genes. Note que o molde do gene é dado
na direção 3´-5´, já que o RNA correspondente será polimerizado no sentido 5´-3´.
7 – O RNA é semelhante à fita não-molde.
8 – O produto da transcrição é uma fita simples, e apenas parte do DNA se encontra aberto em um determinado momento da transcrição.
9 – Ao contrário da replicação, onde o DNA, após abrir-se, não volta a se reanelar com a mesma fita original, na transcrição a fita de DNA é apenas
transitoriamente aberta; ela volta a se reanelar assim que a cópia de RNA é feita.
10 – Um gene pode ser transcrito simultaneamente por várias RNA polimerases.
FITA DUPLA
DE DNA
1 2 4
5 3
GENES
DNA INTERGÊNICO (ESPAÇADOR)
3´
5´
5´
3´
5 – Como na replicação do DNA, a transcrição apresenta uma polaridade, um molde e mecanismos semelhantes de adição de nucleotídeos. Apresenta
também as fases de iniciação, alongamento e terminação.
6 – Ao contrário da replicação, a transcrição não requer um iniciador, já que RNAs polimerases têm a capacidade de inserir nucleotídeos sem o
iniciador, e geralmente apenas segmentos limitados de DNA são transcritos (os genes que estão sendo expressos em um determinado momento da vida
do organismo).
3: TRANSCRIÇÃO– 51
O RNA mensageiro é o intermediário entre o DNA e a proteína. Ele foi inicialmente descoberto por Sydney Brenner, François Jacob e Mathes Meselson
(Brenner, S. et al. 1961. An unstable intermediate carrying information from genes to ribosomes for protein synthesis. Nature 190:576-581). Essa molécula
é instável: apresenta meia vida muito curta, de poucos minutos em bactérias até 6 horas em eucariotos – o que é de extrema importância no controle da
expressão gênica. No entanto, em alguns poucos casos ela é quase que totalmente estável, como o mRNA da globina, já que o produto é necessário a taxas
máximas quase que o tempo todo.
O RNA MENSAGEIRO
CROMOSSOMO
GENE A SER TRANSCRITO
mRNA PRIMÁRIO
mRNA PROCESSADO
TRADUÇÃO
DEGRADAÇÃO
PROCESSAMENTO
DAS PROTEÍNAS
CROMOSSOMO
GENE A SER TRANSCRITO
mRNA
TRADUÇÃO
DEGRADAÇÃO
PROCESSAMENTO
DAS PROTEÍNAS
Modificações e processamento do mRNA
Em procariontes: as moléculas de mRNA que são traduzidas são cópias diretas dos genes, e não há modificações ou processamento; no entanto, há
algumas exceções (procariontes com íntrons).
Em eucariontes: os mRNAs sofrem intensa modificação e processamento antes da tradução, incluindo modificações químicas e remoção de íntrons.
Onde ocorrem as modificações? Núcleo dividido em: - nucléolo: transcrição dos genes de rRNA; e - nucleoplasma: transcrição de outros genes, incluindo
os de mRNA, formando a fração RNA heterogêneo nuclear ou hnRNA, alguns com mais de 20 kb de comprimento.
No entanto, evidências mostram que o mRNA no citoplasma tem comprimento máximo de 2 kb; sendo derivado do hnRNA, então os eventos de
modificação e processamento, incluindo redução nos comprimentos dos transcritos primários, devem ocorrer antes que o mRNA deixe o núcleo.
PROCARIONTES
EUCARIONTES
AS RNA POLIMERASES DE PROCARIONTES E EUCARIONTES
RNA polimerase de procariontes
Em procariontes, uma única RNA polimerase, descoberta em 1958 e
presente com cerca de 7.000 moléculas por célula de E. coli, é responsável
pela síntese de todos os tipos de RNA. Essa polimerase é composta por seis
subunidades, a saber:
Subunidades da RNA polimerase de E. coli
Nome /
quantidade
Massa(kD)
Gene Função
α (2) 37 rpoA Liga-se a seqüências regulatórias
β (1) 151 rpoB Forma ligações fosfodiéster
β’ (1) 155 rpoC Liga-se ao DNA molde
σ (1) 70 rpoD Reconhece o promotor e inicia a síntese
- Cerne: , , , ’ e ω ( se liga ao promotor; liga ribonucleotídeos antes da síntese; ´ se liga ao DNA; e ´ cooperam
na catalização da síntese; ω ainda com função desconhecida; descoberta recentemente, e não requerida in vitro)
-Holoenzima: o cerne mais a subunidade (sigma), que reconhece o promotor (sigma 70 é a mais comum, mas há outras –
importantes no controle da regulação gênica)
RNA polimerases de eucariontes
Em eucariontes, três diferentes polimerases, maiores do que as
de procariontes e com mais subunidades (8 a 12), são
responsáveis pela síntese de diferentes tipos de transcritos
Além disso, as RNA polimerases em eucariontes requerem
uma variedade de proteínas associadas (fatores de
transcrição), que serão detalhados mais tarde.
RNA polimerases de eucariontes
Tipo Localização Transcritos celulares
I Nucléolo RNAs ribossomais (rRNA) 18S, 5,8S e 28S
II Nucleoplasma
Precurssores de mRNA,
e small nuclear RNAs (snRNA)
III Nucleoplasma tRNAs e rRNA 5S
α
β
+ Existe ainda a subunidade ω, cuja função permanece desconhecida
α
β β´ σ ω
α
2-Meio
3 -Três, T
3: TRANSCRIÇÃO– 52
A
C
B
A RNA polimerase completa
(com a subunidade sigma)
escaneia o DNA à procura
dos promotores [-10] e [-35].
Ela não precisa efetivamente
abrir o DNA: ela localiza os
promotores através da fenda
maior do DNA, procurando
os pares de bases.
A polimerase se liga mais
fortemente e o DNA é aberto
próximo à região [-10],
formando o complexo aberto
D
Quando sigma localiza [-35],
a polimerase forma um
complexo “fechado”, fraco
A síntese de RNA se inicia e
sigma se dissocia do
complexo
A iniciação é geralmente dividida em duas subfases: a ligação, e a iniciação propriamente dita. Na ligação, forma-se inicialmente um complexo
fechado, com o DNA ainda em fita dupla não desenrolada. Em seguida, uma região de cerca de 12-15 pb (entre –10 e +3) é desenrolada para formar o
complexo aberto. A iniciação compreende o início da formação do RNA e a desocupação do promotor. Assim que cerca de 8-9 nt de RNA são
sintetizados, a subunidade sigma se dissocia da polimerase, e o restante da enzima inicia o alongamento da cadeia de RNA.
Sigma é importante nesse processo, e direciona a polimerase para diferentes promotores, dependendo da necessidade. Por exemplo, em Bacillus
subtilis, as seguintes variantes são encontradas, as quais reconhecem sequências diferentes: 28: CCGATAT; 29: CATATT; 32: TA*TGTT*TA; 37:
GC*ATTG*T; 43: TATAAT.
A INICIAÇÃO DA TRANSCRIÇÃO: PROCARIONTES
Seqüências de promotores para a RNA polimerase de genes de manutenção
reconhecidos pelo fator sigma 70
PROMOTOR REGIÃO –35 ESPAÇADOR REGIÃO -10
Plac TTTACA 18 TTTGTT
PlacUV5 TTTACA 18 TATAAT
Ptrp TTGACA 17 TTAACT
λ PL TTGACA 17 GATAAT
λ PR TTGACT 17 GATAAT
Consenso TTGACA 17 TATAAT
Fonte: Schumann e Ferreira, 2004. Genetics and Molecular Biology 27(3): 442-453
As sequências são as da fita não-molde, e são apresentadas no sentido 5´-3´
Se a iniciação ocorresse em pontos ao acaso, haveria um enorme desperdício para a célula; ao contrário, há pontos específicos e bem definidos de
início: os promotores, reconhecidos pela subunidade sigma (sem esta, as ligações são mais aleatórias). A ligação da polimerase na região de iniciação
ocupa cerca de 100 pb, 70 acima do sítio de início da transcrição, e 30 abaixo (notação: -70 e +30). As regiões mais importantes são as –35 e –10 (esta
conhecida como Pribnow boxe). Uma terceira região, elemento UP, é encontrada em alguns genes altamente expressos. A composição de bases dos
promotores apresenta um “consenso”, ou seja, regiões que apresentam composição característica, e mais ou menos constante entre diferentes
organismos. Por exemplo, a região –10 apresenta o consenso TATAAT, ou seja, quando vários organismos são comparados, o mais comum é encontrar
um T na primeira posição, um A na segunda, um T na terceira, e assim por diante. O mesmo se aplica à região –35.
Para entendermos o sentido de “consenso”, digamos que estamos
lendo um livro e a certa altura está escrito: “Ele balançou a cateça,
e disse não”. Obviamente que vamos pausar a leitura, pensar sobre
o que o autor realmente quis dizer, e logo concluir que houve um
erro de grafia, e que realmente o que deveria ter sido impresso é o
consenso: “Ele balançou a cabeça...”. No caso dos promotores,
diz-se que o consenso é a sequência mais comum, e também a
mais favorável à transcrição. Como a região promotora de
procariontes apresenta duas caixas importantes (-35 e -10), não só
a sua composição, mas também a distância entre elas é importante
para uma transcrição eficiente. Cada uma das caixas apresente em
geral seis bases, o que dá uma probabilidade de ocorrência de
(1/4)6; embora não seja muito improvável encontrarmos uma
dessas sequências ao acaso, já que elas ocorrem a cada 4.000 pares
de bases, aproximadamente, encontrarmos as duas caixas lado a
lado, na distância correta, apresenta uma probabilidade muitíssimo
menor.
3: TRANSCRIÇÃO– 53
Formação dos complexos de pré-iniciação e de iniciação: a polimerase II e várias outras enzimas, chamadas fatores de transcrição, se ligam ao cerne do
promotor (TATA boxe). O boxe TATA é o principal ponto de montagem do complexo de iniciação, e corresponde ao Pribnow boxe, embora esteja
localizado na posição [–25]. O boxe CAAT é uma outra sequência regulatória localizada próxima ao promotor. Várias outros locais, muitas vezes
distantes do promotor, influem na taxa de iniciação.
-35 -10
TTGACA TATAAT
Região -35 Pribnow box
Início da
transcrição
Fita
codificante
Genes
-75 -25
GGXCAATCT TATAAA
CAAT box TATA box
OS PROMOTORES DE
GENES PROCARIOTOS (ACIMA) E GENES EUCARIOTOS
(ABAIXO)
Fatores requeridos para a transcrição
pela RNA polimerase II de eucariontes
Proteína /
subunidades
Mr de cada
Subunidade
(1.000)
Funções
>> Iniciação
RNA pol II (12) 10 - 220 Cataliza a síntese de RNA
TBP (1) 38 Reconhece o boxe TATA
TFIIA (3) 12, 19, 35
Estabiliza a ligação de TFIIB e TBP ao
promotor
TFIIB (1) 35
Liga-se à TBP e recruta o complexo RNA
polimerase + TFIIF
TFIID (12) 15 - 250
Interage com proteínas regulatórias
positivas e negativas
TFIIE (2) 34, 57
Recruta TFIIH, e tem atividade de helicase
e de ATPase
TFIIF (2) 30, 74
Liga-se fortemente à pol II e previne a
ligação desta a seqüências não-específicas,
através de ligação à TFIIB
TFIIH (12) 35 - 89
Abre o DNA no promotor, fosforilaa
polimerase, e recruta o complexo de excisão
de nucleotídeos
>> Elongamento
ELL (1) 80
P-TEb (2) 43, 124
SII (TFIIS) (1) 38
Elongin (SIII) (3) 15, 18, 110
Fatores requeridos para a transcrição
Devido à maior necessidade de controle na expressão gênica em eucariontes, além da RNA polimerase propriamente dita, vários fatores de transcrição,
ditos “fatores basais”, são requeridos. A montagem do complexo se dá passo-a-passo, e cada passo da montagem pode representar um ponto de
controle, particularmente no tocante à velocidade com que a transcrição ocorre.
IMPORTANTE:
Apesar da participação desses inúmeros fatores de transcrição e da TBP/RNA polimerase, a
montagem completa do complexo basal não garante a eficiência da transcrição, e outros fatores
entram em cena posteriormente. Em muitas situações, esses fatores se ligam a pontos do DNA
muito distantes dos promotores e do gene propriamente dito, e existe a necessidade de torções
localizadas do DNA para permitir que esses fatores protéicos atuem. Como será visto mais tarde
no controle da regulação gênica de eucariontes, o complexo basal é essencial para a transcrição
mas não é eficiente para promovê-la nos níveis requeridos em muitas situações, e as demais
regiões de controle participarão efetivamente do processo.
A INICIAÇÃO DA TRANSCRIÇÃO: EUCARIONTES
3: TRANSCRIÇÃO– 54
A transcrição pela RNA polimerase II de eucariontes pode ser dividida em: montagem, iniciação, alongamento e terminação.
A montagem requer cerca de 30 polipeptídeos e começa com a ligação ao promotor da TATA Binding Protein (TBP), via de regra acompanhada do
fator de transcrição TFIIA (maior estabilização do complexo), e também muitas vezes como parte do complexo maior chamado TFIID. TFIIB liga-se à
TBP e recruta o complexo RNA polimerase + TFIIF; TFIIF auxilia a polimerase a encontrar o promotor. TFIIE e TFIIH se juntam em seguida,
formando o complexo fechado de iniciação.
O DNA é desenrolado no ponto Inr por ação de helicase da TFIIH ou também da TFIIE, criando assim o complexo aberto de iniciação. O terminal
carboxila da subunidade maior da polimerase II é fosforilado pela outra atividade do fator TFIIH (kinase), e a polimerase, com isso, sai da região
promotora e inicia a polimerização do transcrito de RNA, provavelmente liberando os fatores A, B, D e a TBP.
INICIAÇÃO DA TRANSCRIÇÃO DE GENES DE PROTEÍNAS EM EUCARIONTES:
VISÃO MAIS APROFUNDADA
1. TBP reconhece o boxe TATA, TFIID interage
com proteínas regulatórias positivas e negativas,
e TFIIA estabiliza a ligação de TFIIB e TBP ao
promotor
2. TFIIB liga-se à TBP e
recruta
o complexo RNA
polimerase + TFIIF
4. TFIIE recruta
TFIIH, e tem
atividade de
helicase e de
ATPase
5. TFIIH abre o DNA no promotor, fosforila
a polimerase (ação de kinase), e recruta o
complexo de excisão de nucleotídeos
mRNA
-30
3. TFIIF liga-se fortemente à pol II e previne a ligação
desta a sequências não-específicas, através de
ligação à TFIIB, e RNA pol cataliza a síntese de RNA
Complexo
fechado
Complexo
aberto
6. A RNA polimerase II é fosforilada, inicia-
se a transcrição, e posteriormente o
complexo de iniciação é liberado
7. Os fatores iniciais (TFIIE, TFIIH e outros)
abandonam o complexo, o mRNA é
sintetizado, e ao final, a própria RNA
polimerase é desfosforilada, podendo ser
novamente utilizada em outra rodada de
transcrição
3: TRANSCRIÇÃO– 55
Conforme já enfatizado anteriormente, apesar da participação de inúmeros fatores de transcrição e da TBP/DNA polimerase, a montagem completa do
complexo basal não garante a eficiência da transcrição, e outros fatores entram em cena posteriormente. Em muitas situações, esses fatores se ligam a
pontos do DNA muito distantes dos promotores e do gene propriamente dito, e existe a necessidade de torções localizadas do DNA para permitir que
esses fatores protéicos atuem.
PROMOTOR
ATIVADOR
OPERADOR
A
C
E
N
T
U
A
D
O
R
ATIVADOR
Uma região proximal do
gene, onde se liga a
proteína ativadora.
ATIVADORES
As proteínas ativadoras
estimulam a transcrição
facilitando a montagem
do complexo basal, no
cerne do promotor.
Os ativadores podem
atuar diretamente, ou
podem necessitar da
intervenção de
coativadores, que são
adaptadores entre eles
e as proteínas do
complexo basal.
PROMOTOR
A região onde
ocorre a ligação
dos fatores do
complexo basal de
transcrição.
OPERADOR
Uma região
palindrômica,
localizada no final
proximal de um
óperon, que se
constitui no sítio
de ligação do
repressor,
proteína que
controla os
cístrons
adjacentes.
U.A.S
(UPSTREAM
ACTIVATOR
SEQUENCE)
Uma região com
função
semelhante à dos
acentuadores,
também localizada
distante do gene,
existente em
fungos.
INSULADOR
Também conhecidos
como elementos
limítrofes, são
sequências de DNA que
bloqueiam ou insulam o
efeito de acentuadores
de um modo posição-
dependente. Assim, se
o insulador estiver
entre o acentuador e o
promotor, ele bloqueia
a ação do acentuador,
mas se ele estiver em
outra região, ele não
terá efeito.
COMPLEXO BASAL DE
TRANSCRIÇÃO
Inclui a proteína de ligação ao boxe TATA
(TBP), a polimerase e vários fatores de
transcrição discutidos anteriormente.
A sua montagem correta é um pré-
requisito para a transcrição, mas não
garante que a mesma venha a ocorrer e,
mesmo se ocorrendo, que os níveis sejam
adequados. Portanto, outros atores
deverão entrar em cena para garantir os
níveis adequados de trasnscrição.
COATIVADORES
Complexos protéicos coativadores: dentre
estes, o mais bem caracterizado é o TFIID,
que inclui TBP e mais cerca de dez ou
mais TBP-associated factors (TAFs);
também se encontram os fatores CTF1,
Gal4p e SP1.
MEDIADORES
Encontrados comumente em fungos,
ligam-se fortemente ao terminal
carboxílico da polimerase II.
TRANSATIVADORES
A necessidade e a eficácia de transativadores varia
grandemente entre organismos e genes. Muitos
transativadores podem ser regulados por moléculas
sinalizadoras, com capacidade de ativar ou desativar a
transcrição. Em geral, os sítios de ação dos transativadores
são distantes do início da transcrição, de tal forma que se
presume que o DNA esteja argolado na região de ação.
SILENCIADORES
As proteínas silenciadoras são na verdade
repressores, mas o seu sítio de ligação não é o
operador, como no modelo clássico, mas sim
sítios distantes do cerne, os chamados
silenciadores. Por se ligarem a sítios distantes,
necessitam de moléculas adaptadoras para
interagirem com as proteínas do complexo basal.
ACENTUADORES (ENHANCERS)
Originalmente uma sequência de 72 pares de bases do vírus SV40, que aumenta a transcrição de genes adjacentes. Posteriormente sequências semelhantes
foram descobertas em eucariontes. Os acentuadores podem agir à distância de até milhares de pares de bases, tanto a montante quanto a jusante do gene,
com função semelhante à do ativador, onde se ligam proteínas ativadoras que agem à distância, por meio de moléculas adaptadoras,
...Por exemplo, um acentuador que regula o gene codificante de cadeia alfa do receptor de células T está situado 69.000 pb após o promotor do gene...
Também: o efeito dos acentuadores depende do insulador; se esta região se encontrar entre o acentuador e o promotor, ela impedirá o efeito do acentuador;
portanto, os acentuadores são posição-dependente, e embora a maioria deles seja capazde estimular qualquer promotor em sua vizinhança, seus efeitos
são limitados pelos insuladores.
3: TRANSCRIÇÃO– 56
Para adicionar precisão ao processo, é necessário um sinal específico para o término da
transcrição, assim como ocorreu com o início. Em procariontes, há a participação dos
finalizadores, cuja atuação é baseada em pareamentos específicos promovidos por regiões
palindrômicas.
Finalizadores dependentes de rô: na ausência da
sequência final de A’s (U’s no RNA), alguns
finalizadores precisam da intervenção da proteína
rô, que rompe ativamente as ligações entre o DNA e
o RNA nascente logo após a estrutura de alça. Rô é
um hexâmero, com as seis unidades idênticas entre
si, e utiliza a energia proveniente da hidrólise de
ATP. A ligação de rô ao RNA se dá no sítio rut.
Após, a enzima migra na direção 5’-3’ até atingir o
complexo de transcrição, pausado no sítio de
terminação. Rô tem uma atividade de RNA-DNA
helicase. O término propriamente dito, em ambos os
casos, culmina com a dissociação de todo o
complexo (, , , ´ e ω), que pode agora se
reassociar à subunidade σ e reiniciar a transcrição do
mesmo ou de outros genes.
Finalizadores palindrômicos: são dependentes de sequências palindrômicas. Há a formação de uma alça, que ocasiona a parada da RNA polimerase e
a dissociação desta, provavelmente devido ao abalo de ligações entre o RNA e a RNA polimerase. Contribui para a dissociação um segmento rico em
As no final do DNA, o que corresponde, no RNA, a um segmento rico em Us (A=U, somente duas pontes de H, fácil de ser separado).
C A U C G G C A U C G U C A U A U G C C G A U G
C
A
U
C
G
G
C
A
U
C
G
U C
A
U
A
U
G
C
C
G
A
U
G G A C U U U U U U U U U U
Uma sequência palindrômica pode ser definida como
uma região de DNA ou RNA que apresenta uma
composição de bases que permite um pareamento
intramolecular separado por uma região não-pareada,
formando assim um grampo ou alça. Em alguns
casos, a região que formou o braço direito da alça é
seguida por várias Us, que se pareiam com As no
DNA por apenas duas pontes de H, formando assim
uma região frágil, facilmente desnaturada.
sequência de Us eficiente
Sítio rut
Intervenção da proteína Rô,
com sua ação de helicase
Em eucariontes, a terminação se dá por mecanismos ainda não bem estudados e compreendidos. Após a terminação, a RNA polimerase é liberada,
desfosforilada, e reciclada para nova polimerização.
A TERMINAÇÃO
Tanto em procariontes quanto em eucariontes, o RNA é sempre sintetizado no sentido 5’-3’,
como o DNA. A energia para a reação provém da quebra do trifosfato, gerando um
monofosfato, incorporado à cadeia, e um difosfato inorgânico. A cadeia cresce pela formação
de uma ligação entre a 3’-hidroxila e o nucleosídeo trifosfato. Em eucariontes, o
alongamento é acompanhado pela liberação dos fatores TFIIE e TFIIH já nos primeiros 60-
70 nt. TFIIF permanece associado durante o alongamento, e a ação de fatores de alongamento
EF se faz sentir.
1 - no nucleotídeo (Açúcar+Fosfato+Base)
que está entrando na cadeia, a hidroxila do
carbono 5` já havia reagido com o ácido
fosfórico, formando a primeira ligação éster
2 - a hidroxila do carbono 3´ reage com o
fosfato alfa do nucleotídeo entrante, formando
a segunda ligação éster
3 - um pirofosfato
inorgânico é gerado
OH
OH
O ALONGAMENTO DA CADEIA DE mRNA
3: TRANSCRIÇÃO– 57
GENE: Regiões de controle, íntrons, éxons
+1 = início da região transcrita
Produção do hnRNA e processamentos iniciais
ÉXON 1 ÍNTRON 1 5´
Pol II
ÉXON 2 ÉXON 3 ÍNTRON 2 ÉXON 1 ÍNTRON 1
Pol II
Pol II
Pol II
A A A A A A A A A A A A A A
A transcrição dos mRNAs é feita pela RNA polimerase II de eucariontes. Note que íntrons e éxons
são transcritos, bem como uma sequência inicial, que não será traduzida (5´-UTR).
Ainda durante as fases iniciais da transcrição, uma enzima, denominada guanil-transferase, adiciona um “quepe” à extremidade 5 do
mRNA. Esse quepe é constituído de 7-PPP-metilguanosina, obedecendo a uma ligação 5´-5´-trifosfato bastante atípica. As funções do
quepe envolvem o splicing correto, proteção contra degradação por exonucleases, e também serve de chave para o início da
tradução, posto que interage com a subunidade 40S via proteínas de ligação ao quepe, por exemplo fator eIF2.
No transcorrer do processo, uma sequência (consenso: AAUAAA) é transcrita após os éxons finais na extremidade 3´; esse segmento
ajuda a sinalizar um futuro evento de clivagem por uma endonuclease. Note que a polimerase continua a transcrição, passando
portanto do ponto de clivagem, e formando mais uma sequência não traduzida (3´-UTR).
A clivagem é efetuada pela endonuclease, e eventualmente a RNA polimerase dissocia-se do processo.
Após a clivagem, a enzima poli(A)-polimerase adiciona uma cauda de As, com 150-200 resíduos de adenosina. Assim como o quepe,
essa cauda desempenha importantes funções na longevidade e na tradução: serve como sítio de ligação para proteínas, protege
contra degradação por exonucleases (no entanto, se a cauda estiver presente em procariontes, o que raramente acontece, ela acelera
a degradação ao invés de proteger...), e também participa do processo de reconhecimento do mRNA para a tradução.
O transcrito primário é gerado
1
CH3
QUEPE
7-Metil-Guanosina
5´
5´
ÉXON 2 ÉXON 3 ÍNTRON 2 ÉXON 1 ÍNTRON 1 AAUAAA
5´
ÉXON 2 ÉXON 3 ÍNTRON 2 ÉXON 1 ÍNTRON 1 AAUAAA
5´
ÉXON 2 ÉXON 3 ÍNTRON 2 ÉXON 1 ÍNTRON 1 AAUAAA
OS PROCESSAMENTOS DO mRNA EM EUCARIONTES
Em eucariontes, uma plêiade de processamentos ocorre durante e após a tradução, para a formação do transcrito “maduro”, que será sujeito à tradução.
Dentre esses processamentos estão a colocação do quepe e da cauda e a remoção dos íntrons. A seguir apresentaremos esses eventos, bem como suas
implicações para a tradução.
Recorte (splicing) 2
Grupos de pesquisa liderados por Phil Sharp, Louise Chow, Rich Roberts e
Pierre Chambom determinam que muitos genes de eucariontes (e também de
seus vírus) são frequentemente segmentados, com regiões (mais tarde
denominadas ‘éxons’) sendo recompostas (spliced) no mRNA (Chow, L.T.
et al. 1977. An amazing sequence arrangement at the 5´ ends of adenovirus 2
messenger RNA. Cell 12: 1-8; Berger, S.M. et al. 1977. Spliced sequence at
the 5´-terminus of adenovirus 2 late mRNA. PNAS (USA) 74: 3171-3175).
Os íntrons, se presentes, serão transcritos, e precisam ser removidos, o que se
presume que ocorra ainda no núcleo, antes da exportação do mRNA de
eucariontes para o citoplasma. Os mecanismos de remoção são bastante
complexos, e o seqüenciamento de junções íntron/éxon mostrou bastante
homologia, o que indica que há mecanismos que reconhecem essas
sequências e promovem a excisão dos íntrons. Além das próprias junções
que apresentam sequências conservadas, há algumas bases internas que
também são importantes, por participarem das remoções de alguns dos tipos
de íntrons. Aos processos de remoção de íntrons e união de éxons dá-se o
nome de splicing (recorte; recomposição).
3: TRANSCRIÇÃO– 58
A A A A A A A A A A A A A A
O transcrito primário contém íntrons e éxons; todos os íntrons deverão ser removidos, em uma ou mais etapas, e além disso os éxons
poderão ser seletivamente removidos, no processo chamado de splicing alternativo ou embaralhamento de éxons.
ÍNTRON 2 ÍNTRON 1
+
5´ 3´
5´ 3´
+
5´ 3´
+
5´ 3´
5´ 3´
Mecanismos de splicing
Remoção catalizada por spliceosomo
Esta é a via mais comumde remoção de íntrons de transcritos primários
de mRNA. O mecanismo de splicing é semelhante ao observado no grupo
II, com a formação de uma estrutura “lariat”, no entanto com a grande
diferença que é necessária a participação de várias enzimas.
O íntron autoprocessante – uma ribozima
Íntrons do grupo I são encontrados nos genes de rRNA de protozoários, como a
Tetrahymena, e nos genes mitocondriais de fungos e leveduras. Introns do tipo II são
encontrados em alguns transcritos primários de tRNA, bem como em cloroplastos e
mitocôndrias.
+
Há basicamente dois mecanismos de remoção dos íntrons e união dos éxons. No primeiro, não há o envolvimento de nenhuma proteína, apenas de
sequências do próprio mRNA, e estes são denominados de íntrons autoprocessantes, em uma demonstração de ação catalítica de RNA. Esta via de remoção
é comum em genes de cloroplastos e mitocôndrias, além de alguns protozoários. No segundo mecanismo, há a participação das chamadas snurps, small
nuclear ribonucleoproteins (snRNPs), que são complexos formados entre pequenos RNAs ricos em Us e mais ribonucleoproteínas; os snurps ativamente
clivam os íntrons e unem os éxons. Há intenso pareamento intramolecular previamente à remoção; a molécula snRNA U1 tem uma sequência próxima à sua
extremidade 5´ que é complementar ao sítio de corte 5´ do éxon. Esta via de remoção é a mais comum em genes de mRNA em geral.
5´
UU
5´ 3´
5´ 3´
G
U
5´ 3´ UA GU
GA
3´
5´ 3´ UG U A
U
A
UG
5´ 3´ U U
5´ 3´
UU
5´ 3´ U U
GA
5´
ÉXON 2 ÉXON 3 ÍNTRON 2 ÉXON 1 ÍNTRON 1 AAUAAA
5´
ÉXON 2 ÉXON 3 ÉXON 1 AAUAAA A A A A A A A A A A A A A A
Uma guanina externa é utilizada como
cofator; a sua hidroxila faz um ataque
nucleofilico no sítio 5´ de corte, formando
uma ponte fosfodiester com a adenina.
Guanina
GU
Um segundo ataque nucleofílico é feito, desta
vez pela própria extremidade 3´ do primeiro éxon.
Ao final do processo, os dois éxons são unidos, e o íntron é liberado.
GA
REMOÇÃO DE ÍNTRONS DO GRUPO I
REMOÇÃO DE ÍNTRONS DO GRUPO II
REMOÇÃO CATALIZADA POR SPLICEOSOMO
Nestes íntrons, existe um ponto de
ramificação interno, composto por uma
adenina. Esta faz um ataque nucleofílico
no sítio 5´ de corte.
Como resultado, forma-se uma estrutura
denominada “lariat”.
A extremidade 3´-OH do primeiro éxon promove
um ataque nucleofílico no ponto de corte do
segundo éxon.
Ao final do processo, os
dois éxons são unidos, e
o íntron é liberado.
As moléculas de snRNP U1
e U2 posicionam-se sobre o
RNA; há gasto de energia
nesse processo.
Em seguida, as moléculas
U4, U5 e U6 entram no
processo, formando o
spliceossomo inativo.
Através de rearranjos
internos, o complexo torna-
se ativo. Novamente há
gasto de energia no
processo.
As moléculas U1 e U4 são
as primeiras a deixar o
complexo.
Ao final do processo,
a estrutura em lariat é
liberada, juntamente
com o restante das
snRNP, e os éxons
adjacentes são
unidos.
+
Presume-se que todas ou pelo menos a maioria das reações de processamento do hnRNA se dão no núcleo da célula, e a molécula de mRNA é então
liberada para o citoplasma, na forma de um mRNA maduro. Nessa passagem, o mRNA é adicionado de algumas outras proteínas que o protege contra a
degradação, formando um complexo denominado informossomo.
3: TRANSCRIÇÃO– 59
Splicing alternativo – embaralhamento de éxons
Uma das possíveis vantagens evolutivas da existência de íntrons e
éxons em eucariontes é a possibilidade de se fazer o
“embaralhamento” de diferentes éxons, através da remoção
seletiva de alguns deles, permitindo portanto a formação de várias
proteínas a partir de um mesmo transcrito primário. Neste
exemplo dramático, para o mRNA do gene da alfa-tropomiosina
(15 éxons e 14 íntrons – não desenhados em escala), observa-se
que até nove diferentes proteínas são formadas, a partir de um
mesmo gene, dependendo do controle celular exercido.
Em outras situações, não esquematizadas aqui, vias alternativas
de processamento envolvem múltiplos sítios de corte no final 3´.
Assim, um mesmo transcrito pode gerar mais de um produto final
pelo corte e eliminação de um segmento de um éxon em alguns
transcritos, enquanto que em outros o éxon inteiro é mantido.
É também interessante atentar para a informação constante no box
da página seguinte, referente à importância dos íntrons no
controle da expressão gênica.
Recomposição de éxons
Uma outra possível vantagem evolucionária de íntrons/éxons diz respeito à recomposição de éxons, já comentada anteriormente,
através da qual novos genes podem ser formados a partir da recomposição de éxons de dois genes ancestrais.
GENE A GENE B
Exons do Gene A Exons do Gene B
3´ 5´
Proteína A Proteína B
Recomposição de Exons
Nova Proteína C
NOVO GENE C
Formado pela
recomposição de dois
exons dos genes A e B
2a
5´
ÉXON 2 ÉXON 1 AAUAAA A A A A A A A A A A A A A A
5´
ÉXON 1 ÉXON 3 AAUAAA A A A A A A A A A A A A A A
5´
ÉXON 2 ÉXON 3 AAUAAA A A A A A A A A A A A A A A
A 1 B 2 C 3 D 4 E 5 F 6 G 7 H 8 I 9 J 10 K 11 L 12 M 13 N 14 O
A C E F G I J K L M
A B E F G I J K O
A C E F G I J K
D E F G I J K M
D E F G I J K N O
A C E F G I J K O
A C E F G H J K O
D E F G I J K O
A B C D E F G H I J K L M N O
Músculo estriado
Músculo liso
Cérebro (1)
Cérebro (2)
Cérebro (3)
Fibroblasto (1)
Fibroblasto (2)
Fibroblasto (3)
Fibroblasto (4)
Transcrito primário do gene
Edição do pré-mRNA 3
Nem sempre a sequência de aminoácidos de uma proteína é ditada exclusivamente pelo conteúdo do DNA do gene em questão. Muitas vezes,
a edição do RNA mensageiro resulta na substituição, inserção ou deleção de bases. Exemplos são encontrados em genes mitocondriais de
plantas e mesmo em genes celulares de mamíferos. O exemplo mais drástico ocorre em genes mitocondriais de Tripanosoma cruzi, onde
mais de 60% das sequências encontradas no mRNA são fruto de edição. A edição do pré-mRNA é feita por enzimas ou por RNAs guias
(gRNAs), que se pareiam com o mRNA.
3: TRANSCRIÇÃO– 60
Transcrição de Íntrons em Genes Humanos
Estudo realizado na USP identificou que 74% de todos os genes humanos possuem transcrição dentro de seus íntrons. A descoberta, publicada na
edição atual da revista Genome Biology, poderá ajudar a entender melhor as prováveis funções reguladoras dos genes exercida pelos RNAs não-
codificantes, que por muito tempo foram considerados “lixo genético”. Os íntrons são sequências de bases nitrogenadas presentes no DNA, mas não no
RNA mensageiro (mRNA). Ao contrário dos éxons, com os quais se intercalam na longa cadeia do DNA, os íntrons não participam da síntese de
proteínas e são removidos naturalmente durante a transcrição. A equipe, coordenada por Sérgio Verjovski-Almeida, professor do Instituto de Química
da USP, encontrou mais de 55 mil RNAs intrônicos em cerca de 5 milhões de etiquetas de sequências expressas (ESTs) depositados em bancos de
dados genômicos públicos. “Em 74% dos genes, além do RNA codificador de proteínas são transcritos também um ou mais RNAs não-codificadores a
partir de regiões totalmente contidas nos íntrons desses genes”, disse o pesquisador à Agência FAPESP.Os cientistas desenharam e construíram um
microarray (lâminas preparadas com um arranjo de fragmentos de DNA) contendo sondas para 7.135 desses RNAs intrônicos, além de sondas para os
genes codificadores das proteínas correspondentes. Com isso, detectaram padrões característicos da expressão intrônica para tecidos diferentes, como
próstata, rim e fígado. Segundo Verjovski-Almeida, o trabalho aponta para um papel importante dos RNAs não-codificadores de proteínas na regulação
dos diversos tipos de células. “Descobrimos que os RNAs intrônicos anti-senso mais abundantes são transcritos dentro dos íntrons dos genes
codificadores de proteínas que regulam a transcrição. Isso sugere que esses RNAs anti-senso são os reguladores dessas proteínas”, apontou. Os
pesquisadores imaginavam que o RNA transcrito de regiões intrônicas dos genes estivessem envolvidos em diversos processos relacionados com o
controle da expressão genética. Mas não se conhecia o complemento dos genes humanos nos quais os íntrons são transcritos, o número de unidades
transcricionais ou os padrões de expressão nos tecidos. “Levantou-se, recentemente, a hipótese de que haveria unidades totalmente contidas nas regiões
intrônicas. Isso foi constatado em alguns genes, em determinadas regiões do genoma. Começamos a ver, a partir desse novo trabalho, que não se trata
de um acontecimento ocasional restrito a alguns genes. É possível até que todos os genes tenham transcrição intrônica independente da transcrição da
mensagem”, disse Verjovski-Almeida.
Diversidade das espécies
As células têm mecanismos para identificar em seu genoma que certos genes devem ser ativados ou desativados em determinado momento. Depois de
conhecido o genoma, seria importante descobrir onde estão os genes e, para isso, é preciso sequenciar vários tipos de células em vários momentos, para
verificar que genes estão ligados ou desligados. “Geramos um microarray de 7 mil dos mais de 55 mil RNAs intrônicos não-codificantes que
encontramos. Identificamos mensagens intrônicas e exônicas em tecidos do fígado, próstata e rim. Havia um conjunto de mensagem intrônicas em
comum e uma fração menor de algumas centenas que acendem em um tecido e não nos outros, sugerindo uma relação com a regulação de funções
específicas de cada tecido”, disse Verjovski-Almeida. Ao analisar que tipo de gene tem mais presença da transcrição intrônica, os pesquisadores
descobriram que são justamente os genes reguladores de transcrição. “São reguladores da própria máquina de transcrição – isto é, uma espécie de
regulação fina feita pelo RNA. Está claro que os transcritos intrônicos devem ter algum papel e podem agir eventualmente até em proteínas”, afirmou.
Para Verjovski-Almeida, é possível que os RNAs intrônicos estejam relacionados à diversidade das espécies. “Uma indicação disso é que o número de
genes nos organismos superiores não cresceu muito com a evolução. Uma mosca tem 25 mil genes codificantes de proteína, enquanto o homem tem 30
mil. O que varia significativamente entre as espécies são as regiões intrônicas, por isso faz sentido conjecturar que a diversidade vem daí”, sugeriu.
Segundo ele, seria preciso sequenciar o genoma de milhares de pessoas para avaliar essa hipótese. Com isso, seria possível também explicar a
suscetibilidade de indivíduos a determinadas doenças. “Para muitas doenças se encontrou mutações nas regiões codificantes. Mas não há vestígios de
mutações nessas regiões para várias doenças complexas, que podem estar nessa outra rede”, disse.
Fonte: Genome mapping and expression analyses of human intronic noncoding RNAs reveal tissue-specific patterns and enrichment in genes
related to regulation of transcription. Verjovski-Almeida S. et al. Genome Biology 2007, 8:R43.
www.portalbiologia.com.br; acesso em 07/05/2008
3: TRANSCRIÇÃO– 61
Breaking News
Regulatory affairs, By Nijsje Dorman (Published: February 5, 2009)
Researchers have introduced a doxycycline-responsive gene silencing
strategy that can tune expression of splicing modulators.
New York, NY, Feb. 5—The ability to control alternative splicing would
enable functional studies of different mRNA isoforms, and represents a
therapeutic approach to diseases arising from splicing errors. Antisense RNA
that masks particular splice sites or regulatory elements can alter splicing,
but constitutive expression of these modulators limits their utility for
functional studies and would raise safety concerns for gene therapy.
Although regulating expression of protein-coding genes is routine, options
for RNA-encoding cassettes are more limited. For example, because the U7
snRNA-based expression cassette directs both transcription and
downstream processing, regulatory elements cannot be easily swapped in
and out.
Writing in Gene Therapy, Marquis et al. introduce a doxycycline-responsive
gene silencing strategy that can tune expression of splicing modulators. In
this system, the Tet repressor is fused to the heterochromatin-inducing
KRAB protein; in the presence of dox, the Tet repressor recruits KRAB to tet
operator sequences, silencing nearby genes.
Marquis et al. show that this system achieves dox-dependent control of
splicing in cell culture models of splicing defects involved in spinal muscular
atrophy and β-thalassemia. Extent of splicing correction was 77% in the
first case and near-total in the second test system, and remained equally
responsive throughout several induction/repression cycles.
Given the availability of tTR-KRAB transgenic mice and mouse models for
human splicing defects, the authors suggest that their system should allow
in vivo elucidation of the pathogenesis of splicing disorders.
Marquis et al. Doxycycline-controlled splicing modulation by regulated
antisense U7 snRNA expression cassettes. Gene Ther. [Epub ahead of print,
Aug 14, 2008; doi:10.1038/gt.2008.138].
Disponível em: http://biotechniques.com/default.asp?page=news&subsection=article_display&id=589
Os RNAs ribossômicos participam da síntese de polipeptídeos a partir do
mRNA, como os principal constituinte dos ribossomos (rRNA +
proteínas). Os ribossomos são muito numerosos nas células, até 20.000
por célula de bactéria (= 80% do RNA total e 10% das proteínas totais), e
portanto grandes quantidades de rRNAs são produzidas; além disso, as
moléculas são muito mais estáveis do que os mRNAs, tendo uma meia-
vida relativamente longa.
Estrutura molecular do rRNA
Para exercer sua função como arcabouço para ligação de proteínas, os
rRNAs adquirem uma estrutura tridimensional estável proporcionada por
pareamentos inter- e intramoleculares. 3’
5’
RNA ribossômico
16S de E. coli
Domínio 3’
secundário
Domínio 3’
principal
Domínio
central
Domínio 5’
O RNA RIBOSSÔMICO
Síntese de rRNA
Ribossomos são compostos por três diferentes rRNAs em procariontes e por quatro em eucariontes. Em procariontes, a transcrição se dá como um
óperon, assegurando assim número igual de cópias de cada rRNA (16S, 23S e 5S) para montar os conjuntos sem sobra. Em eucariontes, além do
óperon principal (18S, 28S e 5,8S), há um gene adicional, para a subunidade 5S, que é transcrito independentemente.
Transcrição pela RNA polimerase I (quase todos os rRNA)
O promotor da polimerase I é o menos complexo de todos. Na organização genômica, há várias cópias do gene, espaçadas por regiões não transcritas.
O cerne do promotor cobre o ponto de início da transcrição, entre os nucleotídeos -45 e –20, sendo suficiente para promover o início da transcrição. No
entanto uma sequência a jusante (UCE) aumenta a atividade. Ambas são ricas em GC e tem cerca de 87% homologia.
Dois outros fatores, UBF1 e SL1, são requeridos para a transcrição,e se ligam à polimerase antes da ligação desta ao promotor.
UBF1 (Unspecific Binding Factor) é inespecífico, no sentido de reconhecer sequências em vários organismos. É composto por apenas um polipeptídeo.
Processamento do pré-rRNA em procariontes
Em bactérias, apenas um promotor direciona a síntese de todas as
moléculas de rRNA. O óperon consiste ainda em moléculas de
tRNA, variáveis dependendo do gene; as sete cópias do pré-rRNA de
E. coli diferem no número, tipo e localização dos tRNAs incluídos no
transcrito primário, e algumas cópias contém segmentos para outros
tRNAs entre as subunidades 16S e 23S, bem como na extremidade 3’
do transcrito.
O transcrito é processado em uma série de passos, resultando nas
moléculas finais de 16S, 23S e 5S, além dos tRNAs presentes.
Inicialmente, os precursores das moléculas 16S e 23S são metilados.
Na primeira clivagem, por ação das enzimas RNase III (1), RNase P
(2) e RNase E (3), a segunda delas uma ribozima, são produzidos os
intermediários. Após a segunda clivagem, por ação de endonucleases,
são produzidos os rRNAs maduros, além do tRNA presente.
As sequências entre as subunidades finais, denominadas ITS (Internal
Transcribed Sequences) podem servir como marcadores moleculares,
por apresentarem alto nível de polimorfismo.
Processamento do pré-rRNA em eucariontes
Em eucariontes, um rRNA precursor de 45S é produzido e processado no núcleo para formar as unidades 18S, 5,8S e 28S características de
eucariontes. O precursor é metilado em mais de 100 dos cerca de 14.000 nucleotídeos, principalmente nos grupos 2’-OH retidos nos produtos finais. O
processamento requer RNAs encontrados no núcleo, denominados de RNAs nucleolares pequenos (snoRNA), em parte das proteínas reminiscentes dos
spliceossomos. O 5S rRNA é produzido separadamente, por outra polimerase (RNA polimerase III, e não RNA polimerase I).
Transcrito
primário (30S)
Metilação
Clivagem 1
1 1 2 1 1 3 3
Intermediários
Clivagem 2
rRNAs maduros
E E E E E E E
rRNA 16S tRNA rRNA 23S rRNA 5S
M M M M M M M M M M M M M M M M
3: TRANSCRIÇÃO– 62
Ribossomo Procariontes Eucariontes
Ribossomo completo
coeficiente de sedimentação
70 S
80 S
Subunidade maior
Coeficiente de sedimentação
Moléculas de RNA
Número de polipeptídeos
50 S
23 S + 5 S
31
60 S
28 S + 5,8 S + 5 S
50
Subunidade menor
Coeficiente de sedimentação
Moléculas de RNA
Número de polipeptídeos
30 S
16 S
21
40 S
18 S
33
Como os ribossomos são “batizados”
Os ribossomos são referidos pelo seu peso, medido por centrifugação em gradiente de sucrose. Após centrifugação, os ribossomos mais pesados ficam
mais no fundo. A letra “S” significa “Svedberg”, em homenagem ao pesquisador que a definiu, sendo também convenientemente aplicada para
“Sedimentação”. A unidade S é definida como a taxa de sedimentação de uma macromolécula por unidade de força gravitacional aplicada.
OS CONSTITUÍNTES DOS RIBOSSOMOS
EUCARIONTES
PROCARIONTES
23S (2.900 bases)
5S (120 bases)
16S (1.540 bases)
28S (4.800 bases)
5S (120 bases)
5,8S (160 bases)
18S (1.900 bases)
PROTEÍNAS DA
SUBUNIDADE
MAIOR: 31
PROTEÍNAS DA
SUBUNIDADE
MENOR: 21
PROTEÍNAS DA
SUBUNIDADE
MAIOR: 50
PROTEÍNAS DA
SUBUNIDADE
MENOR: 33
70S
50S
30S
40S
80S
60S
3: TRANSCRIÇÃO– 63
RNA transportadores são moléculas adaptadoras pequenas, com tamanhos variando entre 74 e 95 bases, sendo o mais comum 76. Elas formam
pareamento semelhante a um trevo, lêem as sequências de nucleotídeos do transcrito, e direcionam a síntese de um polipeptídeo. A maioria das células
contém cerca de 30 a 40 tipos diferentes de tRNA, e não os 61 que seriam necessários, graças à oscilação entre códons e anticodons. Células eucariotas
têm múltiplas cópias de vários dos genes para os tRNAs. Os tRNAs são derivados de precursores longos, através da ação enzimática, que remove
nucleotídeos de ambas as extremidades. A configuração final dos tRNAs pode ser subdividida em braços ou domínios.
3 2 1
Anticódon
Posição de oscilação
Estrutura terciária
Determinada por difração de raio X, une nucleotídeos que estão separados na estrutura secundária, resultando em uma conformação compacta.
Muitos dos nucleotídeos envolvidos neste pareamento são conservados nos diversos tRNAs.
Estruturas incomuns, tanto secundárias quanto terciárias, aparecem em alguns tRNAs, por exemplo na mitocôndria humana.
5’
3’
5’ 3’
O RNA TRANSPORTADOR
8 9 10 11 12 13
26
27
28
29
30
31
43
42
41
40
39
38 32
37 33
36 34 35
44
14
15
16
17
18
19
...
21
22 23 24 25
...
20
45
46
47
...
...
...
...
...
1
2
3
4
5
6
7
69
68
70
67
71
72
73
66
48
65
49 50
64
51
63
52
62
59 60
61 58
53
54
56
55
57
C
C
A
Braço do aminoácido (aceptor)
Sempre apresenta um ramo pareado que termina com a
sequência 5´-CCA-3´ não-pareada.
No tRNA iniciador, existe uma base extra formando par
com a base de número 73
Braço D
Contém uma base não-comum, dihidrouridina. Outra
característica deste braço é o número variável de
bases; às vezes, há bases extras após 17 (geralmente
1) e após 20 (1 ou 2), mas estas, bem como a própria
base 17, podem estar ausentes em tRNAs com braços
D pequenos
Braço TC
Contém a sequência T-pseudouridina-C nas
posições 54-55-56; a pseudouridina é uma outra
base modificada encontrada nos tRNAs
Braço variável
Este é o braço com tamanho mais variável. Nos
tRNAs da classe 1, que compreendem a maioria
dos tRNAs, o braço contém de 3 a 5 bases; já nos
tRNAs da classe 2, o braço pode inclusive ser o
maior de todos, com até 21 bases, sendo que as
bases extras são numeradas de 47:1 até 47:18.
Braço do anticódon
Neste, encontram-se as três bases que
formam o anticódon: 34, 35 e 36. Note que a
direção, nesta representação, vai da direita
para esquerda, mantendo assim o sentido
3´-5´ da direita para a esquerda, o que virá a
ser antiparalelo ao mRNA, cujo sentido é 5´-
3´ da esquerda para a direita
5’
3’
3: TRANSCRIÇÃO– 64
Transcrição, processamento e modificações dos transcritos de tRNA
Em E. coli, há várias unidades de transcrição, contendo de um a sete genes para diferentes tRNAs. Em eucariontes, os genes também estão agrupados e
ocorrem em múltiplas cópias. A transcrição irá gerar o tRNA precursor, que conterá as várias cópias concatenadas. Esse transcrito é processado para
liberar as moléculas de tRNA maduro, através da ação de enzimas que clivam as extremidades 5´ (RNase P) e 3´ (RNase D); para a ação da primeira
enzima, também já foi demonstrado o envolvimento do próprio RNA, em mais um exemplo de ação enzimática deste ácido nucléico.
Modificações químicas de nucleotídeos
Da mesma forma que ocorre com os rRNAs, os tRNAs sofrem modificações químicas, a taxas muito maiores. Há mais de 50 tipos
diferentes de modificações nos nucleotídeos to tRNA, embora as razões e vantagens dessas modificações sejam em muitos casos
ainda desconhecidas.
Metilação: adiçãode um ou mais grupos metila (CH3); exemplo guanosina para 7-metilguanosina e uridina para ribotimidina.
Rearranjo de base: modificações internas nas posições dos átomos no anel; exemplo uridina para pseudouridina
Saturação da dupla ligação: conversão de uma dupla ligação na base a uma ligação simples; exemplo uridina para diidrouridina.
Desaminação: remoção de um grupo amino (NH2); exemplo guanosina para inosina.
Substituição de enxofre: oxigênio da guanosina ou uridina substituído por enxofre; exemplo uridina para 4-tiouridina.
Adição de grupamentos mais complexos: exemplo guanosina para queosina.
3’ 5’
RNase D RNase D RNase D RNase D
RNase P RNase P RNase P RNase P
Além desses cortes, processamentos posteriores incluem
modificações em algumas bases, o splicing para remover
algumas sequências extras transcritas mas não necessárias,
e a adição de 5´-CCA-3´. Esta sequência é essencial, pois é
na A terminal que o aminoácido irá se ligar. Em muitos
eucariontes, esta sequência não está presente no transcrito
primário, já que o DNA não contém o molde; a adição se
dá pela tRNA nucleotidil-transferase. Em procariontes, a
sequência está geralmente presente, mas pode, em alguns
casos, ser removida pela RNase D, e precisa ser adicionada
por uma tRNA nucleotidil-transferase procariótica.
A adição do
aminoácido
ao braço
aceptor
sempre se
dará na
última
adenina do
terminal
5´-CCA-3´
5’
3’
1
2
3
4
5
6
7
69
68
70
67
71
72
73
66
C
C
A
C
C
3: TRANSCRIÇÃO– 65
REVISÃO
UNIDADE 3 - Transcrição
•RNAs são importantes no processo de transcrição e tradução. Saiba quais são as principais moléculas desse ácido
nucléico, e qual a função de cada uma. (Os RNAs principais são os m-, r- e t-RNA, cada um com sua função específica –
de acordo com seu próprio nome; outros tipos são os snRNA – envolvidos no processamento do mRNA e do rRNA –
RNA como enzima: ribozima - o snoRNA, também envolvido no processamento do rRNA, e outros tipos, envolvidos em
secreção de proteínas e outras funções)
•Há várias propriedades fundamentais do RNA e da transcrição, das quais seis foram detalhadas em aula. Saiba o que
cada uma significa. (1. Fita simples = maior degradação, mas mais estruturas secundárias e terciárias; 2. a hidroxila
extra da ribose torna o RNA mais reativo; 3. uracila é encontrada em lugar da timina; 4. um transcrito vem de uma fita de
DNA, mas ambas as fitas produzem transcritos; 5. a polaridade e o mecanismo são os mesmos; 6. não há necessidade
de um primer; 7. produto é uma fita, e apenas um pequeno segmento abre-se, e volta a se reanelar após o processo)
•Porque a transcrição, ao contrário da replicação, não requer um primer? (Porque o primer do DNA é colocado por uma
RNA polimerase – a primase; portanto, se as DNA pol não têm capacidade de partir do nada, as RNA pol têm)
•Compare e contraste as principais RNA polimerases de organismos procariontes e eucariontes, e saiba como elas
atuam na transcrição (em procariontes, uma enzima composta por cinco subunidades, sendo a subunidade sigma a que
fornece especificidade; em eucariontes há mais especialização, e tem-se três enzimas, I, II e III, para diferentes tipos de
transcritos – basicamente I para rRNAs, II para mRNAs e III para tRNAs)
•A transcrição em procariontes pode ser convenientemente dividida em três etapas; quais são estas e quais suas
particularidades? Como se dá a terminação? (Iniciação, alongamento e terminação; na iniciação são reconhecidos os
promotores, a enzima se liga e a fita se abre; no alongamento ocorre o processo de polimerização 5´- 3´, como na
replicação do DNA; na terminação, dois fenômenos podem ocorrer: formação de uma sequência palindrômica seguida
de uma outra rica em As e Us; ou atuação, simultânea ou não, da proteína rô)
•Em eucariontes, mais fatores participam da transcrição, quando este processo é comparado ao de procariontes. Quais
são os principais fatores envolvidos? E como são divididas as tarefas para a transcrição de mRNAs, rRNAs e tRNAs? (A
própria montagem do complexo já é mais extensa e demanda muito mais fatores, dentre os quais a TBP e os TF –
fatores de transcrição – ver figuras e ta belas nas páginas 3-10 e 3-11)
•O que são ribossomos, e como se dá a síntese e o processamento dos rRNAs? (Ribossomos são misturas de rRNA e
de proteínas, formando uma unidade física onde se processa a síntese de proteínas; são produzidos em cadeias, como
se fossem um óperon, e depois são metilados e clivados)
•A síntese dos tRNAs é mais complexa do que a de rRNAs; saiba quais os principais passos e processos envolvidos.
(Ela é mais complexa porque envolve mais passos, mas muitos são produzidos em cadeia; há necessidade de remoção
das extremidades pelas Rnases P e D, a modificação de bases, e a adição do terminal CCA – este terminal é constante
em todos e é onde se liga o aminoácido)
•No tocante a mRNAs, há mais processos ainda, incluindo autoprocessamentos. Saiba listar os processos, e suas
principais consequências para os organismos. (Os mRNAs recebem também o quepe e a cauda, e os introns, se
presentes, são removidos; é possível que esta remoção seja seletiva – splicing alternativo ou embaralhamento de éxons.
3: TRANSCRIÇÃO– 66
Primosomo: DNA
helicase + RNA
primase Topoisomerase
(DNA girase)
RNA
primer
Várias SSBP
DNA
pol I
DNA
ligase
Dímero
DNA
pol III
Cada dímero é composto
por 10 subunidades:
- alongamento
’ - carregamento
- processividade
Em eucariotos, o esquema geral
é o mesmo, mas participam
cinco enzimas:
- replicação descontínua
- replicação contínua
- reparo
- replicação na mitocôndria
- reparo?
Replicação em procariontes
Replicação em eucariontes
Transcrição em procariontes
Transcrição em eucariontes
RNA pol completa (’) escaneia o
DNA à procura dos promotores
(-)10 e (-)35 e forma um complexo
fechado quando sigma reconhece (-)35
Sigma se dissocia e as
subunidades ’ iniciam a
polimerização do RNA
TFIID
TBP
TFIIA
1. TBP, componente do
TFIID, se liga a TATA, e
TFIIA estabiliza a ligação
2. TFIIB se liga e catalisa
ligação da RNA poI II; TFIIF
direciona a polimerase
3. TFIIE, TFIIH
(helicase), e TFIIJ?
se juntam ao
complexo
RNA polimerase II:
transcrição de
genes de proteínas
B F
H
E
J
3: TRANSCRIÇÃO– 67
UNIDADE 4
Tradução
OBJETIVO
Comentar sobre a descoberta do código genético, com ênfase na abordagem experimental, e discorrer sobre os mecanismos de tradução do DNA e do
RNA em proteínas, com ênfase nas enzimas envolvidas.
CONTEÚDO
O código genético e a tradução do mRNA em proteínas
Descoberta do código genético
Mecanismos de síntese protéica em procariontes
Mecanismos de síntese protéica em eucariontes
GUIA DE ESTUDOS
Saiba detalhar os experimentos que foram conduzidos para a elucidação do código genético.
O que são regiões tolerantes de um gene? Qual sua importância para a elucidação do código genético?
Quais as principais características do código genético? Ele é universal?
Porque o código é dito “degenerado”? Qual uma palavra melhor para definir essa característica do código?
Descreva o papel do tRNA na tradução, bem como os processos envolvidos.
Saiba o que são os sítios A, P e E, na tradução.
Qual a implicação da oscilação dos códons e anticódons? Isto é benéfico para o organismo?
Conheça os principais fatores envolvidos na tradução em procariontes e eucariontes. Como se dá a iniciação, oelongamento da cadeia e a finalização?
O acoplamento da transcrição e da tradução ocorre exclusivamente em procariontes. Porque?
Saiba diferenciar entre o acoplamento da transcrição e da tradução, um processo exclusivo de procariontes, da
tradução simultânea de uma mesma mensagem por vários ribossomos, que ocorre tanto em procariontes quanto
em eucariontes. Qual o benefício deste último evento?
Além da tradução, outros processos são realizados após este, antes que um polipeptídio seja liberado e esteja apto
a ser utilizado. Conheça esses processos e suas implicações.
4: TRADUÇÃO– 68
Tolerante
Trecho original ELE NÃO TEM DOR NEM COR
Uma inserção ELE NÃ OTE MDO RNE MCO R
Duas inserções ELE NÃ OT EMD ORN EMC OR
Três inserções ELE NÃ OT EM DOR NEM COR
O sentido retorna
O código genético contém as regras que determinam a seqüência de aminoácidos do
polinucleotídeo sintetizado a partir de um RNA mensageiro; essa seqüência é a chave para a
estrutura e a função da proteína. Dentre os conceitos importantes para o estudo e a validação do
código, estão:
1 - Colinearidade entre gene e proteína. Chareles Yanofsky e colegas demonstraram que certas
seqüências gênicas são colineares com as proteínas por elas codificadas; assim, mutações no DNA
podem produzir mudanças na proteína, na posição correspondente, de acordo com o código
genético (Yanofsky, C. et al. 1964. On the colinearity of gene structure and protein structure. PNAS
(USA) 51:266-274).
2 - Cada códon do código é uma trinca de nucleotídeos. Sydney Brenner, Francis Crick e colegas
propuseram que o DNA é lido em códons formados por 3 bases. Eles também propuseram que um
conjunto de RNAs, mais tarde denominados tRNAs, decodificava o DNA (Crick, F.H.C. et al.
1961. General nature of the genetic code for proteins. Nature 192:1227-1232). São necessários pelo
menos 20 códons, um para cada aminoácido. Por estágios, eliminaram-se códons de 1 letra (apenas
4 códons: A, T, G, C) e de 2 letras (apenas 16 códons), sendo que o estágio seguinte, códon de
trincas, seria aceitável (64 possíveis combinações).
Demonstração do códon de trincas
A demonstração que o código genético é composto por códons de trincas foi feita em experimentos onde se utilizaram mutagênicos que causam
adições ou deleções de pares de bases; dentre esses, encontram-se os corantes acridina, por exemplo a proflavina. A demonstração baseou-se também
no fato que muitos genes apresentam segmentos “tolerantes”, ou seja, segmentos onde mutações podem ocorrer sem afetar o fenótipo, posto que eles
codificam para segmentos de polipeptídeos sem função importante. Com base nesses dois fenômenos, o seguinte quadro se aplica, demonstrando que
tanto uma quanto duas adições (ou deleções), mesmo ocorrendo em regiões tolerantes, causam efeito no fenótipo, mas três adições (ou deleções) em
regiões tolerantes fazem com que o sentido de leitura seja retomado. Isto ocorre exatamente porque cada códon é formado por trincas.
O CÓDIGO GENÉTICO: DESCOBERTA
A elucidação do código genético
Uma vez tendo sido demonstrado que o código genético era composto por códons de três letras, e sabendo-se que poderiam existir até 64 códons
diferentes, passou-se a argumentar qual o significado de cada um dos códons, ou seja, quais códons codificavam para um determinado aminoácido.
Nos experimentos iniciais, utilizou-se a enzima polinucleotídeo fosforilase, que pode formar moléculas curtas de mRNA in vitro (embora in vivo sua
função seja oposta). Assim, vários grupos passaram a sintetizar cadeias curtas e a verificar, na tradução, qual ou quais os aminoácidos formados.
Quatro experimentos foram essenciais:
(a) síntese protéica in vitro com homopolímeros (1961). RNAs homopoliméricos são fáceis de sintetizar; avanços na síntese protéica in vitro (M.W.
Niremberg & H. Matthaei (1961). The dependence of cell-free protein synthesis in E. coli upon naturally occurring or synthetic polyribossomes.
PNAS 47:1588-1602) permitiram determinar com poli(U) que o códon UUU sintetiza fenilalanina. Os polímeros poli(A) e poli(C) sintetizavam lisina
e prolina, respectivamente; poli(G), por razões ainda não esclarecidas – mas provavelmente porque formava pontes internas de hidrogênio, dobrando-
se – não pode ser construído na época.
(b) heteropolímeros aleatórios. Uma mistura racional de nucleotídeos com a enzima polinucleotídeo fosforilase poderia gerar mRNAs cuja composição
poderia ser estatisticamente prevista.
Heteropolímero aleatório 5C:1A
Probabilidade de C ser incluído: 5/6
Probabilidade de A ser incluído: 1/6
Trincas Probabilidade
CCC (5/6)3 57,9%
CCA CAC ACC (1/6)(5/6)2 11,6%
CAA ACA AAC (1/6)2(5/6) 2,3%
AAA (1/6)3 0,4%
Resultados
Prolina 69% CCC + uma de cada
CCA ou CAC ou ACC
Treonina 14% Uma de cada CCA ou
CAC ou ACC mais uma
de cada CAA ou ACA
ou AAC
Histidina 12% Uma de cada CCA ou
CAC ou ACC
Asparagina 2%
Glutamina 2%
Uma de cada CAA ACA
AAC para cada
Lisina 1% AAA
O método não é absoluto, mas permite prever a maior parte dos códons com probabilidade estatística alta.
Note que inserções ou deleções em
número superior a três, mas não múltiplos
deste, causam o mesmo efeito. Por
exemplo, quatro inserções teriam o
mesmo efeito que uma inserção (com a
diferença que um códon extra teria sido
incluído na região tolerante).
4: TRADUÇÃO– 69
AC ACACACACACACACAC... ACA, CAC
UGU UGUUGUUGUUGUUGU... UGU, GUU, UUG
c) Heteropolímeros ordenados. Os resultados até então obtidos não eram
conclusivos. Foram necessários mais dois tipos adicionais de experimentos, o
primeiro com os heteropolímeros ordenados, obtidos pela polimerização de di-
ou trinucleotídeos conhecidos, por exemplo:
Ensaio de ligação tripla – exemplo para treonina
ACU ACU ACU
ACU ACU
ACU ACU
AA não marcados,
exceto treonina
Trincas ACU
Ribossomos
Mistura os três componentes, e
somente tRNA-Treonina se liga ao
ribossomo e à trinca
Imobiliza os reagentes
em um filtro; os tRNAs
não ligados
atravessam
Resultado:
Se o filtro é radioativo, então a trinca
ACU codifica para o aminoácido treonina
d) Ensaio de ligação tripla (1964). Uma modificação da síntese protéica in vitro, baseada no fato de que ribossomos purificados se fixam a uma
molécula de mRNA de apenas três nucleotídeos (um códon) e ligam o tRNA correto. Foi possível então avaliar os códons previamente determinados e
localizar os restantes (Niremberg, MW e Leder, P. 1964. RNA codewords and protein synthesis. Science 145: 1399-1407).
O CÓDIGO GENÉTICO: CARACTERÍSTICAS
O código é redundante (degenerado)
Todos os aminoácidos, exceto a metionina e o triptofano, são codificados por mais de um códon.
O código contém códons “externos” de pontuação, mas não contém pontuação interna e nem sobreposição
Há três códons de finalização: UAA, UGA e UAG (Brenner, S. et al. 1965. Genetic code: the ‘nonsense’ triplets for chain termination and their
suppression. Nature 206: 994-998), e um códon mais comum de iniciação: AUG, que também codifica metionina. Portanto, a maioria dos
polipeptídeos recém-sintetizados contém metionina, embora a mesma possa vir a ser removida posteriormente. GUG e UUG são também utilizados
como códons de iniciação, em raras ocasiões. Não há, no entanto, “vírgulas” no código genético, de tal forma que a mensagem é lida de forma corrida.
Códon 1 Códon 2 Códon 3 Códon 4
AAA UUU GGG CCC AAA UUU GGG GGG CCC UUU GGG AAA1ª. B
ase
2a . b
ase
3a . b
ase
1ª. B
ase
2a . b
ase
3a . b
ase
1ª. B
ase
2a . b
ase
3a . b
ase
1ª. B
ase
2a . b
ase
3a . b
ase
INÍCIO HISTIDINA GLICINA FIM
Unidade Polinucleotídeo Trincas
básica reveladas
1
2
Note que é importante a determinação do ponto de início da leitura. Sempre há três possíveis quadros de leitura para uma mensagem:
A U G C A U G G C U G A
A U G C A U G G C U G A
A U G C A U G G C U G A
4: TRADUÇÃO– 70
O código não é universal
O sistema in vitro utilizado nos experimentos iniciais baseou-se em E.
coli, e depois sistemas utilizando eucariontes conduziram aos mesmos
resultados. No entanto, posteriormente verificou-se que os genes da
mitocôndria humana utilizam um código genético levemente diferente.
Há outros exemplos com Drosophila, Tetrahymena e Paramecium.
Gly
Ser
Lys
Ala
Val
Leu
Asp
Glu
Pro
Asn
Phe
Thr
Gly
Cys
Ile
Arg
Met
His
Trp
1 2 3 4 5 6
Códons
O número de códons para cada aminoácido é relativamente proporcional à sua freqüência de uso na tradução
Há uma boa correlação entre o número de códons para cada aminoácido e a sua abundância em polipeptídeos, conforme demonstrado no gráfico. A
arginina é uma exceção, porque no DNA de eucariotos há uma baixa ocorrência de duplas CG, de tal forma que os 4 códons que começam com GC
ocorrem pouco.
Os três códons de terminação recebem nomes especiais; o primeiro a ser descoberto foi o códon UAG,
denominado “âmbar”; os outros dois são denominados “opala” (UGA) e “ocre” (UAA)
O códon de iniciação
AUG em procariontes
codifica para uma
metionina ligada a um
grupamento formil,
chamada f-Met, e
responde a um tipo
especial de tRNA.
GUG, e mais
raramente UUG,
podem também servir
como códons de
iniciação. AUG é
usado em 91% dos
casos, GUG em 8%
dos casos, e UUG em
apenas 1%; essa
preferência está
associada com a
eficiência da tradução,
já que AUG é o códon
mais eficiente. As
evidências indicam
que esses códons
alternativos codificam
igualmente para f-Met
se ocorrerem como
códon de iniciação.
Importância para expressão de proteínas humanas e de leveduras em bactérias: AGA e
AGG são raramente usados em bactérias, mas são comuns em humanos e leveduras;
a superexpressão de genes contendo esses códons pode resultar em síntese
defeituosa das proteínas. Isto ocorre em particular se esses códons estiverem próximo
do início do mRNA, o que pode impedir a entrada de novos ribossomos.
Freqüência de uso dos códons alternativos de arginina
em três espécies
CODON E. coli S. cerevisiae H. sapiens
CGU 38 14 8
CGC 40 6 19
CGA 6 7 11
CGG 10 4 22
AGA 4 48 20
AGG 2 21 20
Fonte: Schumann e Ferreira, 2004. Genetics and Molecular Biology 27(3): 442-453
3
O código tem “famílias” e não é ambíguo
As trincas do código tendem a estar arranjadas em grupos, ou famílias; as duas primeiras letras em geral são as determinantes na alocação a uma
determinada família, mas alguns aminoácidos são codificados por diferentes famílias, e algumas famílias codificam diferentes aminoácidos. Além
disso, um determinado códon, em um organismo, codifica somente um aminoácido.
4
5
4: TRADUÇÃO– 71
TRADUÇÃO: VISÃ0 GERAL
Várias macromoléculas estão envolvidas na tradução da informação genética a partir de um RNA mensageiro. Dentre as macromoléculas estão o próprio
mRNA, os ribossomos (com seus rRNA e suas 50-80 proteínas), os 40-60 tRNAs, as várias enzimas ativadoras de aminoácidos (aminoacil-tRNA
sintetases), e mais umas dez proteínas solúveis envolvidas na iniciação, alongamento e terminação da cadeia protéica. Os ribossomos são constituídos de
duas subunidades (pequena e grande), que se associam sempre que um mRNA está sendo traduzido, dissociando-se quando o processo é concluído. Eles
são os sítios físicos onde a tradução ocorre, já que o mRNA e os tRNAs vêm aos ribossomos por ocasião da tradução. Já um mRNA pode ser definido
como a molécula que contém a informação a ser traduzida, na forma de códons (triplets de três bases, cada um codificando para a entrada de um
aminoácido na cadeia polipeptídica). Por outro lado, os tRNAs são as moléculas que trazem os aminoácidos ao sítio de tradução. Eles são as menores
macromoléculas envolvidas no processo, tendo raramente mais do que 80 bases de tamanho, adquirindo, no entanto, uma complexa estrutura secundária,
compatível com sua função na tradução. Os tRNAs contém uma região denominada anticódon, capaz de formar pares de bases com o seu códon
complementar no mRNA.
Cada aminoácido se liga ao seu tRNA após ativação enzimática feita pelas aminoacil-tRNAs sintetases, que são encontradas em número de pelo menos 20
(ou seja, uma para cada aminoácido). Cada espécie de tRNA difere de outra em algumas bases, permitindo assim o reconhecimento por uma aminoacil-
tRNA sintetase trazendo o aminoácido específico para aquele tRNA. Inicialmente, o aminoácido é ativado, e posteriormente ligado ao seu tRNA,
formando o complexo denominado aminoacil-tRNA. Posteriormente, o aminoacil-tRNA reconhece o seu códon no mRNA, pareando então o seu
anticódon a este. Isto ocorre no sítio “A” (aminoácido) do ribossomo, sendo que posteriormente a molécula se move para o sítio “P” (polipeptídio)
No início da síntese, quando uma mensagem nova começa a ser traduzida, o complexo de tradução (mRNA+ribossomo menor) se forma ao redor da trinca
de iniciação (geralmente uma AUG), na região denominada Shine-Dalgarno. Imediatamente, um tRNA especial, carregando uma metionina modificada
(formil-met), entra, o que é seguido pela chegada do ribossomo maior. O próximo tRNA entra no sítio A e, ao se translocar para o sítio P, forma uma
ligação peptídica com aquele primeiro aminoácido, enquanto que a sua própria ligação com o aminoácido é rompida. Este ciclo (tRNA no sítio A,
translocação, formação da ligação peptídica, quebra da ligação tRNA/aa) é repetido tantas vezes quantas houver códons com significado no mRNA.
Quando um códon de terminação é encontrado (UAG, UGA e UAA), o complexo se dissocia. Uma nova proteína foi assim formada, enquanto que os
outros componentes (ribossomos e tRNAs) são reutilizados em outras traduções.
Ademais, cada um mRNA pode ser traduzido simultaneamente por vários ribossomos, distantes aproximadamente 90 nucleotídeos entre si, formando os
chamadas polissomos. Ainda, esse fenômeno pode ocorrer, em procariontes, simultaneamente à transcrição, visto que não há compartimentalização dos
processos (ausência de membrana nuclear) e nem processamento do mRNA. Isto não ocorre em eucariontes, já que a transcrição ocorre no núcleo e a
tradução no citoplasma. Note, no entanto, que eucariontes também apresentam polissomos.
À tradução em si podem se seguir várias etapas de processamentos e modificações das proteínas formadas, incluindo-se: (i) Modificações amino-terminais
e carboxil-terminais: todos os peptídeos iniciam com uma formilmetionina (pro) ou metionina (eucariontes), os quais podem, após síntese, ser removidos
por ação enzimática e, portanto, não ser encontrados na proteína final. Outra modificação comum envolve a acetilação do grupo amino do terminal amino;
(ii) Perda de sequências de sinal: em muitas proteínas, os últimos 12-30 resíduos da extremidade amino desempenhampapel importante na destinação do
polipeptídeo para os compartimentos celulares; essa seqüência sinalizadora é em geral removida quando o destino final é atingido. (iii) Modificações de
amino ácidos: envolve fosforilação de alguns grupos hidroxila de ser, thr e tir, importante para a atividade enzimática. Grupos metil-serina são comumente
encontrados em proteínas musculares e no citocromo c. (iv) Cadeias laterais de CH: encontradas em glicoproteínas, proteoglicanos e proteínas com
funções extra-celulares. (v) Grupamentos isoprenil: dentre as proteínas com essas modificações encontram-se as do grupo Ras (oncogenes e proto-
oncogenes), bem como proteínas G e lamins. (vi) Grupamento prostético: por exemplo na acetil-CoA carboxilase e no grupo heme do citocromo c.
Processamento proteolítico: muitas proteínas são sintetizadas como unidades bastante grandes, que são posteriormente cortadas proteoliticamente para
produzir as formas ativas; exemplos incluem tripsina e quimotripsina. (vii) Cross-linking por ligações dissulfídicas: pontes formadas após o atingimento
da conformação nativa da proteína, protegendo contra desnaturação e outros eventos.
AS ATORES DO SISTEMA DE TRADUÇÃO
3
5
3
5
3
5
3
5
Os ribossomos são constituídos por
rRNA e proteínas associadas. Cada
ribossomo contém um sítio para
ligação do mRNA, e mais três sítios
para ligação dos tRNAs: sítio “A”, para
aminoácido, sítio “P” para
polipeptídeo, e sítio “S”, para saída (no
inglês, “E”, para exit); este último
parece ser determinado quase que
exclusivamente pela subunidade
maior.
P A
P A S
Os RNA transportadores são as moléculas adaptadoras que efetivamente funcionam
como o sistema de transporte para trazer os aminoácidos ao sítio de síntese protéica.
No quadro, está mostrado à esquerda um tRNA não aminoacilado, e à direita um já
aminoacilado. Note que a representação escolhida para o tRNA leva em conta a
polaridade 3´- 5´, inversa portanto à do mRNA, uma vez que os dois deverão formar
pares de bases complementares (códon/anticódon). Em uma determinada célula, existirá
uma população de tRNAs aminoacilados (independentemente da tradução), e uma
população, geralmente menor, de espécies não aminoaciladas. O número de tRNAs
diferentes não é 61, como era de se esperar, mas menor, entre 30 e 40, graças à
“oscilação” entre códon e anticódon.
5 3
Os RNA mensageiros fornecem a mensagem (códons) para
tradução, indicando qual a ordem de incorporação de
aminoácidos no polipeptídeo a ser formado, bem como onde
começar e onde terminar o processo.
Os aminoácidos são as moléculas que efetivamente compõe as proteínas. São definidos como ácidos
orgânicos que contém um grupo alfa-carboxil e um grupo alfa-amino, e que diferem entre si pelo grupo
radical que substitui o carbono alfa. Em geral, são classificados pela polaridade do grupo R: não-polares
(hidrofóbicos), polares (neutros), positivos (básicos) e negativos (ácidos). Na constituição básica das
proteínas, 20 aminoácidos são comumente encontrados; em algumas proteínas especializadas, outros
aminoácidos são encontrados, embora não sejam especificados pelo código genético, mas surgem por
modificações enzimáticas dos aminoácidos parentais.
4: TRADUÇÃO– 72
OS PASSOS PARA A TRADUÇÃO
A incorporação de qualquer aminoácido a uma cadeia polipeptídica envolve os cinco passos seguintes:
1. Energização do aminoácido;
2. Reconhecimento tRNA/aa;
3. Aminoacilação do tRNA;
4. Reconhecimento do códon pelo tRNA carregado; e
5. Formação da ligação peptídica, quebra da ligação tRNA/aa, e translocação.
Na sistemática de tradução, estão também envolvidos sistemas de iniciação e de finalização, que serão vistos em detalhes mais tarde.
H
I
R ---- C ---- C ---- O
-
I II
+
NH2 O
+
ENERGIZAÇÃO DO AMINOÁCIDO
H
I
R ---- C ---- C ---- O
-
I II
+
NH2 O
+
A energização do aminoácido se dá pela união do mesmo a uma ATP, gerando um
pirofosfato inorgânico e um aminoácido ligado a uma AMP, denominado “aminoacil-AMP”.
A energia dessa AMP será usada para ligar o aminoácido ao seu tRNA.
1
aminoácido
ATP
Aminoacil-AMP pirofosfato
inorgânico
ENZIMA:
Aminoacil-tRNA
sintetase
C11/G24
A73
G20
C34
A3/U70
G2/C71
G1/C72
RECONHECIMENTO DO RNA TRANSPORTADOR 2
Cada tRNA tem afinidade específica por um dos 20 aa, formando
uma ligação covalente com o mesmo, quando carregado. O
reconhecimento se dá em bases específicas nos vários braços
do tRNA.
As posições reconhecidas variam; alguns exemplos:
Valina: as três bases do anticódon
Metionina: as três bases do anticódon
Fenilalanina: as três bases do anticódon, mais G20 do braço D
e A73 no terminal
Isoleucina: modificação na posição C34 do anticódon
Glutamina: o anticódon, especialmente a U central
Serina: os pares G1-C72, G2-C71 e A3-U70 no braço acceptor,
mais o par C11-G24 no braço D
Alanina: o par G3-U70 na hélice acceptora
Braço D
Braço do anticódon
Anticódon
Braço pseudouridina
Braço aceptor do aa
5´
3´
4: TRADUÇÃO– 73
RECONHECIMENTO CÓDON/ANTICÓDON: TEORIA DA OSCILAÇÃO 4
Uma vez que o aminoácido correto esteja ligado ao tRNA, a molécula aminoacilada precisa reconhecer, no mRNA, o seu local de ligação, através do braço
anticódon que contém a trinca anticódon. No entanto, códons e anticódons podem oscilar. Teoricamente, deveria haver 61 moléculas de tRNA em cada
célula; na prática, há entre 31 e 40, dependendo do organismo. Como? A explicação está na hipótese da oscilação: há uma região de oscilação, no
primeiro nucleotídeo do anticódon e terceiro do códon, permitindo ao anticódon a formação de pares com mais de um códon.
3`
5`
anticódon
3
1
2 A
2 U mRNA 5`
tRNA 3`
códon
3`
5`
anticódon
3
1
2 C
2 G mRNA 5`
tRNA 3`
códon
3`
5`
anticódon
3
1
2 G
2 U mRNA 5`
tRNA 3`
códon
3`
5`
anticódon
3
1
2 U
2 G mRNA 5`
tRNA 3`
códon
3`
5`
anticódon
3
1
2 U
2 A mRNA 5`
tRNA 3`
códon
3`
5`
anticódon
3
1
2 G
2 C mRNA 5`
tRNA 3`
códon
3`
5`
anticódon
3
1
2 I
2 U mRNA 5`
tRNA 3`
códon
3`
5`
anticódon
3
1
2 I
2 C mRNA 5`
tRNA 3`
códon
3`
5`
anticódon
3
1
2 I
2 A mRNA 5`
tRNA 3`
códon
Pareamentos
convencionais: se as
bases A ou C ocuparem
a primeira posição do
anticódon, elas apenas
formarão os
pareamentos
convencionais com U e
G, respectivamente
Se U ocupar a primeira
posição do anticódon,
ela poderá formar o
pareamento
convencional com A ou
um pareamento não-
convencional com G
Se G ocupar a primeira
posição do anticódon,
ela poderá formar um
pareamento não-
convencional com U
ou o pareamento
convencional com C
Se a base modificada Inosina,
que se assemelha com G em
suas propriedades, for
encontrada na primeira
posição do anticódon, ela
poderá parear com U, C ou A
A
C
C
AMINOACILAÇÃO DO RNA TRANSPORTADOR
H
I
R ---- C ---- C ---- O
I II
+
NH2 O
+
AMINOACILAÇÃOENZIMA:
Aminoacil-tRNA
sintetase
A extremidade amino do
aminoácido permanece
livre
3
H
I
R ---- C ---- C ---- O
-
I II
+
NH2 O
A partir do aminoacil-AMP gerado pela reação de energização do aminoácido, e uma vez feito o reconhecimento apropriado, dá-se a aminoacilação do tRNA, em
uma reação que gerará uma AMP livre e um tRNA aminoacilado. A ligação covalente se dá por aminoacilação ou associação, quando o aminoácido se torna ligado
à extremidade 3’ do braço aceptor do tRNA, que é sempre um A (5’-CCA-3’)
As aminoacil-tRNA sintetases controlam a aminoacilação. Na maioria das células, há uma única sintetase para cada aminoácido, o que significa que uma
enzima pode associar cada membro de uma série de tRNAs isoaceptores. A reação catalizada por todas é a mesma, sendo requerida energia fornecida por ATP.
As aminoacil sintetases são capazes de reconhecer tanto o aminoácido correto, com base no seu radical, quanto o tRNA apropriado.
+
3 ´
A
C
C
aminoacil-AMP tRNA tRNA
aminoacilado
As aminoacil - tRNA sintetases
Estas são as enzimas responsáveis pela ativação dos aminoácidos e sua ligação aos tRNAs. Elas existem em número de pelo menos 20, ou seja, uma
para cada aminoácido – e portanto, como há até 61 espécies de tRNA, cada aminoacil tRNA sintetase reconhece mais de um tRNA, mas somente um
aminoácido. Estas enzimas ligam o aminoácido à hidroxila 3' livre da adenosina terminal do tRNA. A ligação ocorre numa reação de duas etapas, que
envolve a quebra de um ATP, em processos que serão vistos em detalhe mais tarde. Em suma, o aminoácido forma um complexo com a enzima,
utilizando o ATP como fonte de energia, liberando um pirofosfato inorgânico e formando um aminoacil, que é posteriormente ligado ao tRNA.
Quando isto acontece, forma-se o complexo aminoacil-tRNA ativado.
É importante salientar que a entrada do aminoacil-tRNA no complexo de tradução se dá exclusivamente por virtude do reconhecimento do códon pelo
tRNA; isto significa dizer que, se o complexo aminoacil-tRNA ligou um aminoácido errado, este aminoácido será erroneamente incorporado à cadeia
polipeptídica crescente. Isto foi experimentalmente demonstrado em um experimento clássico onde uma cisteína já ligada ao seu tRNA específico foi
quimicamente modificada, transformando-se em uma alanina. Este aminoacil-tRNA (agora denominado alanil-tRNAcis), incorporou a alanina em
resposta a um códon de cisteína.
O reconhecimento dos tRNAs pela sua aminoacil-tRNA sintetase específica é complexo. Por um lado, uma enzima específica deve reconhecer apenas
um aminoácido (o seu aminoácido específico), mas por outro lado, ela pode ligar esse aminoácido reconhecido por ela a vários tRNAs. Conforme será
demonstrado mais tarde, não apenas o anticódon mas várias outras posições no tRNA são importantes para esse reconhecimento.
4: TRADUÇÃO– 74
P A
FORMAÇÃO DA LIGAÇÃO PEPTÍDICA, QUEBRA DA LIGAÇÃO tRNA/aa, E TRANSLOCAÇÃO
A cadeia
polipeptídica já
contém três resíduos
de aminoácidos
desligados de
tRNAs, e mais um
quarto, ainda ligado
ao tRNA
O quarto aminoácido ainda está ligado ao seu tRNA, mas
já houve a formação da ligação peptídica pela enzima
peptidil-transferase
Uma nova ligação peptídica entre os resíduos 4 e 5
forma-se, presumivelmente por ocasião da
translocação do complexo para o próximo códon
5
Após o início da síntese, a adição de cada novo aminoácido passa por três etapas, envolvendo: (i) a formação de uma ligação peptídica entre o novo
aminoácido e a cadeia peptídica; (ii) o rompimento da ligação de alta energia que foi feita durante a aminoacilação do tRNA; e (iii) a translocação de todo
o sistema para o próximo códon. Embora ainda perdurem algumas dúvidas sobre como o processo todo é orquestrado, presume-se que, estando o sítio P
ocupado por um tRNA aminoacilado e já ligado à cadeia, e o sítio A ocupado por um novo aminoacil-tRNA, a formação da nova ligação peptídica faça
com que a cadeia passe para o domínio do tRNA ocupando o sítio A, por alguns instantes, o que é imediatamente seguido pela liberação do tRNA
desacilado e pelo movimento do ribossomo para o próximo códon. Por ocasião da formação da nova ligação peptídica, houve também o rompimento da
ligação de alta energia que existia entre o tRNA e o seu correspondente aminoácido. O ciclo é repetido várias vezes, até que um códon de finalização seja
encontrado. É também postulado que as subunidades maior e menor se movam separadamente, a subunidade maior movendo-se antes da menor.
P A S
P A
5 3 1 2 3 4 5 6 7 8
5
1
2
3
4
P A S
5 3 1 2 3 4 5 6 7 8
1
2
3
4
5
O quinto aminoácido com o seu tRNA ocupa o
sítio A e ainda não está ligado à cadeia
O tRNA do
terceiro
aminoácido
agora está livre,
ao mesmo
tempo em que o
quarto passou
para o sítio S e
em seguida se
liberará
A ligação entre o quarto aminoácido e seu
tRNA rompe-se por hidrólise
O próximo tRNA, com o
resíduo de aminoácido 6,
aproxima-se do sítio A
para formar pares de
bases com o seu códon
P A S
P A
5 3 1 2 3 4 5 6 7 8
5
1
2
3
4
As duas subunidades do ribossomo
se movem um códon à frente; é
possível que esse movimento seja
descoordenado, no sentido em que a
subunidade maior mova-se antes,
deixando um desalinhamento
transitório entre os sítios A e P das
duas subunidades; a isso, seria
seguido o movimento da subunidade
menor
Há também algumas evidências que o
mRNA, e não o ribossomo, se
moveria, mas isto ainda carece de
mais investigação
4: TRADUÇÃO– 75
O INÍCIO DA SÍNTESE PROTÉICA EM PROCARIONTES:
DETALHAMENTO DO RECONHECIMENTO DO CÓDON
O primeiro processo que ocorre na tradução é a ligação da subunidade menor do ribossomo (30S) com a molécula de mRNA a
ser traduzida. O sítio de ligação do ribossomo assegura que a tradução comece na posição correta, logo acima do primeiro
códon “AUG”, que é o mais freqüentemente utilizado; outros códons de iniciação são GUG e UGG, este raramente utilizado. A
eficiência do códon AUG é cerca de duas vezes maior do que GUG, e quatro vezes maior do que UUG.
A seqüência de Shine-
Dalgarno, um conjunto de
nucleotídeos situados logo
acima do ponto de
iniciação da tradução em
procariontes. Descoberta
em 1974, por John Shine e
Larry Dalgarno, na
Austrália. com o consenso
UAAGGAGG ou AAGGA. A
primeira composição
parece ser de 3 a 6 vezes
mais eficiente do que a
segunda.
AUG: códon de iniciação mais comum em procariontes (usado em 91% dos casos); GUG é usado em
8% dos casos, e UUG em apenas 1%. O códon AUG é o mais eficiente em promover a transcrição.
O 16S RNA forma pares de bases com a seqüência de Shine-
Dalgarno, que apresenta o consenso UAAGGAGG ou AAGGA. A
primeira composição parece ser de 3 a 6 vezes mais eficiente do
que a segunda.
P A
5
3
A G U
O complexo de iniciação se forma
quando o tRNA especial de iniciação, já
aminoacilado, forma pares de base com
o códon de iniciação, trazendo uma
metionina adicionada de um grupamento
formil (F-met), garantindo que o
grupamento amino esteja bloqueado,
direcionando assim a polimerização do
polipeptídeo para o grupo carboxila. O
tRNA específico para iniciação difere dos
outros não somente por trazer uma
metionina formilada mas tambémpor
apresentar três pares GC no braço do
anticódon, e adicionalmente por não
estar pareado nas últimas duas bases do
braço do aminoácido. Somente tRNAs
com essas características são capazes
de entrar diretamente no sítio P do
ribossomo menor; os outros requerem o
complexo já formado para serem
capazes de entrar, e portanto
ínicialmente entram no sítio A para
então, por translocação, entrarem no síto
P.
P A
5
3
5 3
3
5
3
5
F-met
P A S
Em seguida, a subunidade maior junta-se ao
complexo já formado, dando continuidade à
síntese. Os fatores IF-1, IF-2 e IF-3 obtém
energia a partir da queima de GTP para
promover as movimentações das unidades,
bem como as próprias ligações.
Três fatores de iniciação participam do processo:
IF-1, IF-2 e IF-3. IF-3 é o primeiro a atuar, ligando-se
à subunidade menor e impedindo a ligação
prematura da subunidade maior. Em seguida, IF-1 e
IF-2 atuam, impedindo a ligação prematura de
tRNAs ao sítio A (IF-1) e facilitando a ligação do
tRNA de iniciação (IF-2). Ao final da iniciação, os
três fatores são liberados.
O espaçamento entre a seqüência Shine-
Dalgarno e o códon varia de 5 a 13, com o
ótimo em torno de 6-7.
4: TRADUÇÃO– 76
5 3
A SÍNTESE PROTÉICA – VÁRIAS TRANSLOCAÇÕES ATÉ A FINALIZAÇÃO
5 3
5 3
5 3
5 3
5 3
5 3
5 3
F-
met
F-
met
F-
met
F-
met
F-
met
F-
met
Uma vez que o códon de iniciação tenha sido encontrado e que o tRNA aminoacilado especial de iniciação, carregando a metionina com o
grupamento formil, esteja no sítio P, um novo tRNA entra no sítio A.
No segundo passo, há a formação de uma ligação peptídica
entre o primeiro e o segundo aminoácido, ainda enquanto este
último está ligado ao tRNA. A enzima responsável pela ligação
era denominada peptidil transferase, mas há também
indicações mais recentes de que esta função é exercida pela
unidade 23S do próprio ribossomo, em mais um exemplo de
ação catalítica de RNA. O local exato é hoje denominado PTC
(peptidyl transferase center), e os últimos estudos confirmam
a ação de peptidil transferase como uma enzima de RNA
(ribozima). A desacilase quebra a ligação entre o tRNA e o
aminoácido.
A finalização da cadeia ocorre quando o sítio A penetra em
um códon finalizador UAA, UAG ou UGA. Não há moléculas de
tRNA com anticódons capazes de parear com os códons de
finalização. Um fator de liberação, RF1 ou RF2, dependendo
do códon presente (RF1: UAA, UAG; RF2: UAA, UGA), entra
no sítio A e cliva o polipeptídeo completo a partir do tRNA
final. Um terceiro fator de liberação, RF3, desempenha papel
auxiliar no processo.
O terceiro passo compreende a translocação do sítio P para o
sítio S, por onde o tRNA descarregado deixa o complexo. Um
novo tRNA carregado entre pelo sítio A, dando continuidade
ao processo. O fator EF-G facilita a translocação do
complexo. Nos procariontes, a velocidade de adição de
aminoácidos à cadeia pode ser de até 20 por segundo; essa
taxa parece ser dez vezes menor em eucariontes.
Acredita-se que efetivamente a subunidade maior mova-se
antes, posicionando o tRNA desacilado no sítio S, que é
domínio exclusivo dessa subunidade. Em seguida, a
subunidade menor se move, ejetando o tRNA, já que ele está
fora do domínio P da subunidade menor.
Algumas observações mais recentes podem indicar que, de
fato, seria o mRNA que se moveria, e não o ribossomo, mas
isto ainda carece de mais fundamentação.
F-
met
F-
met
Esse segundo aminoacil-tRNA está ligado ao fator EF-Tu e a
um GTP; o GTP é hidrolisado, fornecendo assim energia para
uma ligação peptídica.
O processo se repete consecutivamente, enquanto houver
códons com significado no mRNA. Os passos são sempre os
mesmos: desacilação do tRNA, formação de ligação peptídica,
e translocação do ribossomo.
A ligação dos RF ao ribossomo altera a atividade da peptidil-
transferase, de tal forma que uma molécula de água, e não um
aminoácido, seja adicionada à cadeia, formando assim o
terminal aa-COOH do polipeptídeo.
O ribossomo libera o polipeptídeo e posteriormente libera
também o mRNA e se dissocia nas subunidades 30S e 50S, as
quais podem posteriormente ser reutilizadas na síntese
protéica.
Alguns inibidores que bloqueiam a síntese de proteínas:
Estreptomicina – Evita que o tRNA iniciador penetre no sítio P
Quiromicina – Liga-se a EF-Tu
Cloranfenicol – Inibe a peptidil-transferase
Tioestreptona – Liga-se a EF-G e evita a translocação
4: TRADUÇÃO– 77
eIF4B – facilita o
scaneamento do mRNA
eIF4A, com atividade de helicase, remove
as estruturas
TRADUÇÃO EM EUCARIONTES - PARTICULARIDADES
O início da tradução em eucariontes se dá essencialmente da mesma forma que em procariontes, com diferenças nos fatores que participam e pela ausência
da seqüência de Shine-Dalgarno. Esta seqüência, em procariontes, posiciona o ribossomo no códon inicial; em eucariontes, a subunidade pequena do
ribossomo (40S) reconhece o quepe (7-metilguanina) na extremidade 5’ e a partir daí se move até alcançar um códon iniciador, que pode ou não ser a
primeira trinca AUG. Muitos mRNAs de eucariontes contém uma seqüência de reconhecimento ao redor da trinca AUG inicial: 5´- ACCAUGG-3´.
Denominada seqüência Kozak, em homenagem a Marilyn Kozak, que a descobriu, parece funcionar como a seqüência Shine-Dalgarno, no sentido de
sinalizar que a trinca inicial foi localizada. Note, no entanto, que essa seqüência não tem a mesma função de Shine-Dalgarno no sentido de formar uma
ligação entre o ribossomo e o mRNA.
Uma outra diferença importante é que a cauda poli-A também está envolvida na iniciação da tradução. Presume-se que as proteínas que interagem com o
quepe também interajam com a cauda, aumentando, dessa forma, os níveis de tradução. Como as duas estruturas (quepe e cauda) estão situadas em
posições extremas no mRNA, muitas vezes bastante distantes, é provável que o RNA se dobre durante o processo, para dar permissão física a essas
interações. Muito pouco ainda é sabido com relação a esse processo e como ele afeta a tradução e particularmente a formação dos polissomos, já que fica
difícil conceber como é que, fisicamente, um complexo tão volumoso possa se formar. Como alguns mRNAs eucarióticos contém sítios internos de
entrada de ribossomos (IRES – internal ribosome entry site), é possível que os mesmos auxiliem nesse processo, em alguns casos, permitindo que, uma
vez iniciada a primeira rodada de tradução, as traduções posteriores se iniciem a partir do IRES.
Outras diferenças entre a tradução em procariontes e eucariontes incluem: (i) o tRNA transporta uma metionina não modificada; (ii) o início da
tradução requer muito mais fatores; (iii) a iniciação requer energia fornecida por ATP para construir o complexo e escanear o mRNA; e (iv) a
finalização da tradução requer a hidrólise de GTP, não necessária em E. coli.
5´
AUG (início) ............. UAA (fim) A A A A A A A A A A A A A A
5´A A A A A A A A A A A A Proteína de ligação à
cauda poli-A (PAB)
A ligação entre as proteínas de
reconhecimento do quepe e da
cauda acentuariam a ligação da
subunidade menor do ribossomo
à extremidade 5´, e a partir daí a
mesma escanearia o DNA à
procura da seqüência de Kozak e
do primeiro códon de iniciação
Alguns mRNA eucarióticos
possuem seqüências internas de
entrada de ribossomos, o que
poderia alterar este modelo, no
sentido que os ribossomos
poderiam se ligar diretamente,
sem primeiro se ligar ao quepe
Fatores protcos requeridos para a iniciação da tradução em procariontes
IF-1 Previne a ligação prematura dos tRNAs ao sítio A
IF-2 Facilita a ligação do fMet -tRNA à subunidade 30S do ribossomo
IF-3
Liga-se à subunidade 30S, previnindo a associação pre matura da subunidade 50S; também aumenta a
especificidade do sítio P por fMet -tRNA
Fatores protéicos requeridos para a iniciação da tradução em eucariontes
eIF2 Facilita a ligação do Met -tRNA iniciante à subunidade 40S
eIF2B,
eIF3
Primeiros fatores a se unirem à subunidade 40S, facilitando os passos subsequentes
eIF4A
Atividade de RNA helicase remove estruturas secuntárias no mRNA, permitindo ligação da subunidade 40S;
parte do complexo eIF4F
eIF4B Liga-se ao mRNA, facilitando o scanning deste para a l ocalização da primeira trinca AUG
eIF4E Liga-se ao quepe 5’ do mRNA; parte do complexo eIF4F
eIF4G Liga-se a eIF4F e à proteína de ligação a poli -A (PAB); parte do complexo eIF4F
eIF5
Promove a dissociação de vários outros fatores de iniciação da subuni dade 40S, permitindo o acesso da
subunidade 60S
eIF6 Facilita a dissociação das unidades 80S inativas nos subcomponentes 40S e 60S
Fatores protcos requeridos para a iniciação da tradução em procariontes
IF-1 Previne a ligação prematura dos tRNAs ao sítio A
IF-2 Facilita a ligação do fMet -tRNA à subunidade 30S do ribossomo
IF-3
Liga-se à subunidade 30S, previnindo a associação pre matura da subunidade 50S; também aumenta a
especificidade do sítio P por fMet -tRNA
Fatores protéicos requeridos para a iniciação da tradução em eucariontes
eIF2 Facilita a ligação do Met -tRNA iniciante à subunidade 40S
eIF2B,
eIF3
Primeiros fatores a se unirem à subunidade 40S, facilitando os passos subsequentes
eIF4A
Atividade de RNA helicase remove estruturas secuntárias no mRNA, permitindo ligação da subunidade 40S;
parte do complexo eIF4F
eIF4B Liga-se ao mRNA, facilitando o scanning deste para a l ocalização da primeira trinca AUG
eIF4E Liga-se ao quepe 5’ do mRNA; parte do complexo eIF4F
eIF4G Liga-se a eIF4F e à proteína de ligação a poli -A (PAB); parte do complexo eIF4F
eIF5
Promove a dissociação de vários outros fatores de iniciação da subuni dade 40S, permitindo o acesso da
subunidade 60S
eIF6 Facilita a dissociação das unidades 80S inativas nos subcomponentes 40S e 60S
eIF4E – proteína de
ligação ao quepe
eIF4G – proteína
conectante entre eIF4E
e poli-A PAB
eIF4B – facilita o
scaneamento do mRNA
5´
AUG (início) ............. UAA (fim) A A A A A A A A A A A A A A
Nesta região, pode ocorrer a ligação de proteínas
que interagem com outros fatores de iniciação
da tradução já ligados ao mRNA, ou mesmo com
a subunidade pequena do ribossomo (40S),
previnindo a tradução
SEQÜÊNCIAS NÃO TRADUZIDAS (UTR) NO INÍCIO E NO FINAL DO mRNA
As seqüências não traduzidas (UTR) no início e no final do gene desempenham papel importante no controle da expressão. A seqüência 5´
contém o quepe e mais um segmento (UTR) que pode formar estruturas secundárias que deverão ser desfeitas antes do início do escaneamento
do RNA. A seqüência 3´ contém, além da cauda, segmentos (UTR) que servem de ligação para proteínas implicadas na regulação gênica.
Estruturas secundárias podem se
formar na 5´UTR
Quepe 5´-UTR Região do gene 3´-UTR Cauda de poli-A
Quepe 5´-UTR Região do gene 3´-UTR Cauda de poli-A
Subunidade
menor
4: TRADUÇÃO– 78
Após algumas translocações, o início do mRNA
encontra-se livre e pode ser novamente traduzido,
resultando em um polissomo, um mRNA que está sendo
traduzido por inúmeros ribossomos de uma só vez. Isto
ocorre tanto em procariontes quanto em eucariontes.
TRADUÇÃO SIMULTÂNEA DE UMA MESMA MENSAGEM POR VÁRIOS RIBOSSOMOS
EM PROCARIONTES E EUCARIONTES
ACOPLAMENTO DA TRANSCRIÇÃO E DA TRADUÇÃO EM PROCARIONTES
O mRNA de procariontes pode ser traduzido por
ribossomos enquanto ainda está sendo transcrito do DNA
pela RNA polimerase. Isto é possível porque o mRNA de
procariontes não sofre processamentos e nem precisa ser
transportado do núcleo para o citoplasma antes de
encontrar ribossomos livres, como ocorre em
eucariontes. A degradacao dos mRNAs de procariontes
tambem e retardada por este processo, ja que os
ribossomos que se ligam ao mRNA nascente o protegem
das RNAses.
5´
3´
EUCARIONTES PROCARIONTES
3´
5´
Note que os polipeptídeos se
tornam progressivamente maiores
à medida em que os ribossomos
se aproximam da extremidade 3´
do mRNA
DIREÇÃO DA TRADUÇÃO
PRÍONS: PROTEÍNAS INFECCIOSAS COM “CARA” DE MATERIAL GENÉTICO
Stanley B. Prusiner recebeu o Prêmio Nobel de Medicina de 1997 pela suas pesquisas, iniciadas em 1972, com “Príons”, que são proteínas com capacidade
infecciosa, causadoras de doenças. A partir de seu trabalho, os príons foram incluídos, juntamente com bactérias, vírus, fungos e parasitas, como agentes
causativos de doenças. Os príons existem normalmente como proteínas inócuas, mas têm uma capacidade inata de converter suas estrutura em
conformações altamente estáveis, responsáveis pela formação de partículas danosas, causativas de várias doenças do tipo demência em humanos e animais,
incluindo a famosa “doença da vaca louca”. Desnecessário dizer que a comunidade científica mostrou-se muito cética em relação aos príons,
particularmente porque ficou demonstrado que eles podem ser herdados e transmitidos, e no entanto não são constituídos pelo material genético
convencional (DNA ou RNA). Em 1984, sondas já foram desenhadas para localizar o gene responsável pelos príons, que foram encontrados em todos os
animais testados, inclusive no homem. Estudos posteriores demonstraram que os príons, após adquirirem a conformação adequada, passam a ter
propriedades infecciosas que podem iniciar uma reação em cadeia que converte outras proteínas que, quando acumuladas em alta quantidade, podem
causar doenças cerebrais. Um dos problemas é que o sistema imune não responde aos príons, já que eles são proteínas naturais. Dentre as doenças animais
já atribuídas a príons encontram-se Scrapie, em ovinos, e Encefalite esponjosa em bovinos (doença da vaca louca). Em humanos, Kuru, doença de
Gertsmann-Sträussler-Scheinker (GSS), Fatal Familial Insomnia (FFI) e Creutzfeldt-Jakob Disease (CJD) são também atribuídas a príons.
4: TRADUÇÃO– 79
UNIDADE 5
O controle da expressão gênica
OBJETIVO
Demonstrar a necessidade do controle da expressão gênica como uma resposta a mudanças no ambiente e como parte do processo de desenvolvimento
dos organismos, e comentar sobre os principais mecanismos envolvidos no controle da expressão gênica.
CONTEÚDO
Controle da expressão gênica e do ciclo celular
Porque controlar a expressão gênica
Estratégias de controle da expressão gênica
Regulação gênica durante o desenvolvimento
GUIA DE ESTUDOS
Oque é controlar a expressão gênica? É DECIDIR SE:
o Um gene vai ser transcrito ou não, e em que nível; OU: Um determinado mRNA é traduzido ou não, e em
que nível.
ISTO PARA UMA DETERMINADA CÉLULA E/OU UM DETERMINADO MOMENTO
Quem toma a decisão, e como ela é tomada?
o Primeiro, alguns genes não são regulados, ou são muito pouco
o Segundo, alguns genes precisam ser “empurrados” – induz a transcrição/tradução
o Terceiro, alguns genes precisam ser “segurados” – reprime a transcrição/tradução
NO FUNDO, SÃO MOLÉCULAS DE LIGAÇÃO AO DNA/RNA QUE ATIVAM OU DESATIVAM O
PROCESSO. QUEM SÃO ELAS? OS ATIVADORES, TRANSATIVADORES REPRESSORES, FATORES DE
TRANSCRIÇÃO, ... (Lembrem dos “motivos” de ligação)
Regulação positiva e regulação negativa – ver o “modelo geral”
Em que tipos de situação pode ocorrer a regulação (isto é, o desdobramento do “modelo geral”)?
o 1. um substrato está disponível para ser usado, e então induz a expressão de genes para enzimas que
possam utilizá-lo (ex. lactose)
o 2. um substrato “melhor” está disponível para ser usado, e reprime a utilização do substrato “pior” (ex.
glicose versus lactose)
o 3. uma determinada molécula é produzida, atinge os níveis que são necessários na célula, e então envia
um sinal dizendo: “não precisa mais me fazer...” (ex. um amino-ácido)
o 4. uma célula tenta traduzir um mRNA mas não consegue por falta de amino-ácidos no meio, e então
manda uma mensagem dizendo: “não há amino-ácidos disponíveis para traduzir a mensagem, não a faça”
o 5. para fazer um conjunto (ex. os ribossomos) precisam-se de 1 unidade de cada a, b e c; se fizer 1.000
de a e somente 1 de b e c, sobram 999 destes dois últimos, então mande um sinal dizendo: “não faça mais
a”; ou melhor ainda, regule de tal forma que a síntese de a, b e c seja coordenada
o 6. há erros ocorrendo na replicação do DNA, envie enzimas SOS para reparar os erros
o 7. há muita necessidade de uma determinada proteína, então aumente o número de duplas-hélices de
DNA na região contendo o gene para esta proteína
o 8. a célula está se intoxicando com um metal pesado, e esse mesmo metal aumenta a transcrição de genes
para proteínas que irão seqüestrá-lo do meio, detoxificando as células
o 9. como fazer com que este ovo de Drosophila recém posto se transforme em uma linda (linda???) mosca
das frutas?
Genes maternais estabelecem gradientes; cada gene produz fatores de transcrição que irão ativar
outros genes que produzem outros fatores que ativam outros genes que produzem outros
fatores que ativam outros genes (...)que produzem outros fatores que fazem algo importante
além de ativar outros genes... (exemplos Bicoid e Nanos controlam Caudal, Pumilio e
Hunchback...)
Genes de segmentação: estabelecem os segmentos (ex. Fushi-tarazu) – mesma situação acima
5: CONTROLE DA EXPRESSÃO– 80
Porque controlar a expressão gênica
De todos os genes de um organismo, apenas uma fração é expressa em um determinado
momento. Alguns genes são expressos mais freqüentemente ou em maior intensidade, por
exemplo aqueles responsáveis pelos fatores de transcrição do DNA e o gene que codifica
para a enzima rubisco (ribulose 1,5-bisfosfato carboxilase-oxigenase) em plantas. Outros
são expressos menos freqüentemente, por exemplo genes para enzimas que promovem o
reparo de lesões raras do DNA. Em muitos casos, a necessidade por uma determinada
molécula modifica-se conforme o ambiente, ou na medida em que as fontes de alimento se
alteram. Outras importantes fontes de regulação estão relacionadas com as fases de
desenvolvimento de um organismo multicelular, onde certas proteínas que influenciam a
diferenciação celular podem estar presentes por apenas alguns instantes em determinados
tecidos, e com a especialização celular, caso em que apenas algumas células expressam
altas quantidades de determinados produtos.
O controle da regulação gênica em qualquer organismo pode ocorrer em diferentes níveis,
desde a taxa de acesso ao DNA e de transcrição de um determinado gene, até eventos que
influenciam o direcionamento do produto gênico para o local onde poderá atuar, passando
por controles pós-transcricionais tais como processamento e degradação do RNA,
tradução, e processamento pós-tradução de proteínas.
Os mecanismos mais bem estudados e de certa forma mais interessantes e intrigantes situam-se exatamente em nível de regulação da transcrição, particularmente no início do
processo. Através deste tipo de controle, os organismos podem obter, por exemplo a sincronização da expressão de vários genes que codificam para produtos com atividades
interdependentes, como no caso dos genes envolvidos na degradação e utilização de um determinado produto, os quais somente serão transcritos se o produto estiver presente. Neste
caso, a regulação gênica pode ser mediada por proteínas que reagem a sinais do ambiente, detectando a presença do produto a ser utilizado. Os genes podem estar situados em
conglomerados, de tal forma que poderão ser transcritos como um mRNA multigênico.
Genes de manutenção, induzíveis e reprimíveis
Genes com pouca regulação da expressão, por serem utilizados a altas taxas o tempo todo, e em todas as células, são chamados genes de manutenção (housekeeping), e sua
regulação, ou melhor, a ausência da regulação gênica implica uma expressão constitutiva dos mesmos. Genes induzíveis são aqueles cuja transcrição é aumentada sob
circunstâncias particulares, em um processo denominado indução; já genes reprimíveis são aqueles cuja expressão diminui em resposta a estímulo, no processo denominado
repressão.
CONTROLE DA EXPRESSÃO GÊNICA
P
e
rc
e
n
ta
g
e
m
d
a
e
x
p
re
s
s
ã
o
e
m
r
e
la
ç
ã
o
a
o
s
e
lv
a
g
e
m
A importância das regiões regulatórias e sua composição de bases
Uma vez que a transcrição de um gene é mediada pela RNA polimerase ou por enzimas a esta associadas, vale ressaltar a importância das seqüências de ligação do complexo de
transcrição ao DNA. Em muitos casos, a seqüência de nucleotídeos de uma região promotora varia consideravelmente de gene para gene, influenciando a afinidade da RNA polimerase
e assim a freqüência de iniciação da transcrição. As diferenças nas taxas podem ser até da ordem das milhares de vezes. Experimentos com mutações pontuais indicam que há
alterações substanciais na taxa de transcrição quando substituições de nucleotídeos nas regiões promotoras são efetuadas. Por exemplo, na tabela abaixo, observa-se que os mutantes
PlacIq e PlacIal são mais eficientes na promoção da transcrição, quando comparados ao promotor nativo do gene, posto que as seqüências da região –35 são mais próximas do
consenso. Note-se, na mesma tabela, que as seqüências da região –10 dos três promotores divergem bastante da seqüência de consenso TATAAT, o que causa diminuição na
expressão, conforme demonstrado na figura.
0
25
50
75
100
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
Bases na seqüência mutada: C A T G A T
Bases na seqüência consenso: T A T A A T
Seqüências de um tipo selvagem e de dois promotores alternativos
causando aumento na expressão do gene lacI
PROMOTOR REGIÃO –35 ESPAÇADOR REGIÃO -10
PlacI GCGCAA 17 CATGAT
PlacI
q
GTGCAA 17 CATGAT
PlacI
ql
TTGACA 18 CATGAT
Consenso TTGACA 17 TATAAT
Fonte: Schumann e Ferreira, 2004. Genetics and Molecular Biology 27(3): 442-453
Depressão na expressão do óperon da lactose por diferença
na composição de bases da região -10 em comparação com a
seqüência consenso otimizada
O início da transcrição é regulado por proteínas que se ligam no, oupróximo ao, promotor, e pode ser afetado pelos fatores de especificidade, tais como o fator sigma de E. coli, ou
outros fatores chamados de repressores ou ativadores da transcrição. Em E. coli, muitos dos promotores são reconhecidos pelo fator sigma-70, mas sob certas condições, por exemplo
estresse de temperatura, outros fatores como o sigma-32 podem assumir o papel de reconhecimento.
+
Seria interessante que fossem também examinados alguns aspectos referentes a interações críticas, em
nível molecular, entre o DNA e as proteínas que se ligam a ele para ativar ou reprimir a expressão. As
proteínas regulatórias têm uma afinidade 104 a 106 vezes maior pelas seqüências regulatórias, sejam
promotores, operadores ou outras. Para tanto, elas devem ser capazes de reconhecer, em nível molecular, o
DNA, particularmente setores das bases ligados a pontes de H ou a grupamentos metil. Nas proteínas
regulatórias, os resíduos mais comumente envolvidos em reconhecimento são asparagina, glutamina,
glicina, lisina e arginina.
Assim, quando a RNA polimerase contém o fator sigma-32
ao invés do sigma-70, ela será direcionada para um
conjunto de genes com um promotor bastante diferente.
Além desses fatores sigma, há muitos outros; por exemplo,
em Bacilus subtilis as seguintes variantes são encontradas,
as quais reconhecem seqüências diferentes:
28: CCGATAT 29: CATATT
32: TA*TGTT*TA 37: GC*ATTG*T
43: TATAAT
CROMOSSOMO
GENE A SER TRANSCRITO
mRNA PRIMÁRIO
mRNA PROCESSADO
TRADUÇÃO
DEGRADAÇÃO
PROCESSAMENTO
DAS PROTEÍNAS
5: CONTROLE DA EXPRESSÃO– 81
ESTRUTURA E DOMÍNIOS COMUNS EM PROTEÍNAS REGULATÓRIAS
Motivos mais comuns nos transativadores
Os transativadores tipicamente possuem um domínio para ligação ao DNA, e um ou mais para
ativação da transcrição ou para interação com outras proteínas. Além dos motivos zipper de
leucina e hélice-alça-hélice, três outros motivos são importantes. Eles incluem o domínio ácido de
Gal4p, uma estrutura semelhante ao dedo de zinco, na qual seis resíduos de leucina coordenam
dois Zn. A proteína Sp1 possui um domínio rico em glutamina, que se liga ao GC boxe. O fator
CTF1 (CCAAT-binding transcription factor 1) possui um domínio rico em prolina.
O DEDO DE ZINCO consiste em uma
seqüência de cerca de 30 aminoácidos, quatro
dos quais coordenam um íon Zn, este não
diretamente envolvido no reconhecimento mas
servindo como estabilizador da estrutura. A
maioria das proteínas que contém dedo de
zinco apresentam várias repetições desse
motivo; cada dedo se ajusta no sulco maior do
DNA e forma pontes de H com as bases
reconhecidas.
No motivo HÉLICE-GIRO-HÉLICE (H-G-H), comum em
muitas proteínas regulatórias bacterianas, com motivos
correlatos em proteínas eucarióticas, tem-se cerca de 20
aminoácidos, em dois segmentos de alfa-hélice separados
por um giro beta. Um dos dois segmentos da hélice, o de
reconhecimento, contém muitos dos aminoácidos que
irão interagir com o DNA, e geralmente se sobressai na
proteína. A hélice de reconhecimento, quando ligada ao
DNA, está posicionada próxima ou mesmo dentro do sulco
maior. A outra hélice faz a dimerização entre as
subunidades que compõem um dímero.
No motivo ZIPPER DE LEUCINA,
encontrado em fatores de
transcrição eucarióticos, uma alfa-
hélice apresenta uma série de
resíduos de aminoácidos
hidrofóbicos em um lado, o qual
forma uma área de contato entre
dois polipeptídeos de um dímero
(dimerização). Nessas hélices, um
resíduo de leucina ocorre a cada
sete aminoácidos. Uma outra série
de aminoácidos básicos, em um
braço, forma contato com o DNA
(reconhecimento).
O motivo HÉLICE-ALÇA-HÉLICE (H-A-
H), comum em proteínas eucarióticas,
consiste em duas hélices alfa separadas
por uma alça, e também é comum em
proteínas que funcionam como dímeros.
Uma das alças de cada unidade auxilia
na dimerização, enquanto que um
conjunto de aminoácidos altamente
básicos da outra faz contato com o DNA
(reconhecimento) no sulco maior.
Os HOMEODOMÍNIOS, uma classe especial, têm
sido encontrados freqüentemente em proteínas
regulatórias do desenvolvimento em eucariontes.
O domínio é altamente conservado em uma
variedade de organismos, e consiste em três
hélices alfa, uma delas fazendo contato com o
DNA (reconhecimento); esse segmento
apresenta um motivo semelhante ao de hélice-
giro-hélice, e se liga na região chamada de
homeobox no sulco maior.
O motivo RECEPTOR DE ESTERÓIDE,
exclusivo de proteínas eucarióticas, tem
duas hélices alfa, cada uma com um íon Zn
circundado por quatro cisteínas, e
separadas por um segmento protéico. As
duas hélices são perpendiculares entre si,
sendo que uma se ajusta dentro do sulco
do DNA (reconhecimento) enquanto que a
outra permanece externa, paralela ao DNA.
Hélice de
reconhecimento
do DNA
Hélices de
dimerização
Giro
Um dímero
Ìon zinco
Três dedos de zinco
Alfa hélices
Leucinas
Um dímero
Um dímero
Alfa hélices
Hélice perpendicular
ao DNA
Hélices de contato com o DNA
Um dímero
Hélice de contato com
o DNA
Hélice de reconhecimento do
sulco maior
Duas proteínas com o motivo receptor de esteróides
5: CONTROLE DA EXPRESSÃO– 82
A/R simboliza o gene de produção da
proteína regulatória, seja ela um repressor
ou um ativador; esse gene tem regiões
promotoras próprias, e geralmente é
transcrito em níveis basais. As proteínas
regulatórias apresentam plasticidade,
podendo ser ligadas ou desligadas do DNA
de acordo com moléculas que a elas se
ligam, alterando sua conformação.
O ativador é uma região do DNA que
antecede o promotor, sendo o sítio de
ligação de proteínas que ativam a RNA
polimerase; geralmente muito importante
para genes cujos promotores são “fracos”,
ou seja, têm pouca afinidade pela RNA
polimerase.
O operador é geralmente uma seqüência
curta, localizada dentro do próprio promotor,
que é reconhecida pela proteína repressora;
se a proteína estiver ligada ao DNA, ela
impedirá a transcrição do gene. Em geral,
os operadores são palíndromes que
permitem a formação de uma estrutura
cruciforme.
Além das seqüências regulatórias mais comuns, os promotores, existem outras que
controlam a expressâo gênica. Os repressores se ligam a sítios específicos do DNA, os
operadores, causando uma regulação negativa da expressão. Resultado oposto é obtido na
regulação positiva, através dos ativadores. Em geral uma molécula intermediária,
denominada effector, media o controle.
Os operadores são descritos como uma seqüência palindrômica, localizada no final proximal
de um óperon, e que permite a formação de uma estrutura cruciforme. O operador é o sítio
de reconhecimento para uma proteína específica, o repressor, e controla a expressão dos
cistrons adjacentes.
Na regulação gênica exercida nos “óperons”, que podem ser descritos como uma unidade de
cístrons (genes) adjacentes, a expressão está sob o controle de um operador e de um
repressor comuns, sendo produzida uma única mensagem policistrônica.
-35 -10
TTGACA TATAAT
Região -35 Pribnow box
Início da
transcrição
Fita
codificante
Genes
-75 -25GGXCAATCT TATAAA
CAAT box TATA box
OS PROMOTORES DE
GENES PROCARIOTOS (ACIMA) E GENES EUCARIOTOS
(ABAIXO)
REGULAÇÃO POSITIVA E REGULAÇÃO NEGATIVA – SINOPSE
REGULAÇÃO NEGATIVA
O REPRESSOR LIGADO INIBE A TRANSCRIÇÃO
REGULAÇÃO POSITIVA
O ATIVADOR LIGADO FACILITA A TRANSCRIÇÃO
O
S
IN
A
L
M
O
L
E
C
U
L
A
R
C
A
U
S
A
A
D
IS
S
O
C
IA
Ç
Ã
O
D
A
P
R
O
T
E
ÍN
A
R
E
G
U
L
A
T
Ó
R
IA
.
O
S
IN
A
L
M
O
L
E
C
U
L
A
R
C
A
U
S
A
A
A
S
S
O
C
IA
Ç
Ã
O
D
A
P
R
O
T
E
ÍN
A
R
E
G
U
L
A
T
Ó
R
IA
.
Operador Promotor Ativador A/R Gene 1 Gene 3 Gene 2
5: CONTROLE DA EXPRESSÃO– 83
REGULAÇÃO POSITIVA E REGULAÇÃO NEGATIVA – MODELO GERAL
O
S
IN
A
L
M
O
L
E
C
U
L
A
R
C
A
U
S
A
A
D
IS
S
O
C
IA
Ç
Ã
O
D
A
P
R
O
T
E
ÍN
A
R
E
G
U
L
A
T
Ó
R
IA
.
N
E
S
T
E
C
A
S
O
,
A
P
R
O
T
E
ÍN
A
J
Á
“
N
A
S
C
E
”
C
O
M
A
L
T
A
A
F
IN
ID
A
D
E
P
E
L
O
D
N
A
,
E
S
Ó
N
Ã
O
S
E
L
IG
A
S
E
F
O
R
M
O
D
IF
IC
A
D
A
P
E
L
O
S
IN
A
L
M
O
L
E
C
U
L
A
R
.
O
S
IN
A
L
M
O
L
E
C
U
L
A
R
C
A
U
S
A
A
A
S
S
O
C
IA
Ç
Ã
O
D
A
P
R
O
T
E
ÍN
A
R
E
G
U
L
A
T
Ó
R
IA
.
N
E
S
T
E
C
A
S
O
,
A
P
R
O
T
E
ÍN
A
N
A
T
IV
A
T
E
M
B
A
IX
A
A
F
IN
ID
A
D
E
P
E
L
O
D
N
A
E
N
Ã
O
S
E
L
IG
A
A
N
Ã
O
S
E
R
S
E
M
O
D
IF
IC
A
D
A
P
E
L
O
S
IN
A
L
M
O
L
E
C
U
L
A
R
.
REGULAÇÃO NEGATIVA
O REPRESSOR LIGADO INIBE A TRANSCRIÇÃO
Neste modelo, é produzida uma molécula repressora que, quando “certa”, irá se ligar
ao operador, impedindo a transcrição. Isto é o que define “regulação negativa”. A
molécula pode já ter naturalmente uma alta afinidade pelo DNA do operador assim
que produzida, ou pode ter que ser induzida a ter afinidade. O “sinal molecular”
(indutor), que pode ser qualquer molécula que se ligue ao repressor, tem a
capacidade de causar modificações conformacionais que aumentam ou diminuem a
afinidade pelo operador.
REGULAÇÃO POSITIVA
O ATIVADOR LIGADO FACILITA A TRANSCRIÇÃO
Neste modelo, é produzida uma molécula ativadora que, quando “certa”, irá se
ligar ao ativador, promovendo a transcrição. Isto é o que define “regulação
positiva”. A molécula pode já ter naturalmente uma alta afinidade pelo DNA
do ativador ou pode ter que ser induzida a ter afinidade. O “sinal molecular”,
que pode ser qualquer molécula que se ligue à proteína ativadora, tem a
capacidade de causar modificações conformacionais que aumentam ou
diminuem a afinidade pela seqüência ativadora.
Sem sinal
Com sinal
Sem sinal
Com sinal
Operador Promotor R
5´
x
Operador Promotor R
O repressor é produzido
na forma ativa e tem alta
afinidade pelo operador A RNA polimerase não se
liga ao promotor porque o
repressor está ligado
O repressor, produzido na
forma ativa, é agora
inativado pelo sinal
molecular
O repressor não se
liga mais ao operador
porque foi modificado
pelo o sinal molecular
Abaixo estão representados alguns modelos envolvendo repressores e ativadores da transcrição. Note que o repressor ou o ativador não necessariamente fazem parte do
conjunto gênico regulado; eles podem ser, como é comum, moléculas produzidas por outros genes. Outro ponto importante é que, apesar dos esquemas serem baseados em
óperons, as regulações funcionam tanto para óperons quanto para genes individuais. É comum também haver, no mesmo óperon, tanto o ativador quanto o operador.
A proteína ativadora,
originalmente na forma
ativa, é agora inativada
pelo sinal molecular
Ativador Promotor A
Ativador Promotor A
5´
A proteína ativadora é
produzida na forma ativa
e tem alta afinidade pelo
DNA do ativador A RNA polimerase é
induzida a transcrever, por
força da proteína ativadora
ligada ao sítio antecedente
Sem a proteína ativadora ligada ao sítio
ativador, a RNA polimerase não é
induzida a transcrever
x
Ativador Promotor A
5´
Ativador Promotor A
A proteína ativadora é
produzida na forma
inativa e não tem
afinidade pelo DNA do
ativador
Sem a proteína ativadora ligada ao sítio
ativador, a RNA polimerase não é
induzida a transcrever
A proteína ativadora,
produzida originalmente na
forma inativa, é agora
ativada pelo sinal molecular
Com a proteína ativadora ativada
pelo sinal e ligada ao sítio ativador, a
RNA polimerase é induzida a
transcrever
x
Operador Promotor R
A RNA polimerase não
se liga mais ao
promotor porque o
repressor foi
modificado e agora se
liga ao operador
Operador Promotor R
5´
O repressor é
produzido na forma
inativa e não tem
afinidade pelo
operador
A RNA polimerase
pode se ligar ao
promotor porque o
repressor não se liga
ao operador
O repressor,
produzido na forma
inativa, é agora
ativado pelo sinal x
5: CONTROLE DA EXPRESSÃO– 84
O ÓPERON DA LACTOSE
Um óperon pode ser descrito como uma unidade de cistrons adjacentes cuja expressão está sob o controle de uma região comum (por exemplo, um promotor e um operador; ou um ativador e um
promotor; ou um ativador, um promotor e um operador) e leva à síntese de um mRNA policistrônico único; os genes que compõe um óperon codificam para proteínas funcionalmente relacionadas,
que participam de uma mesma rota metabólica. Os óperons representam um mecanismo evolucionário muito comum em procariontes, que permitem a máxima utilização de seus genomas
limitados, bem como uma economia considerável de energia, uma vez que os genes controlados são expressos apenas quando necessários, e de forma coordenada, ou seja, na quantidade
adequada em que cada um é necessário. Por exemplo, se para fazer uma determinada molécula são requeridas três enzimas na proporção 1:1:1, o mais lógico para o organismo é ligar um
comando que induza à produção conjunta das enzimas; o mesmo é válido para enzimas envolvidas no catabolismo de produtos, por exemplo na utilização da lactose por bactérias.
Este, por sinal, foi o primeiro óperon a ser descoberto, em 1960, por Jacques e Monod, do Instituto Pasteur, na França, e é um óperon bastante bem estudado. Eles propuseram que seqüências de
DNA fora da região codificante respondem por sinais moleculares de genes “operadores”, sinais esses que ligam/desligam genes (Jacob, F. et al. 1960. L´operon: groupe de genes a l´expression
coordenne par un operateur. Comptes rendus de l´Académie des Sciences 245:1727-1729).
O óperon da lactose engloba genes envolvidos na degradação da lactose para utilização como fonte energética por bactérias. Esse óperon contém três genes: lacZ, para beta-galactosidase, lacY
para galactosidase permease, e lacA paratiogalactosidase transacetilase; o óperon é traduzido como um policístron, e cada gene é precedido por sítios de ligação de ribossomos, que
independentemente direcionam a tradução. Além desses genes, chamados “estruturais”, o óperon contém ainda um gene “regulatório”, lacI, e uma região ativadora.
Organização do DNA do óperon da lactose em procariontes
mRNA
Beta-galactosidase
Permease
Transacetilase
Enzimas
Lactose fora da célula Lactose dentro da célula
Permease Galactose
+
Glucose
Galactosidase
Transacetilase
O metabolismo da lactose em procariontes
O óperon da lactose apresenta dois tipos de regulação: negativa e positiva. Na regulação negativa,
o gene I continuamente sintetiza o repressor, que se liga à região do operador, bloqueando a RNA
polimerase ligada à região promotora e impedindo a transcrição dos genes estruturais adjacentes.
Quando a lactose está presente, as poucas moléculas sintetizadas, isto é, aquelas que “escaparam”
da repressão, transformam a lactose em alolactose, e esta se liga ao repressor modificando sua
anatomia, de tal forma que o repressor não mais se liga ao operador, e a RNA polimerase pode
transcrever os genes Z, Y e A, responsáveis pela utilização da lactose pela bactéria. Dentro do
quadro esquemático apresentado, essa regulação encaixa-se no modelo de regulação negativa
onde a molécula repressora tem alta afinidade pelo DNA assim que produzida, conforme o esquema
ao lado.
Regulação negativa do óperon da lactose
x
Sem
sinal
O repressor é produzido na
forma ativa e tem alta afinidade
pelo operador
A RNA polimerase não
se liga ao promotor
porque o repressor
está ligado
Operador Promotor R
Sem lactose
Note que o “sinal”, neste caso, é a própria lactose. Como se trata de um
óperon de degradação de um produto para utilização pela célula, é lógico
utilizar esse produto como o sinalizador para a expressão dos genes de
degradação do mesmo.
Com lactose
O repressor tem alta afinidade pelo
operador, e se liga assim que produzido,
impedindo a expressão dos genes lacZ,
lacY e lacA.
1. O repressor continua sendo
produzido, já que o seu controle é
independente do restante do óperon.
2. A lactose, agora presente, funciona como um modificador do repressor, mudando sua conformação de tal forma que,
agora, ele não consegue se ligar ao operador. Na verdade, antes de funcionar como o modificador, a lactose é
transformada em alolactose, para então se ligar ao repressor. Essa transformação só é possível pelo mecanismo de
“vazamento”, pelo qual alguns transcritos gênicos são constitutivamente produzidos, mesmo em baixos níveis de
lactose, permitindo assim o funcionamento do sistema.
Lactose
Alolactose
3. A alolactose
reprime o repressor,
4. e a RNA polimerase consegue se ligar, transcrevendo
os três genes de degradação da lactose.
mRNA
Beta-galactosidase
Permease
Transacetilase
Enzimas
l a c Z Operador Promotor l a c I Promotor I l a c Y l a c A Ativador
l a c Z Operador Promotor l a c I Promotor I l a c Y l a c A Ativador
l a c Z Operador Promotor l a c I Promotor I l a c Y l a c A Ativador
5: CONTROLE DA EXPRESSÃO– 85
Na regulação positiva do lac óperon através do mecanismo de repressão catabólita, a expressão dos genes
para utilização da lactose, arabinose e outros açúcares é estimulada na ausência da glicose, o açúcar
“preferido” da E. coli. O efeito da glicose se dá via cAMP e uma proteína receptora do cAMP, a CRP ou CAP
(catabolite activator protein). Neste caso, CRP funciona como o fator ativador, sendo que o sinal molecular, o
cAMP, ativa a transcrição (mas não é capaz de anular o efeito do repressor!). Dentro do nosso esquema
geral, este seria um fenômeno parecido com o demonstrado ao lado, com a ressalva que a proteína
ativadora, no caso CRP, não é produzida pelo óperon.
Quando não há glicose, CRP liga-se a um sítio próximo ao promotor do lac óperon e estimula a transcrição em até 50
vezes, funcionando então como um elemento regulatório positivo. Isto acontece em parte porque o promotor da lactose
é fraco, posto que diverge bastante da seqüência de consenso, e o complexo aberto não ocorre facilmente a não ser
que CRP esteja presente.
Regulação positiva do óperon da lactose
Ativador Promotor A
A proteína ativadora é produzida
na forma inativa e não tem
afinidade pelo DNA do ativador Sem a proteína ativadora ligada
ao sítio ativador, a RNA
polimerase não é induzida a
transcrever
Com lactose e
com glicose
Com lactose e
sem glicose
1. A proteína CAP está “desativada”
porque os níveis de cAMP são baixos,
mRNA
Beta-galactosidase
Permease
Transacetilase
Enzimas
l a c Z Operador Promotor l a c I Promotor I l a c Y l a c A Ativador
2. mas o óperon está desreprimido pela presença da lactose, portanto há
transcrição; no entanto, os níveis de expressão são baixos, já que o
promotor da lactose é fraco.
2. Os níveis de cAMP são altos devido à
ausência da glicose, e a proteína CAP
está ativada, tendo agora afinidade pelo
sítio ativador.
l a c Z Operador Promotor l a c I Promotor I l a c Y l a c A Ativador
3. Com o ativador ligado, a polimerase é induzida a uma maior expressão, e a quantidade de transcritos
é aumentada em até 50 vezes.
mRNA
Beta-galactosidase
Permease
Transacetilase
Enzimas
O efeito da glicose no CRP é mediado por cAMP. CRP tem um sítio de ligação para cAMP, e se liga mais
ativamente ao DNA quando a concentração de cAMP na célula é alta, mas na presença de glicose, a síntese de
cAMP é inibida, ao passo que a saída de cAMP da célula é estimulada. À medida que [cAMP] decresce, também
a ligação de CRP ao DNA decresce, e em conseqüência a expressão do lac óperon diminui. Assim, a indução
forte do óperon requer tanto a presença da lactose (o que inativa o repressor lac) quanto uma diminuição ou a
ausência de glicose (para causar um aumento em [cAMP] e uma maior ligação do cAMP à CRP).
O ÓPERON DO TRIPTOFANO
O óperon da síntese do triptofano é composto por cinco genes, cujos produtos (enzimas) convertem corismato
em triptofano. O óperon é controlado por um repressor que, quando acionado pelo triptofano, se liga ao DNA e
impede sua transcrição; assim, quando o triptofano é abundante nas células, ele não precisa ser sintetizado,
mas quando ele é escasso, a célula precisa promover sua síntese e portanto o repressor não se liga, permitindo
a transcrição e tradução do cístron. Este é um caso típico de regulação negativa, como no caso da lactose, com
a diferença que o repressor não tem afinidade pelo DNA e precisa ser ativado; neste caso, o sinal molecular é o
próprio triptofano, indicando que os níveis presentes na célula são suficientes. Veremos mais tarde que existe
um outro mecanismo de controle deste óperon, chamado de atenuação da transcrição.
Corismato Antranilato P-ribosil-antranilato Enol-C-fenilamino-P Indol-glicerol-P Triptofano
ENZIMAS -> Antranilato sintase Fosfotransferase Isomerase Indol sintase Triptofano sintase
1 2 3 4 5
t r p E t r p D t r p C t r p B t r p A t r p L (Líder) TrpTrp Operador Promotor t r p R
Rota metabólica levando à produção de triptofano em procariontes
Organização do DNA do óperon do triptofano em procariontes
Os cinco genes produzem um mRNA com uma vida extremamente curta, cerca de 3 min., permitindo uma regulação rápida em caso de mudanças no suprimento. Quando o triptofano é
abundante, este se liga ao repressor, mudando sua conformação e permitindoque ele se ligue ao operador, inibindo assim a transcrição do óperon. O sitio para o operador sobrepõe-se
ao promotor, de tal forma que a ligação do repressor pode bloquear a ligação da RNA polimerase. Diferentes concentrações do triptofano podem ocasionar diferenças na taxa de
transcrição de até 700 vezes.
Operador Promotor R
5´
O repressor é produzido na
forma inativa e não tem
afinidade pelo operador
A RNA polimerase pode efetuar
a transcrição porque o repressor
não se liga ao operador
Sem
sinal
1. Na sua forma nativa, a proteína ainda
está desativada.
5: CONTROLE DA EXPRESSÃO– 86
Quando a repressão é inibida, há a transcrição do DNA do óperon, que se inicia com uma proteína-líder codificada pelo gene trpL. O RNA produzido contém quatro seqüências que tem a
particularidade de se parearem duas a duas, da seguinte forma: 1 com 2, 2 com 3 ou 3 com 4. Esses pareamentos formam grampos, e o grampo 3x4, que é seguido por um segmento
rico em Us, é atenuador, no sentido em que abala a ligação da RNA polimerase com o DNA e com o RNA nascente. Essa seqüência-líder existe para permitir um segundo controle da
síntese do triptofano; assim, caso ainda haja triptofano no citosol bacteriano em quantidade insuficiente para ativar o repressor mas suficiente para garantir a síntese protéica, haverá um
encerramento precoce da síntese do mRNA dos genes da via biossintética do triptofano. Na verdade, a bactéria está mensurando a quantidade de tRNAs aminoacilados com triptofano. A
arquitetura da seqüência líder, bem como o mecanismo em si da atenuação, são apresentados nas figuras abaixo.
Sem triptofano O repressor não tem afinidade pelo operador, e portanto não consegue reprimir a
transcrição; os genes para a produção de triptofano são transcritos.
t r p E t r p D t r p C t r p B t r p A t r p L (Líder) TrpTrp Operador Promotor t r p R
Com triptofano
t r p E t r p D t r p C t r p B t r p A t r p L (Líder) TrpTrp Operador Promotor t r p R
1. O repressor, que na sua forma nativa não tem afinidade pelo
operador, agora é modificado pelo triptofano,
2. e se liga
ao operador, 3. impedindo a transcrição pela RNA polimerase e a expressão do óperon.
Regulação negativa do óperon do triptofano
Atenuação da transcrição do óperon do triptofano
Baixa concentração de triptofano
1. Em baixas concentrações de trp, o
ribossomo “pára” nos dois códons
para trp na seqüência 1 porque os trp-
tRNA carregados são raros; a síntese
da proteína líder é lenta.
Alta concentração de triptofano
2. A transcrição continua, a tradução é
lenta, e a seqüência 2 permanece livre,
isto é, não coberta pelo ribossomo,
enquanto a seqüência 3 é sintetizada.
4. A seqüência 4 não se
pareia com a 3 porque
esta já está pareada
com a 2.
1. A presença do triptofano faz com que as
concentrações de trp-tRNA carregados sejam
altas, e a tradução, que está ocorrendo
simultaneamente com a transcrição, procede
rapidamente, passando pelos dois códons de
triptofano; a proteína líder é feita rapidamente.
2. A seqüência 2 agora é
rapidamente coberta pelo
ribossomo assim que
sintetizada.
3. Com a seqüência 2 coberta, a seqüência 3 forma pares de
bases com a 4, criando uma alça de atenuação da transcrição.
Essa alça é seguida por uma região rica em Us, promovendo
assim a desestabilização da RNA polimerase e de sua união
com o DNA que estava sendo transcrito.
4. A polimerase se
dissocia e a síntese pára
em resposta aos mais
altos níveis de triptofano.
4
1
5. A polimerase continua a
síntese, entrando na região
dos genes de síntese do
triptofano, que serão
transcritos e traduzidos,
para que a célula produza
triptofano.
1
1 2 3 4
AAGUUCACGUAAAAAGGGUAUCGACAAUGAAAGCAAUUUUCGUACUGAAAGGUUGGUGGCGCACUUCCUGAAACGGGCAGUGUAUUCACCAUGCGUAAAGCAAUCAGAUACCCAGCCCGCCUAAUGAGCGGGCUUUUUUUUGAACAAAAUUAGAGAAUAACATrpE...
123456789012345678901234567890123456789012345678901234567890123456789012345678901234567890123456789012345678901234567890123456789012345678901234567890123456789012
Dois códons (UGG) para
trp na proteína líder
Região rica em Us, auxiliando o
desligamento do mRNA
2
3
3. Com 2 e 3 livres, as duas se pareiam
e formam uma alça; no entanto, esta
alça não é de atenuação, pela sua forma,
posição e ausência de Us.
2 3
2
1
DNA
mRNA
mRNA
mRNA
DNA
DNA
4
Exemplo de regulação negativa onde a molécula
sinalizadora (neste caso o próprio triptofano) causa a
ligação da proteína regulatória (Trp repressor) ao DNA
Um códon (UGA) de
parada da tradução
3
5: CONTROLE DA EXPRESSÃO– 87
Em bactérias, uma demanda maior por síntese protéica é suprida por aumento no número de ribossomos, e não aumento em sua atividade. A proporção de recursos celulares
devotados à produção de ribossomos é tão grande em algumas situações, que a célula precisa coordenar com precisão a síntese dos rRNAs e das proteínas que, conjuntamente, irão
formar os ribossomos. Uma forma de atingir esse objetivo é através da síntese coordenada das r-proteínas e dos rRNAs. Em bactérias, um mecanismo atua nesse sentido, exercendo
seu efeito em nível de tradução, e não de transcrição. Os genes das proteínas ribossomoais, em número de 52, estão distribuídos em cerca de 20 óperons, alguns até com 11 genes. O
mecanismo de controle da expressão é de feed-back: uma proteína de cada óperon funciona como um repressor da tradução do restante do mRNA do óperon. Esta proteína é capaz de
se ligar diretamente ao seu rRNA, com o qual ela tem mais afinidade do que com o seu próprio mRNA; assim, quando os níveis daquela r-proteína excedem os níveis do rRNA, isto é,
quando as r-proteínas estão expressas em níveis superiores aos necessários para formar os ribossomos, ela se liga ao seu mRNA e a tradução é reprimida.
Mas como a síntese dos RNA ribossomais pode ser controlada? Um mecanismo atuante em bactérias é capaz de perceber a quantidade de aminoácidos disponíveis para a tradução,
envolvendo um sinal molecular (guanosina tetrafosfato), que sinaliza a RNA polimerase no sentido de parar a síntese de rRNA se não há muitos aminoácidos disponíveis para
aminoacilar os tRNAs; este mecanismo recebe o nome de “resposta estringente”.
Resposta estringente
P A S
P A
5 3 1 2 3 4 5 6 7 8
GTP + ATP ppGpp + AMP
1. Quando a disponibilidade de aminoácidos na célula é baixa, alguns tRNA não aminoacilados podem
entrar no sítio A do ribossomo durante a tradução,
2. o que ocasiona a ligação da proteína do fator
de estringência (RelA) ao ribossomo.
3. A proteína de estringência cataliza a formação de uma guanosina tetrafostato
(ppGpp), um sinal molecular que age como um mensageiro secundário [da mesma
forma que o AMP cíclico (cAMP), já visto no controle do óperon da lactose].
4. Por sua vez, a molécula ppGpp é capaz de se ligar à RNA
polimerase bacteriana e impedir a síntese de muitos RNA
ribossomais, diminuindo assim o número de ribossomos que se
formam e, conseqüentemente, os níveis de tradução de mRNA. Ou
seja, se não há aminoácidos disponíveis, porque montar o aparato de
tradução?
Síntese coordenada de rRNA e r-proteínas
23S (2.900 bases)
5S (120 bases)
16S (1.540 bases)
PROTEÍNAS DA
SUBUNIDADE MAIOR:
31
PROTEÍNAS DA
SUBUNIDADE
MENOR: 21
70S
50S
30S
1. Neste exemplo hipotético, as proteínas S10, L3, L23, S3 e L16 são produzidas pelo
mesmo óperon, sendo que a proteína S10 pode se ligar tanto ao rRNA (com alta
afinidade) quanto ao seu mRNA (com afinidade mais baixa).
L16 S3 L23 S10 Promotor L3
mRNA
S10
L3 L23
L16
S3
3. No entanto, se o número de rRNAs
produzidos for baixo, as proteínas irão se
acumular,mRNA
4. e, estando em excesso, a proteína S10 pode se ligar ao mRNA, ao que tudo indica mais especificamente
na seqüência Shine-Dalgarno, impedindo a tradução do mRNA daquele óperon. Assim, as proteínas não são
traduzidas, embora o controle não atue sobre a quantidade de mRNAs disponíveis.
DOIS EXEMPLOS DE CONTROLE ENVOLVENDO OS RIBOSSOMOS
1
2
3
4
2. Assim que produzidas, as proteínas
imediatamente se ligam ao seu rRNA.
5: CONTROLE DA EXPRESSÃO– 88
O sistema SOS é um mecanismo celular para responder a danos extensivos à célula que levam à inibição da replicação. Esses danos podem ser causados por irradiação, mutação de
bases, agentes intercalantes, ou outros mecanismos. Muitas vezes os danos são tão extensivos que causam perda da fita molde em alguns segmentos, e este sistema de reparo leva a
muitos erros, sendo então considerado como o último recurso para garantir à célula alguma viabilidade.
Na indução do sistema SOS estão envolvidas duas proteínas, LexA e RecA. LexA funciona como um repressor que inibe a transcrição de todos os genes SOS, tendo um sítio de ligação
à frente de cada gene do sistema SOS. A dissociação de LexA do operador requer sua própria quebra em um sítio específico ala-gli, quebra essa induzida pela proteína RecA ativada.
Essa ativação ocorre pela sua ligação a regiões da forquilha de replicação que ainda estão em fita simples, devido aos danos. Uma vez ativada, RecA passa a ter funções de protease,
clivando LexA.
CONTROLE ENVOLVENDO MOLÉCULAS DE RNA ANTISENTIDO
INDUÇÃO DA RESPOSTA S.O.S.
1. As forquilhas são duplicadas e o processo segue
normalmente. Neste caso, todos os genes do
sistema SOS estão reprimidos. RecA é produzida
mas não é ativa.
1. Muitos segmentos de fita simples se
formam nas forquilhas,
2. e a proteína RecA, produzida constitutivamente pela célula, liga-se a
esses segmentose se torna ativada, adquirindo poder de protease.
3. RecA ativada atua sobre LexA, quebrando-a e a tornando
inativa como repressora da síntese dos genes do sistema SOS.
Operador Promotor Gene do sistema SOS
4. Sem o repressor LexA, as proteínas SOS são
transcritas. Entre elas estão UvrA, UvrB, DinB,
DinF e outras, envolvidas no reparo.
Mesmo com o sistema ativado, muitos erros são cometidos, em parte porque a fita molde foi perdida. No entanto, isto ainda é melhor para a sobrevivência da célula. Em eucariontes, um
sistema parecido atua, quando a DNA polimerase η (eta) substitui dímeros de pirimidina, inserindo pares AA. Como os dímeros podem ser tanto TT quanto CT, e a enzima não os
diferencia, são inseridos erros na fita de DNA que, não sendo mais reconhecidos, se tornam regiões mutantes. Esta é uma demonstração de uma polimerase propensa a erros, e
demonstra como o sistema SOS pode inserir vários erros na fita.
É interessante também ressaltar que alguns bacteriófagos utilizam-se da proteína LexA como repressora de genes que os mantém no ciclo lisogênico; com a proteína inativada, eles
entram no ciclo lítico. O repressor do fago lambda é um dos exemplos bem estudados, e explica porque o ciclo lítico deste fago é induzido por radiação ultravioleta. Isto não é uma
resposta celular, mas sim o reconhecimento, pelo fago, que a célula está com problemas: ambos respondem ao mesmo indicador, ou seja, ativação de RecA.
Neste tipo de regulação, a molécula regulatória não é uma proteína, como é o mais comum, mas sim um RNA antisentido, que pode ser definido como uma seqüência complementar a
outra seqüência de ácido nucléico (DNA ou RNA) que pode formar pares de bases com esta. Em bactérias, o RNA antisentido pode inibir a tradução ligando-se a seqüências 5´ do
mRNA, impedindo a ligação do ribossomo.
Exemplos são os genes ompF e micF, o primeiro envolvido na produção de proteínas da membrana externa que permitem que células de E. coli se adaptem a diferentes concentrações
de íons no meio. Em condições de alta osmolaridade no meio, o gene micF (mRNA interferente complementar) é ativado e produz o RNA antisentido que, ao se ligar ao mRNA do gene
ompF, inibe sua tradução. Vários outros exemplos já foram detectados em bactérias e bacteriófagos.
Promotor Gene ompF
Promotor Gene ompF
1. Em condições suportáveis de osmolaridade,
o gene ompF é transcrito e a proteína
correspondente é produzida.
2. Já em condições de alta osmolaridade, que
põem em risco a sobrevivência da célula, um outro
gene, micF, é transcrito também.
Promotor Gene micF
3. Diferentemente do gene ompF, este não é
traduzido, mas funciona como uma molécula de
mRNA complementar, que forma pares de bases
com a extremidade do mRNA do gene ompF.
4. Ao formar pares de bases, o mRNA interferente impede a montagem do ribossomo e,
conseqüentemente, a tradução do gene ompF, de tal forma que a proteína ompF não é mais
produzida e a célula se adapta ao novo ambiente.
Operador Promotor Gene do sistema SOS
Operador Promotor Gene do sistema SOS
Operador Promotor Gene do sistema SOS
Condições normais
Pressão mutativa alta
5: CONTROLE DA EXPRESSÃO– 89
Embora muitos mecanismos sejam semelhantes, uma das grandes diferenças entre a regulação gênica de eucariontes e procariontes foi demonstrada pela criteriosa observação de
transcrição e tradução in vivo. Nestas circunstâncias, a expressão de genes procariotos é quase que irrestrita, e procede a um nível basal não-restritivo. Ao contrário, genes eucariotos
na mesma situação não são expressos a não ser na presença de seqüências regulatórias promovedoras, e o nível de transcrição basal é dito restritivo. Essa diferença fundamental
origina pelo menos quatro importantes facetas:
1 – O acesso aos promotores em eucariontes é restrito pela estrutura de cromatina, e a ativação da transcrição requer mudanças conformacionais nessa estrutura;
2 – Mecanismos de regulação positiva são muito mais comuns em eucariontes, e quase todos os genes requerem ativação para serem transcritos;
3 – As células eucarióticas têm proteínas regulatórias maiores e mais complexas; e
4 – A transcrição em eucariontes é separada da tradução, ocorrendo em compartimentos celulares distintos.
Pela complexação do DNA com as histonas, no núcleo, formam-se os octâmeros que, em geral, reprimem a expressão dos genes eucarióticos. Como a própria expressão somente se
dá pela associação das RNA polimerases e das proteínas regulatórias com os sítios de iniciação da transcrição, esses densos complexos impedem o acesso. Para que ocorra a
transcrição, portanto, são necessárias modificações na cromatina, para permitir o acesso da maquinaria de transcrição. Dentre as modificações, estão a remodelação e acetilação da
cromatina, e a demetilação do DNA.
Cromatina ativa difere da cromatina inativa
Na cromatina normal, o DNA é protegido da ação de nucleases; por exemplo, a Dnase I, in vitro, corta o DNA em fragmentos com cerca de 200 pb, refletindo a estrutura regular dos
nucleossomos. Quando os genes são ativados, as regiões que os flanqueiam tornam-se mais sensíveis à ação das nucleases; de particular importância é a região antecedente aos
genes, com cerca de 1.000 pares a partir do início do gene, na região 5´. Isto demonstra que, in vivo, deve estar ocorrendo um relaxamento da estrutura, para permitir o acesso das
proteínas regulatórias.
Acetilação de histonas
A cromatina ativa tende a ser deficiente em histona H1, e as demais histonas são modificadas por acetilação, ou seja, adição de grupos acetil (CH3CO). Cada histona apresenta dois
domínios distintos: o central, envolvido em interação histona-histona, e o terminal, rico em resíduos de lisina, e portanto altamente básico, este provavelmente interagindocom os
fosfatos do arcabouço do DNA. As enzimas responsáveis pela acetilação são as histona-acetiltransferases (HAT). A acetilação determina menor afinidade das histonas entre si,
provavelmente porque afeta o resíduo terminal e elimina as cargas positivas responsáveis pela interação histona-DNA. A acetilação pode também determinar maior afinidade por
proteínas regulatórias. A deacetilação ocorre quando o gene não necessita mais ser transcrito, e é efetuada por deacetilases.
CONTROLE DA EXPRESSÃO EM EUCARIONTES – ALGUMAS PARTICULARIDADES
Regulação Positiva em Eucariontes
A RNA polimerase de eucariontes tem muito pouca afinidade por DNA, e portanto proteínas ativadoras da transcrição são requeridas, isto é, a transcrição é positivamente
regulada. Há também que se considerar que o próprio fato de o DNA se achar tão intrincadamente complexado com histonas já denota uma dificuldade de acesso da
maquinaria de transcrição. Isto também implica que uma regulação negativa, comum em procariontes, seria redundante em eucariontes. Além disso, a regulação positiva é
em geral mais eficiente que a negativa.
... se os mais de 20.000 genes do genoma humano fossem negativamente regulados, uma célula qualquer deveria, em um dado momento, produzir milhares de diferentes
repressores (mais ainda, se houvesse mais de um sítio de ligação de repressores em cada promotor). Em contraste, na regulação positiva, os genes estão normalmente
inativados, e somente o subconjunto de genes que uma célula necessita expressar irá requerer a ativação.
... outra consideração diz respeito ao tamanho dos genomas, e à chance de que uma determinada seqüência regulatória ocorra ao acaso no genoma, e não apenas onde
deveria ocorrer. Acoplado ao fato de que em geral há cerca de cinco regiões regulatórias em cada gene de eucariontes, isto implica que as associações casuísticas são
muito raras, conferindo assim grande especificidade ao processo.
Estrutura da cromatina
Metilação do DNA
Uma outra importante modificação que ocorre na estrutura do DNA de genes transcritos é a demetilação de citosinas. Por ocasião
da metilação, grupamentos CH3 são adicionados particularmente em citosinas adjacentes a guanosinas; as assim chamadas ilhas
CpG são regiões ricas nessas repetições CG adjacentes, que ocorrem antecedentes ao início dos genes, nos sítios de iniciação da
transcrição. Ao contrário da adição de grupamentos acetil nas histonas, a adição de grupamentos metil no DNA reprime a
transcrição, e portanto a sua remoção promove a transcrição. Portanto, regiões altamente transcritas são submetiladas. A metilação
parece também estar ligada à repressão a longo prazo, tal como no cromossomo X inativado em fêmeas de mamíferos.
Remodelação da cromatina e afastamento dos nucleosomos sem acetilação
Os complexos de remodelação da cromatina, a exemplo de SW1/SNF, podem ocasionar modificações na cromatina mesmo sem
acetilação. Observou-se que esse complexo também cria sítios sensíveis à cromatina, e estimula a ligação de fatores de
transcrição.
Em regiões pouco transcritas, as histonas não estão acetiladas,
permitindo a perfeita união tanto entre suas subunidades
quanto entre elas e o DNA; e o DNA está altamente metilado,
dificultando o acesso de fatores de transcrição.
CH3
CH3
CH3
CH3
CH3
CH3CO
CH3CO
CH3CO
CH3CO CH3CO
CH3CO
CH3CO
Quando a região vai ser transcrita, as histonas são
acetiladas, o que dificulta sua associação, enquanto que o
DNA é desmetilado, “limpando-o” para dar acesso aos
fatores de transcrição.
5: CONTROLE DA EXPRESSÃO– 90
Vários pontos de controle da expressão gênica em eucariontes ocorrem no nível da transcrição. Conforme já enfatizado anteriormente, apesar da participação de inúmeros fatores de
transcrição e da TBP/DNA polimerase, a montagem completa do complexo basal não garante a eficiência da transcrição, e outros fatores entram em cena posteriormente. Em muitas
situações, esses fatores se ligam a pontos do DNA muito distantes dos promotores e do gene propriamente dito, e existe a necessidade de torções localizadas do DNA para permitir que
esses fatores protéicos atuem.
CONTROLE DA TRANSCRIÇÃO: ativadores, coativadores, repressores, acentuadores e insuladores
PROMOTOR
ATIVADOR
OPERADOR
A
C
E
N
T
U
A
D
O
R
ATIVADOR
Uma região proximal
do gene, onde se
liga a proteína
ativadora.
ATIVADORES
As proteínas
ativadoras
estimulam a
transcrição
facilitando a
montagem do
complexo basal, no
cerne do promotor.
Os ativadores
podem atuar
diretamente, ou
podem necessitar
da intervenção de
coativadores, que
são adaptadores
entre eles e as
proteínas co
complexo basal.
PROMOTOR
A região
onde ocorre
a ligação dos
fatores do
complexo
basal de
transcrição.
OPERADOR
Uma região
palindrômica
localizada no
final
proximal de
um óperon,
que se
constitui no
sítio de
ligação do
repressor,
proteína que
controla os
cístrons
adjacentes.
U.A.S
(UPSTREAM
ACTIVATOR
SEQUENCE)
Uma região
com função
semelhante à
dos
acentuadores,
também
localizada
distante do
gene, existente
em fungos.
INSULADOR
Também conhecidos
como elementos
limítrofes, são
seqüências de DNA
que bloqueiam ou
insulam o efeito de
acentuadores de um
modo posição-
dependente. Assim,
se o insulador
estiver entre o
acentuador e o
promotor, ele
bloqueia a ação do
acentuador, mas se
ele estiver em outra
região, ele não terá
efeito.
COMPLEXO BASAL DE
TRANSCRIÇÃO
Inclui a proteína de ligação ao boxe
TATA (TBP), a polimerase e vários
fatores de transcrição discutidos
anteriormente.
A sua montagem correta é um
prerequisito para a transcrição, mas
não garante que a mesma venha a
ocorrer e, mesmo se ocorrendo, que
os níveis sejam os adequados.
Portanto, outros atores deverão entrar
em cena para garantir os níveis
adequados de transcrição.
COATIVADORES
Dentre os complexos coativadores, o
mais bem caracterizado é o TFIID, que
inclui TBP e mais cerca de dez ou
mais TBP-associated factors (TAFs);
também se encontram os fatores
CTF1, Gal4p e SP1.
MEDIADORES
Encontrados comumente em fungos,
ligam-se fortemente ao terminal
carboxílico da polimerase II.
TRANSATIVADORES
A necessidade e a eficácia de transativadores varia
grandemente entre organismos e genes. Muitos
transativadores podem ser regulados por moléculas
sinalizadoras, com capacidade de ativar ou desativar a
transcrição. Em geral, os sítios de ação dos transativadores
são distantes do início da transcrição, de tal forma que se
presume que o DNA esteja argolado na região de ação.
SILENCIADORES
As proteínas silenciadoras são na verdade
repressores, mas o seu sítio de ligação não é o
operador, como no modelo clássico, mas sim
sítios distantes do cerne, os chamados
silencioadores.
Por se ligarem a sítios distantes, necessitam de
moléculas adaptadoras para interagirem com as
proteínas do complexo basal.
ACENTUADORES (ENHANCERS)
Originalmente uma seqüência de 72 pares de bases do vírus SV40, que aumenta a transcrição de genes adjacentes. Posteriormente seqüências
semelhantes foram descobertas em eucariontes. Os enhancers podem agir à distância de até milhares de pares de bases, tanto a montante quanto a
jusante do gene, com função semelhante à do ativador, onde se ligam proteínas ativadoras que agem à distância, por meio de moléculas adaptadoras,
...Por exemplo, um acentuador que regula o gene codificante de cadeia alfa