Buscar

Aula 04 Genes e genomas

Prévia do material em texto

Lindomar Pena 
DVM, PhD 
Principal Investigator at Fiocruz/PE 
lindomar.pena@cpqam.fiocruz.br 
 
 ® Todos os direitos reservados. Material de uso exclusivo dos alunos matriculados na disciplina 
Genética e Biologia Molecular . Proibida a reprodução total ou parcial deste material sem a 
autorização por escrito do professor. 
Programa de Pós-Graduação em 
Genética 
Disciplina:Genética e Biologia Molecular 
 
Tópico 4 
 
 
Genes e Genomas Eucarióticos 
• Capítulo 4 de ZAHA, A. et al. Biologia Molecular Básica. 3ª ed. Porto 
Alegre, Editora Mercado Aberto, 2003. 
• Capítulo 4 de ALBERTS B., JOHNSON A., LEWIS J., RAFF M., 
ROBERTS K., WALTER P. Biologia Molecular da Célula. 5a Edição, 
ARTMED, Porto Alegre. 2010. 
• Chapter 2 de Brown TA. Genomes. 2nd edition. Disponível, em inglês, 
aqui : http://www.ncbi.nlm.nih.gov/books/NBK21120/#A5517 
• Capítulo 10 de COX M; DOUDNA J; O’DONNELL M. Biologia Molecular- 
Princípios e Técnicas. 1ª ed. Artmed. 2012. 
• Disciplina Biologia Molecular UFPel (Prof. Odir Dellagostin). 
 
 
 
http://www.ncbi.nlm.nih.gov/books/NBK21120/
http://www.ncbi.nlm.nih.gov/books/NBK21120/
http://www.ncbi.nlm.nih.gov/books/NBK21120/
http://www.ncbi.nlm.nih.gov/books/NBK21120/
http://www.ncbi.nlm.nih.gov/books/NBK21120/
http://www.ncbi.nlm.nih.gov/books/NBK21120/
http://www.ncbi.nlm.nih.gov/books/NBK21120/
http://www.ncbi.nlm.nih.gov/books/NBK21120/
http://www.ncbi.nlm.nih.gov/books/NBK21120/
http://www.ncbi.nlm.nih.gov/books/NBK21120/
http://www.ncbi.nlm.nih.gov/books/NBK21120/
http://www.ncbi.nlm.nih.gov/books/NBK21120/
http://www.ncbi.nlm.nih.gov/books/NBK21120/
http://www.ncbi.nlm.nih.gov/books/NBK21120/
Integrado Versus Epissomo 
A DNA molecule that replicates independently of chromosomal DNA 
is an episome. By this definition a plasmid is (usually) an episome. 
Integrated transgene 
episome 
Integrado Versus Epissomo 
HIV-1 infects CD4+ T cells. Once the virus releases its RNA genome in the host cell, HIV reverse transcriptase converts 
it to double-stranded DNA, which then enters the cell nucleus. There the enzyme HIV intergrase integrates the HIV 
cDNA into the host cell genome. During normal integration, host DNA repair enzymes circularize a small proportion of 
the HIV cDNA into episomes with one or two copies of the viral LTR. If integration is blocked with an integrase 
inhibitor, a greater proportion of 1-LTR and 2-LTR episomes form. Buzón et al.9 measured the number of 2-LTR circles 
in patients receiving antiretroviral therapy and found that it increased when patients were given the integrase inhibitor 
raltegravir, suggesting that these patients have ongoing, low-level viral replication despite being on retroviral therapy. 
HIV episomes 
Introdução 
Pierce, 2012 
Upstream: a montante 
Downstream: a jusante 
• A montante e a jusante referem-se ambos a uma posição 
relativa no DNA ou RNA. 
Posição Relativa no DNA ou RNA: 
Terminologia 
intramolecular 
intermolecular 
Cis acting elements: Sequências de 
DNA na vizinhança de uma porção 
estrutural de um gene que regulam a 
expressão de um gene-alvo. 
Trans acting elements: Sequências 
de DNA localizados longe dos genes-
alvo, muitas vezes em outro 
cromossomo, que regulam a 
expressão de um gene-alvo. 
Nature Reviews Genetics 10, 595-604 
Cis versus Trans-acting factors 
Contig x Reads x Consensus 
Contig é o conjunto de reads 
Arquebactéria: 192; Eubactéria: 4034; Eucarioto: 183 
Link: http://www.genomesonline.org/cgi-bin/GOLD/index.cgi?page_requested=Complete+Genome+Projects 
Quantos genomas já foram sequenciados? 
Draft genome sequence: a genome that has been sequenced 4 -5 times (4-5-
fold coverage), providing a framework for DNA fragment assembly and 
potentially allowing up to 95% of genes to be identified. Draft sequence is 
mostly in the form of 10,000-bp fragments whose approximate chromosomal 
locations are known; the fragments may contain gaps and their true order and 
orientation may not be known. 
 
Finished genome sequence: a genome that has been sequenced 8-9 times (8-9-
fold coverage) to reduce ambiguities in the draft sequence, to close gaps, and to 
allow for only a single error every 10,000 bases. 
• Muitos genomas eucarióticos são enormes e é 
muito mais trabalhoso sequenciá-los; 
 
• Muitos genomas eucarióticos estão cheios de 
DNA não-codificante e de regiões repetitivas, o 
que dificulta o sequenciamento e montagem para 
obtenção de um cromossomo completo; 
 
• Ainda é muito oneroso sequenciar o genoma de um 
eucarionte comparado a um genoma procarionte. 
Por que há tão poucos genomas 
eucariontes sequenciados? 
• Os seres humanos são eucariontes bastante típicos e, em geral, o 
genoma humano é um bom modelo para genomas eucariontes. 
 
• Eucariotos possuem genoma linear de DNA fita dupla no núcleo e um 
genoma menor, geralmente circular, de DNA mitocondrial (mtDNA). 
As plantas e outros organismos fotossintetizantes ainda possuem 
um terceiro genoma, localizado no cloroplasto (ctDNA). 
Genomas de eucariotos 
 
 Genoma nuclear (gDNA) 
 Genoma de organelas (mtDNA e ctDNA) 
 Geralmente diplóides (2 conjuntos de cromossomos) 
 Podem ser haplóides (leveduras e alguns fungos) ou 
poliplóides (3 ou mais cópias de cada cromossomo) 
Genomas Eucarióticos – Aspectos Gerais 
Exemplos de Culturas poliplóides 
• Triploide: banana, maçã, gengibre, 
melancia, frutas cítricas 
• Tetraploide: milho, algodão, batata, 
repolho, alho-poró, tabaco, amendoim, 
Pelargonium 
• Hexaploide: crisântemo, trigo, 
triticale, aveia, kiwi 
• Octoploide: morango, dália, amor-
perfeito, cana-de-açúcar 
•Nucléolo: Estrutura no núcleo onde o rRNA é transcrito e ocorre a montagem 
das subunidades ribossomais. 
•Heterocromatina: cromatina altamente condensada 
•Eucromatina: uma forma menos condensada 
O DNA é localizado no núcleo celular 
Figure 4-9 Molecular Biology of the Cell 
Figure 4-10 Molecular Biology of the Cell (© Garland Science 2008) 
O DNA eucariótico é compactado em 
uma série de cromossomos 
•Cada cromossomo consiste em uma única e enorme molécula de DNA 
linear com proteínas associadas que dobram e empacotam a fina fita de 
DNA em uma estrutura mais compacta. 
•Cariótipo: Conjunto total dos cromossomas 
• Tamanho 
• Localização do centrômero relativo às duas extremidades 
• Técnicas de coloração: corantes e sondas de hibridização 
heterochromatin 
Identificação de cromossomos individuais 
O Cariograma humano 
DNA alfoide: 
Sequências nucleotídicas repetidas em 
tandem localizados nas regiões 
centroméricas de cromossomos humanos. 
As proteínas centroméricas especiais em 
humanos incluem pelo menos 7 que não são 
encontrados em outras partes do 
cromossomo. Ex.: CENP-A (similar a histona 
H3) 
DNA alfoide 
Snustad, 2013 
Figure 4-15 Molecular Biology of the Cell 
Marrom-escuro: Genes conhecidos 
Marrom-claro: suposições 
Genoma humano (3,2 X 109 bp) 
Gene: éxon+ íntron+ sequências de DNA reguladoras 
Organização gênica nos cromossomos 
Anatomia de um gene 
Anatomia de um gene 
Figure 4-17 Molecular Biology of the Cell 
Conteúdo da sequência nucleotídica do 
genoma humano completo 
•Os telômeros contêm 
sequências nucleotídicas 
repetidas que permitem 
que as extremidades dos 
cromossomos sejam 
eficientemente replicadas 
Cada cromossomo contém um centrômero, 
dois telômeros e origens de replicação 
Figure 4-21 Molecular Biology of the Cell 
• Marcam as extremidades dos cromossomos permitindo a distinção do 
verdadeiro fim de um fim natural causado pela quebra do 
cromossomo - condição essencial porque a célula deve reparar o 
último, mas não o primeiro. 
• É crítico para a sobrevivência do cromossomo e pode ser a chave 
para a compreensão da senescência celular e morte. 
Duas proteínas específicas se ligam às sequências de repetição em telômeros 
humanos. Estes são chamados TRF1, que ajuda a regular o comprimento do 
telômero, e TRF2, que mantéma extensão de cadeia simples. 
Importância dos telômeros 
DNA telomérico é constituído, em seres humanos, por centenas 
de cópias de um motivo repetido, 5’-TTAGGG-3’. 
Importância dos telômeros 
Pierce, 2012 
Telômeros humanos 
Snustad, 2013 
Níveis de compactação da cromatina 
Pierce, 2012 
Nucleossomo ou cromatossomo? 
Figure 4-22 Molecular Biology of the Cell 
Nucleossomo: Estrutura em forma de conta na cromatina eucariótica, composta por um 
pequeno segmento de DNA (cerca de 200 pb) enrolado em torno de um núcleo de oito 
proteínas histonas. Unidade estrutural fundamental da cromatina. 
Cromatina isolada (30 nm) 
Nucleossomo 
Os nucleossomos são as unidades básicas da 
estrutura dos cromossomos eucarióticos 
Figure 4-23/4-27 Molecular Biology of the Cell 
 
•Histonas são altamente conservadas. 
•A maioria das mutações nas sequências das 
histonas é letal 
Organização estrutural de um nucleossomo 
A hélice de DNA dá 1,7 volta 
ao redor do octâmero de histonas 
Figure 4-24 Molecular Biology of the Cell 
142 ligações de 
hidrogênio + outras ligações 
 
Histonas são ricas em lisina ou 
arginina (carga+): interação 
com o DNA (carga -). 
A interface entre o DNA e o cerne de 
histona é extensa 
Pierce, 2012. 
Como a histona de ligação liga-se ao 
nucleossomo 
• Esse tipo de ligação pela H1 parece ser importante na formação da 
fibra de 30 nm. 
Figure 4-25 Molecular Biology of the Cell 
Cada cerne de histonas contém uma 
cauda N-terminal, sujeita a diversas 
formas de modificações covalentes. 
(C) dímero por uma interação conhecida 
como “aperto de mãos”. 
Organização geral da estrutura do cerne 
 de histonas 
O DNA em um nucleossomo isolado 
é surpreendentemente dinâmico 
Figure 4-28 Molecular Biology of the Cell 
Figure 4-30 Molecular Biology of the Cell 
 
Troca de histonas catalisada pelo complexo de 
remodelamento da cromatina dependente de ATP 
Modificações covalentes nas caudas das 
histonas do cerne 
Figure 4-39 
As modificações covalentes e as 
variantes de histonas atuam em 
conjunto para produzir um “código 
de histonas" que auxilia a 
determinar a função biológica 
Figure 4-43 
Código de histonas 
Figure 4-50 Molecular Biology of the Cell (© Garland Science 2008) 
Organização e função da cromatina que 
forma os centrômeros humanos 
Centrômeros humanos 
O que acontece com um cromossomo que perde seu centrômero? 
Pierce, 2012 
Estrutura e expressão de um gene 
eucariótico 
Tamanho médio dos genes 
0,9 1,4 
11,3 
19,2 
0 
5 
10 
15 
20 
25 
—E. coli —S. cerevisiae —D. 
melanogaster 
—H. sapiens 
T
am
an
h
o
 m
éd
io
 d
o
s 
g
en
es
 (
k
b
) 
Levedura: menos de 4% dos genes têm íntrons. Exceção em eucariótos 
Os organismos mais complexos têm 
genomas menos compactos 
3,4 
• No homem, o número médio é de 8-9 íntrons por gene e 
94 % dos genes contém íntrons 
Figure 1-37 Molecular Biology of the Cell, Fifth Edition (© Garland Science 2008) 
C-Value Paradox/Enigma: não há uma correlação direta 
entre tamanho do genoma e complexidade do organismo 
C-Value Paradox/Enigma 
A explicação mais provável para o paradoxo é que os organismos com valores 
extraordinariamente altos de C simplesmente têm uma grande quantidade de 
DNA não-codificante. 
O valor C é o conteúdo de DNA por célula haplóide. 
Geração de múltiplas cópias de RNA a partir de um único gene 
Gene da proteína 4.1R de eritrócitos humanos: 2 ATGs e splicing 
alternative de 12 dos 23 éxons(azul), gerando 18 isoformas da 
proteínas. 
Isoforma: qualquer uma de várias formas diferentes da mesma proteína. As diferentes formas 
de uma proteína podem ser produzidas a partir de genes relacionados, ou pode surgir a partir 
do mesmo gene por processamento alternativo. 
Número de proteínas X número de genes 
Isoforma de Proteína x Isoforma de Feijoada 
• 25 a 50% dos genes são de cópia única 
• Família gênica: >30%-40 % de identidade (parálogos), 
classificação arbitrária 
• 100% identidade: gene cópia (redundância) 
• Famílias gênicas: 
– Genes que codificam tRNAs: > 1300 cópias no homem 
– Genes que codificam rRNA (rDNA): de 100 a 200 cópias 
por genoma 
– Genes que codificam histonas: 300 a 1.000 cópias 
 
• Pseudogene: é uma sequência nucleotídica similar a um gene 
 normal mas que não dá como resultado um produto funcional, 
quer dizer, que não se expressa. 
 
 
Famílias gênicas 
FAMÍLIA, SUPERFAMÍLIA E SUBFAMÍLIA 
DE GENES (OU PROTEÍNAS) 
Subfamília: subconjunto de sequencias repetidas de determinada família com maior 
grau de similaridade entre si. 
Superfamília: sequencias repetidas pertencentes a diferentes famílias, mas que 
guardam algum grau de similaridade em comparações interfamiliares. 
Obs.: Membros de uma família podem estar agrupados (cluster) no mesmo 
cromossomo ou estar disperso no genoma. 
Organização do genoma humano 
Microssatélite 
Repetições Genômicas 
O DNA repetitivo não é codificador é composto por sequências curtas, 
idênticas ou similares, que se encontram em tandem (agrupadas) ou 
intercaladas/dispersas pelo genoma. 
• Tandem: DNAs satélite, microssatélite e minissatélite; 
• Intercaladas: Transposons (SINEs e LINEs) 
“Intercaladas” 
Repetições Genômicas 
STRs 
Repetições em Tandem 
DNA satélite: porção do DNA repetitivo que se diferencia 
do restante do genoma pela composição de bases, 
apresentando alto conteúdo GC. Localizado principalmente na 
heterocromatina dos centrômeros (satélite é o alfa ou 
alfóide) e telômeros. Aparece em bandas de satélite em 
gradientes de densidade. Tamanho: 5-300 pb. 
 
Minissatélite: sequências repetidas de 5 a 50 pb. Também 
chamados de VNTRs (número variável de repetições em 
tandem). Localizado principalmente na eucromatina. 
 
Microssatélite: sequências repetidas de 1 a 4 pb. Também 
podem ser chamados de STRs (repetições curtas em 
tandem), Localizado principalmente na eucromatina. 
• Microssatélite e minissatélite não aparecem em bandas de satélite em gradientes de 
densidade pois repetem menos vezes (até 100X) que o DNA satélite (105-106 X) 
 
• O número e as combinações destas repetições (microssatélites e minissatélites) 
variam em cada indivíduo, tornando-os únicos. Importante na medicina forense 
(investigação de crimes, paternidade), pois elas formam uma espécie de “impressão 
digital” do DNA. 
Number of different short tandem 
repeats in three profile 
Repetições Intercaladas 
Retroelementos 
R
e
tr
o
p
o
so
n
s 
– Possuem LTRs – 500 bp 
– Tamanho de 5 a 9 kb – 8,3% do genoma 
– Possuem o gene gag (capsídio) e o pol 
(polimerase) 
Retrotransposons (similares a retrovírus) 
– LINES (long interspersed elements): 10.000 cópias, 
> 5 kb, codificam para transposase, transpõem com 
frequência, 21% do genoma humano 
 
– SINES (short interspersed elements): > 100.000 cópias, < 
500 pb, não codificam para transposase, transpõem com 
frequência, 11% do genoma. 
Retroposons (similares a mRNA celular) 
Pierce, 2012 
Transposons e cor das 
uvas 
 
• Mitocôndrias - mtDNA 
• Plastídios 
– Cloroplastos 
– Cromoplastos 
– Amiloplastos 
– Elaioplastos 
ctDNA 
Em geral, são maiores e codificam 
maior número de genes que o 
mtDNA 
Genomas de Organelas 
Número de cópias não é são particularmente bem compreendido e não 
está relacionado com a complexidade do organismo 
Replicação, transcrição e tradução do mDNA são autônomos, ou seja, acontece no interior 
da própria organela. Código genético é distinto! 
 
Porém, a maioria das proteínas mitocondrias são codificadas por genes nucleares 
Algumas algas e protozoários têm mDNA linear! 
O genoma mitocondrial contém 37 
genes que codificam 13 proteínas, 22 
tRNAs e 2 rRNAs. 
O genoma mitocondrial humano 
Cada mitocôndria humana contém cerca de 
10 moléculas de DNA idênticas. O númeor 
de mitocôndrias por célula varia (25-
milhares) 
A EVA mitocondrial 
O genoma do cloroplasto do arrozSABATINA 
O que é o Paradoxo do valor de C (C-Value Paradox/Enigma) e qual 
é a sua explicação? 
Fim

Continue navegando