Buscar

Aula_Complexidade_de_Genomas_2013

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 47 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 47 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 47 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1 
Complexidade 
de 
Genomas 
Genoma 
Termo criado por Hans Winkler, professor de botânica, 
em 1920. 
 
 GENe + cromossOMA 
2 
O que é Genoma ? 
 
• É o conjunto de todo o material genético que 
estabelece a identidade de uma determinada 
espécie 
 
• Genoma = (DNA nuclear + DNA citoplasmático). 
 
Tipos de Genomas 
 
• DNA (ssDNA ou dsDNA): a maior parte dos 
organismos 
• RNA (ssRNA ou dsRNA): vírus 
 
• Circulares: genomas de procariotos, mitocôndria, 
 cloroplasto, vírus, plasmídios 
• Lineares: cromossomos de eucariotos, alguns vírus 
3 
Elementos que compõem os genomas 
 
• Cromossomos 
• genes “housekeeping“ 
 
• Elementos extra-cromossomais 
• plasmídios 
• DNA de organelas 
• pequenos cromossomos 
 
Tamanhos de genomas 
Mimivírus e Mamavírus 
4 
Mimivírus: um vírus gigante 
1,18 Mb: 979 proteínas! (2003) 
Acanthamoeba polyphaga 
Virófagos (2008) 
Partículas gigantes de 
mimivírus (vermelho) e vírus 
satélite de mimivírus 
chamado Sputnik (verde) 
Sputinik é um vírus parasita do 
mimivírus 
Os vírus são seres vivos ??? 
5 
Megavirus chilensis 
 (PNAS, outubro de 2011) 
1,25 Mb: 15% maior que o Mimivirus – 1.120 proteínas 
Pandoravirus salinus – julho 2013 
O maior genoma viral 
Philippe, N. et al. Science 341, 281–286 (2013) 
• 0,7 micrometros, 2,5 Mb 
• 93% dos genes não têm homologia com nada 
conhecido ! 
• Origem a partir de um quarto domínio da vida ?? 
 
6 
Outros genomas 
Organismo Tamanho do genoma (pares de bases) 
Vírus, Fago ΦX174; 5386 – Primeiro genoma sequenciado 
Vírus, Fago λ 5×10
4
 
Archae, Nanoarchaeum equitans 5×10
5
 – Menor genoma não-viral (Dez, 2005) 
Bacteria, Buchnera aphidicola 6×10
5
 
Bacteria, Wigglesworthia glossinidia 7×10
5
 
Bacteria, Escherichia coli 4×10
6
 
Ameba, Polychaos dubium 6.7×10
11
 – Maior genoma ! (Dez, 2005) 
Planta, Arabidopsis thaliana 1.2×10
8
 – Primeiro genoma de planta (Dez, 2000) 
Planta, Fritillaria assyrica 1.3×10
11
 
Fungos, Saccharomyces cerevisiae 2×10
7 
– Primeiro genoma eucariótico sequenciado (1996) 
Nematódeo, Caenorhabditis elegans 8×10
7
 
Inseto, Drosophila melanogaster 1.3×10
8
 
Mamífero, Homo sapiens 3×10
9
 
A explosão de genomas sequenciados 
7 
Vale a pena continuar a usar o 
termo “procarioto” ? 
Nature 441: 289 (2006) 
Bactérias → tamanho do genoma está relacionado com o número 
de genes 
 
Eucariotos → tamanho do genoma NÃO está relacionado com o 
número de genes ou com a complexidade do organismo 
 
Razões: 
 - muito DNA intergênico (DNA entre genes) 
 - presença de íntrons 
 - muito DNA repetitivo 
Genomas x número de genes 
8 
Genomas procarióticos x eucarióticos 
 
 Procariotos Eucariotos 
Genoma compacto e 
econômico 
Grandes blocos de DNA 
que nada codificam (?) 
Sequências únicas 
Múltiplas cópias 
de sequências 
particulares 
Genes não-interrompidos 
Genes interrompidos 
com íntrons 
A questão dos genes interrompidos 
9 
Organismos com genomas maiores tendem a ter genes com mais 
íntrons 
• Levedura (uma exceção): só 4% dos genes têm íntrons 
• Drosophila: 83% genes têm íntrons, poucos íntrons/gene 
• Mamíferos e plantas: 94% genes têm íntrons, muitos íntrons/gene 
 
Nota: não há correlação entre tamanho do gene e do mRNA 
 
Gene da Distrofia Muscular de Duchenne (DMD) tem alto 
número de íntrons 
• 2,4 Mb: maior gene humano com mais de 60 éxons! 
• mRNA maduro tem ~14 kb 
• Codifica a distrofina (~500 kDa), presente no músculo esquelético e cardíaco 
O DNA repetitivo 
 
1) Famílias multigênicas (genes funcionais) 
 
2) Família de DNA extragênico repetitivo (DNA não-
transcrito) 
 
10 
1) Famílias Multigênicas 
 
 surgem por duplicação e posterior divergência 
 podem estar dispersos ou agrupados (“clusters”) 
 
Tipos: 
 
1.1. DNA repetitivo que codifica RNA (rDNA, tRNA, snRNA) 
rDNA: 100 cópias/genoma haploide (0,4% genoma humano) 
• organização in tandem 
• localiza-se no nucléolo 
• em Xenopus, os genes 18S, 5.8S, 28S repetem-se 500 
vezes! 
• cada cluster tem uma unidade transcricional separada por 
DNA espaçador não-codificador. 
Organização do rDNA 
11 
rRNA e estabilidade genômica 
Science 327: 693-696 (2010) 
1.2. DNA repetitivo que codifica para proteínas 
 
Família das histonas - os 5 genes que produzem histonas 
podem estar em um "cluster" que se repete várias vezes, ou 
podem estar dispersos, como em alguns vertebrados. 
12 
Distribuição dos genes das histonas 
em humanos 
Família da globina. A hemoglobina é formada por duas cadeia 
 e duas β de globina. 
 
 Família cromossomo humano 16 
 Família β cromossomo humano 11 
 
 Obs: Em algumas famílias, alguns membros não são 
funcionais, são os pseudogenes (relíquias evolutivas). 
 
 
• Família : genes ativos: , 2 genes idênticos e os 
pseudogenes : , , , 
 
• Família β: 5 genes funcionais: ε, 2 genes γ diferentes, δ, β e 
1 pseudogene ( ) 
 
13 
As diferentes cadeias das globinas são utilizadas de acordo 
com o desenvolvimento do embrião 
14 
2) Família de DNA extragênico repetitivo 
 
Dividem-se em 2 classes: 
• Repetições in tandem 
• Repetições inter-espaçadas (“interspersed”) 
2.1. Repetições in tandem 
 
 DNA satélite (STD = “short tandem repeats”): 
 · descoberto por sua densidade em gradientes de cloreto de césio. 
 · tamanho médio variado. 
 · correspondem às sequências alta ou moderadamente repetitivas 
 · formam parte da heterocromatina, que se localiza, sobretudo, nos 
 centrômeros (“DNA alfoide”) 
 · existem diversas famílias de DNA satélite 
DNA satélite em Drosophila 
DNA satélite no centrômero em camundongo 
(hibridação in situ) 
15 
DNA minisatélite 
• tamanho médio de ~7 pb 
• localizam-se nos telômeros ou em outras regiões 
• a telemorase adiciona repetições de TTAGGG 
 
DNA microsatélite 
• 1-4 pb 
• totalmente dispersos 
• (A)n , (T)n, (CA)n forma Z-DNA in vitro mas não se sabe se o mesmo 
ocorre in vivo 
 
Obs: Os minisatélites são também chamados de VNTR ("variable number 
tandem repeats") 
São usados no teste de paternidade (“DNA fingerprinting”) pois há uma 
grande variação no número de cópias destes elementos entre diferentes 
indivíduos gerando polimorfismo genético. 
2.2. Repetições interespaçadas 
 
- SINE ("short interpersed elements”) 
Espalhados pelo genoma, não codificam proteínas, podem “saltar” e se inserir 
em certos genes causando doenças, como a neurofibromatose-1 (“Mal do 
Homem Elefante”). 
 
Exe: "Sequências Alu" (~300 pb) que correspondem a 10% do genoma (1 milhão 
de cópias). Trata-se de um retrotransposon. 
 
 
- LINE ("long interpersed elements") 
Maiores que os SINEs, (7000 pb). Assim como os SINE, podem causar doenças 
por ruptura gênica. 
 
Exe: “Kpn repeats” (também chamados de Line-1) 
 
Os elementos móveis correspondem a quase 50% 
dos genomas humano e de outros primatas ! 
16 
Joseph Merrick (1862-1890) 
NF1 ou Síndrome de Proteus??? 
Elementos genéticos móveis 
• Transposon e sequências 
de inserção (IS): movem-
se por intermediário de 
DNA 
 
• Retrotransposon: movem-
se por intermediário de 
RNA 
17 
Composição de sequências repetidas 
Quase metade do genoma humano é formado por elementos 
transponíveis embora a atividade deles esteja bem reduzida na 
linhagem humana 
 
 
 
 
 
 
 
• Transposição duplicativa 
• Crossing-over desigual 
 
 
 
 
 
• “Escorregão” da DNA Polimerase durante a replicação• Amplificação gênica (rolling circle) 
Como se originam as repetições? 
18 
Amplificação Gênica 
Pode ocorrer para certos genes a fim de suprimir necessidades 
durante o desenvolvimento. 
Exe: 
 
 rDNA de Xenopus forma DNA extracromossomal circular 
com várias cópias in tandem 
 
 cromossomos politênicos durante desenvolvimento de 
insetos 
 
 amplificação devido à pressão seletiva metotrexato induz a 
amplificação do gene DHFR em Leishmania 
Genoma de organelas 
• Extranuclear, origem endossimbiôntica: DNA mitocondrial 
(mtDNA) e de cloroplasto (cpDNA) 
 
• Circulares, pequenos, estrutura parecida com operon, 
proteínas ribossomais semelhantes às de procariotos 
 
• Alguns genes têm íntrons 
 
• mtDNA humano: 16,5 kb: 13 proteínas, 22 tRNA, 2 rRNA 
 
19 
• São considerados DNA repetitivos pois, embora haja uma 
só cópia dos genes/círculo, há várias cópias do 
círculo/célula 
 
• Minicírculos e maxicírculos de T. cruzi formam o k-DNA 
(DNA do cinetoplasto) 
 
k-DNA 
O Genoma 
Humano 
20 
O genoma humano 
 
DNA mitocondrial: 16.569 pb 37 genes 
 
DNA nuclear: ~3 bilhões de pb 100.000 genes (previsto) 
 
 
Projeto Genoma Humano (HGP) 
- Consórcio Público - 
21 
• Iniciativa pública, lançamento oficial em 1990 
 
• Pelo menos 18 países participaram (Austrália, Brasil, Canadá, China, 
Dinamarca, União Européia, França, Alemanha, Israel, Itália, Japão, Coréia, 
México, Holanda, Rússia, Suécia, Reino Unido, EUA) 
 
Objetivos: 
 
 Sequenciar os 3 bilhões de pares de bases do genoma humano identificando 
os 100.000 genes previstos, 
 
 Depositar e disponibilizar estas sequências em bancos de dados, 
 
 Desenvolver ferramentas computacionais para a análise das sequências, 
 
 Transferir tecnologia para o setor privado, 
 
 Discutir as questões éticas, legais e sociais que fossem levantadas. 
• Human Genome Organization (HUGO): coordenação geral 
 
• Mais de 1.100 cientistas trabalharam no projeto durante toda 
uma década e foram gastos cerca de US$ 3 bilhões. 
 
• As sequências foram depositadas no GenBank 
(http://www.ncbi.nlm.nih.gov/) 
 
• Em 1992: primeiro mapa de baixa resolução de todos os 
cromossomos humanos. 
 
22 
Center for Genome Research (Whitehead Institute) 
Projeto Genoma Humano 
- Iniciativa Privada (Celera) - 
Craig Venter funda o The Institute for Genomic Research (TIGR) 
1995: Venter publica o primeiro 
sequenciamento do genoma de um 
ser vivo: Haemophilus influenzae 
(apenas 1 ano!) 
 
23 
• Em 1998, Craig Venter se associou à divisão Applied 
Biosystems da empresa privada Perkin-Elmer para fundar a 
Celera Genomics Corporation. 
 
• Custo do projeto projeto: US$ 300 milhões (3 anos) 
 
• Previram que 100 a 300 genes de interesse para as indústrias 
farmacêuticas seriam patenteados Acredita-se que cada ser 
humano tenha 99,9% de suas sequências de DNA idênticas 
entre si. 
 
• As companhias farmacêuticas estão particularmente 
interessadas no 0,1% de diferenças entre nossos genomas, 
pois são estas variações que podem ser responsáveis pelo 
fato de uma droga ser eficaz num indivíduo e não em outro. 
 
Vantagens da Celera: robotização e bioinformática 
24 
Estratégia: “shotgun” 
(Celera) 
Estratégia: “sequenciamento direcionado (ordenado)” 
(HGP) 
Estratégias de sequenciamento HGP x Celera 
1999: Primeiro cromossomo sequenciado: número 22 
Nature 402: 489-495 (1999) 
 
 
 
 
 
 
2000: Sequenciamento do cromossomo 21 
Nature 405: 311-319 (2000) 
 
26 de junho de 2000: o presidente norte-americano Bill Clinton e o 
primeiro ministro inglês Tony Blair anunciaram que o consórcio PGH 
e o grupo Celera haviam completado o primeiro esboço do genoma 
humano. 
 
25 
 
Fevereiro de 2001: publicação do esboço do genoma humano 
 
HGP: Nature, vol. 409 (2001) 
 
Celera: Science, vol. 291 (2001) 
 
Abril de 2003: “fim” do projeto. Previsão de 30 a 40 mil genes 
 
2006: último cromossomo sequenciado: o de número 1, o maior 
cromossomo humano (8% genoma) - Nature 441: 315-321 (2006) 
26 
A contribuição brasileira 
• Projeto Genoma do Câncer Humano 
 
• Instituto Ludwig do Câncer 
 
• Sequenciamento de EST (Expression Sequence Tags) 
de alguns tecidos cancerosos 
 
27 
12/06/2007: Primeiro genoma individual sequenciado: 
James Watson 
 
Custo: menos de US$ 1 milhão 
Tempo: 2 meses ! 
Genoma do James Watson (2008) 
28 
05/09/2007: O primeiro genoma 
humano diploide é sequenciado 
• Sangue de Craig Venter 
• Genoma mais completo já feito 
• 44% de diferenças entre cópia da mãe 
em relação ao pai: diferença entre 
indivíduos aumentou para 99,5% 
 
 S. Levy et al. PLoS Biol. 5, e254; 2007 
 
29 
Tamanho genoma haploide: 3.164.700.000 pb 
 
99,5% de semelhança entre cada indivíduo (uma mudança a cada 300-
400 pb – Single Nucleotide Polymorphism (SNP) 
 
Número de genes preditos: entre 20-30 mil 
 Celera – 39.114 
 Consórcio público – 29.691 
 Genes já conhecidos – 11.015 
 
 menos de 2% genoma = genes codificadores de proteínas 
1/3 genoma é formado por íntrons ! 
 DNA extragênico é a maior parte do genoma 
 
 
Afinal, quantos genes nós temos? 
 
Resposta: 
• 20.488 genes codificadores de proteínas. 
 
 e os RNA não-codificadores?? 
Quadro de apostas em 2000 
30 
Projeto ENCODE - 2003 
• ENCyclopedia Of DNA 
Elements 
 
• Identificar todos os 
elementos funcionais 
do genoma 
 
• Finalização em 
setembro 2012 
80% do DNA lixo é transcrito 
O genoma é praticamente todo transcrito !!! 
A complexidade da transcrição 
desafia o conceito de gene 
• Anos 60: 1 gene codifica 1 
proteína 
 
• Hoje: uma mesma região 
do DNA pode gerar vários 
transcritos 
31 
Transcrição “Pervargante” 
(em todas as direções) 
Afinal, o que é um gene??? 
Proposta: “o gene é a união de sequências genômicas 
codificadoras de um conjunto de produtos funcionais 
sobrepostos” 
32 
RNAs não-codificadores 
 
 
33 
Como os genes humanos podem 
codificar para mais de uma proteína? 
 
 
1) Múltiplos sítios de iniciação da tradução no mesmo mRNA 
 
2) Promotores alternativos para o mesmo gene 
 
3) Vários sítios de splicing podem gerar diferentes mRNA que, por 
sua vez, podem gerar diferentes proteínas 
Nature, maio 2010 
Um secundo código genético: um que prediz como segmentos 
de mRNA transcritos a partir de um dado gene podem ser 
combinados para gerar múltiplos produtos em diferentes 
tecidos, um processo chamado splicing alternativo 
34 
Pseudogenes 
• Relíquias evolutivas “mortas” 
• Alguns podem ser protogenes 
• No genoma humano há mais de 19.000 pseudogenes para 
somente 21.000 genes codificadores de proteínas ! 
• Pseudogenes: 
1) não-processados (com íntrons) - 11.000 
2) processados (sem íntrons) - 8.000 
Pseudogenes funcionais! 
Nature 458 (2008) 
35 
Benefícios do projeto Genoma Humano 
• Compreensão mais ampla da organização do genoma e 
função dos genes humanos pela comparação com outros 
genomas já sequenciados. 
 
• Diagnóstico antecipado de doenças. 
 
• Desenvolvimento de drogas específicas para certos indivíduos 
– drogas racionais (farmacogenômica). 
 
• Aplicação da "terapia gênica" para a cura de doenças 
genéticas. 
 
 
• Determinação da predisposição genética de indivíduos a 
agentes cancerígenos. 
 
• A análise comparativa de diversos genomas humanos 
permitirá determinar a linhagem e evolução das raças. 
 
• Estabelecimento de novas estratégias para a determinação da 
identidade deindivíduos ("DNA forense"). 
 
 
 
36 
Projeto “1000 Genomas” 
• Lançado em 2008 
• Consórcio internacional 
• Sequenciar pelo menos 1000 genomas de indivíduos de 
diversas partes do mundo 
• Verificar as diferenças entre populações – interesse médico 
O Brasil na era genômica 
Julho, 2000: genoma 
de Xylella fastidiosa 
37 
O genoma do chimpanzé 
Setembro de 2005 
96% de identidade com humanos 
 
Abril de 2007: Genoma do macaco Rhesus 
38 
Maio 2008 – Genoma do ornitorrinco 
• Nature, vol 453 (2008) 
• Uma mistura de características genéticas de mamíferos, 
pássaros e répteis 
 
Novembro 2008 – Genoma do 
mamute 
39 
Primeiro genoma de um 
paleo-humano - 2010 
40 
Benefícios: Paleogenômica 
Poinar et al., Science 311: 392-394 (2006) 
Metagenoma do mamute 
tem pouco DNA ambiental 
Genoma do Homem de Neanderthal 
Svante Pääbo, em 1997, publica a 
primeira sequência de DNA mitocondrial 
 
Cell 90: 19-30 (1997) 
 
 
 
2006: Svante Pääbo sequencia 1 milhão 
de pb de DNA nuclear (0,003% genoma) 
– há muita contaminação com DNA 
humano moderno... 
 – cromossomo Y é bem diferente de 
humanos e chimpanzés 
41 
2008: Genoma mitocondrial completo! 
Green, R.E. et al. Cell 134, 416-426 (2008) 
Primeiro esboço... 
Science, 328 (2010) 
42 
 
Abril 2009 
 
Participação brasileira! 
Soja: 2010 
43 
Genoma do gorila - 2012 
Mais antigo genoma sequenciado 
Nature, junho de 2013 
• Cavalo de Przewalski 
• ~700 mil anos de idade 
44 
Tecnologia e Genômica 
Genomas Sintéticos 
Science 319, 1215 (2008) 
45 
Primeiro genoma desenhado in silico 
Science, 328 (2010) 
Pirosequenciamento 
Sequenciamento de 20 Mb 
em 4.5 horas !!! 
46 
47 
"I think the single most important message is that genetic 
reductionism doesn't work. We are not the sum total of our 
genes.... it is the independent regulation of sets of genes, and our 
own interaction with the environment that determines who we 
are.“ 
 
 Craig Venter

Outros materiais