Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Complexidade de Genomas Genoma Termo criado por Hans Winkler, professor de botânica, em 1920. GENe + cromossOMA 2 O que é Genoma ? • É o conjunto de todo o material genético que estabelece a identidade de uma determinada espécie • Genoma = (DNA nuclear + DNA citoplasmático). Tipos de Genomas • DNA (ssDNA ou dsDNA): a maior parte dos organismos • RNA (ssRNA ou dsRNA): vírus • Circulares: genomas de procariotos, mitocôndria, cloroplasto, vírus, plasmídios • Lineares: cromossomos de eucariotos, alguns vírus 3 Elementos que compõem os genomas • Cromossomos • genes “housekeeping“ • Elementos extra-cromossomais • plasmídios • DNA de organelas • pequenos cromossomos Tamanhos de genomas Mimivírus e Mamavírus 4 Mimivírus: um vírus gigante 1,18 Mb: 979 proteínas! (2003) Acanthamoeba polyphaga Virófagos (2008) Partículas gigantes de mimivírus (vermelho) e vírus satélite de mimivírus chamado Sputnik (verde) Sputinik é um vírus parasita do mimivírus Os vírus são seres vivos ??? 5 Megavirus chilensis (PNAS, outubro de 2011) 1,25 Mb: 15% maior que o Mimivirus – 1.120 proteínas Pandoravirus salinus – julho 2013 O maior genoma viral Philippe, N. et al. Science 341, 281–286 (2013) • 0,7 micrometros, 2,5 Mb • 93% dos genes não têm homologia com nada conhecido ! • Origem a partir de um quarto domínio da vida ?? 6 Outros genomas Organismo Tamanho do genoma (pares de bases) Vírus, Fago ΦX174; 5386 – Primeiro genoma sequenciado Vírus, Fago λ 5×10 4 Archae, Nanoarchaeum equitans 5×10 5 – Menor genoma não-viral (Dez, 2005) Bacteria, Buchnera aphidicola 6×10 5 Bacteria, Wigglesworthia glossinidia 7×10 5 Bacteria, Escherichia coli 4×10 6 Ameba, Polychaos dubium 6.7×10 11 – Maior genoma ! (Dez, 2005) Planta, Arabidopsis thaliana 1.2×10 8 – Primeiro genoma de planta (Dez, 2000) Planta, Fritillaria assyrica 1.3×10 11 Fungos, Saccharomyces cerevisiae 2×10 7 – Primeiro genoma eucariótico sequenciado (1996) Nematódeo, Caenorhabditis elegans 8×10 7 Inseto, Drosophila melanogaster 1.3×10 8 Mamífero, Homo sapiens 3×10 9 A explosão de genomas sequenciados 7 Vale a pena continuar a usar o termo “procarioto” ? Nature 441: 289 (2006) Bactérias → tamanho do genoma está relacionado com o número de genes Eucariotos → tamanho do genoma NÃO está relacionado com o número de genes ou com a complexidade do organismo Razões: - muito DNA intergênico (DNA entre genes) - presença de íntrons - muito DNA repetitivo Genomas x número de genes 8 Genomas procarióticos x eucarióticos Procariotos Eucariotos Genoma compacto e econômico Grandes blocos de DNA que nada codificam (?) Sequências únicas Múltiplas cópias de sequências particulares Genes não-interrompidos Genes interrompidos com íntrons A questão dos genes interrompidos 9 Organismos com genomas maiores tendem a ter genes com mais íntrons • Levedura (uma exceção): só 4% dos genes têm íntrons • Drosophila: 83% genes têm íntrons, poucos íntrons/gene • Mamíferos e plantas: 94% genes têm íntrons, muitos íntrons/gene Nota: não há correlação entre tamanho do gene e do mRNA Gene da Distrofia Muscular de Duchenne (DMD) tem alto número de íntrons • 2,4 Mb: maior gene humano com mais de 60 éxons! • mRNA maduro tem ~14 kb • Codifica a distrofina (~500 kDa), presente no músculo esquelético e cardíaco O DNA repetitivo 1) Famílias multigênicas (genes funcionais) 2) Família de DNA extragênico repetitivo (DNA não- transcrito) 10 1) Famílias Multigênicas surgem por duplicação e posterior divergência podem estar dispersos ou agrupados (“clusters”) Tipos: 1.1. DNA repetitivo que codifica RNA (rDNA, tRNA, snRNA) rDNA: 100 cópias/genoma haploide (0,4% genoma humano) • organização in tandem • localiza-se no nucléolo • em Xenopus, os genes 18S, 5.8S, 28S repetem-se 500 vezes! • cada cluster tem uma unidade transcricional separada por DNA espaçador não-codificador. Organização do rDNA 11 rRNA e estabilidade genômica Science 327: 693-696 (2010) 1.2. DNA repetitivo que codifica para proteínas Família das histonas - os 5 genes que produzem histonas podem estar em um "cluster" que se repete várias vezes, ou podem estar dispersos, como em alguns vertebrados. 12 Distribuição dos genes das histonas em humanos Família da globina. A hemoglobina é formada por duas cadeia e duas β de globina. Família cromossomo humano 16 Família β cromossomo humano 11 Obs: Em algumas famílias, alguns membros não são funcionais, são os pseudogenes (relíquias evolutivas). • Família : genes ativos: , 2 genes idênticos e os pseudogenes : , , , • Família β: 5 genes funcionais: ε, 2 genes γ diferentes, δ, β e 1 pseudogene ( ) 13 As diferentes cadeias das globinas são utilizadas de acordo com o desenvolvimento do embrião 14 2) Família de DNA extragênico repetitivo Dividem-se em 2 classes: • Repetições in tandem • Repetições inter-espaçadas (“interspersed”) 2.1. Repetições in tandem DNA satélite (STD = “short tandem repeats”): · descoberto por sua densidade em gradientes de cloreto de césio. · tamanho médio variado. · correspondem às sequências alta ou moderadamente repetitivas · formam parte da heterocromatina, que se localiza, sobretudo, nos centrômeros (“DNA alfoide”) · existem diversas famílias de DNA satélite DNA satélite em Drosophila DNA satélite no centrômero em camundongo (hibridação in situ) 15 DNA minisatélite • tamanho médio de ~7 pb • localizam-se nos telômeros ou em outras regiões • a telemorase adiciona repetições de TTAGGG DNA microsatélite • 1-4 pb • totalmente dispersos • (A)n , (T)n, (CA)n forma Z-DNA in vitro mas não se sabe se o mesmo ocorre in vivo Obs: Os minisatélites são também chamados de VNTR ("variable number tandem repeats") São usados no teste de paternidade (“DNA fingerprinting”) pois há uma grande variação no número de cópias destes elementos entre diferentes indivíduos gerando polimorfismo genético. 2.2. Repetições interespaçadas - SINE ("short interpersed elements”) Espalhados pelo genoma, não codificam proteínas, podem “saltar” e se inserir em certos genes causando doenças, como a neurofibromatose-1 (“Mal do Homem Elefante”). Exe: "Sequências Alu" (~300 pb) que correspondem a 10% do genoma (1 milhão de cópias). Trata-se de um retrotransposon. - LINE ("long interpersed elements") Maiores que os SINEs, (7000 pb). Assim como os SINE, podem causar doenças por ruptura gênica. Exe: “Kpn repeats” (também chamados de Line-1) Os elementos móveis correspondem a quase 50% dos genomas humano e de outros primatas ! 16 Joseph Merrick (1862-1890) NF1 ou Síndrome de Proteus??? Elementos genéticos móveis • Transposon e sequências de inserção (IS): movem- se por intermediário de DNA • Retrotransposon: movem- se por intermediário de RNA 17 Composição de sequências repetidas Quase metade do genoma humano é formado por elementos transponíveis embora a atividade deles esteja bem reduzida na linhagem humana • Transposição duplicativa • Crossing-over desigual • “Escorregão” da DNA Polimerase durante a replicação• Amplificação gênica (rolling circle) Como se originam as repetições? 18 Amplificação Gênica Pode ocorrer para certos genes a fim de suprimir necessidades durante o desenvolvimento. Exe: rDNA de Xenopus forma DNA extracromossomal circular com várias cópias in tandem cromossomos politênicos durante desenvolvimento de insetos amplificação devido à pressão seletiva metotrexato induz a amplificação do gene DHFR em Leishmania Genoma de organelas • Extranuclear, origem endossimbiôntica: DNA mitocondrial (mtDNA) e de cloroplasto (cpDNA) • Circulares, pequenos, estrutura parecida com operon, proteínas ribossomais semelhantes às de procariotos • Alguns genes têm íntrons • mtDNA humano: 16,5 kb: 13 proteínas, 22 tRNA, 2 rRNA 19 • São considerados DNA repetitivos pois, embora haja uma só cópia dos genes/círculo, há várias cópias do círculo/célula • Minicírculos e maxicírculos de T. cruzi formam o k-DNA (DNA do cinetoplasto) k-DNA O Genoma Humano 20 O genoma humano DNA mitocondrial: 16.569 pb 37 genes DNA nuclear: ~3 bilhões de pb 100.000 genes (previsto) Projeto Genoma Humano (HGP) - Consórcio Público - 21 • Iniciativa pública, lançamento oficial em 1990 • Pelo menos 18 países participaram (Austrália, Brasil, Canadá, China, Dinamarca, União Européia, França, Alemanha, Israel, Itália, Japão, Coréia, México, Holanda, Rússia, Suécia, Reino Unido, EUA) Objetivos: Sequenciar os 3 bilhões de pares de bases do genoma humano identificando os 100.000 genes previstos, Depositar e disponibilizar estas sequências em bancos de dados, Desenvolver ferramentas computacionais para a análise das sequências, Transferir tecnologia para o setor privado, Discutir as questões éticas, legais e sociais que fossem levantadas. • Human Genome Organization (HUGO): coordenação geral • Mais de 1.100 cientistas trabalharam no projeto durante toda uma década e foram gastos cerca de US$ 3 bilhões. • As sequências foram depositadas no GenBank (http://www.ncbi.nlm.nih.gov/) • Em 1992: primeiro mapa de baixa resolução de todos os cromossomos humanos. 22 Center for Genome Research (Whitehead Institute) Projeto Genoma Humano - Iniciativa Privada (Celera) - Craig Venter funda o The Institute for Genomic Research (TIGR) 1995: Venter publica o primeiro sequenciamento do genoma de um ser vivo: Haemophilus influenzae (apenas 1 ano!) 23 • Em 1998, Craig Venter se associou à divisão Applied Biosystems da empresa privada Perkin-Elmer para fundar a Celera Genomics Corporation. • Custo do projeto projeto: US$ 300 milhões (3 anos) • Previram que 100 a 300 genes de interesse para as indústrias farmacêuticas seriam patenteados Acredita-se que cada ser humano tenha 99,9% de suas sequências de DNA idênticas entre si. • As companhias farmacêuticas estão particularmente interessadas no 0,1% de diferenças entre nossos genomas, pois são estas variações que podem ser responsáveis pelo fato de uma droga ser eficaz num indivíduo e não em outro. Vantagens da Celera: robotização e bioinformática 24 Estratégia: “shotgun” (Celera) Estratégia: “sequenciamento direcionado (ordenado)” (HGP) Estratégias de sequenciamento HGP x Celera 1999: Primeiro cromossomo sequenciado: número 22 Nature 402: 489-495 (1999) 2000: Sequenciamento do cromossomo 21 Nature 405: 311-319 (2000) 26 de junho de 2000: o presidente norte-americano Bill Clinton e o primeiro ministro inglês Tony Blair anunciaram que o consórcio PGH e o grupo Celera haviam completado o primeiro esboço do genoma humano. 25 Fevereiro de 2001: publicação do esboço do genoma humano HGP: Nature, vol. 409 (2001) Celera: Science, vol. 291 (2001) Abril de 2003: “fim” do projeto. Previsão de 30 a 40 mil genes 2006: último cromossomo sequenciado: o de número 1, o maior cromossomo humano (8% genoma) - Nature 441: 315-321 (2006) 26 A contribuição brasileira • Projeto Genoma do Câncer Humano • Instituto Ludwig do Câncer • Sequenciamento de EST (Expression Sequence Tags) de alguns tecidos cancerosos 27 12/06/2007: Primeiro genoma individual sequenciado: James Watson Custo: menos de US$ 1 milhão Tempo: 2 meses ! Genoma do James Watson (2008) 28 05/09/2007: O primeiro genoma humano diploide é sequenciado • Sangue de Craig Venter • Genoma mais completo já feito • 44% de diferenças entre cópia da mãe em relação ao pai: diferença entre indivíduos aumentou para 99,5% S. Levy et al. PLoS Biol. 5, e254; 2007 29 Tamanho genoma haploide: 3.164.700.000 pb 99,5% de semelhança entre cada indivíduo (uma mudança a cada 300- 400 pb – Single Nucleotide Polymorphism (SNP) Número de genes preditos: entre 20-30 mil Celera – 39.114 Consórcio público – 29.691 Genes já conhecidos – 11.015 menos de 2% genoma = genes codificadores de proteínas 1/3 genoma é formado por íntrons ! DNA extragênico é a maior parte do genoma Afinal, quantos genes nós temos? Resposta: • 20.488 genes codificadores de proteínas. e os RNA não-codificadores?? Quadro de apostas em 2000 30 Projeto ENCODE - 2003 • ENCyclopedia Of DNA Elements • Identificar todos os elementos funcionais do genoma • Finalização em setembro 2012 80% do DNA lixo é transcrito O genoma é praticamente todo transcrito !!! A complexidade da transcrição desafia o conceito de gene • Anos 60: 1 gene codifica 1 proteína • Hoje: uma mesma região do DNA pode gerar vários transcritos 31 Transcrição “Pervargante” (em todas as direções) Afinal, o que é um gene??? Proposta: “o gene é a união de sequências genômicas codificadoras de um conjunto de produtos funcionais sobrepostos” 32 RNAs não-codificadores 33 Como os genes humanos podem codificar para mais de uma proteína? 1) Múltiplos sítios de iniciação da tradução no mesmo mRNA 2) Promotores alternativos para o mesmo gene 3) Vários sítios de splicing podem gerar diferentes mRNA que, por sua vez, podem gerar diferentes proteínas Nature, maio 2010 Um secundo código genético: um que prediz como segmentos de mRNA transcritos a partir de um dado gene podem ser combinados para gerar múltiplos produtos em diferentes tecidos, um processo chamado splicing alternativo 34 Pseudogenes • Relíquias evolutivas “mortas” • Alguns podem ser protogenes • No genoma humano há mais de 19.000 pseudogenes para somente 21.000 genes codificadores de proteínas ! • Pseudogenes: 1) não-processados (com íntrons) - 11.000 2) processados (sem íntrons) - 8.000 Pseudogenes funcionais! Nature 458 (2008) 35 Benefícios do projeto Genoma Humano • Compreensão mais ampla da organização do genoma e função dos genes humanos pela comparação com outros genomas já sequenciados. • Diagnóstico antecipado de doenças. • Desenvolvimento de drogas específicas para certos indivíduos – drogas racionais (farmacogenômica). • Aplicação da "terapia gênica" para a cura de doenças genéticas. • Determinação da predisposição genética de indivíduos a agentes cancerígenos. • A análise comparativa de diversos genomas humanos permitirá determinar a linhagem e evolução das raças. • Estabelecimento de novas estratégias para a determinação da identidade deindivíduos ("DNA forense"). 36 Projeto “1000 Genomas” • Lançado em 2008 • Consórcio internacional • Sequenciar pelo menos 1000 genomas de indivíduos de diversas partes do mundo • Verificar as diferenças entre populações – interesse médico O Brasil na era genômica Julho, 2000: genoma de Xylella fastidiosa 37 O genoma do chimpanzé Setembro de 2005 96% de identidade com humanos Abril de 2007: Genoma do macaco Rhesus 38 Maio 2008 – Genoma do ornitorrinco • Nature, vol 453 (2008) • Uma mistura de características genéticas de mamíferos, pássaros e répteis Novembro 2008 – Genoma do mamute 39 Primeiro genoma de um paleo-humano - 2010 40 Benefícios: Paleogenômica Poinar et al., Science 311: 392-394 (2006) Metagenoma do mamute tem pouco DNA ambiental Genoma do Homem de Neanderthal Svante Pääbo, em 1997, publica a primeira sequência de DNA mitocondrial Cell 90: 19-30 (1997) 2006: Svante Pääbo sequencia 1 milhão de pb de DNA nuclear (0,003% genoma) – há muita contaminação com DNA humano moderno... – cromossomo Y é bem diferente de humanos e chimpanzés 41 2008: Genoma mitocondrial completo! Green, R.E. et al. Cell 134, 416-426 (2008) Primeiro esboço... Science, 328 (2010) 42 Abril 2009 Participação brasileira! Soja: 2010 43 Genoma do gorila - 2012 Mais antigo genoma sequenciado Nature, junho de 2013 • Cavalo de Przewalski • ~700 mil anos de idade 44 Tecnologia e Genômica Genomas Sintéticos Science 319, 1215 (2008) 45 Primeiro genoma desenhado in silico Science, 328 (2010) Pirosequenciamento Sequenciamento de 20 Mb em 4.5 horas !!! 46 47 "I think the single most important message is that genetic reductionism doesn't work. We are not the sum total of our genes.... it is the independent regulation of sets of genes, and our own interaction with the environment that determines who we are.“ Craig Venter
Compartilhar