Baixe o app para aproveitar ainda mais
Prévia do material em texto
Aula 1 – Organização e evolução de genomas Genômica e Proteômica Profa. Msc. Isadora Louise Genomas e proteomas Organização dos genomas: DNA organizado em cromossomos; Quantidade de sequência de nucleotídeos de DNA por célula constante (intra espécies) e bastante variável (entre espécies) Organismo Tamanho do genoma (pb) VírusEpistein-Barr 0,172x106 Bactéria (E.coli) 4,6x106 Levedura (S.cerevisae) 12,5x106 Vermenematódeo (C.elegans) 100,3x106 AgriãoThale(A.thaliana) 115,4x106 Moscadas frutas (D.melanogaster) 128,3x106 Humanos (Homo sapiens) 3.223x106 Genes: Gene que codifica uma proteína: corresponde a uma sequência de nucleotídeos ao longo de uma ou mais regiões de uma molécula de DNA Procariotos: Genes são regiões contínuas de DNA Eucariotos: Éxons e Íntrons (Splices) => controle da informação organiza a expressão de genes. Regulação da expressão gênica: fatores ambientais (estresses, nutrientes...) Estrutura dos genes Estrutura dos genes Regiões de controle do DNA: sequências sinalizadoras ou de bloqueio (ligação de moléculas ativadoras ou repressoras da transcrição); óperons (procariotos) – genes contíguos codificando diversas proteínas que catalisam etapas sucessivas em uma sequência de reações integradas, estando todos os genes sob o controle de uma mesma sequência reguladora. Tamanho do genoma não está relacionado à complexidade do mesmo (variação no nº de sequências repetidas, nº de cromossomos, distribuição dos genes...) Proteomas Estudos em larga escala das proteínas totais de um individuo sob determinadas condições => complementar ao genoma. 2D-PAGE + MS Bancos de dados de genes => predição correta das proteínas? PTM Dados de transcriptoma diferem de dados de proteoma (importância da validação pela proteomica) Transmissão da informação genética Armazenamento, transmissão e implementação da informação genética => representados através de mapas. Tipos de mapas: Mapas de ligação de genes; Padrões de bandeamento de cromossomos; Sequências de DNA Outros Representam tipos diferentes de dados Transmissão da informação genética Mapas de ligação de genes (abstrato) Genes ligados: genes que representam características distintas em um mesmo cromossomo, Determinados pela observação de padrões de hereditariedade; Localização e distância de genes nos cromossomos: grupos de ligação e frequência de recombinação (quanto mais distantes estiverem 2 genes ligados, maior a frequência de recombinação); Unidade: Morgan 1 cM (1x106pb homem) = frequencia de recombinação de 1% Fonte: http://www.google.com.br/imgres?imgurl=http://www.scielo.br/img/revistas/pab/v45n11/06f01.jpg&imgrefurl=http://www.scielo.br/scielo.php%3Fpid%3DS0100-204X2010001100006%26script%3Dsci_arttext&usg=__VOrM_mC8sMdxS2EYN9o8aZvvVFE=&h=877&w=400&sz=35&hl=pt-br&start=28&zoom=1&um=1&itbs=1&tbnid=OV-7tsm8AMtKnM:&tbnh=146&tbnw=67&prev=/images%3Fq%3D%2522mapa%2Bde%2Bliga%25C3%25A7%25C3%25A3o%2522%2Bde%2Bgenes%26start%3D18%26um%3D1%26hl%3Dpt-br%26client%3Dfirefox-a%26sa%3DN%26rls%3Dorg.mozilla:pt-BR:official%26ndsp%3D18%26biw%3D1366%26bih%3D520%26tbs%3Disch:1&ei=rx1wTb-bKc-ftgeO34yJDw Transmissão da informação genética Padrões de bandeamento de cromossomos Cromossomo: objeto físico; padrões de bandas=> características visíveis; Detecção de síndromes; Origem dos cromossomos: Distinção do materno x paterno (estados distintos de metilação, sinais para expressão diferenciada de genes); Transmissão da informação genética Bandeamento C Fonte: http://www.google.com.br/imgres?imgurl=http://www.scielo.br/img/revistas/rbgo/v28n9/08f2.gif&imgrefurl=http://www.scielo.br/scielo.php%3Fpid%3DS0100-72032006000900008%26script%3Dsci_arttext&usg=__HK-Mgk112UcG60Wu7TDsPFkod4E=&h=346&w=674&sz=90&hl=pt-br&start=2&zoom=1&um=1&itbs=1&tbnid=JpcDiLWFheIUeM:&tbnh=71&tbnw=138&prev=/images%3Fq%3Dbandeamento%2Bcromossomico%2BC%26um%3D1%26hl%3Dpt-br%26client%3Dfirefox-a%26rls%3Dorg.mozilla:pt-BR:official%26biw%3D1366%26bih%3D520%26tbs%3Disch:1&ei=nx9wTaT9N8yBtgfw0-yWDw Transmissão da informação genética Sequências de DNA (informação hereditária armazenada em sua forma física). Sequência de nucleotídeos de uma molécula Bioinformática: sequência de caracteres Transmissão da informação genética Outros tipos de mapa: Restrição: estabelece a ordem e a distância entre os sítios de clivagem das enzimas de restrição => importante para a clonagem e sequênciamento gênico. Contíguos: clivagem dos fragmentos (enzimas de restrição) em fragmentos ainda menores, clonados e ordenados pela sobreposição de sequências. Transmissão da informação genética Relação cromossomos, genes e sequências de DNA => identificação de deficiências moleculares responsáveis por doenças hereditárias (Passado) Sequenciamento tornou possível: Identificação do gene: testes para identificar doentes e portadores (aconselhamento genético); Identificação da proteína: desenvolvimento de terapias; Não é necessário o conhecimento da localização cromossômica do gene Gene desconhecido: traçar uma relação entre fenótipo e gene: integração dos mapas: clonagem posicional ou genética reversa. Ex: Fibrose cística Mapeamento entre os mapas Mapa de ligação gênica e Mapa de padrões de bandeamento: FISH (hibridização in situ por fluorescências): sequência de DNA utilizada como sonda é marcada com corantes fluorescentes. Hibridização com os cromossomos: detectar ligação e estimar distâncias genéticas; detectar anomalias cromossômicas; Mapeamento entre os mapas Mapa de ligação gênica e Mapa de padrões de bandeamento: Sequenciamento de genomas: disponibilidade das sequencias em bancos de dados e localização no genoma. Mapas de alta resolução Marcadores moleculares: Não só os genes, mas qualquer sequência que varie no indivíduo pode ser utilizada como marcador VNRTs (repetições em tandem de número variável ou minissatélites): regiões de 10 a 100 pb repetidas em sequência; repetições com o mesmo motivo podem aparecer várias vezes com tamanhos diferentes em cromossomos diferentes: distribuição do tamanho das repetições = marcador. pode determinar herdabilidade (impressão digital genética) PCR Mapas de alta resolução STRPs (polimorfismo de repetições curtas em tandem ou microssatélites): regiões de 2-5 pb repetidas muitas vezes (10 a 30 cópias consecutivas); Distribuição uniforme ao longo do genoma humano (> que VNRTs); Contíguo ou mapa de clones contíguos: Série de clones de DNA, com sequências que apresentam sobreposições de ordenamento conhecido ao longo de uma cromossomo de um organismo de interesse (ex. cromossomo humano em YACs ou BACs) – cromossomo artificial de levedura/ bactéria permite o mapeamento do genoma => sequenciamento Mapas de alta resolução STS (sítio com sequência marcada): pequena região seqüenciada do genoma, 200 a 660 pb, ex: EST (etiquetas de sequências expressas) – cDNA Selecionando genes em genomas: Busca por ORFs (fases de leitura aberta): começam com um códon iniciador (ATG) e terminam com um códon de parada => região codificadora de proteína em potencial. Técnicas para identificação: 1) Detecção de regiões similares a regiões codificadoras conhecidas de outros organismos: regiões codificadoras de sequências de aminoácidos similares a proteínas conhecidas; Regiões similares a ESTs. Selecionando genes em genomas: 2) Métodos ab initio que procuram identificar genes a partir de propriedades intrísecas das sequências de DNA: anotação de genomas assistidas por computador: procariotos (fácil – genes contíguos) x eucariotos (íntrons, éxons, splice ... ?) Alternativas para eucariotos: Busca por características das sequências (não aleatórias) Ex: primeiro éxon inicia com um ponto inicial da transcrição, precedido por uma região promotora como a caixa TATA cerca de 30 pb acima (sentido5’) do ponto inicial. Genomas de procariotos Características Única molécula de DNA circular dupla fita grande (5 Mpb); Plasmídeos Regiões codificadoras sem íntrons Organização dos genes em óperons: genes adjacentes transcritos em uma única molécula de mRNA, sob o mesmo controle transcricional (genes => proteínas com funções correlatas) Genomas de procariotos Genomas de procariotos Ex. Genoma procarioto: E.coli organismo modelo atribuição de função às sequências gênicas (anos de estudos em laboratório + busca por homólogos em bancos de dados) genoma denso em genes (89% codifica proteínas ou RNA estrutural) maior classe de proteínas: enzimas (30%) => competência metabólica ampla e versátil, permitindo seu crescimento e competição em condições variadas. Genoma Eucarioto Características: DNA moderadamente repetitivo Funcional Famílias de genes dispersos Arranjos de famílias repetidas em tandem Sem função conhecida Elementos nucleares intercalados curtos (SINEs) e longos (LINEs) Pseudogenes Genoma Eucarioto DNA altamente repetitivo Minissatélites Microssatélites Telômeros DNA dupla fita linear organizado nos cromossomos: núcleo DNA dupla fita circular (ou linear) contido em organelas (mitocôndrias e cloroplastos) Variação cromossômica => evolução. Genoma Eucarioto Alguns conceitos importantes Genes parálogos: genes relacionados que divergiram para prover funções diferentes em uma mesma espécie. Ex: globinas α e β humanas; Genes ortólogos: genes homólogos que desempenham a mesma função em espécies diferentes. Ex: mioglobina humana e de cavalo. Organismos modelo eucarióticos Saccharomyces cerevisae (levedura): desenvolvimento de métodos para a determinação de funções de produtos gênicos (nocaute e duplo-híbrido) – 1996 – 12.057.500 pb Organismos modelo eucarióticos Caenorhabditis elegans (nematóide): simples para ser estudado e complexo para ser interessante – genoma sequenciado em1998 – 97 Mpb Organismos modelo eucarióticos Drosophila melanogaster (inseto): genética do desenvolvimento e estudo de doenças humanas (homólogos para 289 genes humanos implicados em diversas doenças). Ex: modelos para malária e parkinson – 1999 –180 Mpb Ex: mRNA bicoid (porção anterior) mRNA oscar (porção posterior) Organismos modelo eucarióticos Arabidopsis thaliana (planta): modelo para plantas, visto que as mesmas possuem sistemas únicos como produção de parede celular e fotossíntese – 2000 – 125 Mpb Organismos modelo eucarióticos Homo sapiens (humano): 2001 3,2 x 109 pb sequências codificadores = 5% genoma sequências de repetições = 50% genoma Numero de genes: 20 – 25.000 => importância do processamento alternativo Polimorfismos de um único nucleotídeo (SNPs) variação genética entre indivíduos limitada a um único par de bases o qual pode ser substituído, inserido ou removido. Ex: anemia falciforme A =>T no gene da globina β = Glu => Val. ampla distribuição no genoma (a cad 5000pb) Acido glutamico = valina 32 SNPs apesar de terem surgido por mutações, muitas das posições que contém SNPs apresentam baixa taxa de mutação => marcadores moleculares estáveis no mapeamento de genes. nem todos os SNPs levam à alteração da proteína (mutações para códons sinônimos) nem todos os SNPs estão ligados a doenças, entretanto a correlação entre uma doença e um SNP específico é de grande importância para prática clínica. SNPs Tratamentos para doenças causadas p/ proteínas defeituosas ou ausentes: Provisão da proteína funcional. Ex: insulina, hormônio do crescimento... Ajustes no estilo de vida que tornem a proteína desnecessária. Ex: fenilcetonúria (evitar fenialanina) Terapia gênica Os SNPs ainda podem fornecer informações sobre migrações (importância para antropologia). Diversidade genética e identificação pessoal Marcadores moleculares => Fingerprints ou impressões digitais (minissatélites, DNA mitocondrial...) => testes de paternidade e genética forense. Protagonistas da minissérie ‘Capitu’, adaptação para TV do romance ‘Dom Casmurro’, de Machado de Assis. Protagonistas da minissérie ‘Capitu’, adaptação para TV do romance ‘Dom Casmurro’, de Machado de Assis. Se já houvesse testes de DNA naquela época, Bentinho não teria dúvidas sobre a paternidade do filho de Capitu (foto: divulgação / TV Globo). Texto na íntegra: http://cienciahoje.uol.com.br/colunas/deriva-genetica/a-revolucao-dos-testes-de-dna Se já houvesse testes de DNA naquela época, Bentinho não teria dúvidas sobre a paternidade do filho de Capitu (foto: divulgação / TV Globo). Sergio Pena Ciencia hoje, 2010, Sergio Pena Evolução de genomas Sequenciamento dos genomas: busca por eventos interessantes Mutações sinônimas: não alteram o aminoácido Mutações não sinônimas: alteram a proteína correspondente Programas computacionais podem inferir mutações sinônimas e não sinônimas a partir do alinhamento de 2 genes. Isso implica em resolver questões como: variações de genes e arranjo dos genes nos genomas entre filos (espécies...); inferir proteínas homólogas e não homólogas entre filos diferentes (função, padrão de expressão...) funções bioquímicas compartilhadas ou exclusivas de diferentes filos... Evolução de genomas Genoma mínimo – M. genitalium e H. influenzae, 1996 Organismo com o menor genoma possivel que fosse consistente com uma forma de vida independente e baseado no dogma central Classes funcionais: tradução replicação do DNA Recombinação e reparo aparato de transcrição chaperonas metabolismo intermediário (via glicolítica) ausência de biossíntese de nucleotídeos, aminoácidos e ácidos graxos maquinaria de exportação de proteínas repertório limitado de proteínas de transporte de metabólitos. identificação de possíveis funções comuns a todas as formas de vida. apenas 30% dessas proteínas tem homólogas nos genomas conhecidos => variação evolutiva Evolução de genomas Transferência horizontal de genes: aquisição de material genético de um organismo por outro, por meios naturais. Este mecanismo afetou a maioria dos genes nos microorganismos. Procariotos e eucariotos => quimeras. Genômica comparativa de eucariotos Comparação do genoma de levedura, verme, mosca e homem => 1.308 grupos de proteínas comuns. Distribuição de prováveis homólogas de proteínas humanas preditas: Apenas vertebrados 22% Vertebrados e outros animais 24% Animais e outros eucariotos 32% Eucariotos e procariotos 21% Sem homólogos em animais 1% Apenas procariotos 1% Genômica comparativa de eucariotos A criação de novas proteínas ou novos domínios é um evento raro; a criação de diferentes combinações dos domínios existentes em níveis crescentes é mais comum. Ex: acréscimos de domínios na terminação das proteínas modulares; duplicação gênica seguida de divergência. Obrigada!
Compartilhar