Prévia do material em texto
AULA 6 - REPLICAÇÃO, TRANSCRIÇÃO E TRADUÇÃO GRINGO 86 Bioinformática Conceito: estudo da aplicação de técnicas computacionais, matemáticas, físicas e químicas visando auxiliar estudos biológicos. Dogma de Crick Explica como ocorre o fluxo de informações do código genético. Esse modelo mostra principalmente que uma sequência de um ácido nucleico pode formar uma proteína, entretanto o contrário não é possível. Segundo esse dogma, o fluxo da informação genética segue o seguinte sentido: DNA → RNA→ PROTEÍNAS. Estrutura DNA: • Fosfato, desoxirribose e base nitrogenada, sendo elas: Adenina, Guanina, Citosina e Timina. • Purinas apresentam anel duplo (Adenina e Guanina) • Pirimidinas apresentam anel único (Citosina e Timina). Densidade Genetica DNA bacteriano é altamente compacto e sem introns nos genes. DNA humano é esparso e tem várias regiões não codificantes. Acreditavam se tratar de regiões lixo (junk DNA), sem função. Vários trabalhos recentes demonstram a importância desse DNA na regulação gênica. Transferencia de DNA Transformação - Processo onde a bactéria capta do meio extracelular um Dna de outra bactéria que morreu ou o secretou. Conjugação - Uma célula é doadora e outra receptora. É transmitido um material (F) que confere fertilidade. Esse fator F é o plasmídeo. O DNA F faz uma “replicação em círculo rolante” e passa o material para a receptora Transdução - Fagos injetam material genético na célula bacteriana. Podem injetar o próprio material genético ou inclusive captar material bacteriano e levar o material para outra bactéria. Tipos de mutações • Mutações no sítio ativo - diminuem ou mudam a atividade da proteína: • Mutações nulas - não existe o produto protéico ou ele existe mas não funciona. • Mutações vazantes - apresentam função residual. • Mutações fora do sítio ativo “podem” ser silenciosas. Replicação A replicação do DNA ocorre de forma semiconservativa, é iniciada em origens únicas e geralmente ocorre de forma bidirecional, a partir de cada origem de replicação. A replicação do DNA é um processo semiconservativo, pois cada uma das suas moléculas recém formadas conserva uma das cadeias da molécula que a originou e forma uma cadeia nova, complementar ao seu molde. A replicação do DNA envolve três etapas: • Iniciação • Ampliação ou alongamento • Término O DNA começa a ser sintetizado pela extensão de extremidade 3’ do iniciador. A fita molde irá orientar qual dos quatro nucleosídeos trifosfatados será adicionado. As duas fitas possuem uma orientação antiparalela, o que significa que a fita molde para a síntese de DNA tem orientação oposta à fita de DNA que está sendo sintetizada. A síntese do DNA é catalisada pela enzima DNA-polimerase. O pareamento correto das bases é necessário para que a DNA-polimerase catalise a adição do nucleotídeo. Ambas as fitas do DNA são sintetizadas juntas na forquilha de replicação, com orientação antiparalela. Transcrição No processo de transcrição, uma molécula de DNA serve como molde para a criação de uma molécula de RNA. É nessa molécula de RNA que é encontrado o código usado para organizar a sequência de aminoácidos e formar as proteínas no processo de tradução. Esse processo consiste na união de aminoácidos, obedecendo à ordem de códons apresentados em um RNA mensageiro. Observa-se também a replicação do DNA, processo pelo qual uma molécula de DNA é capaz de formar outra molécula idêntica à original. Hoje também se sabe que uma molécula de RNA pode produzir DNA. Chamamos esse processo de transcrição reversa e ele acontece principalmente em vírus. Eles possuem uma enzima denominada transcriptase reversa, que transcreve o RNA para o DNA. Propriedades do RNA Cadeia unifilamentar de nucleotídeos altamente dobrável. Açúcar ribose nos nucleotídeos. Uracil no lugar de timina. Pode catalisar importantes reações biológicas. RNA mensageiro Intermediário para a formação de proteínas (RNA informacional). RNA funcional São ativos como RNA. Não são traduzidos. • RNA transportador (tRNA) - levam o aminoácido correto para o mRNA durante a tradução. • RNA ribossômico (rRNA) -principais componentes dos ribossomos que fazem a tradução. • RNA pequenos nucleares (snRNA) - fazem parte do spliceossomo e demais ações que processam o RNA. A RNA polimerase faz a adição de ribonucleotídeos. A Rna polimerase desenrola o gene à frente e reelicoidiza atrás. Transcrição A transcrição é o processo de formação de uma molécula de RNA a partir de uma molécula molde de DNA. Neste processo, as fitas do DNA se separam e uma serve de molde para o RNA, enquanto a outra fica inativa. Ao fim da transcrição, as fitas que foram separadas voltam a se unir. Etapas da transcrição 1 – Reconhecimento da fita molde de DNA O DNA e as polimerases do RNA (enzimas catalizadoras da reação) estão livres na célula e podem se encontrar ao acaso, porém a transcrição só tem início quando a enzima encontra e liga-se fortemente ao sítio promotor. http://audima.co/ https://www.infoescola.com/biologia/rna/ https://www.infoescola.com/biologia/dna/ Quando isso acontece, a dupla-hélice é desenrolada e as fitas são separadas. 2 – Início da transcrição A polimerase ligada à região promotora inicia o processo de transcrição, adicionando os primeiro nove nucleotídeos da seqüência de RNA. Essa fase é chamada de fase de iniciação. 3 – Elongação Após a produção de aproximadamente nove nucleotídeos, a polimerase do RNA passa a se deslocar pela molécula de DNA, desenrolando sua hélice e produzindo uma molécula de RNA, cada vez mais alongada. O DNA já transcrito volta a ser enrolado, quase que imediatamente, recompondo a sua dupla-hélice. Esse processo é chamado de fase de elongação. A fita de RNA produzida é simples e livre. 4 – Término Quando a polimerase do RNA encontra a seqüência de terminalização, o RNA para de ser transcrito. A partir desse momento, nenhuma outra base nitrogenada é incorporada ao RNA. Neste momento, a bolha de transcrição se desprende, liberando uma molécula de RNA e imediatamente a molécula de DNA se enrola completamente. A seqüência de DNA que contém os genes sinalizadores do término é chamada de região terminalizadora. Tradução O processo de tradução gênica consiste em unir aminoácidos de acordo com o a sequência de códons do RNA mensageiro. Códon é uma trinca de bases nitrogenadas do mRNA, que tem sua trinca complementar (anticódon) no RNA transportador correspondente. A tradução ocorre nos ribossomos, que estão situados no citoplasma. O mRNA é traduzido em proteína pela ação de uma variedade de moléculas de tRNA, cada uma específica para cada aminoácido. A sequência de nucleotídeos de uma molécula de mRNA é traduzida na sequência apropriada de aminoácidos de acordo com as determinações do código genético. Existem 64 trincas possíveis de nucleotídeos, sendo que apenas 61 codificam a produção de aminoácidos (2 sinalizam o início da tradução), enquanto 3 trincas correspondem a sequências de término da tradução. A tradução tem início com a associação de um ribossomo, um mRNA e um tRNA carregando o aminácido metionina, que se ligam ao sítio P do ribossomo. O anticódon deste tRNA é UAC e seu códon no mRNA é AUG. Essa trinca consiste no códon de inicialização. Um outro tRNA liga-se ao ribossomo no sítio A. Assim que os dois primeiros tRNAs se encaixam nos sítios P e A, o ribossomo catalisa a ligação dos aminoácidos de seus tRNAs, deslocando-se pela molécula de mRNA, espaço correspondente a uma trinca de bases. https://www.infoescola.com/citologia/nucleotideos/ https://www.infoescola.com/bioquimica/bases-nitrogenadas/ https://www.infoescola.com/bioquimica/bases-nitrogenadas/ https://www.infoescola.com/bioquimica/aminoacidos/ https://www.infoescola.com/genetica/rna-mensageiro/ https://www.infoescola.com/bioquimica/bases-nitrogenadas/ https://www.infoescola.com/bioquimica/bases-nitrogenadas/ https://www.infoescola.com/genetica/rna-transportador/https://www.infoescola.com/citologia/citoplasma/ https://www.infoescola.com/citologia/nucleotideos/ Conforme o ribossomo se desloca, os sítios são ocupados por novos tRNAs com seus aminoácidos correspondentes ao mRNA, e as ligações entre os aminoácidos são sintetizadas, até encontrar as sequências de sinalização de término da tradução. A tradução termina quando um códon finalizador é encontrado na mesma fita de mRNA que está sendo traduzida. Regulação Genica A indução do sistema lac Os segmentos P (promotor), O (operador), Z, Y e A constituem um óperon, isto é, uma região que transcreve um mRNA multigênico (Z, Y e A) mais um promotor (P) e uma região reguladora (O). Na presença de lactose, esta se liga ao repressor causando uma transição alostérica e impedindo sua ação repressora. A lactose, nesse caso, é um indutor, pois causa alívio da repressão (indução). O repressor fica entre o promotor e os genes impedindo o movimento da RNA polimerase nesse caso. À medida que a lactose é consumida, a proteína repressora fica livre para se ligar ao operador novamente. AULA 7 - SEQUENCIAMENTO GENOMICO BITOCA 86 Genoma: conjunto de todos os genes contidos nos cromossomos haplóides de uma dada espécie. O genoma humano, portanto, consiste de 24 cromossomos: 22 cromossomos autossomos + 2 cromossomos sexuais X e Y Sequenciamento genômico: é uma técnica que permite identificar, na ordem correta, a sequência de nucleotídeos de uma molécula de DNA ou RNA, visando conhecer a informação genética contida nesta estrutura. Ele é feito a partir de moléculas de DNA advindas diretamente do DNA genômico (aquele que contém a maior parte da informação genética dos organismos) ou de outras moléculas de DNA celular como: DNA mitocondrial, DNA cloroplastídico, DNA plasmidial, dentre outros. Permite obter informações referentes a: expressão gênica diferencial; estrutura e função dos genes; diversidade genética; presença de elementos móveis no genoma; Metodologias de sequenciamento em pequena escala: Permitiram determinar a sequência de nucleotídeos de fragmentos maiores de DNA. • Maxam-Gilbert - Alan Maxam e Walter Gilbert (baseada em hidrólise química): Neste método a molécula inicial é clivada diretamente. O primeiro passo consiste em marcar radioativamente o DNA alvo, ou seja, a molécula a sequenciar. Para tal, são usados isótopos radioativos, tais como 32P e 35S. De seguida, separam-se as duas cadeias de DNA. Distribui-se por 4 tubos, um para cada família. Em cada tubo irão ocorrer alterações químicas específicas para uma base (A, C, G ou T). As moléculas são clivadas. Por exemplo, no tubo em que o tratamento foi direcionado para a adenina, após a clivagem, a extremidade do fragmento de DNA marcada com o radioisótopo, apresentará uma base que corresponde à que precede a adenina. O passo seguinte é idêntico ao método de Sanger. Cada família é separada em gel de eletroforese e a sequência é lida a partir do próprio gel. Os fragmentos menores são clivados mais próximo da extremidade 5’ enquanto que os fragmentos maiores são clivados mais próximo da extremidade 3’. • Método de Sanger - Frederick Sanger e cols. (baseada em reações enzimáticas): também utiliza marcação radioativa. A diferença é que a primeira marcava diretamente o DNA a ser sequenciado enquanto a de Sanger, marcava os fragmentos de DNA sintetizados a partir da fita molde. A síntese de novos fragmentos de DNA a partir da fita molde só foi possível graças ao desenvolvimento da técnica de PCR. É necessário ainda a presença de didesoxinucleotídeos (ddATP, ddCTP, ddGTP e ddTTP), que atuam como terminadores da síntese de DNA. Cada vez que um ciclo de PCR era finalizado um fragmento de DNA de tamanho distinto poderia ser formado, e esta variação dependia da incorporação de um ddNTP ou desoxinucleotídeo (dNTP). Se acaso o ddNTP fosse incorporado, por falta da hidroxila na posição 3 da pentose, o processo de extensão da cadeia crescente era interrompido (comparar estruturas). Após inúmeros ciclos de PCR, amostras dos respectivos tubos, contendo especificamente seus respectivos ddNTPs são aplicadas em canaletas individualizadas do gel de acrilamida. Feita a eletroforese, o perfil de bandas, lidas de baixo pra cima, determina a correta sequência da molécula de DNA em sua fita complementar, logo o reverso complementar poderia ser definido. • Método de Sanger Automatizado: Para sequenciar grandes extensões de DNA, o método de Sanger pode ser acelerado através da automação. Isso exigiu que as técnicas de marcação radioativa descritas anteriormente, que não são facilmente automatizadas, fossem substituídas por técnicas de marcação fluorescente (eliminando danos à saúde e problemas de armazenamento decorrentes do uso de nucleotídeos radioativos). Cada um dos quatro ddNTPs usados para terminar a extensão de cadeia é ligado covalentemente a um marcador fluorescente de cor diferente e as reações de extensão de cadeia são realizadas em um único tubo que contém os quatro ddNTPs marcados. A mistura de fragmentos formados é, então, submetida à eletroforese em uma 'única canaleta do gel de sequenciamento e a medida que cada fragmento sai do gel, sua base terminal é identificada de acordo com o seu espectro de fluorescência, que é característico para cada base, por um sistema de detecção de fluorescência induzido por laser,[4]em cada reação, ou seja, para cada base (A,T,G,C) utiliza-se um fluorocromo diferente (uma cor diferente), de modo que os produtos podem ser reunidos e a eletroforese destes realizada em um único canal do gel de sequenciamento. O sinal fluorescente diferencial emitido por cada fragmento, após iluminação com um feixe de laser, identificará os produtos baseado na diferença de comprimento de onda. a luz emitida é detectada por escaneamento do gel e a sequência deduzida por computador. Fragmentação do DNA: As técnicas de fragmentação são várias, dentre as quais destacamos: • Fragmentação enzimática - uso de enzimas de restrição de corte freqüente, como Alu1; • Sonicação – método que utiliza ondas sonoras, geralmente ultrassom, para fragmentar a sequência de DNA. • Fragmentação mecânica - quebra aleatória por fragmentação mecânica do genoma a ser sequenciado (shotgun). É a mais utilizada. Técnica de Shotgun: Consiste em “atirar no escuro” (do inglês, shotgun), ou seja, bombardear aleatoriamente o genoma a ser sequenciado com partículas que promovem sua fragmentação. • No Shotgun de genoma completo (WGS), o DNA total do organismo, representado no modelo como um genoma circular bacteriano, é fragmentado, clonado e sequenciado. Fragmentos grandes são essenciais ao processo de montagem por permitir identificar e ligar contigs adjacentes. • Na técnica de shotgun hierárquico (também conhecido como sub- biblioteca) também há fragmentação do material genético, só que os fragmentos gerados são grandes, e por isso precisam ser primeiro clonados em BACs. Posteriormente, este inserto é novamente clivado em fragmentos menores e subclonados em plasmídeos. A partir deste ponto a técnica é idêntica ao WGS. Primer Walking: Como existe uma limitação da ação da polimerase e devido a baixa resolução dos géis de sequenciamento, haverá um momento em que os nucleotídeos não serão mais determinados, reduzindo a eficiência do processo. A partir desta nova sequência determinada (1), desenha-se um novo oligonucleotído nas proximidades da posição 3 ́e tem-se início a um novo processo de sequenciamento, gerando o fragmento 2, que servirá para molde do desenho de um novo oligonucleotídeo, e assim por diante continua- se o processo. Repare que é como se fossem dados pequenos passos para se conhecer a sequência completa, daí a definição primer walking. Sequenciamento de nova geração (Next Generation Sequencing – NGS): Segunda Geração: Pirosequenciamento 454: Utiliza como como base o piro-sequenciamento. Esta tecnologia dispensa a clonageme tem baixo custo (comparado a outros métodos existentes), e o sistema de sequenciamento é cerca de 100 vezes mais rápido quando comparado ao método de sequenciamento padrão de Sanger. Illumina: Utiliza como como base o sequenciamento por síntese (SBS). O princípio desta metodologia é similar ao método proposto por Sanger, pois temos em ambas a síntese de uma fita complementar ao DNA alvo utilizando DNA polimerase e nucleotídeos terminadores marcados com diferentes fluoróforos. A fluorescência emitida após a incorporação de cada nucleotídeo é registrada como imagem e no final, através de uma decodificação destas imagens, tem se a sequência de interesse. SOLiD - Sequencing by Oligonucleotide Ligation and Detection; Baseado em hibridização e ligação. Permite o sequenciamento de genomas e transcriptomas com alta confiabilidade e cobertura (depth / coverage). Problemático para para montagem de novo de genomas devido ao tamanho das leituras. Grande volume de dados exige grande capacidade computacional. Sequenciadores de 3° geração: As tecnologias de sequenciamento de terceira geração, ainda em fase de desenvolvimento, prometem novamente revolucionar a ciência genômica por diminuir ainda mais o custo do sequenciamento. Ainda há controvérsias em sua definição, mas alguns autores consideram como de terceira geração as técnicas que não se baseiam em fluorescência ou luz. Outros consideram como de terceira geração as técnicas que prometem sequenciar fragmentos muito maiores do que os fragmentos sequenciados atualmente. Ion Torrent: A técnica de sequenciamento do Ion Torrent se baseia na detecção da mudança de pH do meio pela liberação de Íons de hidrogênio durante a replicação do DNA utilizando a enzima DNA polimerase. Plataforma focada em velocidade e praticidade (é considerada a mais rápida para sequenciamento de genomas). Pacific Biosciences (PacBio): Também conhecido por Single Molecule, Real Time (SMRT) sequencing, ou sequenciamento real time (em tempo real, significando que você pode ir vendo o resultado à medida que o sequenciamento ocorre) de molécula única (sem necessidade de amplificação da amostra por PCR). Possui uma enzima de alta processividade (estima-se até 20Kb), ancorada no fundo do poço, onde existe uma câmara que detecta as cores geradas pela incorporação de cada base específica, sendo cada uma marcada por um agente fluorescente de cor diferente. MinIon: Possui uma membrana onde existe um nanoporo (lembrando da estrutura de proteínas em formato de barril todo beta). A passagem de qualquer tipo de composto químico pela membrana causa mudanças na mesma que são diferentes para cada composto e podem ser detectadas. A DNA Polimerase se encarrega de “empurrar” o DNA para dentro do poro, passando pela membrana. Assim como o PacBio, realiza sequenciamentos de sequências de até 20 Kb em tempo real. AULA 8 - GENOMICA COMPARATIVA Preju 86 Montagem de Genoma: Montar e ajustar os nucleotídeos na ordem correta e organizada. É feito da seguinte forma, geração contigs ( contígua ), de modo que cada nucleotídeo tenha semelhança com o vizinho, através do alinhamento reads, que le os nucleotideos durante a montagem. A união de vários contigs, levando-se em consideração a sintenia gênica, leva a formação de scaffolds (arcabouço). Assemblers: Programa de montagem. Ou seja, os contigs são um conjunto de reads, no qual estes muitas vezes se sobrepõem, ignorando esses repetições sobrepostas e formando uma sequência contínua. Um problema que pode ocorrer é a não retirada das sobreposições ou a inserção de DNA incorretos no DNA nascente. Overlap: Encontra reads em sobreposição Layout: Reune as Reads em Cotings, e as cotings em supercotings. Consensus: Cria o sequenciamento de DNA final e corrige os erros que passaram. Kmers: Uma reeleitura de parte dos Reads. Teoria dos Grafos Tirar toda a parte inicial que tem repetições sequenciais. Ex: “ Sera que é tudo isso em vão. Sera que nada vai acontecer Sera que vamos conseguir vencer” É tudo isso em vao Sera que ... nada vai acontecer Vamos conseguir vencer. Anotação Genomica •A anotação estrutural consiste na localização dos elementos que constituem o genoma; •A anotação funcional por sua vez visa identificar a função biológica da sequência. Era pós genomica No método Sanger de sequenciamento, o DNA alvo é copiado muitas vezes, produzindo fragmentos de comprimentos diferentes. Nucleotídeos “terminadores de cadeia” fluorescentes marcam os finais dos fragmentos e permitem que a sequência seja determinada. Sequenciamento de segunda geração: permitem estudar genomas microbianos completos a partir de amostras ambientais, bem como identificar e pesquisar clusters gênicos funcionais codificando enzimas microbianas de interesse tecnológico, como lipases, despolimerases ou hidrolases para polímeros complexos. Por que comparar Genomas? Assim como podemos comparar estrutura de apêndices locomotores ou estruturas e conformações cranianas entre espécies, destacando diferenças e similaridades, podemos comparar composição de genomas (no que tange presença ou ausência de genes, organização de genes, entre outros) e relacionar isso com as características funcionais das espécies. As verdadeiras questões que levarão à uma melhor compreensão da relação entre genótipo de um organismo (conteúdo de DNA) e seu fenótipo (características enquanto ser vivo) são mais facilmente descobertas quando realizamos comparações entre organismos evolutivamente parecidos (similar ao que é feito em uma cariotipagem), mas que possuem algumas diferenças em questões essenciais relacionadas ao seu metabolismo. Perspectiva esta fundamental para a ciência denominada Genômica Comparativa. Dentro da genômica comparativa, podemos calcular, por exemplo: (I) o número de genes por cromossomo entre diversas espécies, (II) o número médio de éxons ou íntrons de cada gene, (III) a distribuição de nucleotídeos A, C, T ou G pelos genes, (IV) a utilização de códons preferenciais nos genes codificadores de proteínas, (V) a utilização de pares de nucleotídeos (ou dinucleotídeos) entre os genes, (VI) o compartilhamento de domínios funcionais de proteínas , (VII) a presença de promotores e o tipo de promotores que devem ser “ativados” para a expressão gênica, (VIII) diversos outros fatores que podem ser descritos e comparados entre diferentes genomas. Genes Conservados: Os genes de um genoma que são compartilhados entre outros genomas são chamados de conservados, levando em conta os seguinte critérios: (I) a cobertura - percentual de comprimento de uma sequência de um organismo que se deseja comparar (query) em relação a outra sequência conhecida (subject). (II) a identidade entre as sequências – informação quanto ao nível de conservação das sequências em uma comparação posição a posição. Portanto, para ser conservado, um gene precisa estar presente ao longo de inúmeros organismos de genomas conhecidos e que sejam distantes filogeneticamente. Proteínas conservadas: que normalmente realizam a mesma função em organismos, células e genomas diferentes. * Caiu na nossa prova Genes housekeeping: Os genes responsáveis pela manutenção do metabolismo celular basalsão altamente conservados e estão presentes nos mais diversos genomas com poucas alterações. Praticamente todos os genes house-keeping de um novo genoma sequenciado podem ser identificados através de comparações de sequências com genes já conhecidos em genomas previamente sequenciados. O que é Pan Genomica? Pan-genômica é uma área recente da genômica que tem como principal objetivo a comparação genômica entre diferentes linhagens de uma mesma espécie Docking da proteína: processo de ancorar duas proteínas uma a outra ou, então, uma proteína aum composto (substrato ou droga). Gene específico (caiu na nossa prova) Normalmente se descobre uma determinada quantidade de genes que não apresentavam nenhuma similaridade de sequência com nenhum gene de nenhuma outra espécie conhecida. Esses genes espécie- específicos, quando são pela primeira vez encontrados, não se pode definir ao certo qual seria sua função celular. É interessante notar que, à medida que mais genomas vão sendo descobertos, menor é o número de genes espécie-específicos que se descobre. Sistenia Gênica ( caiu na nossa prova ) Os estudos de sintenia se referem ao entendimento de como a ordem dos genes ao longo dos genomas foi se modificando ao longo do tempo, caso venham a ser alterados. Quando falamos de estudos de sintenia estamos querendo estudar a comparação entre a ordem dos genes em diferentes organismos O conceito de balanço gênico: A monossomia (perda de um cromossomo) tem um prognóstico pior que a trissomia (ganho de um cromossomo) por que qualquer alelo anormal será expresso. As regras sobre a monossomia ter um efeito mais pronunciado que a trissomia também se aplicam aos cromossomos sexuais. Genoma mínimo: sabe-se que determinados genes primordiais importantes para o metabolismo básico de açúcares, proteínas, ácidos nucléicos e lipídeos são sempre necessários. Utilizando a lógica de que genomas menores em tamanho codificam para um menor número de genes, tendo em vista que em média há cerca de um gene por kilobase (1000 bases) de um DNA procariótico, organismos com menores estruturas cromossômicas tenderão a apresentar menor número de sequências codificadoras. Genes Hipotéticos: Genes com funções ainda desconhecidas, são cada vez menores, visto que cada vez mais descubra-se a função de cada gene. Gene conservado hipotético: encontrado com alto nível de identidade e similaridade em outros genomas. Embora continuemos a não saber a função específica destes genes, agora conservados em outras espécies, o dado reforça a possibilidade de ser uma sequencia que efetivamente codifique uma proteína, tendo em vista que outros organismos também o apresentam em seus genomas. SNPs – Polimorfismos de Nucleotídeos únicos Em espécies altamente diversas como a nossa, há determinadas variações entre os genomas que são conhecidas e catalogadas. Por exemplo, em um determinado gene alguém pode ter um nucleotídeo C em uma posição e outra pessoa apresentar um nucleotídeo T nesta mesma posição de um gene. Se essa diferença for polimórfica e isso significa que essa variação deve estar presente em pelo menos 1% dos indivíduos do grupo que se analisa, os biólogos resolveram chamar essas mudanças de SNPs. Na sigla em inglês, o SNP significa Single Nucleotide Polymorphism ou polimorfismo de um único nucleotídeo. Tais polimorfirmos são importantes de ser catalogados porque muitos deles podem causar ou predispor a doenças e é interessante que o indivíduo tenha um diagnóstico cada vez mais precoce das doenças que ele possa vir a ter. A doença conhecida como Anemia falciforme consiste exatamente em uma mudança de bases, de um A para T no gene da cadeia beta da hemoglobina que causa uma mutação do aminoácido ácido glutâmico para valina na sexta posição desta cadeia. Essa mutação faz com que a hemoglobina do anêmico tenha formas distorcidas e não carreguem eficientemente o oxigênio através do sangue. Metagenoma ( Caiu na nossa prova) É o genoma coletivo da microbiota total encontrada em um determinado hábitat. Metagenômica: É a análise genômica das comunidades de microrganismos de um determinado ambiente por técnicas independentes de cultivo. • Objetivos Identificar genes funcionais e/ou novas vias metabólicas; Estimar a diversidade microbiana; permitindo o estudo dos genomas em uma comunidade como um todo; Compreender a dinâmica da população de uma comunidade inteira; Microbiota: conjunto dos microorganismos que habitam um ecossistema, principalmente bactérias, mas também alguns protozoários, que geralmente têm funções importantes na decomposição da matéria orgânica e, portanto, na reciclagem dos nutrientes. Disbiose: mudanças na composição da microbiota, desbalanço entre bactérias com efeito positivo e negativo. Genes codificadores de proteínas hipotéticas são aqueles que apresentam uma ORF, e um códon de parada (Stop Códon válido), mas cujas proteínas ainda não foram caracterizadas experimentalmente. Os genes codificadores de proteínas hipotéticas conservadas são assim chamados por possuírem similaridade com outros organismos.