Buscar

BIOLOGIA MOLECULAR UNIDADE 2

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 19 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 19 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 19 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

BIOLOGIA MOLECULAR
UNIDADE 2
Para começarmos, é importante destacar que as técnicas moleculares estão em constante evolução e aperfeiçoamento e que, além disso, os aspectos gerais sobre a genética molecular e suas alterações são de extrema importância para o seu aprendizado. Assim, destaco que neste material iremos abordar as diferentes técnicas moleculares, desde as mais simples e de menor custo, até as mais complexas que permitiram o sequenciamento do genoma humano. Mas, você já se perguntou como é possível detectar poucas partículas virais que se escondem para não serem detectadas? Ou como foi possível saber exatamente a sequência do genoma humano e de outras espécies? 
Reação em cadeia da Polimerase (PCR)
A reação em cadeia da polimerase (PCR) é uma técnica de biologia molecular, muito requisitada na rotina diagnóstica de alguns laboratórios de análises clínicas de referência e no desenvolvimento de pesquisas científicas. É uma técnica que permite a amplificação de um material genético in vitro, a partir da criação de diversas cópias de uma sequência específica de interesse, baseando-se no processo natural de replicação de DNA que ocorre in vivo.  O principal objetivo do método é fornecer ao analista uma quantidade satisfatória da sequência específica do DNA, para que esta possa ser analisada individualmente e aplicada a diferentes propósitos, como o diagnóstico de doenças infeciosas ou genéticas, onde a sequência específica, que deverá ser amplificada e identificada, representa, respectivamente, o material genético de um microrganismo específico e a sequência responsável pela mutação genética. A técnica de eletroforese em gel, que você já deve ter estudado, é normalmente utilizada como controle de qualidade da PCR que, ao permitir a separação das moléculas oriundas da PCR, comprova se o processo de amplificação ocorreu de forma satisfatória. Para se obter as cópias idênticas de uma sequência específica de DNA por meio da PCR, alguns materiais devem ser utilizados durante a execução da técnica, como a Taq DNA polimerase, os primers para PCR (oligonucleotídeos iniciadores), os desoxirribonucleotídeos, a solução tampão e o DNA amostral que possui a sequência alvo. O tubo em que esses componentes são misturados é levado a ciclos repetitivos de temperaturas, feitos por um equipamento chamado termociclador, que será comentado neste capítulo. 
Taq DNA polimerase 
Como a PCR é um método submetido a diferentes níveis de temperatura, uma das principais desvantagens, dos primeiros testes que foram realizados, era a necessidade de adicionar uma certa quantidade de DNA polimerase ao final de cada ciclo da reação, já que ela não consegue desempenhar suas funções quando está em contato com as altas temperaturas presentes nos ciclos do teste. Uma das principais descobertas que possibilitou a melhoria da técnica foi o isolamento da enzima DNA polimerase de uma bactéria chamada Thermus aquaticus. Essa enzima passou a ser chamada de Taq DNA polimerase e difere da enzima humana por apresentar a resistência ao calor como principal característica, o que a tornou a principal escolha para o uso na PCR. Como o princípio do teste é reproduzir os mecanismos de replicação de DNA in vivo, a Taq DNA polimerase desempenha a função de síntese de uma nova fita de DNA, a partir da adição de nucleotídeos a uma fita molde, seguindo o sentido 5’—3’, mas com ausência da capacidade de autocorreção no sentido 3’—5’ (exonuclease). 
DNA amostral 
Representa o DNA que é extraído da amostra e que será utilizada no teste, com o objetivo de pesquisar a presença (mesmo que em baixas concentrações) ou ausência da sequência-alvo específica, através do processo de amplificação. O DNA que é extraído precisa apresentar bom estado de conservação e deve ser submetido a um processo de purificação, para evitar a presença tanto dos resquícios dos próprios reagentes utilizados no processo de extração, quanto de outras moléculas presentes na própria amostra, que apresentam potencial para interferir no andamento teste. Durante todas as etapas de manipulação do DNA amostral, é necessário cumprir todas as medidas de biossegurança, pois a contaminação por outra fonte de DNA na amostra pode levar a amplificação de sequências diferentes das que se tem interesse. 
Primers para PCR 
Assim como na replicação natural do DNA, a Taq DNA polimerase da PCR necessita de sequências iniciadoras (primers), que permitem a sua fixação e movimentação ao longo da fita, para que possa desempenhar sua função e produzir uma cópia. A sequência específica que se deseja amplificar pode ser manipulada a partir da escolha de diferentes tipos de iniciadores, para isso, duas sequências de primers são sintetizadas quimicamente para cada reação de PCR. Cada um dos dois primers utilizados atua em uma das fitas do DNA amostral e ambos possuem uma estrutura de nucleotídeos previamente projetada para se complementar aos nucleotídeos que compõem as extremidades da sequência de interesse de amplificação. A Taq DNA polimerase reconhece o primer que está estrategicamente posicionado e, a partir dele, articula a extensão da cópia da fita, limitando a amplificação apenas à sequência de interesse, e não ao DNA como um todo. Observe a ação dos primers na Figura 1.
Desoxirribonucleotídeos (dNTPs) e Solução Tampão (Buffer) 
Os desoxirribonucleotídeos representam os quatro de tipos bases nitrogenadas (que compõem a estrutura do DNA), que são adicionadas na reação de PCR, em concentrações equimolares. Durante a fase de extensão dos primers, a Taq DNA polimerase incorpora os dNTPs complementares a fita do DNA amostral, através do pareamento de bases. O conjunto dos dNTPs é formado pela adenina (dATP), citosina (dCTP), timina (dTTP) e guanina (dGTP).  O buffer utilizado na PCR é composto basicamente por íons que garantem a estabilidade do PH, assegurando a funcionalidade da Taq DNA polimerase, e por cloreto de magnésio (MgCl2), que atua como fonte de magnésio, que é um cofator enzimático fundamental para a atividade da Taq DNA polimerase. Durante o primeiro ciclo da PCR, as duas fitas do DNA amostral são utilizadas para produzir uma cópia que contém uma sequência complementar a sequência específica de interesse de amplificação, por isso, tanto a molécula de DNA original quanto a cópia que foi sintetizada podem ser utilizadas para produzir novas cópias. Diante disso, é possível declarar que a PCR é uma reação em cadeia já que, a partir de ciclos consecutivos, todas as cópias originadas de um processo de amplificação gradativo podem ser utilizadas para produzir outras novas cópias, de forma que, ao final de aproximadamente vinte ciclos da PCR, é possível obter um número de aproximadamente um milhão de cópias. Entretanto, o esgotamento da cinética enzimática interrompe o processo de amplificação do DNA de forma que, após uma certa quantidade de ciclos, o número de cópias é estabilizado. Observe a progressão dos ciclos na Figura 2.
Etapas dos ciclos da PCR 
Caro(a) aluno(a), é importante que você saiba que todos os componentes da PCR devem ser misturados em um tubo, para que este possa ser adicionado a um equipamento chamado termociclador, responsável por submeter a amostra a um ciclo de diferentes temperaturas. Cada ciclo da reação é composto por três etapas básicas e, em cada uma delas, uma determinada temperatura é imposta sobre a amostra.  Em uma reação de PCR, normalmente, a amostra sofre entre 30 a 40 ciclos, num processo que pode durar entre 2 a 4 horas. Como já foi dito anteriormente, a cada ciclo, o DNA amostral utilizado como molde sofre um processo de amplificação que resulta na criação de cópias do DNA. O fato de que a reação é composta por várias cópias de primers, enzimas Taq DNA polimerase e desoxirribunucleotídeos permite que as cópias geradas, a partir do DNA amostral, possam ser utilizadas como moldes para geração de outras cópias. As etapas de cada ciclo da PCR são:
Desnaturação
A etapa de desnaturação é o momento em que o equipamento aquece fortemente a amostra, atingindocerca de 96°C, proporcionando a separação da dupla-fita de DNA, através da desestruturação das ligações de hidrogênio presentes entre as bases nitrogenadas. A desnaturação da molécula de DNA garante a formação de duas fitas-simples, e permite que os componentes adicionados na PCR (primers, Taq DNA polimerase, desoxirribonucleotídeos) tenham acesso a sequência alvo da molécula, tornando as duas fitas possíveis moldes para a geração de cópias. 
Anelamento
Como a temperatura de 90°C promove o rompimento das ligações de hidrogênio, nessas condições os primers ficam impossibilitados de formar pareamento de base com a sequência de interesse. Por isso, o equipamento reduz a temperatura imposta, sobre a amostra, para uma faixa entre 45° e 65°C, permitindo que os primers reconheçam e se associem as extremidades das sequências de interesse de amplificação, que possuem nucleotídeos complementares a sua estrutura, o que caracteriza o processo de anelamento.  A variação de temperatura, que é imposta nessa etapa do ciclo, depende da predominância de bases nitrogenadas presentes na estrutura dos primers, já que as ligações de hidrogênio entre a citosina e a guanina formam-se mais efetivamente em temperaturas superiores as da ligação entre adenina e timina.
Extensão
Para a etapa de extensão, o equipamento precisa fornecer a temperatura ótima para o desempenho da atividade da Taq DNA polimerase, que seria cerca de 72°C. Após o pareamento de bases entre os primers e as suas respectivas sequências complementares presentes na região de interesse, a Taq DNA polimerase se liga a sequência iniciadora e passa a incorporar os desoxirribonucleotídeos complementares a sequência, criando uma cópia da região específica do DNA. 
Como cada etapa do ciclo depende de um nível de temperatura específica, é possível controlar o tempo em que os eventos de cada etapa podem acontecer, permitindo a existência de etapas de incubação e garantindo que todas as fases do ciclo possam ocorrer isoladamente. Observe as etapas da PCR na Figura 3.
Tipos de PCR
Hoje em dia, a técnica da PCR é uma das principais metodologias aplicadas na área da biologia molecular e, por existir a possibilidade de utilizá-la para alcançar diferentes objetivos, ao longo dos anos, a técnica original foi submetida a diversas adaptações e melhorias, o que gerou a criação de outras variantes da técnica. A PCR pode ser utilizada para fins de pesquisa científica, diagnósticos laboratoriais, testes aplicados na área da genética, entre outros. Os principais tipos de PCR, que são utilizadas hoje em dia, são a PCR convencional, a PCR com transcriptase reversa e a PCR em tempo real.
PCR convencional 
Diferente das variantes mais utilizadas atualmente em laboratórios de análises clínicas, a PCR convencional não apresenta a principal característica: a visualização dos resultados enquanto o procedimento do teste está em andamento. Nesse tipo de técnica, os resultados da amplificação só podem ser visualizados ao final de todos os ciclos, a partir do uso da eletroforese.  O produto da PCR convencional, ou seja, uma solução enriquecida com a sequência alvo de interesse, deve ser submetida a um teste de eletroforese, para que ocorra a migração das moléculas de DNA ao longo do gel, formando diferentes tipos de bandas a partir de suas variações de peso molecular. As bandas formadas no gel, como resultado da eletroforese, são comparadas com as bandas de uma amostra padrão (de que se tem conhecimento dos resultados), tornando possível a avaliação quanto ao tamanho, quantidade e intensidade delas. As principais aplicabilidades desse método estão associadas com a obtenção de uma solução concentrada de DNA que pode ser utilizada em outras metodologias, como o sequenciamento genético ou a genotipagem, que pode ser utilizada como método de diagnóstico e tratamento. A PCR convencional também é utilizada como um teste qualitativo, ou seja, apresenta boa funcionalidade para a determinação da presença ou ausência de uma sequência de DNA específica na amostra. 
PCR com transcriptase reversa (RT-PCR) 
A maioria das variantes da PCR possui o objetivo de amplificar moléculas de DNA, mas, em determinadas ocasiões, existe o interesse em amplificar moléculas de RNA, para isso, a variante RT-PCR pode ser utilizada, sendo caracterizada pela adição da enzima transcriptase reversa aos componentes do teste. Diagnósticos de doenças virais causadas por espécies que possuem o material genético formado por RNA ou a avaliação da expressão genética a partir de transcritos (RNAm), são alguns exemplos da aplicabilidade da RT-PCR. Diferente das técnicas que amplificam diretamente a molécula de DNA, a RT-PCR é composta por duas fases, uma na qual ocorre a conversão do RNA em DNA, a partir da transcrição reversa, e outra em que acontece a amplificação da sequência propriamente dita. A primeira etapa consiste na síntese de uma fita de DNA, com sequência complementar (DNAc), a partir da utilização de um molde de RNA, em uma reação catalisada pela enzima transcriptase reversa, que é a mesma enzima que algumas espécies virais utilizam para produzir, a partir de seu RNA, uma molécula de DNA capaz de se incorporar ao genoma do hospedeiro. A obtenção do DNAc é feita em apenas um ciclo, e todos os ciclos seguintes são destinados à amplificação da sequência propriamente dita, utilizando o próprio DNAc como molde, o que caracteriza a segunda fase da RT-PCR. Nesta fase, a reação pode ser vinculada a uma PCR em tempo real (RT-qPCR), para se obter uma solução enriquecida com as sequências específicas do DNAc.
PCR em tempo real (qPCR) 
A variante mais utilizada em rotina laboratorial é a PCR em tempo real, também conhecida como PCR quantitativa (qPCR). O princípio da qPCR é a capacidade de monitoramento dos ciclos da reação, enquanto estes ainda estão acontecendo, o que caracteriza o “tempo real”. Dessa forma, a qPCR permite que os resultados sejam coletados durante o procedimento, diferindo-a das outras variantes, que fornecem os resultados apenas no final da reação. Para a obtenção dos resultados, a qPCR se utiliza de um sistema de marcadores fluorescentes chamado sistema TaqMan. Esse sistema é constituído por uma sonda (oligonucleotídeos = um fragmento curto formado por poucos pares de bases), que apresenta na sua estrutura um fluoróforo na extremidade 5’ e uma substância silenciadora (quencher) na extremidade 3’, que atua como antagonista da emissão de fluorescência por parte do fluoróforo, a partir da absorção de luz. Durante o procedimento, caso a sequência alvo esteja presente na amostra, a sonda do sistema TaqMan passa por um processo de anelamento logo após o primer, para que posteriormente seja clivada pela atividade da Taq DNA polimerase.  Após a clivagem da sonda, dois eventos passam a acontecer simultaneamente, o primeiro é a continuidade da etapa de extensão feita pela Taq DNA polimerase, e o segundo é a dissociação dos componentes da sonda, permitindo que o fluoróforo aumente a intensidade de sua fluorescência, já que foi separado do quencher. A medição da fluorescência, emitida pelo fluoróforo, é o que permite a análise dos resultados em tempo real. Observe o mecanismo de ação da sonda TaqMan na Figura 4. 
Caro(a) aluno(a), convido você a conhecer os termos presentes na imagem acima. Veja:
- Quencher sem TaqMan probe = sonda Taqman.
- Forward primer e Reverse primer usamos em inglês, sem tradução.
- Fluorophore = Fluoróforo.
- SNP = sítio do SNP.
- Extension during PCR = extensão durante a PCR.
- Specific binding of probe = local específico de ligação da sonda.
- Probe displacement and cleavage = deslocamento e clivagem da sonda.
- Fluorescence = fluorescência. 
- PCR product = produto do PCR.
- Cleavage products = produto da clivagem.
Nested PCR e Multiplex PCR 
A metodologia da Nested PCR consiste em amplificar, primeiramente, um fragmento de forma abrangente, copiando até sequencias localizadas fora dela, para utilizar posteriormente esse produto para a realização da amplificação em si.Essas duas etapas podem ser realizadas simultaneamente ou em duas reações separadas, melhorando a eficiência e especificidade da reação. Na multiplex PCR, mais de um fragmento de DNA pode ser amplificado numa única reação, cada um com o seu par de primers específico. Esse procedimento apresenta vantagens para algumas aplicações como testes de paternidades, que devem analisar vários marcadores genômicos ao mesmo tempo e para introduzir um controle de reação esse método. Nesses casos, esse tipo de PCR tem a vantagem de simplificar significativamente o processo.
Principais aplicações da PCR 
Caro(a) aluno(a), a identificação de polimorfismos ou mutações pontuais é uma aplicação muito utilizada da qPCR, principalmente nas áreas clínicas e de pesquisa. É ideal para analisar mutações, até mesmo de um único nucleotídeo modificado, e para a sua detecção no fragmento de DNA alvo, é necessária a avaliação do produto amplificado em curva de dissociação, realizada automaticamente após a termociclagem. Na área da farmacogenética, a qPCR vem sendo cada vez mais utilizada, no intuito de analisar a expressão de um determinado gene em resposta a um tratamento com fármacos específicos. Para detecção de microrganismos em doenças infectocontagiosas, a qPCR também possui alta aplicabilidade, pois permite a distinção de uma sequência especifica de DNA dentro de uma mistura complexa. Nesse campo, a qPCR permite a determinação específica da presença e quantidade do material genético de um vírus, bactéria ou fungo, com base na relação existente entre a carga viral e a gravidade da doença. Através dessa técnica, é possível mensurar a progressão da doença nos pacientes e a eficácia das terapias antivirais. A análise de bactérias, com esse mesmo processo, pode viabilizar um rápido acesso as características de sensibilidade do organismo, permitindo que se prescreva o antibiótico adequado.
Enzimas de restrição 
Enzimas de restrição, também conhecidas como endonucleases de restrição, são enzimas que possuem a capacidade de reconhecer sequências específicas das moléculas de DNA e de realizar o corte dessa sequência, produzindo terminações de fitas simples. Esse tipo de enzima está presente em diversos organismos procariotos (principalmente bactérias), onde acredita-se que possuam uma função biológica de defesa, como quando cortam segmentos do material genético de vírus que infectam bactérias, inviabilizando suas funções. Para proteger o DNA endógeno da ação das enzimas de restrição, as sequências específicas, que são reconhecidas por essas enzimas, têm a sua sequência alterada pela adição de um grupo metílico, e é a partir das características de realização de cortes e capacidade de metilação que as enzimas de restrição podem ser classificadas em três tipos diferentes. Enzimas do tipo I possuem a capacidade de corte e de metilação, entretanto, apesar de reconhecer sequências específicas, os cortes são feitos aleatoriamente. Já as enzimas do tipo III também apresentam as capacidades de corte e de metilação, mas diferentemente das enzimas de tipo I, além do reconhecimento específico das sequências, o corte não é feito de maneira aleatória, ou seja, também possui especificidade de ação. Ambos os tipos, I e III, possuem como característica a necessidade do uso de energia metabólica (adenosina trifosfato – ATP) para se locomover ao longo da molécula de DNA, o que as difere das enzimas do tipo II, que apesar de apresentar apenas a capacidade de corte, não necessita de ATP para realizar as suas funções. Existem centenas de tipos de enzimas de restrição do tipo II, e por suas características são o tipo de enzimas que mais são utilizadas em testes de biologia molecular. 
Procedimento de clivagem de DNA 
Como já vimos, as enzimas de restrição reconhecem especificamente pequenas sequências de quatro a oito pares de base, que passam a se chamar sítios de restrição. As sequências dos sítios de restrição do DNA caracterizam-se como palindrômicas (figura 5), ou seja, se a sequência de ambas as fitas que compõem a molécula do DNA for lida na direção 5’—3’, os dois sítios de restrição, presentes em cada fita, vão apresentar a mesma sequência de pares de base.  Pensando nisso, convido você a observar, na Figura 5, como existem diferentes tipos de enzimas de restrição. Veja que cada uma delas reconhece um sítio de restrição específico, assim, é possível isolar diferentes regiões de uma mesma molécula de DNA. Uma das principais aplicações das enzimas de restrição são em técnicas de genotipagem, já que é possível submeter diferentes moléculas de DNA a ação de um conjunto de enzimas de restrição, que consequentemente gera um padrão de fragmentos característicos, como também, em técnicas de recombinação, sendo utilizadas em pesquisas e na engenharia genética.  
Caro(a) aluno(a), convido você a conhecer o termo presente na imagem acima. Veja:
Palindrome = Sequência palindrômica
Além da especificidade de reconhecimento de determinadas sequências da molécula de DNA, as enzimas de restrição também podem ser classificadas a partir do padrão de corte que fazem na molécula. Alguns tipos de enzimas realizam cortes assimétricos nas fitas do DNA, originando fragmentos que possuem uma extremidade que apresenta apenas uma cadeia. Todos os fragmentos que possuem esse tipo de extremidade são complementares aos outros fragmentos originados pela mesma enzima de restrição (em alguns casos, de enzimas de restrição diferentes), por isso, esses fragmentos são conhecidos por apresentar extremidades coesivas, dispondo como principal característica a capacidade de pareamento transitórios entre si, quando submetidos a uma temperatura adequada. Outros tipos de enzimas promovem cortes simétricos entre nucleotídeos vizinhos, caracterizando os fragmentos como de extremidades cegas. Esse tipo de fragmento, diferente das extremidades coesivas, não apresentam a capacidade de pareamento transitório. Observe a diferença entre os padrões de cortes que originam os fragmentos cegos e coesivos na Figura 6. 
Caro(a) aluno(a), convido você a conhecer o termo presente na imagem acima. Veja:
CUT = CORTE
Dessa maneira, durante o processo de replicação de uma molécula de DNA, a enzima DNA-ligase cumpri o seu papel fisiológico ao ligar as extremidades dos fragmentos de Okazaki. A DNA-ligase pode ser utilizada em conjunto com as enzimas de restrição, por apresentar a capacidade de reestruturar as ligações fosfodiéster que foram rompidas. Quando aplicadas em conjunto, as enzimas de restrição e a DNA-ligase tornam-se ferramentas indispensáveis para as técnicas de engenharia genética, pois permitem a manipulação e recombinação genética, a partir da retirada de uma sequência específica e sua substituição por outra de interesse.
Diversidade de enzimas de restrição 
Diversas enzimas de restrição podem ser aplicadas em testes de biologia molecular, que dependem da atividade de clivagem de uma sequência específica do DNA. Atualmente, foram catalogadas milhares de enzimas diferentes, apesar de que pouco mais de uma centena possui aplicabilidade em metodologias de biologia molecular. A nomenclatura das enzimas é normalmente criada a partir da espécie bacteriana em que foi descoberta e, por vezes, seguida de um algarismo romano, nos casos em que na mesma bactéria foram identificadas mais de um tipo de enzima de restrição. Observe, na Figura 7, alguns exemplos de enzimas de restrição, junto a bactéria onde foi caracterizada e a sequência de restrição que possui afinidade para clivar. Considere “Sticky” para um corte que cria extremidades coesivas, e “Blunt” para cortes que criam extremidades cegas. 
Sequenciamento de DNA 
Podendo ser feito por diferentes metodologias, o sequenciamento genético se caracteriza como um procedimento que possui o objetivo de determinar a sequência de nucleotídeos presentes em uma determinada região do DNA. Trata-se de um processo complexo, visto que genomas completos apresentam uma sequência excepcionalmente longa, e que o princípio do teste se baseia naclivagem do DNA em fragmentos menores, para posterior construção da sequência. No início das pesquisas voltadas para o sequenciamento de DNA, duas técnicas se destacaram no cumprimento dessa função: o método de Sanger, também conhecido como método de terminação de cadeia de dideoxinucleosídeos trifosfato (ddNTPs), apresentava resultados satisfatórios para a rotina de sequenciamento de regiões longas de uma molécula de DNA, enquanto o método de degradação química de DNA, desenvolvida por Maxam e Gilbert, se mostrou eficaz no sequenciamento de regiões mais curtas (oligonucleotídeos).  Ao longo dos anos, algumas modificações foram feitas no método de Sanger, que contribuíram para a criação de novas metodologias mais eficazes e que passaram a ser conhecidas como métodos de nova geração. Apesar de, atualmente, os métodos de nova geração serem amplamente utilizados por permitirem acesso ao sequenciamento de genomas completos, de forma mais barata e rápida, o método de Sanger ainda pode ser aplicado em determinadas situações, como o sequenciamento de fragmentos individuais gerados por uma reação de PCR.  No decurso deste material, você será introduzido aos princípios funcionais do método de Sanger e dos métodos de nova geração e as discussões das estratégias elaboradas para a aplicação dessas técnicas no sequenciamento genético.
Método de Sanger 
Para o seu funcionamento, o método de Sanger se baseia na capacidade que a DNA polimerase possui de criar uma cópia de uma molécula de DNA, a partir da adição de nucleotídeos em uma fita molde que possua previamente uma sequência iniciadora. Já que o objetivo do método é a produção de cópias de uma região específica da sequência do DNA, os componentes utilizados no teste se assemelham aqueles que são utilizados na Reação em Cadeia da Polimerase (PCR), que por sua vez, simula os componentes presentes no processo natural de replicação do DNA.
Assim como na PCR, o método de sequenciamento de Sanger necessita dos seguintes componentes:
· DNA polimerase: que possui a função de incorporar os nucleotídeos na cópia da sequência que será formada.
· DNA alvo: uma molécula de DNA que possui a sequência de interesse e que irá servir como molde para a formação das cópias complementares. Deve estar na forma de fita simples, ou ser submetido a um processo de desnaturação, permitindo que os outros componentes tenham acesso a sua estrutura.
· Sequência iniciadoras (primers): é um fragmento de DNA que possui uma sequência curta, que, ao se ligar a sequência de interesse do DNA alvo, atua como iniciador, por permitir o início da atividade da DNA polimerase. 
· Desoxirribonucleotídeos: são os nucleotídeos que serão incorporados a estrutura das fitas de DNA, pela ação da DNA polimerase, são eles: dATP (adenina), dTTP (timina), dTCP (citosina) e dTGC (guanina).
Além dos componentes clássicos de uma PCR, no sequenciamento de Sanger também são adicionados dideoxinucleotídeos (ddNTPs) marcados com corantes. Existem quatro tipos de ddNTPs, que representam as versões dideoxi dos quatro nucleotídeos, sendo elas ddATP (adenina), ddTTP (timina), ddCTP (citosina) e ddGTP (guanina). As principais diferenças estruturais entre os ddNTPs e os outros nucleotídeos são a ausência de um grupamento hidroxila na posição 3’ da pentose e a marcação de sua base nitrogenada, feita pela adição de um corante específico. Como a ligação fosfodiéster depende da presença de um grupamento hidroxila, quando um ddNTPs é incorporado na sequência, os próximos nucleotídeos ficam impossibilitados de serem adicionados, em outras palavras, a presença de um ddNTPs na cadeia atua como inibidor da atividade da DNA polimerase. Por esse motivo, os ddNTPs são conhecidos como terminadores de cadeia, e como a sua incorporação é feita de maneira aleatória, o resultado é a obtenção de sequências de DNA de tamanhos variados, que apresentam, em suas terminações, um dos quatro tipos de bases nitrogenadas ligadas a um corante específico.  O procedimento do teste é iniciado com o preparo da amostra, que consiste na mistura de todos os componentes em um tubo, incluindo a DNA polimerase, o DNA alvo, os primers, os dNTPs e os ddNTPs. Os últimos são adicionados em concentrações inferiores as dos dNTPs, para evitar que a extensão das cadeias seja interrompida precocemente. A próxima etapa é submeter a amostra a ciclos constantes de variação de temperaturas, visando alcanças os mesmos objetivos que uma PCR. O ciclo se inicia com o aquecimento da amostra, visando a desnaturação e consequente abertura da dupla fita de DNA, seguida de uma etapa de redução da temperatura para possibilitar a ligação dos primers a sequência alvo e posterior alcance da temperatura ideal para o funcionamento da DNA polimerase. Durante a etapa de extensão da cadeia, os dNTPs são constantemente incorporados a nova cadeia, até que eventualmente a DNA polimerase incorpore um ddNTPs a sequência, impossibilitando a adição de outros dNTPs.  Como já foi visto, devido a adição aleatória dos ddNTPs, ao final da reação, é obtido um concentrado de fragmentos de DNA, que possuem tamanhos diferentes e a possibilidade de conter ao final de sua sequência uma base nitrogenada marcada. A próxima etapa é realizar a separação dos fragmentos contidos no concentrado, através de um tipo de técnica de eletroforese, conhecida como eletroforese capilar, que efetua a separação a partir das diferenças entre a massa e carga dos fragmentos. Como o próprio nome sugere, o gel desse tipo de eletroforese é solidificado no interior de um capilar, permitindo que os fragmentos ultrapassem os poros do gel e sejam direcionados para uma rota onde há a interceptação por um laser. Os fragmentos menores conseguem se locomover com maior velocidade em relação aos fragmentos maiores, mas como todos eles possuem um ddNTPs anexado a um corante no final da cadeia, ambos são avaliados e contabilizados no momento do contado com o laser. Cada um dos quatro tipos de ddNTPs possui um tipo diferente de corante anexado a si, de forma que é possível observar os resultados a partir de um gráfico fornecido pelos detectores de fluorescência, que mostra tanto o padrão de coloração, que representa um tipo específico de ddNTPs, quanto a intensidade de fluorescência que foi gerada, registrando, a partir disso, a sequência de DNA complementar. 
Atualmente o método de Sanger tende a ser gradativamente substituído por métodos mais modernos, que se propõe a realizar o sequenciamento de genomas completos, de forma mais barata, rápida e eficaz. Ao conjunto de técnicas e aprimoramentos voltados ao sequenciamento de DNA, dá-se o nome de métodos de sequenciamento de nova geração ou métodos de alto desempenho. Observe as etapas do método de sequenciamento de Sanger automatizado na Figura 8.
Caro(a) aluno(a), vamos conhecer os termos da imagem acima? Veja:
- Template = molde.
- Primer extension and chain termination = extensão do primer e terminação da cadeia.
- Capillary gel electropforesis = eletroforese em capilar (gel).
 - Chromatogram = cromatograma.
- Sequence = sequência.
Métodos da nova geração 
Os métodos de nova geração são caracterizados como um grupo de novas técnicas automatizadas, que apresentam algumas vantagens em relação ao método de sequenciamento proposto por Sanger. Dentre elas, destacasse a capacidade de promover várias reações de sequenciamento simultaneamente, de forma que é possível ter acesso a informações sobre milhões de pares bases de uma única vez, além de realizar o sequenciamento de um DNA presente em baixas concentrações, apresentar um baixo custo e a obtenção de resultados mais rápidos. Diferente do método de Sanger, que utiliza etapas prévias de clonagem para a realização do sequenciamento, os métodos de nova geração utilizam uma etapa prévia de PCR em fase sólida, para obter a amplificação do DNA molde, antes da realização do sequenciamento em si. Essa característica aumenta a sensibilidade do teste, por permitir que as milhões de moléculas de DNA, geradas a partir da etapa de amplificação,possam ser analisadas simultaneamente em uma única reação, minimizando o trabalho manual de preparo de placas de sequenciamento e a necessidade de separação dos fragmentos pela eletroforese em gel. Apesar de possuírem a etapa de amplificação por PCR em fase sólida como um fator comum, as plataformas de sequenciamento de nova geração diferem entre si na forma como a amostra é preparada e amplificada, e nas estratégias utilizadas para analisar a sequência de interesse. O sistema da plataforma 454 utiliza como metodologia o pirosequenciamento, que se baseia na análise de produtos oriundos de reações enzimáticas feitas durante o teste. Durante a adição de desoxinucleotídeos, a cadeia que está sendo formada, ocorre a liberação de pirofosfato, que é convertido em ATP. Essa fonte de energia metabólica gerada pelo pirofosfato pode ser utilizada para oxidar um componente chamado luciferina, que passa a emitir um sinal de luz, que pode ser captado por um detector acoplado ao sistema do teste, e a partir disso, fornecer os resultados do sequenciamento.  Além dos métodos que utilizam o pirosequenciamento, é possível destacar outros dois tipos de metodologias empregadas: a de semicondutores de íons utilizada pela plataforma Ion Torrent, que possui semelhanças com o pirosequenciamento, pois ambas se propõem a detectar um produto liberado durante a incorporação de um desoxiribonucleotídeo a cadeia, por intermédio da DNA polimerase. No caso dos semicondutores de íons, o produto detectado são íons de hidrogênio, feito a partir do uso de PHmetro sensíveis. O sistema da plataforma Illumina utiliza a metodologia das terminações reversíveis cíclicas, que se baseia na adição de quatro tipos de dideoxinucleotídeos terminadores reversíveis marcados com fluoróforos, junto a enzima DNA polimerase, que fará a incorporação desses terminadores nos fragmentos que foram previamente formados. Nos ciclos em que existe a incorporação dos dideoxinucleotídeos, os fluoróforos emitem luz, que é detectada para fornecer as informações do sequenciamento. 
Estratégias de sequenciamento de DNA 
Um dos principais empecilhos para o sequenciamento de um genoma completo está na sua longa extensão de nucleotídeos, tornando necessária a implementação de estratégias para se obter o resultado esperado. Uma das principais estratégias para o sequenciamento desses genomas é a criação de bibliotecas de genes, estas são caracterizadas como o conjunto de fragmentos de DNA, que representa todos os genes de uma espécie específica, permitindo o sequenciamento completo de um genoma e a possibilidade de isolamento de um gene específico, que possua interesse em se analisar. A criação de uma biblioteca de genes obedece a algumas etapas, que se inicia com o uso de uma técnica denominada Shotgun. Essa técnica se baseia em submeter o genoma a ação de uma ampla variedade de enzimas de restrição, que clivam diferentes sequências do DNA, promovendo a sua fragmentação. Após a etapa de Shotgun, cada fragmento de DNA passa a ser chamado de inserto, e todos os insertos devem ser inseridos em vetores apropriados, que possuam a característica de autorreplicação, como os plasmídeos bacterianos ou os vírus bacteriófagos. Assim que a etapa de inserção acaba, os vetores são adicionados a bactérias hospedeiras, que, a partir de sua reprodução, gera clones que também possuem o inserto de interesse, caracterizando uma biblioteca de DNA como um grupo de vetores idênticos, que possuem na sua composição os diferentes fragmentos de DNA de interesse. Observe as etapas do Shotgun na Figura 9. O Shotgun hierárquico é uma técnica derivada do Shotgun convencional, voltada para o sequenciamento de uma região/sequência específica do DNA, ao invés do genoma completo do organismo. Assim como no Shotgun convencional, o hierárquico também possui etapas de fragmentação do DNA, entretanto, os insertos obtidos possuem sequências maiores, que precisam ser inseridos e clonados em vetores que possuam a capacidade de suportar suas dimensões.  Existem duas possibilidades de vetores, os cromossomos artificiais bacterianos (BACs) e os cromossomos artificiais de leveduras (YACs), que promovem a clonagem da sequência de interesse, para que estas possam ser submetidas a outra etapa de clivagem, para posterior inserção em plasmídeos ou bacteriófagos. Após a inserção nos segundos vetores, a técnica segue da mesma forma que o Shotgun convencional.  Caso o objetivo do pesquisador seja a avaliação de genes, é possível elaborar uma biblioteca de DNA complementar (DNAc), que consiste na clonagem de DNAc derivados de uma reação enzimática catalisada pela transcriptase reversa, que utiliza RNA mensageiro para produzir o DNAc. Esse tipo de estudo permite avaliar as variações de expressão gênica de um organismo, por exemplo, é possível comparar a concentração de transcritos de DNAc em uma biblioteca criada a partir de um tecido normal e um tecido neoplásico, facilitando o estabelecimento de um marcador tumoral, que pode ser utilizado futuramente como critério diagnóstico. 
Caro(a) aluno(a), vamos conhecer os termos da imagem acima? Veja:
-Human dna = dna humano.
- Cleave with.... = clivagem com nuclease de restrição.
- Millions of.... = milhões de fragmentos genômicos de DNA.
- Dna fragments... = fragmento de DNA inserido em plasmídeos.
- Recombinant DNA.... = moléculas recombinantes de DNA.
- Introduction of plasmids... = introdução dos plasmídeos em bactérias.
- Genomic library = Biblioteca genômica.
Análise de genomas 
A bioinformática é uma ciência originada da fusão da biologia com a informática, que foi criada para lidar com a necessidade de compreender certas funções biológicas, a partir da avaliação de uma grande quantidade de dados gerados. Diante da implementação de metodologias de sequenciamento genético automatizado, ao longo dos anos, os cientistas conseguiram sequenciar o genoma completo de diversos organismos, promovendo avanços significativos na ciência biomédica. A análise completa do genoma de um organismo específico gera uma quantidade massiva de dados, que passaram a ser coletados e analisados por programas de bioinformática, que se utilizam de algumas etapas de análise computacional durante o processo, como a montagem, a predição, a anotação e a criação de mapas de genomas. 
Montagem de genomas 
A montagem de genomas é a etapa responsável por ordenar corretamente as sequências de todos os fragmentos obtidos após uma etapa de sequenciamento. Seguindo essa linha de raciocínio, espera-se que quanto maior o tamanho dos fragmentos, mais fácil é a etapa da montagem dos genomas, entretanto, o mecanismo de ação de todas as técnicas de sequenciamento, que foram abordadas, possuem a característica comum de produzir fragmentos de comprimentos pequenos, dificultando o processo da montagem. Esse procedimento é realizado por programas computacionais de montagem, que promovem o alinhamento das sequências (reads), baseando-se em regiões complementares entre elas, gerando uma sequência única e contínua (contig). 
Durante essa etapa, alguns problemas podem acontecer, dentre eles, destacam-se a possibilidade da montagem de regiões com sequências repetitivas e a inserção errônea de nucleotídeos na sequência, por parte da DNA polimerase. As sequências repetitivas são erros gerados pela dificuldade de ordenar corretamente os fragmentos, e podem ser resolvidas a partir do uso de fragmentos do mesmo trecho, porém, com variação de tamanho, ao passo que a incorporação equivocada de nucleotídeos na sequência é solucionada a partir da realização de mais de um sequenciamento da mesma região, de forma que é possível comparar as sequências que foram formadas e identificar os nucleotídeos.
Anotação de genomas 
Caro(a) estudante, fique atento(a), pois essa etapa se caracteriza por descobrir e atribuir certas funções biológicas a determinadas sequências de nucleotídeos presentes nos contigs, com o objetivo de compreender os processos fisiológicos que ocorrem naquele organismo específico, por exemplo: identificarquais são os trechos responsáveis pela codificação de proteínas, quais são as proteínas que eles codificam e os responsáveis pela transcrição do RNA regulatório. 
Apesar de poder ser feita manualmente, a anotação do genoma é atualmente feita por programas de bioinformática, que se baseiam na comparação das sequências obtidas com outras, presentes em um amplo banco de dados já existente e conhecido, de forma que é possível identificar nas novas sequências obtidas, quais estão relacionadas com regiões promotoras, regiões não codificantes, regiões responsáveis pela codificação de um tipo de proteína específica, entre outras informações. 
Mapas de genomas 
Após a etapa de anotação, todas as informações possíveis contidas no genoma são representadas no formato de um mapa genômico, logo, esses mapas são compartilhados com toda a comunidade científica por um banco de dados utilizado mundialmente. Os mapas pré-existentes são fundamentais para as etapas de montagem e anotação de novos genomas, pois permitem a comparação entre as sequências genéticas de organismos similares, direcionando os pesquisadores as principais possibilidades relacionadas às funções de um sequenciamento que nunca havia sido feito antes.  
O GenBank é um dos principais bancos de dados de compartilhamento de mapa genômicos, que permite o acesso de equipes de pesquisa distribuídas em diversos países, facilitando uma análise comparativa.
Polimorfismo genético 
Neste material, você será introduzido a natureza da variabilidade genética, como esta pode ser influenciada por mutações e os polimorfismos genéticos. Como você já deve estar familiarizado com a teoria das mutações, o próximo tema que trataremos será focado no entendimento teórico dos polimorfismos genéticos, conceituando os tipos de polimorfismos, as suas respectivas características e possíveis aplicações científicas. 
Algumas regiões de uma molécula de DNA são significativamente semelhantes quando comparadas entre os cromossomos de diferentes seres humanos, que habitam diferentes localidades, entretanto, as sequências de uma região específica de DNA apresentam, em média, pelo menos um par de base que as difere entre si. Atualmente, já se foi catalogado milhões de diferenças e variações de sequências de uma mesma região do DNA, entre o maior número possível de diferentes populações humanas, apesar disso, a amostragem utilizada até o momento é considerada baixa, supondo-se, dessa forma, que a variabilidade genética da espécie possua uma extensão muito maior. 
A caracterização dos polimorfismos é semelhante à das mutações, ambas são variações genéticas que podem acontecer tanto em sequências codificadoras quanto em não codificadoras, entretanto, para ser considerada um polimorfismo, essa variação precisa apresentar uma frequência populacional superior a 2%. A maior parte dos polimorfismos está localizada em regiões não codificadoras, por isso, não apresentam relevância fisiológica para o organismo, mas aquelas que estão presentes em regiões codificadoras podem ser responsáveis pela criação de proteínas variantes ou pelo desenvolvimento de algumas patologias. 
Variação genética 
Quando avaliamos e comparamos o genoma de dois indivíduos da espécie humana, que não apresentam graus de parentesco entre si, a sequência de seus materiais genéticos é idêntica em cerca de 99,5% de sua extensão. As pequenas diferenças entre as duas sequências completas são o que torna cada indivíduo exclusivo, caracterizando a presença de uma variação genética, que é chamada de polimorfismo genético. E, como já foi dito, a maioria das diferenças entre as sequências de organismos de mesma espécie apresenta baixa (ou até mesmo ausência) influência nas características fenotípicas e fisiológicas de um organismo, ao passo que outros tipos de variações podem tornar o portador susceptível ao desenvolvimento de doenças como o câncer, transtornos alimentares, resistência a medicamentos, entre outros.  Para entender o conceito de variação genética e polimorfismo, é preciso relembrar alguns conceitos aplicados na área de genética, como locus e alelos. Uma posição específica no cromossomo, onde está localizada uma determinada sequência do DNA, é denominada locus, cada locus de um cromossomo homólogo pode ser ocupado por dois tipos de genes, um que apresenta uma sequência comum a maioria dos indivíduos de uma mesma espécie, outro que representa uma forma alternativa desse mesmo gene, que passa a ser conhecido como alelo. Aos alelos que possuem predominância em uma determinada espécie, dá-se o nome de alelo selvagem, enquanto as formas alternativas, que possuem uma alteração na sequência de nucleotídeos, recebem o nome de alelos variantes. Caso um tipo específico de alelo variante esteja distribuído entre diferentes populações de uma mesma espécie, com uma frequência superior a 2%, diz-se existir um polimorfismo genético.  A variação genética garante que cada indivíduo possua um perfil único de sequências de DNA, e cada perfil passa a ser chamado de DNA fingerprinting, que podem apresentar diferentes aplicabilidades no ramo da genética medicinal. Na genética forense a identificação de certos tipos de polimorfismos pode ser utilizada para a realização de testes de paternidade ou para análises criminalísticas que utilizam vestígios biológicos, como sangue, saliva e sêmen, para identificar e provar quem são os indivíduos envolvidos no crime. As aplicações se estendem para o diagnóstico de diversas patologias, a partir da identificação de um polimorfismo que foi previamente associado a uma doença específica, como vários tipos de câncer, autismo, doenças cardíacas, diabetes, entre outras. 
Tipos de polimorfismo 
A maioria dos polimorfismos presentes no genoma humano são causados por variações simples que afetam apenas um nucleotídeo, por isso, são conhecidos como polimorfismos de nucleotídeos únicos (SNPs). A presença de SNPs no genoma é comum, já que se estima que é possível observar um SNP a cada 1.000 pares de base de uma sequência. Esse tipo de polimorfismo é distribuído de uma forma em que a grande maioria está presente em regiões não codificadoras e, por isso, não apresentam nenhum efeito adverso para os seus portadores, entretanto, existem diversos SNPs conhecidos, que estão localizados em regiões codificadoras de proteínas, comprometendo diretamente na função do gene (Figura 10) . Os SNPs podem ser classificados de acordo com a sua capacidade de influenciar a funcionalidade do gene em que ele está presente. Como você já deve saber, na fase de tradução do dogma central, todos os aminoácidos que serão utilizados para compor a estrutura de uma proteína são codificados por sequências de três nucleotídeos, que é chamada de códon. Apesar de existirem diversas combinações possíveis para a formação de um códon, em alguns casos, um mesmo tipo de aminoácido pode ser codificado por diferentes sequências de códons. O entendimento desses conceitos é importante para a compreensão da classificação dos polimorfismos. Milhares de SNPs já foram reportados em regiões codificadoras de proteínas, entretanto, nem todos promovem uma alteração significativa na estrutura dos códons. Cerca de metade desses polimorfismos, apesar de possuírem a capacidade de alterar a estrutura dos códons, com a nova sequência formada a partir da troca de nucleotídeos, permanecem com a função de codificar o mesmo tipo de aminoácido que a sequência original, não alterando a ordem dos aminoácidos prevista para a formação da proteína, caracterizando um SNP sinônimo. Os polimorfismos que provocam mudanças estruturais capazes de modificar a composição das proteínas formadas são chamados de SNP não sinônimos, e são esses os mais comumente associados a doenças, por interferirem diretamente na função do gene em que está localizado, podendo também ser chamado desta forma, de polimorfismo funcional. 
Outro tipo de polimorfismo é o que está relacionado com a formação de um DNA repetitivo em tandem e pode ser de dois tipos principais, as repetições tandem de númerovariável (VNTR, do inglês variable number tandem repeats) e as pequenas repetições (STR, do inglês short tandem repeats). Os VNTRs também são chamados de minissatélites e consistem em trechos de DNA que são constituídos por repetições de um mesmo tipo de sequência, que pode ter de 15 a 100 nucleotídeos e estar localizado em várias posições do cromossomo. Caso um DNA que possua VNTR seja submetido a ação de enzimas de restrição capazes de reconhecer as regiões flanqueadoras do VNTR, é possível obter fragmentos de diferentes tamanhos, que podem ser separados por eletroforese e aplicados em diferentes ocasiões, como testes de paternidade. Assim como os VNTRs, os STRs também são caracterizados pela presença de padrões de repetições de nucleotídeos, porém, são mais curtas, podendo ter até 14 nucleotídeos, por isso são chamadas de microssatélites e podem ser utilizadas em testes de paternidade.  
Observe um exemplo de STR na Figura 11. 
Caro(a) aluno(a), vamos conhecer os termos da imagem acima? Veja:
- Short tandem repeats = sequências curtas repetidas em tandem.
- Repeats = repetições
- Participant = participante.

Continue navegando