Buscar

BIOINFORMÁTICA AULAS 1 A 10 - CONTEÚDO ONLINE

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 58 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 58 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 58 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Aula 1: Introdução à Bioinformática
Apresentação
A Biomedicina é uma profissão focada, principalmente, na pesquisa e no diagnóstico de doenças que afetam os seres humanos. As ferramentas que um biomédico usa para gerar e avaliar os resultados do seu trabalho são diversas, incluindo vários tipos de microscópios e reações bioquímicas.
Nesta aula, veremos uma nova forma de trabalhar a biomedicina, que está alinhada com a era tecnológica que vivenciamos hoje em dia.
A Bioinformática utiliza ferramentas computacionais para contribuir na melhora do diagnóstico e no tratamento de doenças, na diminuição do tempo de pesquisa para novas drogas, no aprimoramento da solução de crimes, para avanços na área agrícola, dentre muitas outras possibilidades, algumas ainda inexploradas.
Para começo de disciplina, a área da Bioinformática será apresentada a você de uma forma ampla e esclarecedora. Você vai entender o que é essa área da ciência, como ela funciona e que tipo de benefícios ela traz, tanto para o profissional quanto para a sociedade. À medida que você avançar nos próximos capítulos da disciplina, você vai se aprofundar melhor nos conceitos que serão introduzidos ao longo dessa leitura inicial.
Objetivos
· Esclarecer o que é a Bioinformática e suas áreas de atuação;
· Reconhecer suas potencialidades e áreas envolvidas;
· Identificar suas aplicações atuais e futuras.
O que é Bioinformática?
Definir Bioinformática não é uma tarefa simples, mas de forma generalista, podemos dizer que é uma ciência que usa ferramentas computacionais para estudar informações biológicas.
Essas ferramentas são programas desenvolvidos com objetivos de ajudar a quantificar, simplificar e integrar os dados que obtemos de experimentos na bancada usando DNAs, RNAs e proteínas. Dessa forma, os resultados podem ser organizados, e nossas conclusões obtidas de forma mais simples e rápida.
Exemplo
Pense no seu guarda-roupas. Imagine se ele estivesse perfeitamente organizado, se você soubesse quantas opções você tem de blusas, casacos, calças e sapatos, e claro, onde elas estão guardadas exatamente. Ficaria muito mais fácil combiná-los e escolher o look do dia, não é mesmo? Agora, suponha que exista um robô fazendo tudo isso para você: Contando, organizando e combinando tudo.
Na Bioinformática, o robô são as inúmeras ferramentas computacionais e as roupas são os resultados de experimentos com moléculas biológicas. O resultado e a conclusão do trabalho do bioinformata podem ser comparados ao look do dia.
Essa área da ciência, ainda pouco conhecida pela população em geral, tem contribuído muito para grandes avanços no campo da saúde.
O exemplo mais marcante quando se trata de Bioinformática é o Projeto Genoma Humano, um projeto audacioso que começou no final dos anos 1980, liderado pelo Departamento de Energia do Instituto Nacional de Saúde dos Estados Unidos.
O principal objetivo desse projeto foi determinar a ordem das bases nitrogenadas (A, T, C e G) do todos os cromossomos humanos.
Considerando que o nosso Genoma1 genoma soma mais de 3 bilhões de bases nitrogenadas enfileiradas, isso não parece uma tarefa fácil, não é? É aí que entra a Bioinformática!
Depois de extrair o DNA do núcleo das células de seres humanos e colocá-lo em uma máquina que devolve como resultado uma verdadeira sopa de letrinhas, as ferramentas computacionais são usadas para colocá-las em ordem e descobrir que informações essas bases nitrogenadas ordenadas trazem. E como isso mudou nossa vida? Hoje, nós já conhecemos algumas partes do nosso DNA que estão relacionadas a várias doenças, como câncer de mama, doenças musculares, surdez e cegueira.
Genoma 1 : Genoma é o nome dado ao conjunto de informações genéticas de um ser vivo, todo conteúdo de DNA da célula.
Depois de extrair o DNA do núcleo das células de seres humanos e colocá-lo em uma máquina que devolve como resultado uma verdadeira sopa de letrinhas, as ferramentas computacionais são usadas para colocá-las em ordem e descobrir que informações essas bases nitrogenadas ordenadas trazem. E como isso mudou nossa vida? Hoje, nós já conhecemos algumas partes do nosso DNA que estão relacionadas a várias doenças, como câncer de mama, doenças musculares, surdez e cegueira.
A Bioinformática vem ajudando a revolucionar a forma como as doenças são diagnosticadas, tratadas e prevenidas. E acredite, esse é apenas um exemplo entre várias outras aplicações dessa poderosa área da ciência!
A Bioinformática pode ajudar a responder muitas perguntas biológicas, tais como:
· O que longas sequências de As, Ts, Cs e Gs em fileira significam?
· Como vou saber a função biológica de uma nova proteína descrita?
· Qual o formato de uma proteína se eu sei apenas a ordem dos aminoácidos dela?
O principal objetivo da Bioinformática é descobrir como as coisas vivas funcionam, e os bioinformatas são profissionais que buscam construir e utilizar ferramentas computacionais para alcançar esse objetivo.
Áreas do conhecimento envolvidas com a Bioinformática
Se uma das missões da Bioinformática é desenvolver ferramentas computacionais que atendam objetivos biológicos, já é de se esperar que ela misture diferentes áreas do conhecimento. Isso é superatual, pois estamos falando em unir várias tribos diferentes para pensarem juntas! Nesse sentido, podemos incluir a Biologia Molecular, Estatística, Matemática e Computação, principais grandes áreas do saber envolvidas no processo. Cada uma contribui com uma habilidade especial. Podemos dizer que a Bioinformática se trata de uma área interdisciplinar.
O bioinformata tem muitas opções de atuação. Ele pode seguir para a área acadêmica, atuando como professor, além de poder trabalhar como pesquisador, presente nas universidades e nas indústrias.
Grandes hospitais e laboratórios de análises clínicas também contratam, bem como a indústria que depende da análise de dados de Biologia, por exemplo, a agroindústria ligada à análise de dados e melhoramento animal.
Como uma informação biológica pode ser interpretada como dado computacional?
Já sabemos que as proteínas são formadas por pequenas moléculas unidas, os chamados aminoácidos. Estão presentes na natureza 20 tipos de aminoácidos. Existem milhões de proteínas diferentes porque a ordem dos seus aminoácidos é diferente. Como conhecemos os 20 aminoácidos possíveis, podemos usar símbolos para cada um deles, e quando comparamos as sequências de símbolos entre proteínas, conseguimos dizer se elas são ou não semelhantes.
Existem várias ferramentas computacionais eficientes que fazem essa comparação de sequências, disponíveis, inclusive, online. Você pode, portanto, identificar uma proteína no seu experimento, determinar a sequência de aminoácidos dela, acessar a internet e usar uma dessas ferramentas para descobrir se outra pessoa no mundo já encontrou uma proteína igual a sua!
Viu como a Bioinformática é capaz de conectar dados de experimentos de laboratório com a análise de símbolos e informações exatas?
É preciso que tudo esteja integrado, junto e misturado. Você pode ser um biomédico bioinformata, que sabe tudo das questões biológicas, mas também tem que saber usar um computador para resolver muitos dos seus problemas. Seu amigo de profissão pode ser um cientista computacional bioinformata, que sabe tudo de programas e algoritmos, mas também entende que a proteína é formada por uma junção de vários aminoácidos, além de muitos outros conhecimentos biológicos. Cada um dominando os conhecimentos da sua área de origem, mas aplicando outros conhecimentos que são muito úteis. Acredite, tem trabalho para todo mundo por um longo tempo!
A Bioinformática pode ser dividida em dois grandes campos de atuação complementares.
Já ouviram a frase “Quanto mais estudamos, mais descobrimos a nossa ignorância” (Percy Bysshe Shelley)? Funciona assim: À medida que entendemos mais a vida, novas perguntas surgem, e aí, novas ferramentas são necessárias para respondê-las.
Origem da Bioinformática
O surgimento da Bioinformática como ciência só foi possível por causa dos avanços nas áreasde Biologia Molecular e da Computação durante longos anos. Até aqui já citamos algumas vezes as macromoléculas biológicas, dentre elas o DNA.
Saber do que é feito o DNA e como ele se organiza foi o ponto de partida da Bioinformática. Quem contribuiu muito para esse entendimento foram os cientistas Watson e Crick, que descreveram a estrutura dessa molécula em 1953.
A partir da descrição da molécula, foi possível entender como o DNA se replica e como pode ser traduzido em proteína, por exemplo, conceitos de Biologia Molecular, que serão revisados mais adiante na nossa disciplina.
Desenvolvimento de computadores mais rápidos
O desenvolvimento de computadores mais rápidos foi uma das consequências dos avanços da Segunda Guerra Mundial (1939-1945). Parte dessa história é mostrada no premiado filme O Jogo da Imitação, que fala sobre Alan Turing, um cientista britânico que contribuiu muito para o desenvolvimento da ciência Computação. Uma das pioneiras quando falamos de usar computadores para o estudo de biomoléculas foi a brilhante Margaret Dayhoff.
Dayhoff desvendou a ordem dos aminoácidos que formavam algumas proteínas e a forma que essas proteínas tinham, criando o primeiro Atlas de Proteínas. Este é considerado um dos primeiros experimentos em Bioinformática, que foi publicado em 1965.
Em 1966, um programa de computador foi usado pela primeira vez para visualizar a estrutura tridimensional de moléculas (trabalho desenvolvido por John Ward e Robert Stotz).
Em 1970, diversas técnicas já haviam sido desenvolvidas para análise de dados biológicos. Vale lembrar que na década de 1960 um computador ocupava uma sala inteira, mesmo tendo uma capacidade parecida com a de um notebook comum atualmente! Ainda que esses cientistas pioneiros não usassem o termo Bioinformática para descrever seu trabalho, eles tinham uma visão clara de como combinar Biologia e Computação de uma maneira proveitosa para responder a perguntas fundamentais nas ciências da vida.
Além desses, muitos outros pesquisadores contribuíram com diversos avanços, tanto para entender melhor as biomoléculas, como também para melhorar as técnicas computacionais que ajudaram a gerar esse conhecimento. Mas, o grande impacto da Bioinformática na ciência tem acontecido bem debaixo dos nossos olhos!
Estamos vivendo uma era tecnológica. Pare e pense: Como era o seu celular há cinco anos? E a sua televisão?
Tudo tem evoluído de maneira acelerada, os computadores estão ficando cada vez mais rápidos e baratos. Problemas de Bioinformática que antes demoravam anos para serem solucionados, hoje podem ser resolvidos em dias.
Depois do Projeto Genoma Humano, os genomas de vários outros organismos foram sendo concluídos com sucesso! A disponibilidade de milhares de sequências e centenas de estruturas tridimensionais de moléculas biológicas, somada ao desenvolvimento de ferramentas para sua manipulação vêm permitindo que análises computacionais complexas sejam realizadas. Muitos programas de computador estão disponíveis gratuitamente, e a rapidez e capacidade de processamento dos computadores estão sempre sendo melhoradas.
Saiba mais
O Projeto Genoma Humano, de que já falamos um pouco, demorou aproximadamente 10 anos para ser finalizado (1989-2003) com um custo de US$100.000.000. Hoje em dia é possível determinar o genoma de uma pessoa por US$1.000, e você consegue esse resultado em menos de uma semana!
Bioinformática e suas potencialidades
As ferramentas computacionais utilizadas em Bioinformática servem principalmente para análise de sequências, estruturas e funções de moléculas biológicas.
Vamos imaginar a seguinte situação: Você está estudando a sequência de nucleotídeos ATAGATATGGATGCATGCGATGCAUAAGAT.
A primeira coisa a se fazer é saber o que ela significa. Depois de usar um programa de computador, você descobre que a parte da sequência que está em negrito é um gene, ou seja, um trecho do DNA com o código que determina a síntese de uma certa proteína.
Mas qual o papel dessa proteína? A função de toda proteína depende da sua estrutura tridimensional, isto é, a forma que ela tem. Então, você vai copiar a sequência em negrito e colar em um site da internet, e ele vai te mostrar o desenho da estrutura dessa molécula.
Agora que você já sabe a forma da sua proteína, você pode compará-la com estruturas de proteína que já foram estudadas por outros pesquisadores para descobrir sua função. Mais uma vez, você pode contar com a ajuda de um programa de computador. Imagine que esse programa te diz que sua proteína é igual à enzima lactase. Com essa informação, você poderia chegar à conclusão que a função da sua proteína é degradar a lactose no intestino delgado, possibilitando sua digestão.
Acabamos de ver aqui um exemplo de cada tipo de análise em Bioinformática. A análise de sequência, nesse caso, possibilitou encontrar o gene, mas esse tipo de análise também permite outras abordagens, como comparar várias sequências.
Você já ouviu falar sobre árvore genealógica?
Ela conta a história dos antepassados de um indivíduo. A gente pode fazer algo parecido comparando sequências, e descobrir a relação evolutiva entre elas, como se a gente pudesse dizer qual a sequência que apareceu primeiro na história da evolução dos seres vivos.
Quando falamos da análise de estrutura, ela pode ser feita para prever a forma de DNAs, RNAs e proteínas, além de dizer como elas interagem com várias outras moléculas. Já a análise da função permite saber para o que essa molécula serve.
Analisar a função de uma proteína vai nos dizer como ela interfere no funcionamento da célula, o que acontece quando ela está em excesso ou quando ela está em falta.
Atenção!
Não podemos deixar de falar de uma potencialidade muito importante da Bioinformática: Guardar informações biológicas de maneira organizada, de forma que seja fácil encontrá-las quando preciso.
Os chamados bancos de dados biológicos guardam informações como sequências de nucleotídeos e aminoácidos, artigos científicos ou estrutura de proteínas. Além de organizar essas informações, eles permitem que elas sejam atualizadas, consultadas e recuperadas.
Esses bancos são construídos por bioinformatas, que precisam de programas específicos e também de computadores com grandes capacidades, como boa memória e processadores potentes.
Aplicações da Bioinformática
As aplicações da Bioinformática vão muito além da utilidade imediata em entender melhor processos básicos de Biologia Molecular. Ela pode ser aplicada ao desenvolvimento de novas drogas, na análise forense de DNA, na biotecnologia agrícola, na medicina personalizada, entre outros.
Vamos aos exemplos:
Identificação das estruturas de proteínas
Poderíamos estudar uma proteína que seja muito importante para as bactérias, tão importante que, se essa proteína parar de funcionar, a bactéria morre. Se descobrirmos a estrutura dessa proteína, podemos testar várias moléculas e verificar se elas se encaixam na proteína da bactéria. Se esse encaixe for muito perfeito, a molécula pode bloquear a função da proteína bacteriana.
Uma molécula com essa capacidade é candidata a ser um novo antimicrobiano, um grupo de drogas usadas para combater infecções causadas por bactérias. Identificar as estruturas de proteínas e prever o modo de ligação e os detalhes do reconhecimento entre duas moléculas são as principais áreas da Bioinformática envolvidas na pesquisa por novas drogas. Essa abordagem ajuda a acelerar e baratear os estudos que levam ao desenvolvimento de drogas mais potentes, com menos efeitos colaterais e toxicidade.
Área forense
Na área forense, podemos aplicar a Bioinformática para determinar a origem das amostras biológicas. Imagine se um perito criminal encontra na cena de um crime um fio de cabelo do qual se pode extrair o DNA.
A partir desse DNA, podemos usar métodos computacionais para interpretar suas sequências de nucleotídeos e encontrar regiões que sejam capazes de diferenciar os indivíduos. Essas regiões servem como marcadores, etiquetas capazes de dizer de que pessoa veio aquele material. Seo perito possui três suspeitos do crime, com a informação da análise das sequências de DNA ele é capaz de matar a charada, e descobrir quem é o verdadeiro culpado.
Agricultura
Ferramentas computacionais também vêm sendo utilizadas na agricultura. Bancos que armazenam informações sobre plantas têm um papel importante no desenvolvimento de novas variedades de cultura com maior produtividade e mais resistentes a pragas.
Plantas são uma opção importante de energia limpa, quando a partir da biomassa vegetal se produz energia! O milho e a cana-de-açúcar são exemplos de vegetais que produzem uma grande quantidade de biomassa.
Usando ferramentas computacionais, pesquisadores conseguem encontrar os genes que estão relacionados à produção de biomassa e, assim, escolher a planta que produzirá energia de forma mais eficiente.
Medicina personalizada
A ideia de medicina personalizada surgiu porque, muitas vezes, pacientes com a mesma doença e sintomas comuns podem ter causas moleculares diferentes. Um bom exemplo é o câncer. Duas pessoas podem ter câncer de pulmão, mas as causas genéticas para o desenvolvimento dessa doença podem ser distintas entre elas e, portanto, o tratamento deveria ser diferente.
A comparação de sequências de DNA através dos métodos de Bioinformática vem permitindo que regiões específicas sejam caracterizadas e sirvam de marcadores para indivíduos com perfis específicos. Cada vez mais esses marcadores vêm sendo descritos, e podem ser usados não só para o diagnóstico e tratamento de doenças, como também para recomendar, cientificamente, dietas e exercícios mais indicados para cada indivíduo, entre outras utilidades.
O biomédico é conhecido como um profissional do futuro e, por isso, você não pode ignorar as tecnologias mais modernas para lidar com questões biológicas. Aproveite muito essa oportunidade!
Atividade
1. Assista ao vídeo disponível no YouTube sobre Mulheres na Ciência, da Universidade Federal de Minas Gerais, no qual a professora Dra. Raquel Minardi fala sobre a Bioinformática. Logo no início do vídeo, ela diz que a Bioinformática é interdisciplinar. O que isso significa?
a) O profissional de Bioinformática precisa ter graduação em Biomedicina.
b) O profissional de Bioinformática precisa ter graduação em Biomedicina e Ciência da Computação.
c) A Bioinformática reúne conhecimentos de várias disciplinas para solucionar problemas biológicos.
d) Ter apenas conhecimento sobre computação já é suficiente para uma pessoa seguir a carreira de bioinformata.
e) A Bioinformática não integra conhecimentos de diversas disciplinas.
GABARITO: A Bioinformática promove aproximação e a articulação de várias áreas do conhecimento como Biologia Molecular, Estatística, Matemática e Computação. Cada uma contribui com diversas especialidades para resolução de problemas biológicos. O profissional bioinformata precisa ter conhecimento do problema biológico, assim como saber aplicar ferramentas computacionais e cálculos para solucioná-lo.
2. A Bioinformática inclui diferentes possibilidades de análise de dados biológicos. Qual das opções a seguir não é um tipo de análise realizada por bioinformatas?
a) Análise de sequências de nucleotídeos ou aminoácidos.
b) Análise da estrutura tridimensional de biomoléculas, como as proteínas.
c) Análise dos papéis funcionais de moléculas biológicas.
d) Análise do risco biológico de laboratórios de pesquisa científica.
e) Todas as análises acima são realizadas por bioinformatas.
GABARITO: A análise do risco biológico de laboratórios de pesquisa científica é realizada por profissionais da área de Biossegurança.
3. Assista ao vídeo disponível no YouTube Pesquisa da UFSCar utiliza a Bioinformática para compreender a evolução dos vírus. Esse vídeo ilustra uma aplicação da Bioinformática, buscando entender quais as mudanças que os vírus sofrem com o passar do tempo. Esse tipo de informação pode ser adquirido através de uma abordagem citada pelo pesquisador no início do vídeo. Qual é essa abordagem?
a) Previsão do modo de ligação e os detalhes do reconhecimento entre as proteínas virais.
b) Análise e comparação de sequências de nucleotídeos.
c) Análise da função das proteínas produzidas pelos vírus.
d) Construção de um banco de dados contendo diferentes tipos de informações sobre os vírus.
e) Análise da estrutura tridimensional das proteínas virais.
GABARITO: A análise de sequências virais é citada logo no início do vídeo. Essa análise permite comparar várias sequências de nucleotídeos ou aminoácidos, verificando, assim, se alguma mudança ocorreu ao longo do tempo. As outras opções também são tipos de análise em Bioinformática, porém não foram utilizadas para responder à questão biológica tratada no vídeo.
Aula 2: Conceitos moleculares importantes para a Bioinformática
Apresentação
Você já parou para pensar em quantas espécies animais e vegetais existem? Já se perguntou como toda essa biodiversidade surgiu?
A grande quantidade de espécies existentes hoje no nosso planeta se deve aos mecanismos de evolução que vêm acontecendo desde o surgimento da Terra. Esses mecanismos evolutivos associam as alterações que ocorrem em nível molecular com o surgimento de caracteres que estão associados ao sucesso da adaptação ao ambiente e da capacidade de transferência desses caracteres para seus descendentes.
Nesta aula, discutiremos o papel de componentes moleculares na variabilidade genética entre os indivíduos e associaremos as alterações genéticas aos mecanismos de evolução existentes.
Objetivos
· Relacionar a Biologia Molecular com o surgimento da Bioinformática;
· Combinar o papel da mudança dos ácidos nucleicos com ambiente e a variabilidade gênica;
· Diferenciar os mecanismos de evolução (homologia e analogia).
A Biologia Molecular e a Bioinformática
Após a descoberta da estrutura do DNA por Watson & Crick, em 1953, e posterior descoberta do código genético e do fluxo da informação gênica, os biologistas moleculares intensificaram os estudos no intuito de elucidarem a composição dos genes das diferentes espécies com o auxílio de uma nova ciência que era a Bioinformática.
A Bioinformática surgiu nos anos 1990 como uma ciência multidisciplinar baseada na Biologia Molecular, Biologia Computacional e Matemática. Esta ciência utiliza ferramentas computacionais e matemáticas para desvendar as estruturas das moléculas, assim como para predizer suas funções e sua evolução ao longo dos anos. Desta forma, a Bioinformática utiliza a Biologia Molecular como fonte de informação para criar uma linha de investigação dos dados genéticos e bioquímicos.
A Bioinformática ganhou força com o advento dos projetos genomas, que contribuíram para a geração de uma grande quantidade de informação obtida a partir do sequenciamento do DNA.
A utilidade da Bioinformática dentro da Biologia Molecular está voltada para a execução rápida de tarefas que seriam cansativas para o pesquisador, como: montagem de genes, alinhamentos, análise de sequências nucleotídicas e proteicas, entre outros.
Além disso, a Bioinformática também oferece o armazenamento computacional de toda essa grande quantidade de dados que é gerada com o mapeamento dos genes.
O papel da mudança dos ácidos nucleicos com a adaptação ao ambiente
No século XIX, o pesquisador Charles Darwin publicou o livro A Origem das Espécies, no qual ele relatava as evidências sobre a influência do ambiente na diversidade da vida observada em uma expedição às Ilhas de Galápagos.
TEORIA DA SELEÇÃO NATURAL
A teoria da seleção natural postulada por Darwin discute que alguns organismos podem apresentar características herdáveis que possibilitam a sobrevivência e uma maior taxa de reprodução em relação a outros indivíduos. Logo, a interação dos organismos com o ambiente era mútua, pois apenas os organismos com características favoráveis a uma determinada condição ambiental eram capazes de se adaptar ao meio e passar essas características para seus sucessores.
O que Darwin não sabia era como essas características herdáveis eram transmitidas deuma prole para outra. O conceito de gene e de herdabilidade que surgiram posteriormente auxiliaram no melhor entendimento sobre a seleção natural proposta por Darwin.
Hoje, já se sabe que a diversidade fenotípica entre as espécies observadas por Darwin reflete a variabilidade gênica, ou seja, a diferença entre a composição dos genes e de sequências reguladoras no DNA de cada espécie.
Variabilidade genética
A variabilidade genética pode ser medida pelo percentual de médio da quantidade de alelos heterozigotos ou pela observação da diversidade molecular nas sequências de nucleotídeos gerada por mutação.
Você deve estar se perguntando o que são alelos heterozigotos, não é?
Os seres humanos são diploides, ou seja, são formados por pares de cromossomos. Os cromossomos são formados por DNA e histonas. Dessa forma, em cada cromossomo humano existem sequências nucleotídicas específicas que codificam características que são chamadas de genes.
Nos humanos, cada cromossomo pertencente ao par cromossômico tem origens distintas: um vem da mãe e o outro vem do pai.
 
A existência de alelos heterozigotos em uma determinada espécie reflete a variabilidade genética, uma vez que estes alelos só existem a partir da mistura prévia de indivíduos homozigotos que apresentam alelos homozigotos diferentes para uma mesma característica.
Mutação gênica
Outro fator que nós comentamos que é responsável também pela variabilidade genética das espécies é a mutação.
A mutação gênica é definida como uma alteração na sequência pontual dos nucleotídeos do DNA.
A existência de uma mutação em uma sequência não significa necessariamente uma alteração fenotípica, pois grande parte das mutações acontecem em regiões não codificantes do DNA ou não levam às alterações na proteína que será codificada.
Atenção!
Independentemente da fonte da variabilidade genética, é preciso ficar bem claro que algumas alterações fenotípicas entre os indivíduos não são geradas por um fenótipo herdado, e sim por fatores ambientais.
Exemplo:
Os fisiculturistas apresentam músculos desenvolvidos por esforço físico e suplementação alimentar, e não por fatores herdáveis, pois esta massa muscular desenvolvida não é transferida como característica para a próxima geração. Assim, as alterações fenotípicas acarretadas por variabilidade genética são fatores primordiais para que haja a evolução entre diferentes indivíduos.
Não se preocupe, pois no tópico seguinte discutiremos melhor sobre os mecanismos de mutação.
Evolução e o material genético
Você deve ter percebido o quanto variabilidade genética é importante para a geração de biodiversidade e evolução das espécies ao longo no tempo. Entretanto, você ainda deve estar se perguntando como essa variabilidade genética ocorre entre os diferentes indivíduos e populações?
O principal mecanismo molecular responsável pela variação dos genes são as mutações gênicas.
As mutações pontuais no DNA são eventos genéticos que acontecem de forma repentina e aleatória, e que refletem o mau funcionamento do processo de replicação ou reparo do DNA.
Esses erros podem ser a inserção de uma base incorreta na cadeia de DNA em formação ou uma interferência química sobre as bases nitrogenadas do DNA.
Atenção!
É importante ressaltar que as mutações podem acontecer espontaneamente sem nenhum fator de base ou podem ser induzidas por exposição a agentes químicos ou físicos, como: Radiação UV, agentes mutagênicos, agentes químicos e outros.
As mutações podem ser classificadas de acordo com o tipo celular que elas atingem.
 
Esses diferentes tipos de alterações moleculares podem resultar na troca do códon do RNAm que será transcrito a partir da cadeia de DNA mutada.
Substituição de um nucleotídeo
A substituição de um nucleotídeo pode levar a uma mutação silenciosa, ou seja, por mais que haja a alteração do códon, este novo códon irá codificar o mesmo aminoácido do códon anterior. Como assim? Lembra que o código genético é degenerado? Então, isso pode acontecer.
A mutação por substituição pode ainda ser classificada em:
Consequências
As mutações podem apresentar um amplo espectro de consequências. O que determinará a consequência é o local e a extensão desta mutação.
Exemplo:
Mutações em regiões de íntrons, regiões não codificantes, podem ser mutações neutras e não acarretarem alteração na expressão gênica.
O resultado de uma mutação é extremamente variável e pode corresponder a:
· Nenhuma alteração da função do produto gênico;
· Perda total ou parcial de função do produto gênico ou
· Ganho de uma nova função para o produto gênico.
Taxas de mutação
As mutações são raras e geralmente acontecem em uma taxa baixa, porém esta taxa pode variar entre os diferentes organismos.
Os vírus, por exemplo, podem apresentar altas taxas de mutação (10-3), enquanto as células humanas são menos susceptíveis (10-9).
Em geral, a frequência de mutações cresce com o aumento do tamanho da população até atingirem uma taxa mutacional estável. Outro fator importante é a fixação da mutação em uma população.
Duplicação Gênica
Além da mutação, outros mecanismos podem também contribuir para a variação genética entre as espécies. Um dos mecanismos que vem sendo muito estudados nos últimos anos é a duplicação gênica.
Este mecanismo é definido como um processo de duplicação de um fragmento de DNA, que pode ser gerado por meio de recombinação desigual dos cromossomos homólogos durante a meiose, fazendo com que parte do cromossomo seja duplicada, ou através da movimentação de transposons que carreiam informações genéticas do organismo para regiões diferentes do genoma (figura 2).
 Figura 2: Mecanismo de duplicação gênica. Fonte: Wikipedia.org
A duplicação gênica, quando mantida no organismo, pode ser transmitida para os descendentes e se transformar em uma fonte de novidades evolutivas, já que esta nova cópia poderá acumular mutações, podendo levar ao aparecimento de características funcionais vantajosas.
Comentário
A duplicação gênica contribuiu muito ao longo da história para a formação de novos genes. Um caso da sua ação ocorreu com a família das globinas em mamíferos. Após a duplicação de um gene ancestral, as duas cópias gênicas se diferenciaram por mutações evolutivas dando origem aos genes da alfa e beta globina, o que conferiu refinamento no transporte de oxigênio para os mamíferos.
ESPECIAÇÃO
Durante a expedição para as Ilhas Galápagos, Charles Darwin ficou fascinado com a enorme biodiversidade, que foi associada ao grande número de diferentes espécies que povoavam aquela região. Novas espécies surgem de um processo evolutivo chamado de especiação. É na especiação que uma espécie acumula modificações e se transforma em outra espécie ou dá origem a duas novas espécies. Segundo Darwin, a especiação faz parte da evolução e acontece ao longo do tempo com o intuito de adaptação às alterações ambientais.
O processo de especiação relaciona as mudanças nas frequências dos alelos de uma população com a origem de novos indivíduos adaptados.
Os mecanismos genéticos que estão associados a alteração da frequência dos alelos em uma população são:
· mutações;
· fluxo gênico;
· deriva genética;
· seleção natural.
Saiba mais:
Não lembra desses mecanismos? Então, pesquise em livros sobre evolução e relembre esses conceitos.
Na natureza, existem dois tipos diferentes de especiação, a alopátrica e a simpátrica. A diferença entre os tipos de especiação está relacionada com a forma com que o fluxo gênico entre as populações iniciais foi interrompido.
Homologia x analogia
Conforme foi visto até agora, a evolução é um processo de descendência com modificações, ou seja, mecanismos genéticos acontecem e modificam o fenótipo dos organismos. Essas alterações podem ser incorporadas e transmitidas aos descendentes conferindo vantagens para aquele indivíduo ou podem levar a sua eliminação perante diferentes condições ambientais.
A percepção da evolução é clara quando verificamos que as espécies relacionadas que vieram de um ancestralcomum podem apresentar semelhanças morfológicas com funções distintas.
Você já parou para pensar qual é a semelhança entre o membro anterior humano, a asa de um pássaro, a pata de um cão e a nadadeira de uma baleia? Essas estruturas, apesar de exercerem funções completamente diferentes, apresentam a mesma origem embrionária e, por isso, apresentam grandes semelhanças anatômicas (figura 3).
Como cada uma dessas espécies apresenta estilos de vida diferentes, a adaptação ao ambiente fez com que essas estruturas corporais divergissem ao longo da evolução. Essas estruturas corporais são chamadas de homólogas e o processo evolutivo associado a sua formação é a homologia.
Convergência evolutiva
Mas não são só as espécies próximas que apresentam um ancestral comum que podem compartilhar características comuns.
Espécies distantes também podem compartilhar características comuns por razões distintas, geralmente associadas ao ambiente e estilo de vida. Isso é resultado de uma convergência evolutiva.
Genes parálogos e ortólogos
Nós vimos que a evolução por homologia associa a similaridade morfológica de algumas estruturas corporais com a presença de um ancestral comum entre as espécies.
A evidência evolutiva de que as espécies evoluíram por homologia é a presença de genes homólogos, ou seja, genes que apresentem sequências nucleotídicas iguais ou altamente semelhantes que podem codificar para estruturas com a mesma função ou não.
O conjunto de genes estreitamente relacionados forma uma família de genes homólogos que estão presentes em diferentes espécies e que podem ter surgido ao longo da história evolutiva de diferentes formas.
Os genes homólogos podem ser de dois tipos:
Observe, na imagem a seguir, os dois tipos de genes homólogos.
Atividade
1) Baseado nos conceitos expostos nesta aula, cite quais são os principais mecanismos moleculares associados ao surgimento da variabilidade genética entre os indivíduos.
GABARITO: Mutação gênica e duplicação gênica. A mutação gênica é definida como uma alteração na sequência pontual dos nucleotídeos do DNA, enquanto a duplicação gênica é definida como um processo de duplicação de um fragmento de DNA gerado por meio de recombinação ou através da movimentação de transposons.
2) A evolução das espécies pode acontecer por mecanismos convergentes ou divergentes que resultam em homologias e analogias. Baseado nisso, relacione o mecanismo de homologia e analogia com o surgimento de genes parálogos e ortólogos.
GABARITO: A homologia é uma evidência evolutiva entre as espécies que se baseia na ancestralidade comum. Dessa forma, espécies diferentes podem apresentar caracteres semelhantes devido ao compartilhamento de um ancestral comum, enquanto que na analogia o compartilhamento de caracteres semelhantes entre as espécies se deve à convergência evolutiva, e não à ancestralidade. A homologia é evidenciada pelo compartilhamento de sequências homólogas no DNA, que podem ter sido originadas após a especiação (genes ortólogos) ou após a duplicação no ancestral comum (genes parálogos).
3) A especiação é um processo evolutivo muito importante para formação de novas espécies. Descreva como esse processo ocorre:
GABARITO: A especiação é um processo evolutivo no qual novas espécies surgem a partir das modificações de uma espécie ancestral. A especiação ocorre ao longo do tempo com o acúmulo da alteração no material genético que pode ser dado por mutação ou duplicação gênica. Essas alterações genéticas independentes ocorrem após a separação da população inicial por uma barreira física ou por meio da interrupção do fluxo gênico pelo isolamento reprodutivo. Após este processo, a população inicial diverge gerando duas novas espécies.
Aula 3: Conceitos moleculares importantes para a Bioinformática
Apresentação
Nesta aula, abordaremos o dogma central que estabelece o paradigma da Biologia Molecular: A informação é conservada através da replicação do DNA, que converte a informação contida no RNA em proteínas.
Além disso, destacaremos a expressão gênica através de diversos mecanismos, dentre os quais, como um transcrito primário de RNA sofre splicing ou é processado.
Objetivos
· Reconhecer o dogma central da Biologia Molecular;
· Identificar a influência da expressão dos genes na fisiologia;
· Esclarecer o aparecimento de doenças.
A Biologia Molecular aplicada à Bioinformática
Francis Crick: Importante lembrar que Crick, ao lado de James Watson, biólogo molecular, geneticista e zoologista americano, propuseram o modelo de dupla hélice para a estrutura da molécula de DNA, em 1953.
Expressão gênica
O termo expressão gênica diz respeito ao processo em que a informação codificada por um determinado gene é traduzida e, portanto, decifrada, em uma proteína.
Em teoria, o controle, em qualquer uma das fases desse processo, pode ocasionar uma expressão gênica diferencial.
Em organismos multicelulares, a expressão gênica controlada regula um programa genético imprescindível para o desenvolvimento embrionário e sua diferenciação. Nesse sentido, uma célula é capaz de regular a expressão gênica através de diversos mecanismos, dentre os quais, como um transcrito primário de RNA sofre splicing ou é processado.
A ausência e/ou desequilíbrio de mecanismos da regulação gênica pode, inclusive, determinar o estabelecimento de doenças. É esta temática que será abordada na aula de hoje.
Fluxo de informações do código genético
O dogma central da biologia molecular descreve como ocorre o fluxo de informações do código genético. Segundo esse dogma, o fluxo da informação genética segue o seguinte sentido:
Observa-se, portanto, que esse dogma demonstra todos os processos pelos quais os ácidos nucleicos podem passar. Dessa forma, temos o DNA, onde está contida a informação genética, que pode ser transcrito em moléculas de RNA. É nessa molécula de RNA que é encontrado o código usado para organizar a sequência de aminoácidos e formar as proteínas no processo de tradução, o qual consiste na união de aminoácidos, obedecendo à ordem de códons presentes em uma molécula de RNA mensageiro.
Constituição do DNA
Embora possamos ter uma descrição completa da sequência de DNA de um organismo, isso não nos possibilita reconstruir esse organismo.
Vocês podem se questionar: Por que não? Porque o problema não é conhecer como os elementos funcionam em uma sequência de DNA, mas em quais condições cada produto gênico é produzido. Uma vez produzido, o que ele faz?
Os diferentes tipos celulares em um organismo multicelular diferem drasticamente, tanto em estrutura como em função.
Se compararmos um neurônio com uma célula do fígado, por exemplo, as diferenças são tão extremas que é difícil imaginar que as duas células contenham o mesmo genoma. Por essa razão e porque a diferenciação celular com frequência parecesse irreversível, os biólogos originalmente suspeitaram que genes deveriam ser seletivamente perdidos quando uma célula se diferencia.
Para explicar isto, existem algumas afirmativas importantes:
Como veremos nesta aula, existem muitos passos após a produção do RNA nos quais a expressão gênica pode ser regulada.
Controle das proteínas
Uma célula pode controlar as proteínas que produz de seis formas.
Controles transcricionais
Para a maioria dos genes, os controles transcricionais são os mais importantes. Isso porque, de todos os pontos possíveis de controle, somente o controle transcricional garante que a célula não sintetizará intermediários desnecessários.
A transcrição de genes individuais é ativada e desativada nas células por reguladores transcricionais.
Em organismos procariontes, essas proteínas normalmente ligam-se às sequências de DNA específicas próximas do sítio de início da RNA-polimerase e, dependendo da natureza da proteína reguladora e da localização do seu sítio de ligação em relação ao sítio de início, pode tanto ativar como reprimir a transcrição do gene.
A flexibilidade da dupla-hélice do DNA pode permitir que proteínas ligadas em sítios distantes afetem a RNA-polimerasena sequência promotora do gene.
Atenção!
Lembrem-se que promotores ou sequências promotoras são sequências de DNA específicas importantes para o início da transcrição. Tais sequências são reconhecidas por algumas proteínas específicas, chamadas de fatores de transcrição, que trazem a RNA-polimerase para realizar a montagem dos RNAs.
Um único gene eucariótico normalmente é controlado por muitos reguladores transcricionais ligados a sequências que podem estar localizadas a dezenas ou até a centenas de milhares de pares de nucleotídeos do promotor que direciona a transcrição do gene.
Os ativadores e os repressores eucarióticos atuam por meio de vários mecanismos — geralmente alterando a estrutura local da cromatina e controlando a associação dos fatores gerais de transcrição e da RNA-polimerase no promotor.
Eles fazem isso atraindo coativadores e correpressores, que são complexos proteicos que desempenham as reações bioquímicas necessárias. O momento e o local no qual cada gene é transcrito, assim como suas taxas de transcrição sob diferentes condições, são determinadas por um conjunto particular de reguladores transcricionais que se ligam à região reguladora do gene.
Controles pós-transcricionais
Conforme dito anteriormente, para a maioria dos genes, os controles transcricionais são os mais importantes. Porém, outros controles podem atuar mais tarde, na via do DNA para a proteína, a fim de modular a quantidade de produto gênico que é produzida — e em alguns casos, para determinar a sequência de aminoácidos do produto proteico.
Esses controles pós-transcricionais, que operam após a RNA-polimerase ter se ligado ao promotor do gene e iniciado a síntese do RNA, são cruciais para a regulação de muitos genes.
Splicing
Um dos mecanismos do controle pós-transcricional que abordaremos nesta aula é denominado splicing. Mas, para falarmos sobre isto, precisamos compreender o mecanismo de processamento do RNA.
 
Atenção!
Primeiro, é importante saber que além dos RNAs conhecidos por nós (RNAm, RNA transportador e RNA ribossômico), existem outros RNAs compostos por menos de 300 nucleotídeos. Tais RNAs são chamados de snRNAs (small nuclear RNAs) e scRNAs (small cytoplasmatic RNAs).
Os RNAs são importantes porque se associam a proteínas formando complexos chamados de snRNPs (pequenas partículas de ribonucleoproteínas nucleares, do inglês small nuclear ribonucleoprotein particles) e scRNPs (pequenas partículas de ribonucleoproteínas citoplasmáticas, do inglês small cytoplasmatic ribonucleoprotein particles).
Para o processo de splicing ocorrer, é necessária a formação de grandes arranjos compostos por snRNPs e precursores de RNAm, denominados spliceossomos. Serão tais complexos que farão a excisão dos íntrons do RNAm, processo que requer alta precisão das enzimas envolvidas. A falta ou acréscimo de um único nucleotídeo em um éxon pode promover uma alteração de fase de leitura e levar à produção de uma proteína totalmente diferente da original.
Como o splicing é um mecanismo complexo, altamente regulado, uma mutação em um local de reconhecimento na junção íntron e éxon, ou mesmo em um elemento regulador, pode ocasionar uma falha no processo, gerando um produto anômalo, que pode, diversas vezes, inativar um gene, com sérias consequências.
Considera-se que cerca de 10% das doenças genéticas são causadas por equívocos no processo de splicing.
Entretanto, pesquisas envolvendo ferramentas de Bioinformática e Biologia Molecular podem suscitar estratégias capazes de retificar sequências que abalam padrões de splicing, como também expressar, silenciar ou alterar as concentrações de reguladores, a fim de reparar genes afetados por deleções, a exemplo do que ocorre na distrofia muscular progressiva.
 
O processamento alternativo pode acontecer de diversas formas, podendo-se observar a extensão de éxons ou mesmo omissão. Em alguns, os íntrons são mantidos ao invés de serem eliminados, elevando a diversidade de proteínas produzidas.
Como a regulação da expressão gênica pode ter impacto na etiologia de doenças?
Diagnósticos moleculares de distúrbios aparentemente devidos a defeitos genéticos ou genômicos ainda necessitam de maior número de casos investigados, apesar do grande número de estudos projetados para descobrir defeitos nas regiões codificadoras de proteínas do genoma.
Existe um aumento crescente de estudos para pesquisar defeitos em regiões do genoma não codificadoras e alterações na expressão gênica.
Terapia gênica
Antes de prosseguirmos, é importante esclarecer o que significa o termo terapia gênica.
A terapia gênica consiste, basicamente, na manipulação ou correção da expressão gênica em células-alvo ou, ainda, a transferência de genes para células com finalidade terapêutica.
Comentário
Em 1990, o uso da terapia gênica em seres humanos foi iniciado. Àquela época, o objetivo foi o tratamento de uma paciente com imunodeficiência letal, causada pela deficiência da enzima adenosina deaminase, cujo papel está envolvido no metabolismo de purinas, existindo, em grande quantidade, em linfócitos e monócitos ativados, sobretudo linfócitos T helper. Nesse caso, a paciente recebeu uma transfusão de linfócitos geneticamente corrigidos e cuja expressão do transgene foi de longa duração.
Sem dúvida alguma, os avanços da Biologia Molecular associados às ferramentas de Bioinformática, nas últimas duas décadas, contribuíram muito para o desenvolvimento de técnicas de transferência de genes visando corrigir ou repor a expressão de determinado gene defeituoso.
Na próxima aula, veremos como elaborar um desenho experimental destinado à análise de amostras de DNA e RNA, de forma a obter resultados confiáveis para análises de Bioinformática.
Atividade
1. Pensando na importância do conceito do dogma central da Biologia Molecular, assinale a opção que retrata a relação entre tal dogma e a influência sobre a expressão gênica:
a) Segundo o dogma central da Biologia Molecular, o fluxo da informação genética pode ocorrer de forma independente em relação às moléculas envolvidas— DNA, RNA e proteínas.
b) As condições em que cada produto gênico é produzido não impacta no conhecimento sobre determinado organismo.
c) Existem diversos passos após a produção do RNA nos quais a expressão gênica pode ser regulada.
d) De acordo com o fluxo da informação genética, cada pré-RNAm obtido será processado por uma única forma.
e) Nenhuma das respostas anteriores.
GABARITO: Várias são as etapas após a produção do RNA em que pode haver controle da expressão gênica, por exemplo, o splicing.
2. Assinale a alternativa correta sobre a relação entre regulação da expressão gênica e o surgimento de doenças:
a) O controle transcricional está relacionado ao processamento do pré-RNAm.
b) A última etapa do processamento do pré-RNAm é chamada de splicing, onde são removidos os íntrons e unidos os éxons.
c) Erros no splicing não apresentam consequências para a obtenção de proteínas funcionais.
d) Não há relação entre erros nos processos de regulação gênica e o surgimento de doenças.
e) A última etapa do processamento do pré-DNA é chamada de splicing.
GABARITO: A última etapa do processamento do pré-RNAm é chamada de splicing, na qual são removidos os íntrons, que são as sequências não codificantes, e unidos os éxons, denominados de sequências codificantes.
3. As técnicas modernas de sequenciamento e análise de proteínas proporcionaram a identificação e a análise de genomas completos, além dos perfis de expressão de genes sob determinada condição. Nesse contexto, é incorreto afirmar que:
a) Genômica é o nome dado a um ramo da Bioquímica ou Biologia Molecular que estuda o genoma completo de um organismo.
b) A análise do perfil global de expressão gênica é conhecida como transcriptoma.
c) A análise sistemática das proteínas presentes em determinada situação recebe o nome de Proteômica.
d) A genômica funcional é um ramo da Biologia Molecular cujo objetivo principal é entender a relação entre o genoma de um organismo e seu fenótipo.
e) Entende-sepor genômica o ramo da genética que aplica a tecnologia do DNA recombinante e os métodos de sequenciamento de DNA sem utilizar a Bioinformática, para sequenciar, montar e analisar a função e a estrutura dos genomas dos diferentes organismos.
GABARITO: A genômica é o estudo da composição, estrutura e função do material genético dos organismos por meio de recursos computacionais. Tecnologias genômicas de alto desempenho permitem a análise de milhares de genes em paralelo, integradas aos programas de melhoramento, para a compreensão das relações complexas entre variabilidade genética e diversidade fenotípica.
Aula 4: Pesquisa, material genético e a Bioinformática
Apresentação
Nas aulas anteriores, aprendemos que a Bioinformática é uma área de estudo que mistura a Biologia, a Matemática e as ferramentas computacionais para analisar as biomoléculas relacionadas com a expressão gênica: DNA, RNA e proteínas. Este campo de estudo é extremamente importante para o desenvolvimento de novos biomarcadores, descobertas de novas drogas e outras aplicações na área da Saúde.
Agora, você deve estar se perguntando: E então? Como eu posso iniciar um trabalho na área de Bioinformática? Podemos dizer que iniciar uma pesquisa em Bioinformática não é uma tarefa fácil, pois envolve muitas etapas, começando pelo desenvolvimento do desenho experimental e finalizando com as análises dos resultados obtidos.
Nesta aula, aprenderemos como desenvolver um bom desenho experimental para os estudos em Bioinformática e também sobre as etapas que antecedem as aplicações das técnicas de Biologia Molecular e análises de Bioinformática: Transporte, armazenamento e extração de ácidos nucleicos da amostra de estudo. Vamos lá?
Objetivos
· Esclarecer os critérios básicos na elaboração de um desenho experimental;
· Distinguir transporte e armazenamento de amostras para extração de ácidos nucleicos;
· Explicar as importantes etapas da extração e quantificação de ácidos nucleicos.
Pesquisa científica experimental em Bioinformática
Todos os avanços que observamos até hoje nas áreas da Saúde, economia, ambiental, transportes, assim como em outras áreas, são frutos de pesquisas científicas.
A pesquisa científica é a forma universal de se obter novos conhecimentos que são baseados em fatos e não no senso comum. Ela pode ser conduzida de formas diferentes dependendo do seu objetivo e contexto.
Exemplo:
Uma pesquisa científica pode ser realizada, por exemplo, a partir de buscas teóricas realizadas em livros, artigos, revistas ou pode ser mais laboriosa, necessitando de laboratórios equipados para ser realizada.
Pesquisa científica na área de Bioinformática
Para se iniciar uma pesquisa científica na área de Bioinformática, o primeiro passo a se pensar é no desenho experimental para produzir resultados confiáveis.
Mas o que vem a ser desenho experimental?
O desenho experimental seria uma espécie de roteiro que é seguido pelo pesquisador para conduzir a pesquisa de acordo com o objetivo da mesma, com o intuito de obter resultados estatisticamente confiáveis.
Na área da Bioinformática, as pesquisas científicas são classificadas como experimentais, ou seja, são pesquisas que têm como finalidade testar hipóteses de causa e efeito estabelecidas pelo pesquisador e, para isso, é necessário selecionar a população, controles e as variáveis que serão manipuladas.
Achou confuso? Vamos a um exemplo.
Exemplo
Um estudo científico realizado na África, região endêmica para malária, mostrou que uma determinada população com anemia falciforme não adquiria malária. Neste exemplo, existe uma relação causal entre os eventos: Ausência de malária e presença de anemia falciforme. A ausência de malária seria o efeito enquanto a possível causa seria a presença de anemia falciforme.
Malária: A malária é uma doença causada pelo parasita do gênero Plasmodium.
Desenho de uma pesquisa experimental
Vamos, agora, pensar em alguns passos do desenho de uma pesquisa experimental que devem ser seguidos de acordo com a sua ordem de execução:
Você deve agora estar se questionando sobre todos esses passos. Calma, explicaremos cada um deles!
Estabelecendo uma ideia de relação causa-efeito
Para iniciarmos o desenho de uma pesquisa experimental em Bioinformática, é necessário mais do que estabelecer a relação de causa-efeito entre eventos.
Trabalhando com hipóteses
Nos estudos experimentais, geralmente temos duas hipóteses, a nula e a alternativa.
O objetivo de um experimento é achar evidências que possibilitem aceitar a hipótese alternativa e recusar a hipótese nula.
Agora que você já sabe a diferença dos dois tipos de hipótese, se fôssemos nos basear no estudo da anemia falciforme x malária, qual seria a hipótese nula e a alternativa?
Se você pensou que a hipótese alternativa seria “a presença de anemia falciforme protege contra a malária” e a hipótese nula seria “a presença de anemia falciforme não protege contra a malária”, você acertou!
Se você conseguiu formular corretamente as duas hipóteses, é porque você conseguiu visualizar a importância de pensar nas duas possibilidades como o desfecho do estudo.
Definindo a população de estudo e as variáveis manipuladas
Uma vez que nós temos as hipóteses estabelecidas, o próximo passo é definirmos a nossa população de estudo.
A seleção da população de estudo é a etapa crucial para a garantia dos resultados confiáveis. Existem várias maneiras diferentes de selecionar a população que será estudada, já que não raro é necessário fazer uma amostragem da população, ou seja, selecionar alguns participantes pela impossibilidade de recrutar todos.
Independentemente da maneira pela qual a seleção é feita, o mais importante é que a amostragem seja representativa da população que será estudada.
Seguindo a hipótese nula e alternativa elaborada no caso do estudo da anemia falciforme x malária, qual é a nossa população de estudo?
Se você respondeu pessoas com anemia falciforme, você acertou em parte.
Para provarmos a hipótese alternativa, nós precisamos verificar a ausência de malária em pessoas com anemia falciforme e a presença de malária em pessoas sem anemia falciforme.
Além disso, precisamos verificar se existem pessoas com anemia falciforme e com malária além de pessoas sem anemia falciforme e sem malária (saudáveis embora expostos). Entendeu agora quem é a nossa população?
Outra etapa importante atrelada aos estudos experimentais em Bioinformática é pensar nas variáveis do estudo. Existem basicamente dois tipos de variáveis: Independentes e dependentes.
Exemplo:
Voltando ao exemplo da anemia falciforme e da malária, estudos mostram que a presença de mutação na cadeia da hemoglobina causa a anemia falciforme que está presente em indivíduos sem malária. Neste exemplo, uma variável independente pode ser a mutação e a dependente seria a malária. Entendeu?
Executando o experimento e observando os resultados
Após identificar uma situação-problema, estabelecer a hipótese, identificar as variáveis de estudos e selecionar a população, a pesquisa científica experimental começará de vez.
Uma vez que todos os critérios apresentados acima foram bem definidos, a pesquisa em Bioinformática pode ser conduzida no intuito de gerar bons resultados contribuindo para o desenvolvimento de inovações na área da Saúde
Formulando as conclusões sobre a hipótese estabelecida
Após a obtenção dos resultados, ainda pode ser necessário validá-los de forma estatística com o intuito de fortalecer os resultados encontrados.
Só assim o trabalho científico, que inclui também o trabalho em Bioinformática, vai apresentar a robustez necessária e confiabilidade.
Transporte e armazenamento de amostras destinadas à extração de ácidos nucleicos
Quando uma pesquisa experimental em Bioinformática é iniciada, é necessário ter em mente que a população recrutada irá prover a molécula-alvo do estudo a partir da coleta de espécimes clínicos.
Nas pesquisas de Bioinformática nas quais os alvos são moléculas de ácidos nucleicos, diferentes espécimes clínicos podem ser utilizados.A escolha dependerá do objetivo da pesquisa.
Os espécimes clínicos que podem ser utilizados como fonte de ácidos nucleicos são muitos. Por exemplo: Sangue aspirado de medula, tecido, células bucais, urina, líquor, fezes e outros.
Vamos falar como transportar e armazenar alguns desses espécimes para garantir a integridade do ácido nucleico que será posteriormente extraído.
Extração de ácidos nucleicos
Até então, aprendemos sobre os primeiros passos de como começar uma pesquisa em Bioinformática. A partir de agora, falaremos sobre como obter os ácidos nucleicos a partir das amostras coletadas da população de estudo.
Extrair os ácidos nucleicos é um processo primordial, uma vez que eles são as moléculas-alvos que serão analisadas no estudo de Bioinformática.
Imunidade humoral
A extração de ácidos nucleicos nada mais é do que um processo de separação destes de todos os outros componentes celulares. Esses procedimentos têm como objetivo remover impurezas e substâncias inibidoras da amostra para que se obtenha sucesso na realização das técnicas moleculares que precedem as análises da Bioinformática.
Para que ocorra a extração, é necessário utilizar reagentes químicos com propriedades que beneficiem essa separação combinados com o processo de centrifugação.
Existem diferentes protocolos de extração de ácidos nucleicos, utilizando reagentes diversos. Alguns procedimentos podem ser realizados de forma manual e outros automatizados. Entre os protocolos mais conhecidos, estão os protocolos à base de fenol-clorofórmio, isotiocianato de guanidina ou sílica. Independentemente do protocolo, o processo de extração pode ser dividido basicamente em três etapas:
Extração com base no fenol-clorofórmio
Agora, focaremos em um protocolo de extração que utiliza como base o fenol-clorofórmio!
Como você deve lembrar, os ácidos nucleicos (DNA e RNA) estão dentro do núcleo celular. Desta forma, para acessar essas moléculas, é necessário o rompimento da membrana plasmática celular e da membrana nuclear. O rompimento e a retirada dos lipídios das membranas são realizados na primeira etapa da extração pela ação de substâncias detergentes como brometo de cetiltrimetilamômio (CTAB).
A centrifugação, nesta etapa, também é muito importante, pois após este processo, os debris lipídicos são removidos. Na fase de lise, o ácido etilenodiaminotetracético (EDTA) também é utilizado. Este ácido é um agente quelante de íons bivalentes que funcionam como cofator de DNases. Desta forma, elas são inibidas.
Após a liberação do ácido nucleico, a molécula deverá ser separada dos demais componentes contaminantes da amostra: As proteínas. Para efetuar a retirada e inativação das proteínas, é necessário o tratamento da amostra com uma série de substâncias como: Fenol-clorofórmio ou trizol (desnaturam proteínas), proteinase K (inativa nucleases), NaCl (rompem as ligações iônicas da cadeia proteica) e outras.
O fenol-clorofórmio exerce o papel mais importante desta etapa, pois, além de promover a desnaturação das proteínas contaminantes, ele também atua na separação dos componentes em duas fases após a centrifugação: Fase fenólica (onde estão as proteínas) e a fase aquosa (onde está o DNA ou RNA).
Para finalizar a extração, o DNA ou RNA pode ser precipitado após a adição de etanol à mistura. O etanol promove alteração transitória na estrutura dos ácidos nucleicos levando a sua agregação e precipitação. Ao final do processo, o ácido nucleico poderá ser solubilizado em água e armazenado em freezer ou geladeira para análises futuras (figura 1).
Quantificação e verificação da qualidade do material extraído
Terminado o processo de extração de ácidos nucleicos, você deve estar pensando: Agora, sim, vamos começar a utilizar as ferramentas de Bioinformática! E eu te digo que ainda não!
Antes de analisarmos o nosso ácido nucleico, precisamos verificar a quantidade e a qualidade desse material extraído.
A análise de quantidade e qualidade do material extraído é uma etapa essencial para a garantia dos resultados do nosso estudo. É preciso checar se o nosso processo de extração funcionou, ou seja, se eu tenho apenas o meu ácido nucleico naquela amostra, e se eu tenho uma quantidade de material suficiente para iniciar um método de Biologia Molecular.
O conhecimento da quantidade e da qualidade de ácido nucleico extraído é essencial para:
Basicamente, existem três metodologias que podem ser utilizadas nestas análises: Eletroforese, espectrofotometria e fluorimetria. Vamos falar de cada uma delas a seguir.
Eletroforese
Dentre as técnicas descritas anteriormente, a eletroforese é a mais simples e barata para ser executada, mas também é a que produz os resultados menos precisos.
A técnica da eletroforese consiste na migração da molécula de ácido nucleico sobre a influência de um campo elétrico, ou seja, diferença de potencial (polo positivo e polo negativo).
O DNA/RNA são moléculas com carga negativa devido à presença do grupamento fosfato (PO4-). Assim, eles migram do polo negativo em direção ao polo positivo. Essa migração acontece sobre uma matriz gelatinosa que permite a passagem das moléculas.
Geralmente, a matriz é um gel formado de poliacrilamida ou agarose. Durante a preparação do gel, um composto químico chamado brometo de etídio é adicionado como corante pela sua capacidade de se ligar ao DNA/RNA e emitir fluorescência quando é excitado com luz ultravioleta.
Durante a corrida da eletroforese, as moléculas de ácidos nucleicos, além da influência do campo elétrico, migram de acordo com o seu peso molecular, ou seja, moléculas maiores (mais pesadas) migram de forma mais lenta pelo gel do que moléculas menores (mais leves). Dessa forma, é formado um padrão bandas, de acordo com o peso das moléculas corridas.
A eletroforese, além de revelar a presença da molécula, permite separar diferentes moléculas de ácido nucleico e quantificar pelo escaneamento da banda por densitometria.
O padrão da banda é analisado por um densitômetro que mede a transmitância e, assim, a partir do uso de fórmulas matemáticas, é possível chegar à concentração aproximada de ácidos nucleicos na amostra. A desvantagem da eletroforese em relação às outras técnicas é que a quantificação é imprecisa, pois não é avaliada a presença de moléculas contaminantes na amostra.
Espectrofotometria
A espectrofotometria é uma metodologia ótica realizada em um instrumento chamado espectrofotômetro, no qual a quantificação das moléculas se baseia na quantificação da luz absorvida (absorbância) por ela.
Toda substância, ao receber uma quantidade de luz, é capaz de absorvê-la. Isso produz excitação nos elétrons, que passam para níveis energéticos mais altos. Cada molécula necessita de uma quantidade específica de energia para promover a excitação. No caso do DNA/RNA, essa energia obtida no comprimento de onda é 260nm. Quanto maior for a quantidade de DNA e RNA presente na amostra, maior será o valor de absorbância lida pelo aparelho. Logo, a absorbância é proporcional à concentração da molécula lida.
Atenção!
Para fazer a correlação entre absorbância e mg de ácido nucleico, utiliza-se a seguinte proporção: O valor 1 de absorbância corresponde a 50mg de DNA fita dupla e 32,7mg de RNA fita simples.
Para avaliar a qualidade do material, ou seja, verificar a presença de moléculas contaminantes, a amostra pode ser lida no comprimento de onda de 280nm, pois é nesta faixa que as ligações peptídicas das proteínas se excitam.
Assim, a pureza da amostra de ácidos nucleicos extraídos pode ser realizada com as leituras em 260 e 280nm, analisando-se a relação 260/280. Se o resultado obtido estiver entre a faixa de 1,8 a 2,0, a amostra se encontra em boas condições para o uso, diferente do que ocorre em faixas menores do que 1,6, onde será necessário repetir o processo de extração.
 
Fluorimetria
A fluorimetria é uma técnica de espectroscopia eletromagnética que analisa a luz emitida pelas moléculas fluorogênicas.
 
Atividade
1. Nesta aula, nós aprendemos a importância do desenho experimentalpara a pesquisa em Bioinformática. Baseando-se nos conhecimentos adquiridos, descreva os critérios básicos que devem ser avaliados para a confecção de um desenho experimento.
GABARITO: Para realizar um desenho experimental para pesquisa em Bioinformática, é necessário primeiramente detectar uma situação-problema e criar hipóteses em relação a essa situação. O próximo passo seria identificar a população e as variáveis envolvidas. Após esse processo, inicia-se a etapa experimental que será finalizada com a análise de resultados.
2. João coletou uma amostra de tecidos proveniente de uma biópsia de um câncer de tireoide que será usado em um estudo de biologia molecular. Marque a alternativa correta sobre qual seria o local e a temperatura mais apropriada para João fazer o armazenamento deste espécime clínico.
a) Geladeira (2º a 8ºC)
b) Freezer ( -10ºC)
c) Freezer (-70ºC)
d) Freezer (-20ºC)
e) Nitrogênio líquido (-196ºC)
GABARITO: Como na questão não foi explicitado se João usaria essa amostra para análise de DNA ou RNA, o armazenamento em nitrogênio líquido garante a preservação das duas moléculas, visto que nesta temperatura o metabolismo celular é paralisado.
3. A detecção da qualidade e da quantidade do DNA extraído de uma amostra são informações importantes de serem obtidas antes da etapa experimental, para evitar a produção de resultados não confiáveis. Sabendo da importância desse procedimento, explique as diferenças entre a espectrofotometria e a fluorimetria.
GABARITO: A espectrofotometria é uma metodologia ótica realizada em um instrumento chamado espectrofotômetro no qual a quantificação das moléculas se baseia na quantificação da luz absorvida (absorbância) por ela. Já a fluorimetria é uma técnica de espectroscopia eletromagnética que analisa a luz emitida pelas moléculas fluorogênicas. O DNA e RNA são ligados a corante fluorescente e, ao serem excitados pela absorção de luz, emitem luminosidade fluorescente proporcional à concentração da amostra lida.
Aula 5: Métodos de sequenciamento de DNA
Apresentação
Nesta aula, abordaremos o sequenciamento de DNA e identificaremos suas principais características.
Enfatizaremos a determinação da ordem exata em que os nucleotídeos se encontram ao longo da dupla fita e conheceremos as estratégias desenvolvidas, além da importância dessa técnica para o avanço da Bioinformática.
Objetivos
· Esclarecer o princípio de sequenciamento de Sanger;
· Examinar a relação entre as novas técnicas e o avanço da Bioinformática;
· Discutir sobre os sequenciadores de 1ª a 4ª geração.
A estrutura do DNA
A partir da descoberta da estrutura do DNA, importantes avanços levaram à compreensão da complexidade e diversidade dos genomas. Os primeiros métodos de sequenciamento direto do DNA só foram criados na década de 1970.
Os conhecimentos existentes sobre a organização do gene e genoma eram baseados principalmente em estudos de genética reversa, na qual a sequência de aminoácidos do produto do gene de interesse é retro-traduzida em uma sequência de nucleotídeos com base nos códons apropriados. Considerando a característica degenerada do código genético, este processo pode ser complicado e os resultados não corresponderem à realidade.
Os dois primeiros métodos de sequenciamento de DNA foram os de Maxam-Gilbert, conhecido como método de clivagem química e o método de terminação de cadeia de Sanger, tendo este último dominado os trabalhos até meados dos anos 2000.
Projetos de sequenciamento, incluindo principalmente o Projeto Genoma Humano, propiciaram o desenvolvimento de soluções tecnológicas mais avançadas tanto para a geração dos dados quanto para a análise destes.
Estes avanços ajudaram a responder aos novos questionamentos que surgiram, mas as principais barreiras, que eram a produção limitada e os altos custos de sequenciamento, permaneciam.
O lançamento da primeira plataforma de sequenciamento de alto rendimento (eg. high throughput), o Roche 454, em meados da década de 2000, propiciou uma redução de 50.000 vezes no custo do sequenciamento. A nova geração de sequenciadores de DNA (NGS) continuou a evoluir e aumentou a capacidade por um fator de 100-1.000.
Embora seja um grande avanço na forma de se analisar genomas, essas novas abordagens têm suas limitações.
 À medida que novas tecnologias surgiram, os problemas existentes foram exacerbados ou apareceram novos. As novas plataformas, apesar de fornecer grandes quantidades de dados, possuem taxas de erro associadas mais elevadas. Além disso, as leituras são geralmente mais curtas do que o do tradicional sequenciamento de Sanger, exigindo exame mais cuidadoso dos resultados.
Cabe salientar que, devido ao grande número de sequências gerado, a tecnologia de processamento dos dados também teve que evoluir, incluindo a capacidade computacional associada e software.
Em princípio, o conceito subjacente a essa tecnologia se assemelha ao mecanismo de eletroforese através de capilares, onde as bases de um pequeno fragmento de DNA podem ser identificadas sequencialmente a partir de sinais emitidos.
No entanto, os métodos mais modernos ao invés de se limitarem a analisar pequenos fragmentos de DNA, passaram a avaliar milhões deles em uma única corrida. Com isso, esse avanço tecnológico permitiu que fosse realizado um sequenciamento mais eficiente, com uma maior cobertura incluindo genomas inteiros através de uma única reação.
É importante destacar que o método de terminação em cadeia não deixou de ser utilizado, mas está caindo em desuso com o passar dos anos.
O sequenciamento genômico é uma técnica que permite identificar, na ordem correta, a sequência de nucleotídeos de uma molécula de DNA ou RNA, visando conhecer a informação genética contida nesta estrutura.
As metodologias responsáveis por tal façanha fornecem, para cada uma das bases determinadas, uma informação referente a sua qualidade (confiabilidade).
Desde o desenvolvimento das primeiras metodologias de sequenciamento (no final da década de 1970) até as tecnologias atuais, denominadas de Sequenciamento de Nova Geração (New Generation Sequencing— NGS), passamos da escala de sequenciamento manual de poucos kilobases para o sequenciamento maciço e paralelo de genomas inteiros e em curto período de tempo.
Nesta aula, discutiremos algumas das metodologias de sequenciamento mais utilizadas, focando em seus princípios, peculiaridades, aplicações, vantagens e desvantagens.
Além disto, serão apresentadas, sucintamente, tecnologias ainda em desenvolvimento, classificadas como de terceira geração. De forma geral, o sequenciamento é feito a partir de moléculas de DNA advindas diretamente do DNA genômico (aquele que contém a maior parte da informação genética dos organismos) ou de outras moléculas de DNA celular como: DNA mitocondrial, DNA cloroplastídico, DNA plasmidial, dentre outros.
Metodologias de sequenciamento em pequena escala
Entre 1800 e 1900, as proteínas foram consideradas as moléculas mais importantes dentre os constituintes celulares. No entanto, a primeira sequência proteica só foi sequenciada em 1953. Neste mesmo ano, Watson e Crick propuseram o modelo de dupla hélice do DNA, iniciando uma nova era no estudo do DNA.
Apesar dos avanços, era muito difícil até o começo da década de 1970, obter a sequência de nucleotídeos de um fragmento de DNA, por menor que fosse. Este problema foi resolvido com o surgimento em 1977 de duas tecnologias: Uma, desenvolvida por Allan Maxam e Walter Gilbert (baseada em hidrólise química), e outra por Frederick Sanger e cols. (baseada em reações enzimáticas), que permitiram determinar a sequência de nucleotídeos de fragmentos maiores de DNA.
Segundo Sanger et al. (1977), metodologias revolucionaram as pesquisas científicas e se difundiram rapidamente pelo mundo, sendo a base da Genômica.
Sequenciamento químico de Maxam-Gilbert
Após divulgada, esta metodologia foi amplamente utilizada por proporcionar a obtenção da sequência de nucleotídeos de fragmentos maiores de DNA.
Após divulgada, esta metodologia foi amplamente utilizadapor proporcionar a obtenção da sequência de nucleotídeos de fragmentos maiores de DNA.
Sequenciando genomas 29
A técnica desenvolvida por eles utiliza marcação do DNA alvo a ser sequenciado com fósforo radioativo (P32). O P32 é inicialmente ligado ao dATP formando P32-dATP, que é incorporado pela enzima polinucleotídeo quinase ao DNA a ser sequenciado.
Tal incorporação pode ser tanto na extremidade 5’ quanto na extremidade 3’, ficando a critério do executor da técnica. Neste método, o rompimento das pontes de hidrogênio da fita dupla de DNA ocorre pela adição de dimetilsulfato e aquecimento a 90ºC.
O princípio básico desta técnica consiste na clivagem do DNA alvo marcado, através da utilização de compostos químicos, em posições específicas (antes dos “G”s, antes de “A” ou “G”, antes de “C” ou “T” e antes dos “C”s).
A posição a ser quebrada depende do composto químico que é adicionado, num só tipo, a um dos quatro tubos contendo o DNA molde a ser sequenciado. Como resultado, tem-se após a fragmentação um conjunto de fragmentos de diferentes tamanhos em cada um dos quatro tubos.
As bandas geradas após a corrida destes fragmentos em gel de poliacrilamida podem ser visualizadas após a impressão de uma chapa radiográfica. A determinação da sequência de nucleotídeos é obtida lendo-se de baixo para cima, um a um, os nucleotídeos representados pelas bandas do gel.
Método de Sanger
A técnica de sequenciamento desenvolvida por Sanger utiliza marcação radioativa, marcando os fragmentos de DNA sintetizados a partir da fita molde. A síntese de novos fragmentos de DNA a partir da fita molde só foi possível graças ao desenvolvimento da técnica de PCR (reação em cadeia da polimerase), que consiste na síntese in vitro de uma fita de DNA complementar a um DNA molde, utilizando os seguintes componentes básicos da replicação celular:
· Cópias do DNA molde que deverá ser sequenciado, apresentando relativo grau de pureza.
· Enzima DNA polimerase capaz de produzir cópias relativamente fiéis do DNA molde.
· Um DNA iniciador (primer) que propicia o início da extensão pela DNA polimerase.
· Os desoxinucleotídeos que são as unidades básicas para a construção da fita complementar ao DNA molde. São eles: dATP, dCTP, dGTP e dTTP.
· Solução tampão, contendo o cofator magnésio (Mg), necessário para que a enzima DNA polimerase desempenhe sua atividade.
Por fim, é necessária ainda a presença de didesoxinucleotídeos (ddATP, ddCTP, ddGTP e ddTTP), que atuam como terminadores da síntese de DNA. A chance dos desoxi ou didesoxinucleotídeos serem incorporados numa determinada posição da cadeia de DNA nascente é a mesma, uma vez que a DNA polimerase não consegue distinguir estes dois nucleotídeos pelo fato da diferença entre eles ser apenas a ausência do grupo OH na posição 3´.
 
O princípio da técnica consiste em marcar radioativamente alguns dos desoxinucleotídeos livres em solução ou o primeiro desoxinucleotídeo do primer com P32 ou S35.
Após incorporação na cadeia de DNA nascente, estes átomos marcados emitem radiação que é utilizada para impressão de uma chapa radiográfica, permitindo, dessa forma, visualizar os fragmentos resultantes da amplificação.
A técnica se desenvolve da seguinte maneira:
· Primeiro, o DNA fita dupla é desnaturado e utilizado para montar quatro reações independentes contendo os mesmos reagentes, com exceção dos didesoxinucleotídeos, que são adicionados separadamente (um determinado tipo em cada reação).
· Após um determinado tempo de reação, considerando que nada dirige a entrada de desoxi ou didesoxinucleotídeos na cadeia de DNA nascente e que os mesmos são colocados em excesso na reação, será produzido um conjunto de fragmentos complementar ao DNA molde com tamanhos variados, sendo o tamanho de cada fragmento dependente da posição onde o didesoxinucleotídeo terminador foi adicionado.
· Se pensarmos que existem na mistura muitas moléculas do mesmo DNA molde, compreenderemos que todas as posições do DNA molde, em algum momento, terão um dNTP, ora um ddNTP complementar. Assim, teremos amplicons (produto da PCR) terminando em diferentes posições do DNA molde.
· O produto heterogêneo de cada uma das quatro reações é aplicado em canaletas diferentes do gel que, frequentemente, têm a poliacrilamida como matriz. Devido ao alto poder de resolução (separação dos fragmentos) deste gel, é possível separar e visualizar fragmentos que diferem entre si por apenas um nucleotídeo.
· As bandas produzidas são visualizadas numa chapa radiográfica após sua impressão. Assim, como no método anterior, a análise da ordem das bandas na chapa radiográfica começa pelo final do gel, permitindo determinar a sequência de nucleotídeos da fita de DNA recém-sintetizada. Esta técnica permitiu inicialmente separar de 200 a 300 nucleotídeos por corrida, sendo considerada uma revolução na época em que foi descoberta.
Aprimoramento do método de Sanger
Método semiautomatizado
A ciência não para e está sempre buscando novas descobertas, que na maioria das vezes surgem para melhorar a vida de todos nós.
Não foi diferente com a metodologia de sequenciamento proposta por Sanger. Classificada como manual por não utilizar o computador em nenhuma de suas etapas, esta metodologia foi aperfeiçoada originando o método semiautomatizado, que é a base de muitas metodologias de sequenciamento atuais.
A ideia de automatizar o sequenciamento foi proposta por Lloyd M.Smith, Mike Hunkapiller e Tim Hunkapiller na universidade privada do estado da Califórnia. O princípio do método proposto por Sanger permaneceu o mesmo. No entanto, a técnica foi aprimorada ficando mais simples, rápida e segura por não utilizar compostos radioativos prejudiciais à saúde humana.
Mas, que mudança foi esta que trouxe tantas melhorias à técnica, fazendo com que dominasse as três décadas seguintes?
A principal modificação foi a adição aos didesoxinucleotídeos, de corantes capazes de emitir fluorescência quando excitados em comprimento de onda específico. No início, Smith mostrou-se pessimista quanto à exequibilidade do método, temendo que a quantidade de corantes adicionados aos didesoxinucleotídeos fosse insuficiente para ser detectada pelo computador. No entanto, este problema foi rapidamente resolvido pela utilização de corantes especiais, que emitem luz ao serem atravessados por um feixe de raios laser.
O método aprimorado utiliza fluoróforos diferentes para cada um dos quatro tipos de didesoxinucleotídeos que, ao serem excitados, emitem luz característica do didesoxinucleotídeo incorporado.
Utilizaremos aqui o mesmo raciocínio apresentado no método inicial de Sanger: Se pensarmos que existem na reação muitas moléculas do mesmo DNA molde, compreenderemos que todas as posições deste DNA terão, em algum momento, ora um dNTP, ora um ddNTP incorporado pela DNA polimerase durante a PCR. Assim, teremos amplicons terminando em diferentes posições do DNA molde.
Como consequência da incorporação dos didesoxinucleotídeos marcados com fluorescência, as quatro reações passaram a ocorrer num tubo único e seu conteúdo podia agora ser aplicado numa única canaleta do gel. Este fato fez com que o número de amostras analisadas por corrida fosse quatro vezes maior, considerando que no método radioativo eram necessárias quatro canaletas do gel para obter o mesmo resultado que o novo método conseguia em uma canaleta.
Método automatizado
Nos anos 1990, os géis (de difícil manuseio) foram substituídos por finíssimos capilares preenchidos com gel onde os fragmentos de DNA são separados em altíssima velocidade.
Os sequenciadores baseados neste sistema são, aproximadamente, duas vezes mais rápidos do que os semiautomatizados. As amostras são aplicadas através de um sistema de eletroinjeção diretamente nos capilares diminuindo consideravelmente o trabalho do analista.
Para termos uma ideia do nível de automação dos sequenciadores de capilares atuais, 15 minutos de intervenção humana a cada 24 horas é suficiente para produzir aproximadamente meio milhão de pares de bases.

Continue navegando