Prévia do material em texto
Bioinformática Aula 8: Alinhamento de sequências e desenho de primers Apresentação Nesta aula, abordaremos conceitos sobre o alinhamento de sequências e desenho de primers, destacando as principais ferramentas utilizadas. Conheceremos as aplicações no desenho de primers, sondas, alinhamento (comparação) de sequências e predição de resultados de reações de PCR. Objetivo Aplicar o conhecimento das aulas anteriores; Decodi�car a utilização do Blast para elaboração de um primer; Esclarecer a aplicação do Blast na sequência de primer adequada. NCBI Nucleotide Search Quando falamos em ferramentas para o desenho de primers, sondas e a comparação de sequências, três são essenciais. A primeira delas é o NCBI Nucleotide Search, que procura as sequências-alvo desejadas incluindo os genes de alguns animais, do homem, plantas, protozoários, fungos, bactérias e vírus. (Fonte: NCBI Nucleotide Search) A tela inicial tem um campo onde se escreve o nome do gene de interesse. Após a escolha da sequência, é aberta uma página que mostra muitas características da sequência: O nome do organismo e do tipo celular de onde este gene foi isolado, o nome da proteína proveniente (quando a sequência é uma região codi�cável do genoma), a classe da proteína (receptor, citocina, proteína estrutural etc.), o artigo cientí�co em que a sequência foi publicada, a tradução (sequência de peptídeos da proteína gerada), informações sobre os locais de início de transcrição e tradução, entre outras. O tamanho mínimo, ótimo e médio do primer que se deseja criar Recomenda-se que este número seja maior que 15 pares de bases e não maior que 35 pares de bases em condições normais. Primer Tm: Temperatura mínima, ótima e máxima de melting do par de primers. Recomenda-se a escolha de números entre 45ºC e 72ºC, para garantir a especi�cidade da ampli�cação. Primer GC% Concentração de bases G e C nas cadeias dos primers. Salvo em casos especiais, recomenda-se a escolha de valores de até 60%, pois concentrações mais altas podem causar aumento excessivo da temperatura de anelamento, di�cultando, assim, a padronização da reação. Salt concentration Refere-se ao conteúdo total de íons metálicos (em nM) na solução. O valor que o programa oferece (50nM) é adequado na maioria dos casos. Os demais parâmetros não são utilizados rotineiramente. Estes parâmetros dizem respeito à estabilidade térmica dos primers, sua chance de formar dimers, self-dimers, hairpins, sua energia cinética e outros fatores. Sua utilização não será abordada aqui por não ser usual. Estes dados são utilizados em casos especí�cos apenas. Após o preenchimento correto dos parâmetros, clica-se na tecla Pick Primers, logo abaixo das funções Liberal Base e Show Debugging Info. A janela de resultados mostra, a princípio, o par de iniciadores que o programa julgou mais adequado para a ampli�cação em questão, levando em conta os parâmetros fornecidos pelo usuário. Mostra não apenas a sequência de cada primer, mas também a região onde estes se anelam ao DNA-molde, seu tamanho em pares de base, o Tm de cada um e os valores de porcentagem de GC. Outros valores são mostrados, com importância apenas para casos especí�cos. Rolando-se a página até o �m, pode-se observar alguns pares alternativos. Estes pares também podem ser utilizados, porém com maior parcimônia, pois não são tão adequados à reação quanto o primeiro par, já visto. No meio da página, o programa fornece a região ampli�cada, delimitada por uma série de sinais > representando a região de anelamento do Sense primer e de sinais“. Atenção! Aqui existe uma videoaula, acesso pelo conteúdo online Blast Clique no botão acima. O BLAST é talvez o melhor programa de alinhamento de sequências que existe. Pela sua interface, é possível inserir uma sequência genérica e compará-la com todos os genes já sequenciados até o momento. Como veri�cação �nal do processo de idealização de primers, deve-se inserir a sequência obtida pelo Primer3, correspondente à ampli�cação de interesse e confrontá-la com o banco de dados do BLAST. Este processo elimina erros, impedindo que os primers ampli�quem uma sequência errada e mostra a possibilidade de reações cruzadas. O programa estará disponível após acessar o link Standard nucleotide-nucleotide BLAST [blastn]. Nesta página, existe o campo de preenchimento, onde deve-se colocar a sequência obtida pelo Primer3. Feito isto, basta clicar no botão BLAST!, localizado no pé da página. A interface amigável e os controles intuitivos são provavelmente a maior razão do sucesso deste programa, que já conta com mais de uma década de existência. O programa apresenta uma tela de comando, com informações sobre o número do pedido de alinhamento de sequências. Para passar desta etapa, basta clicar em Format! A utilização de softwares como BLAST e Primer3 é de grande valia, poupando tempo e dinheiro na padronização de reações de PCR e servindo como referência. Algumas revistas cientí�cas só aceitam primers cuja sequência foi veri�cada pelo BLAST e desenhados por programas como o Primer3. Apesar de reduzir o tempo de padronização, a experimentação nunca pode ser substituída pelo uso de simulações em computador. As temperaturas de anelamento dos primers obtidos por todo este processo, desde a busca no NCBI até a veri�cação pelo BLAST, devem ser apuradas experimentalmente antes de se começar a sua utilização. Atenção! Aqui existe uma videoaula, acesso pelo conteúdo online Atenção! Aqui existe uma videoaula, acesso pelo conteúdo online O uso do desenho de primers no dia a dia A PCR (polymerase chain reaction) é uma reação em cadeia da polimerase que permite a ampli�cação exponencial de segmentos de DNA in vitro. A reação se processa em diferentes etapas, cada uma em uma temperatura controlada por um aparelho denominado termociclador . A primeira é a etapa de desnaturação térmica do DNA (~95ºC). Nesta temperatura, as �tas de DNA serão completamente separadas. Em seguida, a etapa anelamento dos primers (50~60ºC). Nesta etapa, ocorre o pareamento dos primers por complementariedade. A temperatura utilizada dependerá da composição de bases do primer. E a terceira etapa é a extensão do DNA . A extensão ocorre a 72ºC, temperatura em que a Taq Polimerase (um DNA polimerase) apresenta melhor atividade. Estas três etapas compõem um ciclo da PCR e se repetem por várias vezes, permitindo a ampli�cação de uma região do DNA. Saiba mais A de�nição da região a ser ampli�cada é determinada pelo par de primers, que funcionam como iniciadores da polimerização, delimitando a região do DNA a ser copiada. Os primers são oligonucleotídeos que apresentam sequência complementar à região de anelamento. Cada um dos primers introduzidos na PCR irá parear com uma das �tas de DNA. Os primers precisam apresentar algumas características para que se obtenha sucesso na PCR. Dentre as características, temos: Conteúdo CG deve estar por volta dos 50%. Isso garante que o primer apresente uma maior especi�cidade de interação com a região de complementariedade. Lembre-se que a etapa de anelamento ocorre em uma temperatura menor que a de extensão. A elevação da temperatura faz com que a interação entre o primer e a região de complementariedade do DNA diminua. Se o conteúdo CG for muito menor que 50%, eles irão se dissociar completamente. Não devem conter complementariedade entre suas bases Um primer não pode conter complementariedade com ele mesmo ou com o seu par. Se estes eventos ocorrerem, observaremos a formação de estruturas denominadas de autodímeros e dímeros. Caso ocorram em temperaturas próximas daquelas utilizadas nas etapas da PCR, ao invés do primer parear com a região do DNA de interesse, ele estará pareando com outro primer, reduzindo a e�ciência do processo. A temperatura de anelamento entre os primers não deve diferir mais do que 3ºC. Para se determinar a temperatura de anelamento dos primers, devemos partir da fórmula do cálculo da temperatura de melting [Tm= 2(A + T) + 4(G + C)ºC], onde A, T , G e C, devemser substituídos pela quantidade de vezes que cada uma das bases aparece no primer. Após a obtenção deste valor, utilizaremos a seguinte fórmula para a obtenção da temperatura de anelamento: T anelamento= Tm (primer) – 4 ºC. A fórmula será utilizada para cada um dos dois primers . Ao �nal, a diferença entre os primers deverá ser <3 [T anelamento (primer esquerda) - T anelamento (primer direita) <3]. Isso garante que, no momento de se determinar a temperatura de anelamento no termociclador, ambos os primers estarão pareando com o DNA o mais próximo possível da sua temperatura ótima de anelamento. Existem outras maneiras de se calcular a temperatura de anelamento, mas esta será a utilizada em nossa disciplina. Após análise das características básicas, iremos construir um par de primers, com o objetivo de ampli�car uma determinada região de um gene humano de interesse. A primeira etapa a ser realizada é encontrar a região genômica que apresenta o gene de interesse. Para isso, iremos realizar uma busca no banco de dados do NCBI pelo gene de interesse utilizando um banco de dados de genes. Iremos acessar o gene correspondente em humanos e, a partir desta busca, acessar a sequência de nucleotídeos do gene clicando no link RefSeqGene presente na barra lateral direita do site. Ao acessar, clicando em GenBank, será apresentado. Atividade 1. O método de sequenciamento Sanger: a) É baseado na modificação química do DNA utilizando piperidina e foi inicialmente desenvolvido por Allan Maxam e Walter Gilbert e, mais tarde, modificado por Sanger. b) É baseado na incorporação de didesoxinucleotídeos que, ao serem incorporados, impedem a adição de nucleotídeos adicionais. c) Requer todas as enzimas necessárias para a replicação de DNA como helicases, polimerases, porém, não necessita da primase, pois são adicionados iniciadores artificiais com os nucleotídeos e didesoxinucleotídeos. d) Depende do preparo de géis de acrilamida para separar os diferentes fragmentos de DNA que serão analisados. e) É limitada pela necessidade do uso de isótopos radioativos para a marcação dos fragmentos de DNA que serão sequenciados. 2. (FUVEST) Em vez de sequenciar as bases nitrogenadas de todos os cromossomos de uma planta com um genoma muito grande, pesquisadores selecionaram partes desse genoma para sequenciar. Somente as sequências de DNA que correspondem ao conjunto dos RNA mensageiros transcritos no fruto serão estudadas. O DNA a ser sequenciado foi sintetizado em laboratório, tendo como molde as moléculas de RNA extraídas dos frutos. a) Se os cientistas fossem sequenciar todo o genoma dessa planta, haveria diferença se o material genético viesse do fruto ou da folha da planta? Justi�que. b) No estudo das sequências que tiveram como molde RNA mensageiro, faria diferença se esse RNA mensageiro fosse extraído das folhas ou dos frutos? Justi�que. 3. Diversas técnicas são utilizadas para determinar, em genes de uma célula eucariota, a sequência de bases nitrogenadas codi�cantes, ou seja, aquela que de�ne a estrutura primária da proteína a ser sintetizada. A abordagem experimental mais frequente, hoje, consiste em, primeiramente, extrair os RNA mensageiros da célula, sintetizar os seus DNA complementares e, então, proceder ao sequenciamento das bases presentes nesses DNA. Em uma bactéria, no entanto, é possível determinar a sequência codi�cante diretamente a partir de seu cromossomo. Explique o motivo pelo qual, em organismos eucariotas, é preferível utilizar o RNA-mensageiro para determinar a região codi�cante do DNA. 4. (PUC-SP) […] De outro lado, o galardão de Química �cou com os inventores de ferramentas para estudar proteínas, os verdadeiros atores do drama molecular da vida. É verdade que a Fundação Nobel ainda fala no DNA como o diretor da cena a comandar a ação das proteínas, mas talvez não seja pretensioso supor que foi um lapso, e que o sinal emitido por essas premiações aponta o verdadeiro futuro das pesquisas biológicas e médicas muito além do genoma e de seu sequenciamento (uma simples soletração) […]. O autor refere-se às proteínas como atores do drama molecular e ao DNA como diretor de cena. Essa referência deve-se ao fato de: a) Não ocorrer uma correlação funcional entre DNA e proteínas no meio celular. b) O DNA controlar a produção de proteínas e atuar como catalisador de reações químicas celulares. c) O material genético ser constituído por proteínas. d) As proteínas não terem controle sobre o metabolismo celular. e) O DNA controlar a produção de proteínas e estas controlarem a atividade celular. 5. Marque a alternativa que melhor de�ne um gene: a) O gene é uma porção da molécula de RNA que determina uma característica. b) O gene é uma região do DNA que é responsável pela síntese de carboidratos, determinando nossas características. c) O gene é uma sequência de nucleotídeos em que está contida a informação que será usada para a síntese de proteínas. d) Trecho do RNA que contém sequências de nucleotídeos que são usados para a síntese de proteínas. Notas Referências BRAMMER, Sandra Patussi. A técnica da eletroforese: Importância e aplicações em análises genéticas. Documentos Online. Disponível em: //www.cnpt.embrapa.br/biblio/p_do06.pdf. Acesso em: 24 jan. 2020. FAKRUDDIN, M. D.; CHOWDHURY, A.; HOSSAIN, M. D. N.; MANNAN, K. S. B.; MUZAMDAR, R. M. Pyrosequencing— Principles and Applications. International Journal of Life Science and Pharma Research, v. 2, p. L.65-75, 2012. Disponível em: //www.ijlpr.com/admin/php/uploads/67_pdf.pdf . Acesso em: 24 jan. 2020. FIGUEIREDO, Graziella S. et al. Reação de sequenciamento de DNA e puri�cação— Protocolos otimizados. Circular Técnica, n. 22, dez. 2003. Disponível em: //ainfo.cnptia.embrapa.br/digital/bitstream/CENARGEN/24105/1/ct022.pdf. Acesso em: 24 jan. 2020. LEITE, Marcelo. De volta ao sequenciamento. Folha de S. Paulo, São Paulo, 20 out. 2002. MINOCHE, A. E.; DOHM, J. C.; SCHNEIDER, J.; HOLTGRÄWE, D.; VIEHÖVER, P.; MONTFORT, M.; HIMMELBAUER, H. (2015). Exploiting single-molecule transcript sequencing for eukaryotic gene prediction. Genome Biology, 1–13. PEIXOTO, B. M. Classi�cação de sequência e análise de diversidade em metagenômica. Tese (Mestrado em Bioinformática)— Universidade Estadual de Campinas/UNICAMP— Instituto de Computação, 2013. QUAIL, M.; SMITH, M. E.; COUPLAND, P.; OTTO, T. D.; HARRIS, S. R.; CONNOR, T. R.; GU, Y. (2012). A tale of three next generation sequencing platforms: Comparison of Ion torrent, paci�c biosciences and illumina MiSeq sequencers. BMC Genomics, 13(1)1. Disponível em: //doi.org/10.1186/1471-2164-13-341. Acesso em: 27 jan. 2020. ROBERTS, R. J.; CARNEIRO, M. O.; SCHATZ, M. C. (2013). The advantages of SMRT sequencing. Genome biology, 14(6), 405. STADERMANN, K. B.; WEISSHAAR, B.; HOLTGRÄWE, D. (2015). SMRT sequencing only assembly of the sugar beet (beta vulgaris) chloroplast genome. BMC Bioinformatics, 16(1), 295. javascript:void(0); javascript:void(0); javascript:void(0); Próxima aula As ômicas e sua importância nos estudos cientí�cos. Explore mais Pesquise na internet sites, vídeos e artigos relacionados ao conteúdo visto. Em caso de dúvidas, converse com seu professor online por meio dos recursos disponíveis no ambiente de aprendizagem.