Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade Federal de Goiás Instituto de Ciências Biológicas Curso de Biomedicina Alinhamento de Sequências Discente: Renata Marques De Souza Goiânia 2019 Introdução O alinhamento de sequências consiste no processo de comparar duas sequências (de nucleotídeos ou proteínas) de forma a se observar seu nível de identidade. Essa técnica de comparação de sequências é implementada segundo um conceito de desenvolvimento de programas conhecido como um algoritmo guloso e é um dos pilares de toda a bioinformática. Existem centenas de aplicações do alinhamento de sequências, tanto na identificação de genes e proteínas desconhecidas, quanto na comparação da ordem de genes em genomas de organismos proximamente relacionados (sintenia), no mapeamento de sequências expressas dentro de um genoma para identificação de genes, na montagem de genomas e em diversas outras aplicações. Por exemplo, podemos alinhar duas sequências para descobrirmos o grau de similaridade entre as sequências de forma que possamos inferir (ou não) a uma delas, alguma propriedade já conhecida da outra (Prosdocimi et al., 2003). O alinhamento entre duas sequências pode ser feito de forma global ou local. O alinhamento global é feito quando comparamos uma sequência de aminoácidos ou nucleotídeos com outra, ao longo de toda sua extensão. O algoritmo Needleman- Wunsch é o mais conhecido para realizar esse tipo de alinhamento. Nesse caso são dados valores em uma matriz de comparação para as similaridades (matches), diferenças (mismatches) e falhas (gaps) encontrados durante o alinhamento das sequências. O alinhamento local acontece quando a comparação entre duas sequências não é feita ao longo de toda sua extensão, mas sim através de pequenas regiões destas (http://www.ncbi.nlm.nih.gov/Education/BLASTinfo/glossary2.html). O principal programa utilizado para o alinhamento local de sequências é o BLAST (Basic Local Alignment Search Tool ou Ferramenta Básica de Procura por Alinhamento Local), encontrado em http://www.ncbi.nlm.nih.gov/BLAST/. Esse software compreende um conjunto de algoritmos de comparação de sequências montado de forma a explorar toda a informação contida em bases de dados de DNA e proteínas. Metodologia Forma realizados a pesquisa da sequência genômica (DNA) e a sequência traduzida (proteína) do gene da alpha tubulin 2 de Plasmodium falciparum 3D7. Alpha Tubulin 2 plasmodium falciparum 3D7 Figura 1: pesquisa da sequência de DNA para o homologo do gene em humanos (Homo sapiens (taxid:9606). Figura 2: usando o blast realizamos pesquisa de sequência de DNA. Sequência genômica (DNA) e a sequência traduzida (proteína) do gene da alpha tubulin 2 de Plasmodium falciparum 3D7. Usando a plataforma NCBI. Alpha Tubulin 2 [Plasmodium falciparum 3D7] >XP_001351526.1 alpha tubulin 2 [Plasmodium falciparum 3D7] MREVISIHVGQAGIQIGNACWELFCLEHGIQPDGQMPSDQVVAGGDDAFNTFFSETGAGKHVPRCVFVDL EPTVVDEVRTGTYRQLFHPEQLISGKEDAANNFARGHYTIGKEIVDVCLDRVRKLADNCTGLQGFLMFNA VGGGTGSGLGCLLLERLAIDYGKKSKLNFCSWPSPQVSTAVVEPYNSVLSTHSLLEHTDVAIMLDNEAIY DICKKNLDIERPTYTNLNRLIAQVISSLTASLRFDGALNVDVTEFQTNLVPYPRIHFMLSSYAPIISAEK AYHEQLSVSEITNSAFEPASMMAKCDPRHGKYMACCLMYRGDVVPKDVNAAVATIKTKRSIQFVDWCPTG FKCGINYQPPTVVPGGDLAKVMRAVCMISNSTAIAEVFSRMDQKFDLMYAKRAFVHWYVGEGMEEGEFSE AREDLAALEKDYEEVGIESNDGEGEDEGYE >XM_001351490.1 Plasmodium falciparum 3D7 alpha tubulin 2 (PF3D7_0422300), partial mRNA ATGAGAGAAGTCATTAGTATTCATGTTGGACAGGCTGGTATTCAAATAGGAAATGCTTGCTGGGAATTGT TTTGCCTTGAACATGGAATTCAACCGGATGGGCAGATGCCAAGTGACCAAGTCGTTGCTGGTGGTGATGA TGCCTTTAATACATTTTTCTCAGAAACGGGAGCTGGAAAACATGTACCACGTTGTGTGTTCGTTGATTTA GAACCCACCGTCGTTGACGAAGTTCGAACAGGAACGTATCGTCAGCTGTTTCACCCTGAACAACTAATAT CTGGAAAAGAGGATGCAGCAAATAATTTCGCAAGGGGACATTATACCATAGGAAAAGAAATTGTTGATGT ATGTTTGGATAGGGTTCGAAAGTTGGCTGATAATTGCACTGGATTACAAGGATTTTTGATGTTTAATGCA GTAGGTGGAGGTACAGGTAGTGGTCTTGGTTGTTTATTATTAGAAAGGTTGGCAATAGATTATGGAAAGA AATCAAAATTAAATTTTTGTTCGTGGCCATCTCCTCAAGTATCGACAGCTGTTGTAGAGCCTTATAATTC TGTATTATCAACACATTCATTGTTAGAACATACAGATGTGGCAATTATGCTCGATAACGAAGCAATATAT GATATATGTAAGAAAAATTTAGATATAGAAAGGCCAACCTATACTAACTTGAATAGATTGATTGCTCAAG TTATCTCTTCATTAACAGCATCTTTAAGATTTGATGGTGCTTTGAATGTTGATGTAACAGAATTTCAGAC TAATTTAGTACCATATCCTAGAATTCACTTTATGTTATCATCATATGCTCCAATCATAAGTGCTGAGAAG GCATATCACGAGCAATTGTCGGTTTCTGAAATAACGAATTCTGCCTTTGAGCCTGCATCTATGATGGCAA AGTGTGATCCCAGACATGGAAAATATATGGCTTGTTGTTTAATGTATAGAGGAGATGTAGTACCAAAGGA TGTTAATGCTGCCGTCGCAACTATTAAGACTAAGAGATCTATACAATTCGTTGATTGGTGTCCTACGGGA TTTAAATGTGGAATCAATTATCAGCCCCCTACCGTGGTTCCAGGAGGAGATTTAGCAAAAGTTATGAGAG CTGTTTGCATGATCAGCAACTCAACAGCAATTGCCGAAGTATTCTCACGAATGGACCAAAAATTTGATTT GATGTATGCGAAAAGGGCTTTCGTTCATTGGTATGTAGGTGAAGGTATGGAAGAAGGAGAATTTAGTGAA GCTAGAGAGGATTTGGCTGCCTTGGAAAAGGATTATGAAGAGGTAGGAATAGAATCGAATGATGGAGAGG GAGAAGATGAGGGATATGAATGA apical membrane antigen 1 [Plasmodium falciparum 3D7] NCBI Reference Sequence: XP_001348015.1 GenPept Identical Proteins Graphics >XP_001348015.1 apical membrane antigen 1 [Plasmodium falciparum 3D7] MRKLYCVLLLSAFEFTYMINFGRGQNYWEHPYQNSDVYRPINEHREHPKEYEYPLHQEHTYQQEDSGEDE NTLQHAYPIDHEGAEPAPQEQNLFSSIEIVERSNYMGNPWTEYMAKYDIEEVHGSGIRVDLGEDAEVAGT QYRLPSGKCPVFGKGIIIENSNTTFLTPVATGNQYLKDGGFAFPPTEPLMSPMTLDEMRHFYKDNKYVKN LDELTLCSRHAGNMIPDNDKNSNYKYPAVYDDKDKKCHILYIAAQENNGPRYCNKDESKRNSMFCFRPAK DISFQNYTYLSKNVVDNWEKVCPRKNLQNAKFGLWVDGNCEDIPHVNEFPAIDLFECNKLVFELSASDQP KQYEQHLTDYEKIKEGFKNKNASMIKSAFLPTGAFKADRYKSHGKGYNWGNYNTETQKCEIFNVKPTCLI NNSSYIATTALSHPIEVENNFPCSLYKDEIMKEIERESKRIKLNDNDDEGNKKIIAPRIFISDDKDSLKC PCDPEMVSNSTCRFFVCKCVERRAEVTSNNEVVVKEEYKDEYADIPEHKPTYDKMKIIIASSAAVAVLAT ILMVYLYKRKGNAEKYDKMDEPQDYGKSNSRNDEMLDPEASFWGEEKRASHTTPVLMEKPYY https://www.ncbi.nlm.nih.gov/protein/XP_001348015.1?report=genpept https://www.ncbi.nlm.nih.gov/ipg/XP_001348015.1 https://www.ncbi.nlm.nih.gov/protein/XP_001348015.1?report=graph Figura 3: não encontrado pesquisa por DNA. Figura 4: gráfico no blast Figura 4: Procura homólogos do gene em humanos (Homo sapiens (taxid:9606) usando BLASTn (Nucleotide collection nr/nt). 5. Encontrou diferenças nos resultados entre os dois métodos? Porquê? Sim, na pesquisa através de DNA não é encontrado apenas por RNA mensageiro. Porque a natureza das proteínas é diferente antígenos, proteína de virulência especifica do patógeno, não tem em humanos. 6. A proteína de Plasmodium é muito ou pouco similar à de humanos? Procure achar uma explicação para a sua resposta. A proteína de Plasmodium é pouco similar á humanos, porque existem aminoácidos que são codificados por dois ou mais códons, situação que denominamos código genético degenerado. Essa expressão “código genético degenerado” significa que um mesmo aminoácido pode ser codificado por mais de um códon, mas o contrário não ocorre. 7.Encontrou homólogos em humano? Porquê? Não, porque espécie Plasmodium, é que essa sequência de nucleotídeos parece ser extremamente infreqüente, não tendo sido observada nenhuma homologia com outros peptídeos já catalogados em humanos.
Compartilhar