Buscar

AULA PRATICA 02 BIOINFORMÁTICA

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

ROTEIRO DE ATIVIDADE PRÁTICA 
 
PARA REALIZAR ESTA ATIVIDADE, VOCÊ PRECISA 
Estudar todo conteúdo da disciplina de orientação para realização desta atividade. 
Recomendamos também que você faça a leitura especificada abaixo: 
- Chen et al. 2020. Clinical characteristics and intrauterine vertical transmission potential of COVID-19 infection in nine 
pregnant women: a retrospective review of medical records. The Lancet 
- Prosdocimi F. Introdução à Bioinformática. 2007. Disponível online em 
http://www.iq.usp.br/setubal/bmc/2015/FProsdocimi07_CursoBioinfo.pdf 
 
ATENÇÃO: Você pode realizar esta atividade em casa, sem necessidade de agendar ou ir até o polo EaD. 
 
 
OBJETIVO DO PROCEDIMENTO 
- Empregar um software para predição gênica; 
- Aplicar um software de alinhamento de sequências na busca por sequências similares em um banco de dados 
biológico; 
- Diferenciar as etapas de predição gênica e anotação funcional, que fazem parte do processo de anotação gênica 
 
MATERIAL NECESSÁRIO PARA REALIZAÇÃO DA ATIVIDADE 
Você utilizará os seguintes softwares gratuitos: 
 
- GeneMarkS, disponível online, http://exon.gatech.edu/GeneMark/genemarks.cgi 
- BLAST, disponível online, https://blast.ncbi.nlm.nih.gov/Blast.cgi 
 
PROCEDIMENTOS 
1. Cenário/ 
 A anotação de genomas é a etapa realizada após o sequenciamento total do conjunto de DNA de um 
organismo. Essa etapa pode ser dividida em duas partes: 
 - predição gênica: encontrar os genes, que codificam proteínas; 
 - anotação funcional: descobrir a função da proteína codificada pelos genes. 
 Imagine que devido à mutação encontrada no novo coronavírus isolado do paciente da Austrália, os 
bioinformatas do laboratório decidam por sequenciar todo o genoma desse vírus, não apenas só aquela 
região do gene S. Você agora terá acesso a toda a sequência de DNA do genoma desse novo coronavírus, e irá 
realizar a predição gênica usando o programa de computador GeneMarkS. Após a predição, você irá 
determinar a função das proteínas codificadas pelos genes preditos usando a ferramenta BLAST. 
 
2. Desenvolvimento da atividade prática 
 Inicialmente, você precisa ter acesso à sequência de DNA do genoma do SARS Cov2 isolado do paciente 
australiano. Para isso siga os seguintes passos: 
CURSO: BIOMEDICINA 
DISCIPLINA: BIOINFORMÁTICA (SDE4499) 
ATIVIDADE PRÁTICA 2 
TEMA: Anotação gênica de sequências biológicas e o BLAST 
 
 
 
2.1 Acesse ao site do GenBank, o banco de dados de sequências do NCBI, 
https://www.ncbi.nlm.nih.gov/genbank/ 
 
2.1. Logo no início da página, na lacuna em frente ao quadrado escrito “Nucleotide” copie o seguinte código: 
MT007544.1 
 
2.2. Clique em “Search” e aguarde o resultado. 
 
2.3. Faça o download da sequência: no canto superior direito da página que foi aberta, clique na seta ao lado 
de “Send to” (Figura 1); clique em “Choose Destination” e selecione File; clique em “Format” e escolha 
FASTA. Clique em “Create File”. 
 
 
 
 Figura 1. Como fazer o download de uma sequência do GenBank. 
 
 Agora você já tem no seu computador a sequência de nucleotídeos do genoma do SARS CoV2 isolado 
do paciente da Austrália. A próxima etapa e realizar a predição dos genes desse genoma. 
 
2.4. Acesso o site da ferramenta GeneMarkS, http://exon.gatech.edu/GeneMark/genemarks.cgi 
 
2.5. Abaixo de “Enter sequence (FASTA or multi FASTA format)”, clique em “Escolher arquivo” e procure pelo 
arquivo que você fez o download no item 2.4. O mais provável é que ele esteja na pasta “Downloads” do 
seu computador. Depois que encontrar, clique em cima dele e depois em “Abrir”. 
 
2.6. Agora você precisar escolher as opções (“Options”) que o programa vai utilizar: em “Sequence type” 
selecione “Virus”; em “Output options” escolha “Protein sequence”. 
 
2.7. O próximo passo é rodar o programa: em “Action” clique em “Start GeneMarkS” e aguarde o resultado. 
 
2.8. Na página do resultado clique em “gms.out.faa”, arquivo onde estão as sequências de proteínas baseadas 
nos genes preditos. Mantenha essa página aberta. 
 
 Iniciaremos agora a etapa de anotação funcional. Para isso vamos buscar por proteínas iguais às 
encontradas no genoma do novo coronavírus. Se encontramos uma proteína igual à proteína do vírus, 
podemos copiar a função dessa proteína e acrescentar essa informação sobre o genoma do novo 
coronavírus. Vamos buscar proteínas iguais no banco de dados de proteínas do GenBank. Para encontrá-
las utilizaremos a ferramenta de alinhamento local BLAST. 
 
2.9. Acesse ao site do BLAST, https://blast.ncbi.nlm.nih.gov/Blast.cgi 
 
 
2.10. Clique no quadrado escrito “Protein BLAST”, já que o resultado do item 2.9 foi uma lista de 
sequências de proteínas. 
 
2.11. Agora, você precisa voltar na lista de proteínas do item 2.9. Selecione e copie a sequência da 
proteína do gene 1 (Figura 2). 
 
 
Figura 2. Como copiar a sequência de uma proteína na lista dada pelo GeneMarkS. 
 
2.12. Na página do BLAST, cole a sequência na lacuna abaixo de “Enter accession number(s), gi(s), or 
FASTA sequence(s)”. 
 
2.13. Clique em “BLAST” e aguarde o resultado. 
 
2.14. Na página do resultado, encontre o melhor resultado na lista abaixo de “Sequences producing 
significant alignments”; 
 
2.15. No momento em que esse roteiro foi preparado o melhor resultado foi “orf1a polyprotein [Severe 
acute respiratory syndrome coronavirus 2]”, com 100% de identidade. Esse ranking de melhores 
resultados pode ser alterado caso novos estudos sejam realizados. Portanto, a proteína codificada pelo 
gene 1 é uma poliproteína, que pode ser encontrada também no genoma do coranavírus tipo SARS 
(causador da síndrome respiratória aguda grave). As poliproteínas são produzidas por vírus. Elas são 
tipicamente clivadas em proteínas menores com diferentes funções biológicas. Você pode continuar 
fazendo o mesmo para as proteínas codificadas pelos outros genes no genoma do novo coronavírus. 
 
3. Reflexão 
 Nessa prática, você pôde compreender com clareza as duas fases da anotação gênica. Para encontrar 
genes em meio a longa sequência de nucleotídeos do genoma do novo coronavírus, você utilizou o programa 
GeneMarkS. Como resultado esse programa te deu uma lista de proteínas codificadas pelos genes 
encontrados. Mas até esse ponto você não sabia qual era o papel dessas proteínas. Por isso foi realizada a 
busca pela função dessas proteínas. Usamos para isso um banco de dados, o GenBank. Nesse banco são 
guardadas sequências de DNA e proteínas descritas por pesquisadores em todo mundo. Com a ferramenta de 
alinhamento global BLAST, encontramos no GenBank uma proteína idêntica àquela codificada pelo gene 1 do 
novo coronavírus. Como a proteína do novo coronavírus foi 100% idêntica à proteína guardada no GenBank, 
você pode ter certeza de que elas têm a mesma função. Você poderia consultar outros bancos de dados 
biológicos para conseguir mais informações sobre essa proteína, mas com os passos executados aqui os 
objetivos dessa aula prática já foram alcançados. 
 
 
AVALIANDO OS RESULTADOS 
 
Quais outras informações você poderia recuperar sobre uma proteína além da sua função?

Continue navegando