Buscar

roteiro_pratica2_bioinformatica

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

ROTEIRO PARA ATIVIDADES PRÁTICAS
AULA PRÁTICA: 2
TÍTULO PRÁTICA: Anotação gênica de sequências biológicas e o BLAST 
DISCIPLINA: Bioinformática				
CURSO: Biomedicina
	OBJETIVO(S) DA ATIVIDADE
	Após essa atividade você deverá:
- Empregar um software para predição gênica;
- Aplicar um software de alinhamento de sequências na busca por sequências similares em um banco de dados biológico;
- Diferenciar as etapas de predição gênica e anotação funcional, que fazem parte do processo de anotação gênica. 
	REFERÊNCIA BIBLIOGRÁFICA
	Recomenda-se para esta aula a leitura especificada abaixo:
- Prosdocimi F. Introdução à Bioinformática. 2007. Disponível online em http://www.iq.usp.br/setubal/bmc/2015/FProsdocimi07_CursoBioinfo.pdf
	SOFTWARE(S) NECESSÁRIO(S) PARA A ATIVIDADE
	- GeneMarkS, disponível online, http://exon.gatech.edu/GeneMark/genemarks.cgi
- BLAST, disponível online, https://blast.ncbi.nlm.nih.gov/Blast.cgi
	ATIVIDADE PRÁTICA
	1. Cenário/
 A anotação de genomas é a etapa realizada após o sequenciamento total do conjunto de DNA de um organismo. Essa etapa pode ser dividida em duas partes:
 - predição gênica: encontrar os genes, que codificam proteínas;
 - anotação funcional: descobrir a função da proteína codificada pelos genes.
 Imagine que devido à mutação encontrada no COVID-19 isolado do paciente da Austrália, os bioinformatas do laboratório decidam por sequenciar todo o genoma desse vírus, não apenas só aquela região do gene S. Você agora terá acesso a toda a sequência de DNA do genoma desse COVID-19, e irá realizar a predição gênica usando o programa de computador GeneMarkS. Após a predição, você irá determinar a função das proteínas codificadas pelos genes preditos usando a ferramenta BLAST. 
2. Desenvolvimento da atividade prática
 Inicialmente, você precisa ter acesso à sequência de DNA do genoma do COVID-19 isolado do paciente australiano. Para isso siga os seguintes passos:
2.1 Acesse ao site do GenBank, o banco de dados de sequências do NCBI, https://www.ncbi.nlm.nih.gov/genbank/
2.2 Logo no início da página, na lacuna em frente ao quadrado escrito “Nucleotide” copie o seguinte código: MT007544.1
2.3 Clique em “Search” e aguarde o resultado.
2.4 Faça o download da sequência: no canto superior direito da página que foi aberta, clique na seta ao lado de “Send to” (Figura 1); clique em “Choose Destination” e selecione File; clique em “Format” e escolha FASTA. Clique em “Create File”.
 Figura 1. Como fazer o download de uma sequência do GenBank.
 
 Agora você já tem no seu computador a sequência de nucleotídeos do genoma do COVID-19 isolado do paciente da Austrália. A próxima etapa e realizar a predição dos genes desse genoma.
2.5 Acesso o site da ferramenta GeneMarkS, http://exon.gatech.edu/GeneMark/genemarks.cgi
2.6 Abaixo de “Enter sequence (FASTA or multi FASTA format)”, clique em “Escolher arquivo” e procure pelo arquivo que você fez o download no item 2.4. O mais provável é que ele esteja na pasta “Downloads” do seu computador. Depois que encontrar, clique em cima dele e depois em “Abrir”.
2.7 Agora você precisar escolher as opções (“Options”) que o programa vai utilizar: em “Sequence type” selecione “Virus”; em “Output options” escolha “Protein sequence”.
2.8 O próximo passo é rodar o programa: em “Action” clique em “Start GeneMarkS” e aguarde o resultado.
2.9 Na página do resultado clique em “gms.out.faa”, arquivo onde estão as sequências de proteínas baseadas nos genes preditos. Mantenha essa página aberta.
 Iniciaremos agora a etapa de anotação funcional. Para isso vamos buscar por proteínas iguais às encontradas no genoma do COVID-19. Se encontramos uma proteína igual à proteína do vírus, podemos copiar a função dessa proteína e acrescentar essa informação sobre o genoma do COVID-19. Vamos buscar proteínas iguais no banco de dados de proteínas do GenBank. Para encontrá-las utilizaremos a ferramenta de alinhamento local BLAST.
2.10 Acesse ao site do BLAST, https://blast.ncbi.nlm.nih.gov/Blast.cgi
2.11 Clique no quadrado escrito “Protein BLAST”, já que o resultado do item 2.9 foi uma lista de sequências de proteínas.
2.12 Agora, você precisa voltar na lista de proteínas do item 2.9. Selecione e copie a sequência da proteína do gene 1 (Figura 2).
Figura 2. Como copiar a sequência de uma proteína na lista dada pelo GeneMarkS.
2.13 Na página do BLAST, cole a sequência na lacuna abaixo de “Enter accession number(s), gi(s), or FASTA sequence(s)”.
2.14 Clique em “BLAST” e aguarde o resultado.
2.15 Na página do resultado, encontre o melhor resultado na lista abaixo de “Sequences producing significant alignments”;
2.16 No momento em que esse roteiro foi preparado o melhor resultado foi “orf1a polyprotein [Severe acute respiratory syndrome coronavirus 2]”, com 100% de identidade. Esse ranking de melhores resultados pode ser alterado caso novos estudos sejam realizados. Portanto, a proteína codificada pelo gene 1 é uma poliproteína, que pode ser encontrada também no genoma do coranavírus tipo SARS (causador da síndrome respiratória aguda grave). As poliproteínas são produzidas por vírus. Elas são tipicamente clivadas em proteínas menores com diferentes funções biológicas. Você pode continuar fazendo o mesmo para as proteínas codificadas pelos outros genes no genoma do COVID-19.
3. Reflexão
 Nessa prática, você pôde compreender com clareza as duas fases da anotação gênica. Para encontrar genes em meio a longa sequência de nucleotídeos do genoma do COVID-19, você utilizou o programa GeneMarkS. Como resultado esse programa te deu uma lista de proteínas codificadas pelos genes encontrados. Mas até esse ponto você não sabia qual era o papel dessas proteínas. Por isso foi realizada a busca pela função dessas proteínas. Usamos para isso um banco de dados, o GenBank. Nesse banco são guardadas sequências de DNA e proteínas descritas por pesquisadores em todo mundo. Com a ferramenta de alinhamento global BLAST, encontramos no GenBank uma proteína idêntica àquela codificada pelo gene 1 do COVID-19. Como a proteína do COVID-19 foi 100% idêntica à proteína guardada no GenBank, você pode ter certeza de que elas têm a mesma função. Você poderia consultar outros bancos de dados biológicos para conseguir mais informações sobre essa proteína, mas com os passos executados aqui os objetivos dessa aula prática já foram alcançados.
	
OBSERVAÇÕES
	Pergunta ao aluno
1. Quais outras informações você poderia recuperar sobre uma proteína além da sua função?
EXCLUSIVO PARA TUTORES
 Em outros bancos de dados você poderia encontrar a estrutura tridimensional da proteína, as vias metabólicas das quais ela participa, outros organismos onde essa proteína pode ser encontrada, dentre outras informações.

Continue navegando

Outros materiais