Aula 02 Resumo Aula Bancos de dados Parte 02

•

UFPI

Otavio Leite

09.03.2018

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

UNIVERSIDADE FEDERAL DO PIAUÍ 
CAMPUS DE PARNAÍBA 
CURSO DE BIOMEDICINA 
Disciplina: BIOINFORMÁTICA 
Prof. Jefferson Soares de Oliveira 
 
 
 
Resumo aula Bancos de Dados – Parte 02 
 
 
 Na aula de hoje iremos analisar como as sequências de nucleotídeos e 
aminoácidos estão organizados no banco de dados do NCBI e verificar 
algumas informações que podem ser obtidas a partir desta análise. Ao analisar 
sequências de DNA nos bancos de dados verificamos que somente uma das 
fitas encontra-se depositada. Como as fitas de DNA são complementares, o 
depósito das duas fitas é algo desnecessário, uma vez que obtemos a 
sequência da fita complementar de maneira muito simples. Outra importante 
observação é que não se observam a presença de moléculas de uracila ao se 
analisar as sequências de RNA. Isso acontece porque a molécula de RNA não 
é depositada e sim o cDNA obtido a partir desta. 
 Ao acessar um banco de dados de sequências de nucleotídeos, ou de 
sequências de aminoácidos, várias informações são apresentadas, como a 
entrada da sequência (número de acesso) no banco de dados; a natureza da 
molécula analisada (DNA, mRNA ou aa); o organismo de origem; bem como 
alguns artigos científicos que descrevem a sequência em questão. Nesta 
mesma página também se encontra disponível um breve sumário que descreve 
a função desempenhada no metabolismo celular pela proteína codificada pelo 
gene relacionado. Em seguida é apresentada uma série de informações 
relacionadas à sequência analisada. A sequência em si é apresentada no final 
de cada página. As sequências de nucleotídeos são organizadas em grupos de 
dez nucleotídeos, o que facilita a identificação de um nucleotídeo específico 
dentro da sequência. Já as de aminoácidos são descritas de forma contínua. 
 Ao se analisar moléculas de DNA, podemos encontrar informações sobre 
o gene, como, regiões de éxon, moléculas de mRNA geradas a partir daquele 
gene. Na guia “gene” verificamos a identificação do gene e seus locais de início 
e fim na sequência que está apresentada no final da página. Na guia “éxon” 
obtemos informações sobre cada um dos éxons que o gene possui. Uma 
maneira simples de se identificar o número de éxons de um gene é procurar 
pelo último éxon e verificar a numeração recebida por este. Analisando as 
sequências dos os éxons é possível escolher um dentre eles para análise 
posterior por PCR, por exemplo. Na guia “mRNA” é apresentada as regiões 
que compõem um mRNA de um gene. Nesta guia, encontramos o item 
“transcript_id”. Este item indica o número de acesso daquela molécula de 
mRNA no banco de dados. Ao clicarmos nele, seremos redirecionados para a 
página que contém informações sobre esta sequência. Antes de acessarmos o 
mRNA a partir da página de informações da molécula de DNA, devemos ter a 
 
UNIVERSIDADE FEDERAL DO PIAUÍ 
CAMPUS DE PARNAÍBA 
CURSO DE BIOMEDICINA 
Disciplina: BIOINFORMÁTICA 
Prof. Jefferson Soares de Oliveira 
 
certeza de que este está relacionado ao gene de interesse e não a outro gene 
que compartilha uma mesma região do DNA. 
 Analisando moléculas de RNA no banco de dados verificamos que os 
éxons começam exatamente no nucleotídeo seguinte ao éxon anterior. Isso 
porque o mRNA já passou pelo processamento e todos os íntros já foram 
removidos. Além disso, é possível verificar os possíveis locais de adição da 
cauda poliA (polyA_site), bem como a região do mRNA que determina a sua 
adição (regulatory). Geralmente a região que caracteriza a adição é composta 
pela sequência AAATAAAA (cDNA). Esta análise permite observar se aquele 
mRNA pode ser utilizado como base para produção de diferentes proteínas. 
Além disso, observamos a guia “CDS”. Em alguns casos esta guia também 
pode ser identificada ao se analisar sequências de DNA. A guia CDS diz 
respeito à sequência codificante do mRNA, ou seja, aqueles nucleotídeos que 
irão compor as trincas e que serão lidas para a síntese de proteínas. Se 
analisarmos a primeira trinca de nucleotídeos que compõe a região codificante 
na sequência no final da página, verificaremos que será ATG (cDNA), que 
indica a adição da metionina, primeiro aminoácido incorporado na síntese de 
proteínas. Na guia CDS também encontramos o item “protein_id” que indica o 
número de acesso da proteína relacionada ao mRNA. De modo semelhante ao 
passo anterior, clicando neste número de acesso seremos redirecionados para 
uma página que conterá informações sobre a proteína. 
 Na página que contém informações sobre a proteína, além da sequência 
de aminoácidos podemos observar as guias “site” e “region”, que indicam locais 
e regiões de aminoácidos na proteína que interagem com outros compostos 
químicos do metabolismo celular para que esta desempenhe sua atividade. Por 
exemplo, aminoácidos que são fosforilados ou regiões de interação com outras 
proteínas. 
 Por fim, as sequência de nucleotídeos podem ser visualizadas no formato 
FASTA. O formato FASTA é caracterizado pelo sinal “>” (maior que) seguido 
por uma breve descrição de um única linha da sequência e acompanhada pela 
sequência, seja ela de nucleotídeos ou aminoácidos. A descrição da sequência 
não pode conter espaços entre os caracteres. Este formato é universal da 
bioinformática e exigido para análise de sequências por vários softwares.

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉

Já tem cadastro?

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Bioinformática

1.984 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!