Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
UNIVERSIDADE FEDERAL DO PIAUÍ CAMPUS DE PARNAÍBA CURSO DE BIOMEDICINA Disciplina: BIOINFORMÁTICA Prof. Jefferson Soares de Oliveira Resumo aula Bancos de Dados – Parte 02 Na aula de hoje iremos analisar como as sequências de nucleotídeos e aminoácidos estão organizados no banco de dados do NCBI e verificar algumas informações que podem ser obtidas a partir desta análise. Ao analisar sequências de DNA nos bancos de dados verificamos que somente uma das fitas encontra-se depositada. Como as fitas de DNA são complementares, o depósito das duas fitas é algo desnecessário, uma vez que obtemos a sequência da fita complementar de maneira muito simples. Outra importante observação é que não se observam a presença de moléculas de uracila ao se analisar as sequências de RNA. Isso acontece porque a molécula de RNA não é depositada e sim o cDNA obtido a partir desta. Ao acessar um banco de dados de sequências de nucleotídeos, ou de sequências de aminoácidos, várias informações são apresentadas, como a entrada da sequência (número de acesso) no banco de dados; a natureza da molécula analisada (DNA, mRNA ou aa); o organismo de origem; bem como alguns artigos científicos que descrevem a sequência em questão. Nesta mesma página também se encontra disponível um breve sumário que descreve a função desempenhada no metabolismo celular pela proteína codificada pelo gene relacionado. Em seguida é apresentada uma série de informações relacionadas à sequência analisada. A sequência em si é apresentada no final de cada página. As sequências de nucleotídeos são organizadas em grupos de dez nucleotídeos, o que facilita a identificação de um nucleotídeo específico dentro da sequência. Já as de aminoácidos são descritas de forma contínua. Ao se analisar moléculas de DNA, podemos encontrar informações sobre o gene, como, regiões de éxon, moléculas de mRNA geradas a partir daquele gene. Na guia “gene” verificamos a identificação do gene e seus locais de início e fim na sequência que está apresentada no final da página. Na guia “éxon” obtemos informações sobre cada um dos éxons que o gene possui. Uma maneira simples de se identificar o número de éxons de um gene é procurar pelo último éxon e verificar a numeração recebida por este. Analisando as sequências dos os éxons é possível escolher um dentre eles para análise posterior por PCR, por exemplo. Na guia “mRNA” é apresentada as regiões que compõem um mRNA de um gene. Nesta guia, encontramos o item “transcript_id”. Este item indica o número de acesso daquela molécula de mRNA no banco de dados. Ao clicarmos nele, seremos redirecionados para a página que contém informações sobre esta sequência. Antes de acessarmos o mRNA a partir da página de informações da molécula de DNA, devemos ter a UNIVERSIDADE FEDERAL DO PIAUÍ CAMPUS DE PARNAÍBA CURSO DE BIOMEDICINA Disciplina: BIOINFORMÁTICA Prof. Jefferson Soares de Oliveira certeza de que este está relacionado ao gene de interesse e não a outro gene que compartilha uma mesma região do DNA. Analisando moléculas de RNA no banco de dados verificamos que os éxons começam exatamente no nucleotídeo seguinte ao éxon anterior. Isso porque o mRNA já passou pelo processamento e todos os íntros já foram removidos. Além disso, é possível verificar os possíveis locais de adição da cauda poliA (polyA_site), bem como a região do mRNA que determina a sua adição (regulatory). Geralmente a região que caracteriza a adição é composta pela sequência AAATAAAA (cDNA). Esta análise permite observar se aquele mRNA pode ser utilizado como base para produção de diferentes proteínas. Além disso, observamos a guia “CDS”. Em alguns casos esta guia também pode ser identificada ao se analisar sequências de DNA. A guia CDS diz respeito à sequência codificante do mRNA, ou seja, aqueles nucleotídeos que irão compor as trincas e que serão lidas para a síntese de proteínas. Se analisarmos a primeira trinca de nucleotídeos que compõe a região codificante na sequência no final da página, verificaremos que será ATG (cDNA), que indica a adição da metionina, primeiro aminoácido incorporado na síntese de proteínas. Na guia CDS também encontramos o item “protein_id” que indica o número de acesso da proteína relacionada ao mRNA. De modo semelhante ao passo anterior, clicando neste número de acesso seremos redirecionados para uma página que conterá informações sobre a proteína. Na página que contém informações sobre a proteína, além da sequência de aminoácidos podemos observar as guias “site” e “region”, que indicam locais e regiões de aminoácidos na proteína que interagem com outros compostos químicos do metabolismo celular para que esta desempenhe sua atividade. Por exemplo, aminoácidos que são fosforilados ou regiões de interação com outras proteínas. Por fim, as sequência de nucleotídeos podem ser visualizadas no formato FASTA. O formato FASTA é caracterizado pelo sinal “>” (maior que) seguido por uma breve descrição de um única linha da sequência e acompanhada pela sequência, seja ela de nucleotídeos ou aminoácidos. A descrição da sequência não pode conter espaços entre os caracteres. Este formato é universal da bioinformática e exigido para análise de sequências por vários softwares.
Compartilhar