Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE FEDERAL DO PIAUÍ CAMPUS DE PARNAÍBA CURSO DE BIOMEDICINA Disciplina: BIOINFORMÁTICA Prof. Jefferson Soares de Oliveira Resumo Aula – Identificação de Proteínas As proteínas são o produto final de muitos dos genes eucariotos e estas desempenham diferentes funções no metabolismo celular, como enzimática, estrutural, transporte de moléculas, entre outras. O padrão de expressão destas proteínas é regulado pelas necessidades celulares e alterações neste padrão podem estar associadas a diferentes quadros patológicos. A análise das proteínas expressas em tecidos é uma estratégia amplamente utilizada para entender como a alteração no padrão de expressão de proteínas pode influenciar as mudanças metabólicas observadas em células doentes, bem como na identificação de marcadores moleculares patológicos. A abordagem proteômica envolvendo eletroforese bidimensional associada à espectrometria de massas permite a identificação de uma grande quantidade de proteínas e apresenta um quadro da situação real de proteínas expressadas de um determinado tecido analisado. Na aula de hoje, iremos explorar bancos de dados que permitem a identificação de proteínas utilizando resultados de eletroforese bidimensional e espectrometria de massas. O primeiro banco de dados a ser explorado é “SWISS-2DPAGE” (http://world- 2dpage.expasy.org/swiss-2dpage/) que armazena imagens de géis de eletroforese de poliacrilamida. Além disso, o banco de dados possui informações de proteínas que foram identificadas a partir destes géis bidimensionais. Neste banco de dados podemos comparar proteínas que foram detectadas em um gel de eletroforese realizado no laboratório com proteínas que foram identificadas e depositadas no banco de dados. Para obter informações sobre as proteínas, é necessário acessar um dos itens descritos abaixo da guia “Search by” localizada na lateral esquerda do site. Existem diferentes maneiras de se realizar uma consulta, mas a que utilizaremos será a “pI / Mw range”. Nesta consulta, iremos informar um intervalo de pH e massa molecular e os resultados de todas as proteínas previamente identificadas e localizadas no intervalo informado serão apresentados. Ao acessar este link, irão aparecer os campos que devem ser preenchidos para a consulta. A primeira informação que deve ser adicionada é o intervalo de pH (pI Range). Os valores informados devem estar entre 0 e 14. A segunda informação é o intervalo de massa molecular (Mw Range (kDaltons)). A massa máxima é de 250 kDa. E por fim, devemos escolher o mapa bidimensional que queremos limitar a nossa consulta (Limit to Map). O interessante é limitar a consulta para um gel de eletroforese do mesmo tecido que estamos trabalhando. Em seguida devemos clicar em “Execute query” para que a busca seja iniciada. Na página a seguir é apresentada uma tabela com os resultados da consulta. São listadas todas as proteínas presentes no intervalo de pH e massa molecular que já foram identificadas no mapa bidimensional selecionado. Na tabela encontramos as colunas “Accession number (ID)” que corresponde ao número de acesso da proteína no banco de dados, “Spot ID” que representa o número de acesso da proteína no mapa bidimensional e as colunas “pI” e “Mw” que indicam o ponto isoelétrico e a massa molecular, respectivamente. Para obter informações sobre a proteína, devemos clicar sobre o número de acesso de uma proteína a partir da coluna “Accession number (ID)”. Na guia “Name and origin of the protein” encontramos na linha “Description” o nome da proteína e na linha “Gene name” o símbolo do gene relacionado à proteína. Na guia “References” encontramos os artigos que fundamentam esta identificação. Na janela anterior, na tabela que contém todas as proteínas identificadas dentro intervalo informado, ao clicarmos no “Spot ID” de uma determinada proteína, será apresentado a localização desta no mapa bidimensional em que ela foi identificada. Passando o mouse sobre a proteína é possível obter informações do método utilizado para identificação da proteína na linha “Identification methods”. Os diferentes métodos de identificação são: PMF (peptide mass fingerprint); TandemMS (espectrometria de massas em tandem) AAComposition (análise da composição de aminoácidos); Micro-Sequencing/Tagging (microsequenciamento) Gel Matching UNIVERSIDADE FEDERAL DO PIAUÍ CAMPUS DE PARNAÍBA CURSO DE BIOMEDICINA Disciplina: BIOINFORMÁTICA Prof. Jefferson Soares de Oliveira (identificação por análise comparativa); Comigration (comigração) e Immunobloting (imunodetecção). Outra ferramenta utilizada para identificação de proteínas é a ferramenta “Mascot database search” (http://www.matrixscience.com/search_form_select.html). Dentre as diferentes possibilidades de consulta temos a “Peptide Mass Fingerprint” que identifica no banco de dados proteínas que apresentem o mesmo padrão de fragmentação enzimática que a proteína informada e que se deseja identificar. Clicando em “Perform search” irão aparecer os campos que devem ser preenchidos para se realizar a busca. Os campos nome (Your name) e e-mail (Email) são de preenchimento obrigatório. Em seguida, devemos selecionar o banco de dados a ser consultado (SwissProt) e a enzima utilizada para promover a digestão da proteína. No campo “Taxonomy”, escolhemos o organismo que desejamos retingir a consulta. Nos demais campos, deixaremos as configurações padrões e as massas dos peptídeos serão introduzidas no campo “Data imput”. Após adicionar as massas, devemos clicar em “Start search”. Após busca, será apresentado o resultado da consulta juntamente com um gráfico (Histogram). Na linha “Top Score” será apresentado um valor de score referente a uma proteína presente no banco de dados que, quando digerida com a mesma enzima, apresentou o maior grau de semelhança com a proteína informada. Na mesma linha após o símbolo “GN=” encontramos o gene relacionado. Para que possamos afirmar que o grau de similaridade entre a proteína presente no banco de dados e a proteína informada é estatisticamente significativo devemos nos atentar ao valor mínimo de significância. Se o valor do top escore apresentado for maior que o valor mínimo para ser considerado significativo (Protein scores greater than XX are significant (p<0.05)) significa dizer que as massas dos peptídeos da proteína citada no banco de dados é matematicamente semelhante às massas dos peptídeos gerados pela digestão da proteína de interesse, e assim poderemos atribuir identidade a esta proteína. Por outro lado, se o valor for igual o inferior ao valor mínimo para ser considerado matematicamente semelhante, não será possível atribuir identidade a proteína.
Compartilhar