Buscar

Aula 08 Resumo Aula Identificação de Proteínas (2)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

UNIVERSIDADE FEDERAL DO PIAUÍ 
CAMPUS DE PARNAÍBA 
CURSO DE BIOMEDICINA 
Disciplina: BIOINFORMÁTICA 
Prof. Jefferson Soares de Oliveira 
 
Resumo Aula – Identificação de Proteínas 
 
 As proteínas são o produto final de muitos dos genes eucariotos e estas desempenham 
diferentes funções no metabolismo celular, como enzimática, estrutural, transporte de 
moléculas, entre outras. O padrão de expressão destas proteínas é regulado pelas 
necessidades celulares e alterações neste padrão podem estar associadas a diferentes 
quadros patológicos. A análise das proteínas expressas em tecidos é uma estratégia 
amplamente utilizada para entender como a alteração no padrão de expressão de proteínas 
pode influenciar as mudanças metabólicas observadas em células doentes, bem como na 
identificação de marcadores moleculares patológicos. A abordagem proteômica envolvendo 
eletroforese bidimensional associada à espectrometria de massas permite a identificação de 
uma grande quantidade de proteínas e apresenta um quadro da situação real de proteínas 
expressadas de um determinado tecido analisado. Na aula de hoje, iremos explorar bancos de 
dados que permitem a identificação de proteínas utilizando resultados de eletroforese 
bidimensional e espectrometria de massas. 
 O primeiro banco de dados a ser explorado é “SWISS-2DPAGE” (http://world-
2dpage.expasy.org/swiss-2dpage/) que armazena imagens de géis de eletroforese de 
poliacrilamida. Além disso, o banco de dados possui informações de proteínas que foram 
identificadas a partir destes géis bidimensionais. Neste banco de dados podemos comparar 
proteínas que foram detectadas em um gel de eletroforese realizado no laboratório com 
proteínas que foram identificadas e depositadas no banco de dados. Para obter informações 
sobre as proteínas, é necessário acessar um dos itens descritos abaixo da guia “Search by” 
localizada na lateral esquerda do site. Existem diferentes maneiras de se realizar uma consulta, 
mas a que utilizaremos será a “pI / Mw range”. Nesta consulta, iremos informar um intervalo de 
pH e massa molecular e os resultados de todas as proteínas previamente identificadas e 
localizadas no intervalo informado serão apresentados. Ao acessar este link, irão aparecer os 
campos que devem ser preenchidos para a consulta. A primeira informação que deve ser 
adicionada é o intervalo de pH (pI Range). Os valores informados devem estar entre 0 e 14. A 
segunda informação é o intervalo de massa molecular (Mw Range (kDaltons)). A massa 
máxima é de 250 kDa. E por fim, devemos escolher o mapa bidimensional que queremos 
limitar a nossa consulta (Limit to Map). O interessante é limitar a consulta para um gel de 
eletroforese do mesmo tecido que estamos trabalhando. Em seguida devemos clicar em 
“Execute query” para que a busca seja iniciada. 
 Na página a seguir é apresentada uma tabela com os resultados da consulta. São 
listadas todas as proteínas presentes no intervalo de pH e massa molecular que já foram 
identificadas no mapa bidimensional selecionado. Na tabela encontramos as colunas 
“Accession number (ID)” que corresponde ao número de acesso da proteína no banco de 
dados, “Spot ID” que representa o número de acesso da proteína no mapa bidimensional e as 
colunas “pI” e “Mw” que indicam o ponto isoelétrico e a massa molecular, respectivamente. 
Para obter informações sobre a proteína, devemos clicar sobre o número de acesso de uma 
proteína a partir da coluna “Accession number (ID)”. Na guia “Name and origin of the protein” 
encontramos na linha “Description” o nome da proteína e na linha “Gene name” o símbolo do 
gene relacionado à proteína. Na guia “References” encontramos os artigos que fundamentam 
esta identificação. 
 Na janela anterior, na tabela que contém todas as proteínas identificadas dentro intervalo 
informado, ao clicarmos no “Spot ID” de uma determinada proteína, será apresentado a 
localização desta no mapa bidimensional em que ela foi identificada. Passando o mouse sobre 
a proteína é possível obter informações do método utilizado para identificação da proteína na 
linha “Identification methods”. Os diferentes métodos de identificação são: PMF (peptide mass 
fingerprint); TandemMS (espectrometria de massas em tandem) AAComposition (análise da 
composição de aminoácidos); Micro-Sequencing/Tagging (microsequenciamento) Gel Matching 
 
UNIVERSIDADE FEDERAL DO PIAUÍ 
CAMPUS DE PARNAÍBA 
CURSO DE BIOMEDICINA 
Disciplina: BIOINFORMÁTICA 
Prof. Jefferson Soares de Oliveira 
 
(identificação por análise comparativa); Comigration (comigração) e Immunobloting 
(imunodetecção). 
 Outra ferramenta utilizada para identificação de proteínas é a ferramenta “Mascot 
database search” (http://www.matrixscience.com/search_form_select.html). Dentre as 
diferentes possibilidades de consulta temos a “Peptide Mass Fingerprint” que identifica no 
banco de dados proteínas que apresentem o mesmo padrão de fragmentação enzimática que a 
proteína informada e que se deseja identificar. Clicando em “Perform search” irão aparecer os 
campos que devem ser preenchidos para se realizar a busca. Os campos nome (Your name) e 
e-mail (Email) são de preenchimento obrigatório. Em seguida, devemos selecionar o banco de 
dados a ser consultado (SwissProt) e a enzima utilizada para promover a digestão da proteína. 
No campo “Taxonomy”, escolhemos o organismo que desejamos retingir a consulta. Nos 
demais campos, deixaremos as configurações padrões e as massas dos peptídeos serão 
introduzidas no campo “Data imput”. Após adicionar as massas, devemos clicar em “Start 
search”. 
 Após busca, será apresentado o resultado da consulta juntamente com um gráfico 
(Histogram). Na linha “Top Score” será apresentado um valor de score referente a uma 
proteína presente no banco de dados que, quando digerida com a mesma enzima, apresentou 
o maior grau de semelhança com a proteína informada. Na mesma linha após o símbolo “GN=” 
encontramos o gene relacionado. Para que possamos afirmar que o grau de similaridade entre 
a proteína presente no banco de dados e a proteína informada é estatisticamente significativo 
devemos nos atentar ao valor mínimo de significância. Se o valor do top escore apresentado 
for maior que o valor mínimo para ser considerado significativo (Protein scores greater than XX 
are significant (p<0.05)) significa dizer que as massas dos peptídeos da proteína citada no 
banco de dados é matematicamente semelhante às massas dos peptídeos gerados pela 
digestão da proteína de interesse, e assim poderemos atribuir identidade a esta proteína. Por 
outro lado, se o valor for igual o inferior ao valor mínimo para ser considerado 
matematicamente semelhante, não será possível atribuir identidade a proteína.

Outros materiais