Baixe o app para aproveitar ainda mais
Prévia do material em texto
SUMÁRIO Introdução 2 2. Análise de estruturas proteicas 7 3. Introdução ao Biopython 15 4. Referencias 18 1 1. Introdução As proteínas são as principais biomoléculas de um organismo vivo, consistem em um arranjo de aminoácidos formando um polímero de polipeptídeo. São ditas como executores celulares devido a ampla gama de funções a elas atribuídas: estrutura, transporte, enzimática. Para a determinação da sequência de aminoácidos , técnicas de identificação de proteínas foram desenvolvidas e cada uma delas envolve importantes conceitos. Per Edman desenvolveu o método de degradação sistemática de proteínas, um método direto, começando com o resíduo amino-terminal e prosseguindo em direção ao carboxi-terminal. O processo de degradação de Edman requer a purificação de uma proteína para uma homogeneidade relativa, a qual pode ser alcançada por meios bioquímicos convencionais, tais como purificação em troca iônica, eletroforese, etc. Primeiro, transfere-se a proteína uma membrana especializada de fluoreto de polivinilideno (ou PVDF), a fim de obter uma porção da sequência de aminoácidos, e então realiza-se micro-sequenciação por degradações sequenciais de Edman. Quando a porção amino-terminal esta bloqueada, realiza-se a proteolização da proteína e depois purifica-se os fragmentos obtidos por HPLC, seguindo para a degradação de Edman. As limitações desse processo envolvem o trabalho, a existência de outras técnicas mais sensíveis e não é útil para análise de modificações pós-traducionais. A eletroforese constitui um importante método para separação e caracterização de proteínas. Baseada na migração de partículas carregadas sob a influência de um campo elétrico, a separação é feita por diferença de carga e massa, em que partículas com grupos ionizáveis adquirem carga em determinado pH e migram para o cátodo ou ânodo. Basicamente, os materiais utilizados são fonte de tensão e géis, e cada técnica tem seu aperfeiçoamento. Após a montagem do material, todo o aparato é imerso em uma solução-tampão, visando a constância do estado de ionização das moléculas separadas. 2 Figura 1. Digestão de Edman O SDS-PAGE é um método de eletroforese em gel desnaturante, utilizado para estimar a pureza e a massa molecular, realizada no gel de poliacrilamida (PolyAcrylamide Gel Electrophoresis - PAGE) e tendo como um dos agentes desnaturantes o dodecil-sulfato de sódio (Sodium Dodecyl Sulfate - SDS). O gel de poliacrilamida faz com que a migração das proteínas ocorra lentamente, sendo proporcional à razão carga/massa destas. A eletroforese em gel 2D combina a tecnica SDS-PAGE com a focalização isoelétrica. Em um primeiro gel, as proteínas migram até o pH correspondente ao seu pI, e então ocorre a separação por carga. Quando entram na segunda dimensão, o SDS-PAGE, são então separadas por massa. As vantagens da eletroforese 2D consistem em obter informações de massa e pI das proteínas intactas, é possível detectar massas menores que 1 nanograma, variando os corantes utilizados. As limitações também são muitas: requer otimização 3 para cada amostra, as proteínas mais abundantes em uma amostra se sobressaem, não se pode analisar proteínas muito ácidas ou muito básicas, etc. A espectrometria de massa analisa proteínas carregadas ou peptídeos no estado gasoso. O passo-chave é a transferência das proteínas para o estado gasoso e a ionização destas. Os íons resultantes são acelerados em um campo que transmite uma energia cinética fixa, então atravessam um caminho, são refletidos em um espelho iônico e atingem um detector. A relação massa-carga de um íon determina o tempo necessário para chegar ao detector; íons mais leves têm uma velocidade maior e são detectados primeiro. Tal técnica é útil para a identificação de proteínas, caracterização de proteínas conhecidas e modificações pós-traducionais. A capacidade da espectrometria de massa em medir a massa de uma proteína com precisão e exatidão extremamente altas permite distinguir até mesmo mudanças sutis em proteínas, como a adição de um único grupo fosfato. Um passo fundamental em experimentos de espectrometria de massa é a identificação de proteínas comparando espectros de massa observados com os perfis espectrais teóricos de fragmentos peptídicos obtidos a partir de bancos de dados de proteínas (Marcotte, 2007). O software mais usado para a comparação é o MASCOT. Ele fornece um algoritmo de pontuação para avaliar a taxa falsa positiva de um E-value, semelhante ao usado no BLAST. Esse software integra três diferentes métodos de busca: peptide mass fingerprinting - no qual os valores de massa dos peptídeos são obtidos, sequence queries - no qual os valores de massa dos peptídeos são combinados com os dados de sequências de aminoácidos e informações de composição, e dados MS/MS obtidos dos peptídeos. Uma proteína é composta de uma série de aminoácidos especificados por um gene. As proteínas podem ser classificadas por uma variedade de critérios, incluindo família, localização, propriedades físicas e função. Famílias de proteínas são definidas pela homologia de uma proteína com outras proteínas; as proteínas podem ser 4 homólogas sobre uma região parcial. Bases de dados de famílias de proteínas e motivos permitem que centenas de milhares de proteínas sejam classificadas em grupos que podem ser funcionalmente relacionados. Para proteínas que têm ortólogos e/ou parálogos, existem regiões de identidade de aminoácidos, intimamente relacionados, que é significativa entre pelo menos duas proteínas. O domínio é uma região de uma proteína que pode ter uma estrutura 3D particular e, quando essa região é comum a várias proteínas, estas compõe uma família. Os motivos são regiões curtas e conservadas de padrão de aminoácidos que podem caracterizar uma família de proteínas. Alguns motivos simples e comuns, como um trecho de aminoácidos que formam um domínio transmembrana ou um sítio de fosforilação, não implicam necessariamente em homologia. Em outros casos, um pequeno motivo pode fornecer uma característica para uma família de proteínas. A predição de estruturas é um dos principais objetivos da proteômica. Duas proteínas que compartilham uma estrutura similar são geralmente assumidas como também compartilhando uma função similar. Por exemplo, duas proteínas receptoras podem compartilhar uma estrutura muito semelhante, e mesmo se diferirem em sua capacidade de ligar ligantes ou transduzir sinais, ainda assim compartilham a mesma função básica. Para executar sua função, a proteína deve estar em sua conformação nativa e a informação necessária para especificar a complexa estrutura tridimensional da proteína está contida em sua sequência de aminoácidos. É o que diz a hipótese termodinamica. A complexidade do estudo das conformações adotadas por uma proteína durante o seu enovelamento até a conformação nativa pode ser ilustrada no chamado de paradoxo de Levinthal. Este argumento diz que as proteínas devem adotar suas conformações tridimensionais seguindo caminhos específicos de dobramento, pois, para uma sequência de aminoácidos, há muitas conformações possíveis e encontrar a que leva à sua estrutura tomaria tempo inviável. 5 As abordagens experimentais para determinar a estrutura das proteínas incluem cristalografia de raio X e NMR. Aproximadamente 80% das estruturas foram determinadas utilizando o primeiro método. Na cristalografia de raio X, uma proteína é obtida em alta concentração e cristalizada em uma solução como sulfato de amônio. Um raio de raios-x é destinado aos cristais de proteína. A proteína está em um arranjo altamente regular que faz com que as radiografias difrem (dispersam) onde são detectadas no filme de raios X. As intensidades pontuais são medidas e uma imagem é gerada pela transformação de Fourier das intensidades. Um mapa de densidade eletrônica é gerado correspondendo aos arranjos dos átomos que compõem a proteína. Átomos individuais são distinguíveiscom resolução de 1 a 1,5 A ̊, e resolução de menos de 2 A ̊ é geralmente necessária para uma determinação detalhada da estrutura (PEVSNER, 2014). 6 2. Análise de estruturas proteicas Figura 1. Cas9 (PDB ID: 4OO8) e Human Myoglobin Mutant K45R (PDB ID: 3RGK). Figura 2. 3D View; visualização da estrutura e a relação com suas funções. 7 Figura 3. Visualização das ligações. Figura 4. Sequências que apresentam estruturas similares com a proteína. 8 Figura 5. Funções da proteína 4OO8. Figura 6. Funções da proteína 3RGK. 9 Figura 7. Proteína componente do sistema imune inato: L-ficolin (PBD ID: 4NYT). Figura 8. 3D View; visualização da estrutura e a relação com suas funções. 10 Figura 9. Visualização das ligações. Figura 10. Sequências que apresentam estruturas similares com a proteína. 11 Figura 11. Funções da proteína 4NYT. Figura 12. sequência FASTA da Cas9 visualizada no PDB. 12 Figura 13. Analise da Cas9 no InterPro. Figura 14. Domain endonuclease Cas9, bridge helix. 13 Figura 15. Cas9 Staphylococcus aureus 14 3. Introdução ao Biopython 15 16 17 4. Referencias CHOUDHURI, Supratim. Bioinformatics for Beginners: Genes, genomes, molecular evolution, databases and analytical toys. Elsevier, 2014. FREIRE, Caio César de Melo. Análise exploratória de sequências biológicas: aminoácidos, composição e predição de estruturas. Aula ministrada na disciplina de Bioinformática, do curso de Biotecnologia da Universidade Federal de São Carlos. São Carlos, 2018. 18
Compartilhar