Bioinformática 7 - Análise exploratória de sequências biológicas_ aminoácidos, composição e predição de estruturas

•

UFSCAR

0

Julia Bolli

20/09/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Bioinformática

2.065 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

SUMÁRIO
Introdução 2
2. Análise de estruturas proteicas 7
3. Introdução ao Biopython 15
4. Referencias 18
1
1. Introdução
As proteínas são as principais biomoléculas de um organismo vivo, consistem
em um arranjo de aminoácidos formando um polímero de polipeptídeo. São ditas como
executores celulares devido a ampla gama de funções a elas atribuídas: estrutura,
transporte, enzimática.
Para a determinação da sequência de aminoácidos , técnicas de identificação de
proteínas foram desenvolvidas e cada uma delas envolve importantes conceitos. Per
Edman desenvolveu o método de degradação sistemática de proteínas, um método
direto, começando com o resíduo amino-terminal e prosseguindo em direção ao
carboxi-terminal.
O processo de degradação de Edman requer a purificação de uma proteína para
uma homogeneidade relativa, a qual pode ser alcançada por meios bioquímicos
convencionais, tais como purificação em troca iônica, eletroforese, etc. Primeiro,
transfere-se a proteína uma membrana especializada de fluoreto de polivinilideno (ou
PVDF), a fim de obter uma porção da sequência de aminoácidos, e então realiza-se
micro-sequenciação por degradações sequenciais de Edman. Quando a porção
amino-terminal esta bloqueada, realiza-se a proteolização da proteína e depois
purifica-se os fragmentos obtidos por HPLC, seguindo para a degradação de Edman.
As limitações desse processo envolvem o trabalho, a existência de outras
técnicas mais sensíveis e não é útil para análise de modificações pós-traducionais.
A eletroforese constitui um importante método para separação e caracterização
de proteínas. Baseada na migração de partículas carregadas sob a influência de um
campo elétrico, a separação é feita por diferença de carga e massa, em que partículas
com grupos ionizáveis adquirem carga em determinado pH e migram para o cátodo ou
ânodo. Basicamente, os materiais utilizados são fonte de tensão e géis, e cada técnica
tem seu aperfeiçoamento. Após a montagem do material, todo o aparato é imerso em
uma solução-tampão, visando a constância do estado de ionização das moléculas
separadas.
2
Figura 1. Digestão de Edman
O SDS-PAGE é um método de eletroforese em gel desnaturante, utilizado para
estimar a pureza e a massa molecular, realizada no gel de poliacrilamida
(PolyAcrylamide Gel Electrophoresis - PAGE) e tendo como um dos agentes
desnaturantes o dodecil-sulfato de sódio (Sodium Dodecyl Sulfate - SDS). O gel de
poliacrilamida faz com que a migração das proteínas ocorra lentamente, sendo
proporcional à razão carga/massa destas.
A eletroforese em gel 2D combina a tecnica SDS-PAGE com a focalização
isoelétrica. Em um primeiro gel, as proteínas migram até o pH correspondente ao seu
pI, e então ocorre a separação por carga. Quando entram na segunda dimensão, o
SDS-PAGE, são então separadas por massa.
As vantagens da eletroforese 2D consistem em obter informações de massa e pI
das proteínas intactas, é possível detectar massas menores que 1 nanograma,
variando os corantes utilizados. As limitações também são muitas: requer otimização
3
para cada amostra, as proteínas mais abundantes em uma amostra se sobressaem,
não se pode analisar proteínas muito ácidas ou muito básicas, etc.
A espectrometria de massa analisa proteínas carregadas ou peptídeos no
estado gasoso. O passo-chave é a transferência das proteínas para o estado gasoso e
a ionização destas. Os íons resultantes são acelerados em um campo que transmite
uma energia cinética fixa, então atravessam um caminho, são refletidos em um espelho
iônico e atingem um detector. A relação massa-carga de um íon determina o tempo
necessário para chegar ao detector; íons mais leves têm uma velocidade maior e são
detectados primeiro.
Tal técnica é útil para a identificação de proteínas, caracterização de proteínas
conhecidas e modificações pós-traducionais. A capacidade da espectrometria de
massa em medir a massa de uma proteína com precisão e exatidão extremamente
altas permite distinguir até mesmo mudanças sutis em proteínas, como a adição de um
único grupo fosfato.
Um passo fundamental em experimentos de espectrometria de massa é a
identificação de proteínas comparando espectros de massa observados com os perfis
espectrais teóricos de fragmentos peptídicos obtidos a partir de bancos de dados de
proteínas (Marcotte, 2007).
O software mais usado para a comparação é o MASCOT. Ele fornece um
algoritmo de pontuação para avaliar a taxa falsa positiva de um E-value, semelhante ao
usado no BLAST. Esse software integra três diferentes métodos de busca: peptide
mass fingerprinting - no qual os valores de massa dos peptídeos são obtidos, sequence
queries - no qual os valores de massa dos peptídeos são combinados com os dados de
sequências de aminoácidos e informações de composição, e dados MS/MS obtidos dos
peptídeos.
Uma proteína é composta de uma série de aminoácidos especificados por um
gene. As proteínas podem ser classificadas por uma variedade de critérios, incluindo
família, localização, propriedades físicas e função. Famílias de proteínas são definidas
pela homologia de uma proteína com outras proteínas; as proteínas podem ser
4
homólogas sobre uma região parcial. Bases de dados de famílias de proteínas e
motivos permitem que centenas de milhares de proteínas sejam classificadas em
grupos que podem ser funcionalmente relacionados.
Para proteínas que têm ortólogos e/ou parálogos, existem regiões de identidade
de aminoácidos, intimamente relacionados, que é significativa entre pelo menos duas
proteínas. O domínio é uma região de uma proteína que pode ter uma estrutura 3D
particular e, quando essa região é comum a várias proteínas, estas compõe uma
família.
Os motivos são regiões curtas e conservadas de padrão de aminoácidos que
podem caracterizar uma família de proteínas. Alguns motivos simples e comuns, como
um trecho de aminoácidos que formam um domínio transmembrana ou um sítio de
fosforilação, não implicam necessariamente em homologia. Em outros casos, um
pequeno motivo pode fornecer uma característica para uma família de proteínas.
A predição de estruturas é um dos principais objetivos da proteômica. Duas
proteínas que compartilham uma estrutura similar são geralmente assumidas como
também compartilhando uma função similar. Por exemplo, duas proteínas receptoras
podem compartilhar uma estrutura muito semelhante, e mesmo se diferirem em sua
capacidade de ligar ligantes ou transduzir sinais, ainda assim compartilham a mesma
função básica.
Para executar sua função, a proteína deve estar em sua conformação nativa e a
informação necessária para especificar a complexa estrutura tridimensional da proteína
está contida em sua sequência de aminoácidos. É o que diz a hipótese termodinamica.
A complexidade do estudo das conformações adotadas por uma proteína
durante o seu enovelamento até a conformação nativa pode ser ilustrada no chamado
de paradoxo de Levinthal. Este argumento diz que as proteínas devem adotar suas
conformações tridimensionais seguindo caminhos específicos de dobramento, pois,
para uma sequência de aminoácidos, há muitas conformações possíveis e encontrar a
que leva à sua estrutura tomaria tempo inviável.
5
As abordagens experimentais para determinar a estrutura das proteínas incluem
cristalografia de raio X e NMR. Aproximadamente 80% das estruturas foram
determinadas utilizando o primeiro método.
Na cristalografia de raio X, uma proteína é obtida em alta concentração e
cristalizada em uma solução como sulfato de amônio. Um raio de raios-x é destinado
aos cristais de proteína. A proteína está em um arranjo altamente regular que faz com
que as radiografias difrem (dispersam) onde são detectadas no filme de raios X. As
intensidades pontuais são medidas e uma imagem é gerada pela transformação de
Fourier das intensidades. Um mapa de densidade eletrônica é gerado correspondendo
aos arranjos dos átomos que compõem a proteína. Átomos individuais são distinguíveiscom resolução de 1 a 1,5 A ̊, e resolução de menos de 2 A ̊ é geralmente necessária
para uma determinação detalhada da estrutura (PEVSNER, 2014).
6
2. Análise de estruturas proteicas
Figura 1. Cas9 (PDB ID: 4OO8) e Human Myoglobin Mutant K45R (PDB ID: 3RGK).
Figura 2. 3D View; visualização da estrutura e a relação com suas funções.
7
Figura 3. Visualização das ligações.
Figura 4. Sequências que apresentam estruturas similares com a proteína.
8
Figura 5. Funções da proteína 4OO8.
Figura 6. Funções da proteína 3RGK.
9
Figura 7. Proteína componente do sistema imune inato: L-ficolin (PBD ID: 4NYT).
Figura 8. 3D View; visualização da estrutura e a relação com suas funções.
10
Figura 9. Visualização das ligações.
Figura 10. Sequências que apresentam estruturas similares com a proteína.
11
Figura 11. Funções da proteína 4NYT.
Figura 12. sequência FASTA da Cas9 visualizada no PDB.
12
Figura 13. Analise da Cas9 no InterPro.
Figura 14. Domain endonuclease Cas9, bridge helix.
13
Figura 15. Cas9 Staphylococcus aureus
14
3. Introdução ao Biopython
15
16
17
4. Referencias
CHOUDHURI, Supratim. Bioinformatics for Beginners: Genes,
genomes, molecular evolution, databases and analytical toys.
Elsevier, 2014.
FREIRE, Caio César de Melo. Análise exploratória de sequências
biológicas: aminoácidos, composição e predição de estruturas.
Aula ministrada na disciplina de Bioinformática, do curso de
Biotecnologia da Universidade Federal de São Carlos. São Carlos,
2018.
18