Buscar

aula13_ibm1029

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 9 páginas

Prévia do material em texto

1
Profª Drª Silvana Giuliatti
Departamento de Genética – Bloco G
Ramal: 4503
silvana@rge.fmrp.usp.br
Faculdade de Medicina
Departamento de Genética
IBM1029
Introdução à Bioinformática
Aula 13
Predição de Estruturas 
Secundárias de RNA
– Uma sequência de RNA não ficará estável até que 
algumas de suas bases expostas estejam protegidas de 
moléculas de água.
– Uma maneira simples de proteger uma base é fazer 
com que ela faça par com outra base de RNA.
– O emparelhamento dessas bases forma a estrutura 
secundária do RNA.
– Bases que não formarem pares irão formar laços 
(loops) ou bulbos (bulges).
Estrutura Secundária de RNA Estrutura Secundária de RNA
• Sequências de RNA mantêm padrões de pares 
de bases que fornecem regiões:
– estruturas secundárias
– estruturas terciárias
• Análise computacional de moléculas de RNA 
fazem predição das estruturas secundárias 
mais estáveis.
Características do RNA
• RNA: polímero composto de uma 
combinação de 4 nucleotídeos
– adenina (A)
– citosina (C)
– guanina (G)
– uracila (U)
Estrutura Secundária de RNA Estrutura Secundária de RNA
• Estrutura secundária:
– É vista como um passo intermediário na 
formação da estrutura terciária.
– É fundamentalmente regiões de fita dupla 
formadas de uma fita simples, formando laços 
(loops) na estrutura de RNA.
• Como no DNA:
– G/C: maior estabilidade genética
– A/U: menor estabilidade genética que G/C 
2
• Predições de estrutura de RNA são 
compostas de regiões de bases pareadas e 
não pareadas, formado vários tipos de loops
e arranjos de junções. 
• Interações terciárias são formadas por pares 
de bases entre elementos de estruturas 
secundárias e entre elementos de estrutura 
secundárias e regiões de fita única
Estrutura Secundária de RNA
Interações Secundárias
Grampos (Hairpin)
• Geralmente possuem pelo menos 4 bases.
Estrutura Secundária de RNA
Bulbos
• Ocorrem quando bases em um lado da 
estrutura não formam pares.
Estrutura Secundária de RNA
Loops Interiores
• Ocorrem quando bases em ambos os lados
da estrutura não formam pares.
Estrutura Secundária de RNA
Junções (Multiloops)
• Duas ou mais regiões convergem para formar
uma estrutura fechada.
Estrutura Secundária de RNA
Grampo-Grampo
• Bases não pareadas de dois grampos
separados formam uma junção.
Estrutura Secundária de RNA
Interações Terciárias
3
Pseudonós
Estrutura Secundária de RNA
Grampo-Bulbo
Estrutura Secundária de RNA
• A estrutura é feita de forma que não se 
produzam nós.
• A melhor maneira de representar isso é 
desenhando a sequência num formato circular. 
As bases pareadas são unidas por arcos.
• Se a estrutura total com todos os pares de 
bases preditos estiver livre de nós, os arcos 
não devem se cruzar.
Estrutura Secundária de RNA Estrutura Secundária de RNA
• Regiões auto-complementares em sequências
de RNA predizem estruturas secundárias.
– Todas as análises começam pela identificação de 
regiões auto-complementares.
– Análise mais simples: matriz de pontos.
– Uma matriz de pontos mais avançada pode ser 
usada para mostrar as partes mais energéticas da 
molécula.
Estrutura Secundária de RNA
• Para a análise por matriz de pontos:
– a sequência a ser analisada é listada em ambos os 
eixos. É listada na direção 5´3´, na horizontal, e a 
fita complementar listada na vertical, também em 
5´3´.
– A matriz é pontuada por identidades.
– Regiões auto-complementares aparecem como 
linhas de pontos indo do canto superior esquerdo 
para o canto inferior direito.
Estrutura Secundária de RNA
4
• Um método de matriz de pontos alternativo:
– listar a sequência de RNA na horizontal e também 
na vertical.
– Pontuar a matriz pelas bases complementares ao 
invés de identidades.
– Diagonais indicam regiões complementares indo 
do canto superior direito para o canto inferior 
esquerdo.
Estrutura Secundária de RNA Estruturas Secundárias de RNA
• Assume-se que a tendência natural da molécula de RNA 
é alcançar sua configuração mais estável através da 
interação em pares, dando à molécula a estabilidade mais 
alta que ela possa ter: Modelo de Energia Livre 
Mínima.
• Para uma molécula de aproximadamente 200 bases, 
deve-se esperar uma energia livre menor que -50 kcal.
• É feita uma análise de todas as possíveis combinações de 
regiões de potencial de fita dupla através de minimização 
de energia.
• Termodinamicamente, os modelos estruturais mais 
prováveis são obtidos.
Estruturas Secundárias de RNA
• A estabilidade de uma estrutura secundária é uma 
função de vários parâmetros:
– Nº de pares CG versus AU e GU
– Nº de bases numa região da fita: longas fitas resultam 
em mais ligações.
– Nº de pares de bases na região de hairpin: formação 
de loops com mais de 10 ou menos que 5 bases 
requerem mais energia.
– Nº de bases sem pares: bases não pareadas diminuem 
a estabilidade da estrutura.
Estruturas Secundárias de RNA
• A estabilidade de uma estrutura secundária é 
quantificada como uma quantidade da energia livre 
liberada ou usada para a formação de pares de bases. 
• Energia livre positiva precisam realizar trabalho para 
formar uma configuração. Energia livre negativa liberam 
trabalho armazenado.
• A energia livre total é obtida pela adição de todas as 
componentes de energia livre.
• Quanto mais negativa for a energia de uma estrutura, 
mais provável é a formação da estrutura secundaria, 
porque mais energia é liberada.
Estruturas Secundárias de RNA
• Para computar a energia mínima de uma 
sequência, parâmetros de energia empíricos 
são utilizados. 
• Esses parâmetros sumarizam a mudança de 
energia livre (positiva e negativa) associada 
com todas as possíveis configurações de 
pares de bases.
• O software mais usado que utiliza o algoritmo de 
mínima energia livre é o MFOLD (Zuker et al. 
1991)
• http://www.bioinfo.rpi.edu/applications/mfold/
• Prediz a estrutura secundária de uma molécula de 
RNA.
• O algoritmo leva em consideração parâmetros 
físicos que afetam a estrura, tais como, pH e 
temperatura.
Estruturas Secundárias de RNA
5
• Nos métodos de mínima energia livre:
– cada base é comparada com cada uma das outras 
bases, por complementaridade, por um tipo de 
análise similar à análise de matriz de pontos.
– a sequência é listada na horizontal e vertical.
– numa matriz de RNA, uma diagonal indica uma 
sucessão de nucleotídeos complementares que 
podem, potencialmente, formar uma região de fita 
dupla.
Estruturas Secundárias de RNA
– A estrutura é determinada pelas propriedades 
biofísicas.
– O algoritmo de minimização de energia prediz a 
estrutura pela minimização da energia livre.
– As energias são calculadas pelas contribuições 
acumuladas entre os pares de bases vizinhos.
Estruturas Secundárias de RNA
– A sequência é comparada contra ela mesma, 
usando um algoritmo de programação 
dinâmica.
– O score é baseado nos valores de energia livre.
Estruturas Secundárias de RNA
MFOLD
Input
1. Nome da sequência
– Se nenhum nome for dado:
yyMmmdd-hh-mm-ss (ex:06Feb09-20-23-06)
2. Seqûencia: formato FASTA
3. Restrições
„ Opcional;
„ Cada restrição deve ser inserida numa linha;
„ Devem seguir o formato;
„ Podem ser usadas múltiplas restrições de qualquer tipo.
Estruturas Secundárias de RNA
Formatos das Restrições
• F i j k: força um par de bases específico ou uma 
hélice a se formar.
• P i j k: proíbe um específico par ou hélice de ser 
formado.
• F i 0 k: força uma string de consecutivas bases a 
formar pares.
• P i 0 k: proíbe uma string de consecutivas bases a 
formar pares.
• P i j k l: proíbe uma string de consecutivas bases a 
formar pares com outra string.
Estruturas Secundárias de RNA
6
Nome da Sequência
SequênciaFormato FASTARestrições
Uma 
restrição 
por linha
Formatos
4. Outros Parâmetros
– A sequência pode ser linear ou circular;
– Na versão atual, a temperatura da estrutura é de 
37°C;
– As condições iônicas são fixas;
– Percentagem de sub-ótimos (P): controla o 
incremento da energia livre para apresentação 
dos pares de bases no gráfico de pontos;
Estruturas Secundárias de RNA
– Limite superior do nº de estruturas: deve ser um 
valor absoluto;
– Parâmetro da janela (W): controla o nº de 
estruturas que são computados;
– Se a distância máxima entre o parâmetro das 
bases emparelhadas, M, for especificado, então 
qualquer par deve satisfazer a condição j – i ≤ M.
Estruturas Secundárias de RNA
Outros 
Parâmetros
5. “Jobs” Imediatos Vs. “Batch”
– Sequências contendo até 800 pb podem ser feitos 
enquanto o usuário espera (default);
– Os resultados desses jobs imediatos serão apagados 
dentro de um período de 24-26 hs depois de submetidos;
– Para sequências de 801 a 6.000 pb, deve ser selecionada a 
opção Batch:
• Email válido deve ser usado;
• Resultados permanecem por 48-51 hs.
– Para sequências maiores que 6.000 pb (até 10.400) bases, 
deve ser feito um pedido especial.
Estruturas Secundárias de RNA Output
1. Resolução da Imagem
2. Formatos das Estruturas:
– Bases: mostra bases individuais;
– Outline: não mostra bases;
– Automático: mostra bases até 800 nt
3. Numeração das Bases:
– Por default, serão enumeradas de acordo com o 
comprimento da sequência.
Compr. Seq. Incremento da Numeração
1 - 50 10
51 - 300 20
> 300 50
Estruturas Secundárias de RNA
7
4. Ângulo de Rotação: valores positivos 
correspondem ao sentido horário.
5. Anotação da estrutura:
– P-num: nº de maneiras que uma base pode 
formar par;
– SS-Count: nº de vezes que uma base aparece 
sozinha.
– “High-light”: o usuário especifica as regiões a 
serem marcadas.
Estruturas Secundárias de RNA
Output
Job Imediato ou Batch
1. Gráfico de Pontos de Energia
2. Estrutura Computada: formato RNAML
3. Arquivos extras
4. Estruturas Encontradas
Estruturas Secundárias de RNA
Resultados
Gráfico de Pontos de Energia
8
As diagonais coloridas representam 
as estruturas secundárias sub-
ótimas. A faixa de cores vai do 
vermelho (melhor) ao amarelo (pior).
Formato RNAML
p -num
h -num
log
Arquivos Extras
Estrutura 1
Estruturas
9
Estrutura em jpg
Detalhes Termodinâmicos

Outros materiais