Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Profª Drª Silvana Giuliatti Departamento de Genética – Bloco G Ramal: 4503 silvana@rge.fmrp.usp.br Faculdade de Medicina Departamento de Genética IBM1029 Introdução à Bioinformática Aula 13 Predição de Estruturas Secundárias de RNA – Uma sequência de RNA não ficará estável até que algumas de suas bases expostas estejam protegidas de moléculas de água. – Uma maneira simples de proteger uma base é fazer com que ela faça par com outra base de RNA. – O emparelhamento dessas bases forma a estrutura secundária do RNA. – Bases que não formarem pares irão formar laços (loops) ou bulbos (bulges). Estrutura Secundária de RNA Estrutura Secundária de RNA • Sequências de RNA mantêm padrões de pares de bases que fornecem regiões: – estruturas secundárias – estruturas terciárias • Análise computacional de moléculas de RNA fazem predição das estruturas secundárias mais estáveis. Características do RNA • RNA: polímero composto de uma combinação de 4 nucleotídeos – adenina (A) – citosina (C) – guanina (G) – uracila (U) Estrutura Secundária de RNA Estrutura Secundária de RNA • Estrutura secundária: – É vista como um passo intermediário na formação da estrutura terciária. – É fundamentalmente regiões de fita dupla formadas de uma fita simples, formando laços (loops) na estrutura de RNA. • Como no DNA: – G/C: maior estabilidade genética – A/U: menor estabilidade genética que G/C 2 • Predições de estrutura de RNA são compostas de regiões de bases pareadas e não pareadas, formado vários tipos de loops e arranjos de junções. • Interações terciárias são formadas por pares de bases entre elementos de estruturas secundárias e entre elementos de estrutura secundárias e regiões de fita única Estrutura Secundária de RNA Interações Secundárias Grampos (Hairpin) • Geralmente possuem pelo menos 4 bases. Estrutura Secundária de RNA Bulbos • Ocorrem quando bases em um lado da estrutura não formam pares. Estrutura Secundária de RNA Loops Interiores • Ocorrem quando bases em ambos os lados da estrutura não formam pares. Estrutura Secundária de RNA Junções (Multiloops) • Duas ou mais regiões convergem para formar uma estrutura fechada. Estrutura Secundária de RNA Grampo-Grampo • Bases não pareadas de dois grampos separados formam uma junção. Estrutura Secundária de RNA Interações Terciárias 3 Pseudonós Estrutura Secundária de RNA Grampo-Bulbo Estrutura Secundária de RNA • A estrutura é feita de forma que não se produzam nós. • A melhor maneira de representar isso é desenhando a sequência num formato circular. As bases pareadas são unidas por arcos. • Se a estrutura total com todos os pares de bases preditos estiver livre de nós, os arcos não devem se cruzar. Estrutura Secundária de RNA Estrutura Secundária de RNA • Regiões auto-complementares em sequências de RNA predizem estruturas secundárias. – Todas as análises começam pela identificação de regiões auto-complementares. – Análise mais simples: matriz de pontos. – Uma matriz de pontos mais avançada pode ser usada para mostrar as partes mais energéticas da molécula. Estrutura Secundária de RNA • Para a análise por matriz de pontos: – a sequência a ser analisada é listada em ambos os eixos. É listada na direção 5´3´, na horizontal, e a fita complementar listada na vertical, também em 5´3´. – A matriz é pontuada por identidades. – Regiões auto-complementares aparecem como linhas de pontos indo do canto superior esquerdo para o canto inferior direito. Estrutura Secundária de RNA 4 • Um método de matriz de pontos alternativo: – listar a sequência de RNA na horizontal e também na vertical. – Pontuar a matriz pelas bases complementares ao invés de identidades. – Diagonais indicam regiões complementares indo do canto superior direito para o canto inferior esquerdo. Estrutura Secundária de RNA Estruturas Secundárias de RNA • Assume-se que a tendência natural da molécula de RNA é alcançar sua configuração mais estável através da interação em pares, dando à molécula a estabilidade mais alta que ela possa ter: Modelo de Energia Livre Mínima. • Para uma molécula de aproximadamente 200 bases, deve-se esperar uma energia livre menor que -50 kcal. • É feita uma análise de todas as possíveis combinações de regiões de potencial de fita dupla através de minimização de energia. • Termodinamicamente, os modelos estruturais mais prováveis são obtidos. Estruturas Secundárias de RNA • A estabilidade de uma estrutura secundária é uma função de vários parâmetros: – Nº de pares CG versus AU e GU – Nº de bases numa região da fita: longas fitas resultam em mais ligações. – Nº de pares de bases na região de hairpin: formação de loops com mais de 10 ou menos que 5 bases requerem mais energia. – Nº de bases sem pares: bases não pareadas diminuem a estabilidade da estrutura. Estruturas Secundárias de RNA • A estabilidade de uma estrutura secundária é quantificada como uma quantidade da energia livre liberada ou usada para a formação de pares de bases. • Energia livre positiva precisam realizar trabalho para formar uma configuração. Energia livre negativa liberam trabalho armazenado. • A energia livre total é obtida pela adição de todas as componentes de energia livre. • Quanto mais negativa for a energia de uma estrutura, mais provável é a formação da estrutura secundaria, porque mais energia é liberada. Estruturas Secundárias de RNA • Para computar a energia mínima de uma sequência, parâmetros de energia empíricos são utilizados. • Esses parâmetros sumarizam a mudança de energia livre (positiva e negativa) associada com todas as possíveis configurações de pares de bases. • O software mais usado que utiliza o algoritmo de mínima energia livre é o MFOLD (Zuker et al. 1991) • http://www.bioinfo.rpi.edu/applications/mfold/ • Prediz a estrutura secundária de uma molécula de RNA. • O algoritmo leva em consideração parâmetros físicos que afetam a estrura, tais como, pH e temperatura. Estruturas Secundárias de RNA 5 • Nos métodos de mínima energia livre: – cada base é comparada com cada uma das outras bases, por complementaridade, por um tipo de análise similar à análise de matriz de pontos. – a sequência é listada na horizontal e vertical. – numa matriz de RNA, uma diagonal indica uma sucessão de nucleotídeos complementares que podem, potencialmente, formar uma região de fita dupla. Estruturas Secundárias de RNA – A estrutura é determinada pelas propriedades biofísicas. – O algoritmo de minimização de energia prediz a estrutura pela minimização da energia livre. – As energias são calculadas pelas contribuições acumuladas entre os pares de bases vizinhos. Estruturas Secundárias de RNA – A sequência é comparada contra ela mesma, usando um algoritmo de programação dinâmica. – O score é baseado nos valores de energia livre. Estruturas Secundárias de RNA MFOLD Input 1. Nome da sequência – Se nenhum nome for dado: yyMmmdd-hh-mm-ss (ex:06Feb09-20-23-06) 2. Seqûencia: formato FASTA 3. Restrições Opcional; Cada restrição deve ser inserida numa linha; Devem seguir o formato; Podem ser usadas múltiplas restrições de qualquer tipo. Estruturas Secundárias de RNA Formatos das Restrições • F i j k: força um par de bases específico ou uma hélice a se formar. • P i j k: proíbe um específico par ou hélice de ser formado. • F i 0 k: força uma string de consecutivas bases a formar pares. • P i 0 k: proíbe uma string de consecutivas bases a formar pares. • P i j k l: proíbe uma string de consecutivas bases a formar pares com outra string. Estruturas Secundárias de RNA 6 Nome da Sequência SequênciaFormato FASTARestrições Uma restrição por linha Formatos 4. Outros Parâmetros – A sequência pode ser linear ou circular; – Na versão atual, a temperatura da estrutura é de 37°C; – As condições iônicas são fixas; – Percentagem de sub-ótimos (P): controla o incremento da energia livre para apresentação dos pares de bases no gráfico de pontos; Estruturas Secundárias de RNA – Limite superior do nº de estruturas: deve ser um valor absoluto; – Parâmetro da janela (W): controla o nº de estruturas que são computados; – Se a distância máxima entre o parâmetro das bases emparelhadas, M, for especificado, então qualquer par deve satisfazer a condição j – i ≤ M. Estruturas Secundárias de RNA Outros Parâmetros 5. “Jobs” Imediatos Vs. “Batch” – Sequências contendo até 800 pb podem ser feitos enquanto o usuário espera (default); – Os resultados desses jobs imediatos serão apagados dentro de um período de 24-26 hs depois de submetidos; – Para sequências de 801 a 6.000 pb, deve ser selecionada a opção Batch: • Email válido deve ser usado; • Resultados permanecem por 48-51 hs. – Para sequências maiores que 6.000 pb (até 10.400) bases, deve ser feito um pedido especial. Estruturas Secundárias de RNA Output 1. Resolução da Imagem 2. Formatos das Estruturas: – Bases: mostra bases individuais; – Outline: não mostra bases; – Automático: mostra bases até 800 nt 3. Numeração das Bases: – Por default, serão enumeradas de acordo com o comprimento da sequência. Compr. Seq. Incremento da Numeração 1 - 50 10 51 - 300 20 > 300 50 Estruturas Secundárias de RNA 7 4. Ângulo de Rotação: valores positivos correspondem ao sentido horário. 5. Anotação da estrutura: – P-num: nº de maneiras que uma base pode formar par; – SS-Count: nº de vezes que uma base aparece sozinha. – “High-light”: o usuário especifica as regiões a serem marcadas. Estruturas Secundárias de RNA Output Job Imediato ou Batch 1. Gráfico de Pontos de Energia 2. Estrutura Computada: formato RNAML 3. Arquivos extras 4. Estruturas Encontradas Estruturas Secundárias de RNA Resultados Gráfico de Pontos de Energia 8 As diagonais coloridas representam as estruturas secundárias sub- ótimas. A faixa de cores vai do vermelho (melhor) ao amarelo (pior). Formato RNAML p -num h -num log Arquivos Extras Estrutura 1 Estruturas 9 Estrutura em jpg Detalhes Termodinâmicos
Compartilhar