aula7_ibm1029

•

USP-RP

0

Alef Janguas Da Costa

22.10.2014

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 3 páginas

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Introdução à Bioinformática

161 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

1
IBM1029
Introdução à Bioinformática
Aula 7
Profª Drª Silvana Giuliatti
Departamento de Genética – Bloco G
Ramal: 4503
silvana@rge.fmrp.usp.br
Faculdade de Medicina
Departamento de Genética
Penalidades para Gaps
A maioria dos modelos de alinhamentos de 
sequências utiliza penalidade associadas a gaps nas 
quais o custo de incluir um gap em uma sequência é 
diferente do custo de aumentar um gap já existente.
Penalidades para Gaps
A maioria dos modelos de alinhamentos de 
sequências utiliza penalidade associadas a gaps nas 
quais o custo de incluir um gap em uma sequência é 
diferente do custo de aumentar um gap já existente.
• Penalidade de abertura de um gap (opening
penalty)
• Penalidade de extensão de um gap (extension
penalty)
Penalidades para Gaps
• Modelo Linear
w = g x d
g : comprimento do gap
d : penalidade por abertura do gap = -10
Exemplo: A A A T T T T T T A A A T T T T T T
A - A - A - T - T A A A - - - - T T
wtotal = - (1 x 10) x 4 = -40 wtotal = - (4 x 10) = -40
Penalidades para Gaps
• Modelo “Affine” – Gotoh (1982)
w = d + e (g - 1)
g : comprimento do gap
d : penalidade por abertura do gap = -10
e : penalidade por extensão = -2
Exemplo: A A A T T T T T T A A A T T T T T T
A - A - A - T - T A A A - - - - T T
wtotal = [- 10 -2 (1-1)] x 4 = -40 wtotal = -10 - 2(4 -1) = -16 Onde: M é o score para um alinhamento ótimo entre X e Y, onde o 
alinhamento finaliza com X alinhado com Y; Ix finaliza com X alinhado 
com gap e Iy finaliza com Y alinhado com gap (i =1, ..., m e j =1, ..., n).
M (i - 1, j -1) + s(xi , yj) 
Ix (i - 1, j-1) + s(xi , yj)
Iy (i-1, j - 1) + s(xi , yj)
M (i - 1, j ) + d 
Ix (i - 1, j) + e
M (i , j -1) + d 
Iy (i , j-1) + e
M (i, j) = max
Ix (i, j) = max
Iy (i, j) = max
2
Para M(i,0): score de alinhamento Xi com região de 
gap de comprimento i (i = 1, ..., m).
Para M(0,j): score de alinhamento Yi com região de 
gap de comprimento j (j = 1, ..., n).
M(0,0) = 0
Exemplo: Considere duas sequências:
X: A C G G T A C 
Y: G A G G T 
onde o modelo de pontuação é: s (a, a) = 1 (match)
s (a, b) = -1 (mismatch)
d = -3 (abertura) e = -2 (extensão)
Preenchendo para M(0,j) e M(i,0):
w = d + e (g - 1), sendo g = i ou g = j.
M(0,1) = -3 -2 (1-1) = -3 e assim sucessivamente.
-15C7
-13A6
-11T5
-9G4
-7G3
-5C2
-3A1
-11-9-7-5-30-0
TGGAG-M
543210
O score de um alinhamento ótimo será 
dado por:
Max { M(m, n), Ix(m,n), Iy (m, n)}
e o caminho de volta é traçado pa partir do 
elemento de valor máximo. 
Max {M(7,5), Ix(7,5), Iy(7,5)}
Max {-6, -4, -12}= -4
w = -3 -2 (2-1) = -5
X: A C G G T A C
Y: G A G G T - -
-1 -1 +1 +1 +1 -5 = -4
Penalidades para Gaps
• Não existe teoria que permita calcular a probabilidade 
de um gap, como, por exemplo, uma função da 
distância evolutiva ou de seu comprimento.
• Se a penalidade por gap for muito alta em comparação 
ao scores da matriz, gaps nunca irão aparecer no 
alinhamento.
• Se a penalidade por gap for muito baixa em 
comparação aos scores da matriz, gaps irão aparecer em 
todo lugar ao longo do alinhamento.
• A maioria dos programas sugerem seus valores 
apropriados. 
Programas para Alinhamentos de 
Pares de Sequências
• FASTA
• ALIGN: alinhamento global
algoritmo de Needleman-Wunsch
• LALIGN: alinhamento local
algoritmo de Smith-Waterman
http://fasta.bioch.virginia.edu/
http://veja.igh.cnrs.fr/
3
LALIGN
Matriz PAM250 
penalidade de abertura: -12 
penalidade de extensão: -2
: Pares idênticos
. Pares similares
Programas para Alinhamentos de 
Pares de Sequências
• EMBOSS 
• Needle: alinhamento global
algoritmo de Needleman-Wunsch
• Water: alinhamento local
algoritmo de Smith-Waterman
http://www.hgmp.mrc.ac.uk/Software/EMBOSS/
Alinhamento Global - Needle
Matriz BLOSUM62 | Pares idênticos
penalidade de abertura: -11 : Pares similares
penalidade de extensão: -1 . Pares com similaridade menor
“ “ (espaço) Pares sem relação
Alinhamento Local - Water
Matriz BLOSUM62 | Pares idênticos
penalidade de abertura: -11 : Pares similares
penalidade de extensão: -1 . Pares com similaridade menor
“ “ (espaço) Pares sem relação