Buscar

aula3_ibm1029

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1
IBM1029
Introdução à Bioinformática
Aula 3
Profª Drª Silvana Giuliatti
Departamento de Genética – Bloco G
Ramal: 4503
silvana@rge.fmrp.usp.br
Faculdade de Medicina
Departamento de Genética
PHRAP
“ Phragment Assembly Program ou
Phil´s Revised Assembly Program “
Programa para montagem de dados de seqüências de DNA 
obtidas. 
2
Características:
a.. Utiliza dados de qualidade para definir as bases de cada 
read - não é preciso cortes.
b. Usa algoritmo de alinhamento local (Smith-Waterman) 
c. Não possui recursos de edição e visualização: usar o 
Consed ou Phrapview.
d. Proporciona muita informação sobre a montagem 
contidas nos arquivos de saída. 
e. Pode ser usado para grandes conjuntos de dados. 
f. Extensa lista de opções para linha de comando:
• controle, interpretação dos dados de entrada;
• para controle da região da matriz a ser analisada;
• saída.
Arquivos de Saída
9 *.contigs – arquivo FASTA contendo as contigs..
9 Contigs com mais de um read.
9 Singletons (reads simples com match com alguma outra contig, mas que não 
pode ser unido consistentemente a ela).
9 *.singlets – arquivo FASTA de reads singlets
9 Reads sem nenhum match com outro read.
9 *.ace –– permite a visualização da montagem usando permite a visualização da montagem usando 
ConsedConsed
9 *.view –– usado para visualização da montagem usando usado para visualização da montagem usando 
PhrapviewPhrapview
3
[root@localhost edit_dir]# phrap fasta_seq.screen -minmatch 10 -
new_ace > phrap.out
phrap fasta_seq.screen -minmatch 10 -new_ace
phrap version 0.990329
Reading parameters ... 0.504 Mbytes allocated -- total 0.504 Mbytes
Run date:time 050308:090804
Done
Total space allocated: 0.504 Mbytes; currently free: 0.499 Mbytes in 
2 blocks
Reading query file into memory ... Done
Total space allocated: 0.504 Mbytes; currently free: 0.181 Mbytes in 
2 blocks
Complementing ... Done
Total space allocated: 0.504 Mbytes; currently free: 0.181 Mbytes in 
2 blocks
Allocating align_entries ...0.504 Mbytes allocated -- total 1.008 
Mbytes
Done
Total space allocated: 1.008 Mbytes; currently free: 0.449 Mbytes in 
3 blocks
Reading quality files ... Done
Total space allocated: 1.008 Mbytes; currently free: 0.449 ...
[root@localhost edit_dir]# ls
fasta_seq fasta_seq.screen.contigs
fasta_seq.screen.problems.qual screen.out
fasta_seq.log fasta_seq.screen.contigs.qual 
fasta_seq.screen.qual
fasta_seq.screen fasta_seq.screen.log
fasta_seq.screen.singlets
fasta_seq.screen.ace fasta_seq.screen.problems
phrap.out
CONSED
4
Genome Research 8: 195-202, 1998
Consed é um programa para visualização e edição 
de montagens.
Características:
a. Permite a visualização de contigs, montagens 
(assembly) de reads, valores de qualidade dos reads e 
seqüência final.
b. Arquivos de traços simples e múltiplos podem ser 
visualizados permitindo a comparação de uma dada 
seqüência em vários reads.
c. Identifica e lista regiões que estão abaixo de uma valor 
de qualidade, contendo alta discrepância de qualidade, 
etc.
Execução 
[root@localhost edit_dir]#consed_linux
Três tipos de arquivos de entrada:
1. Cromatogramas: contendo perfis dos traços de 
fluorescência.
2. Arquivos phd: criado pelo Phred ou por outro 
programa de definição de bases.
3. Um arquivo .ace: criado pelo Phrap ou por outro 
programa de assemby (montagem).
5
6
Pipeline Phred/Phrap/Consed
Chromat_dirChromat_dir
Phd_dirPhd_dir
Edit_dirEdit_dir
Diretórios:Diretórios:
Consed
Visualização e edição da Montagem
Montagem (Assembly)
Phrap
Contigs montadas - seqs_fasta.screen.contigs
Arquivo da montangem - seqs_fasta.screen.ace#
Retirada das bases contaminantes
Cross_Match + vector.seq
Arquivo de saída - seqs_fasta.screen
Conversão - phd para fasta
phd2fasta.pl
Seqüências de nucleotídeos - seqs_fasta
Valores de qualidade - seqs_fasta.screen.qual
Avaliação Valores de Qualidade
Phred
Arquivos phd - *.phd
Input
Arquivos do cromatograma
PhredPhrap
• Script em linguagem perl.
• PhredPhrap roda:
• phred
• phd2fasta
• cross_match
• phrap
• Execução: 
• digitar phredphrap na linha de comando
7
Phred/Phrap/Consed
Outros editores de seqüências:
• Gap4 (Bonfield et al., 1995)
• TIGR Assembler (Sutton et al., 1995)
• CAP3 (Huang e Madan, 1999)

Outros materiais