Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 IBM1029 Introdução à Bioinformática Aula 3 Profª Drª Silvana Giuliatti Departamento de Genética – Bloco G Ramal: 4503 silvana@rge.fmrp.usp.br Faculdade de Medicina Departamento de Genética PHRAP “ Phragment Assembly Program ou Phil´s Revised Assembly Program “ Programa para montagem de dados de seqüências de DNA obtidas. 2 Características: a.. Utiliza dados de qualidade para definir as bases de cada read - não é preciso cortes. b. Usa algoritmo de alinhamento local (Smith-Waterman) c. Não possui recursos de edição e visualização: usar o Consed ou Phrapview. d. Proporciona muita informação sobre a montagem contidas nos arquivos de saída. e. Pode ser usado para grandes conjuntos de dados. f. Extensa lista de opções para linha de comando: • controle, interpretação dos dados de entrada; • para controle da região da matriz a ser analisada; • saída. Arquivos de Saída 9 *.contigs – arquivo FASTA contendo as contigs.. 9 Contigs com mais de um read. 9 Singletons (reads simples com match com alguma outra contig, mas que não pode ser unido consistentemente a ela). 9 *.singlets – arquivo FASTA de reads singlets 9 Reads sem nenhum match com outro read. 9 *.ace –– permite a visualização da montagem usando permite a visualização da montagem usando ConsedConsed 9 *.view –– usado para visualização da montagem usando usado para visualização da montagem usando PhrapviewPhrapview 3 [root@localhost edit_dir]# phrap fasta_seq.screen -minmatch 10 - new_ace > phrap.out phrap fasta_seq.screen -minmatch 10 -new_ace phrap version 0.990329 Reading parameters ... 0.504 Mbytes allocated -- total 0.504 Mbytes Run date:time 050308:090804 Done Total space allocated: 0.504 Mbytes; currently free: 0.499 Mbytes in 2 blocks Reading query file into memory ... Done Total space allocated: 0.504 Mbytes; currently free: 0.181 Mbytes in 2 blocks Complementing ... Done Total space allocated: 0.504 Mbytes; currently free: 0.181 Mbytes in 2 blocks Allocating align_entries ...0.504 Mbytes allocated -- total 1.008 Mbytes Done Total space allocated: 1.008 Mbytes; currently free: 0.449 Mbytes in 3 blocks Reading quality files ... Done Total space allocated: 1.008 Mbytes; currently free: 0.449 ... [root@localhost edit_dir]# ls fasta_seq fasta_seq.screen.contigs fasta_seq.screen.problems.qual screen.out fasta_seq.log fasta_seq.screen.contigs.qual fasta_seq.screen.qual fasta_seq.screen fasta_seq.screen.log fasta_seq.screen.singlets fasta_seq.screen.ace fasta_seq.screen.problems phrap.out CONSED 4 Genome Research 8: 195-202, 1998 Consed é um programa para visualização e edição de montagens. Características: a. Permite a visualização de contigs, montagens (assembly) de reads, valores de qualidade dos reads e seqüência final. b. Arquivos de traços simples e múltiplos podem ser visualizados permitindo a comparação de uma dada seqüência em vários reads. c. Identifica e lista regiões que estão abaixo de uma valor de qualidade, contendo alta discrepância de qualidade, etc. Execução [root@localhost edit_dir]#consed_linux Três tipos de arquivos de entrada: 1. Cromatogramas: contendo perfis dos traços de fluorescência. 2. Arquivos phd: criado pelo Phred ou por outro programa de definição de bases. 3. Um arquivo .ace: criado pelo Phrap ou por outro programa de assemby (montagem). 5 6 Pipeline Phred/Phrap/Consed Chromat_dirChromat_dir Phd_dirPhd_dir Edit_dirEdit_dir Diretórios:Diretórios: Consed Visualização e edição da Montagem Montagem (Assembly) Phrap Contigs montadas - seqs_fasta.screen.contigs Arquivo da montangem - seqs_fasta.screen.ace# Retirada das bases contaminantes Cross_Match + vector.seq Arquivo de saída - seqs_fasta.screen Conversão - phd para fasta phd2fasta.pl Seqüências de nucleotídeos - seqs_fasta Valores de qualidade - seqs_fasta.screen.qual Avaliação Valores de Qualidade Phred Arquivos phd - *.phd Input Arquivos do cromatograma PhredPhrap • Script em linguagem perl. • PhredPhrap roda: • phred • phd2fasta • cross_match • phrap • Execução: • digitar phredphrap na linha de comando 7 Phred/Phrap/Consed Outros editores de seqüências: • Gap4 (Bonfield et al., 1995) • TIGR Assembler (Sutton et al., 1995) • CAP3 (Huang e Madan, 1999)
Compartilhar