Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Bioinformática Montagem de sequencias Para obter o resultado completo de um sequenciamento é necessário: 1. Fragmentar a sequencia de interesse em milhares/milhões de pequenos segmentos. 2. Ler a sequencia de cada fragmento (sequenciamento). 3. Com a bioinformática sobrepor cada um destes fragmentos com sequencias idênticas. 4. Sobrepor sequencias maiores até determinar a sequencia completa. Como montar sequências pós- sequenciamento? O sequenciamento é dado pela análise de vários fragmentos. O sequenciador apenas excita com laser os nucleotídeos marcados com fluoróforos ou outra tecnologia. Então como transformar a luz emitida pelos nucleotídeos em uma informação (ATCG)? Como construir uma sequência a partir dos dados do sequenciamento Aplicação de modelos matemáticos e computacionais para o estudo da informação biológica. Bioinformática Utilização de ferramentas computacionais para estudo de genomas. Uso de algoritmos para resolver problemas complexos e específicos: Genômica Estrutural Genômica Funcional Genômica Comparativa Bioinformática Após o sequenciamento, os resultados saem na forma de eletroferogramas. Montagem de sequências Estes dados são inseridos em programas de Base Calling. Consiste no processo de leitura dos dados do sequenciador, identificação da sequência gerada e atribuição de um valor de qualidade para cada base gerada. O programa mais utilizado é o PHRED. Montagem de sequências Softwares: Phred: identificação de bases nitrogenadas (nucleotídeos) e atribui valores de qualidade. Bioinformática Softwares: Phred: análise dos picos X linha de base X distância entre os picos. Bioinformática Softwares: Phred: converte a sequência em arquivo FASTA Bioinformática na Genômica Estrutural S ím b o lo F A S T A Geninfo Identifier Número de acesso Descrição da sequência/Gene/Organismo Sequência de DNA depositada Bioinformática Caso tenha sido utilizado o sequenciamento Shotgun, além da sequência-alvo também foi sequenciado as regiões do plasmídeo flanqueadoras. A retirada destas regiões é geralmente realizada pelo uso do programa Cross-Match. Softwares: Cross-Match: identificação de sequências do vetor na amostra sequenciada Bioinformática na Genômica Estrutural vetor vetor inserto Sequenciamento Primer Primer (1) (2) (3) Amostra sequenciada Cross-Match (4) Amostra sequenciada Softwares: Cross-Match: compara sequências em arquivo FASTA. Mascara a contaminação com sequências do vetor inserindo um “X” no local onde encontra bases nitrogenadas (nucleotídeos) contaminantes. Bioinformática >Seq1 XXXXATGCGCATAGCATAGGGACATCATACATTTTACACACAAGAGACAGACGAT ACTACATGTCATGACTACXXXXXXXXXXXXXXX Exemplo de saída do cross_match Após a geração de arquivos sem contaminantes, contendo a identificação dos nucleotídeos e os valores de qualidade a análise segue pela montagem das sequencias maiores. O programa geralmente empregado é o Phrap que utiliza o mecanismo de sobreposição (alinhamento). Montagem de Sequências Softwares: Phrap: Montagem de sequências contiguas (contigs) Bioinformática Alinhamento de sequências sequenciadas Vários fragmentos sequenciados são sobrepostos Ao conjunto de contigs é dado o nome de reads. Quando todos os reads são corretamente alinhados em uma sequência consenso (Scaffold), temos o genoma completo. Alinhamento de sequências sequenciadas Sequência sobreposta sem alinhamento Sequência sobreposta com alinhamento Softwares: Consed: análise e edição dos contigs. Bioinformática Softwares: Scaffold: fechamento dos gaps Bioinformática Comparação de Sequências Tem o objetivo de identificar SEMELHANÇAS/DIFERENÇAS entre sequências de DNA, RNA e de Proteínas. Alinhamento de Sequências Objetivos 1. Medir a similaridade entre duas ou mais sequências 2. Inferir relações evolucionárias 3. Observar padrões de conservação e variabilidade para predições estruturais e funcionais. Comparação de Sequências O método tradicional de comparar sequências consiste no alinhamento. Comparar duas ou mais sequencias buscando similaridades. Tipos de Alinhamento Alinhamento Global Compara sequências em toda sua extensão; Espera-se semelhanças por toda a extensão da sequência; Programas: ClustalW Alinhamento Local Alinhamento Local Encontra o melhor alinhamento de algum segmento de uma sequência contra o segmento de outra; Programas: BLAST Comparando alinhamento global X local Alinhamento local no Blast Sequência alvo Sequência referência 1. Identidade: Quantos idênticos; 2. Similaridade: Quantos parecidos, considera a possibilidade do alinhamento ter acontecido ao acaso; 3. Homologia: Relação evolutiva entre duas sequências, ou seja: se tem ancestral comum. Comparação de Sequências Valores de Qualidade no “Alinhamento” > GTCGATCGATCGAGCTAGCTAGCTA > ATTGATCCAGCT - GCTAGAT - Match: Correspondência correta entre pares de resíduos; - Mismatch: Falso alinhamento; - Gap: Sequência de espaços no alinhamento; Pontuação do Alinhamento O melhor alinhamento entre duas sequências: Será dado por um Score que á soma da associação das pontuações de cada nucleotídeo alinhado de acordo com um critério pré-definido. Score do alinhamento G A – C G G A T T A G G A T C G G A A T A G Somando o Score deste alinhamento. Score do Alinhamento G A – C G G A T T A G G A T C G G A A T A G Somando o Score deste alinhamento. Match: 9 x 1 Mismatch: 1 x (-1) Gap: 1 x (- 2) Gap extension: -5 Score: [ (9 x 1) + (1 x (-1)) + (1 x (-2))] = 6 Matriz de Substituição Matriz de Score utilizam as pontuações do alinhamento de proteínas para medir a distância genética (divergência). GRIFFITHS A. J.F. et al. Introdução à Genética, 10 ed., Rio de Janeiro: Guanabara Koogan, 2013, 422-441. http://www2.bioqmed.ufrj.br/prosdocimi/FProsdocimi 07_CursoBioinfo.pdf. Referência
Compartilhar