Buscar

Aula 11 Bioinformatica

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

Bioinformática 
Montagem de sequencias 
 Para obter o resultado completo de um 
sequenciamento é necessário: 
1. Fragmentar a sequencia de interesse em milhares/milhões 
de pequenos segmentos. 
2. Ler a sequencia de cada fragmento (sequenciamento). 
3. Com a bioinformática sobrepor cada um destes fragmentos 
com sequencias idênticas. 
4. Sobrepor sequencias maiores até determinar a sequencia 
completa. 
 
Como montar sequências pós-
sequenciamento? 
 O sequenciamento é dado pela análise de vários fragmentos. 
 
 O sequenciador apenas excita com laser os nucleotídeos 
marcados com fluoróforos ou outra tecnologia. 
 
 Então como transformar a luz emitida pelos nucleotídeos 
em uma informação (ATCG)? 
Como construir uma sequência a 
partir dos dados do sequenciamento 
 Aplicação de modelos 
matemáticos e 
computacionais para o 
estudo da informação 
biológica. 
Bioinformática 
 Utilização de ferramentas computacionais para 
estudo de genomas. 
 
 Uso de algoritmos para resolver problemas 
complexos e específicos: 
 Genômica Estrutural 
 Genômica Funcional 
 Genômica Comparativa 
Bioinformática 
 Após o sequenciamento, os resultados saem na forma de 
eletroferogramas. 
Montagem de sequências 
 Estes dados são inseridos em programas de Base Calling. 
 
 Consiste no processo de leitura dos dados do sequenciador, 
identificação da sequência gerada e atribuição de um valor de 
qualidade para cada base gerada. 
 
 O programa mais utilizado é o PHRED. 
Montagem de sequências 
 Softwares: 
 Phred: identificação de bases nitrogenadas (nucleotídeos) e 
atribui valores de qualidade. 
Bioinformática 
 Softwares: 
 Phred: análise dos picos X linha de base X distância entre os picos. 
 
Bioinformática 
 Softwares: 
 Phred: converte a sequência em arquivo FASTA 
Bioinformática na Genômica 
Estrutural 
S
ím
b
o
lo
 F
A
S
T
A
 
Geninfo 
Identifier 
Número 
de acesso Descrição da sequência/Gene/Organismo 
Sequência de DNA depositada 
Bioinformática 
 Caso tenha sido utilizado 
o sequenciamento 
Shotgun, além da 
sequência-alvo também 
foi sequenciado as 
regiões do plasmídeo 
flanqueadoras. 
 
 A retirada destas regiões 
é geralmente realizada 
pelo uso do programa 
Cross-Match. 
 Softwares: 
 Cross-Match: identificação de sequências do vetor na amostra 
sequenciada 
 
Bioinformática na Genômica 
Estrutural 
vetor vetor inserto 
Sequenciamento 
Primer Primer 
(1) 
(2) 
(3) Amostra sequenciada 
Cross-Match 
(4) Amostra sequenciada 
 Softwares: 
 Cross-Match: compara sequências em arquivo FASTA. 
 Mascara a contaminação com sequências do vetor inserindo um 
“X” no local onde encontra bases nitrogenadas (nucleotídeos) 
contaminantes. 
Bioinformática 
>Seq1 
XXXXATGCGCATAGCATAGGGACATCATACATTTTACACACAAGAGACAGACGAT 
ACTACATGTCATGACTACXXXXXXXXXXXXXXX 
 
Exemplo de saída do cross_match 
 Após a geração de arquivos sem contaminantes, contendo 
a identificação dos nucleotídeos e os valores de qualidade 
a análise segue pela montagem das sequencias maiores. 
 
 O programa geralmente empregado é o Phrap que utiliza 
o mecanismo de sobreposição (alinhamento). 
Montagem de Sequências 
 Softwares: 
 Phrap: Montagem de sequências contiguas (contigs) 
Bioinformática 
Alinhamento de sequências 
sequenciadas 
 Vários fragmentos sequenciados são sobrepostos 
 
 Ao conjunto de contigs é dado o nome de reads. 
 
 Quando todos os reads são corretamente alinhados em uma 
sequência consenso (Scaffold), temos o genoma completo. 
Alinhamento de sequências 
sequenciadas 
Sequência sobreposta sem alinhamento 
Sequência sobreposta com alinhamento 
 Softwares: 
 Consed: análise e edição dos contigs. 
Bioinformática 
 Softwares: 
 Scaffold: fechamento 
dos gaps 
Bioinformática 
Comparação de Sequências 
 Tem o objetivo de identificar 
SEMELHANÇAS/DIFERENÇAS entre sequências de 
DNA, RNA e de Proteínas. 
Alinhamento de Sequências 
 Objetivos 
 1. Medir a 
similaridade entre 
duas ou mais 
sequências 
 2. Inferir relações 
evolucionárias 
 3. Observar padrões 
de conservação e 
variabilidade para 
predições estruturais 
e funcionais. 
Comparação de Sequências 
 O método tradicional de comparar sequências consiste no 
alinhamento. 
 Comparar duas ou mais sequencias buscando similaridades. 
Tipos de Alinhamento 
 Alinhamento Global 
 Compara sequências em toda sua extensão; 
 Espera-se semelhanças por toda a extensão da sequência; 
 Programas: ClustalW 
Alinhamento Local 
 Alinhamento Local 
 Encontra o melhor alinhamento de algum segmento de uma 
sequência contra o segmento de outra; 
 Programas: BLAST 
Comparando alinhamento global X local 
 
Alinhamento local no Blast 
Sequência alvo 
Sequência 
referência 
1. Identidade: Quantos idênticos; 
2. Similaridade: Quantos parecidos, considera a possibilidade do alinhamento 
ter acontecido ao acaso; 
3. Homologia: Relação evolutiva entre duas sequências, ou seja: se tem 
ancestral comum. 
Comparação de Sequências 
 Valores de Qualidade no “Alinhamento” 
> GTCGATCGATCGAGCTAGCTAGCTA 
 > ATTGATCCAGCT - GCTAGAT 
- Match: Correspondência correta entre pares de resíduos; 
- Mismatch: Falso alinhamento; 
- Gap: Sequência de espaços no alinhamento; 
Pontuação do Alinhamento 
 O melhor alinhamento entre duas sequências: 
 
 
 
 
 Será dado por um Score que á soma da associação das 
pontuações de cada nucleotídeo alinhado de acordo com um 
critério pré-definido. 
Score do alinhamento 
G A – C G G A T T A G 
G A T C G G A A T A G 
 Somando o Score deste alinhamento. 
Score do Alinhamento 
G A – C G G A T T A G 
G A T C G G A A T A G 
 Somando o Score deste alinhamento. 
 Match: 9 x 1 
 Mismatch: 1 x (-1) 
 Gap: 1 x (- 2) 
 Gap extension: -5 
 Score: [ (9 x 1) + (1 x (-1)) + (1 x (-2))] = 6 
 
Matriz de Substituição 
 Matriz de Score utilizam as pontuações do alinhamento de 
proteínas para medir a distância genética (divergência). 
 GRIFFITHS A. J.F. et al. Introdução à Genética, 10 ed., 
Rio de Janeiro: Guanabara Koogan, 2013, 422-441. 
 
 http://www2.bioqmed.ufrj.br/prosdocimi/FProsdocimi
07_CursoBioinfo.pdf. 
Referência

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais