Buscar

aula9_tecBio-2021 1

Prévia do material em texto

Cronograma 2021.1
Tecnologia Biomédica
DIA TOTAL
SEMANA Início Término H/A
07:50 09:30 Introdução a disciplina
09:40 11:20 Introdução à bioinformática
07:50 09:30 O computador 2hrs
09:40 11:20 Compreendendo na prática o funcionamento do computador 2hrs
07:50 09:30 Revisão de biologia molecular 2hrs
09:40 11:20 Conceitos moleculares importantes para a bioinformática, parte I 2hrs
07:50 09:30 Conceitos moleculares importantes para a bioinformática, parte II 2hrs*
09:40 11:20 A pesquisa, o material genético e a bioinformática 2hrs
07:50 09:30 Métodos de sequenciamento de DNA parte I (PCR e Sanger) 2hrs*
09:40 11:20 Métodos de sequenciamento de DNA parte II (nova geração) 2hrs
07:50 09:30 Ômicas parte I 2hrs
09:40 11:20 Ômicas parte II 2hrs
07:50 09:30 O NCBI Teórica 2hrs
09:40 11:20 PRÁTICA (PubMed e GenBank) *Fazer em casa, relatório valendo ponto PRÁTICA 2hrs
07:50 09:30 2hrs
09:40 11:20 2hrs
07:50 09:30 2hrs
09:40 11:20 2hrs
26/abr SEG 07:50 11:20 AV01 Teórica 2hrs
07:50 09:30 Correção AV01 2hrs
09:40 11:20 Alinhamento de sequência 2hrs
07:50 09:30 Alinhamento de sequência Teórica 2hrs
09:40 11:20 PRÁTICA (BLAST, CLustalW) PRÁTICA 2hrs
07:50 09:30 Construção de primers Teórica 2hrs
09:40 11:20 PRÁTICA (Primer3) PRÁTICA 2hrs
07:50 09:30 Bancos de dados públicos 2hrs
09:40 11:20 Bancos de dados públicos 2hrs
07:50 09:30 Anotação gênica 2hrs
09:40 11:20 Anotação gênica 2hrs
07/jun SEG 07:50 11:20 Revisão AV02 Teórica 2hrs
14/jun SEG 07:50 11:20 AV02 Teórica 2hrs
21/jun SEG 07:50 11:20 Vista AV02 Teórica 2hrs
28/jun SEG 07:50 11:20 AV03 Teórica 2hrs
Teórica
TeóricaSEG
SEG31/mai
24/mai
Teórica
17/mai SEG
03/mai SEG
SEG10/mai
ASSUNTO ATIVIDADE
08/mar SEG
22/fev SEG
01/mar SEG Teórica
Teórica
12/abr SEG
19/abr
 DATA
HORA
SEG
05/abr SEG
Teórica
22/mar SEG Teórica
4hrs
15/mar SEG
29/mar SEG
Teórica
REVISÃO AV01 Teórica
PRÁTICA análise de dados de sequenciamento (presencial?) PRÁTICA
Teórica
Alinhamento de sequências
PRÁTICA 
AULA 9
Prof. Melise Silveira
3
INDICAÇÃO DE MATERIAL PARA ESTUDO
Conteúdo interativo no SAVA: Aula 8, alinhamento de sequências e construção de primers
Livro online
http://www.iq.usp.br/setubal/bmc/2015/FProsdocimi07_CursoBioinfo.pdf Capítulo 3
Alinhamento de sequências 4
http://www.iq.usp.br/setubal/bmc/2015/FProsdocimi07_CursoBioinfo.pdf
Você se lembra da 
função da ferramenta 
BLAST?
Alinhamento de sequências 5
Qual a aplicação do alinhamento de 
sequências?
1. Busca em bancos de dados;
Sequência pergunta ou QUERY
Alinhamento de sequências 6
Banco de sequências
Subject
Subject
Os programa BLAST realiza alinhamentos entre 
sequências de DNA ou proteínas 
chamadas query contra as sequências 
depositadas no banco de dados, essas 
sequências são chamadas subject.
O BLAST (Basic Local Alignment Search Tool) é um algoritmo LOCAL que encontra regiões de similaridade entre 
sequências biológicas. O programa compara sequências de nucleotídeos ou proteínas com bancos de dados de sequências e 
calcula a significância estatística.
Alinhamento de sequências 7
1) Protein blast (blastp) - Compara a sequência de aminoácido de entrada
(query) contra um banco de dados de sequências de aminoácidos.
(subject);
2) Nucleotide blast (blastn) – Compara a sequência de nucleotídeos de
entrada contra um banco de dados de sequências de nucleotídeos;
3) blastx - Compara a sequência de nucleotídeos de entrada traduzida
para todas as sequências de leitura possíveis contra um banco de dados
de sequências de proteínas. É o programa mais utilizado em grandes
projetos de sequenciamento, pois permite identificar possíveis
proteínas a partir de uma sequência de nucleotídeos desconhecida;
4) tblastn - Compara a sequência de aminoácido de entrada contra um
banco de dados de sequências de nucleotídeos traduzidas para todas
as sequências de leitura possíveis.
BLAST
Alinhamento local
Alinhamento de sequências 8
O resultado do alinhamento usando BLAST é avaliado estatisticamente:
-Valor E (e-value): número de alinhamentos com pontuações (scores) iguais 
ou melhores que “X” que seria de se esperar que ocorressem ao acaso numa 
base de dados do tamanho da utilizada. 
Obs: quanto menor o e-value mais confiável o alinhamento.
BLAST
Alinhamento local
Alinhamento de sequências 9
Alinhamento de sequências 10
Alinhamento de sequências 11
Alinhamento de sequências 12
O BLAST: alinhamento contra todas as sequências do banco de dados do GenBank
Copiar a sequencia aqui
Alinhamento de sequências 13
a) Megablast utiliza “seeds” (sequências iniciais para encontrar a similaridade) maiores (28 bases) fazendo com que o
algoritmo seja mais rápido; 
b) Discontiguos megablast- Utiliza seeds maiores, mas exige que apenas
algumas bases sejam coincidentes dentro de um padrão definido;
c) Blastn- seeds menores (11 bases, podendo ser ajustado ate 7 bases). Mais
sensível mas também mais lento.
O BLAST: alinhamento contra todas as sequências do banco de dados do GenBank
Selecionar as especificações
Alinhamento de sequências 14
O BLAST: alinhamento contra todas as sequências do banco de dados do GenBank
Quem são as sequências no 
GenBank que alinharam
Alinhamento de sequências 15
O BLAST: alinhamento contra todas as sequências do banco de dados do GenBank
Mostra o alinhamento para 
cada sequência
Alinhamento de sequências 16
O e-value é um parâmetro que 
descreve o número de 
ocorrências que se "espera" ver 
por acaso ao pesquisar em um 
banco de dados de um tamanho 
específico. Quanto menor melhor, 
mais significante o alinhamento.
O BLAST: alinhamento contra todas as sequências do banco de dados do GenBank
Alinhamento de sequências 17
Identidade: É o número de resíduos (nesse 
caso nucleotídeos) iguais (matches)
identificados no alinhamento e expresso em 
porcentagem, a partir da
comparação com o comprimento deste 
alinhamento.
O BLAST: alinhamento contra todas as sequências do banco de dados do GenBank
Alinhamento de sequências 18
O BLAST: alinhamento contra todas as sequências do banco de dados do GenBank
Alinhamento de sequências 19
Gap: Espaço introduzido em um 
alinhamento para compensar regiões de
inserção ou deleção em uma das duas 
sequências. 
Sentido das fitas de DNA comparadas
plus: +
minus: -
O BLAST: alinhamento contra todas as sequências do banco de dados do GenBank
Alinhamento de sequências 20
Outras regiões 
similares
BLAST é um tipo 
de alinhamento 
LOCAL
O BLAST: alinhamento contra todas as sequências do banco de dados do GenBank
Alinhamento de sequências 21
Carregar a 
sequência 1
Carregar a 
sequência 2
O BLAST: também é possível fazer o alinhamento entre duas sequências que você queira;
Alinhamento de sequências 22
Clustal: ferramenta para alinhamento GLOBAL de 3 ou mais sequências (alinhamento múltiplo).
Alinhamento de sequências 23
Clustal: ferramenta para alinhamento GLOBAL de 3 ou mais sequências (alinhamento múltiplo).
Escolha o tipo de sequência 
que você irá alinhar.
Alinhamento de sequências 24
Colocar três ou mais
sequências no mesmo arquivo
(MULTIFASTA) em um editor 
de texto. 
Salva como sequencias.fasta
Alinhamento de sequências 25
Alinhamento de sequências 26
Clustal: ferramenta para alinhamento GLOBAL de 3 ou mais sequências (alinhamento múltiplo).
Carregar o arquivo 
sequencias.fasta
Alinhamento de sequências 27
Contagem de 
nucleotídeos
Sequências 
alinhadas
* Consenso 
entre as 3 
sequências
Clustal: ferramenta para alinhamento GLOBAL de 3 ou mais sequências (alinhamento múltiplo).
Diferença 
entre as 3 
sequências
Alinhamento de sequências 28
Alinhamento de sequências 29
Clustal: ferramenta para alinhamento GLOBAL de 3 ou mais sequências (alinhamento múltiplo).
Alinhamento progressivo
Faz alinhamentos simples entre 
todas as sequências e coloca a 
pontuação desses alinhamentos 
em uma matriz.
Gera a árvore-guia (guide tree): união 
de vizinhos (neighbor-joining)
C &D são mais próximos,depois A & B
A árvore-guia é usada para refazer 
os alinhamentos gerando 
sequências consenso (compreende 
os resíduos mais comuns em cada 
posição): esse novo alinhamento é 
que será a base da árvore 
filogenética propriamente dita.
Qual a aplicação do alinhamento de sequências?
3. Determinar a 
relação evolutiva 
entre sequências: 
ancestralidade;
Com o passar do tempo as sequências moleculares sofrem alterações 
aleatórias, algumas das quais são selecionadas durante o processo de 
evolução.
https://nextstrain.org/ncov/global
Alinhamento de sequências 30
https://nextstrain.org/ncov/global
Alinhamento de sequências 31
Filogenia das amostras de SARS-Cov-2 isolados no Brasil
Alinhamento de sequências 32
Filogenia das amostras de SARS-Cov-2 isolados no Brasil
Alinhamento de sequências 33
1. Buscar pelo gene “S”, da proteína Spike (espícula);
2. Entrar no link da proteína correspondente;
3. Copiar para um arquivo de texto usando o formato FASTA;
4. Repetir para demais genomas;
5. Realizar o alinhamento múltiplo usando a ferramenta Clustal.
Filogenia das amostras de SARS-Cov-2 isolados no Brasil
Usando a proteína da espícula do vírus (spike, S).
Alinhamento de sequências 34
https://www.saude.go.gov.br/files//conecta-sus/produtos-
tecnicos/I%20-%202021/COVID-19%20-
%20Novas%20Variantes%20SARS-CoV-2.pdf
https://www.saude.go.gov.br/files/conecta-sus/produtos-tecnicos/I%20-%202021/COVID-19%20-%20Novas%20Variantes%20SARS-CoV-2.pdf
Por que as mutações podem 
afetar no diagnóstico da 
COVID-19 e na eficácia da 
vacinas?

Continue navegando