Baixe o app para aproveitar ainda mais
Prévia do material em texto
Qualquer utilização de computadores para tarefas em biologia Estudo e entendimento do mundo biológico através dos princípios e técnicas das ciências da informação Conceito restrito e prático Conceito abrangente e teórico Conjunto de técnicas advindas da matemática, estatística e computação aplicadas a problemas da Genômica Conceito para Genética e Biologia Molecular A bioinformática frente a duas classes de problemas 1) Aqueles oriundos das diversas técnicas biotecnológicas Montagem de genomas Reconstruir de forma computacional o genoma de um organismo com base em pequenos fragmentos de seqüência de DNA, que têm sobreposição entre si A bioinformática frente a duas classes de problemas 2) Problemas de natureza biológica propriamente dita Encontrar os genes num genoma Independem de tecnologias particulares Algorítmo X Programa É um seqüência finita de passos ou operações bem definidas que objetiva resolver determinado programa (Ex. Multiplicação) É a implementação de um algoritmo usando uma linguagem particular de programação Algoritmo (procedimento abstrato) Programa (Entidade mais concreta) Como se pode achar genes num genoma? O gene é a informação mais importante contida em uma seqüência de DNA Seqüência de DNA no formato FASTA Formato universalmente aceito para processamento Estrutura esquemática de um gene procarioto ATG TAA TGA TAG Quadro aberto de leitura ou ORF (open reading frame) Trecho codificante dado por qualquer tredho de DNA que iniciando-se numa determinada base, contém um número de nucleotídeos que é múltiplo de três, termina num códon de parada Estrutura generalizada de um gene eucariótico 5’-3’ >gi|2170208:c30-1 DNA sequence encoding maltosetetraose producing amylase CACAGCGTTGGGGCTCTTGCCGGCCTGATC 123 3’-5’ >gi|2170208:1-30 DNA sequence encoding maltosetetraose producing amylase GATCAGGCCGGCAAGAGCCCCAACGCTGTG 123 Qualquer seqüência de DNA define sempre 06 diferentes quadros de leitura: Inicio na 1ª, 2ª ou 3ª base, tanto na fita direta quanto reversa Método da similaridade Conceito de similaridade Algoritmo de comparação de seqüências Quando comparamos duas seqüência, o que significa dizer que uma é parecida com a outra? Como podemos quantificar essa noção de similaridade? Um alinhamento entre duas seqüências é um forma de colocar uma sobre a outra, de modo a obter uma correspondência entre cada base de cada uma delas ALINHAMENTO Componentes do alinhamento Referência das colunas Casamento entre as bases (bases iguais) Substituições Indels (inserções ou remoções) Sistema de pontuação Atribuir uma certa pontuação para cada coluna do alinhamento Casamento: +1 Substituições: -1 Espaço: -2 Pontuação do alinhamento = Soma das pontuações das colunas +1 +1 -2 +1+1 -1 +1 -2 +1+1+1 -2 +1+1 = 3 SIMILARIDADE Diferentes alinhamentos terão diferentes pontuações A similaridade entre duas seqüências é dada pelo alinhamento que tem maior pontuação entre todos os alinhamentos possíveis Como encontrar o alinhamento de maior pontuação? Algoritmo BLAST – Basic Local Alignment Search Tool Mais rápido, mas menos preciso Não nos dá a garantia de que vai encontrar o alinhamento de pontuação máxima (Situação rara) Geralmente usado em associação com o banco de seqüências do National Center for Biotechnology Information (NCBI) Como aplicar o BLAST? (Aula prática amanhã) 1) Consulta (query) : Seqüência desconhecida que se quer pesquisar 2) Hits em seqüência sujeito (subject): Resultado da execução do BLAST, pertencente ao banco Resultados acompanhados de: pontuação dos alinhamentos – Score Significância estatística dessa pontuação – e-value E-value: crucial para distinguir alinhamentos biologicamente significativos daqueles que são apenas frutos do acaso. Quanto menor o e-value, mais significativo o alinhamento Resultado gráfico dos alinhamentos produzidos pelo BLAST Query Subject Hits encontrados no banco: Cores indicam a pontuação da alinhamento Próximo passo: Verificar quais os hits encontrados Identificador dos hits Início da descrição de cada hit Pontuação do alinhamento Significância estatística Alinhamentos propriamente ditos Informações detalhadas sobre um dos alinhamentos Comprimento do gene Nº de colunas Casamentos Pontuações positivas (BLASTX) Além de nos informar que a nossa seqüência S muito provavelmente contém um gene, os resultados do BLAST no permitem estimar onde começa a sua porção codificante Sítio de ligação ribossomal Códon de início da tradução Códon de parada Região codificante ORF A realização desta análise de detecção do início da porção codificante, de forma automática, para todos os genes de um genoma é uma típica tarefa de bioinformática Tipos de BLAST Proteínas hipotéticas conservadas Hits sem função determinada, no momento da anotação Porém genes significativamente parecidos e sem função conhecida foram detectados em outros organismos No futuro quando algum destes genes tiver sua função conhecida, pode-se formular uma hipótese de que todos aqueles significativamente similares tenham a mesma função Resultados biológicos conseguidos por meio de ferramentas de bioinformática HIPÓTESE Requer confirmação ou refutação experimental
Compartilhar