Baixe o app para aproveitar ainda mais
Prévia do material em texto
Bioinformática Jamisson Freitas 2018 Apresentação • MSc. in Computer Engineering (Poli/UPE, 2015) • BSc. in Computing (Deinfo/UFRPE, 2015) • BSc. in Computer Engineering (Poli/UPE, 2012) • Machine Learning Engineer (Accenture, 2017-) • Bioinformatics Research (Genomika/FACEPE, 2015-2017) • Bioinformatics Consult (Genomika, 2017) • Software Engineer (FaTec, 2013 - 2015) • Professor of Artificial Intelligence since 2016 Bioinformática Jamisson Freitas O que é bioinformática? Bioinformática ● Campo interdisciplinar ○ Aplicação das técnicas da informática, no sentido de análise de informações na área de estudo da biologia. Bioinformática ● Combina para analisar e interpretar dados biológicos: ○ Ciência da computação ○ Estatística/ Matemática ○ Biologia/ Química ○ Física/ Engenharia Bioinformática Uso de métodos computacionais para direcionar os caminhos para experimentos biológicos Permitir análise em grande escala Novas descobertas científicas Bioinformática ● Exemplos de áreas de estudo: ○ Produção de biocombustível a baixo custo ○ Métodos para contenção de bioterrorismo: ■ Antrax ■ Ricina ○ Compreensão de doenças e cânceres ○ Medicina personalizada Era da conectividade Avalanche de dados... Avalanche de dados... O que está causando esta avalanche? O que está causando esta avalanche? Dogma central da biologia O que são as proteínas? ● São moléculas orgânicas compostas de aminoácidos responsáveis pelo crescimento e pela reparação de tecidos. Importância das proteínas ● Ajudam na produção de enzimas, hormônios, neurotransmissores e anticorpos, na reposição do gasto energético das células e no transporte de substâncias para o corpo. Também atuam no metabolismo celular e na contração muscular. Quantos tipos de proteínas existem? ● O Protein Data Bank (PDB) estima mais de 100K. Como o organismo encontra a proteína certa para cada função? Aminoácidos ● O corpo quebra as proteínas em aminoácidos ● As células usam os aminoácidos e criam as proteínas desejadas ● 20 tipos de aminoácidos DNA ● Cada célula contém um “livro de receitas” (DNA) que indica como as proteínas desejadas são produzidas. Abstraindo o dogma central da biologia ● DNA → O grande livro de receitas ○ É transcrito numa molécula menor (região do gene) em RNA ● RNA → Cópia de uma receita ○ É traduzido pelos ribossomos ● Proteína → o que foi produzido Proteína ● Estima-se que exista no corpo humano algo em torno de 2 milhões de proteínas ● São sequências de aminoácidos ● Uma proteína é formada por no mínimo 50 moléculas de aminoácidos ● As maiores proteínas no corpo humano chegam a ter mais de 30.000 aminoácidos Proteína como uma cadeia de aminoácidos Genoma humano 2003 → Depois de uma década o genoma humano é publicado Esforços internacionais de diversos laboratórios trabalhando em conjunto Nova era na genética ● Equipamento mais poderosos ● Maior precisão e volume de dados tratados NextGen Sequencing (NGS) NextGen Sequencing (NGS) Sequenciamento de DNA ● Leitura de um fragmento de DNA ● Determinação das sequências de nucleotídeos (A, T, C ou G) ● Através dele é possível determinar o código genético de um organismo Tamanho de Genomas ● Vírus → ~50.000 pb (pares de bases) ● Bactéria → 2.000.000 pb ● Genoma Humano → 3.000.000.000 pb ● Salamantra → 90.000.000.000 pb ● Planta → 150.000.000.000 pb ● Ameba → 670.000.000.000 pb Desafios da bioinformática ● Montagem dos genomas ○ Novos equipamentos de sequenciamento ○ Limitações de tamanho de leitura ■ “Quebra” o genoma em “pedaços” de leitura e depois precisa montar o quebra cabeça ● Soluções in silico (simulações computacionais) Aplicações NGS ● Doenças hereditárias: ○ Mendelianas ■ Mutações ou alterações em um único gene ○ Complexas ■ Muitos genes e variantes envolvidos Aplicações NGS ● Mutações somáticas ○ Estão na origem de certos cânceres ○ Não são transmitidas à descendência Genética Clínica Genética Clínica - Processo Genoma Humano em um arquivo Genoma Humano em um arquivo Variantes genéticas Bases de dados genéticos Bases de dados genéticos ● Dificuldades: ○ Variedades de acesso ○ Variedade de estruturas (representações) ○ Falta de padronização ○ Ausência de controle de versões ○ Bases públicas e privadas Análise de Variantes Genéticas Análise de Variantes Genéticas ● Dificuldades: ○ Uso extensivo de planilhas; ○ Compartilhamento de dados sensíveis; ○ Visualização de informação (arquivos podem chegar até 30 mil variantes com diversos atributos); ○ Reanálise dos dados (laudos negativos podem ser reavaliados); ○ Suporte para múltiplas anotações. Bioinformática - Oportunidades ● Áreas envolvidas: ○ Big Data ○ Data Mining ○ Machine Learning ○ IHC ○ Segurança da informação Bioinformática x Data Science Futuro Futuro Obrigado! Obrigado! profjamissonfreitas@gmail.com Referências ● O que é Bioinformática? https://www.youtube.com/watch?v=R-HcjHDLbRE ● BIOLOGIA SINTÉTICA - BIOINFORMÁTICA & BIOLOGIA COMPUTACIONAL https://www.youtube.com/watch?v=ubHUuwK2iiw https://www.youtube.com/watch?v=R-HcjHDLbRE https://www.youtube.com/watch?v=ubHUuwK2iiw
Compartilhar