Baixe o app para aproveitar ainda mais
Prévia do material em texto
Inteligência Artificial e o desenvolvimento de fármacos Medalhista Olímpico em mais de 25 Olimpíadas (2013-2015) Química Unicamp (2016-2016) Vice-presidência da Farmácia Acadêmica Social (FAS) (2020) Membro do CA e FEBRAF (2019-2020) Medalhista de Ouro – iGEM (2020-2021) Iniciação Científica – LAPEN (2021-2023) (Autor de capitulo de livro + 4 artigos submetidos) Farmácia e Bioquímica - FCF-USP – fev/2017-Jun/2023 Inicio do Ph.D. na University of Arizona, em Pharmaceutical Sciences (Agosto/2023) Colaboração UNC e USP UNC - School of Pharmacy Uma das melhores escolas de farmácia do mundo Laboratório de modelagem molecular(MML) Antiviral, toxicity issues, mixtures, methodologies QSAR, knowledge Graphs, Neural networks, Data mining https://molecularmodelinglab.github.io/ Fotos da UNC Sumário Aplicação – Doença de Chagas 03 02 01 Inteligência artificial - desenvolvimento de fármacos - QSAR Inteligência artificial - geral 04 Outras técnicas - Knowledge Graphs 05 Considerações finais 06 Questões ? O que é inteligência artificial? O que vocês sabem sobre o tema? Inteligência artificial - Cotidiano Assistentes de Voz (siri, google) Plataformas de streaming ( séries, músicas ) - recomendações Chatbots - perguntas frequentes - CHATGPT Reconhecimento facial Carros autônomos Inteligência artificial - saúde Mak and Pichika, 2019 AI, machine learning and deep learning The incorporation of AI into the healthcare industry is concisely shown in Fig. 1. AI is described as the use of techniques that enable computers to mimic human behaviour (Fig. 1). AI also contains a subfield called machine learning (ML), which uses statistical methods with the ability to learn with or without being explicitly programmed 1, 2, 3. ML is categorised into supervised, unsupervised and reinforcement learning. Supervised learning comprises classification and regression methods where the predictive model is developed based upon the data from input and output sources. Output from supervised ML entails disease diagnosis under the subgroup classification; and drug efficacy and ADMET prediction under the subgroup regression [4]. Unsupervised learning comprises clustering and feature-finding methods by grouping and interpreting data based solely on input data [5]. Through unsupervised ML, outputs such as disease subtype discovery from clustering and disease target discovery from feature-finding methods can be attained [6]. Reinforcement learning is largely driven by decision making in a given environment and its execution to maximise its performance. The outputs from this type of ML include de novo drug design under decision making and experimental designs under execution – where both can be achieved via modelling and quantum chemistry [7]. A further subfield of ML called deep learning (DL) uses artificial neural networks that adapt and learn from the vast amount of experimental data 3, 8. The big data and associated data mining and algorithm methods could provide us with the capacity to discover new compounds that could potentially be new drugs, uncover or repurpose drugs that could be more potent when used individually or in combination and improve the area of personalised medicine based on genetic markers. The emergence of DL was observed with the increasing amount of data and the continuous growth of computer power. The striking difference that makes DL a subfield of AI is the flexibility in the architecture of neural networks such as convolutional neural network (CNNs), recurrent neural networks (RNNs) and fully connected feed-forward networks [7]. It is believed, with proper establishment of methods in AI, we will witness the transition into an era of minimised failures in clinical trials and a faster, cheaper and effective drug development processes 9, 10, 11. Mak and Pichika, 2019 Inteligência artificial - Drug development Mak and Pichika, 2019 With the rapid introduction of AI in healthcare, especially in the years 2016 and 2017, numerous pharmaceutical companies have made investments in and have joint ventures with AI companies in the hopes of developing better healthcare tools. These include the improvements in diagnostics or biomarkers and the identification of drug targets and designing new drugs [66]. The transition from general medicine to modern AI healthcare focuses on the basis of the data [67]. The analyses of these underlying data coupled with ML or DL are subsequently formulated into algorithms – thereby strongly contributing to progressive modern healthcare that incorporates AI. Thus, numerous partnerships between pharmaceutical industries and AI companies were recently developed on a global scale. For instance, DeepMind Technologies, a subsidiary of Google, collaborated with Royal Free London NHS Foundation Trust to assist in the management of acute kidney injury [68]. A global project that utilises data and AI from NHS patients with rare diseases is UK’s 100 000 Genomes Project; this project is in collaboration with Roche, Berg, Merck and Biogen. Atomwise is a pioneer in healthcare AI and is the first DL technology for novel small molecule discovery. Known for its extraordinary speed, accuracy and diversity in structural chemistry using DL, Atomwise has assisted in the invention of new potential medicines for 27 disease targets and is working with top institutions such as Harvard University and Stanford University, as well as pharmaceutical companies. Benevolent AI is one of the AI tools currently used in drug development. It utilises the strategy of text mining to analyse the available patents and other genetics and biological information to extrapolate the relationships between those entities to create highly informative graphs consisting of dynamic maps with over one billion relationships. The resulting graphs consisting of highly complex relationships are believed to have the ability to provide information or identify new links or knowledge gaps that can generate new hypotheses. In contrast to human intervention where the element of bias is present, AI adopts the disease-agonistic approach which permits the unbiased views of scientific data that produce unbiased hypotheses. Exscientia is an AI company that specialises in phenotypic drug discovery. Human analysis of extremely complicated datasets for high-content phenotypic drug discovery is outperformed by AI by a large margin [69]. The ease in rapidly evolving drug designs is achievable through the testing of each newly designed compound and then comparing it with its anticipated performance and other molecules. Another notable AI start-up is Numerate. Numerate focuses on ligand chemistry, ADMET and combinatorial ML with classical approaches, giving emphasis on the transformation of new medicine discovery by filling significant therapeutic gaps through analysing large datasets pertaining to drug development by applying algorithms. A healthy spread of such partnerships covering various research areas, such as the identification of novel small molecules [32], the discovery of new treatment methods, monitoring the health data via wearable technologies [70],among others, is concisely shown in Fig. 3. These advances are forecasted to serve as contributing factors to the betterment of healthcare services, improvement in terms of efficiency in clinical trials, enhancement in stratified medicine and more [71]. Presently, up to US$3 billion over the course of 15 years will be spent to bring a new drug to market. This trend is unsustainable and a change is inevitable because consumers are not willing to pay more for medicines and for the cost of the failures 72, 73. Thus, a change in the business model is necessary, and AI offers such opportunity. These collaborations demonstrate the importance of AI technology in allowing us to explore a much bigger design space and discover rare molecules that have properties, which is beyond the conventional finds if we relied solely on traditional HTS. QSAR - Quantitative Structure-Activity Relationship Conhecem? QSAR Computer Aided Drug Design Data cycle associated with QSAR modeling projects. Muratov et al.(2020) QSAR (Quantitative Structure-Activity Relationship), ou Relação Quantitativa Estrutura-Atividade, é uma técnica utilizada na área de química e farmacologia para prever ou entender a atividade biológica ou propriedades de substâncias químicas com base em sua estrutura molecular. A ideia fundamental por trás do QSAR é que a estrutura molecular de uma substância está diretamente relacionada com suas propriedades e atividades. Isso significa que, se soubermos a estrutura química de uma substância, podemos usar técnicas matemáticas e estatísticas para estabelecer uma relação quantitativa entre a estrutura e a atividade da substância. Para aplicar o QSAR, primeiro coletamos dados experimentais que relacionam a estrutura de várias substâncias com suas atividades biológicas ou propriedades físico-químicas. Esses dados podem incluir informações sobre a estrutura molecular, como tamanho, forma, grupos funcionais presentes, entre outros descritores moleculares. Em seguida, usamos técnicas estatísticas, como regressão linear ou modelos de aprendizado de máquina, para encontrar uma equação matemática que relacione os descritores moleculares com a atividade ou propriedade em questão. Essa equação é chamada de modelo QSAR. O modelo QSAR pode então ser usado para prever a atividade ou propriedade de novas substâncias com base em sua estrutura molecular. Isso é particularmente útil quando não é prático ou viável realizar experimentos para todas as substâncias de interesse. Com o QSAR, podemos economizar tempo e recursos, identificando as substâncias mais promissoras para estudos futuros. No entanto, é importante ressaltar que o QSAR é uma técnica baseada em correlações estatísticas e, portanto, não substitui a necessidade de experimentos e testes laboratoriais. Além disso, os modelos QSAR são tão bons quanto os dados utilizados para treiná-los, portanto, a qualidade dos resultados depende da qualidade e representatividade dos dados experimentais utilizados. Em resumo, o QSAR é uma técnica que busca estabelecer relações quantitativas entre a estrutura molecular de substâncias químicas e suas atividades biológicas ou propriedades físico-químicas. É uma ferramenta poderosa para a triagem de substâncias, planejamento de estudos e otimização de atividades em diversas áreas, como química medicinal, toxicologia e design de fármacos. Notações de texto : Smiles:O=C(C)Oc1ccccc1C(=O)O InChiKey : BSY RYMUTXBXSQ-UHFFFAOYSA-N Representação 3D Representação 2D Computadores não são químicos! G = (V,E) V – Átomos E -- ligações Como que o computador vê os compostos químicos? Descritores moleculares são o resultado final de um procedimento logico e matemático que transforma informação química codificada dentro de uma representação simbólica de uma molécula em um número útil ou o resultado de algum experimento de padronização. Como isso é no knime? Como isso é no knime? Similaridade Química QSAR clássico - modelos de regressão linear - pequeno set de moléculas - atividade biológica parecida Geralmente - motivo molecular e diferentes substituintes em vários lugares Evolução - regressão linear até modelos mais complexos Princípio de similaridade de propriedade (SPP) Similaridade química é sempre avaliada com relação a bioatividade SAR - inibidores de COX-2 Tendencias modernas de QSAR Similaridade química Uso de ferramentas estatísticas AI - superset - tarefas que demonstram características de inteligência humana Machine learning - subset de IA analisa tendencias e gera insights ML - set de técnicas - predizer Ybased propriedades - cada exemplo i tem propriedade Y(i) e um set de k características X(i,j). Tendências Modernas de QSAR Distinguir correlação e causalidade Modelabilidade A preditividade de modelos de QSAR depende de activity cliffs - propriedade de compostos perto de activity cliffs difícil de predizer Métodos de Validação Comum : uso de um set externo - parte dos dados é deixada de lado Time-split test set - assinalar compostos testados em fases mais depois - test set Points out - não diferente de QSAR tradicional - predizer mesmas misturas para nova composição Modelagem multitarefa (Multitask modeling) Atividades dentro e fora do alvo - necessárias para priorizar compostos Domínio de aplicabilidade Espaço de características moleculares que demonstram - treinado Perceber as predições menos confiáveis - ajuda identificar moléculas adicionais - necessárias para expandir o modelo Tendências Modernas de QSAR Dados a modelagem depende muito do tamanho, qualidade e diversidade de dados Aumento da tecnologia em robótica e miniaturização Podemos agora gerar grande quantidade de dados para certos projeto Interpretabilidade COMFA - interessante pelo apelo visual Intrepretação Determinar quais descritores são mais importantes Projetar as features mais importantes Discussão importante : subset de descritores Métodos de aprendizado de máquina Atualmente - redes neurais profundas (DNN) K-nearest neighbors(kNN), partial least squares (PLS), support vector machines (SVM), relevant vector machines (RVM), random forest(RF), Gaussian Processes(GP), boosting Aplicação - Doença de Chagas Estruturas químicas Descritores químicos Modelos de QSAR /(Knime, python, R) Propriedade/atividade Mágica do QSAR Virtual Screening Ativos confirmados Base de dados Enamine - 36 bi compostos Inativos confirmados Aplicação - Doença de Chagas Chembl - Base de dados Bioatividade regularmente extraído da literatura de química medicinal - mais de 65000 publicações, e outras bases de dados Mostrar o Chembl Doença de Chagas Curagem Ver qual tipo de experimento se faz no colaborador Ver quais tipos de ensaios seriam parecidoscom aqueles a serem realizados Descritores químicos : Morgan e RD Remoção de inorgânicos e misturas, conversão estrutural e limpeza, normalização de quimiotípicos específicos, remoção de duplicatas. Métodos - Random forest - floresta aleatória Alguns parâmetros ajustáveis O grau de concordância de predições de diferentes concordâncias de florestas de RF pode ajudar a definir o domínio de aplicabilidade Random forest model prediction for the CNC in citrus (23-30 g·kg −1 ). | Download Scientific Diagram (researchgate.net) Screening Virtual https://arthor.docking.org/index.html / https://sw.docking.org/search.html 33 compostos Cluster 1 Cluster 10 . .. 10000 10000 . .. 100000 QSAR, confiança >0.85 1687 compostos 10 compostos mais diferentes estruturalmente - pesquisa de preço Knowledge Graphs Maclean, 2021 • Uma solução elegante para o problema de dados na indústria farmacêutica, integrando e harmonizando o número de diversas fontes de dados. • Representar sistemas biológicos como knowledge graphs - tem permitido exploração da teoria de grafos e metodologias de aprendizado de máquina, interessante para sistemas biologicos e abordagens relacionadas a target-based • A aplicação mais comum consiste nos primeiros estágios da descoberta de fármacos ou reposicionamento, particularmente na identificação de genes patogênicos e alvos de fármacos. Knowledge Graphs Maclean, 2021 • Biomedical knowledge graphs resultou em candidatos de reposicionamento interessantes para covid-19, levando a validação clínica e uso sob autorização de emergência. • O poder preditivo de técnicas de aprendizado de máquina - vem da conectividade, o que demonstra viés nas tarefas de predição. • Esse viés se exacerba quando treina os knowledge graph derivados da literatura em que o grau de distribuição diverge daquilo relacionado ao sistema biológico vigente. Knowledge Graphs Maclean, 2021 https://www.exemplar.mml.unc.edu/ Considerações finais QSAR e Knowledge Graphs São ferramentas bem utilizadas no processo de reposiconamento e descoberto de novos líderes Embora não tenham fármacos desenvolvidos por IA, é muito provável que este número aumente nos próximos anos Efetividade do processo : pessoas que saibma como usar os algoritmos e que dominem um pouco de estatística IA – analisar grande bases de dados, Químicos medicinais – treinar as máquinas, configurar algoritmos ou otimizar a data analisada para um processo mais acurado IA importante, mas sempre acoplada com experimentos reais em laboratorio Ainda, a possibilidade de combinação de terapia gênica e farmacologia se torna real com IA Reconhecimentos Professores Elizabeth Igne Ferreira Alexander Tropsha Eugene Muratov Alunos de Doutorado Holli-joi Martin Jon-Michael Beasley Nyssa Natasha Tucker Outros Vinicius Alves Referências AL-SALEEM, Jacob et al. Knowledge graph-based approaches to drug repurposing for COVID-19. Journal of chemical information and modeling, v. 61, n. 8, p. 4058-4067, 2021. MACLEAN, Finlay. Knowledge graphs and their applications in drug discovery. Expert opinion on drug discovery, v. 16, n. 9, p. 1057-1069, 2021. MAK, Kit-Kay; PICHIKA, Mallikarjuna Rao. Artificial intelligence in drug development: present status and future prospects. Drug discovery today, v. 24, n. 3, p. 773-780, 2019. MURATOV, Eugene N. et al. QSAR without borders. Chemical Society Reviews, v. 49, n. 11, p. 3525-3564, 2020. GAULTON, Anna et al. The ChEMBL database in 2017. Nucleic acids research, v. 45, n. D1, p. D945-D954, 2017. SHIVANYUK, A. N. et al. Enamine real database: Making chemical diversity real. Chemistry today, v. 25, n. 6, p. 58-59, 2007. Mak and Pichika, 2019 image1.png image2.png image3.jpeg image4.png image5.png image6.png image7.png image8.png image9.jpg image10.jpg image11.jpg image12.png image13.png image14.png image15.png image16.png image17.png image18.png image19.emf O O O OH image20.png image21.png image22.png image23.png image24.png image25.png image26.png image27.png image28.png image29.png image30.png image31.png image32.png image33.png image34.png image35.emf image36.png image37.png image38.png image39.png image40.png image41.png image42.png image43.png
Compartilhar