Inteligência Artificial em Fármacos

•

USP-SP

0

valdecir

30/04/2024

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 43 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 43 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 43 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Farmácia

27.414 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Inteligência Artificial e o desenvolvimento de fármacos
Medalhista Olímpico em mais de 25 Olimpíadas (2013-2015)
Química Unicamp (2016-2016)
Vice-presidência da Farmácia Acadêmica Social (FAS) (2020)
Membro do CA e FEBRAF (2019-2020)
Medalhista de Ouro – iGEM (2020-2021)
Iniciação Científica – LAPEN (2021-2023) (Autor de capitulo de livro + 4 artigos submetidos)
Farmácia e Bioquímica - FCF-USP – fev/2017-Jun/2023
Inicio do Ph.D. na University of Arizona, em Pharmaceutical Sciences (Agosto/2023)
Colaboração UNC e USP
UNC - School of Pharmacy
Uma das melhores escolas de farmácia do mundo
Laboratório de modelagem molecular(MML)
Antiviral, toxicity issues, mixtures, methodologies
QSAR, knowledge Graphs, Neural networks, Data mining
https://molecularmodelinglab.github.io/
Fotos da UNC
Sumário
Aplicação – Doença de Chagas
03
02
01
Inteligência artificial - desenvolvimento de fármacos - QSAR
Inteligência artificial - geral
04 Outras técnicas - Knowledge Graphs
05 Considerações finais
06 Questões
?

O que é inteligência artificial? O que vocês sabem sobre o tema?
Inteligência artificial - Cotidiano
Assistentes de Voz (siri, google)
Plataformas de streaming ( séries, músicas ) - recomendações
Chatbots - perguntas frequentes - CHATGPT
Reconhecimento facial
Carros autônomos
Inteligência artificial - saúde
Mak and Pichika, 2019
AI, machine learning and deep learning
The incorporation of AI into the healthcare industry is concisely shown in Fig. 1. AI is described as the use of techniques that enable computers to mimic human behaviour (Fig. 1). AI also contains a subfield called machine learning (ML), which uses statistical methods with the ability to learn with or without being explicitly programmed 1, 2, 3. ML is categorised into supervised, unsupervised and reinforcement learning. Supervised learning comprises classification and regression methods where the predictive model is developed based upon the data from input and output sources. Output from supervised ML entails disease diagnosis under the subgroup classification; and drug efficacy and ADMET prediction under the subgroup regression [4]. Unsupervised learning comprises clustering and feature-finding methods by grouping and interpreting data based solely on input data [5]. Through unsupervised ML, outputs such as disease subtype discovery from clustering and disease target discovery from feature-finding methods can be attained [6]. Reinforcement learning is largely driven by decision making in a given environment and its execution to maximise its performance. The outputs from this type of ML include de novo drug design under decision making and experimental designs under execution – where both can be achieved via modelling and quantum chemistry [7]. A further subfield of ML called deep learning (DL) uses artificial neural networks that adapt and learn from the vast amount of experimental data 3, 8. The big data and associated data mining and algorithm methods could provide us with the capacity to discover new compounds that could potentially be new drugs, uncover or repurpose drugs that could be more potent when used individually or in combination and improve the area of personalised medicine based on genetic markers. The emergence of DL was observed with the increasing amount of data and the continuous growth of computer power. The striking difference that makes DL a subfield of AI is the flexibility in the architecture of neural networks such as convolutional neural network (CNNs), recurrent neural networks (RNNs) and fully connected feed-forward networks [7]. It is believed, with proper establishment of methods in AI, we will witness the transition into an era of minimised failures in clinical trials and a faster, cheaper and effective drug development processes 9, 10, 11.
Mak and Pichika, 2019
Inteligência artificial - Drug development

Mak and Pichika, 2019
With the rapid introduction of AI in healthcare, especially in the years 2016 and 2017, numerous pharmaceutical companies have made investments in and have joint ventures with AI companies in the hopes of developing better healthcare tools. These include the improvements in diagnostics or biomarkers and the identification of drug targets and designing new drugs [66]. The transition from general medicine to modern AI healthcare focuses on the basis of the data [67]. The analyses of these underlying data coupled with ML or DL are subsequently formulated into algorithms – thereby strongly contributing to progressive modern healthcare that incorporates AI. Thus, numerous partnerships between pharmaceutical industries and AI companies were recently developed on a global scale. For instance, DeepMind Technologies, a subsidiary of Google, collaborated with Royal Free London NHS Foundation Trust to assist in the management of acute kidney injury [68]. A global project that utilises data and AI from NHS patients with rare diseases is UK’s 100 000 Genomes Project; this project is in collaboration with Roche, Berg, Merck and Biogen.
Atomwise is a pioneer in healthcare AI and is the first DL technology for novel small molecule discovery. Known for its extraordinary speed, accuracy and diversity in structural chemistry using DL, Atomwise has assisted in the invention of new potential medicines for 27 disease targets and is working with top institutions such as Harvard University and Stanford University, as well as pharmaceutical companies. Benevolent AI is one of the AI tools currently used in drug development. It utilises the strategy of text mining to analyse the available patents and other genetics and biological information to extrapolate the relationships between those entities to create highly informative graphs consisting of dynamic maps with over one billion relationships. The resulting graphs consisting of highly complex relationships are believed to have the ability to provide information or identify new links or knowledge gaps that can generate new hypotheses. In contrast to human intervention where the element of bias is present, AI adopts the disease-agonistic approach which permits the unbiased views of scientific data that produce unbiased hypotheses.
Exscientia is an AI company that specialises in phenotypic drug discovery. Human analysis of extremely complicated datasets for high-content phenotypic drug discovery is outperformed by AI by a large margin [69]. The ease in rapidly evolving drug designs is achievable through the testing of each newly designed compound and then comparing it with its anticipated performance and other molecules. Another notable AI start-up is Numerate. Numerate focuses on ligand chemistry, ADMET and combinatorial ML with classical approaches, giving emphasis on the transformation of new medicine discovery by filling significant therapeutic gaps through analysing large datasets pertaining to drug development by applying algorithms.
A healthy spread of such partnerships covering various research areas, such as the identification of novel small molecules [32], the discovery of new treatment methods, monitoring the health data via wearable technologies [70],among others, is concisely shown in Fig. 3. These advances are forecasted to serve as contributing factors to the betterment of healthcare services, improvement in terms of efficiency in clinical trials, enhancement in stratified medicine and more [71]. Presently, up to US$3 billion over the course of 15 years will be spent to bring a new drug to market. This trend is unsustainable and a change is inevitable because consumers are not willing to pay more for medicines and for the cost of the failures 72, 73. Thus, a change in the business model is necessary, and AI offers such opportunity. These collaborations demonstrate the importance of AI technology in allowing us to explore a much bigger design space and discover rare molecules that have properties, which is beyond the conventional finds if we relied solely on traditional HTS.
QSAR - Quantitative Structure-Activity Relationship
Conhecem?
QSAR
Computer Aided Drug Design
Data cycle associated with QSAR modeling projects.
Muratov et al.(2020)
QSAR (Quantitative Structure-Activity Relationship), ou Relação Quantitativa Estrutura-Atividade, é uma técnica utilizada na área de química e farmacologia para prever ou entender a atividade biológica ou propriedades de substâncias químicas com base em sua estrutura molecular.
A ideia fundamental por trás do QSAR é que a estrutura molecular de uma substância está diretamente relacionada com suas propriedades e atividades. Isso significa que, se soubermos a estrutura química de uma substância, podemos usar técnicas matemáticas e estatísticas para estabelecer uma relação quantitativa entre a estrutura e a atividade da substância.
Para aplicar o QSAR, primeiro coletamos dados experimentais que relacionam a estrutura de várias substâncias com suas atividades biológicas ou propriedades físico-químicas. Esses dados podem incluir informações sobre a estrutura molecular, como tamanho, forma, grupos funcionais presentes, entre outros descritores moleculares.
Em seguida, usamos técnicas estatísticas, como regressão linear ou modelos de aprendizado de máquina, para encontrar uma equação matemática que relacione os descritores moleculares com a atividade ou propriedade em questão. Essa equação é chamada de modelo QSAR.
O modelo QSAR pode então ser usado para prever a atividade ou propriedade de novas substâncias com base em sua estrutura molecular. Isso é particularmente útil quando não é prático ou viável realizar experimentos para todas as substâncias de interesse. Com o QSAR, podemos economizar tempo e recursos, identificando as substâncias mais promissoras para estudos futuros.
No entanto, é importante ressaltar que o QSAR é uma técnica baseada em correlações estatísticas e, portanto, não substitui a necessidade de experimentos e testes laboratoriais. Além disso, os modelos QSAR são tão bons quanto os dados utilizados para treiná-los, portanto, a qualidade dos resultados depende da qualidade e representatividade dos dados experimentais utilizados.
Em resumo, o QSAR é uma técnica que busca estabelecer relações quantitativas entre a estrutura molecular de substâncias químicas e suas atividades biológicas ou propriedades físico-químicas. É uma ferramenta poderosa para a triagem de substâncias, planejamento de estudos e otimização de atividades em diversas áreas, como química medicinal, toxicologia e design de fármacos.
Notações de texto :
Smiles:O=C(C)Oc1ccccc1C(=O)O
InChiKey : BSY RYMUTXBXSQ-UHFFFAOYSA-N
Representação 3D
Representação 2D
Computadores não são químicos!
G = (V,E)
V – Átomos
E -- ligações
Como que o computador vê os compostos químicos?
Descritores moleculares são o resultado final de um procedimento logico e matemático que transforma informação química codificada dentro de uma representação simbólica de uma molécula em um número útil ou o resultado de algum experimento de padronização.
Como isso é no knime?
Como isso é no knime?
Similaridade Química
QSAR clássico - modelos de regressão linear - pequeno set de moléculas - atividade biológica parecida
Geralmente - motivo molecular e diferentes substituintes em vários lugares
Evolução - regressão linear até modelos mais complexos
Princípio de similaridade de propriedade (SPP)
Similaridade química é sempre avaliada com relação a bioatividade
SAR - inibidores de COX-2
Tendencias modernas de QSAR
Similaridade química
Uso de ferramentas estatísticas
AI - superset - tarefas que demonstram características de inteligência humana
Machine learning - subset de IA analisa tendencias e gera insights
ML - set de técnicas - predizer Ybased propriedades - cada exemplo i tem propriedade Y(i) e um set de k características X(i,j).
Tendências Modernas de QSAR
Distinguir correlação e causalidade
Modelabilidade
A preditividade de modelos de QSAR depende de activity cliffs - propriedade de compostos perto de activity cliffs difícil de predizer
Métodos de Validação
Comum : uso de um set externo - parte dos dados é deixada de lado
Time-split test set - assinalar compostos testados em fases mais depois - test set
Points out - não diferente de QSAR tradicional - predizer mesmas misturas para nova composição
Modelagem multitarefa (Multitask modeling)
Atividades dentro e fora do alvo - necessárias para priorizar compostos
Domínio de aplicabilidade
Espaço de características moleculares que demonstram - treinado
Perceber as predições menos confiáveis - ajuda identificar moléculas adicionais - necessárias para expandir o modelo

Tendências Modernas de QSAR
Dados
a modelagem depende muito do tamanho, qualidade e diversidade de dados
Aumento da tecnologia em robótica e miniaturização
Podemos agora gerar grande quantidade de dados para certos projeto
Interpretabilidade
COMFA - interessante pelo apelo visual
Intrepretação
Determinar quais descritores são mais importantes
Projetar as features mais importantes
Discussão importante : subset de descritores
Métodos de aprendizado de máquina
Atualmente - redes neurais profundas (DNN)
K-nearest neighbors(kNN), partial least squares (PLS), support vector machines (SVM), relevant vector machines (RVM), random forest(RF), Gaussian Processes(GP), boosting
Aplicação - Doença de Chagas
Estruturas químicas
Descritores químicos
Modelos de QSAR /(Knime, python, R)
Propriedade/atividade
Mágica do QSAR
Virtual Screening
Ativos confirmados
Base de dados
Enamine - 36 bi compostos
Inativos confirmados
Aplicação - Doença de Chagas
Chembl - Base de dados
Bioatividade regularmente extraído da literatura de química medicinal - mais de 65000 publicações, e outras bases de dados
Mostrar o Chembl
Doença de Chagas
Curagem
Ver qual tipo de experimento se faz no colaborador
Ver quais tipos de ensaios seriam parecidoscom aqueles a serem realizados
Descritores químicos : Morgan e RD
Remoção de inorgânicos e misturas, conversão estrutural e limpeza, normalização de quimiotípicos específicos, remoção de duplicatas.
Métodos - Random forest - floresta aleatória
Alguns parâmetros ajustáveis
O grau de concordância de predições de diferentes concordâncias de florestas de RF pode ajudar a definir o domínio de aplicabilidade
Random forest model prediction for the CNC in citrus (23-30 g·kg −1 ). | Download Scientific Diagram (researchgate.net)
Screening Virtual
https://arthor.docking.org/index.html / https://sw.docking.org/search.html
33 compostos
Cluster 1
Cluster 10
.
..
10000
10000
.
..
100000
QSAR, confiança >0.85
1687 compostos
10 compostos mais diferentes estruturalmente - pesquisa de preço
Knowledge Graphs
Maclean, 2021
• Uma solução elegante para o problema de dados na indústria farmacêutica, integrando e harmonizando o número de diversas fontes de dados.
• Representar sistemas biológicos como knowledge graphs - tem permitido exploração da teoria de grafos e metodologias de aprendizado de máquina, interessante para sistemas biologicos e abordagens relacionadas a target-based
• A aplicação mais comum consiste nos primeiros estágios da descoberta de fármacos ou reposicionamento, particularmente na identificação de genes patogênicos e alvos de fármacos.
Knowledge Graphs
Maclean, 2021
• Biomedical knowledge graphs resultou em candidatos de reposicionamento interessantes para covid-19, levando a validação clínica e uso sob autorização de emergência.
• O poder preditivo de técnicas de aprendizado de máquina - vem da conectividade, o que demonstra viés nas tarefas de predição.
• Esse viés se exacerba quando treina os knowledge graph derivados da literatura em que o grau de distribuição diverge daquilo relacionado ao sistema biológico vigente.
Knowledge Graphs
Maclean, 2021
https://www.exemplar.mml.unc.edu/
Considerações finais
QSAR e Knowledge Graphs São ferramentas bem utilizadas no processo de reposiconamento e descoberto de novos líderes
Embora não tenham fármacos desenvolvidos por IA, é muito provável que este número aumente nos próximos anos
Efetividade do processo : pessoas que saibma como usar os algoritmos e que dominem um pouco de estatística
IA – analisar grande bases de dados, Químicos medicinais – treinar as máquinas, configurar algoritmos ou otimizar a data analisada para um processo mais acurado
IA importante, mas sempre acoplada com experimentos reais em laboratorio
Ainda, a possibilidade de combinação de terapia gênica e farmacologia se torna real com IA
Reconhecimentos
Professores
Elizabeth Igne Ferreira
Alexander Tropsha
Eugene Muratov
Alunos de Doutorado
Holli-joi Martin
Jon-Michael Beasley
Nyssa Natasha Tucker
Outros
Vinicius Alves
Referências
AL-SALEEM, Jacob et al. Knowledge graph-based approaches to drug repurposing for COVID-19. Journal of chemical information and modeling, v. 61, n. 8, p. 4058-4067, 2021.
MACLEAN, Finlay. Knowledge graphs and their applications in drug discovery. Expert opinion on drug discovery, v. 16, n. 9, p. 1057-1069, 2021.
MAK, Kit-Kay; PICHIKA, Mallikarjuna Rao. Artificial intelligence in drug development: present status and future prospects. Drug discovery today, v. 24, n. 3, p. 773-780, 2019.
MURATOV, Eugene N. et al. QSAR without borders. Chemical Society Reviews, v. 49, n. 11, p. 3525-3564, 2020.
GAULTON, Anna et al. The ChEMBL database in 2017. Nucleic acids research, v. 45, n. D1, p. D945-D954, 2017.
SHIVANYUK, A. N. et al. Enamine real database: Making chemical diversity real. Chemistry today, v. 25, n. 6, p. 58-59, 2007.
Mak and Pichika, 2019
image1.png
image2.png
image3.jpeg
image4.png
image5.png
image6.png
image7.png
image8.png
image9.jpg
image10.jpg
image11.jpg
image12.png
image13.png
image14.png
image15.png
image16.png
image17.png
image18.png
image19.emf
O
O
O
OH
image20.png
image21.png
image22.png
image23.png
image24.png
image25.png
image26.png
image27.png
image28.png
image29.png
image30.png
image31.png
image32.png
image33.png
image34.png
image35.emf
image36.png
image37.png
image38.png
image39.png
image40.png
image41.png
image42.png
image43.png