Prévia do material em texto
TRABALHO DE CONCLUSÃO DE CURSO EM CIÊNCIA DE DADOS UNIVERSIDADE VIRTUAL DO ESTADO DE SÃO PAULO POLO JACAREÍ – SP UNIVESP – 2023 A REVOLUÇÃO DOS GRANDES MODELOS DE LINGUAGEM: Benefícios, desafios e riscos no avanço da inteligência artificial para área da saúde Vídeo de apresentação https://youtu.be/i2WHcfKJBHE https://youtu.be/i2WHcfKJBHE 2 A REVOLUÇÃO DOS GRANDES MODELOS DE LINGUAGEM: Benefícios, desafios e riscos no avanço da inteligência artificial para área da saúde Fabrício Siqueira Faria1 Isabela Felix Moreira Neves1 Douglas de Souza Petri1 Caio Porto Schiavon1 German Alejandro Enriquez Barriga1 Eduardo Fernandes Fileno1 Matheus Olegário Vieira Couto1 Resumo: Em um momento de constante evolução na inteligência artificial, large language models (LLMs) tem se destacado como um tópico de crescente interesse e investigação. O presente trabalho tem como proposta trazer uma discussão abrangente sobre os LLMs aplicados a área da saúde destacando seus benefícios, desafios e riscos para o setor. Como metodologia, foi realizada uma pesquisa bibliográfica com abordagem qualitativa e método teórico- conceitual, buscando na literatura os impactos positivos e negativos dessas tecnologias com a área em estudo. Na saúde, os LLMs vêm sendo aplicados de forma eficaz em diagnósticos, educação médica, descoberta de fármacos, entre outros, com potencial de tornar os sistemas de saúde mais eficientes e personalizados. Porém, apresentam desafios técnicos, éticos e regulatórios a serem enfrentados. A interpretação de dados clínicos e a aceitação pelos profissionais de saúde são barreiras a serem superadas. Além do mais, a segurança dos dados de pacientes e aspectos éticos relacionados ao uso de informações sensíveis também são questões críticas. Contudo, Os LLMs têm o potencial de trazer muitos benefícios para a área, no entanto em sua implementação é essencial a colaboração de todos os atores envolvidos para maior confiabilidade, segurança e mitigação de riscos para usuários. Palavras-chave: Inteligência artificial, Grandes modelos de linguagem, Saúde. Abstract: At a time of constant evolution in artificial intelligence, large language models (LLMs) have stood out as a topic of growing interest and investigation. This work aims to bring a comprehensive discussion about LLMs applied to the health sector, highlighting their benefits, challenges and risks for the sector. As a methodology, bibliographical research was carried out with a qualitative approach and theoretical-conceptual method, searching in the literature for the positive and negative impacts of these technologies on the area under study. In healthcare, LLMs have been effectively applied in diagnostics, medical education, drug discovery, among others, with the potential to make healthcare systems more efficient and personalized. However, they present technical, ethical and regulatory challenges to be faced. The interpretation of clinical data and acceptance by healthcare professionals are barriers to be overcome. Furthermore, the security of patient data and ethical aspects related to the use of sensitive information are also critical issues. However, LLMs have the potential to bring many benefits to the area, nonetheless in their implementation the collaboration of all actors involved is essential for greater reliability, security and risk mitigation for users Keywords: Artificial intelligence, Large language models, Health. 1 UNIVESP | Universidade Virtual do Estado de São Paulo. Bacharelado em Ciência de Dados | Jacareí – 2023. 3 1 INTRODUÇÃO A inteligência artificial (IA) tem avançado de forma expressiva nos últimos anos, impulsionada por grandes progressos em algoritmos, poder computacional e, geração e processamento de imensos volumes de dados. Conceitualmente, a IA remonta aos anos 1950, com os primeiros programas que simulavam comportamentos inteligentes (RUSSELL; NORVIG, 2021). Com os recentes avanços em técnicas de machine learning e deep learning, através das redes neurais profundas, foi possível a criação de sistemas de IA cada vez mais complexos como os modelos de linguagem em larga escala. Esses modelos revolucionaram o campo, permitindo geração de texto, chatbots, agentes inteligentes, entre diversas outras aplicações (KADDOUR et al., 2023). Os modelos de linguagem podem ser considerados como um conjunto de algoritmos probabilísticos de processamento de linguagem natural (PLN), treinados para prever a(s) palavra(s) futura(s) em uma sequência, dada as anteriores (BANERJEE; HAN, 2009). A partir deste, tem-se os grandes modelos de linguagens, large language models (LLMs), os quais são modelos generativos massivos treinados em enormes conjuntos de dados textuais não estruturados. Os LLMs utilizam-se de redes neurais profundas para extrair padrões complexos da linguagem humana e gerar textos coerentes de forma autônoma (BENDER et al., 2021). Exemplos clássicos são GPT-3 (BROWN et al., 2020), BERT (DEVLIN et al., 2019) e T5 (RAFFEL et al., 2020). Os grandes modelos representam hoje a fronteira da pesquisa em processamento de linguagem natural (PLN) e seu impacto tem sido cada vez maior em diversas áreas como saúde, educação, engenharia, entre outras. O surgimento dos LLMs foi possível e impulsionado pelos avanços significativos em aprendizado profundo, como os mecanismos de atenção (BAHDANAU et al., 2016), abrindo caminho para a criação da arquitetura Transformer introduzidas pelo time Google Brain em 2017, o qual permitiu superar as limitações das arquiteturas de redes neurais recorrentes LSTM (HOCHREITER et al., 1997) e GRU (CHO, 2014), consolidadas em tarefas sequenciais em PLN (VASWANI et al., 2023). A arquitetura Transformer utiliza camadas de auto-atenção, possibilitando capturar dependências distantes em sequências longas de maneira mais eficiente do que as redes recorrentes tradicionais (JAIN, 2022). Essa evolução viabilizou o treinamento de modelos 4 maiores e mais poderosos apoiando-se fortemente nessa arquitetura para alcançar capacidades de processamento de linguagem natural antes inimagináveis. A construção de LLMs estado da arte envolve desafios técnicos em seu treinamento (HOFFMANN et al., 2022). No geral, essa etapa se divide em duas fases distintas: pré- treinamento e o ajuste-fino. Na fase de pré-treinamento são requeridos e pré-processados conjuntos de dados textuais massivos, induzindo no modelo a compreensão semântica da linguagem e os relacionamentos contextuais entre palavras. Já na fase de ajuste-fino, um LLM pode ser refinado partindo do modelo pré-treinado, otimizando seus parâmetros para obter maior precisão em um conjunto de dados menor, para cada tarefa específica, demonstrando adaptação eficaz a diversas aplicações (OZDEMIR, 2023). Outras formas de ajuste e alinhamento do modelo podem utilizar técnicas de aprendizado por reforço com feedback humano denominado reinforcement learning from human feedback (RLHF), método que vem apresentando bons resultados em modelos de linguagem grandes (OUYANG, 2022). Além do RLHF, pesquisas apontam outros métodos promissores de alinhamento com feedback de IA denominado Constitutional AI (CAI) (BAI, 2022). Modelos como o GPT-4 (OPENAI, 2023) durante seu treinamento, demandaram equipes especializadas, hardwares dedicados, levando a custos da ordem de milhões de dólares. Os progressos dos modelos de linguagem massivos estão revolucionando diversas áreas com suas capacidades notáveis. O impacto dessa tecnologia pode ser percebido em segmentos como educação, cultura, direito, comercio, saúde, entre outras. Estudos apontam que o emprego desses grandes modelos tem se ramificadopara muitos setores, surgindo aplicações customizadas a todo momento (KADDOUR et al., 2023). Aplicações e pesquisas recentes têm surgido em áreas específicas como telecomunicações (MAATOUK, 2023), engenharia de software (ZHENG, 2023), e-commerce (FAN, 2023), finanças (WU, 2023) e ciência (TAYLOR, 2022). No ramo da saúde, essa tecnologia tem demonstrado crescente potencial para área, especialmente como: educação médica, tomada de decisões em imagens radiológicas, genética clínica e cuidados com pacientes (HADI, 2023). O emprego de grandes modelos de linguagem na saúde tem se mostrado de grande relevância, no entanto, também surgem questões éticas relacionadas (LI et al., 2023.), como exemplo à segurança de dados e regulatórias (PENTEADO et al., 2023) que precisam ser consideradas (TIAN et al., 2023). Compreender esses questionamentos é essencial para que o desenvolvimento ocorra de forma responsável para o bem-estar da sociedade. 5 O presente trabalho traz uma análise qualitativa sobre o avanço dos grandes modelos de linguagem, contextualizando seu histórico de evolução, aplicações, desafios e riscos do emprego dessas tecnologias aplicadas à área da saúde. A motivação do estudo é a necessidade de compreender mais a fundo os benefícios que tais avanços tem trazido para a área, desde a eficiência de diagnóstico até a personalização de cuidados médicos. Ao mesmo tempo, considerando os desafios inerentes, como a interpretação precisa das informações clínicas e as implicações éticas e de segurança que acompanham a utilização desses modelos. 2 O AVANÇO DA INTELIGÊNCIA ARTIFICIAL PARA A ÁREA DA SAÚDE Conforme a demanda por atendimento médico cresce e a necessidade de melhorar a eficiência dos sistemas de saúde se torna evidente, a tecnologia desempenha um papel significativo no apoio aos profissionais de saúde (BORKOWSKI et al., 2023). Um exemplo notável é o ChatGPT, desenvolvido pela OpenAI, que tem despertado interesse na comunidade médica devido à sua capacidade de sucesso no Exame de Licenciamento Médico dos Estados Unidos (KUNG et al., 2023). Segundo Chen et al (2020), existem 4 eras que subdividem a área da saúde, enumeradas de 1.0 até 4.0. Na era 1.0, compreendida no século XIX, marca a adoção de políticas de vacinação e saneamento para prevenção de doenças. Na era 2.0, início do século XX, tem-se a implementação da produção em larga escala de antibióticos, devido às novas tecnologias de produção industrial. Com a era 3.0, já no início da década de 80, a internet apareceu para auxiliar pesquisas e novas tecnologias que permitiram outras formas de abordagens e tratamentos na saúde. Atualmente, na era 4.0, Chen et al (2020) destaca a chamada era da saúde inteligente, com as facilidades que o avanço tecnológico permite. Com a imensa gama de dados de doenças e tratamentos já disponíveis aos pesquisadores para desenvolverem novos métodos, algoritmos avançados auxiliam no diagnóstico em tempo real de doenças e definem o tratamento mais efetivo a cada biotipo do paciente. A tecnologia já permite, por exemplo, analisar o DNA de uma pessoa para avaliar predisposições a determinadas doenças e definir uma abordagem preventiva. O avanço dos modelos de linguagens trouxe muitos impactos positivos para a área médica, além da agilidade para identificar padrões de determinadas doenças, corroborando para uma tomada de decisão mais assertiva dos profissionais da saúde (KHOSRAVI et al., 2019). Outro benefício é a possibilidade de automação da rotina hospitalar, elaborando e analisando 6 os prontuários médicos, definindo uma ordem de prioridades para os enfermos, e otimizando o trabalho da equipe. O impacto dessa otimização é fundamental para evitar casos de erros médicos e, de acordo com Sittig et al. (2019), essa automação evita a sobrecarga da equipe, alerta sobre possíveis alergias do paciente, evitando assim complicações desnecessárias durante o tratamento. Dentre os benefícios potenciais, destaca-se a possibilidade de reduzir a exaustão dos profissionais de saúde, aliviando tarefas administrativas como faturamento, codificação e organização de agendas (BORKOWSKI et al., 2023). O emprego de ferramentas que utilizam LLMs também demonstra capacidade no auxílio ao diagnóstico, baseado em vastos dados clínicos, bem como na interpretação de resultados de exames e sugestão de diagnósticos diferenciais. Além disso, esses modelos têm potencial para identificar oportunidades em ensaios clínicos e aprimorar a qualidade dos tratamentos (BORKOWSKI et al., 2023). Profissionais especializados, como radiologistas, podem se beneficiar da integração de diagnósticos por visão computacional com a criação de relatórios do ChatGPT, aprimorando a precisão diagnóstica (BORKOWSKI et al., 2023). Também é ressaltado o potencial da ferramenta em agilizar o atendimento de urgência, auxiliando na triagem de pacientes em situações críticas (BORKOWSKI et al., 2023). O emprego da inteligência artificial na saúde é colocado à prova devido a alguns desafios em sua aplicabilidade. Conforme Obermeyer et al. (2016), a segurança do tratamento estar sob a alçada de um algoritmo é delicado, já que as reações do organismo humano não são exatas, exigindo um grau de acuidade e tempo de resposta que demandaria muito treinamento do algoritmo. Indo além, é necessário ressaltar que, embora algoritmos avançados possam ser aplicados à saúde, eles não substituem a interação humana e o cuidado personalizado. No entanto, podem complementar o trabalho dos profissionais de saúde, tornando o atendimento mais acessível. Outro desafio está no campo da bioética. Mittelstadt et al. (2020), questiona sobre os dados privados de pacientes, uma vez que é necessário expor o algoritmo a essas informações para resultados mais eficazes. Esses dados estariam circulando entre as partes que atuam no processo de desenvolvimento, suporte e conexão, porém, mesmo que dentro de um ambiente restrito, quaisquer brechas nesse sistema poderiam expor informações altamente íntimas, resultando em prejuízos. Diversos são os pontos positivos e negativos na utilização de aplicações que envolvem algoritmos avançados de IA para área da saúde. Este trabalho tem como objetivo apresentar, 7 com base na literatura especializada e delimitado pelas técnicas de IA baseados em LLMs, pontos de vista de autores, analisando suas aplicações, avaliando benefícios, desafios e riscos, além de explorar a necessidade de regulamentações envolvidas na utilização dessas tecnologias para área. 3 MATERIAIS E MÉTODOS Como parte de um projeto de pesquisa para identificação dos benefícios e desafios do uso dos grandes modelos de linguagem na área da saúde, este estudo desenvolveu-se por meio de uma pesquisa de natureza pura e de objetivo exploratório. A perspectiva de abordagem do problema é qualitativa utilizando-se do método de pesquisa teórico-conceitual e seu desenvolvimento foi realizado conforme cronograma geral de atividades (Anexo A). A pesquisa pura é aquela que é realizada dentro do campo teórico, com suas formulações intangíveis, mas que buscam consolidar informações acerca de algo. Visa unicamente a aplicação do conhecimento, os benefícios não são considerados nesse tipo de entrega (GIL, 2022), mas é a geradora de todos os outros tipos de pesquisas. Quando referido ao objetivo, Pizzinatto e Farah (2012) afirmam que uma pesquisa qualitativa prioriza a obtenção de dados qualitativos sobre um tema específico, buscando extrair resultados a partir das informações sem a necessidade de recorrer a métodos estatísticos para sua análise. O método teórico-conceitual demonstra como o tópico em estudo é influenciado pelas fontes bibliográficas existentes. Esse método de pesquisa é o “produto de reflexões a partir de um fenômeno observado ou relatado pela literatura (revisãobibliográfica); compilação de ideias e opiniões de diferentes autores ou ainda simulação e modelagem teórica” (BERTO; NAKANO, 1998). Segundo Gil (2022), a pesquisa bibliográfica é elaborada a partir de materiais já publicados, como livros, revistas, jornais e teses, dentre outros. Para este trabalho, o levantamento bibliográfico foi realizado com os artigos e livros disponíveis nas bases de dados: Scielo, Google Acadêmico e Web of Science. 4 RESULTADOS E DISCUSSÕES SOBRE O EMPREGO DOS LLMS NA SAÚDE A inteligência artificial está revolucionando a área da saúde. Diversos estudos com IA na área tem demonstrado excelentes resultados em tarefas como leitura precisa de exames médicos (ZHANG et al., 2020), detecção de doenças benignas (ESTEVA et al., 2017), criação 8 de assistentes virtuais de saúde (SINGH et al., 2021) e até mesmo apoiando a realização de cirurgias robóticas de precisão (HASHIMOTO, 2019). O futuro da medicina caminha para ser mais preditivo, preventivo e personalizado graças às possibilidades abertas pela inteligência artificial (TOPOL, 2019), porém vale ressaltar que esse desenvolvimento traz desafios e riscos demandando diálogo constante entre profissionais de saúde, pacientes, desenvolvedores e órgãos reguladores para maior confiabilidade e segurança para todos. 4.1 BENEFÍCIOS Com o surgimento dos grandes modelos de linguagem, a área da saúde tem passado por uma transformação sem precedentes. Essa tecnologia está sendo aplicada em diversas frentes melhorando a prestação de serviços, o atendimento aos pacientes e o aperfeiçoando na tomada de decisões clínicas (REDDY, 2023). Pesquisas atuais apontam um futuro promissor na utilização desses modelos alinhados para tarefas específicas segundo Singhal et al. (2023), porém segundo os autores, algumas melhorias ainda são necessárias para terem maior segurança em aplicações clínicas reais. Segundo Borkowski et al. (2023), a integração desses modelos em sites e aplicativos de saúde pode oferecer aos pacientes acesso instantâneo a informações médicas, verificação de sintomas e agendamento de consultas, promovendo a autogestão da saúde. Outra forma de aplicação promete revolucionar a educação médica, fornecendo recursos de aprendizado mais profundos, auxiliando estudantes na compreensão de conceitos médicos complexos e dilemas éticos (PANDEY; MISHRA, 2023). No diagnóstico e tratamento de câncer, tem surgidas ferramentas inovadoras utilizando LLMs como CancerBERT, modelo alinhado para extração de informações relevantes em registros eletrônicos de saúde relacionados ao câncer de mama (ZHOU, 2022). Outra ferramenta utilizada para classificação de resposta do câncer em categorias baseado em relatórios de radiologia é o GatorTron, baseado em LLM, tem se destacado comparado a outras abordagens como modelos de aprendizado profundo bidirecional, redes convolucionais e modelos de aprendizado de máquina convencionais (TAN et al., 2023). Outro estudo evidencia o emprego do GPT-4 no planejamento de cuidados de enfermagem em oncologia, tendo a capacidade notável de melhorar a qualidade do atendimento em pacientes com câncer (NASHWAN et al., 2023). 9 Pesquisas em saúde mental tem levado ao desenvolvimento de aplicações como MentalBERT e modelos de linguagem semelhantes (JI et al., 2022), tendo o potencial de trazer benefícios significativos para as áreas relacionadas. Essas ferramentas podem desempenhar um papel crucial na identificação precoce, acompanhamento e apoio a indivíduos com transtorno mental. Outro estudo relevante conforme demonstrado por um grupo de pesquisadores em 2021, apresentou resultados promissores que sugerem o potencial desses modelos para aprimorar o diagnóstico e prevenção de distúrbios psicológicos (MARTÍNEZ-CASTAÑO et al., 2021). O emprego de LLMs em pesquisa de medicamentos, pode alavancar o setor segundo Liu et al. (2021). Os modelos capacitam os pesquisadores a processarem e analisarem imensas quantidades de dados, acelerando o processo de pesquisa e permitindo a identificação mais eficaz de candidatos a medicamentos promissores. Novas abordagens em pesquisa de fármacos podem ser evidenciadas no estudo de Uludogan et al. (2022). Para os próximos anos, espera-se que o campo da pesquisa farmacêutica seja transformado pelo emprego desta tecnologia, trazendo avanços significativos no desenvolvimento de novos medicamentos. O potencial dos LLMs em aplicações para saúde é notório. Diversos estudos e pesquisas têm surgidos explorando as capacidades dessas tecnologias. Além das aplicações citadas, a tecnologia pode ser utilizada no apoio a tomada de decisão processando informações de paciente e recomendando exames ou tratamentos. Na pesquisa biomédica, os LLMs podem ser capazes de analisar rapidamente milhões de artigos científicos, estabelecendo conexões que os humanos jamais fariam, acelerando descobertas sobre doenças e tratamentos. Embora os desafios técnicos, éticos e regulatórios precisem ser enfrentados na integração da tecnologia com a saúde, fica evidente que os modelos de linguagens massivos terão grande impacto na área para os próximos anos (YANG et al., 2023). 4.2 DESAFIOS E RISCOS A utilização de grandes modelos de linguagem nos cuidados da saúde apresenta muitos desafios e inquietações que requerem atenção cuidadosa para garantir que estas tecnologias sejam aplicadas de forma eficaz e responsável. Estes desafios abrangem questões tecnológicas, éticas e práticas que devem ser consideradas para maximizar os benefícios destes modelos. A seguir, consideremos algumas das principais questões identificadas na literatura. Segurança e privacidade de dados: a segurança e a privacidade dos dados de pacientes são essenciais para o uso de LLMs na saúde. A partilha de dados médicos sensíveis com estes modelos requer medidas de segurança rigorosas para garantir a conformidade com os 10 regulamentos de proteção de dados, como exemplo as regulações europeias GDPR (General Data Protection Regulation) (MITTELSTADT et al., 2020). Interpretação clínica precisa: a interpretação precisa de dados clínicos é crítica para o sucesso da tecnologia na área da saúde. A linguagem médica é altamente especializada e os modelos devem compreender nuances clínicas e contextos específicos para fornecer informações precisas e relevantes (LI et al., 2023). Aceitação dos profissionais de saúde: a aceitação dos profissionais de saúde é um grande desafio. Médicos e enfermeiros devem confiar nas recomendações dos LLMs e incorporá-las nas suas práticas clínicas. Isto requer treinamento e conscientização sobre as capacidades e limitações dessas ferramentas (BORKOWSKI et al., 2023). Treinamento e manutenção de modelos: os LLMs exigem treinamento inicial em grandes conjuntos de dados e atualizações regulares para manter a relevância e a precisão. Isto exige esforços constantes de recursos técnicos e financeiros para manter os modelos atualizados com os mais recentes conhecimentos médicos (HOFFMANN et al., 2022). Ética e regulamentação: a ética do uso de LLMs na saúde é uma questão crítica. Questões como a transparência na tomada de decisões, a responsabilidade legal e a autonomia dos pacientes devem ser devidamente abordadas. Além disso, devem ser desenvolvidas regulamentações específicas para orientar o uso dessas tecnologias na prática clínica (PENTEADO et al., 2023). Integração com sistemas de saúde: a integração eficaz dos LLMs nos sistemas de saúde existentes é um desafio prático. Isso inclui a adaptação de fluxos de trabalho clínicos, interfaces de usuário e interoperabilidade com sistemas de registros médicos eletrônicos conhecidos como eletronic medical record (EMR) (BORKOWSKI et al., 2023). Enfrentar essas questões é essencial para concretizar o potencial da tecnologia para a área. A colaboraçãoentre profissionais de saúde, cientistas de dados, reguladores e especialistas em ética é fundamental para superar estas barreiras e garantir que estas tecnologias sejam utilizadas de forma benéfica para pacientes e profissionais da saúde. No contexto da saúde digital, há um crescente interesse em se aplicar LLMs, com destaque para o ChatGPT, que possui, por exemplo, até mesmo estudos pré-clínicos o mencionando como o autor. Esses estudos levantam questões éticas e de responsabilidade relacionadas ao conteúdo gerado pela ferramenta. Além disso, evidências mostram que o ChatGPT é capaz de produzir resumos de artigos científicos indistinguíveis dos criados por seres humanos, o que destaca seu potencial na educação em saúde. 11 O uso potencial do ChatGPT na assistência à saúde inclui dados médicos e a criação de materiais informativos acessíveis aos pacientes. Devemos enfatizar a importância de proteger a privacidade do paciente e observar diretrizes éticas ao utilizar a IA nesse contexto. Até o momento, nenhuma agência reguladora avaliou sua utilização na saúde (MEIRELLES; ARAÚJO, 2023). No entanto, somos alertados que há limitações da ferramenta em questões clínicas complexas, havendo necessidade de validação rigorosa antes de considerar seu emprego em tomadas de decisões clínicas. Não podemos esquecer que os LLMs podem refletir vieses humanos, sendo problemático em algumas situações (MEIRELLES; ARAÚJO, 2023). O debate em curso é de extrema relevância com relação a aplicação dos LLMs na área da saúde, enquanto a tecnologia continua a evoluir, seu emprego confiável na assistência à saúde permanece incerta. A interação humana entre médicos e pacientes continua tendo caráter fundamental na tomada de decisões clínicas, e a inteligência artificial deve ser considerada como uma ferramenta complementar (MEIRELLES; ARAÚJO, 2023). 5 CONSIDERAÇÕES FINAIS A utilização dos LLMs na área da saúde representa um avanço revolucionário com o potencial de transformar positivamente a assistência médica. Esses modelos têm a capacidade de automatizar tarefas, acelerar análises de dados clínicos e melhorar a eficiência geral do setor. Além disso, eles podem servir como ferramentas valiosas para a pesquisa médica, contribuindo para descobertas importantes que podem beneficiar a saúde global. No entanto, não se pode ignorar os riscos inerentes associados a essa tecnologia. A privacidade e segurança dos dados de pacientes devem ser prioridades absolutas para garantir que as informações confidenciais permaneçam protegidas contra violações e acessos não autorizados. Além disso, é crucial combater o viés nos modelos para evitar desigualdades no atendimento médico e garantir que a IA seja justa e imparcial. A falta de interpretabilidade desses modelos e o potencial para erros e imprecisões exigem uma abordagem cuidadosa. Os profissionais de saúde devem ser treinados para usar essas ferramentas com discernimento, combinando a expertise clínica com as recomendações dos modelos. Estabelecer responsabilidade clara e regulamentações adequadas é fundamental para resolver questões éticas e legais. Em última análise, o emprego dos grandes modelos de linguagem na saúde é um passo significativo para a evolução da área em direção a um futuro mais eficiente e inovador, mas é 12 um campo que requer um equilíbrio delicado entre os benefícios e riscos. Com medidas de segurança robustas, ações para redução de viés, supervisão humana constante e esforços contínuos para aprimorar a interpretabilidade, pode-se maximizar os benefícios dessa tecnologia, garantindo um atendimento médico de qualidade, ético e seguro para todos. REFERÊNCIAS BAHDANAU, D. et al. Neural machine translation by jointly learning to align and translate. arXiv preprint arXiv:1409.0473v7, maio 2016. Disponível em: https://arxiv.org/abs/1409.0473. Acesso em: 27 ago. 2023. BAI, Y. et al. Constitutional AI: Harmlessness from AI Feedback. arXiv preprint arXiv:2212.08073v1, Anthropic, dez. 2022. Disponível em: https://arxiv.org/abs/2212.08073. Acesso em: 20 ago. 2023. BANERJEE, P.; HAN, H. Language modeling approaches to information retrieval. ReasearchGate DOI:10.5626/JCSE.2009.3.3.143, Journal of Computing Science and Engineering 3(3), p. 143-164, 2009. Disponível em: https://mds.marshall.edu/wdcs_faculty/4/. Acesso em: 10 set. 2023. BENDER, E. M. et al. On the dangers of stochastic parrots: can language models be too big? FAccT'21: Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency, P. 610–623, mar. 2021. Disponível em: https://dl.acm.org/doi/10.1145/3442188.3445922. Acesso em: 30 ago. 2023. BERTO, V. S. R. M.; NAKANO, D. N. Metodologia da Pesquisa e a Engenharia de Produção, Escola Politécnica da Universidade de São Paulo – Departamento de Engenharia de Produção, 1998. Disponível em: http://www.abepro.org.br/biblioteca/enegep1998_art174.pdf. Acesso em: 28 ago. 2023. BORKOWSKI, A. A. et al. Aplicações do ChatGPT e de Modelos de Linguagem Avançados na Medicina e Cuidados de Saúde: Benefícios e Armadilhas. Fed Pract., [S.I.], v.40, n. 6, jun. 2023. BROWN, T. B. et al. Language models are few-shot learners. arXiv preprint arXiv:2005.14165v4, OpenAI, jul. 2020. Disponível em: https://arxiv.org/abs/2005.14165 Acesso em: 3 set. 2023. CHEN, C. et al. The times they are a-changin: healthcare 4.0 is coming! J Med Syst, 2020. CHO, K. et al. Learning phrase representations using RNN encoder–decoder for statistical machine translation. arXiv preprint arXiv:1406.1078v3, set. 2014. DEVLIN, J. et al. BERT: Pre-training of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805v2, Google, maio 2019. 13 ESTEVA, A. et al. Dermatologist-level classification of skin cancer with deep neural networks. DOI:https://doi.org/10.1038/nature21056, Nature Journal, v. 542, n. 7639, p. 115- 118, jan. 2017. FAN, W. et al. Recommender systems in the era of large language models (LLMs). arXiv preprint arXiv:2307.02046v2, ago. 2023. GIL, A. C. Como Elaborar Projetos de Pesquisa. Grupo GEN. E-book. ISBN 9786559771653, 2022. Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9786559771653/. Acesso em: 06 set. 2023. HADI, M. U. et al. Large language models: a comprehensive survey of its applications, challenges, limitations, and future prospects. ReasearchGate DOI:10.5626/JCSE.2009.3.3.143, jul. 2023. HASHIMOTO, D. A. et al. Artificial intelligence in surgery: promises and perils. DOI:https://doi.org/10.1097/sla.0000000000002693, Annals of surgery Journal, v. 268, n. 1, jul. 2018. HOCHREITER, S. et al. Long short-term memory. ReasearchGate DOI:10.1162/neco.1997.9.8.1735, Neural Computation, dez. 1997. HOFFMANN, J. et al. Training compute-optimal large language models. arXiv preprint arXiv:2203.15556v1, DeepMind, mar. 2022. JAIN, S. M. Introduction to transformers for NLP: with the hugging face library and models to solve problems. Bangalore: Apress, p. 19-36, 2022. JI, S. et al. MentalBERT:publicly available pretrained language models for mental healthcare. Proceedings of the Thirteenth Language Resources and Evaluation Conference, Marseille, France, p. 7184–7190, jun. 2022. KADDOUR, J. et al. Challenges and applications of large language models. arXiv preprint arXiv:2307.10169v1, p. 34-48, 2023. KHOSRAVI, A.; TRAINOR, D.; TSANG, A. H. Estimation of Clinical Parameters of Coronary Artery Disease with Machine Learning Techniques: A Retrospective Study. Journal of Medical Systems, 43(3), 56. DOI:10.1007/s10916-019-1166-5, 2019. KUNG, T. et al. Performance of ChatGPT on USMLE: Potencial for AI-assisted medical education using large language models. PLOS Digit Health, 2(2), e0000198, 2023. LI, H. et al.Ethics of large language models in medicine and medical research. ReasearchGate DOI:10.1016/S2589-7500(23)00083-3, The Lancet Digital Health 5(6), abr. 2023. LIU, Z. et al. AI-based language models powering drug discovery and development. DOI:https://doi.org/10.1016/j.drudis.2021.06.009, Drug Discovery Today Journal, v. 26, n. 11, jun. 2021. https://doi.org/10.1038/nature21056 https://doi.org/10.1097/sla.0000000000002693 https://doi.org/10.1016/j.drudis.2021.06.009 14 MAATOUK, A. et al. Large language models for telecom: forthcoming impact on the industry. arXiv preprint arXiv:2308.06013v1, ago. 2023. MARTÍNEZ-CASTAÑO, R. et al. BERT-Based transformers for Early Detection of mental health illnesses. DOI:http://dx.doi.org/10.1007/978-3-030-85251-1_15, Experimental IR Meets Multilinguality, Multimodality, and Interaction, 12th International Conference of the CLEF Association, p. 189–200, set. 2021. MEIRELLES, G.; ARAÚJO, A. ChatGPT: oportunidades e desafios na era da saúde digital. Revista MIT Sloan Review Brasil, Inovação Científica. Disponível em: https://mitsloanreview.com.br/post/chatgpt-oportunidades-e-desafios-na-era-da-saude-digital, jan. 2023. MITTELSTADT, B.; RUSSELL, et al. Bias preservation in machine learning: the legality of fairness metrics under EU non-discrimination law. W. Va. L. Rev., v. 123, p. 735, 2020. NASHWAN, A. J. et al. Enhancing oncology nursing care planning for patients with cancer through harnessing large language models. DOI:https://doi.org/10.1016/j.apjon.2023.100277, Asia-Pacific Journal of Oncology Nursing, v. 10, n. 9, jul 2023. NAVEED, H. et al. A comprehensive overview of large language models. arXiv preprint arXiv:2307.06435v2, ago. 2023. OBERMEYER, Z.; EMANUEL, E. J. The Risks of Innovation in Health Care. JAMA, 316(15), 1543-1544. doi:10.1001/jama.2016.10316, 2016 OPENAI. GPT-4 Technical Report. arXiv preprint arXiv:2303.08774v3, OpenAI, mar. 2023. OUYANG, L. et al. Training language models to follow instructions with human feedback. arXiv preprint arXiv:2203.02155v1, OpenAI, mar. 2022. OZDEMIR, S. Quick start guide to large language models strategies and best practices for using ChatGPT and other LLMs. San Francisco: Addison-Wesley, p. 23-30, 2023. PANDEY, M.; MISHRA, V. Large language models in medical education and quality concerns. DOI:https://doi.org/10.23880/jqhe-16000319, Journal of Quality in Health Care & Economics, v. 6, n. 1, fev. 2023. PENTEADO, B. E. et al. The Regulation of artificial intelligence in healthcare: an exploratory study. ReasearchGate DOI:10.1145/3510606.3551898, Conference: SIGMIS- CPR '22: 2022 Computers and People Research Conference, jan. 2023. PIZZINATTO, N. K.; FARAH, O. E.. Pesquisa pura e aplicada para marketing: processos e aplicações. São Paulo: Atlas, p. 132, 2012. RAFFEL, C. et al. Exploring the limits of transfer learning with a unified text-to-text transformer. arXiv preprint arXiv:1910.10683v3, Google, jul. 2020. http://dx.doi.org/10.1007/978-3-030-85251-1_15 https://mitsloanreview.com.br/post/chatgpt-oportunidades-e-desafios-na-era-da-saude-digital https://doi.org/10.1016/j.apjon.2023.100277 https://doi.org/10.23880/jqhe-16000319 15 REDDY, S. Evaluating large language models for use in healthcare: a framework for translational value assessment. DOI:https://doi.org/10.1016/j.imu.2023.101304, Informatics in Medicine Unlocked Journal, v. 41, jul. 2023. RUSSELL, S. J.; NORVIG, P. Artificial intelligence: a modern approach. 4. ed. Malaysia: Pearson, 1166 p, 2021. SINGH, S. et al. Healthcare virtual assistant. International Research Journal of Modernization in Engineering Technology and Science, v. 3, n. 5, maio 2021. SINGHAL, K. et al. Large language models encode clinical knowledge. DOI:https://doi.org/10.1038/s41586-023-06291-2, Nature Journal, v. 620, p. 172–180, jul. 2023. SITTIG, D. F.; SINGH, H. Artificial Intelligence Applications for Improved Patient Safety and Quality in Health Care. Yearbook of Medical Informatics, 28(1), 195-198. doi:10.1055/s- 0039-1677895, 2019. TAN, R. S. Y. C. et al. Inferring cancer disease response from radiology reports using large language models with data augmentation and prompting. DOI:https://doi.org/10.1093/jamia/ocad133, Journal of the American Medical Informatics Association, v. 30, n. 10, p. 1208-1216, set. 2023. TAYLOR, R. et al. Galactica: A large language model for science. arXiv preprint arXiv:2211.09085v1, Meta AI, nov. 2023. TIAN, S. et al. Opportunities and challenges for ChatGPT and large language models in Biomedicine and health. arXiv preprint arXiv:2306.10070v1, jun. 2023. TOPOL, E. Deep medicine: how artificial intelligence can make healthcare human again. New York: Basic books, 2019. 400 p. ULUDOGAN, G. et al. Exploiting pretrained biochemical language models for targeted drug design. DOI:https://doi.org/10.1093/bioinformatics/btac482, Bioinformatics Journal, v. 38, n. 2, p. 155-161, set. 2022. VASWANI, A. et al. Attention is all you need. arXiv preprint arXiv:1706.03762v7, Google Brain, ago. 2023. WEI, J. et al. Emergent abilities of large language models. arXiv preprint arXiv:2206.07682v2, oct. 2022. WU, S. et al. BloombergGPT: A large language model for finance. arXiv preprint arXiv:2303.17564v2, Bloomberg, maio 2023. YANG, R. et al. Large language models in health care: Development, applications, and challenges. DOI:http://dx.doi.org/10.1002/hcs2.61, Health Care Science - Wiley and Tsinghua University Press, v. 2, n. 4, p. 255-263, jul. 2023. https://doi.org/10.1016/j.imu.2023.101304 https://doi.org/10.1038/s41586-023-06291-2 https://doi.org/10.1093/jamia/ocad133 https://doi.org/10.1093/bioinformatics/btac482 http://dx.doi.org/10.1002/hcs2.61 16 ZHANG, K. et al. Clinically applicable AI system for accurate diagnosis, quantitative measurements, and prognosis of COVID-19 pneumonia using computed tomography. DOI:https://doi.org/10.1016/j.cell.2020.04.045, Cell Press Journal, v. 181, n. 6, p. 1423-1433, abr. 2020. ZHENG, Z. et al. Towards an understanding of large language models in software engineering tasks. arXiv preprint arXiv:2308.11396v1, ago. 2023. Disponível em: https://arxiv.org/abs/2308.11396. Acesso em: 2 set. 2023. ZHOU, S. et al. CancerBERT: a cancer domain-specific language model for extracting breast cancer phenotypes from electronic health records. DOI:https://doi.org/10.1093/jamia/ocac040, Journal of the American Medical Informatics Association, v. 29, n. 7, p. 1208-1216, jun. 2022. https://doi.org/10.1016/j.cell.2020.04.045 https://doi.org/10.1093/jamia/ocac040 17 ANEXO A – CRONOGRAMA GERAL ATIVIDADES Q1 Q2 Q3 Q4 Q5 Q6 Q7 Delimitação do tema Definição do objeto de estudo Revisão da literatura Entrega parcial Coleta de dados bibliográficos Análise e discussão dos resultados Considerações Finais Revisão Final Entrega Final Quadro 1 – Cronograma de atividades