Buscar

TCC - Univesp


Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 17 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 17 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 17 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

TRABALHO DE CONCLUSÃO DE CURSO EM CIÊNCIA DE DADOS 
 
 
 
 
 
UNIVERSIDADE VIRTUAL DO ESTADO DE SÃO PAULO 
POLO JACAREÍ – SP UNIVESP – 2023 
 
 
 
 
 
 
 
 
 A REVOLUÇÃO DOS GRANDES MODELOS DE LINGUAGEM: 
 Benefícios, desafios e riscos no avanço da inteligência artificial para área da saúde 
 
 
 
 
 
 
 
 
 Vídeo de apresentação 
 https://youtu.be/i2WHcfKJBHE 
 
 
 
 
 
 
 
 
 
 
https://youtu.be/i2WHcfKJBHE
 
 
 
2 
A REVOLUÇÃO DOS GRANDES MODELOS DE LINGUAGEM: 
Benefícios, desafios e riscos no avanço da inteligência artificial para área da saúde 
 
 
Fabrício Siqueira Faria1 
Isabela Felix Moreira Neves1 
Douglas de Souza Petri1 
 Caio Porto Schiavon1 
 German Alejandro Enriquez Barriga1 
Eduardo Fernandes Fileno1 
Matheus Olegário Vieira Couto1 
 
Resumo: Em um momento de constante evolução na inteligência artificial, large language 
models (LLMs) tem se destacado como um tópico de crescente interesse e investigação. O 
presente trabalho tem como proposta trazer uma discussão abrangente sobre os LLMs aplicados 
a área da saúde destacando seus benefícios, desafios e riscos para o setor. Como metodologia, 
foi realizada uma pesquisa bibliográfica com abordagem qualitativa e método teórico-
conceitual, buscando na literatura os impactos positivos e negativos dessas tecnologias com a 
área em estudo. Na saúde, os LLMs vêm sendo aplicados de forma eficaz em diagnósticos, 
educação médica, descoberta de fármacos, entre outros, com potencial de tornar os sistemas de 
saúde mais eficientes e personalizados. Porém, apresentam desafios técnicos, éticos e 
regulatórios a serem enfrentados. A interpretação de dados clínicos e a aceitação pelos 
profissionais de saúde são barreiras a serem superadas. Além do mais, a segurança dos dados 
de pacientes e aspectos éticos relacionados ao uso de informações sensíveis também são 
questões críticas. Contudo, Os LLMs têm o potencial de trazer muitos benefícios para a área, 
no entanto em sua implementação é essencial a colaboração de todos os atores envolvidos para 
maior confiabilidade, segurança e mitigação de riscos para usuários. 
 
Palavras-chave: Inteligência artificial, Grandes modelos de linguagem, Saúde. 
 
Abstract: At a time of constant evolution in artificial intelligence, large language models 
(LLMs) have stood out as a topic of growing interest and investigation. This work aims to bring 
a comprehensive discussion about LLMs applied to the health sector, highlighting their benefits, 
challenges and risks for the sector. As a methodology, bibliographical research was carried out 
with a qualitative approach and theoretical-conceptual method, searching in the literature for 
the positive and negative impacts of these technologies on the area under study. In healthcare, 
LLMs have been effectively applied in diagnostics, medical education, drug discovery, among 
others, with the potential to make healthcare systems more efficient and personalized. However, 
they present technical, ethical and regulatory challenges to be faced. The interpretation of 
clinical data and acceptance by healthcare professionals are barriers to be overcome. 
Furthermore, the security of patient data and ethical aspects related to the use of sensitive 
information are also critical issues. However, LLMs have the potential to bring many benefits 
to the area, nonetheless in their implementation the collaboration of all actors involved is 
essential for greater reliability, security and risk mitigation for users 
 
Keywords: Artificial intelligence, Large language models, Health. 
 
1 UNIVESP | Universidade Virtual do Estado de São Paulo. 
 Bacharelado em Ciência de Dados | Jacareí – 2023. 
 
 
 
3 
1 INTRODUÇÃO 
 
A inteligência artificial (IA) tem avançado de forma expressiva nos últimos anos, 
impulsionada por grandes progressos em algoritmos, poder computacional e, geração e 
processamento de imensos volumes de dados. Conceitualmente, a IA remonta aos anos 1950, 
com os primeiros programas que simulavam comportamentos inteligentes (RUSSELL; 
NORVIG, 2021). 
Com os recentes avanços em técnicas de machine learning e deep learning, através das 
redes neurais profundas, foi possível a criação de sistemas de IA cada vez mais complexos 
como os modelos de linguagem em larga escala. Esses modelos revolucionaram o campo, 
permitindo geração de texto, chatbots, agentes inteligentes, entre diversas outras aplicações 
(KADDOUR et al., 2023). 
Os modelos de linguagem podem ser considerados como um conjunto de algoritmos 
probabilísticos de processamento de linguagem natural (PLN), treinados para prever a(s) 
palavra(s) futura(s) em uma sequência, dada as anteriores (BANERJEE; HAN, 2009). A partir 
deste, tem-se os grandes modelos de linguagens, large language models (LLMs), os quais são 
modelos generativos massivos treinados em enormes conjuntos de dados textuais não 
estruturados. 
Os LLMs utilizam-se de redes neurais profundas para extrair padrões complexos da 
linguagem humana e gerar textos coerentes de forma autônoma (BENDER et al., 2021). 
Exemplos clássicos são GPT-3 (BROWN et al., 2020), BERT (DEVLIN et al., 2019) e T5 
(RAFFEL et al., 2020). Os grandes modelos representam hoje a fronteira da pesquisa em 
processamento de linguagem natural (PLN) e seu impacto tem sido cada vez maior em diversas 
áreas como saúde, educação, engenharia, entre outras. 
O surgimento dos LLMs foi possível e impulsionado pelos avanços significativos em 
aprendizado profundo, como os mecanismos de atenção (BAHDANAU et al., 2016), abrindo 
caminho para a criação da arquitetura Transformer introduzidas pelo time Google Brain em 
2017, o qual permitiu superar as limitações das arquiteturas de redes neurais recorrentes LSTM 
(HOCHREITER et al., 1997) e GRU (CHO, 2014), consolidadas em tarefas sequenciais em 
PLN (VASWANI et al., 2023). 
A arquitetura Transformer utiliza camadas de auto-atenção, possibilitando capturar 
dependências distantes em sequências longas de maneira mais eficiente do que as redes 
recorrentes tradicionais (JAIN, 2022). Essa evolução viabilizou o treinamento de modelos 
 
 
 
4 
maiores e mais poderosos apoiando-se fortemente nessa arquitetura para alcançar capacidades 
de processamento de linguagem natural antes inimagináveis. 
A construção de LLMs estado da arte envolve desafios técnicos em seu treinamento 
(HOFFMANN et al., 2022). No geral, essa etapa se divide em duas fases distintas: pré-
treinamento e o ajuste-fino. Na fase de pré-treinamento são requeridos e pré-processados 
conjuntos de dados textuais massivos, induzindo no modelo a compreensão semântica da 
linguagem e os relacionamentos contextuais entre palavras. Já na fase de ajuste-fino, um LLM 
pode ser refinado partindo do modelo pré-treinado, otimizando seus parâmetros para obter 
maior precisão em um conjunto de dados menor, para cada tarefa específica, demonstrando 
adaptação eficaz a diversas aplicações (OZDEMIR, 2023). 
Outras formas de ajuste e alinhamento do modelo podem utilizar técnicas de 
aprendizado por reforço com feedback humano denominado reinforcement learning from 
human feedback (RLHF), método que vem apresentando bons resultados em modelos de 
linguagem grandes (OUYANG, 2022). Além do RLHF, pesquisas apontam outros métodos 
promissores de alinhamento com feedback de IA denominado Constitutional AI (CAI) (BAI, 
2022). Modelos como o GPT-4 (OPENAI, 2023) durante seu treinamento, demandaram equipes 
especializadas, hardwares dedicados, levando a custos da ordem de milhões de dólares. 
Os progressos dos modelos de linguagem massivos estão revolucionando diversas áreas 
com suas capacidades notáveis. O impacto dessa tecnologia pode ser percebido em segmentos 
como educação, cultura, direito, comercio, saúde, entre outras. Estudos apontam que o emprego 
desses grandes modelos tem se ramificadopara muitos setores, surgindo aplicações 
customizadas a todo momento (KADDOUR et al., 2023). 
Aplicações e pesquisas recentes têm surgido em áreas específicas como 
telecomunicações (MAATOUK, 2023), engenharia de software (ZHENG, 2023), e-commerce 
(FAN, 2023), finanças (WU, 2023) e ciência (TAYLOR, 2022). No ramo da saúde, essa 
tecnologia tem demonstrado crescente potencial para área, especialmente como: educação 
médica, tomada de decisões em imagens radiológicas, genética clínica e cuidados com pacientes 
(HADI, 2023). 
O emprego de grandes modelos de linguagem na saúde tem se mostrado de grande 
relevância, no entanto, também surgem questões éticas relacionadas (LI et al., 2023.), como 
exemplo à segurança de dados e regulatórias (PENTEADO et al., 2023) que precisam ser 
consideradas (TIAN et al., 2023). Compreender esses questionamentos é essencial para que o 
desenvolvimento ocorra de forma responsável para o bem-estar da sociedade. 
 
 
 
5 
O presente trabalho traz uma análise qualitativa sobre o avanço dos grandes modelos de 
linguagem, contextualizando seu histórico de evolução, aplicações, desafios e riscos do 
emprego dessas tecnologias aplicadas à área da saúde. A motivação do estudo é a necessidade 
de compreender mais a fundo os benefícios que tais avanços tem trazido para a área, desde a 
eficiência de diagnóstico até a personalização de cuidados médicos. Ao mesmo tempo, 
considerando os desafios inerentes, como a interpretação precisa das informações clínicas e as 
implicações éticas e de segurança que acompanham a utilização desses modelos. 
 
2 O AVANÇO DA INTELIGÊNCIA ARTIFICIAL PARA A ÁREA DA SAÚDE 
 
Conforme a demanda por atendimento médico cresce e a necessidade de melhorar a 
eficiência dos sistemas de saúde se torna evidente, a tecnologia desempenha um papel 
significativo no apoio aos profissionais de saúde (BORKOWSKI et al., 2023). Um exemplo 
notável é o ChatGPT, desenvolvido pela OpenAI, que tem despertado interesse na comunidade 
médica devido à sua capacidade de sucesso no Exame de Licenciamento Médico dos Estados 
Unidos (KUNG et al., 2023). 
Segundo Chen et al (2020), existem 4 eras que subdividem a área da saúde, enumeradas 
de 1.0 até 4.0. Na era 1.0, compreendida no século XIX, marca a adoção de políticas de 
vacinação e saneamento para prevenção de doenças. Na era 2.0, início do século XX, tem-se a 
implementação da produção em larga escala de antibióticos, devido às novas tecnologias de 
produção industrial. Com a era 3.0, já no início da década de 80, a internet apareceu para auxiliar 
pesquisas e novas tecnologias que permitiram outras formas de abordagens e tratamentos na 
saúde. 
Atualmente, na era 4.0, Chen et al (2020) destaca a chamada era da saúde inteligente, 
com as facilidades que o avanço tecnológico permite. Com a imensa gama de dados de doenças 
e tratamentos já disponíveis aos pesquisadores para desenvolverem novos métodos, algoritmos 
avançados auxiliam no diagnóstico em tempo real de doenças e definem o tratamento mais 
efetivo a cada biotipo do paciente. A tecnologia já permite, por exemplo, analisar o DNA de 
uma pessoa para avaliar predisposições a determinadas doenças e definir uma abordagem 
preventiva. 
O avanço dos modelos de linguagens trouxe muitos impactos positivos para a área 
médica, além da agilidade para identificar padrões de determinadas doenças, corroborando para 
uma tomada de decisão mais assertiva dos profissionais da saúde (KHOSRAVI et al., 2019). 
Outro benefício é a possibilidade de automação da rotina hospitalar, elaborando e analisando 
 
 
 
6 
os prontuários médicos, definindo uma ordem de prioridades para os enfermos, e otimizando o 
trabalho da equipe. O impacto dessa otimização é fundamental para evitar casos de erros 
médicos e, de acordo com Sittig et al. (2019), essa automação evita a sobrecarga da equipe, 
alerta sobre possíveis alergias do paciente, evitando assim complicações desnecessárias durante 
o tratamento. 
Dentre os benefícios potenciais, destaca-se a possibilidade de reduzir a exaustão dos 
profissionais de saúde, aliviando tarefas administrativas como faturamento, codificação e 
organização de agendas (BORKOWSKI et al., 2023). O emprego de ferramentas que utilizam 
LLMs também demonstra capacidade no auxílio ao diagnóstico, baseado em vastos dados 
clínicos, bem como na interpretação de resultados de exames e sugestão de diagnósticos 
diferenciais. Além disso, esses modelos têm potencial para identificar oportunidades em ensaios 
clínicos e aprimorar a qualidade dos tratamentos (BORKOWSKI et al., 2023). 
Profissionais especializados, como radiologistas, podem se beneficiar da integração de 
diagnósticos por visão computacional com a criação de relatórios do ChatGPT, aprimorando a 
precisão diagnóstica (BORKOWSKI et al., 2023). Também é ressaltado o potencial da 
ferramenta em agilizar o atendimento de urgência, auxiliando na triagem de pacientes em 
situações críticas (BORKOWSKI et al., 2023). 
O emprego da inteligência artificial na saúde é colocado à prova devido a alguns 
desafios em sua aplicabilidade. Conforme Obermeyer et al. (2016), a segurança do tratamento 
estar sob a alçada de um algoritmo é delicado, já que as reações do organismo humano não são 
exatas, exigindo um grau de acuidade e tempo de resposta que demandaria muito treinamento 
do algoritmo. Indo além, é necessário ressaltar que, embora algoritmos avançados possam ser 
aplicados à saúde, eles não substituem a interação humana e o cuidado personalizado. No 
entanto, podem complementar o trabalho dos profissionais de saúde, tornando o atendimento 
mais acessível. 
Outro desafio está no campo da bioética. Mittelstadt et al. (2020), questiona sobre os 
dados privados de pacientes, uma vez que é necessário expor o algoritmo a essas informações 
para resultados mais eficazes. Esses dados estariam circulando entre as partes que atuam no 
processo de desenvolvimento, suporte e conexão, porém, mesmo que dentro de um ambiente 
restrito, quaisquer brechas nesse sistema poderiam expor informações altamente íntimas, 
resultando em prejuízos. 
 Diversos são os pontos positivos e negativos na utilização de aplicações que envolvem 
algoritmos avançados de IA para área da saúde. Este trabalho tem como objetivo apresentar, 
 
 
 
7 
com base na literatura especializada e delimitado pelas técnicas de IA baseados em LLMs, 
pontos de vista de autores, analisando suas aplicações, avaliando benefícios, desafios e riscos, 
além de explorar a necessidade de regulamentações envolvidas na utilização dessas tecnologias 
para área. 
 
3 MATERIAIS E MÉTODOS 
 
Como parte de um projeto de pesquisa para identificação dos benefícios e desafios do 
uso dos grandes modelos de linguagem na área da saúde, este estudo desenvolveu-se por meio 
de uma pesquisa de natureza pura e de objetivo exploratório. A perspectiva de abordagem do 
problema é qualitativa utilizando-se do método de pesquisa teórico-conceitual e seu 
desenvolvimento foi realizado conforme cronograma geral de atividades (Anexo A). 
A pesquisa pura é aquela que é realizada dentro do campo teórico, com suas formulações 
intangíveis, mas que buscam consolidar informações acerca de algo. Visa unicamente a 
aplicação do conhecimento, os benefícios não são considerados nesse tipo de entrega (GIL, 
2022), mas é a geradora de todos os outros tipos de pesquisas. 
Quando referido ao objetivo, Pizzinatto e Farah (2012) afirmam que uma pesquisa 
qualitativa prioriza a obtenção de dados qualitativos sobre um tema específico, buscando extrair 
resultados a partir das informações sem a necessidade de recorrer a métodos estatísticos para 
sua análise. 
O método teórico-conceitual demonstra como o tópico em estudo é influenciado pelas 
fontes bibliográficas existentes. Esse método de pesquisa é o “produto de reflexões a partir de 
um fenômeno observado ou relatado pela literatura (revisãobibliográfica); compilação de ideias 
e opiniões de diferentes autores ou ainda simulação e modelagem teórica” (BERTO; 
NAKANO, 1998). 
Segundo Gil (2022), a pesquisa bibliográfica é elaborada a partir de materiais já 
publicados, como livros, revistas, jornais e teses, dentre outros. Para este trabalho, o 
levantamento bibliográfico foi realizado com os artigos e livros disponíveis nas bases de dados: 
Scielo, Google Acadêmico e Web of Science. 
 
4 RESULTADOS E DISCUSSÕES SOBRE O EMPREGO DOS LLMS NA SAÚDE 
 
A inteligência artificial está revolucionando a área da saúde. Diversos estudos com IA 
na área tem demonstrado excelentes resultados em tarefas como leitura precisa de exames 
médicos (ZHANG et al., 2020), detecção de doenças benignas (ESTEVA et al., 2017), criação 
 
 
 
8 
de assistentes virtuais de saúde (SINGH et al., 2021) e até mesmo apoiando a realização de 
cirurgias robóticas de precisão (HASHIMOTO, 2019). 
O futuro da medicina caminha para ser mais preditivo, preventivo e personalizado 
graças às possibilidades abertas pela inteligência artificial (TOPOL, 2019), porém vale ressaltar 
que esse desenvolvimento traz desafios e riscos demandando diálogo constante entre 
profissionais de saúde, pacientes, desenvolvedores e órgãos reguladores para maior 
confiabilidade e segurança para todos. 
 
4.1 BENEFÍCIOS 
 
Com o surgimento dos grandes modelos de linguagem, a área da saúde tem passado por 
uma transformação sem precedentes. Essa tecnologia está sendo aplicada em diversas frentes 
melhorando a prestação de serviços, o atendimento aos pacientes e o aperfeiçoando na tomada 
de decisões clínicas (REDDY, 2023). Pesquisas atuais apontam um futuro promissor na 
utilização desses modelos alinhados para tarefas específicas segundo Singhal et al. (2023), 
porém segundo os autores, algumas melhorias ainda são necessárias para terem maior segurança 
em aplicações clínicas reais. 
Segundo Borkowski et al. (2023), a integração desses modelos em sites e aplicativos de 
saúde pode oferecer aos pacientes acesso instantâneo a informações médicas, verificação de 
sintomas e agendamento de consultas, promovendo a autogestão da saúde. Outra forma de 
aplicação promete revolucionar a educação médica, fornecendo recursos de aprendizado mais 
profundos, auxiliando estudantes na compreensão de conceitos médicos complexos e dilemas 
éticos (PANDEY; MISHRA, 2023). 
No diagnóstico e tratamento de câncer, tem surgidas ferramentas inovadoras utilizando 
LLMs como CancerBERT, modelo alinhado para extração de informações relevantes em 
registros eletrônicos de saúde relacionados ao câncer de mama (ZHOU, 2022). Outra 
ferramenta utilizada para classificação de resposta do câncer em categorias baseado em 
relatórios de radiologia é o GatorTron, baseado em LLM, tem se destacado comparado a outras 
abordagens como modelos de aprendizado profundo bidirecional, redes convolucionais e 
modelos de aprendizado de máquina convencionais (TAN et al., 2023). Outro estudo evidencia 
o emprego do GPT-4 no planejamento de cuidados de enfermagem em oncologia, tendo a 
capacidade notável de melhorar a qualidade do atendimento em pacientes com câncer 
(NASHWAN et al., 2023). 
 
 
 
9 
Pesquisas em saúde mental tem levado ao desenvolvimento de aplicações como 
MentalBERT e modelos de linguagem semelhantes (JI et al., 2022), tendo o potencial de trazer 
benefícios significativos para as áreas relacionadas. Essas ferramentas podem desempenhar um 
papel crucial na identificação precoce, acompanhamento e apoio a indivíduos com transtorno 
mental. Outro estudo relevante conforme demonstrado por um grupo de pesquisadores em 2021, 
apresentou resultados promissores que sugerem o potencial desses modelos para aprimorar o 
diagnóstico e prevenção de distúrbios psicológicos (MARTÍNEZ-CASTAÑO et al., 2021). 
O emprego de LLMs em pesquisa de medicamentos, pode alavancar o setor segundo 
Liu et al. (2021). Os modelos capacitam os pesquisadores a processarem e analisarem imensas 
quantidades de dados, acelerando o processo de pesquisa e permitindo a identificação mais 
eficaz de candidatos a medicamentos promissores. Novas abordagens em pesquisa de fármacos 
podem ser evidenciadas no estudo de Uludogan et al. (2022). Para os próximos anos, espera-se 
que o campo da pesquisa farmacêutica seja transformado pelo emprego desta tecnologia, 
trazendo avanços significativos no desenvolvimento de novos medicamentos. 
O potencial dos LLMs em aplicações para saúde é notório. Diversos estudos e pesquisas 
têm surgidos explorando as capacidades dessas tecnologias. Além das aplicações citadas, a 
tecnologia pode ser utilizada no apoio a tomada de decisão processando informações de 
paciente e recomendando exames ou tratamentos. Na pesquisa biomédica, os LLMs podem ser 
capazes de analisar rapidamente milhões de artigos científicos, estabelecendo conexões que os 
humanos jamais fariam, acelerando descobertas sobre doenças e tratamentos. Embora os 
desafios técnicos, éticos e regulatórios precisem ser enfrentados na integração da tecnologia 
com a saúde, fica evidente que os modelos de linguagens massivos terão grande impacto na 
área para os próximos anos (YANG et al., 2023). 
 
4.2 DESAFIOS E RISCOS 
 
A utilização de grandes modelos de linguagem nos cuidados da saúde apresenta muitos 
desafios e inquietações que requerem atenção cuidadosa para garantir que estas tecnologias 
sejam aplicadas de forma eficaz e responsável. Estes desafios abrangem questões tecnológicas, 
éticas e práticas que devem ser consideradas para maximizar os benefícios destes modelos. A 
seguir, consideremos algumas das principais questões identificadas na literatura. 
Segurança e privacidade de dados: a segurança e a privacidade dos dados de pacientes 
são essenciais para o uso de LLMs na saúde. A partilha de dados médicos sensíveis com estes 
modelos requer medidas de segurança rigorosas para garantir a conformidade com os 
 
 
 
10 
regulamentos de proteção de dados, como exemplo as regulações europeias GDPR (General 
Data Protection Regulation) (MITTELSTADT et al., 2020). 
Interpretação clínica precisa: a interpretação precisa de dados clínicos é crítica para o 
sucesso da tecnologia na área da saúde. A linguagem médica é altamente especializada e os 
modelos devem compreender nuances clínicas e contextos específicos para fornecer 
informações precisas e relevantes (LI et al., 2023). 
Aceitação dos profissionais de saúde: a aceitação dos profissionais de saúde é um 
grande desafio. Médicos e enfermeiros devem confiar nas recomendações dos LLMs e 
incorporá-las nas suas práticas clínicas. Isto requer treinamento e conscientização sobre as 
capacidades e limitações dessas ferramentas (BORKOWSKI et al., 2023). 
 Treinamento e manutenção de modelos: os LLMs exigem treinamento inicial em 
grandes conjuntos de dados e atualizações regulares para manter a relevância e a precisão. Isto 
exige esforços constantes de recursos técnicos e financeiros para manter os modelos atualizados 
com os mais recentes conhecimentos médicos (HOFFMANN et al., 2022). 
 Ética e regulamentação: a ética do uso de LLMs na saúde é uma questão crítica. 
Questões como a transparência na tomada de decisões, a responsabilidade legal e a autonomia 
dos pacientes devem ser devidamente abordadas. Além disso, devem ser desenvolvidas 
regulamentações específicas para orientar o uso dessas tecnologias na prática clínica 
(PENTEADO et al., 2023). 
 Integração com sistemas de saúde: a integração eficaz dos LLMs nos sistemas de 
saúde existentes é um desafio prático. Isso inclui a adaptação de fluxos de trabalho clínicos, 
interfaces de usuário e interoperabilidade com sistemas de registros médicos eletrônicos 
conhecidos como eletronic medical record (EMR) (BORKOWSKI et al., 2023). 
Enfrentar essas questões é essencial para concretizar o potencial da tecnologia para a 
área. A colaboraçãoentre profissionais de saúde, cientistas de dados, reguladores e especialistas 
em ética é fundamental para superar estas barreiras e garantir que estas tecnologias sejam 
utilizadas de forma benéfica para pacientes e profissionais da saúde. 
No contexto da saúde digital, há um crescente interesse em se aplicar LLMs, com 
destaque para o ChatGPT, que possui, por exemplo, até mesmo estudos pré-clínicos o 
mencionando como o autor. Esses estudos levantam questões éticas e de responsabilidade 
relacionadas ao conteúdo gerado pela ferramenta. Além disso, evidências mostram que o 
ChatGPT é capaz de produzir resumos de artigos científicos indistinguíveis dos criados por 
seres humanos, o que destaca seu potencial na educação em saúde. 
 
 
 
11 
O uso potencial do ChatGPT na assistência à saúde inclui dados médicos e a criação de 
materiais informativos acessíveis aos pacientes. Devemos enfatizar a importância de proteger a 
privacidade do paciente e observar diretrizes éticas ao utilizar a IA nesse contexto. Até o 
momento, nenhuma agência reguladora avaliou sua utilização na saúde (MEIRELLES; 
ARAÚJO, 2023). 
No entanto, somos alertados que há limitações da ferramenta em questões clínicas 
complexas, havendo necessidade de validação rigorosa antes de considerar seu emprego em 
tomadas de decisões clínicas. Não podemos esquecer que os LLMs podem refletir vieses 
humanos, sendo problemático em algumas situações (MEIRELLES; ARAÚJO, 2023). 
O debate em curso é de extrema relevância com relação a aplicação dos LLMs na área 
da saúde, enquanto a tecnologia continua a evoluir, seu emprego confiável na assistência à 
saúde permanece incerta. A interação humana entre médicos e pacientes continua tendo caráter 
fundamental na tomada de decisões clínicas, e a inteligência artificial deve ser considerada 
como uma ferramenta complementar (MEIRELLES; ARAÚJO, 2023). 
 
5 CONSIDERAÇÕES FINAIS 
 
A utilização dos LLMs na área da saúde representa um avanço revolucionário com o 
potencial de transformar positivamente a assistência médica. Esses modelos têm a capacidade 
de automatizar tarefas, acelerar análises de dados clínicos e melhorar a eficiência geral do setor. 
Além disso, eles podem servir como ferramentas valiosas para a pesquisa médica, contribuindo 
para descobertas importantes que podem beneficiar a saúde global. 
 No entanto, não se pode ignorar os riscos inerentes associados a essa tecnologia. A 
privacidade e segurança dos dados de pacientes devem ser prioridades absolutas para garantir 
que as informações confidenciais permaneçam protegidas contra violações e acessos não 
autorizados. Além disso, é crucial combater o viés nos modelos para evitar desigualdades no 
atendimento médico e garantir que a IA seja justa e imparcial. 
 A falta de interpretabilidade desses modelos e o potencial para erros e imprecisões 
exigem uma abordagem cuidadosa. Os profissionais de saúde devem ser treinados para usar 
essas ferramentas com discernimento, combinando a expertise clínica com as recomendações 
dos modelos. Estabelecer responsabilidade clara e regulamentações adequadas é fundamental 
para resolver questões éticas e legais. 
 Em última análise, o emprego dos grandes modelos de linguagem na saúde é um passo 
significativo para a evolução da área em direção a um futuro mais eficiente e inovador, mas é 
 
 
 
12 
um campo que requer um equilíbrio delicado entre os benefícios e riscos. Com medidas de 
segurança robustas, ações para redução de viés, supervisão humana constante e esforços 
contínuos para aprimorar a interpretabilidade, pode-se maximizar os benefícios dessa 
tecnologia, garantindo um atendimento médico de qualidade, ético e seguro para todos. 
 
 
REFERÊNCIAS 
 
BAHDANAU, D. et al. Neural machine translation by jointly learning to align and 
translate. arXiv preprint arXiv:1409.0473v7, maio 2016. Disponível em: 
https://arxiv.org/abs/1409.0473. Acesso em: 27 ago. 2023. 
 
BAI, Y. et al. Constitutional AI: Harmlessness from AI Feedback. arXiv preprint 
arXiv:2212.08073v1, Anthropic, dez. 2022. Disponível em: https://arxiv.org/abs/2212.08073. 
Acesso em: 20 ago. 2023. 
 
BANERJEE, P.; HAN, H. Language modeling approaches to information retrieval. 
ReasearchGate DOI:10.5626/JCSE.2009.3.3.143, Journal of Computing Science and 
Engineering 3(3), p. 143-164, 2009. Disponível em: https://mds.marshall.edu/wdcs_faculty/4/. 
Acesso em: 10 set. 2023. 
 
BENDER, E. M. et al. On the dangers of stochastic parrots: can language models be too 
big? FAccT'21: Proceedings of the 2021 ACM Conference on Fairness, Accountability, and 
Transparency, P. 610–623, mar. 2021. Disponível em: 
https://dl.acm.org/doi/10.1145/3442188.3445922. Acesso em: 30 ago. 2023. 
 
BERTO, V. S. R. M.; NAKANO, D. N. Metodologia da Pesquisa e a Engenharia de 
Produção, Escola Politécnica da Universidade de São Paulo – Departamento de Engenharia de 
Produção, 1998. Disponível em: http://www.abepro.org.br/biblioteca/enegep1998_art174.pdf. 
Acesso em: 28 ago. 2023. 
 
BORKOWSKI, A. A. et al. Aplicações do ChatGPT e de Modelos de Linguagem Avançados 
na Medicina e Cuidados de Saúde: Benefícios e Armadilhas. Fed Pract., [S.I.], v.40, n. 6, jun. 
2023. 
 
BROWN, T. B. et al. Language models are few-shot learners. arXiv preprint 
arXiv:2005.14165v4, OpenAI, jul. 2020. Disponível em: https://arxiv.org/abs/2005.14165 
Acesso em: 3 set. 2023. 
 
CHEN, C. et al. The times they are a-changin: healthcare 4.0 is coming! J Med Syst, 2020. 
 
CHO, K. et al. Learning phrase representations using RNN encoder–decoder for statistical 
machine translation. arXiv preprint arXiv:1406.1078v3, set. 2014. 
 
DEVLIN, J. et al. BERT: Pre-training of deep bidirectional transformers for language 
understanding. arXiv preprint arXiv:1810.04805v2, Google, maio 2019. 
 
 
 
 
13 
ESTEVA, A. et al. Dermatologist-level classification of skin cancer with deep neural 
networks. DOI:https://doi.org/10.1038/nature21056, Nature Journal, v. 542, n. 7639, p. 115-
118, jan. 2017. 
 
FAN, W. et al. Recommender systems in the era of large language models (LLMs). arXiv 
preprint arXiv:2307.02046v2, ago. 2023. 
 
GIL, A. C. Como Elaborar Projetos de Pesquisa. Grupo GEN. E-book. ISBN 
9786559771653, 2022. Disponível em: 
https://integrada.minhabiblioteca.com.br/#/books/9786559771653/. Acesso em: 06 set. 2023. 
 
HADI, M. U. et al. Large language models: a comprehensive survey of its applications, 
challenges, limitations, and future prospects. ReasearchGate DOI:10.5626/JCSE.2009.3.3.143, 
jul. 2023. 
 
HASHIMOTO, D. A. et al. Artificial intelligence in surgery: promises and perils. 
DOI:https://doi.org/10.1097/sla.0000000000002693, Annals of surgery Journal, v. 268, n. 1, 
jul. 2018. 
 
HOCHREITER, S. et al. Long short-term memory. ReasearchGate 
DOI:10.1162/neco.1997.9.8.1735, Neural Computation, dez. 1997. 
 
HOFFMANN, J. et al. Training compute-optimal large language models. arXiv preprint 
arXiv:2203.15556v1, DeepMind, mar. 2022. 
 
JAIN, S. M. Introduction to transformers for NLP: with the hugging face library and models 
to solve problems. Bangalore: Apress, p. 19-36, 2022. 
 
JI, S. et al. MentalBERT:publicly available pretrained language models for mental healthcare. 
Proceedings of the Thirteenth Language Resources and Evaluation Conference, Marseille, 
France, p. 7184–7190, jun. 2022. 
 
KADDOUR, J. et al. Challenges and applications of large language models. arXiv preprint 
arXiv:2307.10169v1, p. 34-48, 2023. 
 
KHOSRAVI, A.; TRAINOR, D.; TSANG, A. H. Estimation of Clinical Parameters of 
Coronary Artery Disease with Machine Learning Techniques: A Retrospective Study. 
Journal of Medical Systems, 43(3), 56. DOI:10.1007/s10916-019-1166-5, 2019. 
 
KUNG, T. et al. Performance of ChatGPT on USMLE: Potencial for AI-assisted medical 
education using large language models. PLOS Digit Health, 2(2), e0000198, 2023. 
 
LI, H. et al.Ethics of large language models in medicine and medical research. 
ReasearchGate DOI:10.1016/S2589-7500(23)00083-3, The Lancet Digital Health 5(6), abr. 
2023. 
 
LIU, Z. et al. AI-based language models powering drug discovery and development. 
DOI:https://doi.org/10.1016/j.drudis.2021.06.009, Drug Discovery Today Journal, v. 26, n. 11, 
jun. 2021. 
https://doi.org/10.1038/nature21056
https://doi.org/10.1097/sla.0000000000002693
https://doi.org/10.1016/j.drudis.2021.06.009
 
 
 
14 
MAATOUK, A. et al. Large language models for telecom: forthcoming impact on the 
industry. arXiv preprint arXiv:2308.06013v1, ago. 2023. 
 
MARTÍNEZ-CASTAÑO, R. et al. BERT-Based transformers for Early Detection of mental 
health illnesses. DOI:http://dx.doi.org/10.1007/978-3-030-85251-1_15, Experimental IR 
Meets Multilinguality, Multimodality, and Interaction, 12th International Conference of the 
CLEF Association, p. 189–200, set. 2021. 
 
MEIRELLES, G.; ARAÚJO, A. ChatGPT: oportunidades e desafios na era da saúde digital. 
Revista MIT Sloan Review Brasil, Inovação Científica. Disponível em: 
https://mitsloanreview.com.br/post/chatgpt-oportunidades-e-desafios-na-era-da-saude-digital, 
jan. 2023. 
 
MITTELSTADT, B.; RUSSELL, et al. Bias preservation in machine learning: the legality of 
fairness metrics under EU non-discrimination law. W. Va. L. Rev., v. 123, p. 735, 2020. 
 
NASHWAN, A. J. et al. Enhancing oncology nursing care planning for patients with cancer 
through harnessing large language models. 
DOI:https://doi.org/10.1016/j.apjon.2023.100277, Asia-Pacific Journal of Oncology Nursing, 
v. 10, n. 9, jul 2023. 
 
NAVEED, H. et al. A comprehensive overview of large language models. arXiv preprint 
arXiv:2307.06435v2, ago. 2023. 
 
OBERMEYER, Z.; EMANUEL, E. J. The Risks of Innovation in Health Care. JAMA, 
316(15), 1543-1544. doi:10.1001/jama.2016.10316, 2016 
 
OPENAI. GPT-4 Technical Report. arXiv preprint arXiv:2303.08774v3, OpenAI, mar. 2023. 
 
OUYANG, L. et al. Training language models to follow instructions with human feedback. 
arXiv preprint arXiv:2203.02155v1, OpenAI, mar. 2022. 
 
OZDEMIR, S. Quick start guide to large language models strategies and best practices for 
using ChatGPT and other LLMs. San Francisco: Addison-Wesley, p. 23-30, 2023. 
 
PANDEY, M.; MISHRA, V. Large language models in medical education and quality 
concerns. DOI:https://doi.org/10.23880/jqhe-16000319, Journal of Quality in Health Care & 
Economics, v. 6, n. 1, fev. 2023. 
 
PENTEADO, B. E. et al. The Regulation of artificial intelligence in healthcare: an 
exploratory study. ReasearchGate DOI:10.1145/3510606.3551898, Conference: SIGMIS-
CPR '22: 2022 Computers and People Research Conference, jan. 2023. 
 
PIZZINATTO, N. K.; FARAH, O. E.. Pesquisa pura e aplicada para marketing: processos 
e aplicações. São Paulo: Atlas, p. 132, 2012. 
 
RAFFEL, C. et al. Exploring the limits of transfer learning with a unified text-to-text 
transformer. arXiv preprint arXiv:1910.10683v3, Google, jul. 2020. 
http://dx.doi.org/10.1007/978-3-030-85251-1_15
https://mitsloanreview.com.br/post/chatgpt-oportunidades-e-desafios-na-era-da-saude-digital
https://doi.org/10.1016/j.apjon.2023.100277
https://doi.org/10.23880/jqhe-16000319
 
 
 
15 
REDDY, S. Evaluating large language models for use in healthcare: a framework for 
translational value assessment. DOI:https://doi.org/10.1016/j.imu.2023.101304, Informatics in 
Medicine Unlocked Journal, v. 41, jul. 2023. 
 
RUSSELL, S. J.; NORVIG, P. Artificial intelligence: a modern approach. 4. ed. Malaysia: 
Pearson, 1166 p, 2021. 
 
SINGH, S. et al. Healthcare virtual assistant. International Research Journal of 
Modernization in Engineering Technology and Science, v. 3, n. 5, maio 2021. 
 
SINGHAL, K. et al. Large language models encode clinical knowledge. 
DOI:https://doi.org/10.1038/s41586-023-06291-2, Nature Journal, v. 620, p. 172–180, jul. 
2023. 
 
SITTIG, D. F.; SINGH, H. Artificial Intelligence Applications for Improved Patient Safety 
and Quality in Health Care. Yearbook of Medical Informatics, 28(1), 195-198. doi:10.1055/s-
0039-1677895, 2019. 
 
TAN, R. S. Y. C. et al. Inferring cancer disease response from radiology reports using large 
language models with data augmentation and prompting. 
DOI:https://doi.org/10.1093/jamia/ocad133, Journal of the American Medical Informatics 
Association, v. 30, n. 10, p. 1208-1216, set. 2023. 
 
TAYLOR, R. et al. Galactica: A large language model for science. arXiv preprint 
arXiv:2211.09085v1, Meta AI, nov. 2023. 
 
TIAN, S. et al. Opportunities and challenges for ChatGPT and large language models in 
Biomedicine and health. arXiv preprint arXiv:2306.10070v1, jun. 2023. 
 
TOPOL, E. Deep medicine: how artificial intelligence can make healthcare human again. 
New York: Basic books, 2019. 400 p. 
 
ULUDOGAN, G. et al. Exploiting pretrained biochemical language models for targeted 
drug design. DOI:https://doi.org/10.1093/bioinformatics/btac482, Bioinformatics Journal, v. 
38, n. 2, p. 155-161, set. 2022. 
 
VASWANI, A. et al. Attention is all you need. arXiv preprint arXiv:1706.03762v7, Google 
Brain, ago. 2023. 
 
WEI, J. et al. Emergent abilities of large language models. arXiv preprint 
arXiv:2206.07682v2, oct. 2022. 
 
WU, S. et al. BloombergGPT: A large language model for finance. arXiv preprint 
arXiv:2303.17564v2, Bloomberg, maio 2023. 
 
YANG, R. et al. Large language models in health care: Development, applications, and 
challenges. DOI:http://dx.doi.org/10.1002/hcs2.61, Health Care Science - Wiley and Tsinghua 
University Press, v. 2, n. 4, p. 255-263, jul. 2023. 
https://doi.org/10.1016/j.imu.2023.101304
https://doi.org/10.1038/s41586-023-06291-2
https://doi.org/10.1093/jamia/ocad133
https://doi.org/10.1093/bioinformatics/btac482
http://dx.doi.org/10.1002/hcs2.61
 
 
 
16 
ZHANG, K. et al. Clinically applicable AI system for accurate diagnosis, quantitative 
measurements, and prognosis of COVID-19 pneumonia using computed tomography. 
DOI:https://doi.org/10.1016/j.cell.2020.04.045, Cell Press Journal, v. 181, n. 6, p. 1423-1433, 
abr. 2020. 
 
ZHENG, Z. et al. Towards an understanding of large language models in software 
engineering tasks. arXiv preprint arXiv:2308.11396v1, ago. 2023. Disponível em: 
https://arxiv.org/abs/2308.11396. Acesso em: 2 set. 2023. 
 
ZHOU, S. et al. CancerBERT: a cancer domain-specific language model for extracting breast 
cancer phenotypes from electronic health records. DOI:https://doi.org/10.1093/jamia/ocac040, 
Journal of the American Medical Informatics Association, v. 29, n. 7, p. 1208-1216, jun. 2022. 
 
 
https://doi.org/10.1016/j.cell.2020.04.045
https://doi.org/10.1093/jamia/ocac040
 
 
 
17 
ANEXO A – CRONOGRAMA GERAL 
 
ATIVIDADES Q1 Q2 Q3 Q4 Q5 Q6 Q7 
Delimitação do tema 
 
Definição do objeto de estudo 
 
Revisão da literatura 
 
Entrega parcial 
 
Coleta de dados bibliográficos 
 
Análise e discussão dos resultados 
 
Considerações Finais 
 
Revisão Final 
 
Entrega Final 
 
Quadro 1 – Cronograma de atividades

Mais conteúdos dessa disciplina