A APLICAÇÃO DA^GAPRENDIZAGEM DE MÁQUINA NA ^G ^G DETECÇÃO DE FA

Psicologia do Desenvolvimento e da Aprendizagem

•

Escola Dom Henrique Ruth

solben

27/05/2024

Prévia do material em texto

A APLICAÇÃO DA APRENDIZAGEM DE MÁQUINA NA
DETECÇÃO DE FAKE NEWS
Thallya

INTRODUÇÃO

O advento da era digital e das redes sociais trouxe consigo uma explosão de
informações, tornando mais fácil do que nunca o compartilhamento de notícias e informações.
No entanto, esse livre fluxo de informações também abriu as portas para um fenômeno
preocupante: a disseminação descontrolada de notícias falsas, amplamente conhecidas como
"fake news". Nesse sentido, esta pesquisa tem como objetivo geral explorar a aplicação da
aprendizagem de máquina na detecção de fake news, analisando os desafios inerentes a essa
tarefa e delineando perspectivas futuras. Como objetivos específicos, visa-se identificar as
atribuições das fake news disseminadas na internet, examinar os procedimentos de
processamento de linguagem natural e investigar as categorizações das notícias falsas.
Os algoritmos de aprendizado de máquina emergiram como ferramentas promissoras
para abordar o problema das fake news, levantando questões essenciais sobre sua eficácia e
aplicabilidade. Neste contexto, este estudo investiga como os algoritmos de aprendizado de
máquina podem ser aplicados de maneira eficaz para detectar fake news, considerando a
complexidade das informações disponíveis on-line e a velocidade com que são compartilhadas.
A identificação de notícias falsas envolve a análise de uma variedade de características
linguísticas e padrões de comportamento humano. Assim, este artigo também busca responder
à pergunta: quais características linguísticas e padrões de comportamento humano são mais
relevantes para identificar notícias falsas? A análise de sentimentos, a verificação de fontes e
outros atributos desempenham papéis cruciais nesse processo, e sua compreensão é essencial
para o desenvolvimento de modelos eficazes de detecção de fake news.
Além disso, a pesquisa avalia o impacto da detecção automatizada de fake news na
disseminação de informações precisas. A implementação bem-sucedida de sistemas de
detecção de fake news em plataformas de mídia social pode desempenhar um papel vital na
contenção da propagação de informações enganosas, contribuindo para a criação de ambientes
online mais confiáveis e seguros.
A justificativa para este estudo é incontestável, dado o impacto abrangente da
disseminação de fake news na sociedade contemporânea. A desinformação e a manipulação da
opinião pública, a erosão da confiança nas fontes de informação, os riscos à segurança e à
estabilidade política, a amplificação pelas redes sociais e os impactos na saúde pública são
fatores que demandam uma abordagem multidisciplinar e baseada em evidências.
Portanto, esta pesquisa é vital para o desenvolvimento de ferramentas e métodos que
combatam eficazmente a disseminação de fake news. Além de criar algoritmos de detecção, é
essencial compreender as raízes psicológicas e sociais da propagação de notícias falsas, bem
como formular políticas e estratégias eficazes para enfrentar esse fenômeno. Ela desempenha
nesta área um papel crucial na proteção da democracia, da confiança pública e na disseminação
de informações precisas, contribuindo para um ambiente de informação mais saudável e
responsável.

1. REFERENCIAL TEÓRICO

O tópico abordado a seguir, estabelece as bases para compreensão das fake News.
Explorando a importância da mineração de texto, o papel significativo das Máquinas de
Vetores de Suporte e a influência profunda das notícias enganosas na sociedade. Essas
informações fornecem uma fundação para a pesquisa em questão, permitindo uma análise do
tema.

1.1 Fake news e suas características

As fakes news, ou notícias falsas, são uma problemática recorrente no cenário
contemporâneo da informação. Trata – se de informações deliberadamente enganosas
apresentadas como notícias legítimas, com intuito de iludir e manipular o leitor. O impacto
dessas notícias enganosas transcede a mera disseminação de informações incorretas, uma vez
que são criadas com o propósito de confundir e enganar.
Um exemplo notável da influência das fake news ocorreu durante as eleições
presidenciais dos Estados Unidos em 2016, quando a internet se tornou um campo fértil para
proliferação dessas informações falsas. A partir desse evento, o fenômeno das fake news
ganhou destaque, tornando – se um desafio global que afeta desde comunidades locais até
esferas de repercussão internacional.
A identificação das fake news envolve a análise de várias características distintivas. Os
sites que as hospedam costumam utilizar domínios com terminações “.com” ou “.org”,
dificultando a verificação da autenticidade em comparação com os domínios “.br”. Além disso,
esses sites frequentemente adotam nomes semelhantes aos de veículos de notícias respeitáveis,
dificultando a distinção entre fonte confiáveis e enganosas. O conteúdo das fake news
geralmente carece de autoria clara, é repleto de opiniões tendenciosas e exibe layouts
desorganizados e cheios de propagandas. Raramente apresentam uma página de “quem somos”
e quando fazem, a identificação dos autores costuma ser ambígua.
A disseminação das fakes news foi exacerbada pelas redes sociais e pela automação. A
automação se manifesta por meio de robôs ou bots, controlados por software, que
desempenham um papel ativo nas redes sociais, participando de discussões e compartilhamento
de notícias falsas. Esse cenário cria um ambiente propício para disseminação em massa de fake
news, ampliando o alcance dessas informações enganosas.
Curiosamente, as fake news compartilham semelhanças notáveis com o spam, que se
refere ao envio de mensagens eletrônicas não solicitadas com objetos como publicidade
indesejads. Ambos os tipos de conteúdo frequentemente incluem erros gramaticais, tentivas de
manipulação da opinião do leitor, vocabulário limitado e poluição visual. Essas semelhanças
permitiriam a aplicação de abordagens comuns para a filtragem de spam e a detecção de fake
news.

1.2 Mineração de texto

A mineração de texto, também conhecida como Knowledge Discovery in Texts (KDT),
é uma área crucial para a detecção de fake news. Ela engloba o processo de extração de
informações valiosas a partir de documentos de texto não estruturados. Esta disciplina é uma
subárea da Descoberta de Conhecimento em Banco de Dados (KDD), que visa extrair
informações significativas a partir de conjunto de dados. O processo de mineração de texto é
composto por diversas etapas interligadas:

Seleção de Amostras
Na fase inicial, é essencial identificar o problema a ser resolvido e selecionar amostras
de dados relevantes. Para a detecção de fake news, as amostras podem ser coletadas a partir de
uma variedade de fontes, como sites de notícias e mídias sociais.
Pré - Processamento dos Dados
A etapa de pré-processamento envolve a formatação e preparação dos dados para
análise. Isso geralmente envolve transformar os dados em vetores de características, onde cada
característica representa a presença ou frequência de palavras em um documento.
Aplicação dos Algoritmos de Mineração de Dados
Nesta fase, são selecionados algoritmos de aprendizado de máquina para realizar a
mineração de dados. Esses algoritmos são treinados com os dados de treinamento e
posteriormente aplicados para fazer previsões em novos dados.
Avaliação dos Resultados
Na última etapa, ocorre a avaliação do desempenho dos algoritmos. Esse processo
envolve o cálculo de métricas de desempenho, tais como acurácia (avaliando a precisão do
modelo), precisão (mensurando a proporção de itens identificados como positivos que são
verdadeiramente positivos), recall (quantificando quantos dos positivos reais foram
corretamente identificados) e especificidade(determinando quantos dos negativos reais foram
adequadamente identificados). Além disso, técnicas de validação cruzada, como o k-fold cross-
validation, são empregadas para avaliar o desempenho do modelo em diferentes conjuntos de
dados.

1.3 Aprendizado de Máquina

O aprendizado de máquina desempenha um papel fundamental na detecção de fake
news. É uma subárea da inteligência artificial que se concentra no desenvolvimento de técnicas
computacionais capazes de adquirir conhecimento de forma automática. Os sistemas de
aprendizado de máquina aprimoram seu desempenho em tarefas específicas com base na
experiência adquirida.
Existem duas categorias principais de tarefas no aprendizado de máquina: aprendizado
supervisionado e aprendizado não supervisionado. O aprendizado supervisionado envolve a
previsão de valores a partir de dados previamente rotulados, enquanto o aprendizado não
supervisionado lida com a exploração e descrição de conjuntos de dados sem atribuições de
classe.
No contexto do aprendizado de máquina, o algoritmo chamado Máquinas de Vetores
de Suporte (SVM) é uma ferramenta valiosa para detectar fake news. SVMs são especialmente
úteis quando precisamos classificar dados em duas categorias. Elas trabalham encontrando uma
“linha divisória” que maximize a distância entre as categorias, tornando-se uma abordagem
eficaz quando os dados podem ser separados de forma linear. Mas, quando os dados não podem
ser separados dessa maneira, as SVMs usam truques matemáticos, chamados de funções de
kernel, para tornar a separação possível.
Na detecção de fake news, frequentemente lidamos com dados que não podem ser
separados linearmente. Nesse caso, as SVMs não-lineares, que usam essas funções de kernel
para criar espaços de características mais complexos, são a melhor opção. A escolha do tipo de
função de kernel e a configuração de parâmetros, como a constante de regularização C, são
vitais para o sucesso das SVMs na detecção de fake news.
Identificar fake news é um desafio na era da informação digital. A mineração de texto
e o aprendizado de máquina, com foco nas SVMs, desempenham um papel essencial na solução
desse problema. Dominar essas técnicas é fundamental para combater a disseminação de
informações enganosas e promover a integridade da informação em nosso mundo cada vez
mais conectado.

1.4 A influência das fake news na sociedade

A influência das fake news na sociedade é um fenômeno complexo e multifacetado.
Em primeiro lugar, as fake news têm o poder de moldar a opinião pública de maneiras
significativas. Elas podem influenciar o resultado de eventos importantes, como eleições, ao
disseminar informações falsas ou enganosas sobre candidatos ou questões. Isso é
particularmente preocupante, pois pode minar a integridade do processo democrático e corroer
a confiança do público nas instituições democráticas. Além disso, as fake news podem incitar
violência e criar divisões na sociedade ao alimentar preconceitos e promover a desinformação.

Em segundo lugar, as fake news podem ter um impacto significativo na saúde
pública. Durante a pandemia da COVID-19, por exemplo, a disseminação de informações
falsas ou enganosas sobre o vírus levou a comportamentos prejudiciais à saúde, como a recusa
em usar máscaras ou a resistência à vacinação. Além disso, a desinformação sobre a COVID-
19 contribuiu para a desconfiança em relação às autoridades de saúde e dificultou os esforços
para controlar a propagação do vírus.
Em terceiro lugar, as fake news podem minar a confiança nas instituições. Quando
as pessoas são constantemente expostas a informações falsas, elas podem começar a duvidar
da veracidade de todas as notícias que consomem. Isso pode levar a um ceticismo generalizado
em relação à mídia e ao governo, o que pode corroer ainda mais a confiança do público nas
instituições.
No entanto, apesar desses desafios, há esperança. O aprendizado de máquina
emergiu como uma ferramenta promissora para combater o problema das fake news.
Algoritmos de aprendizado de máquina podem ser treinados para detectar notícias falsas com
base em várias características, como o estilo de escrita e a estrutura da notícia. Esses algoritmos
podem então ser usados para filtrar notícias falsas antes que elas sejam disseminadas, ajudando
a limitar seu alcance e impacto.
Em conclusão, as fake news têm uma influência significativa na sociedade. É
crucial que continuemos a pesquisar e desenvolver métodos eficazes para detectar e combater
notícias falsas. Ao fazer isso, podemos ajudar a proteger a integridade de nossa sociedade e
promover um ambiente de informação mais preciso e confiável. A luta contra as fake news é
uma responsabilidade compartilhada que requer o esforço conjunto de indivíduos,
comunidades, empresas de tecnologia e governos.
METODOLOGIA
Este presente trabalho, é uma pesquisa de revisão bibliográfica que se caracteriza
pelo estudo de pesquisas prévias, como artigos acadêmicos, trabalhos e relatórios, com o
objetivo de explorar a aplicação da aprendizagem de máquina na detecção de fake News e a
compreensão dos desafios relacionados a essa questão. O trabalho foi conduzido por meio de
busca externa em literaturas relevantes.
Para coletar tais literaturas, utilizamos uma pesquisa sistemática em diversas fontes
de dados, incluindo bases acadêmicas, repositórios institucionais e bibliotecas digitais. As
principais fontes de dados usadas incluem PubMed, IEEE Xplore, Google Scholar e JSTOR.
As palavras-chave utilizadas na pesquisa incluem "fake news", "detecção de fake
news", "aprendizado de máquina", "processamento de linguagem natural", "algoritmos de
classificação", entre outras. Os critérios de inclusão para os estudos consideraram trabalhos
publicados entre os anos de 2000 e 2023, escritos em inglês e português.
A análise dos estudos selecionados foi realizada por meio de uma leitura
exploratória e, posteriormente, uma leitura seletiva, seguindo uma abordagem qualitativa. Essa
análise visou extrair informações relevantes sobre a detecção de fake news, incluindo as
técnicas, os algoritmos e as estratégias empregadas nos estudos.
Essa metodologia permitirá uma análise abrangente do estado da arte da detecção
de fake news, incorporando resultados e perspectivas de pesquisa relevantes que são
fundamentais para a compreensão e mitigação desse fenômeno nas mídias digitais.

REFERÊNCIAS

APRENDER CIÊNCIA DE DADOS. Máquina de vetores de suporte (SVM) - Aprender
Ciência de Dados. Disponível em: https://www.aprendeercienciadedados.com/svm.

SCIELO. A avaliação da aprendizagem como um ato amoroso: o que o professor pratica?
Disponível em: https://www.scielo.br/avaliacao-da-aprendizagem

FERREIRA, João Rodrigo Santos; LIMA, Paulo Ricardo Silva; SOUZA, Edivanio Duarte de.
Desinformação, infodemia e caos social: impactos negativos das fake news no cenário da
COVID-19. Em Questão, v. 27, n. 1, jan./mar. 2021. Disponível em:
https://doi.org/10.19132/1808-5245271.30-53.

GARCIA, Gabriel Lino. Detecção de Fake News utilizando Aprendizado de Máquina. 2023.
79 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Estadual Paulista,
Bauru, 2023. Disponível
em: https://repositorio.unesp.br/bitstream/handle/11449/242304/garcia_gl_me_bauru.pdf?seq
uence=3.

OLIVEIRA, Leandro Massetti Ribeiro. Inteligência Artificial Aplicada a Detecção de Fake
News. 2019. Trabalho de Conclusão de Curso (Graduação em Ciências Naturais/Química) -
Universidade Federal do Maranhão, São Luís, 2019. Disponível
em: https://monografias.ufma.br/jspui/handle/123456789/4251

ANDRADE, Renan Rocha de. Utilização de técnicas de aprendizado de máquina
supervisionado para detecção de Fake News. Universidade do Sul de Santa Catarina
(UNISUL), Tubarão, SC, Brasil. Disponível
em: https://repositorio.animaeducacao.com.br/bitstream/ANIMA/8445/1/ArtigoTCC2.pdf.

SILVA, Ithalo Henrique da. Análise de sentimentos em textos curtos para detecção de Fake
News. 2021. 54 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) -
Faculdade Doctum de Teófilo Otoni, Teófilo Otoni, 2021. Disponível
em: http://dspace.doctum.edu.br:8080/bitstream/123456789/270/2/TCC Final entrega - Ithalo
Henrique.pdf

SANTOS, Jéssica Cristina dos; SILVA, Leandro Nunes da. Fake News e a influência na
sociedade: um estudo de caso das eleições presidenciais de 2018. 2019. 57 f. Trabalho de
Conclusão de Curso (Graduação em Sistemas de Informação) - Universidade Federal do
Maranhão, Imperatriz, 2019. Disponível
em: https://monografias.ufma.br/jspui/handle/123456789/4251

SILVA, Rafael da; OLIVEIRA, Renan de. Projeto de um Sistema Web à Classificação de
Notícias Falsas Utilizando Técnicas de Aprendizado de Máquina. 2021. 57 f. Trabalho de
Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal de Santa
Catarina, Florianópolis, 2021. Disponível em:
https://d1wqtxts1xzle7.cloudfront.net/69162145/10211-
libre.pdf?1631037231=&response content disposition=inline%3B+filename%3DProjeto_d
e_um_Sistema_Web_a_Classificaca.pdf&Expir
es=1694613696&Signature=dqCuHXq5dItOAFtOby1-
iROdTtK~o3el2~e7fyvcd9mBXTVs1N7SN3Wth6SMt7yWPmZ49-
uE~byk1E2zwLDu pJBMV9yiXmINx~jHil8NAQXUfwNO1al7JyiCMydJpBocd9lM2DGta
REPBuig0z- ~CzrydjVsYJLtCsboPxUqlSd3zMXmroCT9YDHmPW~GqZxfIU2mqr-
MC7ayI qvD3LzasxsvEdKrch5-pagdFOhpUPpHyJ7SChPa78GZoYHR-
9~k6j9w Ps5Je0epf1k801vdJj5Bnc2Zr~cTQsP5XbInA1TK9aiZAoo8xoqW9TK3Dks2u8Ps
Hl47wgxBwykqE A__&Key-Pair-Id=APKAJLOHF5GGSLRBV4ZA.

SILVA, Thaís da; OLIVEIRA, Thiago de. Fake News: Uma análise sobre a influência das
notícias falsas nas eleições presidenciais de 2018. 2019. 57 f. Trabalho de Conclusão de Curso
(Graduação em Ciências Naturais/Química) - Universidade Federal de Santa Catarina,
Florianópolis, 2019. Disponível
em: https://sol.sbc.org.br/index.php/latinoware/article/view/10343
https://monografias.ufma.br/jspui/handle/123456789/4251
https://sol.sbc.org.br/index.php/latinoware/article/view/10343