Prévia do material em texto
Tangara da Serra - MT 2023 ODAIR DA SILVA MATTOS UNIVERSIDADE ANHANGUERA ENGENHARIA DE SOFTWARE - BACHARELADO RELATÓRIO DE AULA PRÁTICA: TÉCNICAS DE INTELIGÊNCIA ARTIFICIAL Tangara da Serra – MT 2023 RELATÓRIO DE AULA PRÁTICA: TÉCNICAS DE INTELIGÊNCIA ARTIFICIAL Trabalho de portfólio apresentado como requisito parcial para a obtenção de pontos para a média semestral. Orientador: Vinicius Camargo Prattes ODAIR DA SILVA MATTOS SUMÁRIO 1 INTRODUÇÃO ..................................................................................................................... 3 2 DESENVOLVIMENTO ........................................................................................................ 4 2.1 ATIVIDADE PROPOSTA ............................................................................................. 4 3 CONCLUSÃO ...................................................................................................................... 9 REFERÊNCIAS BIBLIOGRÁFICAS .................................................................................. 10 3 1 INTRODUÇÃO A Inteligência Artificial (IA) é uma das áreas de estudo mais importantes da Atualidade. Com o avanço da tecnologia, a IA tem se tornado cada vez mais presente em nossa vida cotidiana, desde assistentes virtuais em nossos smartphones até sistemas de reconhecimento facial e de voz em dispositivos eletrônicos. Além disso, a IA tem aplicação em diversos setores, como saúde, finanças, indústria e comércio. Nesse contexto, as técnicas de aprendizado de máquina têm se destacado como uma das principais formas de implementar sistemas de IA. Através de algoritmos que "aprendem" com dados, é possível criar modelos que realizam previsões e classificações com uma precisão cada vez maior. A aula prática de Técnicas de Inteligência Artificial com o uso do software Weka tem como objetivo explorar o potencial dessas técnicas na criação de uma Rede Neural Perceptron de multicamadas para previsão de diferentes tipos de outputs. Através da experimentação, será possível aprender a preparar os dados, criar e ajustar o modelo de rede neural, e interpretar corretamente os resultados obtidos. Essa aula prática é de suma importância para aqueles que desejam se aprofundar no estudo de IA e suas aplicações, já que o software Weka é uma ferramenta amplamente utilizada na área. Além disso, o aprendizado de técnicas de redes neurais permitirão explorar a capacidade de previsão e classificação desses modelos. 4 2 MÉTODOS 2.1 ATIVIDADE PROPOSTA Primeiramente, o software Weka foi aberto e, dentro de seu diretório de instalação, encontramos a pasta “data”, que contém alguns dados disponibilizados para o uso direto do software. Na pasta, abrimos o arquivo “diabetes.arff”, observando que esta base de dados continha 9 atributos (colunas) contendo 768 instâncias (linhas). Clicando em “Visualize All” podemos visualizar a distribuição das variáveis da base de dados: Figura 1 - distribuição das variáveis da base de dados. Fonte: O autor (2023). Lembrando que o objetivo da aula prática era o de implementar uma Rede Neural Perceptron de multicamadas em uma base de dados afim de prever via Classificação os outputs e comparar os resultados do modelo de acordo com a variação no tamanho dos dados de teste e treino. Para tal, seguimos os seguintes passos: 5 Clicamos em “Classify” no canto superior esquerdo da janela e em “Classifer”, clicamos no botão “Choose”, na pasta “function” a função “MultilayerPercepton” foi selecionada. Em “Test options” a opção “Use training set” foi selecionada e em seguida foi clicado em “Start”. Na janela “Classifier”, foi clicado sobre o nome “MultilayerPerceptron”. Esta janela contém algumas configurações que podem ser editadas acerca do modelo de Rede Neural. Foi clicado na caixa de seleção “GUI” e a opção “True” foi selecionada. Depois foi clicado em “Ok”. O modelo foi novamente rodado, clicando-se no botão “Start” e uma janela nova com a seguinte imagem apareceu: Figura 2 – janela Neural Network. Fonte: O autor (2023). Nesta nova janela chamada “Neural Network”, foi clicado em “Start” e depois no botão “Accept”. No “Classifer output”, na imagem a seguir, é analisado os resultados da tela “Classifier output” principalmente os valores de “Root mean squared error” e da “Confusion Matrix”. 6 Figura 3 – Resultados da tela “Classifier Output”. Fonte: O autor (2023). Em sequência, os dados foram divididos de tal forma que 75% fossem dados para teste e o resto fosse dados para treino do modelo. Em “Test options” foi clicado na opção “Percentage split” e digitado 75 no campo ao lado do símbolo de ‘%’. Depois foi clicado em “Start”. A janela “Neural Network” se abriu novamente e foi clicado em “Start” e depois “Accept” nesta janela duas vezes. A imagem a seguir apresenta o resultado disso, e comparem-se os valores da “Root mean squared error” e “Confusion Matrix” com o do modelo anterior. 7 Figura 4 – nova janela Neural Network. Fonte: O autor (2023). Figura 5 – resultados finais. Fonte: O autor (2023). Como se pode ver, os seguintes dados de “Root mean squared error” estão disponíveis: 0.4146. Na primeira execução, utilizou-se a opção "Use training set" e obteve-se um valor de "Root mean squared error" de 0.3815 e uma matriz de confusão com 401 valores classificados como "tested_negative" e 218 valores classificados como 8 "tested_positive". Na segunda execução, dividiram-se os dados em 75% para teste e 25% para treino, obtendo-se um valor de "Root mean squared error" de 0.4146 e uma matriz de confusão com 114 valores classificados como "tested_negative" e 34 valores classificados como "tested_positive". Os valores da "Root mean squared error" indicam a média quadrática da diferença entre os valores reais e os valores previstos pelo modelo. Já a matriz de confusão mostra a relação entre os valores reais e os valores previstos, permitindo avaliar o desempenho do modelo. Os valores diferentes em ambos os modelos podem ser explicados pela variação no tamanho dos dados de teste e treino, que afetam a precisão das previsões e, consequentemente, a taxa de acertos e erros do modelo. Os valores de "Root mean squared error" e "Confusion Matrix" são métricas usadas para avaliar a precisão e desempenho do modelo de rede neuralimplementado no software Weka. O "Root mean squared error" (RMSE) é uma medida de quão bem o modelo de rede neural se ajusta aos dados de treinamento e teste. Quanto menor o valor do RMSE, melhor é o ajuste do modelo aos dados. Já a "Confusion Matrix" é uma tabela que mostra a relação entre as classes reais e as classes previstas pelo modelo. Ela é usada para avaliar a capacidade do modelo de classificação de prever corretamente as classes dos dados de teste. Ao dividir os dados em 75% para teste e 25% para treino, os resultados de "Root mean squared error" e "Confusion Matrix" mudaram em relação ao primeiro modelo. Isso ocorre porque o modelo foi treinado com uma quantidade menor de dados, o que pode afetar a precisão e a capacidade de generalização do modelo. Além disso, é importante lembrar que a qualidade dosdados de treinamento e teste também pode influenciar nos resultados, já que dados de má qualidade podem prejudicar a performance do modelo. 9 3 CONCLUSÃO Em conclusão, a atividade prática de criação e interpretação de modelos de rede Neural Perceptron de multicamadas utilizando o software Weka é de extrema importância para o aprendizado em Técnicas de Inteligência Artificial. Através deste experimento, foi possível explorar e aplicar conceitos teóricos na prática, criando modelos de previsão de diferentes tipos de outputs a partir de uma base de dados disponibilizada pelo software Weka. Além disso, ao comparar os resultados obtidos com a variação no tamanho dos dados de teste e treino, foi possível verificar a influência dessa variação na precisão do modelo. Os valores de "Root mean squared error" e "Confusion Matrix" foram analisados para avaliar o desempenho dos modelos, fornecendo informações valiosas para entender como melhorar a precisão da previsão. Desta forma, atividades práticas como essa são fundamentais para o aprendizado de Técnicas de Inteligência Artificial, pois permitem aplicar conceitos teóricos em situações reais e preparar para o trabalho em diversas áreas que utilizam técnicas de aprendizado de máquina. 10 REFERÊNCIAS BIBLIOGRÁFICAS BISHOP, Christopher M. Pattern Recognition and Machine Learning. Springer, 1st edition, 2006. GOODFELLOW, Ian, et al. Deep Learning. MIT Press, 1st edition, 2016. HASTIE, Trevor, et al. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer, 2nd edition, 2009.