Baixe o app para aproveitar ainda mais
Prévia do material em texto
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 1/26 MODELOS DE APRENDIZADOMODELOS DE APRENDIZADO DE MÁQUINA DE MÁQUINA UNIDADE 1 – INTRODUÇÃO ÀUNIDADE 1 – INTRODUÇÃO À APRENDIZAGEM DE MÁQUINA APRENDIZAGEM DE MÁQUINA Autora: Stella Marys Dornelas Lamounier Autora: Stella Marys Dornelas Lamounier Revisor: Fernando Esquirio Torres Revisor: Fernando Esquirio Torres INICIAR Introdução O aprendizado de máquina se tornou um dos modelos de sistema computacionais com melhores resultados, estando disperso pela maioria das áreas do conhecimento. Problemas complexos que antes eram impossíveis de se resolver utilizando sistemas comuns agora são resolvidos com o surgimento de sistemas inteligentes. Isso porque o aprendizado de uma máquina reproduz, por meio de técnicas e algoritmos que imitam o conhecimento humano, análises de dados que são gerados a todo momento. Esses sistemas são capazes de reconhecer imagens, falas, auxiliar médicos em diagnósticos e tratamentos e até identificar SPAM e transações bancárias legais ou fraudulentas. Os modelos de aprendizado mais utilizados são o supervisionado e o não supervisionado. O primeiro é utilizado quando já temos os rótulos de dados estabelecidos, ou seja, o conjunto de dados é previamente conhecido. São divididos em modelos de classificação e regressão. Já no aprendizado não supervisionado não existem dados a priori, ou seja, o sistema analisa os dados a partir de similaridades ou com objetivos semelhantes no conjunto. Esses dados, então, são separados em grupos divididos em, modelos de agrupamento e associação. Não podemos deixar de citar o aprendizado semissupervisionado, que engloba técnicas dos dois modelos anteriores, isto é, pode utilizar dados rotulados e não rotulados, tendo, como objetivo, uma melhor acurácia por poder misturar estes dois tipos de dados. Ainda podemos contar com a aprendizagem por reforço: muito diferente de todos os modelos citados, essa técnica não utiliza nenhum conjunto de treinamento, seja rotulado ou não. A máquina utiliza o processo de tentativa e erro para encontrar a solução do problema, recebendo recompensas e penalidades para executar uma determinada ação. 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 2/26 1.1 Aprendizagem de máquina – visão geral Não se pode falar de aprendizado de máquina sem antes citar a inteligência artificial, campo da ciência da computação que estuda e constrói sistemas inteligentes, máquinas automatizadas que imitam o conhecimento humano para desempenhar tarefas ou resolver problemas complexos (RUSSEL; NORVIG, 2013). A inteligência artificial (IA) surgiu por volta da década de 1950, como uma das áreas mais importantes do meio tecnológico para a humanidade. Com o avanço das tecnologias, na época, a expectativa era que chegaríamos a um patamar tecnológico que nenhuma máquina havia chegado. No entanto, houve uma série de fracassos e decepções nos projetos que envolviam a IA, mas, mesmo assim, outros campos da ciência da computação evoluíram, como por exemplo a engenharia de software, bancos de dados e processamento compartilhado. Nesse ínterim, é possível afirmar que a IA representa o auge da tecnologia computacional, com diferentes características cada uma de acordo com a forma com a qual se abordam as questões de inteligência ou o problema a ser solucionado (MEDEIROS, 2018). Portanto, é preciso saber a definição adequada do termo aprendizado em sistemas inteligentes, que segundo Mendel e McLaren (1994, p. 287), é: Inteligência Artificial » Clique nas abas para saber mais sobre o assunto De acordo com Luger (2013), duas preocupações ainda norteiam os pesquisadores em IA: a representação do conhecimento e a busca . A primeira trata como capturar a linguagem formal, isso é, a linguagem adequada para ser manipulada pelo computador, formular resposta para as seguintes perguntas: como será representado o conhecimento humano? Como programas inteligentes devem representar conhecimento? A busca é a solução ótima do problema, quais estágios sucessivos e alternativos devem ser seguidos para a resolução do problema, como por exemplo, diferentes configurações do tabuleiro em um jogo de xadrez. Segundo Mehta (2017) e Barnes (2015), a IA possui seis campos do saber: Processamento de linguagem natural; Representação de conhecimento; Raciocínio automatizado; Aprendizado de máquina; Visão computacional; Robótica. Aprendizado é o processo pelo qual um sistema inteligente é adaptado através do estímulo do ambiente no qual está inserido. O tipo de aprendizado é determinado pela maneira através da qual esta adaptação é realizada. 1950 1980 2010 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 3/26 O aprendizado de máquina é uma área da IA em que os algoritmos são capazes de aprender, a partir de conjuntos de dados, modelos de aprendizagem e análises anteriores para prever resultados, tendências e padrões. Nesse sentido, Faceli et al. (2015) destacam que: O aprendizado de máquina ( Machine Learning ) é uma das ferramentas tecnológicas mais discutidas nos tempos atuais. Os sistemas dotados desse tipo de tecnologia têm auxiliado empresas no processo de tomada de decisões, por meio da construção de sistemas capazes de auxiliar gestores e demais profissionais de modo automatizado. São sistemas capazes de tomar decisões baseadas em informações anteriores, ou seja, experiências já adquiridas por soluções bem-sucedidas de problemas ocorridos anteriormente (BRINK e RICHARDS, 2016). Cada vez mais esse termo ganha espaço nas organizações, embora não seja um método totalmente novo no mercado. O termo surgiu no final da década de 1950, com o engenheiro Arthur Samuel, do Instituto de Tecnologia de Massachusetts (MIT), que popularizou o termo Machine Learning , que ele descrevia como um campo de estudo que dá aos computadores a habilidade de aprender sem terem sido programados para isso um sistema de computador capaz de jogar damas com um humano. O sistema analisava cada movimento do jogo e aprendia com os erros e acertos do adversário humano, assim, a cada partida jogada, o computador conseguia prever, com precisão, quais seriam as melhores jogadas a serem feitas (AL MAYAHI; AL-BAHRI, 2020). Entretanto, sua popularização só tomou força devido ao grande volume de dados gerados pelas organizações depois da popularização da internet. Além disso, o melhoramento tecnológico de hardware potencializou ainda mais o desenvolvimento da aprendizagem de máquina. Esse último elemento (potência) proporcionou maior acesso a ferramentas de Machine Learning, devido à diminuição do preço dos hardwares que suportavam efetivamente essas atividades tecnológicas. Atualmente, é possível processar enormes quantidades de dados com um baixo custo de operação (MARQUES, 2017). Embora muitos algoritmos de aprendizado de máquina já existam há muito tempo, é importante entender o processamento e a funcionalidade de cada um, sua capacidade de processar dados e o modelo adotado para, assim, escolher o modelo que deve se adaptar melhor quando um enorme volume de dados chegar. Assim, o modelo Em Aprendizado de Máquina, computadores são programados para aprender com a experiência passada. Para tal, empregam um princípio denominado indução, no qual se obtêm conclusões genéricas a partir de um conjunto particular de exemplos. Assim, algoritmos de Aprendizado de Máquina aprendem a induzir uma função ou hipótese capaz de resolver um problema a partir de dados que representam instâncias do problema a ser resolvido (FACELI et al., 2015, p. 3). VOCÊ SABIA? O termo aprendizado de máquina é frequentemente confundido com inteligência artificial? A IA é a ciência e a engenharia de criar máquinas inteligentes, especialmente programas de computador inteligentes e o aprendizado de máquina (ML) pode ser definidocomo um modo de implementar a inteligência artificial. Semelhante a IA, o aprendizado de máquina é um ramo da ciência da computação que desenvolve ou estuda o design de algoritmos. Em resumo, a IA é uma grande área que contempla o aprendizado de máquina, o aprendizado profundo e a ciência de dados, responsável pela análise e a manipulação de conjuntos de dados (DIAS, 2019). 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 4/26 escolhido deve ser capaz de se ajustar por meio de treinamento e com a entrada de mais novos dados quando a primeira resposta não for a desejada (SAS, 2019). Os sistemas de aprendizado de máquina são, sem dúvida, ferramentas crescentes que já fazem parte do nosso cotidiano e nos ajudam a encontrar insights e padrões valiosos nos dados, detalhes que não seriam identificados por métodos tradicionais. No mundo real, essas técnicas oferecem um modo de identificar tendências, prever comportamentos e fazer recomendações baseadas em fatos e aplicações de gestão. Ajudam, também, na criação de mecanismos de segurança, carros autônomos, campanhas de marketing (BRINK; RICHARDS, 2016). A Figura 1 mostra um modelo de carro autônomo, do grupo Google, capaz de transportar pessoas sem a presença de motoristas (AGRELA, 2019). Figura 1 – Carro autômato Waymo. Fonte: AGRELA, 2019. Outro segmento que aplica aprendizado de máquina é o setor de negócios, desde a detecção de fraudes, direcionamento ao cliente e recomendação de produto, até o monitoramento industrial em tempo real, a análise de sentimento e o diagnóstico médico. Os sistemas inteligentes são capazes de resolver problemas que não podem ser gerenciados manualmente, devido à grande quantidade de dados gerados simultaneamente, e que devem ser processados de modo ágil e assertivo. A técnica pode encontrar relacionamentos entre dados tão sutis que nenhum meio manual os descobriria; e quando muitos desses relacionamentos “fracos” são combinados, eles se tornam #PraCegoVer : fotografia mostrando um carro autônomo. No centro da imagem há um carro branco, modelo sedan, de frente, com a lateral direita visível, com vidros escuros e uma faixa azul e preta na parte inferior do carro. Na porta traseira, na parte inferior, há uma logomarca, um W azul e, embaixo, em preto, o nome do carro, Waymo. Há um dispositivo sobre o teto do carro, composto por uma base branca e uma estrutura em formato de domo preta, que é um dos sensores utilizados para captação de dados do sistema autônomo. Ele trafega na pista central de uma avenida de três pistas, em que não há outros carros. Ao fundo, vê-se uma série de prédios clássicos e uma fileira de quatro árvores pequenas com cerca de meio metro de distância entre uma e outra. Pode-se observar, atrás da quarta árvore, no sentindo contrário ao do carro, duas pessoas caminhando na calçada. 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 5/26 fortes preditores. Assim, o processo de aprender com os dados e, subsequentemente, usar o conhecimento adquirido para informar as decisões futuras é extremamente poderoso. Neste contexto, o aprendizado de máquina está se tornando rapidamente o motor que impulsiona a economia moderna, já que ela é baseada em dados. Basicamente, a Aprendizagem de Máquina é dividida em cinco etapas: Aquisição de dados, Construção de modelo, Análise, Otimização e Predição. A partir de um conjunto de dados escolhido, é possível chegar a uma resposta desejada por meio de um minucioso treinamento do conjunto de dados apresentado, embora se deva levar em conta a avaliação de um método eficaz, que se adapte por quantas vezes forem necessárias à busca das resoluções de problemas complexos (BRINK; RICHARDS, 2016). Ainda, de acordo com Brink e Richards (2016), as etapas mencionadas acima podem ser revistas várias vezes, até que atinjam um resultado que esteja de acordo com o planejado para uma tomada de decisão. O Infográfico 1 relata o ciclo de aprendizado de máquina de modo detalhado. Infográfico 1 – Fluxo de trabalho de aprendizado de máquina adaptado Fonte: BRINK; RICHARDS, 2016, p. 106 (Adaptado). #PraCegoVer : diagrama. Trata-se de um fluxograma que relata o fluxo de trabalho do aprendizado de máquina em cinco etapas, desde a concepção dos dados até o modelo satisfatório sendo aplicado. No topo do fluxograma, temos um retângulo com o termo aquisição de dados. Em seguida, uma seta para baixo apontando para o próximo tópico, um retângulo verde, escrito engenharia de características. Em seguida, uma seta para baixo aponta para um retângulo cinza claro que engloba um ciclo de três retângulos mais finos em azul, em que consta um primeiro retângulo centralizado, na parte de cima do retângulo maior, com o termo construção de modelos, ligado por uma seta para baixo e para a esquerda ao segundo retângulo com o termo aquisição do modelo, que tem uma seta direcionada para a 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 6/26 O ciclo de trabalho em Aprendizado de Máquina é muito utilizado na resolução de problemas complexos, sendo iniciado na avaliação e na construção do método desejado até chegar no modelo apropriado. A primeira tarefa é a aquisição dos dados . Deve-se tomar muito cuidado com o tipo de dados proposto (como dado ordinal, categórico, numérico, desordenado etc.) para que seja apresentado um bom resultado ao final do método escolhido. Posteriormente, é utilizado o processo de engenharia de características , que representa todo um conjunto de informações sobre os dados brutos para que estejam sempre mais perto do mundo real, melhorando manualmente os dados de entrada que jamais foram trabalhados em dados que pudessem representar o modelo preditivo (BROWNLEE, 2014). Na parte da construção do modelo , são usados modelos matemáticos e de máquinas em busca de encontrar relacionamentos no conjunto de dados. Após sua construção, é necessário realizar a testagem dos dados, medir sua performance e níveis de precisão, escolhendo a métrica que se adapte ao modelo escolhido. Tem-se, como objetivo, avaliar a coesão dentro e fora dos grupos criados. Este processo é realizado pelas tarefas de Avaliação e Otimização de Modelos (SCIKIT-LEARN, 2014). Nesse contexto, é constatado que o modelo construído pode ser repetido quantas vezes for necessário, até que o resultado esteja de acordo com a resposta desejada. Dependendo do conjunto de dados, todas as etapas podem ser revistas desde a primeira etapa do ciclo – a aquisição de novos dados – passando, posteriormente, para engenharia de característica. Assim, ao obter o resultado, é possível realizar a análise de desempenho das predições por meio do processamento de dados anteriores. Os novos dados, então, podem ajudar a melhorar o desempenho, em se tratando de atingir a métrica desejada (DE LIMA, 2014). 1.2 Uso de técnica de aprendizagem de máquina Sabemos que o aprendizado de máquina é uma ferramenta poderosa para a aquisição de conhecimento e resultados satisfatórios, mas por si só não é possível aplicar técnicas sobre uma massa de dados em seu formato original, devido às diferentes características, dimensões e formatos que esses dados podem apresentar. Desse modo, é necessário realizar a retirada de dados antes mesmo de iniciar o seu processamento, ou seja, tratar dados que possam prejudicar o resultado esperado, como dados faltosos, inconsistentes ou ruidosos, sendo necessário aplicar técnicas na base de dados. Após a análise dos dados, deve-se também observar que o aprendizado de máquina não apresenta apenas um algoritmo, e sim uma infinidade de modelos com características distintas e singulares. Nesse sentido, é importante compreender o funcionamento da técnica e suas limitações através do conhecimento metodológico que cada uma direita, para o terceiro retângulo, onde se lê otimização de modelos,que consequentemente, para fechar o ciclo tem uma seta para cima e para a esquerda, apontando para o primeiro retângulo, construção de modelos. Fora do retângulo maior, cinza claro, à esquerda, tem-se uma seta para cima, apontando para ele, vinda de um retângulo verde, em que consta o termo engenharia de características, que é seguido de uma seta para cima, vinda de um retângulo verde alinhado abaixo, com o termo, novos dados. Ainda abaixo do retângulo cinza claro maior, tem-se à direita uma seta para baixo apontando para um retângulo verde com o termo predições, que está alinhado ao retângulo verde de engenharia de características. 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 7/26 apresenta. Assim, serão apresentados algoritmos e técnicas que permitam ao usuário escolher o melhor modelo para a resolução dos seus problemas (BARRETO, 2018). Antes de demonstrar os principais algoritmos, entretanto, é necessário conhecer alguns conceitos que norteiam esses modelos, segundo as definições de Monard (2003). Conceitos importantes do aprendizado de máquina ITEM CONCEITOS PADRÃO É um conjunto de padrões que têm características similares entre si. ATRIBUTO Consiste em um objeto, processo, evento ou entidade que pode ter um nome. CLASSE São as características de um dado ou aspecto dos dados que podem ser divididos entre nominal e contínuo. O primeiro não possui ordem de valor, apenas características, e o último existe em uma forma linear, como por exemplo, elemento do conjunto de números reais. CLASSIFICAÇÃO Consiste em agrupar os dados em classes, ou seja, identificar a qual classe pertence uma determinada amostra de dados. RUÍDO É imperfeição, distorção ou imprecisão dos dados. Ocorre, na maioria das vezes, durante a extração dos dados. CLASSIFICADORES São usados na classificação dos dados e descobrimento de padrões por meio de suas características. OVERFITTING Sobreajuste dos dados, ou excesso de ajuste dos dados. Ocorre quando o modelo utilizado foi ajustado perfeitamente e se adaptou tão bem que o modelo decorou o conjunto de dados treino, mas não consegue diferenciar os dados quando chegarem novos dados de testes. 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 8/26 UNDERFITTING Ao contrário do overfitting, o termo quer dizer que o desempenho do modelo já apresenta problemas no próprio treinamento. Não consegue encontrar as relações entre varáveis e teste, sendo o modelo de conjunto de dados descartado. Fonte: ONARD; BARANAUSKAS, 2003. (Adaptado). 1.3 Tipos de algoritmos Após o conhecimento dos principais conceitos que norteiam o aprendizado de máquina, os cards a seguir apresentam os tipos de aprendizagem. Tipos de aprendizagem » Clique nas setas ou arraste para visualizar o conteúdo Desse modo, entende-se que a aprendizagem indutiva possui duas divisões: os modelos de aprendizado de máquina supervisionado e os de aprendizado não supervisionado. O primeiro modelo é dividido em algoritmo de classificação e regressão , enquanto o segundo é dividido em algoritmos de agrupamento e associação . Essa hierarquia está representada no Diagrama 1. Diagrama 1 – Tipos de aprendizagem de máquina É o tipo de aprendizado que se encontra no topo dos modelos, engloba as técnicas de aprendizado supervisionado e não supervisionado. APRENDIZADO SUPERVISIONADO Quando o conjunto de dados já é previamente conhecido e que existe uma relação entre os dados de entrada e saída, este modelo é dividido em classificação e regressão. APRENDIZADO NÃO SUPERVISIONADO Quando não existe um conjunto de dados a priori, isso é, ainda não se tem uma ideia de como o resultado vai se apresentar, pois os rótulos ainda são desconhecidos. São divididos em modelos de agrupamento e associação. 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 9/26 Fonte: MONARD; BARANAUSKAS, 2003, p. 41. (Adaptado). Sistemas de computação que utilizam a aprendizagem indutiva são capazes de prover melhores desempenhos em técnicas de programação do que softwares convencionais por meio de suas regras e produções semânticas, pois possuem habilidades para a geração de aprendizado por indução, promovendo a transferência de conhecimento do especialista para a máquina. Exemplos disso são diagnósticos de doenças em plantações de soja ou a aquisição de regras para um jogo de xadrez. O Quadro 1 exemplifica os principais algoritmos de acordo com sua técnica. Quadro 1 – Principais algoritmos utilizados no aprendizado de máquina CLASSIFICAÇÃO Regressão linear SUPERVISIONADOS NÃO SUPERVISIONADOS REGRESSÃO AGRUPAMENTO ASSOCIAÇÃO Apriori Random Forest Partition Regressão logística LS-SVM: Least-squares Eclat FP Growth #PraCegoVer : diagrama ilustrando a hierarquia do aprendizado de máquina. No topo, ao centro do diagrama, temos um retângulo azul com o termo o aprendizado indutivo. Em seguida, para baixo há uma linha ligando dois novos retângulos amarelos, um à esquerda com o termo aprendizado supervisionado, e o outro à direita, com o termo aprendizado não supervisionado. Há um terceiro nível nesse diagrama. Sendo que abaixo de aprendizado supervisionado, tem uma linha ligando dois retângulos verdes, no primeiro à esquerda, indica-se classificação e o segundo, à direita, regressão. Alinhado a eles, mais dois retângulos também em verde, estão ligados ao aprendizado não supervisionado, sendo que o primeiro, à esquerda, está escrito agrupamento, e o segundo, à direita, está escrito associação. KNN (K-Nearest Neighbors) Redes neurais artificiais Naive Bayes SVM: Support Vector k-medoid k-means Bisecting k means 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 10/26 support vector machine FP-Growth Fonte: Elaborado pela autora, 2020. 1.3.1 Supervisionado Em modelos de algoritmos supervisionados, os dados de entrada já estão previamente rotulados, isto é, os atributos de entrada e saída já são conhecidos. Busca-se, portanto, a partir desses conjuntos de dados já conhecidos, prever resultados mais exatos em relação à predição de valores para novos dados (BRINK; RICHARDS, 2016). Sobre o modelo supervisionado, Neves et al. (2018) indicam que: Segundo Carvalho (2014, p. 34-35), no algoritmo supervisionado, exemplos já classificados pelo usuário são levados em consideração para encontrar um modelo capaz de classificar novos conjuntos de dados, a partir do aprendizado obtido com o conjunto de dados de treinamento. É importante que esses dados de treinamento sejam de qualidade, ou seja, que não sejam dados duplicados, faltantes ou inconsistentes, para que não ocorram erros na classificação dos novos conjuntos, utilizando modelos que possam predizer novos padrões de modo efetivo. Ainda, de acordo com Silva (2018), o conceito de aprendizado supervisionado é: Segundo Amaral (2016), modelos de aprendizado supervisionados são divididos em modelos de classificação e regressão. Os de classificação são modelos mais utilizados e com um maior número de algoritmos em mineração de dados, além de serem tratados como os mais complexos da categoria. Machine Bisecting k-means Este modelo utiliza um conjunto de dados (amostra) que contém registros de exemplos com suas respectivas classes (rótulos). Baseado nesses exemplos, o algoritmo classificador generaliza as respostas recebidas e aplica essas generalizações a registros novos e de classes desconhecidas, com a finalidade de determinar corretamente suas respectivas classes (NEVES, 2018, p. 29-30). Aprendizagem supervisionada é a tarefa de encontrar uma função a partir de dados de treinamento rotulados. O objetivo é encontrar os parâmetros ótimos que ajustem um modelo que possa prever rótulos desconhecidos em outros objetos (o conjunto de teste). Se o rótulo é um númeroreal, a tarefa chama-se regressão. Se o rótulo vem de um conjunto finito e não ordenado, então a tarefa chama-se classificação (SILVA, 2018, n.p.). VOCÊ QUER VER? Assista o vídeo Machine Learning: como ensinar uma máquina a aprender | Nerdologia Tech e aprenda um pouco mais sobre aprendizado de máquina e sua utilidade, exemplo e importância no mundo atual. 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 11/26 » Algoritmos classificação Algoritmos de classificação buscam classificar os dados em diferentes classes, ou seja, um certo conjunto de dados é associado a uma determinada classe, a separação desses dados se dá de acordo com as características de grupos específicos, que associam ou classificam um item em uma ou várias classes predefinidas, com o objetivo maior de atribuir classes (ou rótulos) a um conjunto finito de dados. A resposta do modelo supervisionado geralmente é definida por variáveis ditas categóricas, com resultados nominais, que são, geralmente, aplicadas em detecção de SPAM, reconhecimento de imagens e fala. Um exemplo clássico que utiliza algoritmos de classificação é prever se um determinado indivíduo será um bom ou mau pagador de um empréstimo bancário. Nesse caso, as informações de entrada são baseadas em dados históricos para que o modelo possa conhecer e aprender sobre o perfil analisado, ou seja, por meio de movimentações bancárias, históricos de empréstimos anteriores, renda e número de filhos, o algoritmo é capaz de prever se aquele perfil será de um bom ou mau pagador (AMARAL, 2016). Esse exemplo é descrito no Quadro 2, utilizando uma base de dados fictícia. Em um certo conjunto de dados, ou seja, dados históricos de uma instituição bancária, tem-se a idade e a categoria de pagamento do indivíduo, sendo um para bom pagador e zero para não bom pagador. Quadro 2 – Base de dados para treino IDADE 0 CATEGORIA 1 1 18 46 34 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 12/26 0 0 Fonte: AMARAL, 2016, p. 31. (Adaptado). A partir dos dados históricos demonstrados no Quadro 2, é possível criar um modelo para prever se novos clientes podem ser bons ou maus pagadores. Por meio da variável de entrada “idade”, o classificador processa as informações de entrada e cria o resultado como mostra o Quadro 3. Quadro 3 – Nova base de dados: classificador IDADE CATEGORIA 0 1 0 1 Fonte: AMARAL, 2016, p. 32. (Adaptado). Podemos, a partir do treinamento apresentado, prever novos clientes. O algoritmo observa o modelo construído a partir da base de dados e retorna se o novo cliente é bom ou mau pagador. Por outro lado, é importante destacar que nenhum algoritmo de aprendizado de máquina acerta em 100%, ou seja, deve-se, então, considerar seu desempenho na previsão de dados anteriores. Isso é feito a partir da separação dos dados em dois subconjuntos: treinamento e teste , em que dados de treino são submetidos ao classificador e produzem o modelo e os dados de testes são submetidos ao modelo para que seja feita a previsão. Caso o desempenho do modelo seja satisfatório, pode ser, então, colocado em produção para a classificação de novos dados (AMARAL 2016). Ainda segundo o autor, esses conjuntos podem utilizar diferentes técnicas de treinamento e testes conforme mencionado abaixo: » Clique nas abas para saber mais sobre o assunto Teste seus conhecimentos Atividade não pontuada. 21 37 18 ~ 22 23 ~ 35 36 ~ 45 45 ~ 65 Hold out Validação cruzada 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 13/26 VAMOS PRATICAR A tabela abaixo demonstra classes de animais, caso o animal possua a característica, deve-se marcar um para verdadeiro, caso contrário, zero para falso. A partir dos dados, tem-se o classificador determinador G para gato e P para pato. AMOSTRA É PELUDO? FAZ MIAU? TEM PENAS? TEM ASAS? É ANIMAL DOMÉSTICO? É PEQUENO? QUAL É O ANIMAL? 1 0 1 G 0 1 1 P0 1 0 G0 1 G0 1 0 1 G Sabemos, então, que a máquina usará os dados acimar para identificar um padrão e, com isso, aprender o que é gato e o que é pato. Com base nesses dados históricos citados na tabela anterior, faça a previsão do animal abaixo, cuja classificação ainda não conhecemos, mas temos suas características. AMOSTRA É PELUDO? FAZ MIAU? TEM PENAS? TEM ASAS? É ANIMAL DOMÉSTICO? É PEQUENO? QUAL É O ANIMAL? 0 1 1 ? Os dados são coletados, divididos em amostras de treinamento e teste, o modelo é treinado, ou seja, apresentam-se os dados ao algoritmo e o modelo preditivo é criado. Por fim, é feito o teste e a validação utilizando outros conjuntos de dados para saber se o modelo tem um bom nível de acurácia. Um exemplo de previsão seria o da venda ou lançamento de um novo produto no mercado. O sistema preveria se o produto seria ou não aceito por uma determinada população (DEY, 2016). 1 1 2 0 3 1 4 5 0 1 1 1 0 1 0 0 0 1 1 0 Oculta 0 1 1 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 14/26 Principais fenômenos acústicos CATEGORIA CONCEITOS Os dados são coletados, ou seja, um conjunto de dados existentes Os dados são divididos em amostras e aplica-se técnicas de estatísticas e amostragem, criando amostras de treino e teste. Escolhe-se o modelo de algoritmo que mais se adapta ao problema. Os dados são apresentados ao modelo de algoritmo, criando o modelo preditivo É feito os testes e validações utilizando outros conjuntos de dados para saber se o modelo escolhido tem um bom nível de acurácia, ou seja, um bom nível de precisão. Por fim, a produção é responsável por colocar o modelo para fazer aquilo que foi criado, por exemplo, uma previsão de vendas. Fonte: DEY, 2018, p. 1176. (Adaptado). Existem inúmeros modelos de algoritmos de classificação, cada um com suas particularidades e características, assim, o profissional deverá ter o cuidado de escolher o modelo que mais se adapta a sua base de dados e ao resultado que pretende chegar. Sendo assim, analisaremos os modelos que mais têm se destacado no aprendizado de máquinas por apresentarem melhor acurácia nos resultados. » Algoritmo K-NN K-Nearest Neighbors (KNN) O algoritmo de K-Nearest Neigbours (KNN) é um dos algoritmos mais simples e mais usados em modelagem supervisionada de classificação. Seu classificador é baseado no quanto um dado é similar ao outro, isso é, na similaridade dos dados entre k vizinhos mais próximo. Nesse contexto, a máquina pode dizer a que classe um certo volume de dados pertence. O KNN pode ser usado para algoritmos de regressão, que fornecem um número real como saída desejada a partir da análise de dados. No K-NN, após a definição do conjunto de dados para instanciar o treinamento, o modelo classifica uma nova instância, calculando a distância mais próximas ou a mais similar e em relação ao novo exemplo. Os vizinhos mais próximos são denominados K , são eles que vão decidir em qual classe Dados brutos Amostras de dados Algoritmo Modelo treinado Teste e validação Produção 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 15/26 deve ser classificado, por meio de votação entre os mesmos, onde a classe que aparece com maior frequência dentre os vizinhos selecionados deve ser a classe atribuída à nova instância (WITTEN; FRANK, 2005). Para se classificar um conjunto de dados desconhecido, é necessário calcular a distância de cada um para todos os conjuntos de treinamento, isso é, calcular a distância entre a nova instância e todas as instâncias do conjunto de treinamento, em que a menor distância é identificada e a classe mais representada dentre essas k instâncias é considerada a classe de saída do algoritmo. A distância mencionada pode ser calculada utilizando diversas funções, como adistância euclidiana para valores contínuos ou distância de Hamming para valores simbólicos. Além disso, uma das principais vantagens desse modelo é que ele pode ser aplicado em um pequeno conjunto de dados (KUHN; JOHNSON, 2013; BAY, 1998). » Máquina de vetores de suporte (SVM) A máquina de vetores de suporte (SVM) é um algoritmo de aprendizado supervisionado criado a partir de ideias iniciadas em 1964 no trabalho Generalised Portrait Method , de Vapnik e Chervonenkins. No início, o SVM foi criado como uma técnica de classificação e, posteriormente, tornou-se uma ferramenta eficaz na estimativa de funções que utilizam regressão de valores reais. Na literatura, a regressão pode ser referenciada como SVM ou SVR ( Support Vector Regression ). Esse tipo de algoritmo mapeia os dados de entrada de treinamento para um espaço multidimensional, de forma que seja possível encontrar um hiperplano que separe as duas classes. Sendo assim, após o treinamento, o mecanismo precisa ser capaz de determinar à qual dessas classes um item desconhecido pertence. O melhor hiperplano para um SVM significa aquele com a maior margem entre as duas classes (RUSSELL; NORVIG, 2013). Muitas são as características desse modelo, mas ele é fortemente usado para reconhecimento de voz, imagem e visão computacional. Na Figura 2, podemos observar duas classes separadas: uma azul e outra laranja. Se os objetos novos, ao entrarem para as análises, estiverem mais à esquerda, serão classificados na classe azul, caso contrário, se estiverem posicionados mais à direita, serão classificados na classe laranja (PORTELA, 2017). Figura 2 – Separação de dados no modelo SVM simples. Fonte: PORTELA et al., 2017. 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 16/26 » Rede neural artificial Uma rede neural artificial (RNA) é um modelo de processamento de dados em paralelo, constituído de unidades simples de processamento, inspiradas no sistema neural. Essas têm propensão natural para armazenar conhecimento extraído de dados, tornando-o disponível para uso. Sua semelhança com o cérebro humano está relacionada a dois aspectos: ao conhecimento adquirido pelo processo de aprendizagem e à conexão de pesos sinápticos, que possuem a função de armazenar o conhecimento adquirido. Com a utilização de técnicas de algoritmos de aprendizagem, é possível modificar os pesos para que se alcance um objetivo. A maioria dos modelos de redes neurais possui alguma regra de treinamento, isto é, aprendem através de treinamentos, em que os pesos de suas conexões são adaptados de acordo com os padrões apresentados, ou seja, através de exemplos (HAYKIN, 2001). Uma rede neural artificial é um sistema massivamente paralelo e distribuído, constituído de unidades simples de processamento interconectadas, denominadas neurônicas, inspiradas no sistema neural humano, com capacidade natural de armazenar e utilizar conhecimento (NEGNEVITSKY, 2005; NILSSON, 2014). Embora a utilização de técnica de inteligência artificial tenha como objetivo auxiliar, por meio de dispositivos computacionais, a solução de problemas e maximizar a precisão nas informações, deve-se ressaltar que não existe uma técnica ideal a ser adotada. Assim, é importante levar em consideração a relevância do problema, fatores humanos e éticos. Teste seus conhecimentos Atividade não pontuada. » Sistema de inferência Fuzzy O sistema de inferência Fuzzy é uma teoria matemática aplicada em conceitos incertos ou vagos, em que não existe raciocínio preciso. Por meio de observações de vários fenômenos, constatou-se que a resolução desses problemas poderia se dar sem a posse de informações precisas, apenas com valores entre zero e um, denominados graus de pertinência de cada elemento a um determinado conjunto. Isso é, em modelos Fuzzy não existe fronteira definida para que o elemento pertença ou não a um conjunto de dados (ZADEH, 1965). De acordo com Chenci, Rignel e Lucas (2011), utilizando-se diferentes funções de pertinência e variáveis linguísticas, como demonstrado no Gráfico 1, os sistemas Fuzzy podem ser aplicados em diversos segmentos, como no ajuste de controle de peso em máquinas de lavar, câmeras fotográficas para medir o campo de visão do equipamento e no controle de temperatura de ar-condicionado. #PraCegoVer : a ilustração exibe um gráfico criado a partir de um algoritmo SVM, que classifica os dados em dois conjuntos. Um conjunto está na forma de 14 círculos na cor azul, situado na parte inferior esquerda do gráfico, mais próximo ao eixo central. Há, também, um conjunto de dados de 14 círculos na cor amarela, que representa os dados mais afastados do eixo. Por fim, para separar a classificação dos dois conjuntos, tem-se uma reta grossa, na cor preta, exatamente ao meio dos dois conjuntos de dados, em diagonal, da esquerda para a direita. 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 17/26 Gráfico 1 – Variável linguística de entrada Fonte: CHENCI et al., 2005, p. 24. (Adaptado). #PraCegoVer : gráfico com eixos X e Y. No eixo X, na horizontal, é exibido o peso de pessoas 50, 75 e 100 quilos, e no eixo Y, na vertical, as pertinências zero e um. Os dados centrais do gráfico representam variáveis linguísticas classificadas em baixo, médio e alto – da esquerda para a direita. Logo, percebe-se que: pessoas de até 50 kg apresentam grau de pertinência igual a um, no conjunto baixo; o grau de pertinência nesse conjunto decresce à medida que o peso aumenta. A pessoa de 75 kg é totalmente pertencente ao conjunto médio. E pessoas acima de 80 kg (aproximadamente) apresentam grau de pertinência diferente de zero, em alto. E pessoas acima de 100 kg, definitivamente estão com o peso alto. » Algoritmos regressão A regressão é definida como a tarefa de aprender uma função f , que mapeie cada conjunto de atributos X em uma saída com valor contínuo Y . Ou seja, é uma modelagem preditiva, que analisa as dependências entre os valores de atributos, a partir de um conjunto de itens, e cria um modelo que possa prever valores de atributos para novos (TAN; STEINBACH; KUMAR, 2018). É necessário aplicar análise de regressão em algumas situações em que o resultado não depende apenas de uma variável, sendo necessário explorar a relação entre elas (MORETTIN; BUSSAB, 2013). Os modelos de regressão predizem um número – por exemplo, o quanto de receita ou despesas um cliente gerará no próximo ano ou mês. Sendo assim, é um dos métodos mais populares em estatística, porque estima a relação entre as variáveis, sendo constantemente utilizado para determinar quantidades de fatores específicos, como a alta do dólar, por exemplo. Com a análise de regressão, queremos predizer um número, chamado de resposta ou variável Y . O modelo mais simples é de “Regressão Linear Simples”, que corresponde a uma relação linear entre a variável dependente e a outra independente, verificando se existe uma relação entre estas duas variáveis. Por exemplo: temos duas variáveis X (independente) e Y (dependente). Deste modo X é o responsável por explicar Y , que é utilizada para explicar e/ou prever o resultado de Y . Este modelo de regressão é amplamente utilizado para prever a relação de alteração dos salários e taxa de desemprego, demanda dos produtos de uma firma e publicidade, etc. 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 18/26 Já a regressão múltipla, por sua vez, usa duas ou mais variáveis independentes para prever um resultado. Com a regressão logística, variáveis dependentes com valores discretos são previstas a partir das relações entre variáveis dependentes e independentes de padrões já conhecidos. A variável de resposta é categórica, o que significa que pode assumir um número limitado de valores. A regressão logística realiza a classificação binária. Com o rótulo de resposta, tem apenasdois valores (0 e 1), contudo, os modelos mais usuais são aqueles que apresentam rótulos com números reais ou contínuos (SILVA, 2018). Os algoritmos mais comuns que utilizam esses modelos são as redes neurais artificiais, o SVM e o KNN. » Modelos de séries temporais Uma série temporal é um conjunto de dados sobre uma variável de tempo e registrado por períodos. Esses períodos são marcados e coletados dentro de um intervalo, sejam em dias, meses, anos ou até mesmo horas. Os dados são coletados e armazenados para a análise posterior. Esses modelos podem ser aplicados em análise de vendas mensais de um determinado produto, em previsões de temperatura em um intervalo de tempo, visitas em sites da internet por hora e valores de fechamento do índice de uma bolsa de valores. Seu principal objetivo é identificar padrões variáveis no tempo na série temporal de uma variável de interesse. Assim, a observação desse comportamento passado pode permitir previsões sobre o futuro, orientando a tomada de decisões (SAS, 2019). Segundo (MORETTIN; TOLOI, 2006), uma série temporal pode ser compreendida como a representação matemática do comportamento de um processo ou sistema através de um conjunto de observações ordenadas no tempo. O Gráfico 2 mostra a uma série temporal da temperatura média mensal, na cidade de Lavras/MG. Gráfico 2 – Série temporal (média mensal de temperatura) Fonte: SOARES, 2017, p. 17. (Adaptado). #PraCegoVer : o gráfico cartesiano retrata um modelo de série temporal da média da temperatura na cidade de Lavras, em MG. No eixo X, na horizontal, encontra-se o índice de tempo, iniciado no ano de 1990 e com intervalo de cinco em cinco anos até 2010 (1990, 1995, 2000, 2005, 2010). No eixo Y, na vertical, está a temperatura média da cidade com valores, de baixo para cima, de 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 e 25 ºC. O modelo do gráfico adotado pelo autor é um gráfico de linhas, representado na cor verde, que demonstra a tendência 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 19/26 irregular da temperatura no intervalo de tempo, com as altas e baixas de temperatura, variando entre 16 e 25 ºC. VOCÊ QUER VER? Você sabia que a robô Sophia é uma humanoide com Inteligência Artificial? Ela é uma cidadã saudita e possui milhares de seguidores no Instagram. Ela fez aparições em diversos programas de televisão e até já discursou na ONU. A robô chama a atenção por sua capacidade de reprodução facial, de contar piadas e de debater sobre assuntos existenciais. Para saber um pouco mais sobre essa simpática robô acesse: 1.3.2 Não supervisionado Diferente do aprendizado supervisionado, o modelo não supervisionado não apresenta dados rotulados, ou seja, ele não possui um conjunto de dados a priori. Assim, o algoritmo aprende a partir de entradas submetidas segundo uma medida de qualidade ou similaridade (ABREU, 2016). Segundo Bueno (2018), a aprendizagem não supervisionada encontra padrões ocultos ou estruturas intrínsecas aos dados. Ela é usada para extrair características de conjuntos de dados sem respostas rotuladas, desconhecidos. Inúmeras técnicas utilizam esse tipo de aprendizagem, embora a de agrupamento seja a técnica mais comum. De todo modo, a aprendizagem não supervisionada é comumente utilizada para a análise exploratória de dados, buscando padrões ocultos ou agrupamentos nos dados. Segundo SAS (2019), esse modelo é utilizado quando não existe um agente externo indicando a resposta desejada, como dados históricos ou uma resposta certa. Assim, para os padrões de entrada, esse tipo de aprendizado tem, 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 20/26 como objetivo, explorar os dados e encontrar alguma estrutura dentro deles, aplicações que utilizam modelos não supervisionados incluem análise de sequência de genes, pesquisa de mercado, reconhecimento de objetos, campanhas de marketing, recomendação de produtos e a identificação de pontos discrepantes nos dados. Esses modelos também são conhecidos como algoritmos descritivos, que possuem a funcionalidade de descobrir regras e padrões para gerar os dados. Nesse contexto, destacam-se três modelos: o agrupamento que divide o conjunto de dados por similaridade, isso é, por características; os modelos de associação que buscam encontrar padrões frequentes nos dados, de tal modo que itens que ocorram juntos regularmente sejam descobertos; e, por fim, o modelo menos usual de sumarização (CARMO et al., 2018). Inúmeros são os algoritmos que utilizam essa técnica para obter um melhor resultado na tomada de decisão. Todavia, não podemos julgar qual o melhor modelo. Por isso, é preciso analisar qual seria o mais específico, e qual deles melhor se adapta ao conjunto de dados implícitos. » Algoritmos não supervisionados com técnicas de agrupamento Com o considerável aumento do volume de dados e de informações distintas geradas com a internet, nos últimos tempos, tornou-se necessário agrupar dados de acordo com sua similaridade. O processo de agrupar dados abstratos por características comuns é denominado clusterização. Um cluster nada mais é que uma coleção de dados agrupados dentro de um mesmo grupo similar ou em grupos distintos. Para Fernandes e Filho (2019), técnicas de agrupamento não supervisionado são aquelas em que os dados são divididos por partições, ou seja, por cluster. Nesse, são considerados os algoritmos de agrupamento, e o usuário é quem vai definir a quantidade de clusters a ser empregado. Existem inúmeros modelos de algoritmos de clusterização, o mais comum é o modelo algoritmo k-means (k-medias). Esse algoritmo separa aleatoriamente cada centro do conjunto de dados e a cada nova interação agrupa os pontos mais próximos ao centroide, por meio da menor distância quadrática euclidiana. Os centroides são também atualizados pela média dos pontos de cada cluster . O algoritmo termina (converge) quando não há mais mudanças significativas dos centroides. » Algoritmos não supervisionado com regras de associação Algoritmos que utilizam regras de associação prescritivas são muito usados como suportes para tomadas de decisão, como em sistemas de diagnósticos; análise de dados de vendas; descoberta de tendências; estudo das informações coletadas durante a venda simultânea de itens etc. De acordo com Brusso (2000), regras de associação são padrões descritivos, que representam a probabilidade de que um conjunto de itens apareça em uma transação, visto que outro conjunto está presente. Uma regra de associação tem como objetivo encontrar elementos que implicam na presença de outros elementos em uma mesma transação, ou seja, encontrar relacionamentos ou padrões frequentes entre diversos conjuntos de dados. O termo transação indica quais itens foram consultados em uma determinada operação de consulta. Um exemplo citado por Vasconcelos e Carvalho (2018) é a venda de sapatos. Por meio de regras de associação, o algoritmo mostra que o cliente que compra cinto e bolsa possivelmente comprará um sapato. Para isso, são utilizadas regras que especificam o grau de certeza: o fator de suporte e o fator de confiança. 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 21/26 Com o avanço das tecnologias, novos equipamentos foram criados para a coleta de conjunto de dados, ou seja, coletar informações e armazená-las já faz parte do cotidiano das empresas, sejam elas de pequeno, médio ou grande porte. Com esse conhecimento disponível, as organizações facilitam a tomada de decisão e promovem estratégias certeiras de marketing, que potencializam o cliente e o layout de catálogos de produtos a partir dos dados coletados (VASCONCELOS; CARVALHO, 2018). Segundo Pichiliani (2008), as regras de associação podem ser geradas por meio da utilização de diversos algoritmos no mercado. O mais comum e popular é o algoritmoa priori, que tem como função principal encontrar todos os conjuntos de itens frequentes, fazendo o uso de duas funções: a primeira denominada a priori, para gerar dados e eliminar aqueles que não são frequentes; e a segunda função Genrules , utilizada para extrair as regras de associação. 1.4 Identificar as diferenças entre algoritmo supervisionado e não supervisionado Como podemos notar, ao longo da unidade, o aprendizado de máquina é dotado por uma quantidade enorme de algoritmos inteligentes. Cada modelo se destaca por sua capacidade de resolver um problema específico, dando auxílio aos usuários na tomada de decisão, seja para aumentar os lucros de uma empresa ou auxiliar o homem do campo sobre índices de chuva em uma determinada região. É importante entender como e qual técnica deve-se ser empregada naquele conjunto de dados específicos, por exemplo: quando temos os dados já visíveis, rotulados, por exemplo: ao usarmos dados históricos de clientes para tentarmos prever novos clientes em potencial, empregaremos modelos de algoritmos supervisionados, que ainda podem ser divididos para resolver problemas de classificação e regressão. No entanto, quando não se tem nenhum desses dados a priori, ou seja, ainda não existe nenhum dado histórico ou conjunto de dados, a técnica utilizada é de algoritmos não supervisionados, que ainda se divide para resolver problemas de agrupamento e associação. Por fim, não existe uma técnica perfeita; o profissional de tecnologia, aliado ao bom gestor, é quem ditará qual o modelo que mais vai auxiliar na tomada de decisão de uma empresa. Síntese Nesta unidade, vimos os principais conceitos e definições sobre o aprendizado de máquina, além de uma descrição sobre os principais tipos de modelos dessa área. Vimos, também, os principais algoritmos que norteiam os sistemas inteligentes, isso é, que possuem uma melhor acurácia; esses algoritmos são dotados de técnicas de classificação e regressão quando se trata de aprendizado supervisionado. Ademais, outra categoria que estudamos foi a dos modelos de aprendizado não supervisionados, que separam os dados por meio de modelos de agrupamento ou de regras de associação. Por fim, vale ressaltar que, quanto maior a compreensão do algoritmo, limitações e desempenho, mais adequadamente o profissional poderá aplicá-los na tomada de decisão. 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 22/26 SAIBA MAIS Título: Inteligência artificial aplicada – uma abordagem introdutória Autor(a) ou autores(as): Luciano Frontino de Medeiros Editora: Intersaberes Ano: 2018 Comentário: Leia a Capítulo 1 do livro, que irá ajudar a compreender as bases da Inteligência Artificial, através de seu contexto histórico que abrange diversas linhas de pesquisa da IA podendo ser em aplicados em diferentes ramos de negócios, auxiliando assim o gestor em uma tomada de decisão correta. Onde encontrar? Biblioteca Virtual . Referências bibliográficas ABREU, A. L. E. Bootstrap e modelos de Support Vector Machine : SVM. 2016. 115 f. Tese (Doutorado em Métodos Numéricos em Engenharia) – Pós-graduação em Métodos Numéricos em Engenharia, Universidade Federal do Paraná, Curitiba, 2016. Disponível em: < https://acervodigital.ufpr.br/bitstream/handle/1884/43555/R%20- %20T%20-%20ANDRE%20LUIZ%20EMIDIO%20DE%20ABREU.pdf?sequence=1&isAllowed=y >. Acesso em: 17 nov. 2020. AGRELA, L. Carro autônomo do Google já pode transportar pessoas. Revista Exame , 03 jul. 2019. Disponível em: < https://exame.com/tecnologia/carro-autonomo-do-google-ja-pode-transportar-pessoas >. Acesso em: 11 nov. 2020. AL MAYAHI, Khalfan; AL-BAHRI, Mahmood. Machine Learning Based Predicting Student Academic Success. In: International Congress on Ultra Modern Telecommunications and Control Systems and Workshops (ICUMT), 12., 2020. Anais […] [s. l.]: IEEE, 2020. p. 264-268. Disponível em: < https://ieeexplore.ieee.org/abstract/document/9222435 >. Acesso em: 11 nov. 2020. AMARAL, F. Aprenda mineração de dados : teoria e prática. São Paulo: Alta Books, 2016. BARNES, J. Microsoft azure essentials azure machine learning . Redmond: Microsoft Press, 2015. BARRETO, C. A. S. Uso de técnicas de aprendizado de máquina para identificação de perfis de uso de t ó i b d d d t ti 2018 92 f Di t ã (M t d E h i d S ft ) https://acervodigital.ufpr.br/bitstream/handle/1884/43555/R%20-%20T%20-%20ANDRE%20LUIZ%20EMIDIO%20DE%20ABREU.pdf?sequence=1&isAllowed=y https://exame.com/tecnologia/carro-autonomo-do-google-ja-pode-transportar-pessoas https://ieeexplore.ieee.org/abstract/document/9222435 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 23/26 automóveis baseado em dados automotivos . 2018. 92 f. Dissertação (Mestrado em Engenharia de Software) – Pós-Graduação em Engenharia de Software, Universidade Federal do Rio Grande do Norte, Natal, 2018. Disponível em: < https://repositorio.ufrn.br/jspui/bitstream/123456789/26017/1/Usot%c3%a9cnicasaprendizado_Barreto_2018.pdf >. Acesso em: 17 nov. 2020. BAY, S. D. Combining nearest neighbor classifiers through multiple feature subsets . In: Proc. 15th International Conf. on Machine Learning. Proc. 15th International Conf. no aprendizado de máquina. Morgan Kaufmann, San Francisco, CA. p. 37-45, 1998. Disponível em: < http://citeseerx.ist.psu.edu/viewdoc/download? doi=10.1.1.52.455&rep=rep1&type=pdf >. Acesso em: Acesso em: 17 nov. 2020. BROWNLEE, J. Discover feature engineering, how to engineer features and how to get good at it. 2014. Disponível em: < https://machinelearningmastery.com/discover-feature-engineering-how-to-engineer-features-and- how-to-get-good-at-it/ >Acesso: 06 dez. 2020. BRINK, H.; RICHARDS, J. W. Real-world machine learning . 2016. Disponível em: < https://www.manning.com/books/real-world-machine-learning >. Acesso: 08 nov. 2020. BRUSSO, M. J. Access miner : uma proposta para a extração de regras de associação aplicada à mineração do uso da web. 2000. 96 f. Dissertação (Mestre em Ciência da Computação) – Instituto de Informática, Universidade Federal do Rio Grande do Sul, Porto Alegre, 2000. Disponível em: < https://lume.ufrgs.br/handle/10183/2074 >. Acesso em: 17 nov. 2020. BUENO, A. L. C. Relaxamento adaptativo da sincronização através do uso de métodos de aprendizagem supervisionada . 2018. 80 f. Tese (Doutorado em Informática) – Pontifícia Universidade Católica do Rio de Janeiro, Rio de Janeiro, 2018. Disponível em: < http://www.dbd.puc- rio.br/pergamum/tesesabertas/1321841_2018_completo.pdf >. Acesso em: 12 nov. 2020. CARMO, P. N. S. et al. Aprendizado de máquina em ações de controle no tribunal de contas do Estado do Maranhão. In: I Jornada de Informática do Maranhão, 7., 2018, Maranhão. Anais ... Maranhão, 2018. Disponível em: < http://sistemas.deinf.ufma.br/anaisjim/artigos/2018/201809.pdf >. Acesso em: 12 nov. 2020. CARVALHO, H. M. Aprendizado de máquina voltado para mineração de dados : árvores de decisão. 2014. 68 f. Monografia submetida ao curso de graduação em Engenharia de Software – Faculdade de Engenharia de Software, Universidade de Brasília, Distrito Federal, 2014. Disponível em: < http://fga.unb.br/articles/0000/5556/TCC_Hialo_Muniz.pdf >. Acesso em: 17 nov. 2020. CHENCI, G. P.; RIGNEL, D. G. S.; LUCAS, C. A. Uma introdução à lógica Fuzzy. Revista Eletrônica de Sistemas de Informação e de Gestão Tecnológica , São Paulo. v. 1, n. 1, p. 17-28, 2011. Disponível em: < http://www.logicafuzzy.com.br/wp-content/uploads/2013/04/uma_introducao_a_logica_fuzzy.pdf >. Acesso em: 18 nov. 2020. DE LIMA, G. C. Pesquisa e Desenvolvimento de um Método de Aprendizagem de Máquina com Aprendizado Incremental . 2014. Disponível em: < http://fga.unb.br/articles/0000/7764/tcc_GustavoCorreiaDeLima.pdf > Acesso: 08 nov. 2020. https://repositorio.ufrn.br/jspui/bitstream/123456789/26017/1/Usot%c3%a9cnicasaprendizado_Barreto_2018.pdf http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.52.455&rep=rep1&type=pdfhttps://machinelearningmastery.com/discover-feature-engineering-how-to-engineer-features-and-how-to-get-good-at-it/ https://www.manning.com/books/real-world-machine-learning http://www.dbd.puc-rio.br/pergamum/tesesabertas/1321841_2018_completo.pdf http://sistemas.deinf.ufma.br/anaisjim/artigos/2018/201809.pdf http://fga.unb.br/articles/0000/5556/TCC_Hialo_Muniz.pdf http://www.logicafuzzy.com.br/wp-content/uploads/2013/04/uma_introducao_a_logica_fuzzy.pdf http://fga.unb.br/articles/0000/7764/tcc_GustavoCorreiaDeLima.pdf 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 24/26 DEY, A. Machine learning algorithms: a review. International Journal of Computer Science and Information Technologies , [s.l.]. v. 7, n. 3, p. 1174-1179, 2016. Disponível em: < http://ijcsit.com/docs/Volume%207/vol7issue3/ijcsit2016070332.pdf >. Acesso em: Acesso em: 17 nov. 2020. DIAS, M. D. Democratizando a inteligência artificial. Serpro , 18 out. 2019. Disponível em: < https://www.serpro.gov.br/menu/noticias/noticias-2019/democratizando-a-inteligencia-artificial >. Acesso em: 10 nov. 2020. FACELI, K. et al. Inteligência artificial : uma abordagem de aprendizado de máquina. Rio de Janeiro: LTC, 2015. FERNANDES, F. T.; FILHO, A. D. P. C. Perspectivas do uso de mineração de dados e aprendizado de máquina em saúde e segurança no trabalho. Revista Brasileira de Saúde Ocupacional , São Paulo. v. 44, n. 13, p. 1-12, 04 nov. 2019. Disponível em: < https://www.scielo.br/scielo.php?script=sci_arttext&pid=S0303-76572019000101401 >. Acesso em: 12 nov. 2020. HAYKIN, S. Redes neurais : princípios e prática. 2. ed. Porto Alegre: Bookman, 2001. KUHN, M.; JOHNSON, K. Applied Predictive Modelling . New York: Springer, 2013. LAMOUNIER, S. M. D. Modelagem incremental fuzzy para detecção incipiente e estimação do grau de severidade da doença de parkinson a partir de sinais de voz . 2018. 82 f. Dissertação (Mestrado em Engenharia de Sistemas e Automação) – Área de Concentração em Engenharia de Sistemas e Automação, Universidade Federal de Lavras, Lavras, 2018. Disponível em: < encurtador.com.br/qtAU0 >. Acesso em: 17 nov. 2020. CLUSTERING. Scikit-learn , 2014. Disponível em: < http://scikit-learn.org/stable/modules/clustering.html >.Acesso em: 06 dez. 2020. LUGER, G. F. Inteligência artificial . São Paulo: Pearson, 2013. Machine Learning: como ensinar uma máquina a aprender | Nerdologia Tech . Postado por Nerdologia. (10min. 10s.). son. color. port. Disponível em: < https://www.youtube.com/watch?v=mhe5e2B9bL8&t=43s >. Acesso em: 12 nov. 2020. MARQUES, K. M. O que é Machine Learning (ML)? Exemplos & Aplicações! Becode , 2017. Disponível em: < https://becode.com.br/o-que-e-machine-learning/ >. Acesso em: 12 nov. 2020. MEDEIROS, L. F. Inteligência artificial aplicada : uma abordagem introdutória. Curitiba: Intersaberes, 2018. MEHTA, R. Big data analytics with Java . Birmingham: Packt Publishing, 2017. MENDEL, J. M.; R. W. MCLAREN. Reinforcement-learning control and pattern recognition systems . Rio de Janeiro: Elsevier, 1994. MONARD, M. C.; BARANAUSKAS, J. A. Sistemas Inteligentes : Fundamentos e Aplicações. Barueri: Manole, 2003. MORETTIN, P. A.; TOLOI, C. Análise de séries temporais . São Paulo: Blucher, 2006. http://ijcsit.com/docs/Volume%207/vol7issue3/ijcsit2016070332.pdf https://www.serpro.gov.br/menu/noticias/noticias-2019/democratizando-a-inteligencia-artificial https://www.scielo.br/scielo.php?script=sci_arttext&pid=S0303-76572019000101401 http://scikit-learn.org/stable/modules/clustering.html https://www.youtube.com/watch?v=mhe5e2B9bL8&t=43s https://becode.com.br/o-que-e-machine-learning/ 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 25/26 MORETTIN, P. A.; BUSSAB, W. O. Estatística básica . São Paulo: Saraiva Educação, 2017. NEGNEVITSKY, M. Artificial intelligence : a guide to intelligent systems. London: Pearson education, 2005. NEVES, D. V.; DIAS, F. C. A.; CORDEIRO, D. Uso de aprendizado supervisionado para análise de confiabilidade de dados de crowdsourcing sobre posicionamento de ônibus. In: WORKSHOP BRASILEIRO DE CIDADES INTELIGENTES (WBCI), 2018, Natal. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2018. Disponível em: < https://sol.sbc.org.br/index.php/wbci/article/view/3229/3191 >. Acesso em: 18 nov. 2020. NILSSON, N. J. Principles of artificial intelligence . Burlington, Massachusetts: Morgan Kaufmann, 2014. PICHILIANI, M. Data Mining na prática: regras de associação. iMasters , 21 jan. 2018. Disponível em: < https://imasters.com.br/back-end/data-mining-na-pratica-regras-de-associacao >. Acesso em: 10 nov. 2020. PORTELA, C. et al. Tutorial de SVM. LAMFO , 13 jul. 2017. Disponível em: < https://lamfo- unb.github.io/2017/07/13/svm/ >. Acesso em: 09 nov. 2020. ROBÔ Sophia: “Deveríamos ser parceiros, não substitutos” [CT Entrevista] . Postado por Canaltech. (7min. 54s.). son. color. port. Disponível em: < https://www.youtube.com/watch?v=pKCgl7r9Qw8 >. Acesso em: 10 nov. 2020. RUSSEL, S.; NORVIG, P. Artificial intelligence : a modern approach. Nova Jersey: Prentice Hall, 2013. SAS. Inteligência artificial . O que é qual sua importância? Disponível em: < https://www.sas.com/pt_br/insights/analytics/inteligencia-artificial.html >. Acesso em: 10 nov. 2020. SILVA, J. C. Algoritmos de aprendizagem de máquina: qual deles escolher? Medium , 25 mar. 2018. Disponível em: < https://medium.com/machina-sapiens/algoritmos-de-aprendizagem-de-m%C3%A1quina-qual-deles-escolher- 67040ad68737 >. Acesso em: 10 nov. 2020. SOARES, E. A. Sistemas evolutivos baseados em regras para previsão de séries temporais meteorológicas . 2017. 75 f. Dissertação (Mestrado em Engenharia de Sistemas e Automação) – Pós-Graduação em Engenharia de Sistemas e Automação, Universidade Federal de Lavras, Lavras, 2017. Disponível em: < encurtador.com.br/lFST4 >. Acesso em: 11 nov. 2020. TAN, P.; STEINBACH, M.; KUMAR, V. Introduction to data mining . 2. ed. Chennai: Pearson India Education Services, 2018. VASCONCELOS, L. M. R.; CARVALHO, C. L. Aplicação de regras de associação para mineração de dados na web. Revista Telfract , São Paulo, v. 1, n. 1, p. 1-19, 24 abr. 2018. Disponível em: < http://ww2.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_004-04.pdf >. Acesso em: 11 nov. 2020. VAPNIK, V. N.; CHERVONENKIS, A. Y. On the uniform convergence of the frequencies of occurrence of events to their probabilities. In: Empirical Inference. Springer, Berlin, Heidelberg, 2013. p. 7-12. https://sol.sbc.org.br/index.php/wbci/article/view/3229/3191 https://imasters.com.br/back-end/data-mining-na-pratica-regras-de-associacao https://lamfo-unb.github.io/2017/07/13/svm/ https://www.youtube.com/watch?v=pKCgl7r9Qw8 https://www.sas.com/pt_br/insights/analytics/inteligencia-artificial.html https://medium.com/machina-sapiens/algoritmos-de-aprendizagem-de-m%C3%A1quina-qual-deles-escolher-67040ad68737 http://ww2.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_004-04.pdf 27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina https://ambienteacademico.com.br/course/view.php?id=12373 26/26 WITTEN, I. H.; FRANK, E. Data mining : Practical Machine Learning Tools and Techniques with Java implementations. 2. ed. Philadelphia: Elsevier. 2005. ZADEH, L. A. Fuzzy sets. Information and control , v. 8, n. 3, p. 338-353, 1965. Disponível em: < https://www.sciencedirect.com/science/article/pii/S001999586590241X >. Acesso em: 11 nov. 2020. https://www.sciencedirect.com/science/article/pii/S001999586590241X
Compartilhar