Prévia do material em texto
<p>INTELIGÊNCIA ARTIFICIAL</p><p>Unidade 02</p><p>Como a IA Toma Decisões e Trata as Incertezas</p><p>ALAN DE OLIVEIRA SANTANA</p><p>Unidade 2| Introdução</p><p>O objetivo desta unidade será apresentar os conceitos ligados ao tratamento incerto, como por exemplo, utilizando o modelo oculto de Markov e as redes baysesianas. Com o objetivo de fundamentar melhor estes conceitos, iremos retomar e aprofundar conceitos já visto na unidade anterior. Assim, poderemos ao final do material discutir sobre como os sistemas inteligentes realizam decisões sobre dados incertos.</p><p>‹#›</p><p>Unidade 2 | Objetivos</p><p>Entender as características do tratamento das incertezas.</p><p>Compreender a lógica conceitual do algoritmo de Bayes e Markov.</p><p>Identificar a aplicabilidade do algoritmo de Markov.</p><p>Discernir sobre as técnicas de tomadas de decisão, simples e complexas.</p><p>‹#›</p><p>Introdução ao Tratamento de Incertezas</p><p>O tratamento do tempo deve ser tratado como uma ação hierarquizada em relação a variável tempo, uma vez que tais ações, ligadas ao exemplo acima, que possuem tempo menor, mais próximo do atual, devem ser executadas antes das ações com tempo maior, menos próximos do atual (OLIVEIRA; BELO, 2014).</p><p>‹#›</p><p>O tempo é uma variável que pode ser entendida como do mundo real, uma vez que ações temporizadas possuem implicações práticas no mundo real, pois tais ações necessitam que o tempo no mundo real avance para que estas possam completar seu ciclo de execução.</p><p>Introdução ao Tratamento de Incertezas</p><p>Não apenas o tempo, mas várias outras variáveis do mundo real podem ser abstraídas para a tomada de decisão, com os dados destas variáveis, entendidos como conhecimentos variáveis ou constantes, podendo ser inseridos pelos programadores ou adquiridos por sensores, como por exemplo: o clima, quantidade de pessoas em um ambiente, entre outros.</p><p>Introdução ao Tratamento de Incertezas</p><p>Existem diversas estratégias na criação de sistemas que escalonar os processos. Uma delas é fazer primeiramente o escalonamento para depois fazer o planejamento estratégico. Outra forma de desenvolver a estratégia é realizar primeiramente o planejamento e em seguida fazer o escalonamento por demanda, sendo este último similar ao exemplo do sistema inteligente usado em uma companhia aérea citado acima.</p><p>Introdução ao Tratamento de Incertezas</p><p>Expandindo o Planejamento com Hierarquia</p><p>Uma hierarquia é uma estrutura onde um indivíduo, processo, arquivo, pasta, entre outros, são organizados em uma estrutura onde cada etapa pode receber privilégios ou ser um referencial para os demais elementos, bem como, adicionar outras características que os distinguem ou que passam para os outros elementos abaixo da hierarquia (OLIVEIRA; BELO, 2014).</p><p>‹#›</p><p>Segundo Russell (2013), as ações podem ser divididas em duas, as chamadas primitivas, nomenclatura usada para identificar os modelos apresentados na unidade 1 deste material, apresentando geralmente pré-condição e ação respectiva, e as ações de alto nível, onde as ações são hierarquizadas e acessadas por chamadas unilaterais através de chaves de acesso.</p><p>Expandindo o Planejamento com Hierarquia</p><p>‹#›</p><p>De forma simples, incerteza é a falta de capacidade de um modelo matemático aplicado a um computador de prever uma saída, dado um conjunto de entrada(s). Por sua vez, Mendes (2020), cita que incerteza é a falta de capacidade de dado um conjunto de dados, inferir sobre o significado dos processos.</p><p>Expandindo o Planejamento com Hierarquia</p><p>‹#›</p><p>Problemas de incerteza são tratados em diversas áreas da computação, como a própria IA, métodos estocásticos, computação quântica, entre outros, permitindo que achados sobre o tratamento de incertezas estudados em uma área, sejam, em muitos momentos, utilizados em outras áreas da computação.</p><p>Expandindo o Planejamento com Hierarquia</p><p>‹#›</p><p>Entre as origens da incerteza, podemos citar os ambientes parcialmente observáveis e os casos onde os agentes são incapazes de observar os estados.</p><p>Neste contexto, surge a camada chamada estado de crenças, onde o agente mantém todas as combinações possíveis de serem previstas como base de conhecimento principal ou adicional. Além deste modelo de crenças, o agente também deve possuir um conjunto de regras para tratar situações não previstas.</p><p>Expandindo o Planejamento com Hierarquia</p><p>‹#›</p><p>Uma Visão Geral Sobre o Algoritmo de Bayes no Tratamento das Incertezas</p><p>Esta Seção é destinada a apresentação de algumas teorias que embasam os modelos de inferências que, por sua vez, fundamentam conceitos de independência de dados e do próprio algoritmo de Bayes.</p><p>Para esta fundamentação, apresentaremos a teoria da utilidade, teoria da probabilidade e a teoria da decisão.</p><p>Para esta fundamentação, apresentaremos a teoria da utilidade, teoria da probabilidade e a teoria da decisão:</p><p>Teoria da utilidade: Segundo Nunes e Silva (2019), pode ser entendida como a capacidade de raciocinar ao processar conjunto de dados representados objetivamente, onde fatores emocionas de cada indivíduo, os permite tomar decisões em meio a incerteza</p><p>Uma Visão Geral Sobre o Algoritmo de Bayes no Tratamento das Incertezas</p><p>Teoria da probabilidade: Segundo Russell (2013), os modelos probabilísticos estão ligados a representações de mundo, nunca podendo existir dois mundos ao mesmo tempo, algo que pode ser explicado com base no exemplo acima, pois cada face só pode estar virada para cima caso todas as demais não estejam. Desta forma, cada resultado provável é um mundo específico.</p><p>Uma Visão Geral Sobre o Algoritmo de Bayes no Tratamento das Incertezas</p><p>Teoria da decisão é a solução para a reflexão acima, uma vez que esta teoria procura maximizar as um conjunto de utilidades em forma de mundos baseados nas crenças e desejos dos agentes (RUSSELL, 2013).</p><p>Uma Visão Geral Sobre o Algoritmo de Bayes no Tratamento das Incertezas</p><p>O Algoritmo de Bayes</p><p>O algoritmo de Bayes, comumente chamado de redes bayesianas, é um grafo orientado composto de N vértices, com cada vértice representado um estado probabilístico, ou seja, um mundo.</p><p>‹#›</p><p>Redes bayesianas são indicadas para problemas de raciocínio probabilístico, ou seja, problemas em que não se tem completo conhecimento sobre um problema dado, seja pela falta de dados informativos, ou pela não possibilidade de obtê-los.</p><p>Uma das premissas das redes bayesianas é que cada estado deve apresentar valores que variam entre 0 e 1, desta forma, podemos considerar que o valor 1 representa cem porcento em uma dada probabilidade e 0 zero porcento, com os valores intermediários representando valores entre o zero e o cem porcento.</p><p>O Algoritmo de Bayes</p><p>‹#›</p><p>Também é importante lembrar que dado um conjunto de mundos, a soma total de todos os estados deve ser igual a 1, como no caso dos dados apresentado anteriormente, em que, cada face tem 1/6 porcento de chance de acontecer, ao se somar as seis faces o valor total será 6/6, ou seja, 1.</p><p>Assim, cada vértice da rede será composto de um conjunto de probabilidades ligadas a regras de hierarquia parental, bem como, de ativação do vértice e posterior execução de vértices aparentados a partir dos filhos do nó atual.</p><p>O Algoritmo de Bayes</p><p>‹#›</p><p>Uma Visão Geral Sobre o Modelo Oculto de Markov e sua Contribuição para a IA</p><p>A teoria da probabilidade tem sua provável origem no século nono depois de Cristo, com os trabalhos ligados a criação de regras para análise de possibilidades de combinações de jogadas em jogos de azar.</p><p>Posteriormente, matemáticos célebres como Pascal (1623-1662), Leibniz (1646-1716), Beroulli (1654-1705), Bayes (1702-1761) e Laplace (1749-1827), contribuíram para a noção clássica que temos sobre a probabilidade e sua representação de possibilidades igualmente prováveis entre os elementos de um dado grupo (RUSSELL, 2013).</p><p>Uma das principais contribuições da chamada probabilidade clássica é o princípio da indiferença.</p><p>Uma Visão Geral Sobre o Modelo Oculto de Markov e sua Contribuição para a IA</p><p>Nos últimos 100 anos aproximadamente, as contribuições para a criação de modelos probabilísticos</p><p>se desenvolveu muito, como a definição da lógica indutiva, que parte do princípio que cada indivíduo possui um conjunto de crenças ligadas a diferentes evidências, permitindo que a relação entre as duas variáveis citadas sobre cada indivíduo possam ser tratadas matematicamente de forma precisa (SAINSBURY, 1991).</p><p>Uma Visão Geral Sobre o Modelo Oculto de Markov e sua Contribuição para a IA</p><p>Podemos dizer que ambos os algoritmos, Bayes e Markov, aplicam seus modelos baseados em lógica de primeira ordem, uma vez que o uso de modelos temporais e probabilísticos, respectivamente a cada algoritmo, são expansões dos modelos da lógica proposicional.</p><p>Uma Visão Geral Sobre o Modelo Oculto de Markov e sua Contribuição para a IA</p><p>Relação Entre o Tempo e a Incerteza</p><p>Percebemos que a variável do tempo nos permite criar escalonamentos simples para o tratamento de incertezas, bem como, introduziu o conceito de tratamento de variáveis do mundo real em meios digitais.</p><p>‹#›</p><p>Meios computacionais não são capazes de aplicar modelos realmente contínuos, também conhecidos como valores analógicos, uma vez que a base da computação é a lógica proposicional, o qual, discretiza as interações em dois valores específicos, 1 e 0.</p><p>Porém, os modelos discretos podem ser entendidos como modelos contínuos ao reduzir-se a valores muito pequenos os intervalos de tempo observacionais.</p><p>Relação Entre o Tempo e a Incerteza</p><p>‹#›</p><p>Trataremos características que auxiliam na construção de modelos para problemas temporais, facilitando a construção e manutenção dos modelos com base nas regras de construção e avaliação.</p><p>A primeira característica é a capacidade de fazer estimativas baseadas nos estados de crença de cada agente.</p><p>Relação Entre o Tempo e a Incerteza</p><p>‹#›</p><p>Quando os agentes humanos e computacionais estão filtrando suas escolhas e alterando suas crenças com base em estado internos e externos advindo de suas emoções momentâneas, do ambiente e de outros definimos essa característica como filtragem.</p><p>característica se chamada suavização, permite que os dados anteriores sejam comparados constantemente com os dados atuais e sejam feitas alterações pontuais na estratégia definida.</p><p>Relação Entre o Tempo e a Incerteza</p><p>‹#›</p><p>Característica ligada a exemplificação se chama explicação mais provável.</p><p>Capacidade nos agentes que tratam a incerteza em ambientes temporais é chamada de aprendizagem.</p><p>Segundo Du (2019), o modelo oculto de Markov nos permite fazer a extensão de modelos estáticos em modelos dinâmicos. Já Russell (2013), cita que o modelo oculto de Markov tem por objetivo ser um modelo temporal para tratamento de estados através do uso de apenas uma única vaiável aleatória e discreta.</p><p>Relação Entre o Tempo e a Incerteza</p><p>‹#›</p><p>O modelo oculto de Markov toma por base três variáveis principais, uma ligada ao modelo de transição, outra ligada ao modelo dos sensores e por fim, uma ligada as mensagens de movimentação entre as possibilidades.</p><p>Relação Entre o Tempo e a Incerteza</p><p>‹#›</p><p>Tomadas de Decisão Simples e Complexas</p><p>Até o momento, vimos que uma tomada de decisão racional é orientada primeiramente por uma base de conhecimento básica, o qual, permita que o agente possa consultá-la durante suas inferências, tornando os agentes reativos simples em sistemas capazes de raciocinar.</p><p>‹#›</p><p>A primeira base apresentada foram as tabelas-verdade da lógica proposicional, ao tratar dados binários através de modelos pré-definidos chamados tabela verdade, modelos estes advindos da lógica computacional e lógica dedutiva.</p><p>Em seguida, vimos o uso de grafos baseados na lógica proposicional. Esta estrutura de dados permitiu que a tomada de decisão fosse mais efetiva, ao tratar conflitos e usar o fluxo para direcionar decisões em cadeia.</p><p>Tomadas de Decisão Simples e Complexas</p><p>Até este momento, a tomada de decisões era feita sobre dados certos, em que tínhamos o controle das entradas e das saídas previstas, bem como, qual o fluxo que levaria até uma dada solução. Isto mudou com a inserção da incerteza no capítulo 1 desta unidade.</p><p>A incerteza inseriu um fator em que os agentes não são capazes de prever completamente um estado ou o próprio fluxo de dados.</p><p>Tomadas de Decisão Simples e Complexas</p><p>Neste momento, aprendemos que o uso da teoria da probabilidade nos permite criar soluções baseadas em modelos para o tratamento de problemas incertos.</p><p>Desta forma, podemos retomar a definição do que vem a ser um agente e adicionarmos que agentes inteligentes capazes de raciocinar sobre incertezas, são aquelas que tratam com alguma complexidade os dados, baseando-se na teoria da utilidade e probabilidade.</p><p>Tomadas de Decisão Simples e Complexas</p><p>Assim, trataremos sobre o uso da teoria da decisão, o qual, é baseada na soma das teorias da probabilidade e utilidade.</p><p>A teoria da utilidade procura encontrar a melhor escolha para um grupo de elementos com base em crenças.</p><p>A teoria da probabilidade procura auxiliar na melhor escolha para um dado problema.</p><p>Assim, podemos definir que a teoria da decisão procurará a melhor escolha baseada na utilidade pressuposta nos modelos de crenças.</p><p>Tomadas de Decisão Simples e Complexas</p><p>Agentes de Tomada de Decisão Simples</p><p>Redes de decisão é um termo usado para uma notação chamada também de diagrama de influência. Sua estrutura utiliza as redes bayesianas para com camadas adicionais de tratamento que processam os dados baseado na utilidade.</p><p>‹#›</p><p>Estas redes possuem uma diagramação própria para descrever os modelos, sendo formada por:</p><p>Nós de acaso;</p><p>Nós de decisão;</p><p>Nós de utilidade;</p><p>Ligações.</p><p>Estas são as 4 estruturas básicas das redes de decisão. Esta notação mantem os nós de acaso para representar as implicações, porém, existe uma forma simplificada no qual os nós de acaso são omitidos</p><p>Agentes de Tomada de Decisão Simples</p><p>‹#›</p><p>Por fim, Russell (2013) apresenta um conjunto de regras para avaliar as possíveis soluções de cada nó, os quais, seguem três passos, sendo eles:</p><p>Primeiro passo: Deve ser feita a avaliação para definição das variáveis de evidência que serão utilizadas no processo de decisão do estado atual;</p><p>Segundo passo: É feita a avaliação para definir o custo baseado no valor de cada possível resultado em um dado nó de decisão. Esta regra é dividida em três etapas.</p><p>Agentes de Tomada de Decisão Simples</p><p>‹#›</p><p>Os problemas com vários nós de decisão são chamados de problemas de decisão sequenciais, uma vez que, um conjunto, ou sequência, de decisões estarão conflitante-mente atuando nos agentes durante as escolhas em cada camada de ações.</p><p>Agentes de Tomada de Decisão Simples</p><p>‹#›</p><p>OBRIGADO!</p><p>‹#›</p><p>image6.jpg</p><p>image7.png</p><p>image4.png</p><p>image5.png</p><p>image8.png</p><p>image10.png</p><p>image9.jpg</p><p>image11.jpg</p><p>image12.jpg</p><p>image2.png</p><p>image3.png</p><p>image1.png</p>