Baixe o app para aproveitar ainda mais
Prévia do material em texto
Prof. Dr. Kauê Rosalem UNIDADE I Estudos Disciplinares Inteligência Artificial IA é um ramo da Ciência da computação cujo objetivo é desenvolver sistemas computacionais que exibam características que nós associamos com inteligência no comportamento humano. IA é o estudo de ideias as quais permitem ao computador fazer coisas que façam as pessoas parecerem inteligentes. IA é uma subdivisão da Ciência da Computação preocupada em criar software e hardware com o objetivo de produzir resultados como os produzidos pelas pessoas. IA é o estudo para fazer com que computadores façam coisas que até o momento as pessoas fazem melhor. Definição de Inteligência Artificial Fonte: https://www.cidademarketing.com .br/marketing/2019/08/09/intelige ncia-artificial-vs-inteligencia- humana-porque-together-is- better/ IN – Inteligência Natural Criativa enquanto IA não tem nenhuma inspiração. Possibilita às pessoas se beneficiarem e usarem experiências sensórias. Raciocínio humano faz uso da experiência de um amplo contexto. IA – Inteligência Artificial: Mais permanente. Fácil de duplicar e disseminar. Pode ser menos cara. Mais consistente. Pode ser documentada. IA x IN Humano racional Pensamento Sistemas que pensam como seres humanos Sistemas que pensam racionalmente Comportamento Sistemas que agem como seres humanos Sistemas que agem racionalmente Machine Learning e Deep Learning são métodos para treinar modelos, ou seja, mostrar às máquinas como elas devem aprender a classificar dados. A Inteligência artificial, por sua vez, engloba os dois, e pode ser definida como qualquer técnica que capacite uma máquina a imitar a inteligência humana. Áreas relacionadas com IA Fonte: https://opencadd.com.br/machine-learning-ou-deep-learning/ ARTIFICIAL INTELLIGENCE MACHINE LEARNING DEEP LEARNING Qualquer técnica que capacite uma máquina a imitar a inteligência humana Métodos estatísticos que possibilitam que as máquinas aprendam a partir dos dados sem programação Redes Neurais com múltiplas camadas que assimilam tarefas e reconhecem símbolos a partir dos dados Turing, em 1950, propôs o famoso Teste de Turing no artigo “Computing machinery and intelligence”. O teste foi proposto para fornecer uma definição operacional de inteligência. O computador passará no teste se um interrogador humano, depois de propor algumas perguntas por escrito, não for capaz de distingui-lo de um humano. Teste de Turing Para passar no teste, o computador precisaria ter como capacidades: Processamento de linguagem natural. Representação de conhecimento. Raciocínio automatizado. Aprendizado de máquina. O teste evita a interação física direta para focar na inteligência. O chamado “Teste de Turing Total” inclui um sinal de vídeo para testar habilidades de percepção e também permite manipulação de objetos (robótica). A crítica principal em relação ao teste é que ele não é uma definição a partir de princípios básicos e sim de imitação. Teste de Turing A ideia de que inteligência significa a mesma coisa que comportamento inteligente foi desafiada por alguns estudiosos. O contra-argumento mais conhecido é o experimento da Sala Chinesa, de John Searle. Searle descreve uma experiência em que uma pessoa que não conhece chinês está trancada em uma sala. Do lado de fora da sala existe uma pessoa que pode enviar notas escritas em chinês para dentro da sala através de um espaço para correspondência. A pessoa dentro da sala recebe um grande manual, no qual ela pode encontrar instruções detalhadas para responder às anotações que ela recebe do lado de fora. Searle argumentou que mesmo que a pessoa de fora da sala tenha a impressão de que ela esteja conversando com outra pessoa que fala chinês, a pessoa dentro da sala não entende chinês. O argumento da sala chinesa Fonte: https://opencadd.com.br/machine -learning-ou-deep-learning/ É um subcampo do aprendizado de máquina, que em si é um subcampo da IA, que em si é um subcampo da ciência da computação. Essa é a definição de: a) IA (Inteligência Artificial). b) Deep Learning (Aprendizado Profundo). c) Data Science (Ciência de Dados). d) Visão Computacional. e) Machine Learning (Aprendizado de Máquina). Interatividade É um subcampo do aprendizado de máquina, que em si é um subcampo da IA, que em si é um subcampo da ciência da computação. Essa é a definição de: a) IA (Inteligência Artificial). b) Deep Learning (Aprendizado Profundo). c) Data Science (Ciência de Dados). d) Visão Computacional. e) Machine Learning (Aprendizado de Máquina). No deep learning, as grandes redes neurais artificiais são alimentadas com algoritmos de aprendizado e quantidades cada vez maiores de dados, ampliando continuamente sua capacidade de "pensar" e "aprender”. "Deep" se refere às muitas camadas que a rede neural acumula com o tempo, e o desempenho melhora quanto mais profunda a rede for. Hoje, grande parte do deep learning acontece sob a supervisão humana, mas o objetivo é criar redes neurais que consigam treinar a si mesmas e "aprender" de modo independente. Resposta Talvez estejamos mais familiarizados com aplicações de probabilidade em jogos. No entanto, muito mais importante, a probabilidade também pode ser usada para quantificar e comparar riscos na vida cotidiana: quais são as chances de bater seu carro se você exceder o limite de velocidade ou dirigir falando ao celular? Quais são as chances de que as taxas de juros sobre sua hipoteca subam? Ou quais são as chances de que a IA automatize tarefas específicas, como detectar ossos fraturados em imagens de raios-x ou identificar comportamentos suspeitos em pessoas por reconhecimento facial? O fato de que a incerteza pode ser quantificada é de suma importância, por exemplo, na decisão referente à vacinação ou outras políticas públicas. Os riscos nunca são conhecidos nos mínimos detalhes, mas sua magnitude é geralmente conhecida em grau suficiente para que se possa argumentar se os benefícios superam os riscos. Probabilidade e Incerteza O algoritmo Naive Bayes recebe este nome por ser baseado no Teorema de Bayes. O classificador Bayes é uma técnica de aprendizado de máquina que pode ser usada para classificar objetos como documentos de texto em duas ou mais classes. O classificador é treinado analisando um conjunto de dados de treinamento, para os quais as classes corretas são fornecidas. O algoritmo tem como objetivo calcular a probabilidade que uma amostra desconhecida pertença a cada uma das classes possíveis, ou seja, predizer a classe mais provável. Este tipo de predição é chamada de classificação estatística, pois é completamente baseada em probabilidades. Esta classificação também é chamada ingênua (a palavra Naive em inglês significa ingênuo), pois ela considera que o efeito do valor de um atribuído sobre uma determinada classe é independente dos valores dos outros atributos, o que simplifica os cálculos envolvidos. Classificação Naive Bayes Thomas Bayes (1702-1761) Fonte: https://br.pinterest.com/pin/ 464926361529915932/ Dentre as diversas formas em se definir o conceito de aprendizagem de máquina, temos: Aprendizado é a capacidade de se adaptar, modificar e melhorar seu comportamento e suas respostas, sendo portanto uma das propriedades mais importantes dos seres ditos inteligentes, sejam eles humanos ou não. Ou seja, estamos tentando reproduzir nas máquinas o mesmo processo de aprendizagem dos seres humanos e fazemos isso através de algoritmos de Machine Learning, que em última instância nada mais são do que Matemática e Estatística. Existem muitos algoritmos que permitem fazer isso, cabendo a um Cientista de Dados escolher o algoritmo que melhor se encaixa em cada tipo de problema a resolver. Aprendizagem de Máquina Aprendizagem deMáquina – Aplicabilidades Fonte: https://isitics.com/2018/05/ 10/principais-sub-divisoes- e-aplicabilidade-da- aprendizagem-de-maquina/ Reconhecimento de imagens Retenção de clientes Diagnósticos Previsões de mercado Decisões em tempo real Navegação de robôs Aquisição de conhecimento Tarefas de constante aprendizagem Segmentação de clientes Sistema de recomendação Visualização de atributos Elicitação de atributos Aprendizagem supervisionada Aprendizagem não supervisionada Aprendizagem por reforço Aprendizagem de máquina Aprendizagem Supervisionada: o supervisionamento é feito através do treinamento com dados rotulados, ou seja, etiquetados com algum tipo de classe. Por exemplo, produtos podem ser classificados em duas classes: com defeito e sem defeito. Aprendizagem Não Supervisionada: ao contrário da supervisionada, aqui não se faz necessário o uso de etiquetas. Aqui são encontrados algoritmos de recomendação, agrupamento e segmentação. Aprendizagem por Reforço: a aprendizagem por reforço é muito utilizada em sistemas de decisão em tempo real. Neste caso, não existe um grande conjunto de dados históricos para que seja gerado um conjunto de treinamento e consequentemente seja possível criar um modelo de aprendizado. Aprendizagem de Máquina Podemos definir como uma aplicação real de IA o seguinte exemplo: a) Um Filtro de SPAM. b) Um Classificador de Documentos. c) Um Identificador de Faces. d) Um Gerador automático de Códigos. e) Todas as alternativas estão corretas. Exemplo Podemos definir como uma aplicação real de IA o seguinte exemplo: a) Um Filtro de SPAM. b) Um Classificador de Documentos. c) Um Identificador de Faces. d) Um Gerador automático de Códigos. e) Todas as alternativas estão corretas. Resposta Em seu estado atual, a IA encontra apenas algumas aplicações especializadas, como ferramentas de apoio à decisão para radiologistas. No futuro próximo, teremos a triagem automática rápida de imagens normais versus imagens anormais (cerca de 80% dos exames são geralmente normais, 15% são anormais, mas fáceis de interpretar, e 5% são difíceis de interpretar). Muitos especialistas acreditam que a radiologia baseada em IA irá superar com grande margem as capacidades de radiologistas bem treinados, e uma das razões é a maneira como o Big Data será usado. O diagnóstico por imagem é uma tarefa essencialmente visual, ou seja, quanto mais imagens o radiologista vê ao longo de sua profissão, melhor ele será no diagnóstico. Medicina Diagnóstica e IA Fonte: https://forumsaudedigital.com.br /fidi-e-aidoc-firmam-parceria- para-aplicar-inteligencia- artificial-a-radiologia/ A velocidade com que as perdas financeiras podem ocorrer por conta de fraude de cartão de crédito torna as técnicas inteligentes de detecção de fraudes cada vez mais importantes. Devido à disponibilidade de grandes volumes de dados de clientes e de dados transacionais, a Inteligência Artificial pode ser usada para identificar com eficiência padrões de comportamento de cartões de crédito irregulares para clientes específicos. As empresas de segurança cibernética podem se concentrar na implementação de aprendizado profundo para criar impressões digitais de usuários e transações, usando modelos matemáticos através da criação de clusters que podem então ser monitorados. Conseguir isso reduzirá os custos gerais dos bancos e melhorará sua reputação com os clientes, que provavelmente serão mais leais a uma instituição que proteja melhor seu dinheiro. Detecção de fraudes e IA Fonte: https://computerworld.com.br/segu ranca/maioria-das-financeiras- sofreu-tentativa-de-fraude-nos- ultimos-anos/ A melhor abordagem para o raciocínio sob incerteza e quase todas as aplicações atuais de IA pode ser definida por: a) Probabilidades. b) Incertezas. c) Certezas. d) Dúvidas. e) Pesquisa e Desenvolvimento. Interatividade A melhor abordagem para o raciocínio sob incerteza e quase todas as aplicações atuais de IA pode ser definida por: a) Probabilidades. b) Incertezas. c) Certezas. d) Dúvidas. e) Pesquisa e Desenvolvimento. O campo de pesquisa em computação probabilística não é novo, mas os avanços em processamento de alto desempenho e algoritmos de aprendizagem profunda podem levá-lo a uma nova era. Nos próximos anos, devemos acompanhar o desenvolvimento significativo dos sistemas de Inteligência Artificial em termos de confiabilidade, segurança, facilidade de manutenção e desempenho, incluindo o surgimento de hardware projetado especificamente para computação probabilística. Esses avanços são essenciais para o uso dessas aplicações no mundo real – de casas até cidades inteligentes. Resposta Dados, Características e Algoritmos Fonte: https://www.datageek s.com.br/machine- learning/ Algoritmos de Machine Learning Fonte: https://www.geeksforgeeks.org/ Clustering Unsupervised Learning Machine Learning Reinforcement Learning Supervised Learning Regression Dimensionality Reduction Classification Navie Bayes SVM K-Nearest Neighbor Decision Tree Linear Regression Logistic Regression Principal Component Analysis (PCA) Feature Selection Linear Discriminant Analysis (LDA) K-Means Mean Shift K-Medoids O M significa Modificado, e NIST significa Instituto Nacional de Padrões e Tecnologia. O MNIST é um dataset de dígitos escritos à mão amplamente usado por quem está estudando sobre Machine Learning. Esses dígitos manuscritos foram então digitalizados e etiquetados. No total são 60.000 imagens de treinamento e 10.000 imagens de teste. O MNIST é gratuito e pode ser usado para você treinar seus algoritmos de Machine Learning antes de usar datasets maiores e mais complexos. Este é o site oficial do MNIST: http://yann.lecun.com/exdb/mnist/ O que gostaríamos de alcançar é um método de IA que possa receber uma imagem e automaticamente citar o rótulo correto (um número entre 0 e 9). MNIST O classificador de vizinho mais próximo está entre os classificadores mais simples possíveis. Quando recebe um item para classificar, ele encontra o item de dados de treinamento mais semelhante ao novo item e exibe seu rótulo. Distância geométrica padrão/distância euclidiana. A ideia é usar um princípio muito simples de que os usuários com comportamentos passados e semelhantes tendem a ter um comportamento futuro também semelhante. Exemplos: sistema de recomendação de músicas e filmes que coleta dados sobre o comportamento dos usuários e realiza novas sugestões. Classificador do vizinho mais próximo (K nearest neighboors – KNN) Fonte: http://computacaointelige nte.com.br/algoritmos/k- vizinhos-mais-proximos/ Rótulo A Rótulo B Distância k = 7 A regressão linear é uma metodologia desenvolvida a partir da estatística e da econometria. Este método serve para avaliar os efeitos que outras variáveis causam sobre uma variável analisada. A ideia básica na regressão linear é somar os efeitos de cada uma das variáveis de recurso para produzir o valor previsto. O termo técnico para o processo de soma é a combinação linear. A palavra linear significa que o aumento na saída quando uma característica de entrada é aumentada por alguma quantidade fixa é sempre a mesma. Regressão linear simples (2 variáveis) Regressão linear múltipla (3 ou mais variáveis) Exemplo: analisar a venda de um produto relacionada ao crescimento populacional de um país. Regressão linear Fonte: https://www.dicionariofinanceiro. com/regressao-linear/ Dados observados Regressão linear 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 Um dos casos particulares dos modelos lineares generalizados são os modelos em que a variável resposta apresenta apenas duas categorias, assumindo valores 0 ou 1, sendo o modelo de regressão logística o mais popular desses modelos. A regressãologística é usada para problemas de classificação, em que trabalhamos com variáveis categóricas. O modelo de regressão logística é semelhante ao modelo de regressão linear. Uma variável binária assume dois valores, como por exemplo, Y = 0 e Y = 1 denominados “fracasso” e “sucesso”. A regressão logística é amplamente usada em ciências médicas e sociais, e tem outras denominações, como modelo logístico. Regressão logística Fonte: https://aimlsite.wordpress.com/ 2017/08/13/regressao-logistica- gradiente-descendente/ P ro b a b il it y ( 1 /1 0 ) Model Output 1 0,8 0,6 0,4 0,2 0 -20 -10 0 10 20 0’s 1’s Sobre os itens abaixo, é correto afirmar: I. No caso de reconhecimento de dígitos MNIST, uma maneira comum de medir a similaridade de imagem é contar as correspondências pixel a pixel. II. Um exemplo típico de uma aplicação do método do vizinho mais próximo é prever o comportamento do usuário em aplicativos de IA, como sistemas de recomendação. III. Os sistemas de recomendação atuais usam filtragem colaborativa em vez dos metadados inseridos manualmente. a) Somente I é correto. b) Somente I e III são corretos. c) Somente II é correto. d) Somente II e III são corretos e) I, II e III são corretos. Interatividade Sobre os itens abaixo, é correto afirmar: I. No caso de reconhecimento de dígitos MNIST, uma maneira comum de medir a similaridade de imagem é contar as correspondências pixel a pixel. II. Um exemplo típico de uma aplicação do método do vizinho mais próximo é prever o comportamento do usuário em aplicativos de IA, como sistemas de recomendação. III. Os sistemas de recomendação atuais usam filtragem colaborativa em vez dos metadados inseridos manualmente. a) Somente I é correto. b) Somente I e III são corretos. c) Somente II é correto. d) Somente II e III são corretos e) I, II e III são corretos. Resposta Uma rede neural pode significar uma rede neural biológica “real”, como a do cérebro, ou uma rede neural artificial simulada em um computador. Uma rede neural, biológica e artificial, consiste de um grande número de unidades simples, neurônios, que recebem e transmitem sinais uns aos outros. Redes neurais artificiais formam um conjunto de algoritmos de Machine Learning, que tentam simular o funcionamento do cérebro humano para realizar atividades complexas. Uma das razões para o interesse é a esperança de entender nossa própria mente, que emerge do processamento neural em nosso cérebro. Definição de Redes Neurais Fonte: https://deeplearningbr asil.wordpress.com/ Dendritos (terminal de recepção) Corpo Axônio Bainha de Mielina Nodo de Ranvier Terminal do Axônio (terminal de transmissão) Sentido de propagação Seu primeiro conceito foi introduzido em 1943, mas ganhou popularidade algumas décadas depois com a introdução de algoritmos de treinamento como retropropagação (backpropagation), que permite a realização de um treinamento posterior para aperfeiçoar os resultados do modelo. Atualmente, há diversas topologias das RNA’s que buscam resolver diferentes tipos de problemas, tais como: Processamento de linguagem natural. Reconhecimento de fala e imagens. Previsão de valores. A operação de uma unidade de processamento, proposta por McCullock e Pitts em 1943, pode ser resumida da seguinte maneira: Sinais são apresentados à entrada. Cada sinal é multiplicado por um número, ou peso, que indica a sua influência na saída da unidade. É feita a soma ponderada dos sinais que produz um nível de atividade. Se este nível de atividade exceder um certo limite (threshold), a unidade produz uma determinada resposta de saída. Redes Neurais Artificiais Fonte: http://deeplearningbook.com.br/o- perceptron-parte-1/ Um dos primeiros modelos formais de computação neural e por causa de seu papel fundamental na história das redes neurais: “mãe de todas as redes neurais artificiais”. Pode ser usado como um classificador simples em tarefas de classificação binária. Um método para aprender os pesos do perceptron a partir dos dados, chamado de algoritmo Perceptron, foi introduzido pelo psicólogo Frank Rosenblatt, em 1957. O princípio básico é alimentar os dados de treinamento da rede, um exemplo de cada vez. Cada erro de classificação leva a uma atualização no peso. Algoritmo Perceptron Fonte: http://deeplearningbook.co m.br/o-perceptron-parte-1/ O Perceptron é uma rede neural de camada única. Um Perceptron de várias camadas é chamado de Rede Neural Artificial. O Perceptron é um classificador linear (binário). Algoritmo Perceptron Fonte: http://deeplearningbook.co m.br/o-perceptron-parte-1/ Utilizada para o reconhecimento de um objeto em qualquer lugar de uma imagem, não importando onde ela tenha sido observada nas imagens de treinamento. Os neurônios convolucionais são normalmente colocados nas camadas inferiores da rede, que processa os pixels brutos de entrada. Neurônios básicos (como o neurônio do perceptron discutido anteriormente) são colocados nas camadas mais altas, que processam a saída das camadas inferiores. As camadas inferiores geralmente podem ser treinadas usando aprendizado não supervisionado, assim com fotos de animais, características típicas serão orelhas e focinhos. Isso significa que camadas convolucionais pré-treinadas podem ser reutilizadas em muitas tarefas de processamento de imagem diferentes. As camadas superiores são sempre treinadas por técnicas supervisionadas de aprendizado de máquina, como retropropagação (backpropagation). Redes Neurais Convolucionais (CNNs) Fonte: http://deeplearningbook.com .br/introducao-as-redes- neurais-convolucionais/ Input layer hidden layer 1 hidden layer 2 hidden layer 3 Ouput layer Uma das redes é treinada para gerar imagens como as dos dados de treinamento. A tarefa da outra rede é separar as imagens geradas pela primeira rede das imagens reais dos dados de treinamento, ela é chamada de rede adversária, e todo o sistema é chamado de Rede Adversária Generativa ou GAN (Generative Adversarial Network). O sistema treina os dois modelos lado a lado. No início do treinamento, o modelo contraditório tem uma tarefa fácil de diferenciar as imagens reais dos dados de treinamento e as tentativas desajeitadas do modelo generativo. À medida que a rede generativa lentamente se torna melhor, o modelo adversário também precisa melhorar, e o ciclo continua até que, finalmente, as imagens geradas são quase indistinguíveis das imagens reais. Redes Adversárias Generativas (GANs) Fonte: http://deeplearningboo k.com.br/introducao- as-redes-adversarias- generativas-gans- generative- adversarial-networks/ Training set Random noise Generator Fake image Discriminator Real Fake Para construir um classificador de rede neural, precisamos formalizar o problema de uma maneira que possamos resolvê-lo usando os métodos que aprendemos. A GAN é um tipo de rede neural que gera as imagens reais a partir de pontos de dados. Portanto, devemos utilizá-la para nos auxiliar a solucionar nossos problemas. Verdadeiro ou Falso? Redes incluindo camadas convolucionais são chamadas de redes neurais convolucionais (CNNs). Sua principal propriedade é que elas podem detectar recursos da imagem, como pontos claros ou escuros (ou cores específicas), bordas em várias orientações e padrões. Verdadeiro ou Falso? Exemplo Para construir um classificador de rede neural, precisamos formalizar o problema de uma maneira que possamos resolvê-lo usando os métodos que aprendemos. A GAN é um tipo de rede neural que gera as imagens reais a partir de pontos de dados. Portanto, devemos utilizá-la para nos auxiliar a solucionar nossos problemas. Verdadeiro ou Falso? Falso! Redes incluindo camadas convolucionais são chamadas de redes neurais convolucionais (CNNs). Sua principal propriedade é que elaspodem detectar recursos da imagem, como pontos claros ou escuros (ou cores específicas), bordas em várias orientações e padrões. Verdadeiro ou Falso? Verdadeiro! Exemplo – Resposta O Perceptron pode ser usado para: a) Tarefas de classificação binária. b) Criar hipérboles de IA. c) Trabalhar como o principal algoritmo durante o inverno da IA. d) Reconhecimento de imagens. e) Todas as opções estão erradas. Interatividade O Perceptron pode ser usado para: a) Tarefas de classificação binária. b) Criar hipérboles de IA. c) Trabalhar como o principal algoritmo durante o inverno da IA. d) Reconhecimento de imagens. e) Todas as opções estão erradas. Resposta ATÉ A PRÓXIMA!
Compartilhar