relatorio final para o desafio profissional AI 02 (aula 7 ok)

•

UNIP

Vinicius Ferreira

28/02/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Cálculo I

182.646 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Desafio Profissional Inteligência Artificial
CHARLES RODRIGUES SANTOS RA: 061334
OTAVIO FORTUNATO RIBEIRO DA COSTA RA: 14002097
RODRIGO DE OLIVEIRA BRANDÃO RA: 1921620242 VINICIUS FERREIRA GONCALVES RA: 1821629536
Relatório final das aulas de Inteligência artificial
Aula 1- Introdução Dia 19/10/2020 semana 1 dia 1
Inteligência artificial é a capacidade de dispositivos eletrônicos de funcionar de uma maneira que lembra o pensamento humano. Isso implica em perceber variáveis, tomar decisões e resolver problemas. Enfim, operar em uma lógica que remete ao raciocínio
Inteligência artificial deu início em 1956 com um professor chamado John McCarthy da Universidade de Dartmouth em Hanover nos Estados Unidos. McCarthy selecionou um grupo de cientistas com os quais trabalhou durante um verão, estudando uma forma de “ensinar” as máquinas. Para isso, seria necessário descrever precisamente aspectos do aprendizado e outras características da inteligência humana. Desta forma, as máquinas seriam capazes de utilizar a linguagem, resolver problemas e aperfeiçoar-se gradativamente.
A importância da inteligência artificial (IA) possibilita que máquinas aprendam com experiências, se ajustem a novas entradas de dados e performem tarefas como seres humanos. A maioria dos exemplos de IA sobre os quais você ouve falar hoje – de computadores mestres em xadrez a carros autônomos – dependem de deep learning e processamento de linguagem natural. Com essas tecnologias, os computadores podem ser treinados para cumprir tarefas específicas ao processar grandes quantidades de dados e reconhecer padrões nesses dados.
Historia da IA
· Filosofia (de 428 A.C. até a atualidade)
-Lógica, métodos de raciocínio, mente como um sistema físico, origens do aprendizado (indução), racionalidade
· Matemática (cerca de 800 até a atualidade)
-Representações formais, algoritmos, computabilidade, intratabilidade, probabilidade
· Economia (de 1776 até a atualidade)
-Conceito de utilidade, teoria da decisão, teoria dos jogos
· Neurociência (de 1861 até a atualidade)
-Substrato físico para a atividade mental
· Psicologia (de 1879 até a atualidade)
-Percepção e controle motor, técnicas experimentais
· Engenharia da computação (de 1940 até a atualidade)
-Construção de computadores rápidos, ambientes computacionais, conceitos de programação
-Linguística (de 1957 até a atualidade)
-Representação do conhecimento e gramática
· 1943 – McCulloch & Pitts: Modelo booleano do cérebro
· 1950 – Turing publica “Computing Machinery and Intelligence”
· 1956 – Encontro em Dartmouth: o termo “Inteligência Artificial” é criado
· 1950s – Primeiros programas de IA, incluindo o jogador de damas de Samuel, o Logic Theorist de Newell & Simon e o Geometry Theorem Proverde Gelernter.
· 1965 – Robinson descobre um método de raciocínio lógico completo
· 1966-73 – IA enfrenta o problema da complexidade computacional. A pesquisa em redes neurais quase desaparece.
· 1969-79 – Desenvolvimento de sistemas especialistas
· 1980 - IA(sistemas especialistas) se torna uma indústria
· 1986 - Retorno das redes neurais
· 1987 - IA se torna uma ciência
· 1995 - Surgimento de agentes inteligentes
-Popularizados na internet
habilidades são consideradas de inteligência:
· Aprender ou entender a partir da experiência
· Dar sentido a mensagens ambíguas ou contraditórias
· Responder rapidamente e com sucesso frente a uma situação nova (flexibilidade) Usar raciocínio na solução de problemas
· Lidar com situações de perplexidade
· Entender e inferir de modo comum, racional
· Adquirir e aplicar conhecimento
· Pensar e raciocinar
· Reconhecer a importância relativa de diferentes elementos dentro de uma situação
Teste de Turing
· Turing em 1950 propôs o famoso Teste de Turing no artigo “Computing machinery and intelligence”.
· O teste foi proposto para fornecer uma definição operacional de inteligência.
· O computador passará no teste se um interrogador humano, depois de propor algumas perguntas por escrito, não for capaz de distingui-lo de um humano.
-Para passar no teste, o computador precisaria ter como capacidades:
-Processamento de linguagem natural
-Representação de conhecimento
-Raciocínio automatizado
-Aprendizado de máquina
Observaçoes este teste:
· O teste evita a interação física direta para focar na inteligência.
· O chamado “Teste de Turing Total” inclui um sinal de vídeo para testar habilidades de percepção e também permite manipulação de objetos (robótica).
· A crítica principal em relação ao teste é que ele não é uma definição a partir de princípios básicos e sim de imitação.
· Prêmio Loebner
Categorizações da inteligência artificial
Inteligência artificial Fraca
· É uma corrente de pesquisa e desenvolvimento que defende que nunca será possível construir máquinas inteligentes no real sentido da palavra, pois, para ela, a inteligência demanda consciência e autopercepção, habilidades impossíveis de serem recriadas.
· Tudo que se pode fazer envolve imitar comportamentos inteligentes e emoções, bem como resolver problemas, mas nunca a consciência, considerando que isso se resume a um conjunto de cálculos.
Inteligência artificial Forte
· Acreditam que um dia será possível recriar máquinas capazes de pensar, criar e exibir comportamento inteligente nos moldes humanos, a partir da criação de algoritmos cognitivos que possam executar em computadores.
· Assim, essas duas correntes são de caráter filosófico e servem para refletir sobre os limites da tecnologia.
Superinteligência
· Foi definido pelo filósofo sueco Nick Bostrom como “um intelecto que é muito mais inteligente do que o melhor cérebro humano em praticamente todas as áreas, incluindo criatividade científica, conhecimentos gerais e habilidades sociais”.
· Nesse tipo hipotético de inteligência artificial, concentram-se hoje as principais discussões, pois é dessa área que vêm as promessas mais promissoras e assustadoras para o futuro da humanidade: a imortalidade ou a extinção dos seres humanos.
Aula 2- Estatística e Introdução a Agentes Inteligentes Dia 21/10/2020 semana 1 dia 2
Resumo de Estatística na IA
O conceito de arbitragem estática envolve a busca por anomalias momentâneas nas relações de preços entre diversos ativos, de modo que, quando ais distorções sejam corrigidas, seja possível obter lucros, com consistência e baixo risco. O uso de técnicas do campo da econometria abre a possibilidade de determinar quando a relação entre dois (ou mais) ativos se desvia de um cero equilíbrio. O conceito de cointegração, aqui representado pela metodologia de Engle-Granger, permite testar a existência desse equilíbrio (mais precisamente, estacionariedade no resíduo), e determinar um modelo para aproveitar as oportunidades criadas pelos desvios. Na dissertação é apresentada uma variação da técnica de Engle-Granger que permite construir essas de ações, cujos resíduos (ou mispricings ) são cointegrados. Contudo, tomar decisões de compra e venda apenas com base em ideias de reversão à média não necessariamente é lucrativo, como será mostrado através da simulação de estratégias de arbitragem estática implícita. As redes neurais aparecem então como uma ferramenta não-paramétrica de previsão, dada sua capacidade de se adaptar a dados com grande dose de ruído. A teoria relevante para o projeto e uso de uma rede neural é apresentada, e são discutidas aplicações dessa classe de modelos a problemas de previsão em finanças. Mais ainda, cada uma das características de uma boa rede é explorada, visando um modelo de alo desempenho. Esse modelo é então combinado com o modelo de cointegração, e vai prever o comportamento futuro dos mispricings, de maneira a identificar os pontos de compra e venda dessas certas ações. Ao fim, algumas técnicas de trading são implementadas em conjunto com os modelos, de maneira a melhorar os retornos sem aumentar os riscos, na presença de custos de transação.
Conceitose fundamentos
· População: É o conjunto de elementos e o número de pessoas de uma cidade.
· Amostra: Envolve uma parte representativa de uma população.
· Frequência Absoluta: Trata-se do valor exato, número de vezes que o valor da variável é citado.
· Frequência relativa: Envolve o valor representado pela porcentagem, a divisão entre a frequência absoluta de cada variável e o somatório das absolutas.
· Média aritmética:É a medida de tendência central, o somatório dos valores dos elementos dividido pelo seu número.
· Média aritmética ponderada:Envolve o somatório dos valores dos elementos multiplicado pelos seus respectivos pesos e dividido pela soma dos pesos atribuídos.
· Moda :É o valor de maior frequência em uma série de dados, o que mais se repete.
· Mediana:Trata-se da medida central em determinada sequência de dados numéricos.
· Média: é um dos conceitos mais básicos da estatística e um valor que representa vários outros.
Machine learning e deep learning
· O machine learning é uma subárea da inteligência artificial e a principal técnica por trás da automação. Trata-se da construção de algoritmos que aprendem a partir dos dados, em que a estatística tem um papel fundamental, oferecendo as ferramentas necessárias para o processo de análise e a construção de modelos.
· Assim, aprender análise estatística te tornará um profissional preparado para o novo mundo.
· Atualmente muito associado ao Big Data e a Analytics, o machine learning foi defendido por T. Mitchell, em 1997, e surgiu dos sistemas baseados em conhecimento da inteligência artificial clássica. Seu grande objetivo é desenvolver sistemas que aprendem por si mesmos por meio de experiências e comportamentos passados (aprendizagem não supervisionada); entrada de mapas de dados (aprendizagem supervisionada); e interação com o ambiente (aprendizagem por reforço), por exemplo, dirigindo um carro.
· Para implementar o machine learning, diversas técnicas estão envolvidas, como uso de estatística para auxiliar na análise e predição de dados até técnicas de mineração de dados (data mining), algoritmos de árvore de decisão, redes bayesianas e processos de clustering.
· O deep learning é uma técnica de machine learning eficaz e precisa para aprendizagem de máquina, que utiliza grandes quantidades de dados não estruturados, possibilitando a representação hierárquica das suas camadas.
· Os algoritmos de rede neural artificial (RNA) são usados nele justamente por permitir que o aprendizado de padrões ocorra.
· Portanto, quaisquer soluções que envolvam o reconhecimento de voz, o processamento de imagem, a análise de comportamento, entre outras características, podem ser aplicações factíveis de deep learning.
Agentes inteligentes
· Um agente é algo capaz de perceber seu ambiente por meio de sensores e de agir sobre esse ambiente por meio de atuadores.
· executam continuamente três funções: percebem as condições dinâmicas do ambiente, agem alterando as condições do ambiente e raciocinam de modo a interpretar percepções, resolver problemas, fazer inferências e determinar ações.
· Quanto comparados com os modelos de Vida Artificial, os modelos e teorias de Agentes Inteligentes, discutidos a seguir, apresentam um maior nível de abstração e simbolismo, em maior consonância com a IA Simbólica. Enquanto que nos modelos de Vida Artificial, a complexidade emergente, a interatividade e evolutibilidade são características fundamentais, nos modelos de agentes inteligentes parte-se do princípio de que a inteligência, de alguma forma, já deve estar presente nos elementos autônomos.
Aplicações de agentes inteligentes
• Agricultura
• Indústria
• Matemática
• Medicina
• Ciência
• Transportes
• Química
• Comunicações
• Computação
• Eletrônica
• Engenharia
• Meio ambiente
• Geologia
PEAS
Ao projetar um agente, a primeira etapa deve ser sempre especificar o ambiente de tarefa.
· Performance = Medida de Desempenho
· Environment = Ambiente
· Actuators = Atuadores
· Sensors = Sensores
Exemplo:
Robô de seleção de peças
Medida de desempenho: porcentagem de peças em bandejas corretas.
Ambiente: correia transportadora com peças, bandejas.
Atuadores: braço e mão articulados.
Sensores: câmera, sensores angulares articulados.
Aula 3- Estrutura de Dados Dia 26/10/2020 semana 2 dia 3
Python
é mantida pelo Python Software Foundation (PSF) Entre os diversos softwares que o utilizam no seu core (núcleo), pode-se destacar o PostgreSQL, o BrOffice, o Blender e outros.
pode ser utilizado em aplicações de inteligência artificial, chamada machine learning (aprendizado de máquina), na qual existe um subcampo da inteligência dedicado ao desenvolvimento de técnicas por meio dessa linguagem, que permitem aos sistemas de computação aprender com base em dados matemáticos empíricos.
Lista
É uma estrutura de dados dinâmicos,formada por uma sequencia encadeada de elementos que também são chamados de nos. Os nos dentro de uma lista contem pelo menos dois campos principais: campo de informação e campo de endereço.
O campo de informação é responsável por armazenar os elementos da lista,e o campo de endereço armazena o endereço do próximo nó da lista.
Fila
É uma estrutura de dados dinâmica e ordenada,em que os elementos dentro da fila seguem a seguinte regra:para sair da fila,os elementos precisam estarem uma extremidade,chamada início da fila;para entrar na fila,precisam estar na outra extremidade chamada final da fila.
Pilha
São estruturas de dados em conjunto ordenado,em que os elementos podem ser inseridos e eliminados em uma extremidade chamada de topo. Assim,novos elementos podem ser inseridos no topo da pilha,tornando-se então o primeiro elemento.
Árvores Binárias
· As árvores são a demonstração, em formato de galhos de árvore, de um conjunto de nós que se ligam a uma raiz, com o intuito de hierarquizar dados e informações
· Conceitos de altura da árvore, profundidade, pais e folhas ou nós filhos
Aula 2- Aula 4- Problemas de Buscas Dia 28/10/2020 semana 2 dia 4
Busca
· Um agente com várias opções imediatas pode decidir o que fazer comparando diferentes sequências de ações possíveis.
· Esse processo de procurar pela melhor sequência é chamado de busca.
· Formular objetivo [situação atual; medida desempenho > buscar > executar]
Busca de soluções
· Ideia: Percorrer o espaço de estados a partir de uma árvore de busca
· Expandir o estado atual aplicando a função sucessor, gerando novos estados.
· Busca: seguir um caminho, deixando os outros para depois.
· A estratégia de busca determina qual caminho seguir.
Busca Sem Informação
· Estratégias de busca sem informação usam apenas a informação disponível na definição do problema.
- Apenas geram sucessores e verificam se o estado objetivo foi atingido.
- Estratégias que medem a função de utilidade, são heurísticas.
· As estratégias de busca sem informação se distinguem pela ordem em que os nós são expandidos.
-Busca em extensão (Breadth-first)
-Busca de custo uniforme
-Busca em profundidade (Depth-first)
-Busca em profundidade limitada
-Busca de aprofundamento iterativo
Busca em Largura
· O algoritmo de busca em largura ou BFS se originou da teoria dos grafos, com a função de realizar buscas em estruturas de dados como árvores e grafos, inicializando a partir do nó raiz e continuando a verificação dos nós vizinhos até que o elemento buscado seja encontrado (COPPIN, 2010).
· No algoritmo BFS, há, por definição, uma busca desinformada e exaustiva, que examina todos os nós de uma árvore ou arestas/vértices de um grafo até encontrar o elemento buscado (DROZDEK, 2017).
· Portanto, sua finalidade é realizar a exploração de árvores e grafos a fim de buscar determinado elemento, ao qual se deseja encontrar.
· A borda é uma fila FIFO (first-in, first-out), isto é, novos itens entram no final.
Busca em Profundidade
· O algoritmo de busca em profundidade ou DFS, assim como o BFS, é oriundo da teoria dos grafos e usado para realizar buscasem uma árvore ou um grafo.
· Ele se inicializa selecionando algum nó para ser o nó raiz no grafo, por exemplo, e, a partir desse nó, explora cada um dos ramos.
· Sua primeira utilização não foi com a estrutura de dados, mas com a busca por caminhos de saídas em problemas com labirintos no século XIX, tendo o auxílio do matemático Tremaux (PERKOVIC, 2016).
· Assim, o algoritmo DFS realiza uma busca em profundidade a partir do primeiro nó filho no caso de uma árvore, se aprofundando pelos ramos desta até achar o elemento buscado ou se encontrar com um nó folha, que não possui filhos; caso isso ocorra, a busca sofre um retrocesso (backtrack) e recomeça o próximo nó.
· Para realizar essa busca, todos os nós são inseridos em uma pilha para que se viabilize a exploração nó por nó.
· Borda = fila LIFO (last-in, first-out) = pilha
Busca de Custo Uniforme
As estratégias de busca sem informação se distinguem pela ordem em que os nós são expandidos.
-Busca em extensão (Breadth-first)
-Busca de custo uniforme
-Busca em profundidade (Depth-first)
-Busca em profundidade limitada
-Busca de aprofundamento iterativo
Aula 5- Buscas com informação/Tabelas Hash Dia 04/11/2020 semana 3 dia 5
Busca com informação (ou heurística)
Avaliação dos nós pode ser baseada em uma informação incompleta. Uma heurística é usada para guiar o processo de busca. Estratégias de Busca Heurística usam informação do domínio para limitar a busca sobre áreas onde podem existir soluções.
Busca pela melhor escolha (gulosa)
· Ideia: usar uma função de avaliação f(n) para cada nó.
· Estimativa do quanto aquele nó é desejável
· Expandir nó mais desejável que ainda não foi expandido
· Função de avaliação f(n) = h(n) (heurística)
· estimativa do custo de n até o objetivo
· Ex.: hDLR(n) = distância em linha reta (DLR) de n até Bucareste.
Exemplo de busca gulosa pela melhor escolha.
Romênia com custos em km.
Busca A*
· Ideia: evitar expandir caminhos que já são caros
· Função de avaliação f(n) = g(n) + h(n)
· g(n) = custo para alcançar n
· h(n) = custo estimado de n até o objetivo
· f(n) = custo total estimado do caminho através de n até o objetivo.
Exemplo: Heurísticas Admissíveis.
· Para o quebra-cabeça de 8 peças:
· h1(n) = número de peças fora da posição
· h2(n) = distância “Manhattan” total (para cada peça calcular a distância em “quadras” até a sua posição)
· h1(S) = ? 8
· h2(S) = ? 3+1+2+2+2+3+3+2 = 18
Tabelas hash.
Um exemplo clássico é a implementação de uma tabela de dispersão com um vetor, que, neste caso, terá oito posições, logo, a função hashing será h(x) = x MOD 8. Utiliza-se o MOD porque ele representa o resto de uma divisão, como 10 MOD 8 = 2, em que 10/8 equivale ao quociente 1 e resto 2 ou 8*1 + 2 = 10.
Pode-se sugerir que a função h(k) é a posição original da chave k, a qual deve ser inserida nessa posição da tabela (DROZDEK, 2017).
Assim, realiza-se a inserção de uma coleção de valores, com suas respectivas chaves em uma tabela de dispersão, conforme você pode ver no Quadro 1
Colisões em tabelas hash.
Para entender as colisões em tabelas hash, a melhor forma é mostrando como uma colisão ocorre. Portanto, pressuponha que você tenha uma tabela de dispersão para armazenamento de valores, conforme as chaves, logo, haverá uma associação entre chave e valor, que responde aos seguintes parâmetros:
W, o número de posições na tabela hash ou de dispersão.
K, o número de chaves de outra tabela (chamada tabela key).
X, o fator de associação entre as duas tabelas (X = K/W).
A partir disso, você precisa aplicar uma função de associação entre as chaves da tabela key e as posições da tabela de dispersão, ocorrendo a função hashing, responsável por transformar cada chave em um índice da tabela hash. Logo, essa função implementa a seguinte requisição: “qual posição da tabela hash deverá ser associada às chaves da tabela key”.
Assim, a função hashing inicializa uma alocação dinamicamente das chaves na tabela de dispersão, associando esta à tabela key.
Observe que houve colisões no índice hashing com associação da chave 2 duas vezes, respectivamente com as chaves a e d e os valores xyz e uvw.
Como foi citado anteriormente, esse tipo de situação é comum em banco de dados, quando há a indexação de uma grande quantidade de dados em tabelas, logo, as tabelas hash ou de dispersão costumam utilizar vetores na função hashing para realizar a associação entre as tabelas (COPPIN, 2010).
Logo, conclui-se que há colisões quando os vetores apontarem para o mesmo índice ou a função hashing coincidir duas chaves diferentes para o mesmo índice, como ocorreu no exemplo anterior, com as chaves a e d.
Portanto, colisões são normais, mas a função hashing pode ser acompanhada de diversas estratégias ou outras funções para evitar ao máximo o número de sua ocorrência.
Por melhor que seja o projeto da tabela hash, ela sempre terá colisões, assim, deve-se implementar também o mecanismo de tratamento delas, que dependem diretamente da finalidade para a qual essa tabela é utilizada.
Introdução a Redes Neurais
Redes Neurais Artificiais são técnicas computacionais que apresentam um modelo matemático inspirado na estrutura neural de organismos inteligentes e que adquirem conhecimento através da experiência. Uma grande rede neural artificial pode ter centenas ou milhares de unidades de processamento; já o cérebro de um mamífero pode ter muitos bilhões de neurônios.
O sistema nervoso é formado por um conjunto extremamente complexo de células, os neurônios. Eles têm um papel essencial na determinação do funcionamento e comportamento do corpo humano e do raciocínio. Os neurônios são formados pelos dendritos, que são um conjunto de terminais de entrada, pelo corpo central, e pelos axônios que são longos terminais de saída.
Algumas perguntas...
· O que é aprender?
· Incrementar o conhecimento
· Adaptar-se melhor às novas situações do ambiente
· ...
· Como aprender?
· Observando - Memorizando
· Generalizando
· Especializando
Redes Neurais Artificiais – RNAs
· Técnica de aprendizado que tem como modelo o cérebro;
· Um modo de abordar a solução de problemas da área de IA.
· RNAs - Redes Neurais Artificiais
· ANN - Artificial Neural Networks
Inspiração Biológica
· O cérebro de um mamífero pode ter muitos bilhões de neurônios.
· Uma grande rede neural artificial pode ter centenas ou milhares de unidades de processamento.
· O sistema nervoso é formado por um conjunto extremamente complexo de células: os neurônios.
· Eles têm um papel essencial na determinação do funcionamento e comportamento do corpo humano e do raciocínio.
· Axônio: responsável pela transmissão de sinais a partir do corpo celular. Em geral são compridos e apresentam poucas ramificações
· Dendritos: conduzem sinais para a célula; têm muitas ramificações (zonas receptivas)
· Sinapse: local de contato entre neurônios, onde ocorre a transmissão de impulsos nervosos de uma célula para outra
Aula 6- Redes Neurais Artificiais Dia 09/11/2020 semana 4 dia 5
Introdução
Redes Neurais Artificiais são técnicas computacionais que apresentam um modelo matemático inspirado na estrutura neural de organismos inteligentes e que adquirem conhecimento através da experiência. Uma grande rede neural artificial pode ter centenas ou milhares de unidades de processamento; já o cérebro de um mamífero pode ter muitos bilhões de neurônios.
O sistema nervoso é formado por um conjunto extremamente complexo de células, os neurônios. Eles têm um papel essencial na determinação do funcionamento e comportamento do corpo humano e do raciocínio. Os neurônios são formados pelos dendritos, que são um conjunto de terminais de entrada, pelo corpo central, e pelos axônios que são longos terminais de saída.
Os neurônios se comunicam através de sinapses. Sinapse é a região onde dois neurônios entram em contato e através da qual os impulsos nervosos são transmitidos entre eles. Os impulsos recebidos por um neurônio A, em um determinado momento, são processados, e atingindo um dado limiar de ação, o neurônioA dispara, produzindo uma substância neurotransmissora que flui do corpo celular para o axônio, que pode estar conectado a um dendrito de um outro neurônio B. O neurotransmissor pode diminuir ou aumentar a polaridade da membrana pós-sináptica, inibindo ou excitando a geração dos pulsos no neurônio B. Este processo depende de vários fatores, como a geometria da sinapse e o tipo de neurotransmissor.
Em média, cada neurônio forma entre mil e dez mil sinapses. O cérebro humano possui cerca de 10 E11 neurônios, e o número de sinapses é de mais de 10 E14, possibilitando a formação de redes muito complexa.
Componentes da RNA (REVIEW.
· Pesos associados as conexões;
· Pesos armazenam o conhecimento representado;
· Pesos ponderam a entrada recebida por cada neurônio.
Propriedades Neurobiológicas.
· O conhecimento é adquirido pela rede, a partir de seu ambiente, através de um processo de aprendizagem;
· Forças de conexões entre neurônios, conhecidas como pesos sinápticos, são utilizadas para armazenar o conhecimento adquirido.
· Os pesos sinápticos são alterados através de processos algorítmicos, para que possam representar o conhecimento adquirido.
· Estas alterações caracterizam o processo de aprendizagem de uma rede neural.
· Devido à similaridade com a estrutura do cérebro ...
· o que as tornam satisfatoriamente aplicáveis a problemas não adequados à computação tradicional
· ...exibem características similares ao do comportamento humano, tais como:
· Procura Paralela e Endereçamento pelo Conteúdo:
· O cérebro não possui endereço de memória e não procura a informação sequencialmente.
· O conhecimento fica distribuído pelos neurônios artificiais da rede.
· Robustez e Degradação Gradual:
· A perda de elementos de processamento não causa o mal funcionamento da rede neural.
· Generalização:
· Abstração:
· Adaptabilidade:
· Informação Contextual:
· Uniformidade:
· Resumo ...
O Neurônio Artificial
· Basicamente, todos os tipos de redes neurais apresentam a mesma unidade de processamento:
· um neurônio artificial, que simula o comportamento do neurônio biológico!!!
· ... e também denominado:
· Célula ou nó
· Elemento Processador
· Unidade de Processamento
Composição do Neurônio Artificial
O neurônio artificial possui várias entradas, que correspondem às conexões sinápticas com outras unidades similares a ele, e uma saída, cujo valor depende diretamente da somatória ponderada de todas as saídas dos outros neurônios a esse conectado.
Neste cálculo de integração dos estímulos das várias entradas, a ponderação é dada pelos pesos que cada conexão possui.
Neurônio artificial do tipo linear (Adaptive Linear Element - Adaline).
Saída do Neurônio Linear (Adaline)
(
Saída

=>
Soma =
)
Pesos e Estímulos
As constantes de ponderação (Pesos) wi representam as conexões sinápticas biológicas que intermediam a interação entre neurônios vizinhos;
xi é o estímulo proveniente do neurônio vizinho
o resultado Soma representa o estímulo global (com as devidas ponderações relativas) recebido pelo neurônio de todos os seus vizinhos.
(
Soma =
)
(
∑
Função de Soma
Saída
Entradas
x0
x1
x2
w0
w1
w2
Pesos (ajustáveis)
)
Elementos Básicos de um Neurônio Artificial
O modelo do neurônio artificial possui os seguintes componentes principais : Um conjunto de sinapses ou conexões de entrada, sendo cada entrada ponderada por um peso sináptico. Uma junção de soma, responsável pela combinação aditiva das entradas ponderadas pelos pesos sinápticos.
Conexões e Pesos = Memória local
Em analogia às sinapses de um modelo conexionista biológico;
Representando a força de ligação entre as unidades de processamento;
Conexões com pesos positivos, chamadas excitatórias, indicam o reforço na ativação do neurônio;
Modelo Neural Não Linear
Uma pequena alteração no modelo neural é necessária para a viabilizar as funcionalidades não lineares, através da introdução de uma função de transferência.
No modelo não linear “a ativação do neurônio é obtida através da aplicação da função de ativação, que ativa ou não a saída, dependendo do valor da soma ponderada das entradas”
Aula 7- Tipos de Redes Neurais Artificiais
Introdução
A seguir aprenderemos a identificar diferentes tipos de Redes Neurais Artificiais, suas aplicações e suas limitações, estas são:
· Portas de Limiar
· Perceptron
· Noções de Perceptron multicamadas (MLP)
· Configuração das RNAs
Portas de Limiar
Características:
· Podem ser lineares, quadráticas e polinomiais
· Tem como função a de comparar a soma ponderada das entradas com um valor de limiar (threshold) ... e caso a soma exceda o limiar, a saída é ativada!
Portas de Limiar
· Entradas restritas a variáveis booleanas x ϵ {0 , 1}n
· Utilizada para problemas linearmente separáveis
Portas de Limiar Quadrática
· Utilizada para problemas de maior complexidade. Definida por:
· Neste caso, se tivermos duas variáveis de entrada, a condição de disparo do neurônio é definida por:
· x12ω11 + x22ω22 + x1x2ω12 + x2x1ω21 + x1ω1 + x2ω2 = θ
Portas de Limiar Quadrática
· Exemplo: solução encontrada para a porta de duas entradas: ω1=1, ω2=1, ω11=5, ω22=5, ω12=ω21=1 e θ=3
· Logo, a superfície obtida é dada por: f(x1,x2) = 5x12 + 5x22 + x1x2 + x2x1 + x1 + x2
Portas de Limiar Quadrática.
· Os pontos com f(x1,x2) ≥ 3 resultarão em y=1 e os demais em y=0. Logo a superfície de resposta resultante é a seguinte:
· Se fizermos f(x1,x2) = 3 temos a equação da elipse acima apresentada
Tipos de Redes Neurais e Funcionamento
· Perceptron;
· Perceptron Multicamadas (MLP) com retropropagação;
· RBF;
· LVQ;
· Hamming Net e Maxnet;
· SOM (Kohonen), etc.
Perceptron
· Modelo proposto por Rosenblatt (1958);
· Tem como unidade básica o neurônios MCP;
· Primeiro modelo de aprendizagem supervisionada, sendo feedfoward;
· Usada para classificação de padrões linearmente separáveis: foi provado que neste caso a solução sempre converge;
· Possui a camada de entrada, uma intermediária e a de saída;
· Somente a camada de saída possui propriedades adaptativas: as demais possuem pesos fixos definidos antes do período de treinamento.
· Foi duramente criticada por Minsky e Papert (1969)
Perceptron – Algoritmo de Aprendizado
· Os pesos sinápticos são obtidos pelo algoritmo de treinamento do perceptron de forma iterativa;
· Um processo de aprendizagem consiste em determinar um Δω a ser aplicado no vetor ω de tal forma que o seu valor atualizado: ω(t+1)= ω(t)+Δω esteja mais próximo da solução desejada!
· Mais uma vez, o valor atualizado do vetor de pesos é dado por ω(t+1) = ω(t)+ηex(t) onde η é a taxa de aprendizado.
Perceptron – Algoritmo de Aprendizado
· Algoritmo:
1. Inicialize η;
2. Inicializa o vetor de pesos ω com valores aleatórios;
3. Aplique a regra de atualização de pesos ω(t+1)= ω(t)+ηex(t) para todos os pares do conjunto de treinamento;
4. Repita o passo anterior até que e = 0 para todos os elementos do conjunto de treinamento.
Perceptron – Superfície de Separação
· O perceptron divide duas regiões por meio de um superfície de separação linear;
Perceptron
· Se o problema de aprendizado é linearmente separável, a regra de aprendizagem do Perceptron encontra uma solução (hiperplano) que separa as classes. Se não for, é necessária outra abordagem.
MLP com Backpropagation
· MLP (Multilayer Perceptron) – perceptron de múltiplas camadas
· Estas redes possuem uma camada de nós na camada de entrada;
· Uma ou mais camadas ocultas;
· Uma camada de saída.
Configuração das RNAs
· Existem inúmeras pesquisas no sentido de encontrar uma fórmula "mágica" que determine a configuração ideal de uma rede neural para um dado problema ...
... no entanto, até agora o que se tem são apenas sugestões que estão fundamentadas em experiências vividas por especialistas no assunto e no bom senso. Configuração das RNAs
· Maior problema: overfitting
Número de Camadas Ocultas
· A utilização de um grande número de camadas escondidas não é recomendado:
· Erro médio aumentacom o número de camadas;
· A única camada que tem uma noção precisa do erro cometido pela rede é a camada de saída: a penúltima recebe uma estimativa da estimativa;
· A maioria dos problema são resolvidos com única camada oculta ... e raríssimos precisam mais do que duas camadas ocultas;
Número de Neurônios na Camada Oculta
· definido empiricamente: muitos causam overfitting ... e poucos necessitam de grande número de épocas para modelagem;
· podem ser definidos a partir do número de neurônios de entrada e saída (média entre ambos?);
· uma regra é a de utilizar um número de sinapses aproximadamente 10 vezes menor do que o de amostras de treinamento .. Mas pode ocorrer underfitting
Configuração das RNAs
Taxa de Aprendizado (η)
· “aprendizado lento” X “dificuldade de convergência”;
· varia entre 0.1 e 1.0 (recomenda-se 0.4);
· pode ser adaptativa.
Momentum (α)
· semelhante a taxa de aprendizado (recomenda-se 0.3)
Critérios de Parada do Treinamento
· número de épocas: overfitting x underfitting (recomenda-se de 500 a 3000 épocas);
· erro médio quadrático máximo: não garante boa generalização;
· validação: o treinamento é interrompido a cada “x” ciclos e é realizada uma estimativa do erro sobre os dados de teste. O processo para quando o erro sobe.