Baixe o app para aproveitar ainda mais
Prévia do material em texto
Páginas 43-44 1. Explique o funcionamento do neurônio artificial. R- Os neurônios artificiais são não lineares, eles fornecem saídas tipicamente contínuas, podem realizar funções como coleta de sinais existentes em suas entradas , agregá-los de acordo com sua função operacional e produzir uma resposta. 2. Descreva os objetivos principais das funções de ativação. R- Limitar a saída do neurônio dentro de um intervalo de valores razoáveis a serem assumidos pela sua própria imagem funcional 3. Faça uma analogia entre os elementos constituintes do neurônio artificial e do neurônio biológico. R- O tempo de processamento do neurônio artificial é muito superior ao neurônio biológico. Mas, o processamento cerebral é infinita s vezes mais rápido que uma rede neural artificial na maioria dos casos, pois os neurônios da rede neural biológica trabalham com alto grau de paralelismo entre si, a o passo que para os neurônios artificiais este nível de paralelismo é bem limitado, poi s a maioria dos computadores é constituída de máquinas tipicamente sequenciais 4. Discorra sobre a importância envolvendo o limiar de ativação. R - É importante pois ele especifica qual a etapa apropriada para que o resultado produzido pelo combinador linear gere um valor de disparo em direção a saída do neurônio 5. Em relação às características das redes neurais artificiais, explique em que consiste a adaptação por experiência e a capacidade de generalização. R- Adaptação por experiência: Parâmetros internos da rede, tipicamente seus pesos sinápticos são ajustados a partir da apresentação sucessiva de amostras Capacidade de generalização: Após o processo de treinamento,a rede é capaz de generalizar conhecimento adquirido, possibilitando estimação de soluções que eram até então desconhecidas 6. Discorra sobre as principais características matemáticas que são verificadas nas funções de ativação logística e tangente hiperbólica. R- Logística: assume sempre valores reais entre 0 e 1 g(u)=1/1+e^beta*w Tangente hiperbólica: Sempre assume valores reais entre -1 e 1 g(u)=1-e^beta*w/1+e^beta*w ambas funções possui um beta que quanto maior for o seu valor mais próximo de g(u) sendo que beta tende ao infinito 7. Obtenha as expressões analíticas das derivadas de primeira ordem da função de ativação logística e tangente hiperbólica. R- 8. Para um problema específico, há a possibilidade de utilizar como função de ativação tanto a função logística como a tangente hiperbólica. Em termos de implementação em hardware, discorra quais seriam os eventuais aspectos relevantes para a seleção de uma destas. R- Um dos aspectos relevantes para a escolha da função de ativação seria o custo que irá influenciar na escolha da função já que a logística é a com o menor custo computacional 9. Considerando que as operações individuais nos neurônios artificiais são realizadas mais rapidamente em comparação com os neurônios biológicos, explique por que diversas atividades executadas pelo cérebro humano produzem resultados mais rapidamente que um computador. R- Devido a grande quantidade de neurônios biológicos que trabalham em conjunto além de possuírem uma alta capacidade de processamento e a grande quantidade de dendritos(responsável por captar e encaminhar estímulos) que permitem um grande quantidade de caminhos para que a informação possa ser transmitida 10. Quais os principais tipos de problemas em que as redes neurais artificiais são aplicadas. R- Aproximador universal de funções, controle de processos, Reconhecimento/classificação de padrões, agrupamento de dados,sistemas de previsão,otimização de sistemas e memórias associativas Páginas 54-55 1. Discorra sobre as vantagens e desvantagens envolvidas na aprendizagem usando lote de padrões e aprendizagem usando padrão-por-padrão. R- Lote de padrões: -Vantagens: considera os desvios observados nas amostras de treinamento. -Desvantagens: Precisa de pelo uma época para realizar o ajuste nos pesos e as amostras devem estar disponíveis enquanto estiver em processo de aprendizagem. Padrão-por-padrão: -Vantagens: Não precisa das amostras estejam disponíveis em todo o processo de aprendizagem assim efetuando um ajuste após a apresentação de cada amostra. -Desvantagens: Demora para apresentar um número significativo de amostra. 2. Considere uma aplicação que possui quatro entradas e duas saídas. O projetista menciona que neste caso a rede feedforward de camadas múltiplas a ser implementada deve conter necessariamente quatro neurônios na primeira camada escondida. Discorra se tal informação é pertinente. R- Nesse caso não é pertinente, pois a quantidade de neurônios não depende da quantidade de entradas da aplicação. 3. Em relação ao exercício anterior, cite alguns fatores que influenciam na determinação do número de camadas escondidas de uma rede feedforward de camadas múltiplas. R- Vai depender das necessidades do problema e dos recursos da maquina. 4. Quais as eventuais diferenças estruturais observadas nas redes com arquitetura recorrente em relação aquelas com arquitetura feedforward. R- Recorrentes: as saídas dos neurônios são realimentadas com sinais de entrada para outro neurônio. Feedforward: Possui uma entrada de camada e saída de neurônios 5. Mencione em que tipos de aplicações é essencial a utilização de redes neurais recorrentes. R- Aplicações com e sistema de previsão, otimização de sistemas e controle de processos. 6. Elabore um diagrama de blocos que ilustre o funcionamento do treinamento supervisionado. R- 7. Discorra sobre o conceito de método de treinamento e algoritmo de aprendizado, explicitando-se ainda o conceito de época de treinamento. R - Treinamento: Consiste da aplicação de passos ordenados que são necessários para sintonização dos pesos sinápticos e limiares de seus neurônios para generalizar soluções a serem produzidas pelas saídas,cuja as respostas são representativas do sistema físico em que estão mapeadas Algoritmo de aprendizagem: É o conjunto de passos ordenados do treinamento para extrair características discriminantes do sistema a ser mapeado por meio de amostras que foram retiradas de seu contexto 8. Quais as principais diferenças existentes entre os métodos baseados em treinamento supervisionado e não-supervisionado. R- Supervisionado: possui uma saída desejada Não supervisionada: separa as amostras em classes 9. Quais as principais diferenças existentes entre os métodos baseados em treinamento supervisionado e treinamento com reforço. R- Reforço: usa um sistema de recompensa e punição para pontuar Supervisionado: possui uma saída esperada 10. Considerando uma aplicação específica explicite então como poderia ser o critério de desempenho utilizado para o ajuste dos pesos e limiares da rede que empregará método de treinamento com reforço. R- Deve ser implementado o sistema de punição e recompensa para a pontuação e ajuste do sistema. Página 69 6. Dois projetistas de instituições diferentes estão aplicando uma rede Perceptron para mapear o mesmo problema de classificação de padrões. Discorra se é correto afirmar que ambas as redes convergirão com o mesmo número de épocas. R- Não, pois se eles usarem pesos iniciais diferentes as épocas não irão convergir 7. Em relação ao exercício anterior, considere que ambas as redes ja estão devidamente treinadas. Para um conjunto contendo 10 novas amostras que devem ser identificadas, explique se os resultados produzidos por ambas serão os mesmos. R- O resultado vai variar sempre que for executado. 8. Seja um problema de classificação de padrões que seja linearmente separável composto de 50 amostras. Em determinada época de treinamento observou-se que somente para uma dessas amostras a rede não estava produzindo a resposta desejada. Discorra se é então necessário apresentar novamente todas as 50 amostras na próxima época de treinamento. R- Devem estar presentes pois quando a saída não coincidem com a desejada ele incrementa os pesos sinápticos e o limiares em todas as amostras até que a saída seja igual a desejada pelaamostra 10. Explique de forma detalhada quais seriam as eventuais limitações do Perceptron se considerarmos seu limiar de ativação nulo. R- Teria um problemas na reta que separa as classe, pois a reta não irá se ajustar corretamente alterando o resultado final Páginas 86-87 7. Considerando-se os procedimentos de derivação do processo de aprendizagem do Adaline, explique se seria possível utilizar na expressão (4.5) a saída do neurônio {y} ao invés do valor do combinador linear {u}. R- não seria possível, 8. Discorra se a afirmação seguinte é verdadeira ou falsa. Independentemente dos valores iniciais assumidos para o vetor de pesos do Adaline, uma mesma configuração final para w’ será sempre obtida após a sua convergência. R- Verdadeiro 9. Explique, considerando a questão anterior, se o número de épocas de treinamento será também igual independente do seu vetor de pesos iniciais. R- Não,pois vai variar do valor assumido da taxa de aprendizagem e da disposição das amostras de treinamento 10. Em relação ao critério de parada para o processo de convergência do adaline, fornecido em (4.17), discorra se há realmente a necessidade de aplicação do operador módulo sobre a diferença do erro quadrático médio entre duas épocas sucessivas. R- Sim,pois a variação é a que vai fornecer um indicativo do melhor resultado em que o processo de treinamento está sendo executado
Compartilhar