Buscar

“Redes neurais artificiais são uma boa aproximação para cálculos mais genéricos de algoritmos de aprendizagem por reforço. As primeiras tentativas ...

“Redes neurais artificiais são uma boa aproximação para cálculos mais genéricos de algoritmos de aprendizagem por reforço. As primeiras tentativas neste sentido, entretanto, conservaram a ‘maldição da dimensionalidade” proveniente das soluções simbólicas. A evolução das técnicas conexionistas profundas, que ocorreram concomitantemente às tentativas de aplicação de redes neurais em RL, finalmente suavizaram a maldição.” Aula 6 - Tema 1. Considerando o texto acima e nossos estudos de DRL podemos afirmar: A Redes neurais são treinadas com base em pequenas amostras o que torna os padrões estatisticamente instáveis. Os dados disponíveis em RL são por sua vez volumosos e estáveis, além disso, os modelos não apresentam grande sensibilidade a variações de Q. B A memória de uma rede neural permite a generalização da aprendizagem em ações futuras, quando carregamos a memória da rede com padrões, presume-se que se manterá a memória intacta durante a operação. Esta presunção é especialmente verdadeira para RL. C Neural Fitted Q Interaction (NFQ) é um algoritmo que busca reinplantar a memória do conhecimento futuro. A implementação, dita unusual memory algorithm, parte da ideia de descartar as transições de estado anteriores a cada update. D DQN utiliza o princípio proveniente do NFQ, que resolveu o problema de perda de memória, VGP, memorizando as transições de estado anteriores para reimplantanção. E Todas as afirmações anteriores estão corretas.

Respostas

User badge image

Ed Verified user icon

Vamos analisar cada alternativa: A) Redes neurais são treinadas com base em pequenas amostras o que torna os padrões estatisticamente instáveis. Os dados disponíveis em RL são por sua vez volumosos e estáveis, além disso, os modelos não apresentam grande sensibilidade a variações de Q. - Esta afirmação está incorreta, pois as redes neurais são capazes de lidar com grandes conjuntos de dados e não são necessariamente instáveis estatisticamente. B) A memória de uma rede neural permite a generalização da aprendizagem em ações futuras, quando carregamos a memória da rede com padrões, presume-se que se manterá a memória intacta durante a operação. Esta presunção é especialmente verdadeira para RL. - Esta afirmação está incorreta, pois a preservação da memória de uma rede neural não é garantida e pode variar dependendo do contexto e do algoritmo de aprendizagem. C) Neural Fitted Q Interaction (NFQ) é um algoritmo que busca reinplantar a memória do conhecimento futuro. A implementação, dita unusual memory algorithm, parte da ideia de descartar as transições de estado anteriores a cada update. - Esta afirmação está incorreta, pois a descrição do algoritmo NFQ não condiz com a realidade. D) DQN utiliza o princípio proveniente do NFQ, que resolveu o problema de perda de memória, VGP, memorizando as transições de estado anteriores para reimplantação. - Esta afirmação está incorreta, pois a descrição do funcionamento do DQN em relação ao NFQ não está correta. E) Todas as afirmações anteriores estão corretas. - Como analisamos, nenhuma das afirmações anteriores está correta. Portanto, a alternativa correta é a letra E.

0
Dislike0

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Responda

SetasNegritoItálicoSublinhadoTachadoCitaçãoCódigoLista numeradaLista com marcadoresSubscritoSobrescritoDiminuir recuoAumentar recuoCor da fonteCor de fundoAlinhamentoLimparInserir linkImagemFórmula

Para escrever sua resposta aqui, entre ou crie uma conta

User badge image

Mais conteúdos dessa disciplina