Respostas
Vamos analisar cada alternativa: A) Redes neurais são treinadas com base em pequenas amostras o que torna os padrões estatisticamente instáveis. Os dados disponíveis em RL são por sua vez volumosos e estáveis, além disso, os modelos não apresentam grande sensibilidade a variações de Q. - Esta afirmação está incorreta, pois as redes neurais são capazes de lidar com grandes conjuntos de dados e não são necessariamente instáveis estatisticamente. B) A memória de uma rede neural permite a generalização da aprendizagem em ações futuras, quando carregamos a memória da rede com padrões, presume-se que se manterá a memória intacta durante a operação. Esta presunção é especialmente verdadeira para RL. - Esta afirmação está incorreta, pois a preservação da memória de uma rede neural não é garantida e pode variar dependendo do contexto e do algoritmo de aprendizagem. C) Neural Fitted Q Interaction (NFQ) é um algoritmo que busca reinplantar a memória do conhecimento futuro. A implementação, dita unusual memory algorithm, parte da ideia de descartar as transições de estado anteriores a cada update. - Esta afirmação está incorreta, pois a descrição do algoritmo NFQ não condiz com a realidade. D) DQN utiliza o princípio proveniente do NFQ, que resolveu o problema de perda de memória, VGP, memorizando as transições de estado anteriores para reimplantação. - Esta afirmação está incorreta, pois a descrição do funcionamento do DQN em relação ao NFQ não está correta. E) Todas as afirmações anteriores estão corretas. - Como analisamos, nenhuma das afirmações anteriores está correta. Portanto, a alternativa correta é a letra E.
Responda
Para escrever sua resposta aqui, entre ou crie uma conta