Logo Passei Direto
Buscar
Disciplina(s): Reinforcement Learning 0:10:21 t Questão 8/10 - Reinforcement Learning "Redes neurais artificiais são uma boa aproximação para cálculos mais genéricos de algoritmos de aprendizagem por reforço As primeiras tentativas neste sentido, entretanto, conservaram a 'maldição da dimensionalidade" pro neurais em RL, finalmente suavizaram a maldição." Aula 6 Tema 1. Considerando o texto acima e nossos estudos de DRL podemos afirmar: A 1 Redes neurais são treinadas com base em peguenas amostras o que torna os padrões estatisticamente instáveis. Os dados disponíveis em RL são por sua vez volumosos e estáveis, além disso, os modelos r B 10) A memória de uma rede neural permite a generalização da aprendizagem em ações futuras, quando carregamos a memória da rede com padrões, presume-se que se manterá a memória intacta durante a op Neural Fitted Q Interaction (NFQ) é um algoritmo que busca reinplantar a memória do conhecimento futuro. A implementação, dita unusual memory algorithm, parte da ideia de descartar as transições de esta DQN utiliza o princípio proveniente do NFQ, que resolveu O problema de perda de memória, VGP, memorizando as transições de estado anteriores para reimplantanção. E D Todas as afirmações anteriores estão corretas 1 2 3 4 5 6 7 8 (?) (?) B A E A C (?) 9 10 (?) (?) nsolarado Pesquisar C LG
User badge image
Melissa Cristina

há 9 meses

Respostas

User badge image

Ed Verified user icon

há 9 meses

Vamos analisar as alternativas apresentadas sobre redes neurais e aprendizado por reforço (Reinforcement Learning): 1. A: Redes neurais são treinadas com base em pequenas amostras, o que torna os padrões estatisticamente instáveis. Os dados disponíveis em RL são, por sua vez, volumosos e estáveis. - Essa afirmação é um pouco confusa, pois em RL, os dados podem ser volumosos, mas a instabilidade pode ocorrer dependendo da abordagem de treinamento. 2. B: A memória de uma rede neural permite a generalização da aprendizagem em ações futuras. Quando carregamos a memória da rede com padrões, presume-se que se manterá a memória intacta durante a operação. - Essa afirmação é verdadeira, pois redes neurais podem generalizar a partir de padrões aprendidos. 3. C: Neural Fitted Q Interaction (NFQ) é um algoritmo que busca reimplantar a memória do conhecimento futuro. A implementação, dita unusual memory algorithm, parte da ideia de descartar as transições de estado. - Essa afirmação parece correta, pois o NFQ é uma abordagem que lida com a memória em RL. 4. D: Todas as afirmações anteriores estão corretas. - Essa opção sugere que todas as afirmações anteriores são verdadeiras. Analisando as opções, a alternativa que abrange a veracidade das afirmações apresentadas é a D: Todas as afirmações anteriores estão corretas.

Essa resposta te ajudou?

0
Dislike0
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar essa resposta. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Mais conteúdos dessa disciplina