Buscar

Sobre aprendizagem por reforço ativa, julgue os itens a seguir escolhendo a única alternativa correta. Escolha uma opção: a. Na aprendizagem por r...

Sobre aprendizagem por reforço ativa, julgue os itens a seguir escolhendo a única alternativa correta. Escolha uma opção: a. Na aprendizagem por reforço ativa, um agente não deve assumir um compromisso entre exploração e estimativa de utilidade direta. b. Na aprendizagem por reforço ativa, um agente deve assumir um compromisso entre exploração e estimativa de utilidade direta. Incorreto c. O agente precisa aprender um modelo completo com probabilidades de resultados para todas as ações, em vez de aprender apenas o modelo para a política fixa. d. O agente não precisa aprender um modelo completo com probabilidades de resultados para todas as ações, em vez de aprender apenas o modelo para a política fixa. e. Um agente deve escolher quais ações deve executar, analogamente a aprendizagem por reforço passiva.

💡 1 Resposta

User badge image

Ed Verified user icon

A alternativa correta é a letra b. Na aprendizagem por reforço ativa, um agente deve assumir um compromisso entre exploração e estimativa de utilidade direta. Isso significa que o agente deve escolher ações que maximizem a recompensa esperada, mas também deve explorar novas ações para aprender mais sobre o ambiente e melhorar sua política de decisão.

0
Dislike0

✏️ Responder

SetasNegritoItálicoSublinhadoTachadoCitaçãoCódigoLista numeradaLista com marcadoresSubscritoSobrescritoDiminuir recuoAumentar recuoCor da fonteCor de fundoAlinhamentoLimparInserir linkImagemFórmula

Para escrever sua resposta aqui, entre ou crie uma conta

User badge image

Outros materiais