Buscar

Questão 9 A taxonomia de modelos em reinforcement learning pode ser dividida em algoritmos baseados em modelo (model-based) e livres de model (mode...

Questão 9 A taxonomia de modelos em reinforcement learning pode ser dividida em algoritmos baseados em modelo (model-based) e livres de model (mode...

Questão 9

A taxonomia de modelos em reinforcement learning pode ser dividida em algoritmos baseados em modelo (model-based) e livres de model (model-free). Sobre mode-free, assinale a opção INCORRETA.




a) Assumem que o agente tem acesso ou pode aprender um modelo capaz de informar como o ambiente progride a partir do estado atual e da ação escolhida.



b) Estimam a função de valor/valor-ação ou a política ótima diretamente, sem assumar a existência de um modelo. Requerem mais interações com o ambiente.



c) As duas principais abordagens para representar e treinar agentes baseiam-se em otimização de políticas (policy optimization) e Q-Learning.



d) Metodos podem assumir abordagens on-policy ou off-policy.


Respostas

User badge image

Ed Verified user icon

A alternativa que está incorreta é a letra "a) Assumem que o agente tem acesso ou pode aprender um modelo capaz de informar como o ambiente progride a partir do estado atual e da ação escolhida." Na verdade, essa descrição se refere aos algoritmos baseados em modelo (model-based), enquanto que os algoritmos model-free não assumem que o agente tem acesso ou pode aprender um modelo capaz de informar como o ambiente progride a partir do estado atual e da ação escolhida.

0
Dislike0

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Responda

SetasNegritoItálicoSublinhadoTachadoCitaçãoCódigoLista numeradaLista com marcadoresSubscritoSobrescritoDiminuir recuoAumentar recuoCor da fonteCor de fundoAlinhamentoLimparInserir linkImagemFórmula

Para escrever sua resposta aqui, entre ou crie uma conta

User badge image