Questão 9 A taxonomia de modelos em reinforcement learning pode ser dividida em algoritmos baseados em modelo (model-based) e livres de model (mode...

Question

Questão 9 A taxonomia de modelos em reinforcement learning pode ser dividida em algoritmos baseados em modelo (model-based) e livres de model (mode...

Questão 9

A taxonomia de modelos em reinforcement learning pode ser dividida em algoritmos baseados em modelo (model-based) e livres de model (model-free). Sobre mode-free, assinale a opção INCORRETA.

a) Assumem que o agente tem acesso ou pode aprender um modelo capaz de informar como o ambiente progride a partir do estado atual e da ação escolhida.

b) Estimam a função de valor/valor-ação ou a política ótima diretamente, sem assumar a existência de um modelo. Requerem mais interações com o ambiente.

c) As duas principais abordagens para representar e treinar agentes baseiam-se em otimização de políticas (policy optimization) e Q-Learning.

d) Metodos podem assumir abordagens on-policy ou off-policy.

Ed · Answer

A alternativa que está incorreta é a letra "a) Assumem que o agente tem acesso ou pode aprender um modelo capaz de informar como o ambiente progride a partir do estado atual e da ação escolhida."

Na verdade, essa descrição se refere aos algoritmos baseados em modelo (model-based), enquanto que os algoritmos model-free não assumem que o agente tem acesso ou pode aprender um modelo capaz de informar como o ambiente progride a partir do estado atual e da ação escolhida.

Questão 9 A taxonomia de modelos em reinforcement learning pode ser dividida em algoritmos baseados em modelo (model-based) e livres de model (mode...

Questão 9 A taxonomia de modelos em reinforcement learning pode ser dividida em algoritmos baseados em modelo (model-based) e livres de model (mode...

Questão 9

A taxonomia de modelos em reinforcement learning pode ser dividida em algoritmos baseados em modelo (model-based) e livres de model (model-free). Sobre mode-free, assinale a opção INCORRETA.

a) Assumem que o agente tem acesso ou pode aprender um modelo capaz de informar como o ambiente progride a partir do estado atual e da ação escolhida.

b) Estimam a função de valor/valor-ação ou a política ótima diretamente, sem assumar a existência de um modelo. Requerem mais interações com o ambiente.

c) As duas principais abordagens para representar e treinar agentes baseiam-se em otimização de políticas (policy optimization) e Q-Learning.

d) Metodos podem assumir abordagens on-policy ou off-policy.

Ciência de Dados

Outros

Respostas

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Responda

Mais conteúdos dessa disciplina

Perguntas dessa disciplina

Questão 9 A taxonomia de modelos em reinforcement learning pode ser dividida em algoritmos baseados em modelo (model-based) e livres de model (mode...

Questão 9 A taxonomia de modelos em reinforcement learning pode ser dividida em algoritmos baseados em modelo (model-based) e livres de model (mode...

A taxonomia de modelos em reinforcement learning pode ser dividida em algoritmos baseados em modelo (model-based) e livres de model (model-free). S...

Questão 1/10 - Reinforcement Learning “ Para que o agente seja capaz de agir inteligentemente em um ambiente desconhecido é necessário a obtenção ...

Conteúdos escolhidos para você

Assinale a afirmativa que indica o modelo de banco de dados mais recente

Aula 7 - Banco de dado - modelo lógico drawio

Projeto Integrador em ciência de dados - ATIVIDADE 1

Modelagem e arquitetura do DW