Buscar

Em aprendizado por reforço, o agente aprende a partir da sua iteração com o ambiente. Essa iteração pode ser realizada de duas formas principais: d...

Em aprendizado por reforço, o agente aprende a partir da sua iteração com o ambiente. Essa iteração pode ser realizada de duas formas principais: determinística e estocástica. Quais das afirmações abaixo estão corretas em relação a essas duas formas de iteração?

Apenas as afirmativas I e II estão corretas.
Todas as afirmativas estão corretas.
Apenas as afirmativas I e III estão corretas.
Apenas as afirmativas II e III estão corretas.
Nenhuma afirmativa está correta

Essa pergunta também está no material:

AP Sem6 Atv10
4 pág.

Aprendizado Universidade Virtual do Estado de São PauloUniversidade Virtual do Estado de São Paulo

Respostas

User badge image

Ed Verified user icon

A alternativa correta é: "Apenas as afirmativas I e III estão corretas". Explicação: - A afirmativa I é correta, pois a iteração determinística é quando o agente sabe exatamente qual ação tomar em cada estado do ambiente. - A afirmativa III também é correta, pois a iteração estocástica é quando o agente não sabe exatamente qual ação tomar em cada estado do ambiente, mas escolhe uma ação aleatoriamente com base em uma distribuição de probabilidade. Já a afirmativa II está incorreta, pois não há uma terceira forma de iteração mencionada na pergunta.

0
Dislike0

Responda

SetasNegritoItálicoSublinhadoTachadoCitaçãoCódigoLista numeradaLista com marcadoresSubscritoSobrescritoDiminuir recuoAumentar recuoCor da fonteCor de fundoAlinhamentoLimparInserir linkImagemFórmula

Para escrever sua resposta aqui, entre ou crie uma conta

User badge image

Continue navegando