Buscar

Há diferentes formas de se construir um modelo de aprendizado por reforço, entretanto, todos os modelos compartilham alguns componentes em comum. Q...

Há diferentes formas de se construir um modelo de aprendizado por reforço, entretanto, todos os modelos compartilham alguns componentes em comum. Quais são os principais componentes de um sistema baseado em aprendizado por reforço?

Rede neural, sistema de recompensa, sensores e atuadores.
Agente, estados, sensores, atuadores e recompensas.
Agente, ambiente, estados, ações e recompensas.
Rede neural, algoritmo de treinamento e sistema de recompensa.
Agente, ambiente, sensores e atuadores.

Essa pergunta também está no material:

AP Sem6 Atv10
4 pág.

Aprendizado Universidade Virtual do Estado de São PauloUniversidade Virtual do Estado de São Paulo

💡 1 Resposta

User badge image

Ed Verified user icon

A alternativa correta é: "Agente, ambiente, estados, ações e recompensas." Os principais componentes de um sistema baseado em aprendizado por reforço são: - Agente: é o responsável por tomar as decisões e realizar as ações no ambiente. - Ambiente: é o espaço onde o agente atua e interage. - Estados: são as condições do ambiente que o agente percebe através dos sensores. - Ações: são as escolhas que o agente faz para interagir com o ambiente através dos atuadores. - Recompensas: são os sinais que o agente recebe do ambiente em resposta às suas ações.

0
Dislike0

✏️ Responder

SetasNegritoItálicoSublinhadoTachadoCitaçãoCódigoLista numeradaLista com marcadoresSubscritoSobrescritoDiminuir recuoAumentar recuoCor da fonteCor de fundoAlinhamentoLimparInserir linkImagemFórmula

Para escrever sua resposta aqui, entre ou crie uma conta

User badge image

Outros materiais