A alternativa correta é: "Agente, ambiente, estados, ações e recompensas." Os principais componentes de um sistema baseado em aprendizado por reforço são: - Agente: é o responsável por tomar as decisões e realizar as ações no ambiente. - Ambiente: é o espaço onde o agente atua e interage. - Estados: são as condições do ambiente que o agente percebe através dos sensores. - Ações: são as escolhas que o agente faz para interagir com o ambiente através dos atuadores. - Recompensas: são os sinais que o agente recebe do ambiente em resposta às suas ações.
Para escrever sua resposta aqui, entre ou crie uma conta
Compartilhar