A alternativa correta é a letra A: "Envolvimento de feedback na forma de recompensas ou penalidades". O aprendizado por reforço é um tipo de aprendizado de máquina que envolve um agente que toma ações em um ambiente e recebe feedback na forma de recompensas ou penalidades, com o objetivo de maximizar a recompensa ao longo do tempo. Isso difere dos outros tipos de aprendizado de máquina, como o supervisionado e o não supervisionado, que não envolvem feedback na forma de recompensas ou penalidades.
Para escrever sua resposta aqui, entre ou crie uma conta
Compartilhar