Essa pergunta também está no material:
Respostas
12 pessoas visualizaram e tiraram suas dúvidas aqui
A alternativa correta é a letra a. O aprendizado por reforço envolve feedback na forma de recompensas ou penalidades, que são utilizados para ajustar o comportamento do agente de aprendizado. As outras alternativas estão incorretas: b. O aprendizado por reforço utiliza algoritmos, c. O aprendizado por reforço recebe feedback na forma de recompensas ou penalidades, d. O aprendizado por reforço tem autonomia em tomar decisões e é adequado para navegação robótica, e e. O aprendizado por reforço envolve tentativa e erro.
Responda
Para escrever sua resposta aqui, entre ou crie uma conta