Ed
há 3 semanas
O aprendizado por reforço é uma abordagem em que um agente aprende a tomar decisões através de tentativas e erros, recebendo recompensas ou punições com base nas ações que realiza. Isso significa que o agente ajusta seu comportamento com base nos resultados das suas ações. Analisando as alternativas: a) Aprendizado sem supervisão - Isso se refere a um tipo de aprendizado onde não há rótulos ou feedback explícito, o que não caracteriza o aprendizado por reforço. b) Aprendizado por tentativas e erros - Esta é a definição correta do aprendizado por reforço, onde o agente aprende através da experiência. c) Aprendizado direto - Essa opção não descreve adequadamente o processo de aprendizado por reforço. Portanto, a alternativa correta é: b) Aprendizado por tentativas e erros.
Mais perguntas desse material