Ed
há 10 meses
O aprendizado por reforço é uma técnica de aprendizado de máquina onde um agente aprende a tomar decisões através de interações com um ambiente, recebendo recompensas ou punições com base nas ações que realiza. Essa abordagem é mais comumente utilizada em contextos onde a tomada de decisão sequencial é necessária, como em jogos e controle de robôs. Analisando as opções: a) Classificação de e-mails como spam ou não spam - Isso é mais relacionado a aprendizado supervisionado, não ao aprendizado por reforço. b) Identificação de padrões em dados tabulares - Também se encaixa em aprendizado supervisionado ou não supervisionado, não em aprendizado por reforço. c) Controle de robôs e jogos interativos - Este é um contexto clássico para o aprendizado por reforço, onde o agente aprende a otimizar suas ações para maximizar recompensas. d) Criação de gráficos de barras - Não se relaciona com aprendizado por reforço. e) Construção de websites dinâmicos - Também não é um contexto para aprendizado por reforço. Portanto, a alternativa correta é: c) Controle de robôs e jogos interativos.
Já tem uma conta?
Ao continuar, você aceita os Termos de Uso e Política de Privacidade
Mais perguntas desse material