Em machine learning, a categoria de aprendizagem por reforço identifica as tarefas em que um software interage com um ambiente dinâmico, como, por ...
Em machine learning, a categoria de aprendizagem por reforço identifica as tarefas em que um software interage com um ambiente dinâmico, como, por exemplo, veículos autônomos.
A afirmação está correta. Na aprendizagem por reforço, o software aprende a tomar decisões em um ambiente dinâmico através de tentativa e erro, recebendo recompensas ou punições por suas ações. Isso é muito utilizado em veículos autônomos, jogos e robótica.
0
0
Responda
Para escrever sua resposta aqui, entre ou crie uma conta