A alternativa correta é a letra "b". O aprendizado por reforço é um tipo de aprendizado de máquina que envolve feedback na forma de recompensas ou penalidades, ou seja, o algoritmo aprende a partir das consequências de suas ações. Já os outros tipos de aprendizado de máquina podem não envolver esse tipo de feedback ou podem utilizá-lo de forma diferente.
Para escrever sua resposta aqui, entre ou crie uma conta
Compartilhar