Buscar

No aprendizado por reforço, é possível acompanhar o exemplo do problema proposto, verificando um feedback positivo ou negativo, acordando com a sol...

No aprendizado por reforço, é possível acompanhar o exemplo do problema proposto, verificando um feedback positivo ou negativo, acordando com a solução que o algoritmo propõe em uma situação em que a máquina procura aprender a melhor ação a ser tomada, dependendo das situações nas quais a ação será executada.

💡 1 Resposta

User badge image

Ed Verified user icon

No aprendizado por reforço, é possível acompanhar o exemplo do problema proposto, verificando um feedback positivo ou negativo, acordando com a solução que o algoritmo propõe em uma situação em que a máquina procura aprender a melhor ação a ser tomada, dependendo das situações nas quais a ação será executada. Isso é feito através de um processo de tentativa e erro, onde o algoritmo recebe recompensas ou penalidades com base em suas ações, permitindo assim que ele aprenda a melhor estratégia a ser adotada em determinadas situações.

0
Dislike0

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

✏️ Responder

SetasNegritoItálicoSublinhadoTachadoCitaçãoCódigoLista numeradaLista com marcadoresSubscritoSobrescritoDiminuir recuoAumentar recuoCor da fonteCor de fundoAlinhamentoLimparInserir linkImagemFórmula

Para escrever sua resposta aqui, entre ou crie uma conta

User badge image

Outros materiais