Buscar

O aprendizado por reforço é um método de aprendizado de máquina voltado para tratar como os agentes de software devem realizar ações em um ambiente...

O aprendizado por reforço é um método de aprendizado de máquina voltado para tratar como os agentes de software devem realizar ações em um ambiente. Em relação ao aprendizado por reforço, selecione a opção correta.


O agente só é informado sobre a sua recompensa ao final de um número fixo de iterações para evitar desvios sobre sua política de tomada de decisão.
Ele dá suporte para maximizar recompensas cumulativas.
A escolha das ações é fixa ao longo da execução do algoritmo.
Todo o processo de aprendizagem é desenvolvido a partir de ideias baseadas em métodos exatos.
O agente é informado por exemplos positivos e negativos.

Essa pergunta também está no material:

NAV SIMULADO MACHINE LEARNING
1 pág.

Sistemas Banco de Dados Universidade Estácio de Sá - EADUniversidade Estácio de Sá - EAD

💡 1 Resposta

User badge image

Ed Verified user icon

A opção correta em relação ao aprendizado por reforço é: "Ele dá suporte para maximizar recompensas cumulativas." Nesse método, o agente busca aprender a tomar ações que maximizem a recompensa acumulada ao longo do tempo, através de interações com o ambiente.

0
Dislike0

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

✏️ Responder

SetasNegritoItálicoSublinhadoTachadoCitaçãoCódigoLista numeradaLista com marcadoresSubscritoSobrescritoDiminuir recuoAumentar recuoCor da fonteCor de fundoAlinhamentoLimparInserir linkImagemFórmula

Para escrever sua resposta aqui, entre ou crie uma conta

User badge image

Outros materiais