Buscar

O aprendizado por reforço é muito importante para os modelos de aprendizado de máquina. Trata-se de um conjunto de elementos que se conectam por me...

O aprendizado por reforço é muito importante para os modelos de aprendizado de máquina. Trata-se de um conjunto de elementos que se conectam por meio de responsabilidades bem delimitadas para atingir seu objetivo. Em relação ao aprendizado por reforço, selecione a opção que não corresponde a uma característica do modelo.


O valor corresponde aos elementos do gradiente em determinada iteração.
Valor Q trata do valor da recompensa de um agente em relação aos pares de estado-ação para determinada política.
O estado corresponde a uma situação em que o agente se encontra em determinado momento.
A função valor calcula o valor total da recompensa.
O agente é uma entidade que executa ações para ganhar alguma recompensa em um ambiente.

Essa pergunta também está no material:

AV MAchine Learning Estacio
3 pág.

Machine Learning Universidade Estácio de SáUniversidade Estácio de Sá

💡 1 Resposta

User badge image

Ed Verified user icon

A opção que não corresponde a uma característica do modelo de aprendizado por reforço é: "O valor corresponde aos elementos do gradiente em determinada iteração."

0
Dislike0

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

✏️ Responder

SetasNegritoItálicoSublinhadoTachadoCitaçãoCódigoLista numeradaLista com marcadoresSubscritoSobrescritoDiminuir recuoAumentar recuoCor da fonteCor de fundoAlinhamentoLimparInserir linkImagemFórmula

Para escrever sua resposta aqui, entre ou crie uma conta

User badge image

Outros materiais