Buscar

Rede usada para o treinamento do agente que é composta de duas partes: uma rede de codificação que processa as observações, seguida por uma camada ...

Rede usada para o treinamento do agente que é composta de duas partes: uma rede de codificação que processa as observações, seguida por uma camada de saída densa que gera um Q-Value por ação. Grupo de escolhas da pergunta TF-Agents Tensorflow QNetwork Sklearn

💡 1 Resposta

User badge image

Ed Verified user icon

A rede descrita na pergunta é a QNetwork.

0
Dislike0

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

✏️ Responder

SetasNegritoItálicoSublinhadoTachadoCitaçãoCódigoLista numeradaLista com marcadoresSubscritoSobrescritoDiminuir recuoAumentar recuoCor da fonteCor de fundoAlinhamentoLimparInserir linkImagemFórmula

Para escrever sua resposta aqui, entre ou crie uma conta

User badge image

Outros materiais