Rede usada para o treinamento do agente que é composta de duas partes: uma rede de codificação que processa as observações, seguida por uma camada ...
Rede usada para o treinamento do agente que é composta de duas partes: uma rede de codificação que processa as observações, seguida por uma camada de saída densa que gera um Q-Value por ação. Grupo de escolhas da pergunta TF-Agents Tensorflow QNetwork Sklearn
Compartilhar