A alternativa correta é a letra D: "Ao contrário do SGD, o algoritmo Adam utiliza médias móveis para obter uma estimativa do momentum e do gradiente." Essa é a principal diferença entre os algoritmos SGD e Adam. O SGD utiliza apenas o gradiente para atualizar os pesos, enquanto o Adam utiliza médias móveis do gradiente e do momentum para atualizar os pesos.
Para escrever sua resposta aqui, entre ou crie uma conta
Compartilhar