Ed
há 5 dias
Vamos analisar as alternativas com base no que sabemos sobre algoritmos de TD (Temporal Difference): A) "A TD busca a previsão da ação baseada na análise da cadeia de Markov de primeira ordem segundo a qual o futuro depende apenas do presente, o que impede, em TD, levarmos em conta predições temporais já feitas." — Incorreto. TD trabalha justamente com predições temporais anteriores para atualizar valores, não é impedido de usá-las. B) "Mesmo em processos marcovianos de primeira ordem, o uso de TD é convergente e ao menos igualmente eficiente que outros métodos de aprendizagem." — Correto. TD é conhecido por sua convergência e eficiência em processos de Markov de primeira ordem. C) "O método de diferença temporal passa pela análise dos erros das predições anteriores, ao qual denominaremos derivada parcial do erro em relação ao peso por diferença temporal, ou DPETD." — Parcialmente correto, mas o termo DPETD não é um conceito padrão ou amplamente usado. D) "O erro por diferença temporal é o fator que ajustará o valor do estado em função das multivariáveis do espaço estocástico, mas não das ocorrências anteriores que poderiam contribuir para o próximo estado, por este motivo foi abandonado e substituído pelas CNNs." — Incorreto. TD não foi abandonado e CNNs são técnicas diferentes, não substitutas diretas. E) "Todas estão corretas." — Incorreto, pois algumas alternativas estão erradas. Portanto, a alternativa correta é: B) Mesmo em processos marcovianos de primeira ordem, o uso de TD é convergente e ao menos igualmente eficiente que outros métodos de aprendizagem.


Cadastre-se ou realize login
Ao continuar, você aceita os Termos de Uso e Política de Privacidade