“A independência do futuro em relação ao passado não é plena. Por este motivo a hipótese de Markov propõe a previsibilidade da ação futura em funç...

Question

“A independência do futuro em relação ao passado não é plena. Por este motivo a hipótese de Markov propõe a previsibilidade da ação futura em função de uma quantidade finita de ações/resultados anteriores e não somente do estado presente.” Aula 2, Tema 3.

Considerando o exposto acima e o que estudamos sobre MDP, podemos afirmar:

A- Se a previsibilidade do próximo estado depender do estado atual e do que o antecede apenas, não teremos um processo de Markov e precisaremos abandonar o uso de algoritmos de RL.

B- A ênfase na dependência singular do estado atual levou a se chamar as transições entre estados, cuja dependência do passado seja desprezível de hipóteses de Bellman sem transição.

C- A cada ação realizada, o agente pode receber um feedback do meio, que chamaremos de recompensa. Esta recompensa é um valor numérico qualquer e é proporcional a assertividade do resultado em relação ao objetivo da política do agente.

D- A ideia da recompensa simula a reação newtoniana do meio a uma ação qualquer: a toda ação ocorre uma reação de mesma intensidade e sentido contrário à ação.

Ed · Answer

Você precisa criar uma nova pergunta.

“A independência do futuro em relação ao passado não é plena. Por este motivo a hipótese de Markov propõe a previsibilidade da ação futura em funç...

Machine Learning

UNINTER

Respostas

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Responda

Mais conteúdos dessa disciplina

Perguntas dessa disciplina

“A independência do futuro em relação ao passado não é plena. Por este motivo a hipótese de Markov propõe a previsibilidade da ação futura em funçã...

“A independência do futuro em relação ao passado não é plena. Por este motivo a hipótese de Markov propõe a previsibilidade da ação futura em funçã...

A independência do futuro em relação ao passado não é plena. Por este motivo a hipótese de Markov propõe a previsibilidade da ação futura em função...

Questão 1/10 - Reinforcement Learning “A independência do futuro em relação ao passado não é plena. Por este motivo a hipótese de Markov propõe a p...

Conteúdos escolhidos para você

Deep Learning

UNIDADE 3 - Técnicas de árvores para machine learning - Exercícios

UNIDADE 1 - Técnicas de Machine Learning - Ampli

Machine Leaning