Buscar

Sorger Abordagem Recursiva (5 4)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Sorger – Abordagem Recursiva (5.4) 
	A abordagem recursiva não requer argumentos variáveis ou premissas interiores e retorna condições ótimas, necessárias e suficientes sem premissas de convexidade, diferente da abordagem de Lagrange e da equação de Euler.
	Retome o problema de otimização dinâmica na forma reduzida da seção 5.1. O espaço de estado é um conjunto arbitrário não-vazio e o conjunto de transições é não-vazio para todo e . Isso nos garante que para todo período inicial e para todo estado inicial , existe, ao menos, uma sequência satisfazendo e . Ou seja, existe ao menos uma trajetória factível para o problema , onde é definido como 
Denotamos o conjunto de todas as trajetórias factíveis do problema por . Além disso, mantemos a premissa de que 
existe para todas as trajetórias factíveis, o que garante que a função objetiva seja um número real bem definido quando . No coração da abordagem recursiva para a otimização dinâmica está a função valor ótimo , definida porDefinição de Supremo: Seja . Um elemento é dito Supremo de se é o mínimo do conjunto de todos os upper bounds.
Definição de Upper Bound: Seja . Um elemento é dito Upper Bound de se 
Definição de Mínimo: Seja . Um elemento é dito mínimo em se .
[Função valor ótimo retorna o supremo do problema de otimização]
a equação de Bellman
Prova – Teorema 5.7:
Tome como uma trajetória factível qualquer para . Note que
[ pode ser escrito como a utilidade do primeiro período , , acrescido de seus valores nos outros períodos, isso é, a partir de , denotado por ]
e que
Assim, temos que 
Note que
Como 
Temos que 
que representa a equação de Bellman. Assim, provamos que as funções de valor ótimo sempre satisfazem a equação de Bellman.
Teorema 5.8 (Suficiência de Bellman e Condição ): suponha que a função satisfaz a equação de Bellman e que a condição é satisfeita para todas as trajetórias factíveis e todo . Assim, temos que é a função valor ótima.
Teorema 5.7 (necessidade de Bellman): A função valor ótimo satisfaz a equação de Bellman.
Prova – Teorema 5.8: tome como uma solução arbitrária da equação de Bellman e tome como uma trajetória factível arbitrária. Assim, temos:
[Essa desigualdade deriva do fato de a função satisfazer a definição de Equação de Bellman: como , assume um valor pelo menos tão grande quanto o supremo da soma ]
Explicitando alguns termos de , temos
Com , essa desigualdade, em conjunto com a condição, implica que
[Observe que e que ]
Como a trajetóra foi escolhida arbitrariamente de , temos que 
	Isso demonstra que é ao menos tão grande quanto o valor ótimo do problema de otimização dinâmica. Para completar a prova, basta mostrarmos que não pode ser estritamente maior que o valor ótimo (precisa ser igual ao supremo). Para isso, suponha, por contradição, que essa essa propriedade é falsa, ou seja, que existe um estado e um número positivo real tal que para toda trajetória factível é verdade que
[Ao adicionar estamos assumindo que vai ser estritamente maior que o supremo, ou seja, é ao menos tão grande quanto o supremo acrescido de um valor real ].
Em particular, é verdade para a trajetória factível , que é construída da seguinte maneira.
Tome como uma sequência de números positivos tal que ela converge para , isso é
Como é solução da equação de Bellman e porque é positiva, existe um tal que
[Estamos mostrando que haverá algum valor que irá ultrapassar . Esse valor será o próprio supremo, ou algum valor próximo dele.]
Tome na desigualdade e combine os resultados de e .
Portanto
Subtraindo de ambos os lados, temos
Podemos repitir esse processo indefinidamente para , e obteremos
Quando , temos que
Isso segue de e e do fato de ser um número finito.
[Note que o fato de ser um número finito ser um número finito implica que os útimos valores da soma são nulos, ou seja, não aumentam o somatório. Assim, quando iniciamos o somatório em , estamos apenas somando zeros, de tal forma que o limite do somatório quando é zero]
 Assim, 
implica em
o que é uma contradição.
Desse lema, segue o Teorema 5.9.Prova – Lema 5.1 – Princípio da Otimalidade: suponha, por com tradição, que não é uma trajetória ótima do problema . Então existe uma trajetória factível tal que 
Considere a trajetória definida por
Essa trajetória é factível pois e são factíveis. Assim, é óbvio que e, portanto
Uma vez que temos , podemos decompor os somatórios, de forma a obter
Disso segue que
Portanto,
Ou seja, 
Isso é uma contradição à otimalidade de para .
[Nessa prova mostramos que se é necessário reavaliar a trajetória em um período futuro, então é melhor fazê-lo no início da trajetória, ao invés de ao longo dele].
Lema 5.1 – Princípio da Otimalidade: Tome como uma trajetória ótima para o problema . Para todo , temos que é uma trajetória ótima para o problema . Ou seja, quando temos uma trajetória ótima até o ponto , se continuarmos a seguir tal trajetória para além de , isso é, , continuamos em uma trajetória ótima. Sucintamente, uma trajetória ótima é ótima em todos os seus pontos.
Teorema 5.10 (Suficiência de Bellman e Condição ): Se é a função valor ótima do peoblema de otimização e se é uma trajetória factível para tal problema e satisfaz a condição , e a Equação de Bellman, , então temos que é uma trajetória ótima.
Prova – Teorema 5.10: Da Equação de Bellman,
temos que, para todo ,
Tomando e utilizando da Condição de Transversalidade, temos que
Assim, 
Uma vez que é a função valor ótima, temos que é uma trajetória ótima do problema .
Prova – Teorema 5.9: Uma vez que é a função valor ótimo e dado que é uma trajetória ótima, temos 
Do princípio da otimalidade, temos que é uma trajetória ótima para tal que
Com essas duas equações provamos o teorema para . Além disso, como é ótima para (Princípio da Otimalidade), podemos repetir todo esse argumento para . Fazendo isso podemos provar que é verdade para todo .
Teorema 5.9 (Se temos função valor ótimo e a trajetória ótima, então Bellman é satisfeito): Se é a função valor ótima do peoblema de otimização e se é uma trajetória ótima, então temos que a equação 
é satisfeita.
[estamos inserindo a equação de Bellman no Princípio da Otimalidade. Se tivermos a função valor ótimo e uma trajetória ótima, então a equação de Bellamn é satisfeita com igualdade em . Isso implica que a trajetória ótima sempre atingirá o supremo.]

Continue navegando