Baixe o app para aproveitar ainda mais
Prévia do material em texto
Otimizac¸a˜o Nas aplicac¸o˜es a`s cieˆncias, frequentemente surge a necessidade de se achar pontos de ma´ximo e mı´nimo de func¸o˜es em duas ou mais varia´veis, assim como seus valores de ma´ximo e mı´nimo. Na F´ısica busca-se o mı´nimo da energia potencial U(x,y,z) definida no espac¸o. Na Economia deseja-se maximizar a func¸a˜o lucro, que pode depender de diversos paraˆmetros. Na Qu´ımica interessa saber a temperatura e a quantidade do reagente A que maximizam a produc¸a˜o de uma substaˆncia B, numa certa reac¸a˜o. A otimizac¸a˜o e´ o procedimento do ca´lculo que nos permite analisar esses problemas. Para tal, devemos antes definir com cuidado os conceitos acima. 1 Func¸o˜es definidas em regio˜es abertas do Rn A definic¸a˜o mais geral para pontos extremos pode ser feita independentemente do conjunto domı´nio da func¸a˜o. Denotaremos D ⊂ Rn um conjunto na˜o-vazio arbitra´rio, e x = (x1, x2, . . . , xn) ∈ D um ponto qualquer. Definic¸a˜o 1.1. Seja f : D ⊂ Rn → R e P ∈ D. Dizemos que P e´ ponto de. . . mı´nimo local: Se f(x) ≥ f(P ) para todos os pontos x em D suficientemente pro´ximos de P . Por suficientemente pro´ximo entende-se que existe um raio r > 0 (pequeno) para o qual a propriedade f(x) ≥ f(P ) vale para todo x ∈ BP (r) ∩D. ma´ximo local: Se f(x) ≤ f(P ) para todo x ∈ BP (r) ∩D, para algum r > 0. Um ponto de mı´nimo local no qual a condic¸a˜o f(x) ≥ f(P ) vale para todo x no domı´nio D de f e´ chamado mı´nimo global, e similarmente, um ponto de ma´ximo local sera´ ma´ximo global se a desigualdade respectiva valer para toda a regia˜o D. Qualquer ponto de ma´ximo ou mı´nimo e´ chamado ponto extremo, oqual pode ser local ou global. O conjunto D pode ser todo o espac¸o Rn, ou enta˜o um pedac¸o menor deste espac¸o. Nesse caso D possuira´ fronteira ∂D 6= ∅. Os pontos extremos de f podem ocorrer no interior de D e tambe´m em sua fronteira. Lembramos que um subconjunto U ⊂ Rn e´ aberto se para todo P ∈ U , existe algum raio r > 0 tal que a bola aberta BP (r) = {x ∈ Rn | d(x, P ) < r} esta´ contida inteiramente em U (a notac¸a˜o d(x, P ) designa a norma do vetor x−P , e´ a distaˆncia euclidiana entre os pontos). O importante sobre os conjuntos abertos e´ que eles na˜o conteˆm nenhum ponto de sua fronteira U ∩ ∂U = ∅, portanto sempre se pode aproximar um de seus pontos P por qualquer direc¸a˜o, desde que tomemos outros pontos bem pro´ximos de P . Por outro lado, se D e´ qualquer subconjunto de Rn, o interior de D, denotado intD, e´ o maior conjunto aberto contido em D, e vale intD = D − ∂D. Definic¸a˜o 1.2. Um ponto cr´ıtico da func¸a˜o f e´ um ponto P ∈ D no qual o vetor ∇fP na˜o existe, ou enta˜o existe e vale ∇fP = ~0. Teorema 1.3. Seja P um ponto extremo de f no interior de D. Enta˜o ou o gradiente de f na˜o existe em P (uma das derivadas parciais na˜o existe), ou o gradiente existe e vale ~0. Portanto, qualquer ponto extremo de f no interior de D e´ cr´ıtico. Demonstrac¸a˜o. Seja P ∈ intD um ponto extremo, admitamos que seja ma´ximo local. Enta˜o existe uma bola aberta pequena BP (r) ⊂ D tal que f(x) ≤ f(P ) para todo x ∈ BP (r) (definic¸a˜o de ma´ximo local). Escrevendo P = (p1, p2, . . . , pn) e x = (x1, x2, . . . , xn) podemos escolher algum ı´ndice i, 1 ≤ i ≤ n e considerar a reta paralela ao eixo 0xi que passa por P . Restringindo f a essa reta obtemos g(s) = f(p1, p2, . . . , pi−1, s, pi+1, . . . , pn) que e´ func¸a˜o de uma varia´vel real com ponto de ma´ximo local em s = pi. Da teoria em dimensa˜o 1, sabemos que pi e´ ponto cr´ıtico de g, ou seja, 1 g′(pi) e´ zero ou na˜o existe. Como g ′(pi) = ∂f ∂xi (P ), conclu´ımos que as derivadas parciais de f em P sa˜o, cada uma delas, zero ou inexistente. Isso conlui que P e´ ponto cr´ıtico. Exemplo 1. A func¸a˜o f(x, y) = x2 + y2 e´ diferencia´vel no R2 e so´ pode ter pontos cr´ıticos do tipo ∇f = (0, 0). Como ∇f(x,y) = (2x, 2y) vemos que o u´nico ponto cr´ıtico de f e´ a origem (0, 0). Exemplo 2. A func¸a˜o g(x, y) = x 3 3 − 3y2 + 2xy − x e´ diferencia´vel no plano. Resolvemos a equac¸a˜o ∇g(x,y) = (0, 0): ∇g(x,y) = (x2 + 2y − 1,−6y + 2x) = (0, 0) =⇒ { x2 + 2y − 1 = 0 −6y + 2x = 0 . O sistema de equac¸o˜es obtido tem por soluc¸a˜o os pontos {(−1+ √ 10 3 , −1+ √ 10 9 ), (−1− √ 10 3 , −1− √ 10 9 )}. Estes sa˜o pois os u´nicos pontos cr´ıticos de g. No interior do domı´nio pontos extremos sa˜o cr´ıticos. Contudo, nem todo ponto cr´ıtico necessita ser ponto extremo. Isso sugere uma definic¸a˜o. Definic¸a˜o 1.4. Um ponto cr´ıtico P de f e´ chamado ponto de sela se vale a propriedade seguinte: podemos encontrar pontos x, y ∈ D ta˜o pro´ximos de P quanto desejarmos com f(x) < f(P ) < f(y). Note que a definic¸a˜o de ponto de sela so´ vale para pontos cr´ıticos. Um ponto P no qual ∇fP 6= 0 na˜o pode ser classificado como ponto de sela, mesmo que ambas desigualdades da definic¸a˜o acima valham para P . Exemplo 3. Veˆ-se atrave´s de um ca´lculo que o u´nico ponto cr´ıtico de f(x, y) = y2 − x2 e´ (0, 0). Tomando x = 0 e valores arbitrariamente pequenos para y obtemos pontos onde f(0, y) = y2 > 0, logo f(0, y) > f(0, 0) = 0. E se tomarmos y = 0 e x arbitrariamente pequeno obtemos pontos onde f(x, 0) < f(0, 0). Isso mostra ser a origem um ponto de sela. O crite´rio de classificac¸a˜o de pontos cr´ıticos interiores usara´ a matriz hessiana de f : se f : U ⊂ R n → R e´ de classe C2 enta˜o Hf = ∂2f ∂x21 ∂2f ∂x2∂x1 · · · ∂ 2f ∂xn∂x1 ∂2f ∂x1∂x2 ∂2f ∂x22 · · · ∂ 2f ∂xn∂x2 ... ... . . . ... ∂2f ∂x1∂xn ∂2f ∂x2∂xn · · · ∂ 2f ∂x2n . Apresentaremos o crite´rio inicialmente para func¸o˜es em abertos do plano. Teorema 1.5. Seja f : D ⊂ R2 → R de ordem C2, f = f(x, y), e P um ponto cr´ıtico no interior de D. Enta˜o: 1. detHf(P ) > 0 e ∂2f ∂x2 (P ) > 0 ⇒ P e´ ponto de mı´nimo local. 2. detHf(P ) > 0 e ∂2f ∂x2 (P ) < 0 ⇒ P e´ ponto de ma´ximo local. 3. detHf(P ) < 0 ⇒ P e´ ponto de sela. 4. detHf(P ) = 0 ⇒ teste inconclusivo. Vamos analisar alguns exemplos anteriores atrave´s deste teorema. 2 Exemplo 4. No exemplo 1 a func¸a˜o f tem matriz hessiana calculada num ponto (x, y) arbitra´rio Hf = ( 2 0 0 2 ) ⇒ detHf = 2.2 = 4 > 0. Como ∂2f ∂x2 = 2 > 0 vemos pelo teste que (0, 0) e´ ponto de mı´nimo local, oque ja´ pod´ıamos inferir diretamente devido ao crescimento da func¸a˜o afastando-se da origem. Note que (0, 0) e´ efetivamente um mı´nimo global. Ja´ para a func¸a˜o g do exemplo 2 na˜o parece o´bvio qual a classificac¸a˜o dos dois pontos cr´ıticos antes de aplicarmos o teste da segunda derivada. Vamos obter a matriz hessiana em (x, y): Hg(x, y) = ( 2x 2 2 −6 ) . Temos dois pontos cr´ıticos, P1 = ( −1+ √ 10 3 , −1+ √ 10 9 ) e P2 = ( −1− √ 10 3 , −1− √ 10 9 ). Calculando os determi- nantes fica detHg(P1) = 2( −1 +√10 3 )(−6)− 2.2 = −4 √ 10 < 0 , detHg(P2) = 2( −1−√10 3 )(−6)− 2.2 = +4 √ 10 > 0 . Conclu´ımos primeiro que P1 e´ ponto de sela. Agora, como a derivada ∂2g ∂x2 (P2) = 2( −1− √ 10 3 ) e´ negativa, mas seu determinante e´ positivo, temos que P2 e´ ponto de ma´ximo local. Exemplo 5. Encontre os valores extremos locais de f(x, y) = xy − x2 − y2 − 2x− 2y + 4. Soluc¸a˜o. A func¸a˜o e´ diferencia´vel em todo o plano, por isso os pontos extremos ocorrem somente nos pontos cr´ıticos. Calculando as derivadas primeiras, ∂f ∂x = y − 2x− 2 e ∂f ∂y = x− 2y − 2 , vemos que a soluc¸a˜o do sistema { y − 2x− 2 = 0 x− 2y − 2 = 0 nos da´ o u´nico ponto cr´ıtico: P = (−2,−2). Como o determinante da hessiana e´ detHf = det ( −2 1 1 −2 ) = 3 > 0 , o sinal de ∂2f ∂x2 = −2 enta˜o nos indica ser (−2,−2) ponto de ma´ximo local. O valor de ma´ximo correspondente e´ f(−2,−2) = 8. Para classificarmos pontos cr´ıticos interioresem dimensa˜o maior que 2 devemos tratar com os autovalores da matriz hessiana. Lembramos que uma matriz A de tipo n × n e´ sime´trica se A = (aij) com aij = aji. O principal fato a respeito de matrizes sime´tricas e´ a diagonalizac¸a˜o: existe uma matriz ortogonal Rn×n e tal que D = R −1.A .R e´ matriz diagonal. Os autovalores de A sa˜o os elementos da diagonal de D. Notamos que devido a regra de Schwartz, a matriz hessiana de uma func¸a˜o de classe C2 sempre e´ sime´trica. 3 Teorema 1.6 (Classificac¸a˜o de pontos cr´ıticos). Se f e´ de classe C2 e P um ponto cr´ıtico, Hf a matriz hessiana de f . Enta˜o 1) Se os autovalores {λ1, . . . , λm} de Hf forem positivos P e´ ponto de mı´nimo local; 2) Se os autovalores {λ1, . . . , λm} de Hf forem negativos P e´ ponto de ma´ximo local; 3) Se houver ao menos dois autovalores λi e λj de sinais opostos, P e´ ponto de Sela; 4) Se algum autovalor λi for zero e os demais mantiverem o mesmo sinal nada se pode concluir. 2 Ma´ximos e mı´nimos de func¸o˜es com restric¸a˜o - Multiplicadores de Lagrange Seja f(x, y) definida em uma regia˜o D ⊂ R2 aberta. Considere C uma curva fechada diferencia´vel, ou diferencia´vel por partes, e contida em D. Podemos considerar a func¸a˜o obtida da restric¸a˜o de f a C, ou seja, uma func¸a˜o f˜ : C → R , f˜(x, y) = f(x, y) para todo (x, y) ∈ C . A pergunta e´: como encontrar pontos extremos de f˜ em C 1 ? Notamos que a definic¸a˜o 1.1 se aplica a f˜ , bastando que se substitua naquela f(x, y) por f˜ e D pela curva C. O conceito de localidade continua sendo dado por bolas abertas no plano. Vamos primeiro abordar essa pergunta visualmente, atrave´s das curvas de n´ıvel de f : A B E P Q f(x,y)=c 7 8 9 10 11 12 13 14 No desenho acima as curvas de n´ıvel de f sa˜o aproximadamente arcos de elipses. A curva fechada C e´ dada pela justaposic¸a˜o dos segmentos diferencia´veis AB, BE e EQPA. Note que C na˜o e´ diferencia´vel nos pontos A, B e E, embora seja cont´ınua em todos os seus pontos. A curva C e´ diferencia´vel nos pontos P e Q, e os vetores representados sobre esses pontos indicam a direc¸a˜o ortogonal a` C (o sentido foi determinado como “para fora” da regia˜o limitada de fronteira C). A ana´lise do desenho mostra que f˜ , ou f restrita a` curva C, apresenta 4 pontos extremos: B e´ mı´nimo global; P e´ mı´nimo local; A e´ ma´ximo local; Q e´ ma´ximo global. Observamos que os pontos extremos de f restrito a C ocorrem em pontos onde C na˜o e´ dife- rencia´vel, assim como em pontos onde a curva de n´ıvel de f e´ tangente a` curva C. Esses sera˜o os candidatos naturais a pontos extremos de uma func¸a˜o restrita a uma curva diferencia´vel por partes. Note que E tambe´m e´ um ponto onde C na˜o e´ diferencia´vel, mas a func¸a˜o na˜o apresenta extremo em E. Teorema 2.1. Dada a func¸a˜o f(x, y) definida numa vizinhanc¸a de uma curva C. Suponha que o ponto P ∈ C seja ma´ximo local (ou mı´nimo local) de f restrita a C. Enta˜o uma das treˆs condic¸o˜es ocorre: 1A forma natural de se responder a` pergunta acima e´ com a Teoria de Variedades Diferencia´veis, que estuda espac¸os na˜o-euclidianos e func¸o˜es diferencia´veis neles definidas. 4 1. C na˜o e´ diferencia´vel em P ; ou 2. C e´ diferencia´vel em P e P e´ ponto cr´ıtico de f ; ou 3. C e´ diferencia´vel em P e ∇fP e´ ortogonal a` curva C. No caso 2 acima o ponto cr´ıtico e´ entendido no sentido original da definic¸a˜o 1.2 Demonstrac¸a˜o. Certamente que o caso 1 e´ mutuamente excludente com os casos 2 e 3. Assim, devemos mostrar, por exemplo, que se 1 e 2 na˜o ocorrem, enta˜o deve necessariamente ocorrer o caso 3. Assuma que C e´ curva diferencia´vel em P . Enta˜o podemos achar uma parametrizac¸a˜o t→ σ(t) = (x(t), y(t)) tal que σ(0) = P e σ′(0) e´ um vetor tangente a` curva C no ponto P . Note que σ′(0) deve ser na˜o nulo, oque e´ sempre poss´ıvel. Assuma tambe´m que P na˜o e´ ponto cr´ıtico de f . Enta˜o ∇fP e´ diferente de zero. Devemos apenas mostrar que ∇fP e´ ortogonal a` curva C para finalizar a prova do teorema. Por simplicidade, vamos admitir que f e´ diferencia´vel. Tomemos a composta f(σ(t)). Como f restrito a C tem ma´ximo local em P , certamente a func¸a˜o f(σ(t)) possui ma´ximo local em t = 0. Logo (f ◦ σ)′(0) = 0. Pela regra da cadeia obtemos (f ◦ σ)′(0) = ∇fσ(0) · σ′(0) = ∇fP · σ′(0) = 0 , ou seja, o gradiente de f em P e´ ortogonal ao vetor tangente a` curva em P , como quer´ıamos demonstrar. Considere agora o caso de uma curva de n´ıvel C dada como o conjunto soluc¸a˜o da equac¸a˜o g(x, y) = c, para uma certa func¸a˜o diferencia´vel g(x, y) e constante real c. Supomos tambe´m que ∇gQ 6= 0 para todo Q ∈ C (essa condic¸a˜o e´ importante para garantir que C seja uma curva regular, ou seja, uma curva diferencia´vel em todos os pontos). O caso 3 do teorema 2.1 nos diz que se P e´ ponto extremo da restric¸a˜o de f enta˜o o gradiente de f e´ ortogonal a C em P . Mas o gradiente de g tambe´m e´ ortogonal a C em P , pela relac¸a˜o ba´sica entre curvas de n´ıvel e gradiente de uma mesma func¸a˜o. Portanto, ∇fP e ∇gP sa˜o paralelos a` mesma direc¸a˜o. Logo devem ser mu´ltiplos um do outro. Tal fato e´ expresso pelo teorema abaixo. Teorema 2.2 (Multiplicadores de Lagrange). Sejam f(x, y) e g(x, y) func¸o˜es diferencia´veis em um mesmo aberto do plano, e C 6= ∅ a curva de n´ıvel c de g. Assuma que P ∈ C e´ ponto extremo de f restrita a C, e que ∇gP 6= 0. Enta˜o existe uma nu´mero real λ tal que ∇fP = λ ∇gP . Observac¸a˜o 2.3. Note que para incluirmos o caso de P ser ponto cr´ıtico de f o multiplicador de Lagrange λ deve ser sempre coeficiente de ∇gP . Lembramos que um subconjunto K ⊂ Rn e´ compacto se K e´ limitado e fechado. Por limitado entendemos que na˜o existe uma sequeˆncia de pontos em K que ‘fuja’ para algum infinito, ou ainda, que existe alguma bola aberta BO(R) de raio suficientemente grande e tal que BO(R) ⊃ K. Teorema 2.4. Se D ⊂ Rn e´ compacto e f : D → R e´ cont´ınua enta˜o f admite valores (pontos) de ma´ximo e mı´nimo globais. Exemplo 6. Encontre os valores de ma´ximo e mı´nimo de f(x, y) = xy restrito a curva x 2 8 + y 2 2 = 1. Soluc¸a˜o. Definindo g(x, y) = x 2 8 + y 2 2 estamos olhando primeiro para o seguinte problema: Encontrar os pontos (x, y) do plano tais que, para algum λ real,{ ∇f(x, y) = λ∇g(x, y) g(x, y) = 1 . 5 Calculando os gradientes ∇f = (y, x) e ∇g = (x/4, y), chegamos no sistema de equac¸o˜es y = λ x 4 x = λy . (1) Aqui a ana´lise pode ser feita assim: se fosse x = 0 enta˜o necessariamente y = 0, mas (0, 0) na˜o e´ soluc¸a˜o de g(x, y) = 1. Logo deve ser x 6= 0. Dividindo a primeira pela segunda equac¸a˜o em (1) obtemos y x = x 4y =⇒ 4y2 = x2 . Substituindo em g(x, y) = 1 fica 4y2 8 + y2 2 = 1 =⇒ y2 = 1 ⇒ y = ±1 . Para esses valores de y calculamos que x pode ser ±2, ou seja, os u´nicos candidatos a pontos cr´ıticos sa˜o {(2, 1), (2,−1), (−2, 1), (−2,−1)}. Testando diretamente esses pontos chegamos a f(2, 1) = 2 = f(−2,−1) e f(2,−1) = −2 = f(−2, 1). Portanto, o valor ma´ximo de f e´ 2, alcanc¸ado em {(2, 1), (−2,−1)}. O valor mı´nimo e´ -2 em {(−2, 1), (2,−1)}. Observe que a func¸a˜o f(x, y) na˜o tem ma´ximo nem mı´nimo no plano cartesiano. Exemplo 7. Ache o(s) ponto(s) cr´ıticos de f(x, y) = 5x+ 2y na para´bola y = 3x2 − 4x+ 1. Soluc¸a˜o. Definimos g(x, y) = y − 3x2 + 4x e queremos analisar a curva g(x, y) = 1. A condic¸a˜o de ponto cr´ıtico nos da´ ∇f = λ∇g e as equac¸o˜es ficam{ 5 = λ(−6x+ 4) 2 = λ.1 ⇒ λ = 2 e x = 1 4 . Substituindo o valor de x na equac¸a˜o da curva calculamos y = 3 16 . Logo o u´nico ponto cr´ıtico de f restrito a g(x, y) = 1 e´ (1 4 , 3 16 ). Observac¸a˜o 2.5. No exemplo acima podemos calcular diretamente o ponto cr´ıtico e mostrar que se trata de mı´nimo global. Tomando σ(t) = (t, 3t2 − 4t + 1) vemos que a curva σ(t) parametrizaa para´bola dada por g(x, y) = 1, sendo t ∈ R. Compondo f ◦ σ(t) e otimizando a func¸a˜o resultante em uma varia´vel, obtemos f(σ(t)) = 6t2 − 3t+ 2 ⇒ t = 1 4 e´ mı´nimo global. Como t = 1 4 corresponde ao ponto P = (1 4 , 3 16 ) conclu´ımos que este e´ o ponto de mı´nimo global de f condicionado a` g(x, y) = 1. Note que este e´ um exemplo muito espec´ıfico, pois em geral na˜o sabemos paramterizar a curva de n´ıvel de g de forma a reduzir o problema ao Ca´lculo I. 3 Func¸o˜es em regio˜es compactas do plano Para finalizar o caso de func¸o˜es em duas varia´veis, analisemos a situac¸a˜o em que desejamos encontrar ma´ximos e mı´nimos de f(x, y) definida em uma regia˜o D ⊂ R2 compacta. Definic¸a˜o 3.1. Um conjunto F ⊂ Rn e´ chamado fechado se seu complementar Rn − F e´ aberto. Um conjunto F e´ compacto se for fechado, e ale´m disso existir alguma bola aberta Bp(r) para algum r > 0 e p ∈ Rn tal que F ⊂ Bp(r). Assim um conjunto compacto e´ um conjunto fechado (que possui todos os seus pontos de fronteira) e limitado. 6 Um fato importante aqui (que ja´ usamos antes) e´ enunciado abaixo: Teorema 3.2. Seja f : D → R uma func¸a˜o cont´ınua e D um compacto. Enta˜o f admite pelo menos um ponto de ma´ximo global e um ponto de mı´nimo global em D. Ou seja, existem Pmin ∈ D e Pmax ∈ D tais que f(Pmin) ≤ f(x) ≤ f(Pmax) para qualquer x ∈ D. O procedimento para encontrar pontos extremos de f em D e´ assim resumido: buscamos os pontos cr´ıticos de f no interior de D e os pontos extremos de f restrita a` fronteira de D, ∂D. A´ı comparamos todos esses pontos e entre eles encontraremos o ma´ximo e mı´nimo globais, ale´m dos apenas locais. Para simplificar, supomos sempre que ∂D e´ uma curva diferencia´vel por partes, de forma a aplicarmos os resultados da sec¸a˜o 2. Exemplo 8. Determine os pontos extremos de f(x, y) = x3+y3−3x−3y em D = {(x, y) ∈ R2 | 0 ≤ x ≤ 2 e |y| ≤ 2}. Soluc¸a˜o. f e´ cont´ınua em D, e D e´ compacto. Vamos encontrar os pontos cr´ıticos de f no interior de D, intD = {(x, y) ∈ R2 | 0 < x < 2 e |y| < 2}. Calculando o gradiente e igualando a zero, ∇f(x,y) = (3x2 − 3, 3y2 − 3) = (0, 0) ⇔ { 3x2 − 3 = 0 3y2 − 3 = 0 O sistema acima possui no plano quatro soluc¸o˜es, que sa˜o os ve´rtices do quadrado [−1, 1]× [−1, 1]. Desses, somente os pontos (1, 1) e (1,−1) pertencem a intD. Agora analisamos a fornteira ∂D, que sa˜o os lados de um retaˆngulo. Os ve´rtices {(0, 2), (0,−2), (2, 2), (2,−2) sa˜o candidatos a extremos por serem pontos onde ∂D na˜o e´ diferencia´vel. Para os demais pontos da fronteira, utilizamos multiplicadores de Lagrange: olhamos cada lado como um pedac¸o de uma curva de n´ıvel de uma func¸a˜o g(x, y) apropriada: 1- No lado horizontal superior tomamos g(x, y) = y = 2 com 0 < x < 2. Enta˜o ∇f = λ ∇g equivale a { 3x2 − 3 = 0 3y2 − 3 = λ Resolvendo encontramos x = 1 e y = 2 (e λ = 9 mas isto na˜o sera´ usado aqui). De forma totalmente ana´loga obtemos, no lado horizontal inferior g(x, y) = y = −2 e 0 < x < 2 o ponto (1,−2). 2- Nos lados verticais tomamos g(x, y) = x =0 ou 2, conforme o caso. Tambe´m aplicando multiplicadores de lagrange obtemos { 3x2 − 3 = λ 3y2 − 3 = 0 Portanto os pontos candidatos nos segmentos verticais de fronteira sa˜o {(0, 1), (0,−1), (2, 1), (2,−1)}. Coletando todos os pontos obtidos temos os candidatos a extremos: J = {(0, 2), (0,−2), (2, 2), (2,−2), (1, 1), (1,−1), (1, 2), (1,−2), (0, 1), (0,−1), (2, 1), (2,−1)} . Calculando f(P ) para cada P ∈ J conclu´ımos enfim que existem 2 pontos de ma´ximo global (2,−1), (2, 2) com valor de ma´ximo 4, e dois pontos de mı´nimo global (1, 1), (1,−2) com valor de mı´nimo -4. Exemplo 9. Calcule o valor ma´ximo que f(x, y) = 2x+ y assume na regia˜o x2 + 4y2 ≤ 1. 7 Soluc¸a˜o. A regia˜o D = {(x, y) | x2+4y2 ≤ 1} e´ a regia˜o compacta limitada pela elipse que se obte´m trocando o “≤” por “=” na inequac¸a˜o acima. A func¸a˜o f e´ linear, portanto cont´ınua e diferencia´vel. Devemos buscar pontos cr´ıticos de f no interior de D e aplicar a condic¸a˜o de Lagrange para f na fronteira de D. Calculando ∇f obtemos ∇f(x,y) = (2, 1). Vemos que na˜o ha´ pontos cr´ıticos para f(x, y) em intD (e em nenhum lugar do plano). Enta˜o todos os pontos extremos de f em D ocorrem na fronteira ∂D. Esta e´ a curva de n´ıvel 1 da func¸a˜o g(x, y) = x2 +4y2. Como ∇g(x,y) = (2x, 8y), o multiplicador de Lagrange λ nos da´ ∇f = λ ∇g ⇒ { 2 = 2λx 1 = 8λy A primeira equac¸a˜o obriga tanto x como λ a serem diferentes de zero, em particular x = 1 λ . A segunda equac¸a˜o nos da´ y = 1 8λ . Agora usamos a equac¸a˜o da restric¸a˜o, que e´ a pro´pria curva de n´ıvel: x2 + 4y2 = 1 ⇒ ( 1 λ )2 + 4 ( 1 8λ )2 = 1 , resolvendo fornece λ = √ 17 4 ou λ = − √ 17 4 . Substituindo nos valores de x e y calculamos: 1- Para λ = √ 17 4 o ponto P1 = ( 4√ 17 , 1 2 √ 17 ). 2- Para λ = − √ 17 4 o ponto P2 = (− 4√17 ,− 12√17). Esses sa˜o os u´nicos pontos extremos de f em D. Os valores de f sa˜o f(P1) = √ 17 2 , f(P2) = − √ 17 2 . Logo o valor de ma´ximo de f em D e´ √ 17 2 . 4 Otimizac¸a˜o em dimensa˜o > 2 Com relac¸a˜o a` otimizac¸a˜o condicionada vamos admitir que f e´ sempre diferencia´vel, e V ⊂ U e´ o conjunto de n´ıvel c de uma func¸a˜o diferencia´vel g : U → R. Desejamos estudar extremos de f restrita a V . Note que tipicamente, V e´ uma variedade diferencia´vel de dimensa˜o m-1, que e´ subvariedade do espac¸o euclidiano, ao menos nos pontos onde ∇g 6= 0. Teorema 4.1 (Multiplicadores de Lagrange). Assuma que ∇gP 6= 0. Se P ∈ V e´ extremo local de f restrito a V enta˜o existe λ ∈ R tal que ∇fP = λ ∇gP . Para ilustrar esse u´ltimo teorema consideremos uma superf´ıcie de n´ıvel S ⊂ R3. Exemplo 10. Encontre os extremos globais de f(x, y, z) = x2 + y2 + z2 + 4xy + 6xz + 6yz restrito a` superf´ıcie da esfera unita´ria x2 + y2 + z2 = 1. Soluc¸a˜o. A esfera e´ a superf´ıcie de n´ıvel 1 de g(x, y, z) = x2 + y2 + z2. Aplicando a condic¸a˜o de Lagrange com ∇f = (2x+ 4y + 6z, 2y + 4x+ 6z, 2z + 6x+ 6y) e ∇g = (2x, 2y, 2z) obtemos ∇f = λ ∇g ⇒ (2− 2λ)x+ 4y + 6z = 0 4x+ (2− 2λ)y + 6z = 0 6x+ 6y + (2− 2λ)z = 0 Para cada λ ∈ R fixo o sistema de equac¸o˜es acima e´ linear em x,y e z. Por outro lado, buscamos uma soluc¸a˜o desse sistema que tambe´m satisfac¸a x2 + y2 + z2 = 1. Isso significa que procuramos soluc¸o˜es 8 na˜o triviais do sistema linear homogeˆneo. De acordo com a A´lgebra Linear, isso so´ e´ poss´ıvel se o determinante da matriz do sistema for zero, ou seja,∣∣∣∣∣∣ (2− 2λ) 4 6 4 (2− 2λ) 6 6 6 (2− 2λ) ∣∣∣∣∣∣ = −λ3 + 3λ2 + 19λ+ 15 = 0 . Por tentativas, achamos que λ = −1 e´ ra´ız do polinoˆmio acima. Fatorando em (λ + 1) obtemos as duas outras ra´ızes, −λ3 + 3λ2 + 19λ+ 15 = −(λ+ 1)(λ2 − 4λ− 15) = 0 ⇒ λ ∈ {−1, 2 + √ 19, 2− √ 19} . Para cada valor de λ encontramos agora os pontos (x, y, z) associados resolvendo diretamente o sistema linear (4). Para λ = −1. A soluc¸a˜o dos sistema e´ da forma (x,−x, 0). Substituindo em x2 + y2 + z2 = 1 obtemos os pontos P1 = ( 1√ 2 ,− 1√ 2 , 0) e P2 = (− 1√2 , 1√2 , 0). Para λ = 2 + √ 19. Obtemos pontos da forma (x, x, 6 1+ √ 19 x). Aplicando a restric¸a˜o novamente encontramos os pontos P3 = √ 19+ √ 19 2 √ 19 (1, 1, 6 1+ √ 19 ) e P4 = −P3. Para λ = 2−√19. Os pontos sa˜o da forma (x, x, 6 1− √ 19 x) e calculando x fica P5 = 3√ 2(19+ √ 19) (1, 1, 6 1− √ 19 ) e P6 = −P5. Agora devemos calcular todos os f(Pi), 1 ≤ i ≤ 6, e comparar. Obtemos que f(P3) = f(P4) = 2+ √ 19, f(P5) = f(P6) = 2− √ 19 e f(P1) = f(P2) = −1. Portanto os pontos de ma´ximo global sa˜o {P3, P4} e os pontos de mı´nimo global sa˜o {P5, P6}. Observac¸a˜o 4.2. A func¸a˜o f do exemplo acima e´ uma forma quadra´tica definida no espac¸o R3, que pode ser escrita comof(x, y, z) = (x, y, z) · A · (x, y, z)T , onde A3×3 e´ uma matriz sime´trica (qual ?). Vemos enta˜o que os pontos candidatos a serem extremos locais de f restrito a` esfera unita´ria sa˜o os autovetores da matriz A, e o valor de f nesses pontos sa˜o os respectivos autovalores. Esse fato se generaliza para matrizes sime´tricas n × n que definem formas quadra´ticas no espac¸o Rn, ou seja, podemos definir autovetor unita´rio de uma matriz sime´trica como sendo um ponto da esfera unita´ria ⊂ Rn que verifica a condic¸a˜o de Lagrange para a forma quadra´tica associada a`quela matriz. 9
Compartilhar