Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

<p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 1</p><p>Caṕıtulo 2.11 - Gradiente e hessiana</p><p>2.11.1 - Nova notação 2.11.4 - O gradiente e as curvas de ńıvel</p><p>2.11.2 - Gradiente e hessiana 2.11.5 - Interpretação econômica do gradiente</p><p>2.11.3 - Significado do gradiente</p><p>Vimos nos últimos dois caṕıtulos como calcular derivadas de primeira e de segunda ordens (de ordens</p><p>superiores, também) de funções de duas ou mais variáveis reais. Veremos agora como organizar essas derivadas,</p><p>em termos do vetor gradiente e da matriz hessiana, de um modo que será útil na maximização ou minimização</p><p>dessas funções. Veremos também o significado do vetor gradiente.</p><p>2.11.1 - Nova notação</p><p>Quando tratamos da derivada de funções de uma variável real, existem dois tipos de notação, usadas de</p><p>acordo com a comodidade e da preferência da pessoa que as usa: a notação de Leibniz,</p><p>df</p><p>dx</p><p>, e a notação de</p><p>Newton, f ′(x). A primeira enfatiza o fato da derivada ser um limite de uma taxa de variação e a segunda</p><p>ressalta o fato da derivada ser uma função. Até o momento, temos usado uma notação mais ao estilo de Leibniz</p><p>para derivadas parciais:</p><p>∂f</p><p>∂xi</p><p>. Veremos agora uma notação mais ao estilo de Newton.</p><p>Primeiro, não podemos utilizar a notação f(x), pois temos que especificar com relação a qual variável</p><p>estamos derivando. A solução é escrever</p><p>fx =</p><p>∂f</p><p>∂x</p><p>e fy =</p><p>∂f</p><p>∂y</p><p>.</p><p>Note que a notação utiliza um x como subscrito (letra menor, colocada um pouco abaixo da base da letra f)</p><p>para designar a derivada parcial com relação a x e um y subscrito para designar a derivada com relação a y.</p><p>Exemplo 1: calcule as derivadas parciais da função f(x, y) =</p><p>√</p><p>x3 − y2.</p><p>Solução: escrevendo f(x, y) = (x3 − y2)1/2, calculamos</p><p>fx =</p><p>1</p><p>2</p><p>(x3 − y2)−1/2 · 3x2 =</p><p>3x2</p><p>2</p><p>√</p><p>x3 − y2</p><p>e fy =</p><p>1</p><p>2</p><p>(x3 − y2)−1/2 · (−2y) =</p><p>−y</p><p>√</p><p>x3 − y2</p><p>.</p><p>Essa notação também é facilmente generalizada para o caso de funções com mais de duas variáveis, como</p><p>no exemplo a seguir.</p><p>Exemplo 2: calcule as derivadas parciais da função f(x, y, z) = 2x ln(y − z).</p><p>Solução: as derivadas parciais ficam</p><p>fx = 2x ln 2 ln(y − z) , fy =</p><p>2x</p><p>y − z</p><p>e fz =</p><p>−2x</p><p>y − z</p><p>.</p><p>A notação para derivadas parciais de segunda ordem é dada a seguir:</p><p>fxx = (fx)x =</p><p>∂2f</p><p>∂x2</p><p>, fxy = (fx)y =</p><p>∂2f</p><p>∂y∂x</p><p>, fyx = (fy)x =</p><p>∂2f</p><p>∂x∂y</p><p>, fyy = (fy)y =</p><p>∂2f</p><p>∂y2</p><p>.</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 2</p><p>Exemplo 3: calcule as derivadas parciais de segunda ordem da função f(x, y) =</p><p>√</p><p>x3 − y2.</p><p>Solução: utilizando as derivadas parciais calculadas no exemplo 1 escritas sob a forma de potências:</p><p>fx =</p><p>3</p><p>2</p><p>x2(x3 − y2)−1/2 e fy = −y(x3 − y2)−1/2 ,</p><p>temos</p><p>fxx =</p><p>3</p><p>2</p><p>· 2x · (x3 − y2)−1/2 +</p><p>3</p><p>2</p><p>x2 ·</p><p>(</p><p>−1</p><p>2</p><p>)</p><p>(x3 − y2)−3/2 · 3x2 = 3x(x3 − y2)−1/2 − 9</p><p>4</p><p>x2(x3 − y2)−3/2 ,</p><p>fxy = fyx =</p><p>3</p><p>2</p><p>x2 ·</p><p>(</p><p>−1</p><p>2</p><p>)</p><p>(x3 − y2)−3/2 · (−2y) =</p><p>3</p><p>2</p><p>x2y(x3 − y2)−3/2 ,</p><p>fyy = −1 · (x3 − y2)−1/2 − y ·</p><p>(</p><p>−1</p><p>2</p><p>)</p><p>(x3 − y2)−3/2 · (−2y) = −(x3 − y2)−1/2 − y2(x3 − y2)−3/2 .</p><p>A notação para as derivadas parciais de funções de mais de duas variáveis, ou a notação de derivadas parciais</p><p>de ordens superiores a dois, pode ser facilmente deduzida a partir dáı.</p><p>2.11.2 - Gradiente e hessiana</p><p>Agora introduziremos dois conceitos que nos serão úteis quando formos trabalhar em otimização: os de</p><p>gradiente e hessiana. O gradiente de uma função de duas variáveis reais é um vetor (matriz 2 × 1) definido</p><p>como</p><p>~∇f(x, y) =</p><p>(</p><p>fx</p><p>fy</p><p>)</p><p>,</p><p>e a hessiana é a matriz</p><p>H(f) =</p><p>(</p><p>fxx fxy</p><p>fyx fyy</p><p>)</p><p>.</p><p>Exemplo 1: calcule o gradiente e a hessiana da função f(x, y) = xy2 + 2x.</p><p>Solução: o gradiente e a hessiana ficam</p><p>~∇f(x, y) =</p><p>(</p><p>fx</p><p>fy</p><p>)</p><p>=</p><p>(</p><p>y2 + 2</p><p>2xy</p><p>)</p><p>, H(f) =</p><p>(</p><p>fxx fxy</p><p>fyx fyy</p><p>)</p><p>=</p><p>(</p><p>0 2y</p><p>2y 2x</p><p>)</p><p>.</p><p>Esses dois conceitos podem ser generalizados para funções de n variáveis reais, como veremos a seguir para</p><p>n = 3.</p><p>~∇f(x, y, z) =</p><p></p><p></p><p>fx</p><p>fy</p><p>fz</p><p></p><p> , H(f) =</p><p></p><p></p><p>fxx fxy fxz</p><p>fyx fyy fyz</p><p>fzx fzy fzz</p><p></p><p> .</p><p>Exemplo 2: calcule o gradiente e a hessiana da função f(x, y) = x ln(yz).</p><p>Solução: temos</p><p>~∇f(x, y, z) =</p><p></p><p></p><p>fx</p><p>fy</p><p>fz</p><p></p><p> =</p><p></p><p></p><p>ln(yz)</p><p>x/y</p><p>x/z</p><p></p><p> , H(f) =</p><p></p><p></p><p>fxx fxy fxz</p><p>fyx fyy fyz</p><p>fzx fzy fzz</p><p></p><p> =</p><p></p><p></p><p>0 1/y 1/z</p><p>1/y −x/y2 0</p><p>1/z 0 −x/z2</p><p></p><p> .</p><p>O gradiente e a hessiana podem ser calculados em pontos espećıficos, como mostra o exemplo a seguir.</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 3</p><p>Exemplo 3: calcule o gradiente e a hessiana da função f(x, y) = xy2 + 2x em (x, y) = (1,−1).</p><p>Solução: dados o gradiente e a hessiana calculados no exemplo 1, temos</p><p>~∇f(1,−1) =</p><p>(</p><p>(−1)2 + 2</p><p>2 · 1 · (−1)</p><p>)</p><p>=</p><p>(</p><p>3</p><p>−2</p><p>)</p><p>, H(f) =</p><p>(</p><p>0 2(−1)</p><p>2(−1) 2 · 1</p><p>)</p><p>=</p><p>(</p><p>0 −2</p><p>−2 2</p><p>)</p><p>.</p><p>Podemos nos perguntar, com toda a razão, quais são os significados do gradiente e da hessiana. A resposta</p><p>para o gradiente é dada a seguir. Para a hessiana, teremos que esperar mais um pouco.</p><p>2.11.3 - Significado do gradiente</p><p>O gradiente tem uma caracteŕıstica muito importante, que será mostrada nos exemplos a seguir.</p><p>Exemplo 1: calcule o gradiente de f(x, y) = x2 + y2 em (x, y) = (1, 0), (x, y) = (0, 1), (x, y) = (1, 1) e</p><p>(x, y) = (0, 0) e desenhe esses vetores sobre as curvas de ńıvel da função.</p><p>Solução: o gradiente de f(x, y) = x2 + y2 fica</p><p>~∇f(x, y) =</p><p>(</p><p>fx</p><p>fy</p><p>)</p><p>=</p><p>(</p><p>2x</p><p>2y</p><p>)</p><p>.</p><p>Calculado nos pontos desejados, temos</p><p>~∇f(1, 0) =</p><p>(</p><p>2</p><p>0</p><p>)</p><p>, ~∇f(0, 1) =</p><p>(</p><p>0</p><p>2</p><p>)</p><p>, ~∇f(1, 1) =</p><p>(</p><p>2</p><p>2</p><p>)</p><p>, ~∇f(0, 0) =</p><p>(</p><p>0</p><p>0</p><p>)</p><p>.</p><p>Note que cada gradiente é um vetor, onde a primeira linha é a sua primeira componente e a segunda linha é a</p><p>sua segunda componente. Por exemplo, ~∇f(1, 0) é um vetor que, a partir do ponto (1, 0), se desloca duas unidades</p><p>à direita; o vetor ~∇f(0, 1) se desloca duas unidades para cima a partir do ponto (0, 1). A seguir, representamos</p><p>cada um desses vetores sobre as curvas de ńıvel da função. A função em três dimensões (um parabolóide), com os</p><p>vetores gradientes, é mostrada na última figura a seguir.</p><p>x</p><p>y</p><p>−3 −2 −1 0 1 2 3</p><p>−3</p><p>−2</p><p>−1</p><p>1</p><p>2</p><p>3</p><p>b b x</p><p>y</p><p>−3 −2 −1 0 1 2 3</p><p>−3</p><p>−2</p><p>−1</p><p>1</p><p>2</p><p>3</p><p>b</p><p>b</p><p>x</p><p>y</p><p>−3 −2 −1 0 1 2 3</p><p>−3</p><p>−2</p><p>−1</p><p>1</p><p>2</p><p>3</p><p>b</p><p>b</p><p>x</p><p>y</p><p>−3 −2 −1 0 1 2 3</p><p>−3</p><p>−2</p><p>−1</p><p>1</p><p>2</p><p>3</p><p>bb</p><p>x y</p><p>z</p><p>1.0</p><p>2.0</p><p>3.0</p><p>-1.0</p><p>-2.0</p><p>-3.0</p><p>-4.0</p><p>1.0</p><p>2.0</p><p>3.0</p><p>-1.0</p><p>-2.0</p><p>-3.0</p><p>-4.0</p><p>1.0</p><p>2.0</p><p>3.0</p><p>4.0</p><p>b</p><p>b</p><p>b</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 4</p><p>Note que os vetores gradiente sempre idicam a direção onde a função aumenta mais rapidamente e que, no</p><p>ponto onde a função é mı́nima, o vetor gradiente se anula. Vamos verificar esse comportamento em uma outra</p><p>função.</p><p>Exemplo 2: calcule o gradiente de f(x, y) = 4 − x2 − y2 + 2x + y + xy em (x, y) = (1, 0), (x, y) = (0, 1),</p><p>(x, y) = (1, 1) e (x, y) = (0, 0) e desenhe esses vetores sobre as curvas de ńıvel da função.</p><p>Solução: o gradiente de f(x, y) = 4 − x2 − y2 + 2x + y + xy fica</p><p>~∇f(x, y) =</p><p>(</p><p>fx</p><p>fy</p><p>)</p><p>=</p><p>(</p><p>−2x + 2 + y</p><p>−2y + 1 + x</p><p>)</p><p>.</p><p>Calculado nos pontos desejados, temos</p><p>~∇f(1, 0) =</p><p>(</p><p>0</p><p>2</p><p>)</p><p>, ~∇f(0, 1) =</p><p>(</p><p>3</p><p>−1</p><p>)</p><p>, ~∇f(1, 1) =</p><p>(</p><p>1</p><p>0</p><p>)</p><p>, ~∇f(0, 0) =</p><p>(</p><p>2</p><p>1</p><p>)</p><p>.</p><p>A seguir, representamos cada um desses vetores sobre as curvas de ńıvel da função. A função em três dimensões</p><p>(um parabolóide eĺıptico), com os vetores gradientes é mostrada na última figura a seguir.</p><p>x</p><p>y</p><p>−2 −1 0 1 2 3 4 5</p><p>−2</p><p>−1</p><p>1</p><p>2</p><p>3</p><p>4</p><p>5</p><p>b</p><p>b x</p><p>y</p><p>−2 −1 0 1 2 3 4 5</p><p>−2</p><p>−1</p><p>1</p><p>2</p><p>3</p><p>4</p><p>5</p><p>b</p><p>b</p><p>x</p><p>y</p><p>−2 −1 0 1 2 3 4 5</p><p>−2</p><p>−1</p><p>1</p><p>2</p><p>3</p><p>4</p><p>5</p><p>b</p><p>b</p><p>x</p><p>y</p><p>−2 −1 0 1 2 3 4 5</p><p>−2</p><p>−1</p><p>1</p><p>2</p><p>3</p><p>4</p><p>5</p><p>b</p><p>b</p><p>x y</p><p>z</p><p>1.0</p><p>2.0</p><p>3.0</p><p>-1.0</p><p>-2.0</p><p>-3.0</p><p>-4.0</p><p>1.0</p><p>2.0</p><p>3.0</p><p>-1.0</p><p>-2.0</p><p>-3.0</p><p>-4.0</p><p>1.0</p><p>2.0</p><p>3.0</p><p>4.0</p><p>5.0</p><p>6.0</p><p>b</p><p>b</p><p>Como no exemplo 1, os vetores gradiente seguem sempre a direção para onde a função cresce mais rapida-</p><p>mente a partir do ponto dado. Outra caracteŕıstica é que o vetor gradiente em um determinado ponto sempre</p><p>segue uma reta perpendicular à curva de ńıvel naquele ponto.</p><p>Um exemplo pode facilitar a compreensão da utilidade do gradiente: consideremos um aplpinista mı́ope que</p><p>quer subri uma montanha. Ele só enxerga claramente até dois metros</p><p>de distância e não tem como enxergar</p><p>mais longe que isso. Como ele fará para subir a montanha?</p><p>Uma resposta é que ele pode, dentro de seu campo de visão, identificar para onde o terreno tem um</p><p>maior aclive (sobe mais rapidamente) e subir um pouco naquela direção e sentido. Depois, ele pára e verifica</p><p>novamente o terreno em torno de onde ele está. Segue novamente a direção para onde o terreno for mai ı́ngreme</p><p>e repete o processo até que o terreno não tenha mais para onde subir.</p><p>Essa tática pode ou não funcionar, pois o alpinista, caso não se defronte com algum abismo pelo caminho,</p><p>pode acabar chegando a um pico (máximo) local, achando que já chegou ao poco da montanha, quando ainda</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 5</p><p>está bem longe dela. A figura a seguir ilustra dois caminhos obtidos usando o gradiente como guia: no primeiro</p><p>caminho (em vermelho), chega-se ao topo do maior dos dois picos; no segundo (azul), chega-se apenas a um</p><p>máximo local.</p><p>Concluindo esta seção, o gradiente é um vetor que dá a direção de maior crescimento da função a partir</p><p>de um determinado ponto. Isto será muito útil na maximização ou minimização de uma função (a Leitura</p><p>Complementar 1.5.1 traz um método numérico utilizando o gradiente para determinar máximos e mı́nimos de</p><p>funções de diversas variáveis). A hessiana servirá mais tarde para verificar se um determinado ponto cŕıtico é</p><p>um máximo, um mı́nimo ou um ponto de inflexão (ponto se sela). A demonstração disto necessita do conceito</p><p>de derivada direcional e será feita em uma leitura complementar do Módulo 2 deste curso.</p><p>2.11.4 - O gradiente e as curvas de ńıvel</p><p>Algo que pode ser notado nas figuras dos exemplos da seção anterior é que o vetor gradiente é sempre</p><p>perpendicular à curva de ńıvel da qual ele parte. Isto será provado agora, utilizando a regra da cadeia,</p><p>aprendida no Caṕıtulo 2.8.</p><p>A regra da cadeia para uma função f(x, y), ou seja, uma função f : D(f) ⊂ R</p><p>2 → R, onde x = x(t) e</p><p>y = y(t), é dada por</p><p>df</p><p>dt</p><p>(t) =</p><p>∂f</p><p>∂x</p><p>(x, y)</p><p>dx</p><p>dt</p><p>(t) +</p><p>∂f</p><p>∂y</p><p>(x, y)</p><p>dy</p><p>dt</p><p>(t) .</p><p>Se considerarmos uma curva que seja a imagem de uma função vetorial γ (x(t), y(t)), podemos escrever f (γ(t))</p><p>e γ′(t) =</p><p>(</p><p>dx</p><p>dt</p><p>(t),</p><p>dy</p><p>dt</p><p>(t)</p><p>)</p><p>, de modo que a mesma expressão para a regra da cadeia possa ser escrita</p><p>df</p><p>dt</p><p>(γ(t)) =</p><p>〈</p><p>∇f (γ(t)) , γ′(t)</p><p>〉</p><p>,</p><p>isto porque 〈∇f (γ(t)) , γ′(t)〉, o produto interno do gradiente pela derivada da função vetorial γ(t), é dado por</p><p>〈</p><p>∇f (γ(t)) , γ′(t)</p><p>〉</p><p>=</p><p>〈(</p><p>∂f</p><p>∂x</p><p>(x, y),</p><p>∂f</p><p>∂y</p><p>(x, y)</p><p>)</p><p>,</p><p>(</p><p>dx</p><p>dt</p><p>(t),</p><p>dy</p><p>dt</p><p>(t)</p><p>)〉</p><p>=</p><p>∂f</p><p>∂x</p><p>(x, y)</p><p>dx</p><p>dt</p><p>(t) +</p><p>∂f</p><p>∂y</p><p>(x, y)</p><p>dy</p><p>dt</p><p>(t) .</p><p>Consideremos agora uma curva de ńıvel da função f(x, y), que pode ser dada pela equação f(x, y) =</p><p>f (γ(t)) = c, onde c é uma constante. Se derivarmos ambos os lados dessa expressão com relação a t, obtemos</p><p>f (γ(t)) = c ⇔ df</p><p>dt</p><p>(γ(t)) = 0 .</p><p>Substituindo agora a derivada da esquerda pela expressão compacta da regra da cadeia, ficamos com</p><p>〈</p><p>∇f (γ(t)) , γ′(t)</p><p>〉</p><p>= 0 ,</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 6</p><p>de modo que ∇f (γ(t)) é perpendicular ao vetor γ′(t).</p><p>Na figura ao lado, fazemos o gráfico de uma</p><p>curva de ńıvel e de um vetor γ′(t0), que é sem-</p><p>pre tangente a essa curva de ńıvel (de acordo com</p><p>o Caṕıtulo 1.6). Se o gradiente é perpendicular a</p><p>γ′(t0), então ele será perpendicular à curva de ńıvel</p><p>no ponto t0, que é o que queŕıamos demonstrar.</p><p>Esse resultado é, na verdade, bem geral, e pode</p><p>ser aplicado às superf́ıcies de ńıvel de funções de</p><p>três variáveis reais ou às hipersuperf́ıcies de ńıvel</p><p>de funções de mias de três variáveis. O vetor gradi-</p><p>ente será sempre perpendicular a essas superf́ıcies</p><p>ou hipersuperf́ıcies de ńıvel.</p><p>x</p><p>y</p><p>γ(t0)</p><p>γ′(t0)</p><p>∇f (x(t0), y(t0))</p><p>A demonstração de que o gradiente é o vetor que indica a direção e o sentido de maior crescimento de</p><p>uma função necessita do conceito de derivada direcional e não serrá feita no texto principal deste caṕıtulo.</p><p>Essa demonstração é feita na Leitura Complementar 2.11.1. Um método numérico de busca pelo máximo ou</p><p>mı́nimo local de uma função utilizando o gradiente é explicado na Leitura Complementar 2.11.2. A seção a</p><p>seguir mostra um significado econômico para o gradiente.</p><p>2.11.5 - Interpretação econômica do gradiente</p><p>O vetor gradiente pode ser aplicado em áreas econômicas e administrativas indicando que atitudes tomar</p><p>quando se quer aumentar o valor de uma função (como a produção, a utilidade ou o lucro) em diminúı-la (como</p><p>na diminuição de custos). Mais especificamente, no caso de uma função de produção P (K,L) em termos do</p><p>capital K investido e do trabalho L, o gradiente pode nos dar a proproção em que novos investimentos devem</p><p>ser feitos em cada uma dessas áreas, como mostra o exemplo a seguir.</p><p>Exemplo 1: um industrial tem que decidir onde investir R$ 100.000 e estima que a produção de sua empresa</p><p>possa ser modelada pela função P (K,L) = 1, 1K0,25L0,75, onde o capital investido K e o trabalho L são</p><p>medidos em milhões de reais. No momento, o capital investido é de 7 milhões de reais e o gasto em trabalho</p><p>é de 6 milhões de reais. Determine o quanto do dinheiro tem que ser usado em cada uma dessas áreas de</p><p>modo a maximizar a produção da empresa.</p><p>Solução: o vetor gradiente, calculado a partir do ponto (7, 6), correspondente ao ńıvel atual de investimento (7</p><p>milhões em capital e 6 milhões em trabalho) determina a “direção” de maior crescimento da produção. Portanto,</p><p>podemos começar calculando o gradiente da função nesse ponto:</p><p>~∇P (K, L) =</p><p>(</p><p>0, 275K−0,75L0,75</p><p>0, 825K0,25L−0,25</p><p>)</p><p>⇒ ~∇P (7, 6) =</p><p>(</p><p>0, 275 · 7−0,75 · 60,75</p><p>0, 825 · 70,25 · 6−0,25</p><p>)</p><p>≈</p><p>(</p><p>0, 245</p><p>0, 857</p><p>)</p><p>.</p><p>Portanto, de modo a aumentar a produção ao máximo, deve-se usar uma proporção de</p><p>0, 245</p><p>0, 857</p><p>entre o capital e</p><p>o trabalho. Escrevendo o dinheiro dispońıvel em termos de milhões de reais, isto significa que deve-se investir</p><p>IK =</p><p>0, 245</p><p>0, 245 + 0, 857</p><p>· 0, 1 ≈ 0, 022 , IL =</p><p>0, 857</p><p>0, 245 + 0, 857</p><p>· 0, 1 ≈ 0, 078 ,</p><p>isto é, deve-se investir R$ 22.000 em capital e deve-se gastar R$ 78.000 em trabalho.</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 7</p><p>Exemplo 2: considere que o industrial do exemplo anterior tenha investido R$ 22.000 em capital e tenha</p><p>gasto R$ 78.000 em trabalho. Agora ele tem mais R$ 100.000 para investir. Onde esse dinheiro deve ser</p><p>investido?</p><p>Solução: no momento, temos K = 7 + 0, 22 = 7, 22 e L = 6 + 0, 78 = 6, 78, medidos em milhões de reais. O vetor</p><p>gradiente já foi calculado no exemplo anterior, de modo que só temos que calculá-lo para K = 7, 22 e L = 6, 78:</p><p>~∇P (K, L) =</p><p>(</p><p>0, 275K−0,75L0,75</p><p>0, 825K0,25L−0,25</p><p>)</p><p>⇒ ~∇P (7, 22 , 6, 78) =</p><p>(</p><p>0, 275 · 7, 22−0,75 · 6, 780,75</p><p>0, 825 · 7, 220,25 · 6, 78−0,25</p><p>)</p><p>≈</p><p>(</p><p>0, 262</p><p>0, 838</p><p>)</p><p>.</p><p>Para aumentar a produção ao máximo, deve-se usar uma proporção de</p><p>0, 262</p><p>0, 838</p><p>entre o capital e o trabalho. Isto</p><p>significa que deve-se investir</p><p>IK =</p><p>0, 262</p><p>0, 262 + 0, 838</p><p>· 0, 1 ≈ 0, 024 , IL =</p><p>0, 838</p><p>0, 262 + 0, 838</p><p>· 0, 1 ≈ 0, 076 ,</p><p>isto é, deve-se investir R$ 24.000 em capital e deve-se gastar R$ 76.000 em trabalho.</p><p>Note que as proproções de quanto deve ser investido em capital ou trabalho mudam de acordo com o</p><p>ńıvel prévio de investimento. No segundo exemplo, o investimento em trabalho não foi tão grande quanto no</p><p>primeiro. Isto porque, de acordo com a função de produção escolhida, investimentos em capital e trabalho</p><p>trazem resultados cada vez menores em termos de produção conforme estes aumentam a patamares cada vez</p><p>maiores.</p><p>Terminamos esta exposição por aqui. Mais algumas aplicações do gradiente podem ser vistas na leitura</p><p>complementar deste caṕıtulo e nos exerćıcios. Aplicações para a matriz hessian serão vistas mais tarde.</p><p>Resumo</p><p>• Gradiente: o gradiente de uma função f(x, y) é o vetor</p><p>~∇f(x, y) =</p><p>(</p><p>fx</p><p>fy</p><p>)</p><p>O vetor gradiente, quando calculado em um ponto, dá a direção</p><p>de maior variação da função naquele</p><p>ponto e é perpendicular à curva de ńıvel no mesmo ponto.</p><p>• Hessiana: a hessiana de uma função f(x, y) é a matriz</p><p>H(f) =</p><p>(</p><p>fxx fxy</p><p>fyx fyy</p><p>)</p><p>.</p><p>• Significado do gradiente: o gradiente dá, a cada ponto do domı́nio de uma função, a direção de</p><p>maior crescimento da função a partir daquele ponto. Além disso, ele é sempre perpendicular à curva</p><p>de ńıvel no ponto onde é calculado.</p><p>Todas as definições podem ser generalizadas para funções de n variáveis reais.</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 8</p><p>Leitura Complementar 2.11.1 - Derivada direcional</p><p>e o vetor gradiente</p><p>Como já vimos antes, o gradiente dá as derivadas de uma função f com relação a suas variáveis. Mais</p><p>especificamente para uma f(x, y), ele fornece as derivadas parciais dessa função com relação às variáveis x e y.</p><p>Como as derivadas parciais representam uma aproximação das taxas de variação da função com relação a suas</p><p>variáveis, podemos escrever</p><p>~∇f(x, y) =</p><p>(</p><p>fx</p><p>fy</p><p>)</p><p>≈</p><p>(</p><p>∆f/∆x</p><p>∆f/∆y</p><p>)</p><p>=</p><p>(</p><p>[f(x + ∆x, y) − f(x, y)] /∆x</p><p>[f(x, y + ∆y) − f(x, y)] /∆y</p><p>)</p><p>.</p><p>Isto significa que o gradiente dá, aproximadamente, a variação da função f(x, y) em duas direções diferentes:</p><p>uma com relação ao eixo x e a outra com relação ao eixo y.</p><p>Mas e se quisermos saber como a função varia com relação a alguma outra direção? Como podemos medir</p><p>tal variação?</p><p>Voltemos, agora, ao exemplo prático de uma função de produção de Cobb-Douglas: P (K,L) = AKαL1−α.</p><p>Podemos calcular, usando derivadas parciais, boas aproximações para a produtividade marginal do capital,</p><p>dada pela taxa de variação de P com relação a K, e para a produtividade marginal do trabalho, dada pela</p><p>taxa de variação de P com relação a L, respectivamente dadas por</p><p>∆P</p><p>∆K</p><p>=</p><p>P (K + ∆K,L) − P (K,L)</p><p>∆K</p><p>≈ ∂P</p><p>∂K</p><p>e</p><p>∆P</p><p>∆L</p><p>=</p><p>P (K,L + ∆L) − P (K,L)</p><p>∆L</p><p>≈ ∂P</p><p>∂L</p><p>.</p><p>E se quisermos agora calcular a variação da produção quando fazemos uma variação ∆K no capital investido</p><p>e uma variação ∆L no gasto com o trabalho? Podemos escrever essa variação como</p><p>∆P = P (K + ∆K,L + ∆L) − P (K,L) .</p><p>O problema de como aproximar essa variação por meio de derivadas parciais é semelhante ao problema de</p><p>determinar a variação de uma função em uma determinada direção. A solução para isso é definir uma derivada</p><p>direcional.</p><p>a) A derivada direcional</p><p>A definição de uma derivada direcional é dada a seguir.</p><p>Definição 1 - Dada uma função f(x1, · · · , xn), a sua derivada direcional com relação a uma direção</p><p>dada pelo vetor u =</p><p>(</p><p>u1</p><p>u2</p><p>)</p><p>é definida como</p><p>Duf(x, y) = lim</p><p>h→0</p><p>f(x + hu1, y + hu2) − f(x, y)</p><p>h</p><p>,</p><p>quando esse limite existir.</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 9</p><p>Exemplo 1: calcule a derivada direcional de f(x, y) = x2 − xy + 4x + 8 na direção u =</p><p>(</p><p>2</p><p>1</p><p>)</p><p>.</p><p>Solução: pela definição 1, temos</p><p>Df (x, y) = lim</p><p>h→0</p><p>f(x + hu1, y + hu2) − f(x, y)</p><p>h</p><p>=</p><p>= lim</p><p>h→0</p><p>(x + 2h)2 − (x + 2h)(y + h) + 4(x + 2h) + 8 − x2 + xy − 4x − 8</p><p>h</p><p>=</p><p>= lim</p><p>h→0</p><p>x2 + 4hx + 4h2 − xy − hx − 2hy − 2h2 + 4x + 8h − x2 + xy − 4x</p><p>h</p><p>=</p><p>= lim</p><p>h→0</p><p>3hx + 2h2 − 2hy + 8h</p><p>h</p><p>= lim</p><p>h→0</p><p>(3x + 2h − 2y + 8) = 3x − 2y + 8 .</p><p>Uma forma mais simples de se calcular uma derivada direcional é dada pelo teorema a seguir.</p><p>Teorema 5 - Dada uma função f(x, y) diferenciável em x e em y e um vetor u =</p><p>(</p><p>u1</p><p>u2</p><p>)</p><p>, então</p><p>Duf(x, y) = fx(x, y)u1 + fy(x, y)u2 .</p><p>Demonstração: considere a derivada direcional Duf(x, y) = lim</p><p>h→0</p><p>f(x + hu1, x + hu2) − f(x, y)</p><p>h</p><p>. Se definirmos a</p><p>função g(x) = f(x + hu1, y + hu2), então teremos</p><p>g′(0) = lim</p><p>h→0</p><p>g(h) − g(0)</p><p>h</p><p>= lim</p><p>h→0</p><p>f(x + hu1, y + hu2) − f(x, y)</p><p>h</p><p>= Du(x, y) .</p><p>Escrevendo agora x̄ = x + hu1 e ȳ = y + hu2, temos g(h) = f(x̄, ȳ) e, pela regra da cadeia,</p><p>g′(h) =</p><p>dg</p><p>dh</p><p>= fx̄(x̄, ȳ)</p><p>dx̄</p><p>dh</p><p>+ fȳ(x̄, ȳ)</p><p>dȳ</p><p>dh</p><p>= fx̄u1 + fȳu2 .</p><p>Para h = 0, teremos x̄ = x, ȳ = y e</p><p>g′(0) = fx(x, y)u1 + fy(x, y)u2 .</p><p>Comparando agora as duas expressões para g′(0), conclúımos que</p><p>Du(x, y) = fx(x, y)u1 + fy(x, y)u2 .</p><p>Exemplo 2: calcule a derivada direcional de f(x, y) = x2 − xy + 4x + 8 na direção u =</p><p>(</p><p>2</p><p>1</p><p>)</p><p>.</p><p>Solução: pelo teorema 1, temos</p><p>Df(x, y) = fxu1 + fyu2 = (2x − y + 4) · 2 + (−x) · 1 = 4x − 2y + 8 − x = 3x − 2y + 8 .</p><p>Exemplo 3: calcule a derivada direcional de f(x, y) = ln(x3 − y) na direção u =</p><p>(</p><p>−1</p><p>2</p><p>)</p><p>.</p><p>Solução: pelo teorema 1, temos</p><p>Df(x, y) = fxu1 + fyu2 =</p><p>1</p><p>x3 − y</p><p>· 3x2 · (−1) +</p><p>1</p><p>x3 − y</p><p>· (−1) · 2 =</p><p>−3x2</p><p>x3 − y</p><p>− 2</p><p>x3 − y</p><p>=</p><p>−3x2 − 2</p><p>x3 − y</p><p>.</p><p>O exemplo a seguir mostra os cálculos das derivadas direcionais de uma função a partir de um ponto ao</p><p>longo de três vetores distintos.</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 10</p><p>Exemplo 4: calcule a derivada direcional de f(x, y) = x2 + y2 − 4x + 2y + 2xy no ponto (3, 1) ao longo dos</p><p>vetores u =</p><p>(</p><p>1</p><p>2</p><p>)</p><p>, v =</p><p>(</p><p>1</p><p>1</p><p>)</p><p>e w =</p><p>(</p><p>1</p><p>0</p><p>)</p><p>.</p><p>Solução: primeiro, calculamos fx e fy: fx = 2x − 4 + 2y e fy = 2y + 2 + 2x.</p><p>Calculadas no ponto (3, 1), temos fx(3, 1) = 2·3−4+2·1 = 6−4+2 = 4 e fy(3, 1) = 2·1+2+2·3 = 2+2+6 = 10.</p><p>Agora, fica fácil calcular as derivadas direcionais pedidas:</p><p>Duf(3, 1) = 4 · 1 + 10 · 2 = 24 , Dv(3, 1) = 4 · 1 + 10 · 1 = 14 , Dw(3, 1) = 4 · 1 + 10 · 0 = 4 .</p><p>b) Derivada direcional e o vetor gradiente</p><p>O conceito de derivada direcional serve, ainda, para provar que o vetor gradiente indica a direção de maior</p><p>crescimento de uma função. A demonstração parte do fato de que, usando o vetor gradiente, podemos definir</p><p>a derivada direcional de forma matricial:</p><p>Duf =</p><p>(</p><p>u1 u2</p><p>)</p><p>(</p><p>fx</p><p>fy</p><p>)</p><p>.</p><p>No entanto, a demonstração envolve o conceito de produto escalar entre vetores, que é aprendido em cursos de</p><p>álgebra vetorial e será visto aqui de modo pragmático.</p><p>Podemos definir o produto escalar entre dois vetores u e v, escrito u · v, de duas formas distintas:</p><p>u · v = tr (vtu) ,</p><p>onde vt é a transposta do vetor v e v é o traço (soma dos elementos da diagonal principal de uma matriz), ou</p><p>u · v = |u||v| cos θ ,</p><p>onde |u| e |v| são os módulos dos vetores u e v, respectivamente, e θ é o ângulo entre esses dois vetores.</p><p>Cada uma dessas definições é útil, dependendo da forma como os dados do problema são fornecidos, como</p><p>mostram os dois exemplos a seguir.</p><p>Exemplo 1: calcule u · v, onde u =</p><p>(</p><p>−1</p><p>4</p><p>)</p><p>e v =</p><p>(</p><p>2</p><p>1</p><p>)</p><p>.</p><p>Solução: u · v = tr (vtu) = tr</p><p>(</p><p>2 1</p><p>)</p><p>(</p><p>−1</p><p>4</p><p>)</p><p>= tr (2) = 2 .</p><p>Exemplo 2: calcule u · v, onde |u| = 2, |v| = 3 e o ângulo entre eles é θ = 60o.</p><p>Solução: u · v = |u||v| cos θ = 2 · 3 · cos 60o = 6 · 1</p><p>2</p><p>= 3 .</p><p>De acordo com a primeira definição de produto escalar, podemos escrever a definição da derivada direcional</p><p>como</p><p>Duf =</p><p>(</p><p>u1 u2</p><p>)</p><p>(</p><p>fx</p><p>fy</p><p>)</p><p>= tr</p><p>(</p><p>~∇f · u</p><p>)</p><p>,</p><p>onde ~∇f =</p><p>(</p><p>fx</p><p>fy</p><p>)</p><p>e u =</p><p>(</p><p>u1</p><p>u2</p><p>)</p><p>. Alternativamente, podeŕıamos escrever essa mesma definição do seguinte</p><p>modo:</p><p>Duf = |~∇f ||u| cos θ ,</p><p>onde θ é o ângulo entre o vetor gradiente e o vetor u.</p><p>Da segunda definição, podemos ver que a derivada direcional é maior quando cos θ é maior. O valor máximo</p><p>que cos θ pode ter é 1, o que ocorre quando θ = 0o. Portanto, o vetor gradiente e o vetor u devem ter a mesma</p><p>direção e sentido se quisermos maximizar a derivada direcional Duf . Dáı, conclui-se que a direção e o sentido</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 11</p><p>de maior valor da derivada direcional Duf , que é a direção e o sentido de maior crescimento da função f , é ao</p><p>longo do gradiente.</p><p>Teorema 6 - Dada uma função f(x, y) diferenciável em x e em y e um vetor u =</p><p>(</p><p>u1</p><p>u2</p><p>)</p><p>, então</p><p>Duf(x, y) é máxima se u = ~∇f(x, y).</p><p>Exemplo 3: determine a direção de maior crescimento da função f(x, y) = 3x ln y no ponto (2, 1).</p><p>Solução: a direção de maior cresciment é dada pelo vetor gradiente nesse ponto, isto é,</p><p>~∇f(x, y) =</p><p>(</p><p>fx</p><p>fy</p><p>)</p><p>=</p><p>(</p><p>3 ln y</p><p>3x/y</p><p>)</p><p>, de modo que ~∇f(2, 1) =</p><p>(</p><p>3 · ln 1</p><p>3 · 2/1</p><p>)</p><p>=</p><p>(</p><p>0</p><p>6</p><p>)</p><p>.</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 12</p><p>Leitura Complementar</p><p>2.11.2 - Método de busca por</p><p>gradiente</p><p>Veremos agora um método bastante eficiente para encontrar máximos e mı́nimos de funções envolvendo</p><p>mais de uma variável real. Esse método é baseado no fato do gradiente sempre apontar a direção e o sentido</p><p>de maior crescimento de uma função a cada ponto do domı́nio desta. Faremos esse estudo por meio de alguns</p><p>exemplos. A teoria será exposta conforme a necessidade de cada exemplo.</p><p>Problema 1: Mı́nimo de uma parabolóide</p><p>Comecemos com um problema bem simples, que é determinar o ponto mı́nimo do parabolóide dado pela</p><p>função f(x, y) = x2 + y2 partindo do ponto (1, 1).</p><p>O método de busca por gradiente segue o seguinte algoritmo:</p><p>• Calcula-se o gradiente ~∇f(x, y).</p><p>• Escolhe-se um ponto inicial ~x0 pertencente ao domı́nio da função.</p><p>• A partir desse ponto, calculamos o próximo ponto ~x1, dado por</p><p>~x1 = ~x0 + λ~∇f(~x0) ,</p><p>onde o vetor gradiente dá a direção de maior variação da função e λ é um parâmetro que indica o sentido a ser</p><p>seguido e o módulo da variação a ser feita.</p><p>• Determina-se o valor de λ que maximiza ou minimiza a função objetivo, dependendo do problema ser um de</p><p>maximização ou de minimização.</p><p>• Calcula-se ~x1 usando o valor de λ determinado anteriormente. Se |~x1 − ~x0| < ǫ, onde ǫ é um parâmetro dado</p><p>pelo problema que indica qual o grau de precisão desejado, então o problema termina por áı. Senão, repete-se</p><p>todo o processo.</p><p>Apliquemos esse procedimento ao problema em questão. Primeiro, calculamos o gradiente da função f(x, y):</p><p>~∇f(x, y) =</p><p></p><p></p><p></p><p>∂f</p><p>∂x</p><p>∂f</p><p>∂y</p><p></p><p></p><p></p><p>=</p><p>(</p><p>2x</p><p>2y</p><p>)</p><p>.</p><p>O ponto inicial já foi escolhido pelo problema: ~x0 =</p><p>(</p><p>1</p><p>1</p><p>)</p><p>. Calculando o gradiente, temos</p><p>~∇f(~x0) =</p><p>(</p><p>2 · 1</p><p>2 · 1</p><p>)</p><p>=</p><p>(</p><p>2</p><p>2</p><p>)</p><p>.</p><p>Determinamos então um novo ponto ~x1:</p><p>~x1 = ~x0 + λ~∇f(~x0) =</p><p>(</p><p>1</p><p>1</p><p>)</p><p>+ λ</p><p>(</p><p>2</p><p>2</p><p>)</p><p>=</p><p>(</p><p>1 + 2λ</p><p>1 + 2λ</p><p>)</p><p>.</p><p>Substituindo esse ponto na função objetivo, temos</p><p>f(~x1) = (1 + 2λ)2 + (1 + 2λ)2 = 1 + 4λ + λ2 + 1 + 4λ + λ2 = 2 + 8λ + 8λ2 .</p><p>Note que a função só depende agora do parâmetro λ, de modo que podemos escrevê-la como</p><p>f(λ) = 2 + 8λ + 8λ2 .</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 13</p><p>Essa função tem um ponto cŕıtico quando</p><p>f ′(λ) = 0 ⇔ 8 + 16λ = 0 ⇔ 16λ = −8 ⇔ λ = −1</p><p>2</p><p>.</p><p>Para determinamos se esse ponto cŕıtico é um mı́nimo da função, calculamos a segunda derivada desta:</p><p>f ′′(x) = 16 .</p><p>Como esse valor é positivo, a concavidade da função é sempre para cima e λ = −1</p><p>2 é um ponto de mı́nimo.</p><p>Substituindo o valor de λ encontrado, temos</p><p>~x1 =</p><p></p><p></p><p>1 + 2 ·</p><p>(</p><p>−1</p><p>2</p><p>)</p><p>1 + 2 ·</p><p>(</p><p>−1</p><p>2</p><p>)</p><p></p><p> =</p><p>(</p><p>0</p><p>0</p><p>)</p><p>.</p><p>O gradiente de ~x1 fica, então,</p><p>~∇f(~x1) =</p><p>(</p><p>2 · 0</p><p>2 · 0</p><p>)</p><p>=</p><p>(</p><p>0</p><p>0</p><p>)</p><p>.</p><p>O fato do vetor gradiente ser nulo indica que atingimos a solução ótima. Se quiséssemos calcular um novo</p><p>ponto ~x2, teŕıamos</p><p>~x1 = ~x1 + λ~∇f(~x1) =</p><p>(</p><p>0</p><p>0</p><p>)</p><p>+ λ</p><p>(</p><p>0</p><p>0</p><p>)</p><p>=</p><p>(</p><p>0</p><p>0</p><p>)</p><p>= ~x1 .</p><p>Portanto, não há mais como melhorar a solução e o ponto que minimiza a função é ~x1 =</p><p>(</p><p>0</p><p>0</p><p>)</p><p>.</p><p>Problema 2: Função exponencial</p><p>Vamos usar o método de busca por gradiente para maximizar a função f(x, y) = 12e−(x+4)2−y2</p><p>. Começamos</p><p>calculando o gradiente da função f(x, y):</p><p>~∇f(x, y) =</p><p></p><p></p><p></p><p>∂f</p><p>∂x</p><p>∂f</p><p>∂y</p><p></p><p></p><p></p><p>.</p><p>As derivadas parciais são dadas por</p><p>∂f</p><p>∂x</p><p>= 12 e−(x+4)2−y2 · [−2(x + 4)] = −24(x + 4) e−(x+4)2−y2</p><p>,</p><p>∂f</p><p>∂y</p><p>= 12 e−(x+4)2−y2 · (−2y) = −24y e−(x+4)2−y2</p><p>,</p><p>de modo que o gradiente fica</p><p>~∇f(x, y) =</p><p></p><p></p><p>−24(x + 4) e−(x+4)2−y2</p><p>−24y e−(x+4)2−y2</p><p></p><p> .</p><p>Escolhamos o ponto inicial como sendo: ~x0 =</p><p>(</p><p>0</p><p>0</p><p>)</p><p>. Calculando o gradiente, temos</p><p>~∇f(~x0) =</p><p></p><p></p><p>−24(0 + 4) e−(0+4)2−02</p><p>−24 · 0 · e−(0+4)2−02</p><p></p><p> =</p><p>(</p><p>−96 e−16</p><p>0</p><p>)</p><p>.</p><p>Determinamos então um novo ponto ~x1:</p><p>~x1 = ~x0 + λ~∇f(~x0) =</p><p>(</p><p>0</p><p>0</p><p>)</p><p>+ λ</p><p>(</p><p>−96 e−16</p><p>0</p><p>)</p><p>=</p><p>(</p><p>−96 e−16λ</p><p>0</p><p>)</p><p>.</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 14</p><p>Substituindo esse ponto na função objetivo, temos</p><p>f(~x1) = 12 e−(−96 e−16λ+4)2−02</p><p>= 12 e−(−96 e−16λ+4)2 .</p><p>A função agora só dependedo parâmetro λ, de modo que podemos escrevê-la como</p><p>f(λ) = 12 e−(−96 e−16λ+4)2 .</p><p>Derivando a função com relação a λ, temos</p><p>f ′(λ) = 12 e−(−96 e−16λ+4)2 ·</p><p>[</p><p>−2(−96 e−16λ + 4)(−96 e−16</p><p>]</p><p>= 2304 e−16(−96 e−16λ + 4) e−(−96 e−16λ+4)2 .</p><p>Essa função tem um ponto cŕıtico quando</p><p>f ′(λ) = 0 ⇔ 2304 e−16(−96 e−16λ + 4) e−(−96 e−16λ+4)2 = 0 ⇔ −96 e−16λ + 4 = 0 ⇔ 96 e−16λ = 4 ⇔</p><p>⇔ λ =</p><p>1</p><p>24</p><p>e16 .</p><p>Para determinamos se esse ponto cŕıtico é um mı́nimo da função, calculamos a segunda derivada desta:</p><p>f ′′(x) = 2304 e−16(−96 e−16) e−(−96 e−16λ+4)2 + 2304 e−16(−96 e−16λ + 4) e−(−96 e−16λ+4)2 ·</p><p>·</p><p>[</p><p>−2(−96 e−16λ + 4)(−96 e−16</p><p>]</p><p>=</p><p>= −221184 e−32 e−(−96 e−16λ+4)2 + 442368 e−32(−96 e−16λ + 4)2 e−(−96 e−16λ+4)2 .</p><p>Substituindo o valor de λ encontrado, temos</p><p>f ′′</p><p>(</p><p>e16</p><p>24</p><p>)</p><p>= −221184 e−32 e</p><p>−</p><p>(</p><p>−96 e−16 e</p><p>16</p><p>24</p><p>+4</p><p>)2</p><p>+ 442368 e−32</p><p>(</p><p>−96 e−16 e16</p><p>24</p><p>+ 4</p><p>)2</p><p>e</p><p>−</p><p>(</p><p>−96 e−16 e</p><p>16</p><p>24</p><p>+4</p><p>)2</p><p>=</p><p>= −221184 e−32 e−(−4+4)2 + 442368 e−32(−4 + 4)2 e−(−4+4)2 =</p><p>= −221184 e−32 e0 + 442368 e−32 · 0 · e0 = −221184 e−32 .</p><p>Como esse valor é negativo, a concavidade da função nesse ponto é para baixo e λ = e16</p><p>4 é um ponto de máximo.</p><p>Substituindo o valor de λ encontrado, temos</p><p>~x1 =</p><p>(</p><p>−96 e−16 e16</p><p>24</p><p>0</p><p>)</p><p>=</p><p>(</p><p>−4</p><p>0</p><p>)</p><p>.</p><p>Calculando o gradiente para esse ponto, temos</p><p>~∇f(~x1) =</p><p></p><p></p><p>−24(−4 + 4) e−(−4+4)2−02</p><p>−24 · 0 · e−(−4+4)2−02</p><p></p><p> =</p><p>(</p><p>0</p><p>0</p><p>)</p><p>.</p><p>Como o gradiente é nulo, ~x1 corresponde ao máximo da função f(x, y).</p><p>Problema 4: Localização de um armazém</p><p>Vamos, agora, resolver um problema mais prático envolvendo a minimização de uma função. Um novo</p><p>armazém de uma indústria de pesticidas deve ser instalado na região que compreende as cidades de Besourinhos,</p><p>Formigas e Cupinzal. A cidade de Besourinhos tem 400.000 habitantes; a cidade de Formigas, localizada 20</p><p>km a leste de Besourinhos, tem uma população de 250.000; a cidade de Cupinzal tem 140.000 habitantes e fica</p><p>a 10 km a leste de Besourinhos e a 100 km ao norte dessa cidade.</p><p>a) Formule um problema de pesquisa operacional que minimize as distâncias do novo armazém às três cidades</p><p>que serão servidas por ele.</p><p>b) Resolva esse problema usando busca por gradiente.</p><p>c) Modifique o problema anterior de modo que a função-objetivo seja proporcional à população de cada cidade.</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 15</p><p>d) Resolva o problema modificado usando busca por gradiente.</p><p>Solução:</p><p>a) O problema consiste em determinar onde deve ser constrúıdo um armazém que sirva às três cidades indicadas</p><p>de modo a minimizar a distância deste às cidades. Podemos localizar as cidades em um eixo cartesiano</p><p>de coordenadas estabelecendo Besourinhos na origem (0, 0), a cidade formigas no ponto (20, 0) e a cidade de</p><p>Cupinzal em (10, 10). No gráfico indicamos coordenadas arbitrárias para a localização do armazém que deverão</p><p>ser determinadas pelo problema.</p><p>x</p><p>y</p><p>0</p><p>10 20</p><p>10</p><p>b b</p><p>b</p><p>B F</p><p>C</p><p>b (x, y)</p><p>As variáveis de decisão do problema são (x, y) =coordenadas do armazém. A função-objetivo é minimizar a</p><p>soma das distâncias do armazém aos três centros urbanos. As distâncias do armazém até Besourinhos, Formigas</p><p>e Cupinzal são dadas, respectivamente, por</p><p>dB =</p><p>√</p><p>(x − 0)2 + (y − 0)2 =</p><p>√</p><p>x2 + y2 ,</p><p>dF =</p><p>√</p><p>(x − 20)2 + (y − 0)2 =</p><p>√</p><p>(x − 20)2 + y2 ,</p><p>dC =</p><p>√</p><p>(x − 10)2 + (y − 10)2 .</p><p>Portanto, o problema fica</p><p>min d(x, y) =</p><p>√</p><p>x2 + y2 +</p><p>√</p><p>(x − 20)2 + y2 +</p><p>√</p><p>(x − 10)2 + (y − 10)2 .</p><p>O problema não tem restrições, pois as variáveis x e y podem assumir quaisquer valores reais.</p><p>b) Para resolver o problema por meio de busca por gradiente, precisamos calcular as derivadas parciais dx e dy</p><p>da função-objetivo:</p><p>dx =</p><p>∂d</p><p>∂x</p><p>=</p><p>1</p><p>2</p><p>(x2 + y2)−1/2 · 2x +</p><p>1</p><p>2</p><p>[</p><p>(x − 20)2 + y2</p><p>]−1/2 · 2(x − 20) +</p><p>+</p><p>1</p><p>2</p><p>[</p><p>(x − 10)2 + (y − 10)2</p><p>]−1/2 · 2(x − 10) =</p><p>= x(x2 + y2)−1/2 + (x − 20)</p><p>[</p><p>(x − 20)2 + y2</p><p>]−1/2</p><p>+ (x − 10)</p><p>[</p><p>(x − 10)2 + (y − 10)2</p><p>]−1/2</p><p>,</p><p>dy =</p><p>∂d</p><p>∂y</p><p>=</p><p>1</p><p>2</p><p>(x2 + y2)−1/2 · 2y +</p><p>1</p><p>2</p><p>[</p><p>(x − 20)2 + y2</p><p>]−1/2 · 2y +</p><p>1</p><p>2</p><p>[</p><p>(x − 10)2 + (y − 10)2</p><p>]−1/2 · 2(y − 10) =</p><p>= y(x2 + y2)−1/2 + y</p><p>[</p><p>(x − 20)2 + y2</p><p>]−1/2</p><p>+ (y − 10)</p><p>[</p><p>(x − 10)2 + (y − 10)2</p><p>]−1/2</p><p>.</p><p>O gradiente fica</p><p>~∇d(x, y) =</p><p>(</p><p>dx</p><p>dy</p><p>)</p><p>,</p><p>onde dx e dy são dados pelas equações anteriores.</p><p>Para iniciarmos a busca, escolheremos um ponto inicial apropriado. Quanto mais próximo do ponto ótimo</p><p>estiver esse ponto inicial, melhores serão as chances da busca terminar logo. Observando o gráfico que mostra</p><p>as posições das cidades, vemos que elas são simétricas com relação a x = 10. Portanto, podemos partir, por</p><p>exemplo, do ponto ~x0 =</p><p>(</p><p>10</p><p>0</p><p>)</p><p>. Calculando o gradiente, temos</p><p>~∇d(~x0) =</p><p>(</p><p>0</p><p>−1</p><p>)</p><p>.</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 16</p><p>Determinamos então um novo ponto ~x1:</p><p>~x1 = ~x0 + λ~∇d(~x0) =</p><p>(</p><p>10</p><p>0</p><p>)</p><p>+ λ</p><p>(</p><p>0</p><p>−1</p><p>)</p><p>=</p><p>(</p><p>10</p><p>−λ</p><p>)</p><p>.</p><p>Substituindo esse ponto na função objetivo, temos</p><p>d(~x1) =</p><p>√</p><p>102 + (−λ)2 +</p><p>√</p><p>(10 − 20)2 + (−λ)2 +</p><p>√</p><p>(10 − 10)2 + (−λ − 10)2 =</p><p>=</p><p>√</p><p>100 + λ2 +</p><p>√</p><p>100 + λ2 +</p><p>√</p><p>(λ + 10)2 = 2</p><p>√</p><p>100 + λ2 + |λ + 10| = d(λ) .</p><p>A presença do módulo mostra que, à direita ou à esquerda do ponto λ + 10 = 0 ⇔ λ = −10, podemos escrever</p><p>essa função como</p><p>d(λ) =</p><p>{</p><p>2</p><p>√</p><p>100 + λ2 − λ − 10 , λ < −10 ;</p><p>2</p><p>√</p><p>100 + λ2 + λ + 10 , λ ≥ −10 .</p><p>Para λ < −10 a derivada dessa função fica</p><p>d′(λ) = 2 · 1</p><p>2</p><p>(100 + λ2)−1/2 · 2λ − 1 = 2λ(100 + λ2)−1/2 − 1 .</p><p>Para λ > −10, temos</p><p>d′(λ) = 2 · 1</p><p>2</p><p>(100 + λ2)−1/2 · 2λ + 1 = 2λ(100 + λ2)−1/2 + 1 .</p><p>Note que a derivada não é definida em λ = −10.</p><p>Essa função tem pontos cŕıticos quando d′(λ) = 0 ou quando d′(λ) não existe. Portanto, ela tem um ponto</p><p>cŕıtico em λ = −10, que é onde ela não é definida. Para λ < −10, temos</p><p>d′(λ) = 0 ⇔ 2λ(100 + λ2)−1/2 − 1 = 0 ⇔ 2λ(100 + λ2)−1/2 = 1 ⇔ 2λ = (100 + λ2)1/2 ⇔</p><p>⇔ 4λ2 =</p><p>∣</p><p>∣100 + λ2</p><p>∣</p><p>∣⇔ 4λ2 = 100 + λ2 ⇔ 3λ2 = 100 ⇔ λ2 =</p><p>100</p><p>3</p><p>⇔ λ = ± 10√</p><p>3</p><p>.</p><p>Só que tanto λ = − 10√</p><p>3</p><p>quanto λ = 10√</p><p>3</p><p>são maiores que −10, o que indica que para λ < −10 não há pontos</p><p>cŕıticos. Para λ > −10,</p><p>d′(λ) = 0 ⇔ 2λ(100 + λ2)−1/2 + 1 = 0 ⇔ 2λ(100 + λ2)−1/2 = −1 ⇔ 2λ = −(100 + λ2)1/2 ⇔</p><p>⇔ 4λ2 =</p><p>∣</p><p>∣100 + λ2</p><p>∣</p><p>∣⇔ 4λ2 = 100 + λ2 ⇔ 3λ2 = 100 ⇔ λ2 =</p><p>100</p><p>3</p><p>⇔ λ = ± 10√</p><p>3</p><p>.</p><p>No entanto,</p><p>d′</p><p>(</p><p>− 10√</p><p>3</p><p>)</p><p>= 0 , d′</p><p>(</p><p>10√</p><p>3</p><p>)</p><p>= 2 ,</p><p>o que mostra que λ = 10√</p><p>3</p><p>não é um ponto cŕıtico. Portanto, os pontos cŕıticos da função d(x, y) são dados por</p><p>λ = −10 e λ = − 10√</p><p>3</p><p>.</p><p>Para determinamos se algum desses pontos cŕıticos são um mı́nimo da função, calculamos a segunda derivada</p><p>desta. Para λ > −10, que é o único caso (fora λ = −10) onde ocorrem pontos cŕıticos, temos</p><p>d′′(λ) = 2(100 + λ2)−1/2 + 2</p><p>(</p><p>−1</p><p>2</p><p>)</p><p>(100 + λ2)−3/2 · 2λ = 2(100 + λ2)−1/2 − 2λ(100 + λ2)−3/2 .</p><p>Substituindo λ = − 10√</p><p>3</p><p>, temos</p><p>d′′</p><p>(</p><p>− 10√</p><p>3</p><p>)</p><p>≈ 0, 104 .</p><p>Portanto, λ = − 10√</p><p>3</p><p>é um ponto de mı́nimo.</p><p>Resta ainda analisar o ponto λ = −10, que não pode ser analisado usando derivadas. Tomando valores</p><p>próximos a ele, vemos que d(−10, 1) ≈ 28, 526 e d(−9, 9) ≈ 28, 243. Já que d(−10) = 28, 284, este não é um</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 17</p><p>ponto de mı́nimo nem de máximo da função, mas apenas uma cúspide. Conclúımos, então, que λ = − 10√</p><p>3</p><p>é o</p><p>único ponto de mı́nimo da função d(λ). Para que visualizemos melhor a situação, segue um gráfico da função</p><p>d(λ).</p><p>λ</p><p>d(λ)</p><p>−15 −10 −5 5</p><p>0</p><p>5</p><p>10</p><p>15</p><p>20</p><p>25</p><p>30</p><p>35</p><p>40</p><p>45</p><p>Substituindo o valor de λ encontrado, temos</p><p>~x1 =</p><p>(</p><p>10</p><p>10√</p><p>3</p><p>)</p><p>.</p><p>O gradiente de ~x1 fica, então,</p><p>~∇d(~x0) =</p><p>(</p><p>0</p><p>0</p><p>)</p><p>=</p><p>(</p><p>0</p><p>0</p><p>)</p><p>.</p><p>O fato do vetor gradiente ser nulo indica que atingimos a solução ótima. Portanto, não há mais como melhorar</p><p>a solução e o ponto que minimiza a função é</p><p>~x1 =</p><p>(</p><p>0</p><p>10√</p><p>3</p><p>)</p><p>≈</p><p>(</p><p>0</p><p>5, 774</p><p>)</p><p>.</p><p>O valor mı́nimo da função-objetivo é d ≈ 27, 320. A seguir, fazemos uma descrição gráfica dos passos feitos</p><p>pelo problema:</p><p>x</p><p>y</p><p>0</p><p>10 20</p><p>10</p><p>b b</p><p>b</p><p>B F</p><p>C</p><p>b</p><p>b</p><p>c) O problema agora consiste em determinar onde deve ser constrúıdo um armazém que sirva às três cidades</p><p>indicadas de forma proporcional às suas populações. Podemos fazer isto dando um peso a cada distância</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 18</p><p>da função-objetivo que seja proprocional à população de cada cidade. Usando como variáveis de decisão do</p><p>problema (x, y) =coordenadas do armazém, temos, então,</p><p>min d(x, y) = 400</p><p>√</p><p>x2 + y2 + 250</p><p>√</p><p>(x − 20)2 + y2 + 140</p><p>√</p><p>(x − 10)2 + (y − 10)2 .</p><p>d) O gradiente é dado por</p><p>~∇d(x, y) =</p><p>(</p><p>dx</p><p>dy</p><p>)</p><p>,</p><p>onde</p><p>dx =</p><p>∂d</p><p>∂x</p><p>= 400 · 1</p><p>2</p><p>(x2 + y2)−1/2 · 2x + 250 · 1</p><p>2</p><p>[</p><p>(x − 20)2 + y2</p><p>]−1/2 · 2(x − 20) +</p><p>+140 · 1</p><p>2</p><p>[</p><p>(x − 10)2 + (y − 10)2</p><p>]−1/2 · 2(x − 10) =</p><p>= 400x(x2 + y2)−1/2 + 250(x − 20)</p><p>[</p><p>(x − 20)2 + y2</p><p>]−1/2</p><p>+ 140(x − 10)</p><p>[</p><p>(x − 10)2 + (y − 10)2</p><p>]−1/2</p><p>,</p><p>dy =</p><p>∂d</p><p>∂y</p><p>= 400 · 1</p><p>2</p><p>(x2 + y2)−1/2 · 2y + 250 · 1</p><p>2</p><p>[</p><p>(x − 20)2 + y2</p><p>]−1/2 · 2y +</p><p>+140 · 1</p><p>2</p><p>[</p><p>(x − 10)2 + (y − 10)2</p><p>]−1/2 · 2(y − 10) =</p><p>= 400y(x2 + y2)−1/2 + 250y</p><p>[</p><p>(x − 20)2 + y2</p><p>]−1/2</p><p>+ 140(y − 10)</p><p>[</p><p>(x − 10)2 + (y − 10)2</p><p>]−1/2</p><p>.</p><p>Para iniciarmos a busca, escolheremos um ponto inicial apropriado. Partiremos novamente do ponto inicial</p><p>~x0 =</p><p>(</p><p>10</p><p>0</p><p>)</p><p>. Calculando o gradiente, temos</p><p>~∇d(~x0) =</p><p>(</p><p>150</p><p>−140</p><p>)</p><p>.</p><p>Determinamos então um novo ponto ~x1:</p><p>~x1 = ~x0 + λ~∇d(~x0) =</p><p>(</p><p>10</p><p>0</p><p>)</p><p>+ λ</p><p>(</p><p>150</p><p>−140</p><p>)</p><p>=</p><p>(</p><p>10 + 150λ</p><p>−140λ</p><p>)</p><p>.</p><p>Substituindo esse ponto na função objetivo, temos</p><p>d(~x1) = 400</p><p>√</p><p>(10 + 150λ)2 + (−140λ)2 + 250</p><p>√</p><p>(−10 + 150λ)2 + (−140λ)2 +</p><p>+140</p><p>√</p><p>(150λ)2 + (−140λ − 10)2 =</p><p>= 400</p><p>√</p><p>100 + 3000λ + 22500λ2 + 19600λ2 + 250</p><p>√</p><p>100 − 3000λ + 22500λ2 + 19600λ2 +</p><p>+140</p><p>√</p><p>22500λ2 + 100 + 2800λ + 19600λ2 = d(λ) =</p><p>= 400</p><p>√</p><p>100 + 3000λ + 42100λ2 + 250</p><p>√</p><p>100 − 3000λ + 42100λ2 +</p><p>+140</p><p>√</p><p>100 + 2800λ + 42100λ2 = d(λ) .</p><p>Calculando a derivada da função, ficamos com</p><p>d′(λ) = 200(3000 + 84200λ)(100 + 3000λ + 42100λ2)−1/2 +</p><p>+125(−3000 + 84200λ)(100 − 3000λ + 42100λ2)−1/2 +</p><p>+70(2800 + 84200λ)(100 + 2800λ + 42100λ2)−1/2</p><p>Teremos que usar um método numérico (método de Newton) para encontrar as ráızes dessa derivada. Para</p><p>isso, precisamos calcular sua derivada segunda:</p><p>d′′(λ) = 16840000(100 + 3000λ + 42100λ2)−1/2 − 62, 5(−3000 + 84200λ)2(100 − 3000λ + 42100λ2)−3/2 +</p><p>+10525000(100 − 3000λ + 42100λ2)−1/2 − 62, 5(−3000 + 84200λ)2(100 − 3000λ + 42100λ2)−3/2 +</p><p>+5894000(100 + 2800λ + 42100λ2)−1/2 − 35(2800 + 84200λ)2(100 + 2800λ + 42100λ2)−3/2</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 19</p><p>Usando o algoritmo de Newton, temos, então, partindo de λ0 = 0,</p><p>λ1 = λ0 −</p><p>d′(λ0)</p><p>d′′(λ0)</p><p>= 0 − d′(0)</p><p>d′′(0)</p><p>≈ 0 − 42100</p><p>1926500</p><p>≈ −0, 022 ,</p><p>λ2 = −0, 022 − d′(−0, 022)</p><p>d′′(−0, 022)</p><p>≈ −0, 022 − −4651, 944</p><p>2596943</p><p>≈ −0, 020 ,</p><p>λ3 = −0, 020 − d′(−0, 020)</p><p>d′′(−0, 020)</p><p>≈ −0, 020 − 897, 329</p><p>2522698, 865</p><p>≈ −0, 020 .</p><p>Como d′′(−0, 020) = 2522698, 865, que é positivo, este é um mı́nimo da função. Para visualizarmos melhor essa</p><p>função, ela está representada no gráfico a seguir.</p><p>λ</p><p>d(λ)</p><p>−0, 03 −0, 02 −0, 01 0, 01</p><p>0</p><p>7000</p><p>7500</p><p>8000</p><p>Substituindo o valor de λ encontrado, temos</p><p>~x1 =</p><p>(</p><p>7</p><p>2, 8</p><p>)</p><p>.</p><p>O gradiente de ~x1 fica, então,</p><p>~∇d(~x0) =</p><p>(</p><p>73, 149</p><p>71, 964</p><p>)</p><p>.</p><p>Precisamos fazer uma nova iteração para encontrar um resultado melhor.</p><p>Determinamos então um novo ponto ~x2:</p><p>~x2 = ~x1 + λ~∇d(~x1) =</p><p>(</p><p>7</p><p>2, 8</p><p>)</p><p>+ λ</p><p>(</p><p>73, 149</p><p>71, 964</p><p>)</p><p>=</p><p>(</p><p>7 + 73, 149λ</p><p>2, 8 + 71, 964λ</p><p>)</p><p>.</p><p>Substituindo esse ponto na função objetivo, temos</p><p>d(~x2) = 400</p><p>√</p><p>(7 + 73, 149λ)2 + (2, 8 + 71, 964λ)2 + 250</p><p>√</p><p>(−13 + 73, 149λ)2 + (2, 8 + 71, 964λ)2 +</p><p>+140</p><p>√</p><p>(−3 + 73, 149λ)2 + (−7, 2 + 71, 964λ)2 .</p><p>Usando novamente um método numérico, descobrimos que esta função tem um mı́nimo em λ = −0, 033.</p><p>Substituindo novamente na expressão para ~x2, temos</p><p>~x2 =</p><p>(</p><p>4, 586</p><p>0, 425</p><p>)</p><p>.</p><p>O gradiente fica</p><p>~∇d(~x0) =</p><p>(</p><p>79, 480</p><p>−78, 066</p><p>)</p><p>.</p><p>Constrúımos, então, o ponto ~x3:</p><p>~x3 =</p><p>(</p><p>4, 586 + 79, 480λ</p><p>0, 425 − 78, 066λ</p><p>)</p><p>.</p><p>A função-objetivo fica</p><p>d(~x2) = 400</p><p>√</p><p>(4, 586 + 79, 480λ)2 + (0, 425 − 78, 066λ)2 +</p><p>+250</p><p>√</p><p>(−15, 414 + 79, 480λ)2 + (0, 425 − 78, 066λ)2 +</p><p>+140</p><p>√</p><p>(−5, 414 + 79, 480λ)2 + (−9, 575</p><p>− 78, 066λ)2 .</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 20</p><p>Usando um método numérico, descobrimos que esta função tem um mı́nimo em λ = −0, 012. Portanto,</p><p>~x3 =</p><p>(</p><p>3, 632</p><p>1, 362</p><p>)</p><p>.</p><p>Repetindo o mesmo processo, chegamos ao ponto</p><p>~x4 =</p><p>(</p><p>2, 760</p><p>0, 362</p><p>)</p><p>.</p><p>A tabela a seguir mostra todos passos do método, que vão até que a precisão de três casas decimais seja</p><p>alcançada.</p><p>i xi yi</p><p>0 10 0</p><p>1 7 2, 8</p><p>2 4, 586 0, 425</p><p>3 3, 632 1, 362</p><p>4 2, 760 0, 362</p><p>5 2, 242 0, 814</p><p>6 1, 739 0, 234</p><p>7 1, 432 0, 509</p><p>8 1, 112 0, 154</p><p>9 0, 922 0, 325</p><p>10 0, 722 0, 101</p><p>11 0, 601 0, 210</p><p>12 0, 469 0, 066</p><p>13 0, 391 0, 136</p><p>14 0, 305 0, 043</p><p>15 0, 255 0, 088</p><p>i xi yi</p><p>16 0, 197 0, 027</p><p>17 0, 165 0, 057</p><p>18 0, 128 0, 018</p><p>19 0, 107 0, 037</p><p>20 0, 084 0, 012</p><p>21 0, 070 0, 024</p><p>22 0, 054 0, 007</p><p>23 0, 045 0, 015</p><p>24 0, 032 0, 004</p><p>25 0, 027 0, 009</p><p>26 0, 019 0, 002</p><p>27 0, 016 0, 005</p><p>28 0, 008 0, 000</p><p>29 0, 007 0, 002</p><p>30 0, 000314 −0, 000044</p><p>31 0, 000301 0, 0000861</p><p>Nas últimas duas linhas foram usadas mais casas decimais para evitar singularidades nas derivadas primeira e</p><p>segunda da função d(x, y). Pode-se ver que a solução ótima, com precisão de duas casas decimais, é</p><p>~x =</p><p>(</p><p>0</p><p>0</p><p>)</p><p>,</p><p>isto é, o armazém deve ser constrúıdo na cidade de Besourinhos.</p><p>Uma descrição gráfica dos passos feitos pelo problema é feita a seguir:</p><p>x</p><p>y</p><p>0 10 20</p><p>10</p><p>b b</p><p>b</p><p>B F</p><p>C</p><p>Note o comportamento em zigue-zague da busca, t́ıpica do método de busca por gradiente, que torna a</p><p>busca dif́ıcil e lenta quando nos aproximamos da solução do problema.</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 21</p><p>Exerćıcios - Caṕıtulo 2.11</p><p>Nı́vel 1</p><p>Gradiente</p><p>Exemplo 1: calcule o gradiente da função f(x, y, z) = x cos(yz).</p><p>Solução: temos</p><p>fx =</p><p>∂f</p><p>∂x</p><p>= cos(yz) , fy =</p><p>∂f</p><p>∂y</p><p>= −xz sen (yz) , fz =</p><p>∂f</p><p>∂z</p><p>= −xy sen (yz) .</p><p>Portanto,</p><p>~∇f =</p><p></p><p></p><p>fx</p><p>fy</p><p>fz</p><p></p><p> =</p><p></p><p></p><p>cos(yz)</p><p>−xz sen (yz)</p><p>−xy sen (yz)</p><p></p><p> .</p><p>E1) Calcule os gradientes das seguintes funções:</p><p>a) f(x, y) = xy3, b) f(x, y) = 2x + cos y, c) f(x, y, z) = 4xz − 8y2, d) f(x, y, z) = 8x</p><p>√</p><p>y − 2 ez .</p><p>Exemplo 2: calcule o vetor que dá a direção e sentido de maior crescimento da função f(x, y, z) = x cos(yz)</p><p>no ponto (1, 0, 2).</p><p>Solução: o gradiente da função, calculado no exemplo 3, é dado por</p><p>~∇f =</p><p></p><p></p><p>cos(yz)</p><p>−xz sen (yz)</p><p>−xy sen (yz)</p><p></p><p> .</p><p>O vetor gradiente calculado no ponto desejado dá a direção e o sentido de maior variação da função. Portanto, em</p><p>(1, 0, 2), temos</p><p>~∇f(1, 0, 2) =</p><p></p><p></p><p>cos(0 · 2)</p><p>−1 · 2 sen (0 · 2)</p><p>−1 · 0 sen (0 · 2)</p><p></p><p> =</p><p></p><p></p><p>cos 0</p><p>−2 sen0</p><p>−0</p><p></p><p> =</p><p></p><p></p><p>1</p><p>0</p><p>0</p><p></p><p> .</p><p>E2) Calcule os vetores que dão as direções e sentidos de maior crescimento das funções abaixo nos pontos</p><p>indicados:</p><p>a) f(x, y) = xy3 , (1, 1); b) f(x, y) = 2x + cos y , (0, π); c) f(x, y, z) = 4xz − 8y2 , (1, 4, 2);</p><p>d) f(x, y, z) = 8x</p><p>√</p><p>y − 2 ez , (2, 1, 0).</p><p>Hessiana</p><p>Exemplo 3: calcule a hessiana da função f(x, y, z) = x cos(yz).</p><p>Solução: as derivadas parciais de segunda ordem já foram calculadas no exemplo 3. A partir delas, temos</p><p>H(f) =</p><p></p><p></p><p>fxx fxy fyz</p><p>fyx fyy fyz</p><p>fzx fzy fzz</p><p></p><p> =</p><p></p><p></p><p>0 −z sen (yz) −y sen (yz)</p><p>−z sen (yz) −xz2 cos(yz) −x sen (yz) − xyz cos(yz)</p><p>−y sen (yz) −x sen (yz) − xyz cos(yz) −xy2 cos(yz)</p><p></p><p></p><p>E3) Calcule as hessianas das seguintes funções:</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 22</p><p>a) f(x, y) = xy3, b) f(x, y) = 2x + cos y, c) f(x, y, z) = 4xz − 8y2, d) f(x, y, z) = 8x</p><p>√</p><p>y − 2 ez .</p><p>Nı́vel 2</p><p>E1) As figuras a seguir ilustram algumas curvas de ńıvel das funções f(x, y) = 2x2 + 3y2, g(x) = 3x2 − 2y2 e</p><p>h(x, y) = 3x−x3 − 3xy2. Desenhe sobre essas curvas de ńıvel os vetores gradiente normalizados dessas funções</p><p>nos pontos (0, 0), (1, 0), (0, 1) e (1, 1) com origem nos pontos dados.</p><p>x</p><p>y</p><p>−1</p><p>0</p><p>1</p><p>−1</p><p>1</p><p>b</p><p>f(x, y) = 2x2 + 3y2</p><p>x</p><p>y</p><p>−3 −2 −1</p><p>0</p><p>1 2 3</p><p>−4</p><p>−3</p><p>−2</p><p>−1</p><p>1</p><p>2</p><p>3</p><p>4</p><p>g(x, y) = 3x2 − 2y2</p><p>x</p><p>y</p><p>−2 −1 0 1 2</p><p>−2</p><p>−1</p><p>1</p><p>2</p><p>b b</p><p>h(x, y) = 3x − x3 − 3xy2</p><p>E2) Considerando os dados a seguir, calcule, aproximadamente, um vetor que dê a direção e o sentido do</p><p>gradiente no ponto (0, 0).</p><p>x/y −2 −1 0 1 2</p><p>−2 −3, 2 −3, 1 −2, 9 −2, 8 −3, 0</p><p>−1 −2, 9 −2, 7 −2, 7 −2, 6 −2, 8</p><p>0 −1, 6 −1, 4 −1, 2 −1, 4 −1, 6</p><p>1 −0, 4 −0, 6 −0, 4 −0, 7 −0, 6</p><p>2 0, 6 0, 8 0, 7 0, 8 0, 3</p><p>E3) O laplaciano de uma função f(x, y) é definido como ∇2f = fxx + fyy. Dada f(x, y) =</p><p>√</p><p>x2 + y2, prove</p><p>que ∇2f = 1</p><p>f .</p><p>E4) Determine em qual direção e sentido uma função f decresce mais rapidamente.</p><p>E5) Determine todos os pontos para os quais a direção de maior mudança da função f(x, y) = x2 + y2 −x− 3y</p><p>é dada por</p><p>(</p><p>1</p><p>1</p><p>)</p><p>.</p><p>E6) Um industrial tem que decidir onde investir R$ 50.000 e estima que a produção de sua empresa possa ser</p><p>modelada pela função P (K,L) = 1, 3K0,45L0,55, onde o capital investido K e o trabalho L são medidos em</p><p>milhões de reais. No momento, o capital investido é de 5 milhões de reais e o gasto em trabalho é de 4 milhões</p><p>de reais. Determine o quanto do dinheiro tem que ser usado em cada uma dessas áreas de modo a maximizar</p><p>a produção da empresa (use uma precisão de um milhar de reais na resposta).</p><p>Nı́vel 3</p><p>E1) Calcule a reta normal e a reta tangente à elipse</p><p>x2</p><p>4</p><p>+ y2 = 2 no ponto (−2, 1) seguindo as seguintes</p><p>instruções:</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 23</p><p>a) Considere que a elipse é uma curva de ńıvel da função f(x, y) =</p><p>x2</p><p>4</p><p>+ y2 e calcule o gradiente dessa função</p><p>no ponto (−2, 1).</p><p>b) Usando o fato do gradiente ser perpendicular à curva de ńıvel para calcular um ponto da reta normal à</p><p>elipse no ponto dado.</p><p>c) Utilize o ponto (−2, 1) e o novo ponto dado para calcular a equação da reta normal à elipse naquele ponto.</p><p>d) Use o fato da reta tangente ser perpendicular à reta normal calculada para repetir o processo (considerando</p><p>agora a reta normal como uma isoquanta de uma função adequada) e calcular a equação da reta tangente.</p><p>e) Desenhe em um mesmo gráfico a elipse dada, o ponto (−2, 1) e as retas normal e tangente a essa curva nesse</p><p>ponto.</p><p>E2) Calcule a reta normal e a reta tangente à curva x3 − 3y = 5 no ponto (2, 1).</p><p>E3) Um industrial estima que a produção de sua empresa possa ser modelada pela função de produção de</p><p>Cobb-Douglas P (K,L) = 1, 2K0,6L0,4, onde o capital investido K e o trabalho L são medidos em milhões de</p><p>reais. No momento, o capital investido é de 5 milhões de reais e o gasto em trabalho é de 4 milhões de reais. Ele</p><p>pretende, nos próximos 6 meses, investir R$ 1.000.000 todo mês. Determine uma estratégia de investimentos</p><p>para o industrial para os próximos 6 meses de modo a maximizar a sua produção. Assuma nos seus cálculos</p><p>que ele sempre invista em unidades de milhares de reais.</p><p>E4) Use busca por gradiente com precisão de duas casas decimais para maximizar a função</p><p>f(x, y) = 4 − x2 − y2 + 2x − 3y partindo do ponto x0 = (0, 0).</p><p>E5) Use busca por gradiente com precisão de duas casas decimais para maximizar a função</p><p>f(x, y) = 4 − x2 − y2 + 2x − xy partindo do ponto x0 = (0, 0).</p><p>Respostas</p><p>Nı́vel 1</p><p>E1) a) ~∇f =</p><p>(</p><p>y3</p><p>3xy2</p><p>)</p><p>, b) ~∇f =</p><p>(</p><p>y2</p><p>− sen y</p><p>)</p><p>, c) ~∇f =</p><p></p><p></p><p>4z</p><p>−16y</p><p>4x</p><p></p><p>, d) ~∇f =</p><p></p><p></p><p>8</p><p>√</p><p>y</p><p>4x/</p><p>√</p><p>y</p><p>−2 ez</p><p></p><p>.</p><p>E2) a) ~∇f(1, 1) =</p><p>(</p><p>1</p><p>3</p><p>)</p><p>, b) ~∇f(0, π) =</p><p>(</p><p>2</p><p>0</p><p>)</p><p>, c) ~∇f(1, 4, 2) =</p><p></p><p></p><p>8</p><p>−64</p><p>4</p><p></p><p>, d) ~∇f(2, 1, 0) =</p><p></p><p></p><p>8</p><p>8</p><p>−2</p><p></p><p>.</p><p>E3) a) H(f) =</p><p>(</p><p>0 3y2</p><p>3y2 6xy</p><p>)</p><p>, b) H(f) =</p><p>(</p><p>0 0</p><p>0 − cos y</p><p>)</p><p>, c) H(f) =</p><p></p><p></p><p>0 0 4</p><p>0 −16 0</p><p>4 0 0</p><p></p><p>,</p><p>d) H(f) =</p><p></p><p></p><p>0 4√</p><p>x</p><p>0</p><p>4√</p><p>x</p><p>− 2x</p><p>y3/2</p><p>0</p><p>0 0 −2 ez</p><p></p><p>.</p><p>Nı́vel 2</p><p>E1)</p><p>x</p><p>y</p><p>−1</p><p>0</p><p>1</p><p>−1</p><p>1</p><p>b</p><p>f(x, y) = 2x2 + 3y2</p><p>b x</p><p>y</p><p>−3 −2 −1</p><p>0</p><p>1 2 3</p><p>−4</p><p>−3</p><p>−2</p><p>−1</p><p>1</p><p>2</p><p>3</p><p>4</p><p>g(x, y) = 3x2 − 2y2</p><p>b x</p><p>y</p><p>−2 −1 0 1 2</p><p>−2</p><p>−1</p><p>1</p><p>2</p><p>b b</p><p>h(x, y) = 3x − x3 − 3xy2</p><p>b</p><p>b</p><p>Cálculo 2 - Caṕıtulo 2.11 - Gradiente e hessiana 24</p><p>E2)</p><p>(</p><p>0</p><p>−1</p><p>)</p><p>.</p><p>E3) ∇2f = fxx + fyy =</p><p>y2</p><p>(x2 + y2)3/2</p><p>+</p><p>x2</p><p>(x2 + y2)3/2</p><p>=</p><p>x2 + y2</p><p>(x2 + y2)3/2</p><p>=</p><p>1</p><p>(x2 + y2)1/2</p><p>=</p><p>1</p><p>f</p><p>.</p><p>E4) Na direção dada por −~∇f .</p><p>E5) Para os pontos (1, 2) e (0, 1).</p><p>E6) Ele deve investir R$ 19.780</p><p>em captial e usar R$ 30.220 em trabalho.</p><p>Nı́vel 3</p><p>E1) a) ~∇f(−2, 1) =</p><p>(</p><p>−1</p><p>2</p><p>)</p><p>. b) (−3, 3). c) y = −2x − 3. d) y =</p><p>1</p><p>2</p><p>x + 2. e) x</p><p>y</p><p>−3 −2 −1 0 1 2 3</p><p>−3</p><p>−2</p><p>−1</p><p>1</p><p>2</p><p>3</p><p>b</p><p>E2) A reta normal é dada por y = −0, 3x + 1, 6. A reta tangente é dada por y =</p><p>1</p><p>3</p><p>(x + 1).</p><p>E3) A estratégia de investimentos é dada pela tabela a seguir. Os investimentos são dados em milhares de reais.</p><p>Mês K L</p><p>1 623 377</p><p>2 623 377</p><p>3 622 378</p><p>4 622 378</p><p>5 623 377</p><p>6 623 377</p><p>E4) a) x = 1 e y = −1, 5, f = 7, 25 (uma iteração).</p><p>E5) a) x = 1, 33 e y = −0, 67, f = 5, 33 (10 iterações).</p>

Mais conteúdos dessa disciplina