Baixe o app para aproveitar ainda mais
Prévia do material em texto
Capítulo 9 Diferenciabilidade 9.1 Definição de derivada Uma reta não vertical que passa pelo ponto (x0,y0) pode ser representada ex- plicitamente pela equação y� y0 = m(x� x0) . (9.1) O número real m descreve a inclinação da reta. x f(x) x0 f(x0) x f(x) x0 f(x0) Figura 9.1: Inclinação da reta e da curva. Intuitivamente podemos visualizar que uma curva representada explicitamente pela equação y = f (x) possui uma certa inclinação no ponto (x0,y0) e em cada ponto diferente da curva teremos uma inclinação diferente. Queremos agora de- finir uma maneira precisa, livre de ambiguidades e contradições, este conceito de inclinação de uma curva em um ponto. 134 Diferenciabilidade x y Se a curva em questão é uma circunfe- rência, podemos observar que a reta tan- gente a um certo ponto possui a mesma inclinação que a circunferência neste ponto. Podemos definir a inclinação da circunferência no ponto (x0,y0) pela in- clinação da reta tangente a este ponto, que é definida como a reta que intercepta a circunferência apenas no ponto esco- lhido. Esta definição é ambígua se extendida para uma curva qualquer. Por exem- plo, a reta horizontal y = y0 e a reta vertical x = x0 interceptam o ponto mínimo de uma parábola em apenas um ponto. Além disso, a reta que de fato possui a mesma inclinação da curva y = f (x) pode interceptar a curva em algum outro ponto distante, com mostra a figura 9.1. x y Precisamos então definir esta reta de modo que seja a reta tangente se aplicar- mos a definição a uma circunferência e que não seja ambígua no caso geral. Vol- tando à circunferência, uma reta que a in- tercepta em dois pontos distintos é cha- mada de reta secante. Se mantivermos um ponto fixo e variarmos o segundo de modo que ele se aproxima mais do ponto mantido fixo, podemos perceber que a reta secante se aproxima cada vez mais da reta tangente ao ponto mantido fixo. x f(x) x0 f(x0) x1 x1 x1 Aplicando esta definição a uma curva representada explicitamente pela equa- ção y= f (x) temos também uma sequên- cia de retas que se aproximam da reta que possui a mesma inclinação da curva no ponto mantido fixo. Seja (x0,y0) o ponto mantido fixo e (x1,y1) o ponto que es- colhemos variar. A equação da reta que passa por estes dois pontos é y = y1 � y0 x1 � x0 x+ y0x1 � y1x0 x1 � x0 . (9.2) 9.1 Definição de derivada 135 A inclinação desta reta é dada por m = y1 � y0 x1 � x0 = f (x1)� f (x0) x1 � x0 . (9.3) Esta inclinação pode ser calculada sempre que x1 6= x0. A expressão não é definida em x1 = x0, mas definimos a reta tangente à curva y= f (x) no ponto (x0,y0) como m = lim x1!x0 f (x1)� f (x0) x1 � x0 . (9.4) Se este limite existir, chamamos o número real m de derivada da função f em x0. Definição 9.1. A derivada da função f no ponto x0 é f 0(x0) = limx1!x0 f (x1)� f (x0) x1 � x0 (9.5) se este limite for um número real. Neste caso dizemos que f é diferenciável em x0. Teorema 9.1. Se f é diferenciável em x0, então f é também contínua em x0. Demonstração. Queremos provar que lim x!x0 f (x) = f (x0) . (9.6) Mudando a variável x para x1 como x = x1, podemos provar este limite mostrando que lim x1!x0 [ f (x1)� f (x0)] = 0 . (9.7) Podemos manipular a diferença f (x1)� f (x0) e escrever o limite como lim x1!x0 [ f (x1)� f (x0)] = limx1!x0 f (x1)� f (x0) x1 � x0 (x1 � x0) = lim x1!x0 f (x1)� f (x0) x1 � x0 · lim x1!x0 (x1 � x0) = f 0(x0) ·0 = 0 . (9.8) A definição de diferenciabilidade garante que f 0(x0) é um número real. 136 Diferenciabilidade x y a x b Se toda função diferenciável em um ponto é também contínua neste ponto, então uma função que não é contínua não pode ser diferenciável. Se em um certo ponto x0 o gráfico da função é interrom- pido e exibe um “salto”, como ilustrado na figura ao lado, as retas secantes se aproximam cada vez mais de uma reta vertical, que não pode ser expressa pela equação y� y0 = m(x� x0) com m real, motivo pelo qual a função não é diferen- ciável em x0. 9.1.1 Exemplos de funções diferenciáveis Exemplo 9.1 (Função constante). Seja f (x) = K para todo x real e x0 um número real qualquer. f 0(x0) = limx1!x0 f (x1)� f (x0) x1 � x0 = lim x1!x0 K �K x1 � x0 = lim x1!x0 0 = 0 . (9.9) Este resultado implica que uma reta horizontal sempre possui inclinação nula. Exemplo 9.2 (Polinômio de primeiro grau). Seja f (x) = ax+b e x0 um número real qualquer f 0(x0) = limx1!x0 f (x1)� f (x0) x1 � x0 = lim x1!x0 ax1 +b�ax0 �b x1 � x0 = lim x1!x0 a(x1 � x0) x1 � x0 = a . (9.10) Como a equação y = ax+b descreve uma reta com inclinação a, é natural esperar que a derivada tenha sempre a mesma inclinação. Exemplo 9.3 (Polinômio de segundo grau). Seja agora f (x) = ax2 +bx+ c. A derivada no ponto x0 é f 0(x0) = limx1!x0 f (x1)� f (x0) x1 � x0 = lim x1!x0 ax21 +bx1 + c�ax20 �bx1 � c x1 � x0 = lim x1!x0 a x21 � x20 x1 � x0 +b x1 � x0 x1 � x0 � = lim x1!x0 [a(x1 + x0)+b] = 2ax0 +b . A inclinação de reta tangente a uma parábola depende do ponto x0 escolhido. 9.1 Definição de derivada 137 9.1.2 Exemplos de funções não diferenciáveis em algum ponto Exemplo 9.4 (Hipérbole). Seja f (x) = 1x e x0 6= 0. Neste ponto podemos calcular a derivada da função, f 0(x0) = limx1!x0 f (x1)� f (x0) x1 � x0 = lim x1!x0 1 x1 � 1x0 x1 � x0 = lim x1!x0 1 (x1 � x0) x0 � x1 x1 ·x0 � = lim x1!x0 �1 x1 ·x0 � =� 1 x20 . (9.11) A derivada f 0(x0) existe sempre que x0 6= 0, ou seja, no domínio da função. Mas como lim x0!0 f 0(x0) = lim x0!0 � 1 x20 =�• , (9.12) a inclinação da hipérbole se aproxima de uma reta vertical à medida em que x0 se aproxima de 0. Mesmo que f (0) seja definida de alguma maneira, esta nova função não pode ser contínua em x0 = 0 e portanto não pode ser diferenciável neste ponto. Exemplo 9.5. Seja agora f (x) = 3 p x. Esta função é contínua em todo x real. Seja x0 um número real qualquer. f 0(x0) = limx1!x0 f (x1)� f (x0) x1 � x0 = lim x1!x0 3 p x1 � 3 p x0 x1 � x0 . (9.13) Este limite também é um caso 00 , então devemos manipular com o produto notável a3 �b3 = (a�b)(a2 +ab+b2) . (9.14) Se a = 3 p x1 e b = 3 p x0, podemos eliminar os termos que resultam em zero multi- plicando e dividindo por (a2 +ab+b2), isto é, 3 p x1 � 3 p x0 x1 � x0 = 3 p x1 � 3 p x0 x1 � x0 3 q x21 + 3 p x1 3 p x0 + 3 q x20 3 q x21 + 3 p x1 3 p x0 + 3 q x20 = x1 � x0 (x1 � x0)( 3 q x21 + 3 p x1 3 p x0 + 3 q x20) = 1 3 q x21 + 3 p x1 3 p x0 + 3 q x20 . (9.15) 138 Diferenciabilidade Como a função 3 p x é contínua, calculamos o limite deste último denominador como lim x1!x0 3 q x21 + 3 p x1 3 p x0 + 3 q x20 = 3 q x20 + 3 p x0 3 p x0 + 3 q x20 = 3 3 q x20 . (9.16) Se x0 6= 0, f 0(x0) = limx1!x0 f (x1)� f (x0) x1 � x0 = 1 3 3 q x20 = x� 2/3 0 3 . (9.17) Apesar de 3 p x ser contínua em x0 = 0, a derivada não existe porque a curva tem inclinação vertical e portanto a reta tangente não pode ser escrita na forma y�y0 = m(x� x0) com m real. Exemplo 9.6 (Função modular). A função f (x) = |x|= ⇢ x , se x � 0 �x , se x < 0 (9.18) é contínua em todo x real. A sua derivada em um x0 qualquer é f 0(x0) = limx1!x0 |x1|� |x0| x1 � x0 . (9.19) Calculando a derivada em x0 = 0 temos f 0(0) = lim x1!0 |x1| x1 . (9.20) Este limite não existe, pois lim x1!0+ |x1| x1 =+1 e lim x1!0� |x1| x1 =�1 . (9.21) A derivada f 0(0) não existe. Tomando o limite de retas secantes à direita do ponto x0 = 0 temos uma reta com inclinação m = +1, enquanto calculando retas secantes com pontos à esquerda de x0 = 0 encontramos inclinação m = �1. A inclinação à esquerda é diferente da inclinação à direita. Geometricamente esta descontinuidade na derivada quer dizer que a curva tem um “bico” ou um “canto”. Estes dois últimos exemplos mostram que uma função pode ser contínua em um ponto e não ser diferenciável neste mesmo ponto. O último exemplo sugere a definição de derivada à direita e derivada à esquerda como f 0(x+0 ) = lim x1!x+0 f (x1)� f (x0) x1 � x0 e f 0(x�0 ) = lim x1!x�0 f (x1)� f (x0)x1 � x0 . (9.22) 9.1 Definição de derivada 139 Definição 9.2. Dizemos que a função f é diferenciável no intervalo aberto (a,b) se f for diferenciável em todo x0 2 (a,b). Dizemos que f é diferenciável no intervalo fechado [a,b] se for diferenciável em (a,b), diferenciável pela direita em x0 = a e diferenciável pela esquerda em x0 = b. No caso da função f (x) = |x|, podemos dizer que f é diferenciável no inter- valo [0,1] ou no intervalo [�1,0], mas não podemos dizer que é diferenciável no intervalo [�1,1], porque em x0 = 0 a função não é diferenciável. 9.1.3 Função derivada Na definição de derivada f 0(x0) = limx1!x0 f (x1)� f (x0) x1 � x0 (9.23) podemos fazer a substituição de variáveis h = x1 � x0 e escrever o limite como f 0(x0) = lim h!0 f (x0 +h)� f (x0) h . (9.24) Este formato pode ser mais conveniente para calcular derivadas, e também para definir a função derivada de f (ou apenas a derivada de f ) como uma função que em x = x0 retorna a derivada de f em x0, isto é, f 0(x0). O domínio da função derivada é o conjunto de pontos em que a função original é diferenciável. A derivada de uma função pode ser calculada pela fórmula f 0(x) = lim h!0 f (x+h)� f (x) h . (9.25) Exemplo 9.7. Seja a função f (x) = 1x2 . Sua derivada é dada por f 0(x) = lim h!0 f (x+h)� f (x) h = lim h!0 1 h ✓ 1 (x+h)2 � 1 x2 ◆ = lim h!0 1 h x2 � (x+h)2 x2(x+h)2 � = lim h!0 1 h x2 � x2 �2hx�h2 x2(x+h)2 � = lim h!0 �2x�h x2(x+h)2 � . (9.26) Agora não há divisões por zero e as funções envolvidas são contínuas, então f 0(x) = �2x x4 =� 2 x3 . (9.27) Como f não é contínua em x = 0 naturalmente a sua derivada f 0 não é de- finida neste ponto. A função derivada é contínua em todo x 6= 0, portanto f é diferenciável no domínio (�•,0)[ (0,+•). 140 Diferenciabilidade 9.1.4 Notações de derivada Seja a curva representada explicitamente pela equação y = f (x), onde f é uma função diferenciável. Podemos escrever h = Dx, agora chamado de incremento em x e definir o incremento em y como a variação da função após o incremento Dx, isto é, x y x f(x) x+h f(x+h) Δx Δy Dy = f (x+Dx)� f (x) . (9.28) A razão entre estes incrementos é a incli- nação da reta secante definida pelos pon- tos x e x+Dx, dada por m = Dy Dx = f (x+Dx)� f (x) Dx . (9.29) A derivada da função calculada em x é o limite da inclinação da reta secante quando o incremento em x tende a zero, isto é, f 0(x) = lim Dx!0 Dy Dx . (9.30) Podemos denotar este limite trocando os símbolos Dx e Dy pelos símbolos dx e dy, que chamamos de incrementos infinitesimais ou diferenciais. Com estes símbolos podemos denotar a derivada da função por dy dx = lim Dx!0 Dy Dx ou d f dx = lim Dx!0 D f Dx . (9.31) Esta notação de derivada é chamada de notação de Leibniz. É importante notar que o símbolo dydx lembra a razão entre dois diferenciais, mas não pode ser entendido como uma divisão, pois a operação de divisão entre diferenciais não é definida (seria como dividir por um vetor ou dividir por zero). A símbolo f 0(x) escolhido para denotar a derivada é uma notação chamada notação de Lagrange. Existem diversas outras notações, como a notação de New- ton, que consiste em escrever um ponto acima da função. Normalmente a notação de Newton é utilizada quando a variável da função representa o tempo. Então se x(t) é a função que descreve a posição de uma partícula no tempo, sua velocidade pode ser denotada como v(t) = ẋ(t). A notação de Euler consiste em escrever a derivada como D f . Esta notação é útil quando queremos utilizar a derivada como um operador (uma transformação que aplicamos numa função que retorna a derivada da função). Podemos também 9.1 Definição de derivada 141 utilizar a notação de Leibniz para representar a derivada como um operador na forma d f dx (x) = d dx ( f (x)) . (9.32) Nesta equação o símbolo ddx é entendido como um operador que age na função f (x) e retorna a derivada d fdx (x). 9.1.5 Derivadas de ordem superior Como o resultado da aplicação do operador ddx é também uma função, nada nos impede de aplicar novamente este operador no resultado da função. O resultado de duas aplicações deste operador numa função chama-se segunda derivada de f , que pode ser calculada como a derivada da derivada. Na notação de Leibniz a segunda derivada é denotada como d2 f dx2 = d dx ✓ d f dx ◆ = ✓ d dx ◆✓ d dx ◆ f . (9.33) Na notação de Lagrande denotamos a segunda derivada como f 00(x) = lim h!0 f 0(x+h)� f 0(x) h . (9.34) Na notação de Euler a segunda derivada é simplesmente D2 f , enquanto na notação de Newton utilizamos dois pontos. A segunda lei de Newton pode ser escrita como F = mẍ(t) . (9.35) Se a segunda derivada for contínua em um ponto x0, dizemos que a função é duas vezes diferenciável em x0. Dizemos que ela é duas vezes diferenciável em um intervalo se for duas vezes diferenciável em cada ponto deste intervalo. Como funções contínuas podem não ser diferenciáveis em um ponto, é também possível que uma função seja diferenciável em um ponto, mas não duas vezes. Por exemplo, a função f (x) = x|x| possui derivada f 0(x) = 2|x| e segunda derivada f 00(x) = 2 |x|x . Esta função é contínua e diferenciável em x0 = 0, mas não é duas vezes diferenciável neste ponto. Podemos classificar as funções pelo número de vezes em que elas são diferen- ciáveis em um intervalo. Uma função é de classe C2 se for duas vezes diferenciá- vel, de classe C1 se for diferenciável e de classe C0 se for contínua. De acordo com a propriedade de que toda função diferenciável é contínua, podemos afirmar 142 Diferenciabilidade que o conjunto das funções de classe C2 está contido no conjunto de funções de classe C1, que por sua vez está contido no conjunto de funções de classe C0. Naturalmente podemos definir uma terceira derivada, denotada por f 000(x) ou d3 f dx3 (x), uma quarta derivada, denotada por f 0000(x) ou d 4 f dx4 (x), e assim por sucessi- vamente. Para um número de vezes arbitrário, denotamos a n-ésima derivada de f como f (n)(x) na notação de Lagrange ou d n f dxn (x) na notação de Leibniz. Dizemos que a função é n vezes diferenciável num ponto x0 se a n-ésima derivada neste ponto existir e que a função é de classe Cn em um intervalo (a,b) se a n-ésima derivada for contínua neste intervalo. Se todas as infinitas derivadas de uma função forem contínuas, dizemos que a função é de classe C• e chamamos estas funções de funções suaves. Exemplo 9.8 (Polinômios de terceiro grau). Um polinômio de terceiro grau pode ser escrito na forma p(x) = ax3 +bx2 + cx+d (9.36) com a 6= 0. Como polinômios são funções contínuas em todo x real, esta função é de classe C0 no intervalo (�•,+•). Sua primeira derivada é dada por p0(x) = lim h!0 p(x+h)� p(x) h = lim h!0 1 h ⇥ a(x+h)3 +b(x+h)2 + c(x+h)+d �ax3 �bx2 � cx�d ⇤ = lim h!0 1 h ⇥ ax3 +3ax2h+3axh2 +ah3 +bx2 +2bxh+bh2 +cx+ ch+d �ax3 �bx2 � cx�d ⇤ = lim h!0 1 h ⇥ 3ax2h+3axh2 +ah3 +2bxh+bh2 + ch ⇤ = lim h!0 ⇥ 3ax2 +3axh+ah2 +2bx+bh+ c ⇤ = 3ax2 +2bx+ c . (9.37) A derivada de um polinômio de terceiro grau é um polinômio de segundo grau, que é uma função contínua em todo x real. Portanto polinômios de terceiro grau são funções de classe C1 no intervalo (�•,+•). 9.1 Definição de derivada 143 Agora calculamos a segunda derivada. p00(x) = lim h!0 p0(x+h)� p0(x) h = lim h!0 1 h ⇥ 3a(x+h)2 +2b(x+h)+ c�3ax2 �2bx� c ⇤ = lim h!0 1 h ⇥ 3ax2 +6axh+3ah2 +2bx+2bh+ c�3ax2 �2bx� c ⇤ = lim h!0 1 h ⇥ 6axh+3ah2 +2bh ⇤ = lim h!0 [6ax+3ah+2b] = 6ax+2b . A segunda derivada é um polinômio de primeiro grau, portanto polinômios de terceiro grau são funções de classe C2 em (�•,+•). A terceira derivada é dada por p000(x) = lim h!0 p00(x+h)� p00(x) h = lim h!0 1 h [6a(x+h)+2b�6ax�2b] = lim h!0 1 h [6ax+6ah+2b�6ax�2b] = lim h!0 1 h [6ah] = lim h!0 [6a] = 6a , que é um polinômio de grau zero. Então polinômios de terceiro grau são funções de classe C3 em (�•,+•). Finalmente a quarta derivada vale p0000(x) = lim h!0 p000(x+h)� p000(x)h = lim h!0 6a�6a h = 0 , (9.38) que é uma função nula e portanto contínua. Polinômios de terceiro grau são de classe C4 em (�•,+•). Todos os sucessivos cálculos de derivadas resultam numa função nula. Portanto todas as infinitas derivadas do polinômio de terceiro grau são funções contínuas em todo x real e estas funções são suaves. 144 Diferenciabilidade 9.1.6 Propriedades de derivada O cálculo de derivadas pode ser um processo trabalhoso mesmo para funções simples como polinômios se aplicarmos somente a definição. É conveniente de- duzirmos regras de derivação que nos permitem reduzir o cálculo de uma derivada complicada em diversos cálculos de derivadas simples. Começamos com as derivadas das funções elementares, que são polinômios, trigononométricas, exponenciais e logarítmicas e em seguida veremos como combiná- las. Teorema 9.2. Seja n um número inteiro positivo. Então (a) Se f (x) = xn, f 0(x) = n ·xn�1; (b) Se f (x) = x�n, f 0(x) =�n ·x�n�1; (c) Se f (x) = x 1 n , f 0(x) = 1n ·x 1 n�1. Demonstração. Se f (x) = xn, então f 0(x) = lim h!0 (x+h)n � xn h . (9.39) Pelo binômio de Newton, (x+h)n = n  k=0 n! k!(n� k)!x n�khk . (9.40) Nesta dedução é importante escrever isoladamente os dois primeiros termos desta somatória, que são (x+h)n = n! 0!(n�0)!x n�0h0+ n! 1!(n�1)!x n�1h1+ n  k=2 n! k!(n� k)!x n�khk (9.41) ou (x+h)n = xn +nxn�1h+ n  k=2 n! k!(n� k)!x n�khk (9.42) Nesta somatória restante todos os termos possuem uma potência h2 ou maior. 9.1 Definição de derivada 145 Substituindo na fórmula da derivada temos f 0(x) = lim h!0 1 h " xn +nxn�1h+ n  k=2 n! k!(n� k)!x n�khk ! � xn # = lim h!0 1 h " nxn�1h+ n  k=2 n! k!(n� k)!x n�khk # = lim h!0 " nxn�1 + n  k=2 n! k!(n� k)!x n�khk�1 # . (9.43) Nesta última somatória a menor potência em h é h1. Se isolarmos um h fora da somatória escrevemos f 0(x) = lim h!0 " nxn�1 +h n  k=2 n! k!(n� k)!x n�khk�2 # (9.44) e podemos considerar esta somatória como um polinômio na variável h. Como polinômios são funções contínuas, o limite desta somatória é algum número real A. Então o limite acima vale f 0(x) = nxn�1 +0 ·A = nxn�1 . (9.45) Agora provamos o segundo caso. Se f (x) = x�n = 1xn , f 0(x) = lim h!0 f (x+h)� f (x) h = lim h!0 1 h 1 (x+h)n � 1 xn � = lim h!0 1 h xn � (x+h)n xn(x+h)n � = lim h!0 (x+h)n � xn h � · lim h!0 �1 xn(x+h)n = nxn�1 · �1 xn ·xn =�nx �n�1 . (9.46) Por fim, se f (x) = x 1 n = n p x, f 0(x) = lim h!0 n p x+h� n p x h . (9.47) Seja v = n p x e u = n p x+h. Elevando a n temos vn = x e un = x+h = vn +h. Em termos da variável u escrevemos o limite como f 0(x) = lim u!v u� v un � vn . (9.48) 146 Diferenciabilidade Agora fazemos uma mudança de variáveis adicional u = v+ t e f 0(x) = lim t!0 t (v+ t)n � vn = 1 lim t!0 (v+t)n�vn t . (9.49) Este limite no denominador já foi calculado. lim t!0 (v+ t)n � vn t = nvn�1 = n vn v = n x x 1 n . (9.50) Então f 0(x) = 1 n x x 1 n = 1 n x 1 n�1 . (9.51) Teorema 9.3. Se f (x) = sen(x) e g(x) = cos(x), então f 0(x) = cos(x) e g0(x) =�sen(x). Demonstração. A derivada do seno é dada por f 0(x) = lim h!0 sen(x+h)� sen(x) h . (9.52) Pelas propriedades trigonométricas, escrevemos o limite como f 0(x) = lim h!0 sen(x)cos(h)+ cos(x)sen(h)� sen(x) h (9.53) ou f 0(x) = lim h!0 sen(x) cos(h)�1 h + cos(x) sen(h) h � . (9.54) Pelas propriedades de limite, f 0(x) = sen(x) lim h!0 cos(h)�1 h � + cos(x) lim h!0 sen(h) h � . (9.55) Os limites restantes são limites fundamentais, lim h!0 sen(h) h = 0 e lim h!0 cos(h)�1 h = 0 . (9.56) Portanto f 0(x) = 0 · sen(x)+1 · cos(x) = cos(x) . (9.57) 9.1 Definição de derivada 147 A derivada do cosseno é g0(x) = lim h!0 cos(x+h)� cos(x) h = lim h!0 cos(x)cos(h)� sen(x)sen(h)� cos(x) h = cos(x) lim h!0 cos(h)�1 h � � sen(x) lim h!0 sen(h) h � = cos(x) ·0� sen(x) ·1 =�sen(x) . Teorema 9.4. Se f (x) = ax e g(x) = loga(x) com a > 0 e a 6= 1, f 0(x) = ax loge(a) e g0(x) = 1 x loga(e). Demonstração. Começamos pela exponencial. f 0(x) = lim h!0 ax+h �ax h = lim h!0 ax ·ah �ax h = ax lim h!0 ah �1 h . (9.58) Este último limite em h é um limite fundamental que vimos que vale loge(a). Então f 0(x) = ax loge(a) . (9.59) A derivada do logaritmo é g0(x) = lim h!0 loga(x+h)� loga(x) h = lim h!0 1 h loga ✓ x+h h ◆ = lim h!0 1 h loga ✓ 1+ h x ◆ . (9.60) Para remover o x de dentro do logaritmo, fazemos a mudança de variáveis u = hx , que tende a zero quando h tende a zero. Assim g0(x) = lim u!0 1 x ·u loga (1+u) = 1 x lim u!0 loga h (1+u) 1 u i , (9.61) onde o termo 1x saiu do limite por ser constante. Como a função logarítmica é contínua, podemos passar o limite para o argumento da função e g0(x) = 1 x loga lim u!0 (1+u) 1 u � = 1 x loga(e) . (9.62) 148 Diferenciabilidade Em particular, se escolhermos o número de Euler como base da função expo- nencial temos que d dx (ex) = ex . (9.63) A função exponencial de base e é uma função cuja derivada é igual a ela mesma, e é a única base com esta propriedade. A função logarítmica de base e possui derivada d dx (loge(x)) = 1 x . (9.64) Esta é a única base em que a derivada do logaritmo é igual ao inverso do argu- mento. Estas propriedades tornam o número de Euler a base mais conveniente para as diversas aplicações do cálculo diferencial e integral, motivo pelo qual fun- ções exponenciais e logarítmicas sem base explícita (como nas expressões exp(x) e log(x)) serão presumidas como base e, isto é, exp(x) = ex e log(x) = loge(x) . (9.65) O logaritmo de base e é também chamado de logaritmo natural e denotado muitas vezes como ln(x), ou seja, ln(x) = log(x) = loge(x) . (9.66) A partir destas funções elementares podemos construir diversas funções im- portantes pelas operações algébricas entre as funções vistas. Teorema 9.5 (Álgebra de derivadas). Se f e g são diferenciáveis em x e k é uma constante, então: (a) a soma f +g é diferenciável e ( f (x)+g(x))0 = f 0(x)+g0(x); (b) a multiplicação por escalar k · f é diferenciável e (k · f (x))0 = k · f 0(x); (c) o produto f ·g é diferenciável e ( f (x) ·g(x))0 = f (x)g0(x)+ f 0(x) ·g(x); (d) a razão f/g é diferenciável e ⇣ f (x) g(x) ⌘0 = f 0(x) ·g(x)� f (x) ·g0(x) g2(x) se g(x) 6= 0. Demonstração. ( f +g)0(x) = lim h!0 f (x+h)+g(x+h)� ( f (x)+g(x)) h = lim h!0 f (x+h)� f (x) h + g(x+h)�g(x) h � = lim h!0 f (x+h)� f (x) h + lim h!0 g(x+h)�g(x) h = f 0(x)+g0(x) . (9.67) 9.1 Definição de derivada 149 (k · f )0 (x) = lim h!0 k · f (x+h)� k · f (x) h = lim h!0 k f (x+h)� f (x) h = k lim h!0 f (x+h)� f (x) h = k · f 0(x) . (9.68) ( f ·g)0 (x) = lim h!0 f (x+h) ·g(x+h)� f (x) ·g(x) h = lim h!0 f (x+h) ·g(x+h)� f (x) ·g(x+h)+ f (x) ·g(x+h)� f (x) ·g(x) h = lim h!0 [ f (x+h)� f (x)]g(x+h)+ f (x) [g(x+h)�g(x)] h = lim h!0 f (x+h)� f (x) h · lim h!0 g(x+h)+ lim h!0 f (x) · lim h!0 g(x+h)�g(x) h = f 0(x)g(x)+ f (x)g0(x) . (9.69) ✓ f g ◆0 (x) = lim h!0 f (x+h) g(x+h) � f (x) g(x) h = lim h!0 1 h f (x+h)g(x)� f (x)g(x+h) g(x)g(x+h) � = lim h!0 1 h f (x+h)g(x)� f (x)g(x)+ f (x)g(x)� f (x)g(x+h) g(x)g(x+h) � = lim h!0 ⇢ 1 g(x)g(x+h) ✓ f (x+h)� f (x) h ◆ g(x)� f (x) ✓ g(x+h)�g(x) h ◆�� = lim h!0 1 g(x)g(x+h) �✓ lim h!0 f (x+h)� f (x) h ◆ g(x)� f (x) ✓ lim h!0 g(x+h)�g(x) h ◆� = f 0(x)g(x)� f (x)g0(x) g2(x) , (9.70) se g(x) 6= 0. Exemplo 9.9 (Polinômios de terceiro grau). Voltando ao caso do polinômio de terceiro grau, cuja derivada já calculamos pela definição, seja p(x) = ax3 +bx2 + cx+d . (9.71) 150 Diferenciabilidade Como a derivada da soma de funções é a soma das derivadas das funções podemos escrever p0(x) = � ax3 �0 + � bx2 �0 +(cx)0+(d)0 . (9.72) A derivada de uma constante vezes uma função é a constante vezes a derivada da função. Então p0(x) = a � x3 �0 +b � x2 �0 + c(x)0+d (1)0 . (9.73) Agora sabendo que (xn)0 = nxn�1 concluímos que p0(x)= a ·3x2 +b ·2x+ c ·1+d ·0 (9.74) ou apenas p0(x) = 3ax2 +2bx+ c . (9.75) Exemplo 9.10 (Polinômios de grau n). Um polinômio de grau n pode ser escrito como p(x) = cnxn + cn�1xn�1 + · · ·+ c1x+ c0 = n  k=0 ckxk . (9.76) A derivada deste polinômio de acordo com as regras já vistas é dada por p0(x) = n  k=0 ckxk !0 = n  k=0 ⇣ ckxk ⌘0 = n  k=0 ck ⇣ xk ⌘0 . (9.77) Sabendo que (xk)0 = kxk�1 se k > 0 e (x0)0 = 0, o termo referente a k = 0 na somatória é nulo e pode ser ignorado. Assim p0(x) = n  k=1 kckxk�1 (9.78) ou p0(x) = ncnxn�1 +(n�1)cn�1xn�2 + · · ·+2c2x+ c1 . (9.79) A derivada de um polinômio de grau n é um polinômio de grau n� 1. Por este motivo, a segunda derivada será um polinômio de grau n� 2 e cada operação de derivação reduz em um o grau do polinômio, até eventualmente chegar numa função constante. A partir daí as demais derivadas são todas nulas. Como todo po- linômio é uma função contínua em toda reta real, polinômios são funções suaves em todo o seu domínio. 9.1 Definição de derivada 151 Exemplo 9.11 (Função racional). Seja a seguinte razão entre polinômios, f (x) = x2 �1 x2 +1 . (9.80) Podemos calcular a derivada desta função pela definição, que é uma operação trabalhosa, ou podemos utilizar a regra da razão. Seja p(x) = x2 � 1 e q(x) = x2 +1. Assim f 0(x) = ✓ p(x) q(x) ◆0 = p0(x)q(x)� p(x)q0(x) q2(x) = 2x(x2 +1)� (x2 �1)2x (x2 +1)2 = 2x3 +2x�2x3 +2x x4 +2x2 +1 = 4x x4 +2x2 +1 . (9.81) Como o denominador nunca se anula, esta derivada é contínua em todo x real portanto a função f é de classe C1. Exemplo 9.12. Consideramos agora a função f (x) = x · log(x) . (9.82) Pela regra do produto, f 0(x) = (x · log(x))0= (x)0 · log(x)+x · (log(x))0= 1 · log(x)+x · 1 x = log(x)+1 . (9.83) Como log(x) e a função constante 1 são contínuas no domínio de f , esta função é de classe C1 no conjunto dos números positivos. Exemplo 9.13. Seja agora f (x) = x2 ·ex . (9.84) Novamente utilizamos a regra do produto. f 0(x) = � x2ex �0 = � x2 �0 ·ex + x2 · (ex) = 2xex + x2ex = (x2 +2x)ex . (9.85) Polinômios e funções exponenciais são contínuas em todo x real, portanto esta função é de classe C1 em todo o seu domínio. 152 Diferenciabilidade Exemplo 9.14. Conhecendo a derivada das funções trigonométricas simples podemos calcular a derivada das demais funções trigonométricas. Por exemplo, a função f (x) = tan(x) (9.86) é contínua nos pontos em que cos(x) 6= 0. Em particular, esta função é contínua no intervalo aberto (�p2 ,+ p 2 ). Pela regra da razão, f 0(x) = ✓ sen(x) cos(x) ◆0 = (sen(x))0 cos(x)� sen(x)(cos(x))0 cos2(x) = cos(x) · cos(x)� sen(x) · (�sen(x)) cos2(x) = cos2(x)+ sen2(x) cos2(x) = 1 cos2(x) = sec2(x) . (9.87) Esta derivada é contínua no intervalo (�p2 ,+ p 2 ), então a tangente é de classe C 1 neste intervalo ou em qualquer intervalo que não contenha uma raiz do cosseno. Exemplo 9.15. O domínio da função f (x) = sec(x) (9.88) é o mesmo da função tangente. A derivada é f 0(x) = ✓ 1 cos(x) ◆0 = (1)0 · cos(x)�1 · (cos(x))0 cos2(x) = 0 · cos(x)�1 ·(�sen(x)) cos2(x) = sen(x) cos2(x) = tan(x) · sec(x) . (9.89) Esta função é de classe C1 em qualquer intervalo que não contenha uma raiz do cosseno. Exemplo 9.16. Das propriedades de exponenciação sabemos que xn+m = xn ·xm (9.90) com n e m positivos. Então a derivada da função xn+m deve ser igual à derivada do produto xn ·xm. Escrevendo k = n+m, que é um número inteiro positivo, temos que � xn+m �0 = ⇣ xk ⌘0 = kxk�1 = (n+m)xn+m�1 . (9.91) 9.1 Definição de derivada 153 Pela regra do produto, (xn ·xm)0 = (xn)0 ·xm + xn · (xm)0 = n ·xn�1 ·xm + xn ·m ·xm�1 = nxn�1+m +mxn+m�1 = (n+m)xn+m�1 . (9.92) Como era de se esperar, o resultado é o mesmo. 154 Diferenciabilidade 9.2 Regra da cadeia Conhecendo as derivadas de funções elementares podemos deduzir derivadas de funções mais complicadas mas que podem ser escritas como composições de funções elementares. Se, por exemplo, p(x) = 1+ x2 e q(x) = cos(x), sabemos calcular as derivadas p0(x) = 2x e q0(x) =�sen(x). Podemos a partir destas deri- vadas simples calcular a derivada das composições p(q(x)) = 1+ cos2(x) e q(p(x)) = cos(1+ x2) ? (9.93) A derivada da composição p(q(x)) pode ser calculada pelas regras de derivada da soma e do produto, mas a segunda não. Para evitar confusões com as variáveis podemos escrever h(u) = f (u), u(x) = g(x) e a composição h = f � g como h(x) = f (g(x)). Sabemos que se g(x) é contínua em x0 e f (u) é contínua em u0 = g(x0), a composição h(x) = f (g(x)) é contínua em x0, que é uma condição necessária para h(x) ser diferenciável em x0. Sabendo que g(x) é diferenciável em x0 e que f (u) é diferenciável em u0 = g(x0), podemos afirmar que h(x) = f (g(x)) é também diferenciável em x0? Pela definição precisamos mostrar que algum dos limites lim h!0 f (g(x+h))� f (g(x)) h ou lim x1!x0 f (g(x1))� f (g(x0)) x1 � x0 (9.94) existe. É tentador multiplicar e dividir a função que aparece no segundo limite por g(x1)�g(x0) e obter lim x1!x0 f (g(x1))� f (g(x0)) x1 � x0 = lim x1!x0 f (g(x1))� f (g(x0)) g(x1)�g(x0) g(x1)�g(x0) x1 � x0 (9.95) e pela propriedade do limite do produto temos lim x1!x0 f (g(x1))� f (g(x0)) x1 � x0 = lim x1!x0 f (g(x1))� f (g(x0)) g(x1)�g(x0) · lim x1!x0 g(x1)�g(x0) x1 � x0 . (9.96) Este segundo limite existe por hipótese e vale g0(x0). O primeiro limite é um pouco mais sutil. Se tivéssemos x1 � x0 no denominador poderíamos garantir que em qualquer vizinhança de x0 exceto no x0 a diferença x1�x0 é sempre não nula e não há risco de divisão por zero nos valores de x1 que satisfazem 0 < |x1�x0|< d. O denominador g(x1)� g(x0) é obviamente nulo se x1 = x0. Suponha que exista alguma vizinhança de x0 na qual g(x1) 6= g(x0) sempre que 0< |x1�x0|< d. Neste caso a razão f (g(x1))� f (g(x0)) g(x1)�g(x0) (9.97) 9.2 Regra da cadeia 155 está definida em toda a vizinhança e podemos fazer a substituição u= g(x1). Lem- brando que g(x) é contínua em x0 e u0 = g(x0), temos que lim x1!x0 g(x1) = g(x0) = u0 . (9.98) Portanto fazendo a substituição de variáveis u1 = g(x1) calculamos lim x1!x0 f (g(x1))� f (g(x0)) g(x1)�g(x0) = lim u1!u0 f (u1)� f (u0) u1 �u0 . (9.99) Como sabemos que f (u) é diferenciável em u0, lim u1!u0 f (u1)� f (u0) u1 �u0 = f 0(u0) = f 0(g(x0)) . (9.100) Neste caso lim x1!x0 f (g(x1))� f (g(x0)) x1 � x0 = f 0(g(x0)) ·g0(x0) . (9.101) No entanto nem sempre podemos garantir que g(x1) 6= g(x0) se x1 6= x0. Por exemplo, a função g(x) = ⇢ 0 , se x = 0 x2 sen � p x � , se x 6= 0 (9.102) é contínua em todo x real (inclusive em x0 = 0) mas toda vizinhança de x0 = 0 possui infinitos pontos nos quais g(x) = 0, invalidando o argumento de que g(x1)�g(x0) 6= 0 em toda a vizinhança de x0. Este problema pode ser contornado se definirmos a seguinte função. Q(u) = ( f 0(u0) , se u = u0 f (u)� f (u0) u�u0 , se u 6= u0 (9.103) Como f (u) é diferenciável em u0, lim u!u0 Q(u) = lim u!u0 f (u)� f (u0) u�u0 = f 0(u0) = Q(u0) , (9.104) ou seja, Q é contínua em u0. Se u1 6= u0, pela maneira como definimos Q(u1) temos que f (u1)� f (u0) = Q(u1)(u1 �u0) (9.105) e nesta expressão não temos divisões por zero. 156 Diferenciabilidade Escrevendo u1 = g(x1) e u0 = g(x0) escrevemos esta última expressão como f (g(x1))� f (g(x0)) = Q(g(x1))(g(x1)�g(x0)) (9.106) ainda sem divisões por zero. Agora se dividirmos por x1 � x0, que é sempre dife- rente se zero se x1 6= x0, temos f (g(x1))� f (g(x0)) x1 � x0 = Q(g(x1)) g(x1)�g(x0) x1 � x0 (9.107) e o limite desta função quando x1 tende a x0 pode ser calculado sem riscos de divisão por zero. Pela propriedade do limite de produto de funções temos lim x1!x0 f (g(x1))� f (g(x0)) x1 � x0 = lim x1!x0 Q(g(x1)) � lim x1!x0 g(x1)�g(x0) x1 � x0 � . (9.108) Já mostramos que Q(u1) é contínua em u0 = g(x0). Como g é diferenciável em x0, ela deve ser contínua e portanto a composição Q(g(x1)) também é contínua em x0, que implica lim x1!x0 Q(g(x1)) = Q(g(x0)) = Q(u0) = f 0(u0)= f 0(g(x0)) . (9.109) Portanto lim x1!x0 f (g(x1))� f (g(x0)) x1 � x0 = f 0(g(x0)) ·g0(x0) . (9.110) Este resultado é conhecido como regra da cadeia. Teorema 9.6 (Regra da cadeia). Se g(x) é diferenciável em x0 e f (u) é diferenciável em u0 = g(x0), a compo- sição h(x) = f (g(x)) é diferenciável em x0 e h0(x0) = f 0(g(x0)) ·g0(x0) . (9.111) A função derivada da composição h(x) = f (g(x)) é dada por h0(x) = f 0(g(x)) ·g0(x) . (9.112) A composição será de classe C1 sempre que o lado direito da equação acima for uma função contínua. Na notação de Leibniz, escrevendo h(x)= f (u) e u(x)= g(x), o termo f 0(g(x)) pode ser denotado como d fdu ou d f dg , enquanto o termo g 0(x) é denotado como dgdx ou dudx . Então a derivada da composição h(x) = f (g(x)) = f (u) pode ser denotada como dh dx = dh du du dx . (9.113) 9.2 Regra da cadeia 157 Exemplo 9.17. Seja a função f (x) = sen(x2) , (9.114) que é a composição das funções f (u) = sen(u) e u(x) = x2 . (9.115) As derivadas destas funções simples são d f du (u) = cos(u) e du dx (x) = 2x . (9.116) Então pela regra da cadeia, f 0(x) = d f dx (x) = d f du (u(x)) du dx (x) = cos(u(x))2x = 2xcos(x2) . (9.117) Exemplo 9.18. Seja agora a função f (x) = ea ·x , (9.118) que é a composição das funções f (u) = eu u(x) = a ·x . (9.119) As derivadas das funções simples são d f du (u) = eu e du dx (x) = a . (9.120) Pela regra da cadeia, f 0(x) = d f dx (x) = d f du (u(x)) du dx (x) = eu(x) ·a = aea ·x . (9.121) Exemplo 9.19. Seja a composição f (x) = (g(x))n , (9.122) onde g é uma função diferenciável. Escrevendo u = g(x), podemos escrever de f como f (x) = f (u(x)) (9.123) 158 Diferenciabilidade e sua derivada como d f dx = d f du du dx . (9.124) A primeira destas derivadas é d f du = nun�1 (9.125) enquanto a segunda é du dx = u0(x) = g0(x) . (9.126) Lembrando que na regra da cadeia devemos substituir u por g(x), então a derivada de f é f 0(x) = n(u(x))n�1 u0(x) = n(g(x))n�1 g0(x) . (9.127) Exemplo 9.20. Imagine que uma esfera está expandindo e o seu raio dobra a cada segundo, ou seja, depende do tempo de acordo com a função r(t) = r02t , (9.128) onde r0 é o raio inicial da esfera quando t = 0. A taxa de variação do volume da esfera em relação ao tempo é dada, de acordo com a regra da cadeia, por dV dt = dV dr dr dt . (9.129) Sabendo que V (r) = 4 3 pr3 , dV dr = 4pr2 . (9.130) Calculamos também dr dt = r0 d dt 2t = r02t log(2) . (9.131) Então a taxa de variação do volume da esfera em relação ao tempo é dV dt = 4p(r(t))2 ·r02t log(2) = 4p � r02t �2 ·r02t log(2) = 4 3 pr30 � 23t3log(2) . (9.132) O termo entre colchetes pode ser identificado como o volume inicial da esfera, que denotamos por V0. Assim dV dt =V023t3log(2) . (9.133) 9.2 Regra da cadeia 159 Exemplo 9.21. Sejam f e g funções diferenciáveis em um intervalo no qual f (x) > 0, para que f (x) possa ser a base de uma função exponencial. Assim podemos definir a composição y(x) = ( f (x))g(x) . (9.134) Conhecendo a derivada de f (x) e de g(x), podemos calcular a derivada da função y(x). Pelas propriedades da exponenciação de números reais temos y(x)> 0. Como já visto, a base mais conveniente para derivadas de exponencial é a base e. Calcu- lando o logaritmo natural dos dois lados da equação (9.134) temos log [y(x)] = log h ( f (x))g(x) i = g(x) · log( f (x)) . (9.135) Calculando a exponencial dos dois lados recuperamos y(x) como y(x) = eg(x) · log( f (x)) . (9.136) Esta forma é mais conveniente para aplicarmos a regra da cadeia. Agora y(x) é a composição das funções y(u) = eu e u(x) = g(x) · log( f (x)) . (9.137) A derivada de y(x) pela regra da cadeia é dy dx = dy du du dx , (9.138) sendo dy du = d du (eu) = eu (9.139) e du dx = d dx (g(x) · log( f (x))) , (9.140) que calculamos com a regra do produto, ou seja, du dx = g0(x) · log( f (x))+g(x) · (log( f (x)))0 . (9.141) Esta última derivada necessida também da regra da cadeia para ser calculada. Escrevendo v = f (x) temos que d dx [log( f (x))] = d dv [log(v)] · dv dx = 1 v ·v0(x) = 1 f (x) · f 0(x) . (9.142) 160 Diferenciabilidade Então d dx (g(x) · log( f (x))) = g0(x) · log( f (x))+g(x) f 0(x) f (x) . (9.143) Assim finalmente calculamos a derivada da composição y(x) como dy dx = eu(x) · g0(x) · log( f (x))+g(x) f 0(x) f (x) � = eg(x) · log( f (x)) · g0(x) · log( f (x))+g(x) f 0(x) f (x) � (9.144) ou apenas dy dx = ( f (x))g(x) · g0(x) · log( f (x))+g(x) f 0(x) f (x) � . (9.145) Esta fórmula tem diversos casos particulares interessantes, abordados nos pró- ximos exemplos. Exemplo 9.22. Seja f (x) = x e g(x) = x. Então para todo x > 0 podemos definir a composição y(x) = xx . (9.146) Neste caso f 0(x) = 1 e g0(x) = 1, então d dx (xx) = xx 1 · log(x)+ x1 x � = xx [log(x)+1] . (9.147) Exemplo 9.23. Seja f (x) = x e g(x) = a onde a é um número real qualquer mantido constante. Então para todo x > 0 podemos definir a composição y(x) = xa (9.148) e f 0(x) = 1 e g0(x) = 0, então d dx (xa) = xa 0 · log(x)+a1 x � = xa ⇣a x ⌘ = a ·xa�1 , (9.149) que é um resultado já conhecido para a inteiro, mas agora generalizado para qual- quer a real desde que x seja positivo. 9.3 Definição alternativa de diferenciabilidade 161 Exemplo 9.24. Seja f (x) = a e g(x) = x onde a é um número real positivo mantido constante. Então para todo x real podemos definir a composição y(x) = ax (9.150) e f 0(x) = 0 e g0(x) = 1, então d dx (ax) = ax 1 · log(a)+01 x � = ax log(a) . (9.151) que também é um resultado conhecido. É importante lembrar que este exemplo é no máximo um teste de consistência da operação de derivada, porque a propri- edade de que (ax)0 = ax · log(a) foi utilizada para podermos deduzir a derivada de f (x)g(x), então a fórmula da derivada desta composição não pode ser utilizada para deduzir a derivada de ax. Esta dedução deve ser feita com a definição e com o limite fundamental, como visto. Exemplo 9.25. Pela regra da divisão, sabemos que se g(x) = 1f (x) , g0(x) = (1)0 · f (x)�1 · f 0(x) f 2(x) =� f 0(x) f 2(x) . (9.152) Este resultado pode ser obtido também através da regra da cadeia, escrevendo g(u) = 1u com u = f (x). Então dg dx = dg du du dx = ✓ � 1 u2 ◆ ·u0(x) =� 1 f 2(x) f 0(x) . (9.153) 9.3 Definição alternativa de diferenciabilidade Na dedução da regra da cadeia, para evitar divisões por zero definimos uma função Q(x) = ( f 0(x0) , se x = x0 f (x)� f (x0) x�x0 , se x 6= x0 (9.154) que é contínua em x0 desde que f seja diferenciável em x0. Agora veremos uma interpretação geométrica para esta função. Seja x = x0 +Dx, onde Dx > 0 é o incremento na variável x a partir de x0. Calculando Q neste ponto temos Q(x0 +Dx) = f (x0 +Dx)� f (x0) (x0 +Dx)� x0 = f (x0 +Dx)� f (x0) Dx . (9.155) 162 Diferenciabilidade Este numerador é o incremento ao longo da curva y = f (x), que representamos pelo símbolo Dy. Então a função Q(x) nada mais é que a razão entre o incremento ao longo da curva e o incremento na variável. x y x f(x) x+h f(x+h) Δx Δy dy E(x) Calculando a equação da reta tangente à curva y = f (x), desenhada com uma li- nha tracejada azul na figura ao lado e re- presentada pela equação y = f (x0)+ f 0(x0)(x�x0) , (9.156) podemos calcular também o incremento ao longo da reta tangente após um incre- mento Dx a partir de x0, que denotamos pelo símbolo dy. Então de acordo com a equação da reta tangente, dy = ⇥ f (x0)+ f 0(x0)(x0 +Dx� x0) ⇤ � f (x0) = f 0(x0)Dx . (9.157) A diferença entre o incremento ao longo da curva Dy e o incremento ao longo da reta tangente dy é chamada de erro da aproximação da curva y = f (x) pela reta tangente a esta curva no ponto (x0, f (x0)), E(x) = Dy�dy = f (x0 +Dx)� f (x0)� f 0(x0)Dx . (9.158) Em termos da função Q(x) podemos escrever o erro da aproximação como E(x) = Q(x)Dx�Q(x0)Dx = [Q(x)�Q(x0)]Dx . (9.159) O termo entre colchetes pode ser escrito como uma função e1(x). Vimos que se f é diferenciável em x0,a função Q é contínua em x0 e lim x!x0 e1(x) = limx!x0 [Q(x)�Q(x0)] = 0 . (9.160) Escrevendo a variável x em termos do incremento Dx temos que lim Dx!0 e1 = 0 . (9.161) Portanto, se f é diferenciável em x0, podemos escrever f (x0 +Dx) = f (x0)+ f 0(x0)Dx+ e1 ·Dx onde lim Dx!0 e1 = 0 . (9.162) Imagine agora que antes de verificar que f é diferenciável conseguimos mos- trar que f (x0 +Dx) = f (x0)+A ·Dx+ e1 ·Dx (9.163) 9.3 Definição alternativa de diferenciabilidade 163 onde A é um número real que pode depender ou não de x0, mas não de Dx e e1 é uma função qualquer que tende a zero quando Dx tende a zero. Então a derivada de f em x0 vale f 0(x0) = lim Dx!0 f (x0 +Dx)� f (x0) Dx = lim Dx!0 A ·Dx+ e1 ·Dx Dx = lim Dx!0 (A+ e1) = A . (9.164) Então toda função que pode ser escrita na forma da equação (9.163) é diferenciá- vel e sua derivada vale A. Deduzimos assim a seguinte propriedade. Teorema 9.7. Uma função f é diferenciável em x0 se e somente se for possível escrever f (x0 +Dx) = f (x0)+ f 0(x0) ·Dx+ e1 ·Dx onde lim Dx!0 e1 = 0 . (9.165) Em outras palavras, dizemos que f é diferenciável em x0 se e somente se o erro da aproximação da curva y = f (x) pela reta tangente em (x0, f (x0)) dada por E(x) = e1 ·Dx tender a zero mais rápido que o incremento Dx. Devido a este fato, entre todas as retas que podemos utilizar para aproximar o valor da função f (x) na vizinhança de x0, a reta tangente é a que melhor aproxima a curva. Exemplo 9.26. Seja f (x) = x3. Imagine que ainda não sabemos se f é diferenciável e quere- mos calcular a derivada de acordo com a equação (9.165). Num ponto x0 qualquer escrevemos f (x0) = x30 e após um incremento Dx temos f (x0 +Dx) = (x0 +Dx)3 = x30 +3x 2 0Dx+3x0Dx 2 +Dx3 . (9.166) O único termo que não multiplica Dx é de fato f (x0). O termo que possui apenas um fator Dx é escrito como A ·Dx. Os demais termos possuem uma potência Dx2 ou maior, e podemos isolar um Dx, resultando em f (x0 +Dx) = f (x0)+ � 3x20 � ·Dx+ ⇥ 3x0D+Dx2 ⇤ ·Dx . (9.167) Nesta expressão reconhecemos o termo entre colchetes como o e1 e lim Dx!0 e1 = lim Dx!0 ⇥ 3x0D+Dx2 ⇤ = 3x0 ·0+02 = 0 . (9.168) Então de acordo com o teorema anterior f é diferenciável em x0 e sua derivada é dada pelo termo que não depende de Dx que multiplica Dx, isto é, f 0(x0) = 3x20 . (9.169) 164 Diferenciabilidade Como o teorema que permite calcular a derivada desta maneira é uma condi- ção necessária e suficiente, podemos definir a derivada de uma função pela equa- ção (9.165). Esta definição alternativa de diferenciabilidade parece desnecessária, e se nos limitarmos ao estudo de funções reais de uma única variável real ela é mesmo. Esta definição alternativa será importante para definir a diferenciabili- dade de funções de várias variáveis, pois neste caso é possível que as derivadas da função em relação a cada variável existam e mesmo assim a função não ser diferenciável em um ponto, problema este que é resolvido com esta definição al- ternativa. 9.3.1 Diferenciais Se escrevermos o incremento Dx como um incremento infinitesimal, que de- notamos pelo símbolo dx, o incremento ao longo da reta tangente é escrito como dy = f 0(x0)dx ou d f = f 0(x0)dx . (9.170) Chamamos agora o símbolo dy de incremento infinitesimal ao longo da reta tan- gente. Num ponto x qualquer este incremento infinitesimal é calculado como dy = f 0(x)dx ou d f = f 0(x)dx . (9.171) Note que nesta equação as quantidades x e dx são independentes. x é o ponto no qual calculamos a reta tangente à curva y = f (x), e dx é um incremento infinitesi- mal na variável x. Quando escrito desta forma, o incremento infinitesimal dy é chamado de dife- rencial de y ou da função f . Na notação de Leibniz o diferencial é escrito como dy = dy dx dx ou d f = d f dx dx . (9.172) É tentador pensar que o símbolo dydx é uma razão entre diferenciais. Mas a operação de divisão por um diferencial não é bem definida. Esta última equação deve ser entendida como “o diferencial dy é igual à multiplicação do diferencial dx pelo número real dydx” mais ou menos como entendemos que um vetor pode ser obtido pela multiplicação de outro vetor por um número real qualquer, mas não existe a operação de divisão por vetor. Podemos descrever o diferencial de uma função como um operador diferencial d que age em uma função f e retorna o diferencial d f , isto é, d f = d( f (x)) = f 0(x)dx . (9.173) 9.3 Definição alternativa de diferenciabilidade 165 Exemplo 9.27. Se f (x) = xn, vimos que f 0(x) = nxn�1. Então o diferencial de f é dado por d f = f 0(x)dx = nxn�1dx . (9.174) Exemplo 9.28. Se f (x) = sen(x), vimos que f 0(x) = cos(x). Então o diferencial de f é dado por d f = f 0(x)dx = cos(x)dx . (9.175) Exemplo 9.29. Se f (x) = tan(x2), pela regra da cadeia escrevemos u = x2 e d f dx = d f du du dx = sec2(u) ·x = 2xsec2(x2) . (9.176) O diferencial de f é dado por d f = 2xsec2(x2)dx . (9.177) Exemplo 9.30. Se f (x) = e� x2 2 , pela regra da cadeia escrevemos u =� x22 e d f dx = d f du du dx = eu ·(�x) =�xe� x2 2 (9.178) O diferencial de f é dado por d f =�xe� x2 2 dx . (9.179) 166 Diferenciabilidade 9.4 Funções implícitas Uma circunferência de raio a centrada na origem pode ser descrita como o conjunto de pontos com coordenadas (x,y) que satisfazem o vínculo x2 + y2 = a2 . (9.180) Se quisermos isolar a variável y e escrevê-la como função de x, escrevemos y2 = a2 � x2 e encontramos duas soluções para y, dadas por y =± p a2 � x2 . (9.181) Cada sinal desta última equação representa uma curva diferente. A equação y = + p a2 � x2 descreve os pontos da circunferência de raio a com coordenada y po- sitiva ou nula (primeiro e segundo quadrante) enquanto a equação y =� p a2 � x2 descreve os pontos da circunferência com coordenada y negativa ou nula (terceiro e quarto quadrante). No entanto é impossível descrever a circunferência inteira com uma única equação y = f (x) pois uma função não pode ter dois valores dis- tintos para o mesmo x. A equação x2 + y2 = a2 é uma equação que descreve todos os pontos da cir- cunferência, mas ela é um vínculo entre as variáveis x e y e não uma relação que descreve explicitamente o valor de y como função de x ou vice-versa. Esta equação descreve implicitamente a maneira como as variáveis dependem uma da outra e por este motivo é chamada de representação implícita da circunferência, enquanto as equações y =+ p a2 � x2 e y =� p a2 � x2 são representações explí- citas de metade da circunferência cada uma. Seja por exemplo (x0,y0) um ponto da circunferência de raio a centrada na origem que pertence ao primeiro quadrante ou segundo quadrante, isto é, a coor- denada y0 é positiva. A inclinação da reta tangente a este ponto pode ser calculada pela derivada da função explícita f (x) = + p a2 � x2 no ponto x0. Pela regra da cadeia, escrevemos f (x) = p u(x) com u(x) = a2 � x2 e f 0(x) = d f du du dx = 1 2 p u (�2x) = �xp a2 � x2 . (9.182) Então f 0(x0) = �x0 q a2 � x20 =�x0 y0 se y0 > 0 . (9.183) Se o ponto (x0,y0) pertencer ao terceiro ou quarto quadrante, ou seja, y0 < 0, a derivada é calculada pela função explícita f (x) =� p a2 � x2 também pela regra da cadeia, f 0(x) = d f du du dx =� 1 2 p u (�2x) = xp a2 � x2 . (9.184) 9.4 Funções implícitas 167 Então f 0(x0) = +x0 q a2 � x20 =�x0 y0 se y0 < 0 , (9.185) pois neste caso y0 =� q a2 � x20. Tanto para valores em que y0 > 0 quanto y0 < 0 chegamos na mesma expressão para a inclinação da reta tangente m = � x0y0 e a equação da reta tangente é dada por y� y0 = m(x� x0) =) y� y0 =� x0 y0 (x� x0) (9.186) que podemos manipular como y0(y� y0)+ x0(x� x0) = 0 . (9.187) Esta expressão para a derivada ou a equação da reta tangente pode ser obtida de maneira mais simples diretamente da função implítica x2 + y2 = a2 . (9.188) Escrevendo y = f (x) mas sem explicitar a fórmula de f (x) temos x2 +( f (x))2 = a2 . (9.189) Aplicando o operador de derivação dos dois lados temos d dx h x2 +( f (x))2 i = d dx ⇥ a2 ⇤ . (9.190)O lado direito é a derivada de uma função constante e portanto é nulo. O lado esquerdo, pela regra da cadeia, escrevemos como 2x+2 f (x) · f 0(x) = 0 . (9.191) Isolando f 0(x) encontramos a expressão f 0(x) =� 2x 2 f (x) =�x y , (9.192) que é válida sempre que y 6= 0. 168 Diferenciabilidade Exemplo 9.31. x y Seja o par de hipérboles representado im- plicitamente pela equação y2 + xy�1 = 0 . (9.193) Com a fórmula de Bhaskara podemos isolar y e escrever y = �x± p x2 +4 2 (9.194) e cada sinal representa uma hipérbole. Podemos calcular a derivada de cada curva pela função explícita correspondente ou pela equação implícita aplicando o ope- rador de derivação. d dx � y2 + xy+1 � = 0 , (9.195) d dx � y2 � + d dx (xy)+ d dx (1) = 0 , (9.196) 2y dy dx + x · dy dx +1 ·y+0 = 0 , (9.197) (2y+ x) dy dx + y = 0 , (9.198) e finalmente dy dx =� y 2y+ x . (9.199) Exemplo 9.32. Seja a elipse de semi-eixos a e b representada implicitamente pela equação x2 a2 + y2 b2 = 1 . (9.200) A derivada dydx , quando ela existe, pode ser calculada como d dx ✓ x2 a2 + y2 b2 ◆ = d dx (1) , (9.201) 9.4 Funções implícitas 169 que pela regra da cadeia resulta em 2x a2 + 2y b2 dy dx = 0 . (9.202) Isolando o termo dydx encontramos dy dx =�2x a2 b2 2y =�b 2 a2 x y (9.203) se y 6= 0. Exemplo 9.33. Seja agora a equação implícita y+ay = x , onde a > 1 . (9.204) Neste exemplo é impossível isolar a variável y como uma função explícita de x, pois a equação é transcedental. Só podemos calcular a derivada dydx pela derivação implícita. Podemos verificar que a função g(y) = y+ay é estritamente crescente, contí- nua e bijetora. Portanto existe uma função inversa tal que y = g�1(x). No entanto não é possível escrever esta função como uma combinação ou composição das funções elementares. Se aplicarmos o operador de diferenciação nos dois lados da equação implícita obtemos d dx (y+ay) = d dx (x) (9.205) e pela regra da cadeia encontramos dy dx +ay log(a) dy dx = 1 (9.206) e isolando a derivada dydx encontramos a expressão dy dx = 1 1+ay log(a) . (9.207) Como o denominador é sempre não nulo, esta derivada é válida em qualquer ponto da curva. 170 Diferenciabilidade 9.5 Funções inversas Seja f uma função com domínio D f e g uma outra função com domínio Dg. Dizemos que g é inversa à direita de f se f (g(x)) = x , 8x 2 Dg (9.208) e dizemos que g é inversa à esquerda de f se g( f (x)) = x , 8x 2 D f . (9.209) Exemplo 9.34. Sejam as funções f (x) = x2 , g1(x) = p x e g2(x) =� p x , (9.210) com domínios D f = (�•,+•) e Dg1 = Dg2 = [0,+•). Tanto g1 quanto g2 são inversas à direita de f , pois f (g1(x)) = ( p x)2 = x , 8x 2 Dg1 (9.211) e f (g2(x)) = (� p x)2 = x , 8x 2 Dg2 . (9.212) No entanto nenhuma destas funções é inversa à esquerda de f , pois g1( f (x)) = p x2 = |x| 6= x se x < 0 (9.213) e g2( f (x)) =� p x2 =�|x| 6= x se x > 0 . (9.214) Em ambos os casos existem pontos no domínio de f em que g( f (x)) 6= x. Neste exemplo existem duas inversas à direita distintas porque a função f (x)= x2 não é injetora em seu domínio. Para todo y > 0 existem dois valores distintos de x tais que y = f (x). Como a função não é injetora, f não é inversível e não podemos definir uma inversa à esquerda. Somente limitando o domínio de f como o conjunto [0,+•) que f torna-se injetora e g1 é a única inversa à esquerda de f , pois g1( f (x)) = p x2 = |x|= x se x �< 0 . (9.215) Podemos também limitar o domínio de f como o conjunto (�•,0] e g2 torna-se a única inversa à esquerda de f , pois g2( f (x)) =� p x2 =�|x|= x se x 0 . (9.216) 9.5 Funções inversas 171 É possível mostrar que se uma inversa à esquerda existir, ela é única e é tam- bém uma inversa à direita. Neste caso dizemos que f é uma função inversível e a sua inversa à esquerda é a função inversa de f , denotada por f�1(x). Em outras palavras, f�1( f (x)) = x , 8x 2 D f (9.217) e f ( f�1(x)) = x , 8x 2 ¡( f ) . (9.218) Exemplo 9.35. Sejam agora as funções f (x) = x3 e g(x) = 3 p x , (9.219) definidas em todo x real. Neste caso g é inversa à esquerda e à direita de f , pois f (g(x)) = � 3 p x �3 = x , 8x 2 R (9.220) e g( f (x)) = 3 p x3 = x , 8x 2 R . (9.221) Neste caso f é inversível, pois possui inversa à esquerda, e g(x) = f�1(x). Conhecendo a derivada de uma função inversível, podemos calcular a derivada da função inversa pela regra da cadeia. Como visto, se f é inversível com inversa g, então f (g(x)) = x (9.222) em todo o domínio da inversa. Aplicando o operador de diferenciação temos d dx ( f (g(x))) = d dx (x) = 1 . (9.223) De acordo com a regra da cadeia, temos f 0(g(x)) ·g0(x) = 1 . (9.224) Se a derivada f 0(g(x)) é diferente de zero podemos isolar g0(x) e calcular a deri- vada da inversa como g0(x) = 1 f 0(g(x)) . (9.225) 172 Diferenciabilidade Exemplo 9.36. Suponha que não conhecemos a derivada da função log(x), mas sabemos que (ex)0 = ex. Como o logaritmo é a inversa da exponencial, elog(x) = x , 8x > 0 (9.226) e d dx ⇣ elog(x) ⌘ = d dx x = 1 . (9.227) Pela regra da cadeia, escrevemos u = log(x) e d dx ⇣ elog(x) ⌘ = d du (eu) du dx = eu d dx (log(x)) = elog(x) d dx (log(x)) = 1 . (9.228) Portanto d dx (log(x)) = 1 elog(x) = 1 x se x > 0 . (9.229) Exemplo 9.37. A função f (x) = sen(x) não é inversível, pois ela não é injetora em seu domí- nio. Restringindo o domínio ao intervalo [�p2 ,+ p 2 ], a função torna-se estritamente crescente e injetora, com imagem [�1,1]. Com esta restrição definimos a inversa g(x) = arcsen(x), que possui domínio [�1,1] e imagem [�p2 ,+ p 2 ]. A derivada do arcsen(x) é calculada aplicando o operador de diferenciação na equação sen(arcsen(x)) = x , 8x 2 [�1,1] , (9.230) resultando em d dx [sen(arcsen(x))] = 1 . (9.231) Escrevemos u = arcsen(x) para aplicar a regra da cadeia. d dx [sen(u)] = d du [sen(u)] du dx = cos(u) · d dx [arcsen(x)] (9.232) Então d dx [arcsen(x)] = 1 cos(u) = 1 cos(arcsen(x)) . (9.233) Este denominador pode ser simplificado sabendo que cos2(u)+ sen2(u) = 1 , 8u 2 R , (9.234) 9.5 Funções inversas 173 que manipulamos como cos2(u) = 1� sen2(u) (9.235) e calculando a raiz quadrada temos |cos(u)|= q 1� sen2(u) . (9.236) Como u = arcsen(x) pertence ao invervalo [�p2 ,+ p 2 ] em que cos(u) > 0, então |cos(u)|= cos(u) e cos(arcsen(x)) = q 1� sen2(arcsen(x)) = p 1� x2 . (9.237) Portanto d dx [sen(u)] = 1p 1� x2 . (9.238) Esta derivada é contínua no intervalo aberto (�1,1) e é simples verificar que lim x!1� 1p 1� x2 = lim x!�1+ 1p 1� x2 =+• , (9.239) portanto a função arcsen(x) não é diferenciável nos pontos x =±1, apesar de ser contínua no intervalo [�1,1]. Nestes pontos a reta tangente torna-se vertical. Exemplo 9.38. A função f (x) = tan(x) está definida em todos os pontos em que cos(x) 6= 0, mas não é injetora. Restringindo o domínio ao intervalo � �p2 ,+ p 2 � , a função torna-se contínua em todo o intervalo aberto e injetora. A imagem da função é to- dos os números reais. Com esta restrição de domínio podemos definir a inversa da tangente, denotada por arctan(x), com domínio (�•,+•) e imagem � �p2 ,+ p 2 � , que é contínua e estritamente crescente. A derivada do arctan(x) é calculada aplicando o operador de derivação nos dois lados da equação tan(arctan(x)) = x , (9.240) onde escrevemos u = arctan(x) para utilizar a regra da cadeia. d dx [tan(u(x))] = d du [tan(u)] · du dx = sec2(u) · d dx (arctan(x)) . (9.241) Então a derivada do arctan(x) é dada por d dx (arctan(x)) = 1 sec2(u) = 1 sec2(arctan(x)) . (9.242) 174 Diferenciabilidade Esta expressão também pode ser simplificada com propriedades trigonométri- cas. Partimos da equação cos2(u)+ sen2(u) = 1 . (9.243) Como �p2 < u < + p 2 , o cos(u) nunca se anula e podemos dividir a equação por cos2(u), resultando em 1+ tan2(u) = sec2(u) , (9.244) Portanto sec2(arctan(x)) = 1+ tan2(arctan(x)) = 1+ x2 . (9.245) A derivada do arctan(x) pode ser escrita finalmente como ddx (arctan(x)) = 1 1+ x2 . (9.246) Esta derivada é uma função racional cujo denominador nunca se anula, portanto a função arctan(x) é de classe C1 em todo o seu domínio. Exemplo 9.39 (Função extremamente complicada). Seja agora a função f (x) =� r 2 3 · arctan " s 2(3� x) 3(x�2) # , (9.247) que é de fato uma função complicada. Mas podemos calcular derivadas mesmo de funções complicadas como esta aplicando com cuidado as ferramentas conhe- cidas. Primeiro escrevemos todo o argumento do arco tangente como u, isto é. f (x) =� r 2 3 · arctan(u) com u = s 2(3� x) 3(x�2) . (9.248) Pela regra da cadeia, d f dx = d f du · du dx . (9.249) Calculamos primeiro d fdu . d f du = d du " � r 2 3 · arctan(u) # =� r 2 3 d du arctan(u) =� r 2 3 1 1+u2 . (9.250) 9.5 Funções inversas 175 Escrevendo u como função de x temos d f du =� r 2 3 1 1+ ⇣ q 2(3�x) 3(x�2) ⌘2 =� r 2 3 1 1+ 2(3�x)3(x�2) =� r 2 3 1 1+ 2(3�x)3(x�2) 3(x�2) 3(x�2) =� r 2 3 3(x�2) 3(x�2)+2(3� x) =� r 2 3 3(x�2) 3x�6+6�2x =� r 2 3 3(x�2) x . Agora partimos para a próxima derivada. du dx = d dx s 2(3� x) 3(x�2) . (9.251) Novamente devemos utilizar a regra da cadeia. Escrevemos u(x) = p v com v(x) = 2(3� x) 3(x�2) (9.252) e calculamos du dx = du dv dv dx , (9.253) onde novamente calculamos cada derivada isoladamente. du dv = d dv v 1 2 = 1 2 v 1 2�1 = 1 2 p v . (9.254) Escrevendo como função de x temos du dv = 1 2 q 2(3�x) 3(x�2) = 1 2 s 3(x�2) 2(3� x) . (9.255) A derivada restante é dv dx = d dx 2(3� x) 3(x�2) � = 2 3 d dx (3� x) (x�2) , (9.256) que calculamos com a regra da divisão. dv dx = 2 3 (�1) ·(x�2)� (3� x) ·1 (x�2)2 = 2 3 �x+2�3+ x (x�2)2 =� 2 3 1 (x�2)2 . (9.257) Então du dx = 1 2 s 3(x�2) 2(3� x) · ✓ �2 3 1 (x�2)2 ◆ =�1 3 s 3(x�2) 2(3� x) 1 (x�2)2 . (9.258) 176 Diferenciabilidade Finalmente podemos calcular a derivada da função original como d f dx = d f du du dx =� r 2 3 3(x�2) x · �1 3 s 3(x�2) 2(3� x) 1 (x�2)2 ! = s (x�2) (3� x) · 1 (x�2) · 1 x = 1 x p (3� x)(x�2) . (9.259) Mesmo derivadas complicadas como esta podem ser calculadas utilizando sis- tematicamente e cuidadosamente as ferramentas disponíveis. 9.6 Valores extremos 177 9.6 Valores extremos Ao estudar propriedades de funções contínuas, vimos o teorema de Weiers- trass, que diz que se f for contínua em um intervalo fechado [a,b], existem dois elementos x1 e x2 do intervalo [a,b] tais que f (x1) f (x) f (x2) 8x 2 [a,b] . (9.260) x y a bx m x M Como consequência deste teorema, a imagem de uma função contínua em um intervalo fechado é um intervalo fechado [m,M], onde m e M são chamados de va- lor mínimo e valor máximo de f (x) em [a,b]. Os pontos x1 e x2 são chamados de pontos de mínimo global e máximo global de f (x) em [a,b]. Definição 9.3. Seja f uma função definida em um conjunto D. Dizemos que xM 2 D é um máximo global ou máximo absoluto de f (x) em D se f (x) f (xM) para todo x 2 D. Dizemos que xm é um mínimo global ou mínimo absoluto de f (x) em D se f (x)> f (xm) para todo x 2 D. Esta definição de máximo e mínimo global se refere a todo o conjunto D. Podemos de maneira semelhante definir máximos e mínimos relativos a uma vizi- nhança pequena destes pontos. Definição 9.4. Dizemos que x0 é um máximo local ou máximo relativo de f (x) se existir alguma vizinhança de x0 tal que f (x) f (x0) sempre que |x� x0|< d . (9.261) Da mesmo forma, dizemos que x0 é um mínimo local ou mínimo relativo de f (x) se existir alguma vizinhança de x0 tal que f (x)� f (x0) sempre que |x� x0|< d . (9.262) Em qualquer um destes casos dizemos que x0 é um extremo de f . 178 Diferenciabilidade Se f está definida em um intervalo fechado [a,b], no ponto a a definição deve ser satisfeita numa vizinhança à direita apenas enquanto no ponto b à esquerda, como na definição de continuidade em conjunto fechado. x y a bx m x M Na figura ao lado, os pontos a e x2 são mínimos locais enquanto x1 e b são má- ximos locais. Além disso x2 é o mínimo global e b é o máximo global. Nesta fi- gura podemos também notar que exceto nos extremos do intervalo [a,b] os extre- mos de f ocorrem em pontos em que a inclinação da curva é horizontal. Teorema 9.8 (Teorema de Fermat). Seja f uma função definida em um intervalo aberto (a,b). Se existir um ex- tremo de f em um ponto c 2 (a,b) e se f 0(c) existe, então f 0(c) = 0. Demonstração. Seja Q(x) = ( f (x)� f (c) x�c se x 6= c f 0(c) se x = c (9.263) A função Q é contínua em c, pois lim x!c Q(x) = lim x!c0 f (x)� f (c) x� c = f 0(c) = Q(c) . (9.264) Queremos provar que Q(c) = 0. Para isso mostraremos que as suposições Q(c)> 0 e Q(c)< 0 implicam uma contradição. Se Q(c) > 0, pelo princípio de conservação do sinal, existe uma vizinhança de c na qual Q(x)> 0. Nesta vizinhança o numerador da razão f (x)� f (c)x�c deve ter o mesmo sinal que o denominador, ou seja, f (x) > f (c) se x > c e f (x) < c se x < c. Estas desigualdades contradizem a hipótese de que c é um mínimo local ou máximo local, portanto a hipótese Q(c)> 0 deve ser falsa. Se Q(c)< 0, pelo mesmo raciocínio temos que f (x)< f (c) se x > c e f (x)> f (c) se x < c, também violando a hipótese de que c é um extremo de f . Logo a suposição Q(c)< 0 também deve ser falsa, restando apenas a possibilidade Q(c)= 0. 9.6 Valores extremos 179 x y A figura ao lado nos mostra que a re- cíproca deste teorema não é necessari- amente verdade, isto é, a derivada de uma função pode ser nula em um ponto e mesmo assim o ponto não é um extremo. No exemplo da função f (x) = x3, a de- rivada f 0(x) = 3x2 é nula em x = 0, mas este ponto não é um máximo local ou mí- nimo local. x y É importante também que a função seja diferenciável no ponto de extremo para concluirmos que a derivada é nula. Por exemplo, a função f (x) = |x| possui um mínimo local em x = 0, mas a derivada f 0(0) não existe. Se uma função possuir máximos ou mínimos globais, estes pontos devem ocorrer nos extremos do intervalo (caso seja definida em um intervalo fechado), num ponto em que f 0(x) = 0 ou em um ponto em que f não é diferenciável. O teorema a seguir garante a existência de um ponto em que f 0(c) = 0 sob certas condições. Teorema 9.9 (Teorema de Rolle). Seja f uma função contínua em [a,b] e diferenciável em (a,b). Se f (a)= f (b), então existe algum c 2 (a,b) tal que f 0(c) = 0. Demonstração. Esta demonstração também é feita por contradição. Suponha que não existe c 2 (a,b) tal que f 0(c) = 0. Como f é contínua em [a,b], pelo teorema de Weiers- trass deve existir um máximo global e um mínimo global em [a,b]. Pelo teorema de Fermat, se o mínimo ocorrer em algum ponto c 2 (a,b), então f 0(c) = 0, vio- lando a suposição de que f 0(x) 6= 0 em (a,b). Então o máximo e o mínimo global devem ocorrer nos extremos do intervalo, isto é, em x = a ou x = b. Mas como f (a) = f (b), o valor máximo M e o valor mínimo m de f (x) em [a,b] devem ser iguais, o que implica f (x) = M = m em todo o intervalo [a,b], isto é, f é uma função constante e f 0(x) = 0, violando também a suposição de que f 0(x) 6= 0 em (a,b). Como chegamos a uma contradição, nas condições do teorema deve existir algum c 2 (a,b) tal que f 0(c) = 0 como queríamos demonstrar. Este teorema possui uma generalização importante. 180 Diferenciabilidade Teorema 9.10 (Teorema do valor médio (ou Teorema de Lagrange) ). Seja f uma função contínua em [a,b] e diferenciável em (a,b). Então existe algum c 2 (a,b) tal que f 0(c) = f (b)� f (a) b�a . (9.265) Demonstração. Seja h(x) = f (x)(b�a)�x( f (b)� f (a)). Esta função é também contínua em [a,b] e diferenciável em (a,b). Além disso, h(a) = f (a)(b�a)�a( f (b)� f (a)) = b f (a)�a f (b) , (9.266) h(b) = f (b)(b�a)�b( f (b)� f (a)) = b f (a)�a f (b) . (9.267) A função h satisfaz as condições do teorema de Rolle e portanto existe algum c 2 (a,b) tal que h0(c) = 0, que implica f 0(c)(b�a)� ( f (b)� f (a)) = 0 =) f 0(c) = f (b)� f (a) b�a . (9.268) x y a bc f(a)=f(b)x y a bc f(a) f(b) Figura 9.2: Ilustração do teorema de Rolle (esquerda) e teorema do valor médio (direita). A interpretação geométrica deste teorema é a seguinte. Seja uma curva repre- sentada explicitamente pela equação y = f (x) no intervalo [a,b], onde f satisfaz as condições do teorema do valor médio. Como a função é contínua (o gráfico não é interrompido) e diferenciável (não tem “bicos”), ao longo do caminho entre 9.7 Intervalos de crescimento e decrescimento 181 (a, f (a)) e (b, f (b)) vai existir pelo menos um ponto em que a inclinação da reta tangente é igual à inclinação da reta que une os pontos (a, f (a)) e (b, f (b)). Como ilustrado acima, pode existir mais de um ponto em que f 0(c) = f (b)� f (a) b�a . (9.269) O teorema do valor médio garante a existência de pelo menos um, mas não afirma nada quanto à existência de mais de um. 9.7 Intervalos de crescimento e decrescimento Intuitivamente percebemos que se a derivada de uma função é positiva num intervalo a função é crescente neste intervalo. Esta noção intuitiva é confirmada pelo teorema do valor médio. Teorema 9.11. Seja f uma função contínua em [a,b] e diferenciável em (a,b). Então: (a) Se f 0(x)> 0 em (a,b), f é estritamente crescente em [a,b]; (b) Se f 0(x)< 0 em (a,b), f é estritamente decrescente em [a,b]; (c) Se f 0(x) = 0 em (a,b), f é constante em [a,b]. Demonstração. Sejam x1 e x2 números reais tais que a x1 < x2 b. Pelo teorema do valor médio existe algum c tal que x1 < c < x2 e f (x2)� f (x1) = f 0(c)(x2 � x1) (9.270) Se f 0(x)> 0 em (a,b), necessariamente f 0(c)> 0 e f (x2)> f (x1) se x2 > x1, ou seja, a função é estritamente crescente. Se f 0(x) < 0, então f 0(c) < 0 e f (x2) < f (x1) se x2 > x1 implicando que a função é decrescente. Por fim, se f 0(x) = 0 então f 0(c) é sempre nulo e f (x2) = f (x1), isto é, f é constante. Exemplo 9.40. Se f (x) = ex, a derivada é f 0(x) = ex, que é positiva em todo x real. Portanto a função exponencial é estritamente crescente em todo o seu domínio. Exemplo 9.41. Seja agora f (x) = ax com a > 0. A derivada é f 0(x) = ax log(a). Se a > 1, log(a) > 0 e f 0(x) > 0, ou seja, a função exponencial com base a > 1 é estrita- mente crescente. Se 0 < a < 1, log(a)< 0 e f 0(x)< 0, portanto a função exponen- cial de base 0 < a < 1 é estritamente decrescente. Por fim, se a = 1, log(a) = 0 e a função é constante. 182 Diferenciabilidade Exemplo 9.42. Se f (x) = log(x), f 0(x) = 1x e a derivada é sempre positiva no domínio do loga- ritmo. Então o logaritmo natural é estritamente crescente em todo o seu domínio. Exemplo 9.43. Seja agora f (x) = sen(x) no intervalo [0,2p]. A sua derivada é f 0(x) = cos(x). Esta derivada é positiva no intervalo � 0, p2 � , negativa no intervalo � p 2 , 3p 2 � e fi- nalmente positiva no intervalo �3p 2 ,2p � , portanto a função seno é estritamente crescente nos intervalos ⇥ 0, p2 ⇤ e ⇥3p 2 ,2p ⇤ e estritamente decrescente no intervalo ⇥ p 2 , 3p 2 ⇤ . Exemplo 9.44. Se f (x) = x2, a derivada f 0(x) = 2x é positiva no intervalo (0,+•) e nega- tiva no intervalo (�•,0), portanto a função é estritamente crescente no intervalo [0,+•) e estritamente decrescente no intervalo (�•,0]. Sempre que a derivada de uma função de classe C1 muda de sinal, ocorre neste ponto um máximo local ou mínimo local. Teorema 9.12. Seja f uma função contínua em [a,b] e diferenciável em (a,b) exceto talvez em um ponto c 2 (a,b). Nestas condições: (a) Se f 0(x)> 0 quando x > c e f 0(x)< 0 quando x < c, então c é um máximo local de f ; (b) Se f 0(x)< 0 quando x > c e f 0(x)> 0 quando x < c, então c é um mínimo local de f . Demonstração. Se f 0(x) > 0 quando x < c, existe d1 > 0 tal que f é estritamente crescente no intervalo [c� d1,c]. Se f 0(x) > 0 quando x > c, existe d2 > 0 tal que f é estritamente decrescente no intervalo [c,c + d2]. Escolhendo d como o menor valor entre d1 e d2, temos que f (x) f (c) sempre que |x�c|< d, ou seja, c é um máximo local. A demonstração do caso (b) é idêntica. Exemplo 9.45. No caso da função f (x) = x2, a derivada é positiva se x > 0 e negativa se x < 0, portanto o ponto x0 = 0 é um mínimo local. Exemplo 9.46. 9.7 Intervalos de crescimento e decrescimento 183 Seja agora a função f (x) = |x|, cuja derivada é dada por f 0(x) = ⇢ +1 se x > 0 �1 se x < 0 (9.271) e f 0(0) não existe. A função é contínua em todo x real, a derivada é positiva se x > 0 e negativa se x < 0, portanto o ponto x0 = 0 é um mínimo local da função, mesmo não sendo diferenciável em x0 = 0. Exemplo 9.47. A função f (x) = e�x 2 é extremamente importante no estudo de probabilidades. Pela regra da cadeia, f 0(x) = �2xe�x2 , portanto f é de classe C1 em todo x real. Como f 0(x) é negativo se x > 0 e positivo se x < 0, o ponto x0 = 0 é um máximo local. Exemplo 9.48. Se f (x) = x3, sua derivada é f 0(x) = 3x2 que é positiva sempre que x 6= 0. Por- tanto a função é estritamente crescente em todo o domínio e não existem máximos locais e mínimos locais desta função, a não ser que a função esteja definida apenas em um intervalo fechado [a,b]. Neste caso o ponto x0 = a é um mínimo local e o ponto x0 = b é um máximo local. Os máximos e mínimos locais de uma função ocorrem nos extremos de um intervalo fechado, em pontos em que a função não é diferenciável ou em pontos em que a derivada é nula. Os pontos em que f 0(x) = 0 podem ser chamados de pontos críticos. Sabemos como determinar se um ponto crítico é um máximo local (como x0 = 0 na função f (x) = e�x 2 ), um mínimo local (como x0 = 0 na função f (x) = x2) ou se não é um extremo (como x0 = 0 na função f (x) = x3) analisando o sinal da derivada na vizinhança do ponto crítico. Esta análise é simplificada se pudermos calcular a segunda derivada. Teorema 9.13. Seja f uma função de classe C2 em (a,b) e seja c 2 (a,b) um ponto crítico de f , isto é, f 0(c) = 0. Se f 00(c) < 0, c é um máximo local de f e se f 00(c) > 0, c é um mínimo local de f . Demonstração. Sabemos que a segunda derivada é contínua em (a,b). Se f 00(x) < 0, pelo princípio de conservação do sinal existe uma vizinhança de c na qual f 00(x) < 0. Portanto existe um d > 0 tal que f 0(x) é estritamente decrescente se x 2 [c�d,c+ d]. Como f 0(c) = 0, por ser decrescente temos que f 0(c) > 0 se c� d < x < c e f 0(x) < 0 se c < x < c+ d, provando que c é um máximo local. O mesmo raciocínio mostra que se f 00(c)> 0, c é um mínimo local. 184 Diferenciabilidade Exemplo 9.49. Seja f (x) = cos(x). Esta função é de classe C2 em todo o seu domínio. Os máximos e mínimos locais devem ocorrer em pontos nos quais f 0(x) = 0. Sabendo que f 0(x) = �sen(x), os pontos críticos são múltiplos de p, isto é, 0, p, 2p, 3p e assim por diante, assim como os múltiplos negativos �p, �2p, �3p, . . . De forma geral, todo ponto da forma xn = n ·p com n inteiro é um ponto crítico de cos(x). Calculando a segunda derivada temos f 00(x) =�cos(x). Calculando o valor da segunda derivada nos pontos críticos temos que f 00(n ·p) =�cos(np) = ⇢ �1 se n é par +1 se n é ímpar (9.272) Então os pontos 0, ±2p, ±4p, . . . são máximos locais e os pontos ±p, ±3p, ±5p, . . . são mínimos locais do cos(x). Exemplo 9.50. Seja novamente a função f (x) = e�x 2 , cuja derivada vale f 0(x) = �2xe�x2 . Trivialmente percebemos que x0 = 0 é o único ponto crítico. Calculando a se- gunda derivada temos f 00(x) = (4x2 �2)e�x2 . No ponto crítico x0 = 0 calculamos f 00(0) =�2, portanto este ponto crítico é um máximo local. Exemplo 9.51. Sejam agora as funções f (x) = x3 e g(x) = x4 e h(x) =�x4. As derivadas são f 0(x) = 3x2, g0(x) = 4x3 e h0(x) = �4x3. Nos três casos o único ponto crítico é x0 = 0. As segundas derivadas são f 00(x) = 6x, g00(x) = 12x2 e h00(x) = �12x2. No ponto crítico x0 = 0 as três derivadas se anulam e não podemos aplicar o teo- rema 9.13 para concluir se estes pontos são máximos ou mínimos locais. Analisando o sinal da primeira derivada na vizinhança do ponto crítico vemos que f 0(x)> 0 se x > 0 e f 0(x)> 0 se x < 0 (9.273) g0(x)> 0 se x > 0 eg0(x)< 0 se x < 0 (9.274) h0(x)< 0 se x > 0 e h0(x)> 0 se x < 0 (9.275) Podemos utilizar o teorema 9.12 para concluir que o ponto crítico x0 = 0 é um mínimo local de g(x) e um máximo local de h(x). Vimos também no exem- plo 9.48 que o ponto x0 = 0 não é um extremo de f (x). Este exemplo ilustra que se a segunda derivada da função em um ponto crítico se anular, nada podemos concluir, pois este ponto pode ser um máximo local, um mínimo local ou não ser um extremo. 9.8 Funções convexas 185 9.8 Funções convexas x y a b A segunda derivada de uma função está ligada a uma propriedade chamada de convexidade de uma função. Seja R a região do R2 limitada lateralmente pelas retas verticais x = a e x = b e inferior- mente pela curva y = f (x), como ilus- trado na figura ao lado. Podemos repre- sentar esta região por R = � (x,y) 2 R2 | a x b , y � f (x) . (9.276) x y a b Dizemos que a função f é convexa no intervalo [a,b] se a região R é convexa. Como os pontos da curva y = f (x) per- tencem ao conjunto R, o segmento de reta que une dois pontos distintos da curva deve estar contido no conjunto R. Como R foi definida como o conjunto de pontos acima do gráfico, todo o seg- mento de reta de estar acima do gráfico. A equação do segmento de reta que une os pontos (x1, f (x1)) e (x2, f (x2)) é y = f (x2)� f (x1) x2 � x1 x+ x2 f (x1)� x1 f (x2) x2 � x1 se x 2 [x1,x2] . (9.277) Se f é uma função convexa em [a,b], então f (x) f (x2)� f (x1) x2 � x1 x+ x2 f (x1)� x1 f (x2) x2 � x1 (9.278) se x1 x x2 para quaisquer x1 e x2 do intervalo [a,b]. Para relacionar esta propriedade de convexidade com a segunda derivada é conveniente escrever a variável x como x = (1� t) ·x1 + t ·x2 (9.279) e à medida em que t varia de 0 a 1 o valor de x varia de x1 a x2. A desigualdade anterior pode ser escrita em termos da variável t como f ((1� t) ·x1 + t ·x2) f (x2)� f (x1) x2 � x1 [(1� t) ·x1 + t ·x2]+ x2 f (x1)� x1 f (x2) x2 � x1 , 186 Diferenciabilidade (9.280) que manipulamos como f ((1� t) ·x1 + t ·x2) f (x2)� f (x1) x2 � x1 [x1 + t ·(x2 � x1)]+ x2 f (x1)� x1 f (x2) x2 � x1 , (9.281) f ((1� t) ·x1 + t ·x2) t [ f (x2)� f (x1)]+ x1 f (x2)� x1 f (x1)+ x2 f (x1)� x1 f (x2) x2 � x1 (9.282) ou apenas f ((1� t) ·x1 + t ·x2) t [ f (x2)� f (x1)]+ f (x1) . (9.283) Podemos dizer que uma função f é convexa no intervalo [a,b] se e somente se t [ f (x2)� f (x1)]+ f (x1)� f (x)� 0 , (9.284) onde x = (1� t) ·x1+ t ·x2, para todo t 2 [0,1] e para quaisquer valores x1 e x2 tais que a x1 < x2 b. Escrevendo f (x) = (1�t) f (x)+t f (x) podemos expressar a condição para que f seja convexa como t [ f (x2)� f (x1)]+ f (x1)� (1� t) f (x)+ t f (x)� 0 (9.285) ou t [ f (x2)� f (x)]+(1� t) [ f (x1)� f (x)] 0 . (9.286) Seja t 2 (0,1), que implica x1 < x < x2. Se f é uma função de classe C1 em (a,b) e contínua em [a,b] pelo teorema do valor médio existem c1 e c2 tais que x1 < c1 < x < c2 < x2 e [ f (x)� f (x1)] = f 0(c1)(x� x1) , (9.287) [ f (x2)� f (x)] = f 0(c2)(x2 � x) . (9.288) A condição para que f seja convexa torna-se t f 0(c2) [x2 � t ·x2 � (1� t)x1]�(1�t) f 0(c1) [(1� t)x1 + t ·x2 � x1]� 0 , (9.289) 9.8 Funções convexas 187 que simplificamos como t f 0(c2)(1� t)(x2 � x1)� (1� t) f 0(c1)t(x2 � x1)� 0 (9.290) ou ainda mais como t(1� t)(x2 � x1) ⇥ f 0(c2)� f 0(c1) ⇤ � 0 . (9.291) Se f for de classe C2 em (a,b), aplicamos o teorema do valor médio na derivada para garantir a existência de um c3 tal que c1 < c3 < c2 e f 0(c2)� f 0(c1) = f 00(c3)(c2 � c1) , (9.292) o que nos permite escrever a condição para que a função seja convexa como t(1� t)(x2 � x1)(c2 � c1) f 00(c3)� 0 . (9.293) Todos os termos que multiplicam f 00(c3) são positivos e c3 2 (a,b). Se pudermos garantir que a segunda derivada de f é sempre positiva, isto é, se f 00(x) > 0 para todo x 2 (a,b), então a função f é necessariamente convexa. Se f 00(x)< 0, então o segmento de reta que une os pontos (x1, f (x1)) e (x2, f (x2)) estará sempre abaixo da curva y = f (x), o que pode ser verificado repetindo o ra- ciocínio ou aplicando este resultado a � f . Neste caso dizemos que a função é côncava e provamos o seguinte teorema. Teorema 9.14. Seja f uma função contínua em [a,b] e de classe C2 em (a,b). Então: (a) f é convexa em [a,b] se f 00(x)> 0 em (a,b); (b) f é côncava em [a,b] se f 00(x)< 0 em (a,b). Exemplo 9.52. Seja f (x) = sen(x) no intervalo [0,2p]. Vimos que f 0(x) = cos(x) e portanto f é estritamente crescente nos intervalos ⇥ 0, p2 ⇤ e ⇥3p 2 ,2p ⇤ e estritamente decrescente no intervalo ⇥ 0p2 , 3p 2 ⇤ . Calculando a segunda derivada temos f 00(x) = �sen(x). A segunda derivada é negativa no intervalo (0,p) e positiva no intervalo (p,2p), portanto a função f (x) = sen(x) é côncava no intervalo [0,p] e convexa no intervalo [p,2p]. Neste exemplo o ponto x0 = p é a fronteira entre intervalos com convexidades opostas. Neste caso dizemos que o ponto é um ponto de inflexão. Pelo teorema de Fermat, se x0 é um ponto de inflexão e f 00(x0) existe, então f 00(x0) = 0, mas um ponto pode ser um ponto de inflexão e a segunda derivada não existir, assim como um ponto pode ser um mínimo local ou máximo local e a primeira derivada não existir. 188 Diferenciabilidade Exemplo 9.53. Seja f (x) = ( 1+ x 2 2 se x � 0 1� x22 se x < 0 (9.294) Esta função é contínua em todo x real (inclusive em x0 = 0). Sua derivada vale f 0(x) = ⇢ x se x � 0 �x se x < 0 (9.295) ou apenas f 0(x) = |x|. A segunda derivada é dada por f 00(x) = ⇢ 1 se x � 0 �1 se x < 0 (9.296) e f 00(0) não existe. Pelo sinal da segunda derivada vemos que f é convexa no intervalo [0,+•) e côncava no intervalo (�•,0]. Portanto o ponto x0 = 0 é um ponto de inflexão. Exemplo 9.54. Seja f (x) = x4, que possui derivadas f 0(x) = 4x3 e f 00(x) = 12x2. Neste exem- plo temos que f 00(0) = 0, no entanto a segunda derivada é positiva tanto à direita do zero quanto à esquerda. A função f (x) = x4 é convexa em todo o seu domínio e x0 = 0 não é um ponto de inflexão. Estes exemplos mostram que o fato de f 00(x0) = 0 não implica que x0 seja um ponto de inflexão. Mas se x0 é um ponto de inflexão, então f 00(x0) não existe ou f 00(x0) = 0. Exemplo 9.55. No caso da função f (x) = ex, as derivadas valem f 0(x) = ex e f 00(x) = ex que são sempre positivas. Então a função exponencial é convexa em todo o seu domínio. Exemplo 9.56. Se f (x) = log(x), suas derivadas são f 0(x) = 1x e f 00(x) = � 1x2 . Neste caso a segunda derivada é sempre negativa, então a função logarítmica é côncava em todo o seu domínio. 9.9 Esboço de gráficos 189 9.9 Esboço de gráficos Conhecendo as duas primeiras derivadas de uma função encontramos interva- los de crescimento e decrescimento e intervalos nos quais a função é convexa ou côncava. Estas informações permitem traçar um esboço razoável do gráfico de funções. Exemplo 9.57 (Função seno). Seja f (x) = sen(x). Esta função é periódica de período 2p. Podemos esboçar o gráfico desta função no intervalo [0,2p] e repetir o gráfico nos outros intervalos até completar o domínio. Se esta função é contínua no intervalo fechado [0,2p] sabemos pelo teorema de Weierstrass que a imagem é também um intervalo fe- chado e pelo teorema do valor intermediário sabemos que o gráfico é uma linha sem interrupções. Primeiro analisamos o valor da função. No intervalo [0,2p] a função se anula em x = 0, x = p e x = 2p. Por ser contínua, a função deve ter o mesmo sinal nos intervalos (0,p) e (p,2p). Calculando f (x) em algum ponto qualquer destes intervalos encontramos f ⇣ p 2 ⌘ = sen ⇣ p 2 ⌘ = 1 > 0 =) f (x)> 0 se 0 < x < p , (9.297) f ✓ 3p 2 ◆ = sen ✓ 3p 2 ◆ =�1 < 0 =) f (x)< 0 se p < x < 2p . (9.298) x 0 π 2π f(x)>0 f(x)<0 A primeira derivada é f 0(x) = cos(x). Não existem pontos em que f 0(x) não existe e a derivada se anula nos pontos x= p2 e x= 3p 2 . Como a derivada é contínua, ela deve ter o mesmo sinal nos intervalos ⇥ 0, p2 � , � p 2 , 3p 2 � e �3p 2 ,2p ⇤ . Escolhendo algum ponto qualquer destes intervalos
Compartilhar