Buscar

AnaliseRn-notasdeaulaV01

Prévia do material em texto

NOTAS DE AULA DE ANÁLISE NO Rn
OLIVAINE S. DE QUEIROZ
Departamento de Matemática
Instituto de Matemática, Estatística e Computação Científica
UNICAMP
Campinas
2015
Capítulo 1
Revisão de Topologia em Rn
Neste capítulo inicial vamos apresentar conceitos básicos essenciais que necessitaremos no decorrer do curso.
1.1 Comentários preliminares sobre o espaço Rn
O espaço Euclidiano Rn é definido como o conjunto de todas as n-uplas x = (x1, . . . ,xn) de números reais xi,
i= 1, . . . ,n. Um ponto x ∈Rn é também chamado de vetor, já que com as operações x+ y := (x1+ y1, . . . ,xn+ yn)
e ax := (ax1, . . . ,axn) (a ∈R), Rn se torna um espaço vetorial. O vetor (0, . . . ,0) ∈ Rn será denotado somente por
0. Quando n= 1, também chamamos os pontos de R= R1 de escalares.
A noção se soma de vetores e multiplicação por escalares, apesar de determinar uma estrutura de espaço
vetorial em Rn, não é suficiente para definir a noção de distância. Para tanto necessitamos do conceito de produto
interno, que é uma função que associa a cada par de vetores x,y ∈ Rn um escalar e que ainda satisfaz certas
propriedades que listaremos a seguir para um exemplo particular. O produto interno euclidiano em Rn é definido
por
〈x,y〉 :=
n
∑
i=1
xiyi, x= (x1, . . . ,xn),y= (y1, . . . ,yn).
Outros produtos internos em Rn também podem ser considerados. São 4 as principais propriedades do produto
interno.
Proposição 1.1.1 Sejam x,y ∈ Rn e a ∈ R quaisquer. Temos as seguintes propriedades:
(i) simetria: 〈x,y〉= 〈y,x〉;
(ii) bilinearidade: 〈ax,y〉= 〈x,ay〉= a〈x,y〉, 〈x+ z,y〉= 〈x,y〉+ 〈z,y〉 e 〈x,y+ z〉= 〈x,y〉+ 〈x,z〉;
(iii) positividade: 〈x,x〉 ≥ 0 e 〈x,x〉= 0 se, e somente se, x= 0;
(iv) identidade de polarização: 4〈x,y〉= 〈x+ y,x+ y〉− 〈x− y,x− y〉.
A norma euclidiana (ou comprimento) de um vetor x ∈ Rn é definida por
‖x‖ := 〈x,x〉1/2.
Proposição 1.1.2 Sejam x,y,z ∈ Rn e a ∈ R quaisquer. Temos as seguintes propriedades:
(i) ‖x‖ ≥ 0 e ‖x‖= 0 se, e somente se, x= 0;
(ii) Desigualdade de Cauchy: |〈x,y〉| ≤ ‖x‖‖y‖;
(iii) Desigualdade triangular: ‖x+ y‖ ≤ ‖x‖+ ‖y‖;
3
4 CAPÍTULO 1. REVISÃO DE TOPOLOGIA EM RN
(iv) ‖ax‖= |a|‖x‖.
Sendo Rn um espaço vetorial de dimensão n, qualquer subconjunto linearmente independente {v1, . . . ,vn}
com n vetores forma uma base deste espaço.
Uma base {v1, . . . ,vn} paraRn é chamada ortonormal se 〈vi,v j〉= δi j, onde δi j = 0 se i 6= j e δii = 1 (símbolo
de Kronecker). A base canônica de Rn é {e1, . . . ,en}, onde ei = (0, . . . ,1, . . . ,0), com 1 na i-ésima coordenada.
Concluiremos esta seção com alguns comentários sobre transformações lineares e matrizes.
Se T : Rn → Rm é um a transformação linear, a matriz de T com relação às bases canônicas de Rn e Rm é a
matriz A= (ai j), onde
T (ei) =
m
∑
j=1
a ji f j.
Observe que as coordenadas a ji do vetor T (ei) (com relação à base ( f1, . . . , fm)) aparecem na i-ésima coluna de A.
Por linearidade obtemos então que o vetor y= T (x) = Tx pode ser encontrado pela expressão y1...
ym
=
 a11 . . . a1n... ...
am1 . . . amn

 x1...
xn
 .
Reciprocamente, se A é uma matriz m× n então T (x) := Ax, x ∈ Rn, define uma transformação linear de Rn
em Rm. Assim, existe uma relação biunívoca entre o conjunto L (Rn,Rm) das transformações lineares de Rn em
Rm com o conjunto das matrizes m× n.
1.2 Espaços métricos
Nesta seção vamos formalizar o conceito de métrica ou distância em um conjunto, definindo assim os espaços
métricos.
Definição 1.2.1 Um conjunto X é chamado de espaço métrico se existe uma função d : X ×X → R satisfazendo
as seguintes propriedades para quaisquer x,y,z ∈ X:
(1) d(x,y)≥ 0 e d(x,y) = 0 se, e somente se, x= y;
(2) d(x,y) = d(y,x);
(3) d(x,z) ≤ d(x,y)+ d(y,z).
Qualquer função d que satisfaz as três propriedades acima é chamada demétrica (ou distância).
As vezes utilizamos a notação (X ,d) significando que X é um espaço métrico com métrica d.
Exemplo 1.2.2 Seja X = Rn e
d1(x,y) = ‖x− y‖=
√
(x1− y1)2+ . . .+(xn− yn)2, x,y ∈ Rn.
Das propriedades de produto interno segue que (Rn,d1) é um espaço métrico. Além disso, podemos ainda definir
d2(x,y) = |x− y|=max
i
{|xi− yi|}.
Verifica-se sem muitas dificuldades que (Rn,d2) é também um espaço métrico. As métricas d1 e d2 são chamadas
demétrica euclidiana emétrica do sup, respectivamente. Elas estão relacionadas de várias maneiras. Em particular,
|x− y| ≤ ‖x− y‖ ≤ √n|x− y|, para quaisquer x,y ∈ Rn.
1.2. ESPAÇOS MÉTRICOS 5
Exemplo 1.2.3 Seja X qualquer conjunto não vazio. Dados x,y ∈ X defina d(x,y) = 1 se x 6= y e d(x,x) = 0.
Então, apesar de parecer meio artificial, d define uma métrica em X .
Suponha que d seja uma métrica em X e que Y ⊂ X . Então existe automaticamente uma métrica dY em Y (e
portanto (Y,dY ) é um espaço métrico) definida pela restrição de d à Y ×Y , isto é,
dY = d |Y×Y .
Exemplo 1.2.4 Seja S2 a esfera de raio 1 em R3. Dados x,y ∈ S2, defina d˜(x,y) como sendo o comprimento do
menor arco sobre S2 que une x a y. Então d˜ é uma métrica em S2. Além disso, note que d˜ 6= d1 |S2×S2 , onde d1 é a
métrica euclidiana. De fato, a seguinte desiguladade é satisfeita:
d1(x,y)≤ d˜(x,y)≤ pi2 d1(x,y), para quaisquer x,y ∈ S
2.
Recorrendo à noção de distância podemos definir os conceitos fundamentais de conjuntos abertos e fechados.
Definição 1.2.5 Seja (X ,d) um espaço métrico e x0 ∈ X. dado ε > 0, o conjunto
U(x0,ε) := {x ∈ X | d(x,x0)< ε}
é chamado de ε-vizinhança de x0. Um subconjunto V ⊂ X é chamado de aberto se, para qualquer x0 ∈V, existe
ε > 0 tal queU(x0,ε)⊂V . Um subconjuntoC⊂ X é chamado de fechado se seu complemento X−C= X \C=Cc
é aberto.
Observação 1.2.6 Seja (X ,d) um espaço métrico e Y ⊂X. Então uma ε-vizinhança de um ponto x0 ∈Y na métrica
dY é dada por U(x0,ε)∩Y , sendo essa última entendida na métrica d.
Proposição 1.2.7 Seja (X ,d) um espaço métrico e {Uα | α ∈ A} uma coleção de subconjuntos abertos de X, onde
A é um conjunto de índices qualquer. Então o conjunto
⋃
α∈AUα é aberto de X. Se supormos que que A é finito,
isto é, A= {1, . . . ,k}, então ⋂kα=1Uα é aberto.
Corolário 1.2.8 Se Y ⊂ X e A é aberto em Y com relação à dY , então existe um conjunto aberto U em X tal que
A=U ∩Y.
Demonstração. Sendo A aberto em Y , para qualquer x ∈ A existe εx > 0 tal queU(x,εx)∩Y ⊂ A. Definamos
U =
⋃
x∈A
U(x,εx).
Temos então pela Proposição 1.2.7 e pela Observação 1.2.6 queU é aberto de X . Note queU ∩Y ⊂ A. Além disso,
como a união é tomada em todo x ∈ A, temos que A⊂U . Logo, A⊂U ∩Y . Conclui-se que A=U ∩Y . �
Em Rn as ε-vizinhanças nas duas métricas d1 e d2 que vimos anteriormente recebem nomes especiais. Se
x0 ∈Rn, a ε-vizinhança de x0 na métrica euclidiana d1 é chamada de bola aberta de centro x0 e raio ε , e é denotada
por Bε(x0). A ε-vizinhança de x0 na métrica do sup é chamada de cubo aberto de centro x0 e raio ε , sendo denotado
porCε (x0). Pelo Exemplo 1.2.2 temos que
Bε(x0)⊂Cε (x0)⊂ Bε√n(x0),
para qualquer x0 ∈Rn e qualquer ε > 0. Podemos refrasear este fato na maneira apresentada no próximo resultado.
Proposição 1.2.9 Um subconjunto U ⊂ Rn é aberto com relação à métrica d1 se, se e somente se, é aberto com
relação à métrica d2.
6 CAPÍTULO 1. REVISÃO DE TOPOLOGIA EM RN
Definição 1.2.10 Um ponto x0 de um espaço métrico X é chamado de ponto limite de um subconjunto A⊂ X se
para toda ε-vizinhança de x0 U(x0,ε), o conjunto U(x0,ε)∩A possui infinitos elementos. Se x0 ∈ A não é ponto
limite de A dizemos que x0 é ponto isolado de A.
Um subconjunto D⊂ X é denso em X se todo ponto de X é ponto limite de D ou um ponto de D.
O conjunto
A := A∪{x ∈ X | x é ponto limite de A}
é chamado de fecho de A.
Em particular, o fecho de qualquer subconjunto de X é um subconjunto fechado.
1.3 Limites e continuidade
Consideremos dois espaços métricos (X ,dX) e (Y,dY ), uma função f : X → Y e x0 ∈ X .
Definição 1.3.1 Nascondições acima, dizemos que f é contínua em x0 se, dado ε > 0, existe um δ > 0, δ = δ (ε),
tal que
dY ( f (x), f (x0))< ε sempre que dX(x,x0)< δ .
Dizemos que f é contínua se f é contínua em todo x0 ∈ X.
Uma formulação alternativa para a definição de continuidade pode ser apresentada na forma de teorema.
Teorema 1.3.2 A função f : X → Y é contínua se, e somente se, para qualquer subconjunto aberto U de Y, a
pré-imagem f−1(U) é aberta em X .
Definição 1.3.3 Uma função f : X → Y é chamada de homeomorfismo se ela é inversível e ambas, f e f−1, são
contínuas. Os espaços métricos (X ,d) e (Y,d) são homeomorfos se existe um homeomorfismo de X em Y. Duas
métricas d e d′ definidas no mesmo conjunto X são equivalentes se existe um homeomorfismo de (X ,d) em (X ,d′).
Também definimos o limite de uma função f em um dado ponto em termos da métrica.
Definição 1.3.4 Seja A⊂ X e f : A→ Y . Seja ainda x0 um ponto limite do domínio A de f . Dizemos que o limite
de f em x0 é y0 se, para cada ε > 0, existe um δ > 0 tal que
dY ( f (x),y0)< ε sempre que x ∈ A e 0< dX(x,x0)< δ .
Limites e continuidade de funções em espaços métricos satisfazem as mesmas propriedades que limites e
continuidades de funções em R com relação à soma, produto e composição.
1.4 Interior e exterior
Definição 1.4.1 Seja (X ,d) um espaço métrico e A⊂ X. o conjunto
IntA := (Ac)c
é chamado interior de A.
Note que x ∈ IntA se, e somente se, existe ε > 0 tal queU(x,ε)⊂ A, e assim o interior de A é aberto.
Definição 1.4.2 O exterior de A é o conjunto ExtA := Int(Ac). O bordo, (ou fronteira) de A é o conjunto
∂A := X \ (ExtA∪ IntA).
Notemos que sempre vale X = IntA∪ExtA∪∂A.
1.5. COMPACIDADE EM RN 7
1.5 Compacidade em Rn
Passamos a relembrar nesta seção o importante conceito de subconjuntos compactos. Como usual, denotaremos
por (X ,d) um espaço métrico.
Seja A ⊂ X . Uma cobertura de A é uma coleção de subconjuntos {Uα | α ∈ I}, sendo I um conjunto de
índices, tal que A⊂⋃α∈IUα . Se cadaUα é aberto, então dizemos que a cobertura é aberta.
Definição 1.5.1 Um subconjunto A ⊂ X é chamado de compacto se toda cobertura aberta de A possui uma
subcoleção finita que também forma uma cobertura aberta de A.
Um subconjunto B de um espaço métrico (X ,d) é dito limitado se existe uma constante M > 0 e x0 ∈ X tal
que d(x,x0)≤M para qualquer x ∈ B.
Em Rn os compactos são caracterizados como sendo os subconjuntos fechados e limitados. Uma parte desse
resultado possui uma demonstração simples e daremos a seguir. Na verdade, enunciamos somente para Rn mas ele
vale para qualquer espaço métrico.
Teorema 1.5.2 Seja X um subespaço compacto de (Rn,d1) ou (Rn,d2). Então X é fechado e limitado.
Demonstração. Por equivalência, basta demonstrarmos o resultado com relação à métrica d2.
Mostremos incialmente que X é limitado. Para cada N ∈ Z+ definimos o cubo abertoUN :=CN(0). Então:
U1 ⊂U2 ⊂ . . . e Rn =
∞⋃
N=1
UN .
Em particular, o conjunto {UN | N ∈ Z+} é uma cobertura aberta do compacto X , existindo assim uma quantidade
finita de inteiros positivos N1, . . . ,Nk tais que
X ⊂
k⋃
j=1
UN j .
Assim, sendoM =max j{N j}, segue que X ⊂UM e X é limitado.
Agora demonstremos que Rn \X é aberto, isto é, que X é fechado. Para isso, seja x0 ∈ Rn \X e, para cada
N ∈ Z+, definamos o cubo fechadoCN :=C1/N(x0). Então
. . .⊂C2 ⊂C1 e
∞⋂
N=1
CN = {x0}.
Seja VN := Rn \CN . Segue queVN é aberto e que
Rn \ {x0}=
∞⋃
N=1
VN .
Novamente, usando a compacidade de X obtemos que existe uma quantidade finita de subconjuntos VN1 , . . .VNl
que cobrem X . TomandoM =maxiNi obtemos que X ⊂VM e em particularCN ∩X = /0. Notando que x0 ∈ IntCM
temos que Rn \X é aberto. �
Corolário 1.5.3 Se X é um subconjunto compacto de R então X possui máximo e mínimo.
Teorema 1.5.4 Seja X um subconjunto compacto de Rn e f : X → Rm contínua. Então f (X) ⊂ Rm é compacto e,
se m= 1, f assume máximo e mínimo.
Para finalizarmos a caraterização dos subconjuntos compactos emRn necessitaremos ainda de um fato básico.
Lema 1.5.5 O retângulo Q := [a1,b1]× . . .× [an,bn]⊂ Rn é um subconjunto compacto.
8 CAPÍTULO 1. REVISÃO DE TOPOLOGIA EM RN
Teorema 1.5.6 Seja X ⊂ Rn um subconjunto limitado e fechado. Então X é compacto.
Demonstração. SejaA uma coleção de abertos que cobremX . Adicionemos a esta coleção o abertoRn\X . Temos
assim uma cobertura aberta de Rn. Como X é limitado, podemos tomar um retângulo Q como no Lemma 1.5.5
tal que X ⊂ Q. Em particular a cobertura aberta de Rn cobre o compacto Q. Extraímos então uma subcobertura
finita que ainda cobre Q. Se esta subcobertura de Q ainda conter Rn \X , tiramos este conjunto obtendo ainda outra
subcoleção da cobertura inicial A . Tal subcoleção pode não cobrir Q, mas certamente cobre X já que o conjunto
Rn \X descartado não contém pontos de X . �
Definição 1.5.7 Seja X ⊂ Rn. Dado ε > 0, o conjunto ⋃x∈X Bε(x) é chamado de ε-vizinhança de X na métrica
euclidiana. Similarmente, substituindo Bε(x) por Cε (x) definimos a ε-vizinhança de X na métrica do sup .
Teorema 1.5.8 Sejam X ⊂ Rn um subespaço compacto e U ⊂Rn um aberto que contém X. Então existe ε > 0 tal
que a ε-vizinhança de X está contida em U (em qualquer métrica d1 ou d2).
Demonstração. Por equivalência das métricas, basta demonstrarmos o resultado para a métrica do sup .
Dado um subconjuntoC ⊂ Rn, para cada x ∈ Rn definimos a distância entre x eC pela expressão
d(x,C) := inf
c∈C
{|x− c|}.
Assumiremos por um momento que, fixadoC, a função x 7→ d(x,C) é contínua de Rn em R.
SejamU aberto tal que X ⊂U e f : X →R dada por
f (x) := d(x,Rn \U).
Como f é contínua e X é compacto, pelo Teorema 1.5.4 temos que f assume um mínimo. O valor mínimo de f
deve ser positivo, caso contrário, f (x0) = 0 para algum x0 ∈ X , o que mostraria que x0 ∈ Rn \U , pois este último
conjunto é fechado, obtendo assim uma contradição. Segue que existe ε0 > 0 tal que f (x)≥ ε0 para qualquer x∈ X
e assim a ε0-vizinhança de X está contida emU .
Falta mostrarmos que x 7→ d(x,C) é contínua de Rn em R. Sejam x,y ∈Rn e c ∈C. Então, pela desigualdade
triangular,
d(x,C)−|x− y| ≤ |x− c|− |x− y| ≤ |y− c|.
Tomando o ínfimo em c na desigualdade acima obtemos
d(x,C)− d(y,C)≤ |x− y|.
Como a mesma desigualdade vale se trocarmos os papeis de x e y, obtemos
|d(x,C)− d(y,C)| ≤ |x− y|.
Segue a continuidade e a demonstração do teorema. �
O Teorema 1.5.8 não é válido se retirarmos a hipótese de compacidade em X , como verificaremos nos exer-
cícios deste capítulo.
Demonstraremos a seguir um resultado familiar.
Teorema 1.5.9 Seja X ⊂Rn um subespaço compacto e f : X→Rm contínua. Então f é uniformemente contínua
no seguinte sentido: dado ε > 0, existe δ > 0, dependendo somente de ε , tal que, para quaisquer x,y ∈ X,
‖ f (x)− f (y)‖< ε sempre que ‖x− y‖< δ .
Este mesmo resultado vale se considerarmos a métrica do sup .
1.6. CONEXIDADE EM RN 9
Demonstração. Consideremos o produto cartesiano X×X ⊂ Rn×Rn e seu subconjunto
∆ := {(x,x) | x ∈ X},
o qual chamaremos de diagonal de X×X . Notemos que ∆ é um subconjunto compacto de R2n já que é imagem de
X pela aplicação contínua h(x) = (x,x).
Consideremos a função g : X ×X →R definida por
g(x,y) := ‖ f (x)− f (y)‖.
Notemos que g é contínua já que pode ser escrita com soma e composição das funções contínuas f e d1. Segue
que, dado ε > 0, o conjunto V dos pontos (x,y) ∈ X ×X para os quais g(x,y)< ε é aberto em X×X e, como tal,
deve ser escrito como a intersecção de um abertoU ⊂ Rn×Rn com X×X . Como ∆ ⊂V , temos que ∆⊂U .
A compacidade de ∆ e o Teorema 1.5.8 implicam na existência de um número δ > 0 tal que a δ -vizinhança
de ∆ ainda está contida emU . Note que, se x,y ∈ X são tais que ‖x− y‖< δ , então
‖(x,y)− (y,y)‖= ‖(x− y,0)‖= ‖x− y‖< δ ,
ou seja, (x,y) pertence à δ -vizinhança de ∆. Segue que (x,y) ∈U e assim g(x,y)< ε , como desejado.
A demonstração para o caso damétrica do sup segue por equivalência das métricas. �
1.6 Conexidade em Rn
Nesta seção daremos a definição de espaços conexos e apresentaremos algumas propriedades que necessitaremos.
Definição 1.6.1 Um subconjunto Y de um espaço métrico X é conexo se ele não é igual à união de dois subcon-
juntos abertos, disjuntos e não vazios.
Exemplo 1.6.2 O conjuntoQ dos números racionais é desconexo, sendo
{x ∈ R | x>
√
2}∩Q e {x ∈ R | x<
√
2}∩Q
uma decomposição.
Teorema 1.6.3 Os únicos subconjuntos de R que possuem mais que um ponto e são conexos são o próprio R e os
intervalos (abertos, fechados ou semi-fechados).
Uma caracterização de subconjuntos conexos é dada no próximo resultado.
Teorema 1.6.4 Seja X um espaço métrico. São equivalentes:
1. X é conexo;
2. os únicos subconjuntos de X que são abertos e fechados são o próprio X e /0;
3. nenhuma função contínua f : X → {1,2} é sobrejetiva.
Usaremos o seguinte fato básico sobre espaços conexos.
Teorema 1.6.5 (Teorema do valor intermediário) Sejam X e Y espaços métricos. Se X é conexo e f : X → R é
contínua então f (X) é conexo.
10 CAPÍTULO 1. REVISÃO DE TOPOLOGIA EM RN
Demonstração. Se f (X) não fosse conexo, pelo Teorema 1.6.4 existiria uma função g : f (X)→ {1,2} contínua e
sobrejetora. Assim, a composição g ◦ f : X → {1,2} seria também contínua e sobrejetora, contradizendo o fato de
X ser conexo. �
Em particular, uma função contínua de um espaço métrico conexo X com valores em R assume todos os
valores entre dois quaisquer pontos de sua imagem.
Uma importante classe de conjuntos conexos emRn é dada pelos conjuntos convexos, que passamos a definir.
Dados x1,x2 ∈ Rn, o segmento de reta unindo x1 a x2 é dado por t 7→ x1 + t(x2− x1), 0 ≤ t ≤ 1. Um
subconjunto A ⊂ Rn é convexo se o segmento de reta unindo quaisquer de seus pontos está inteiramente contido
em A. Notemos que qualquer subconjunto convexo de Rn é conexo.
1.7 Exercícios do capítulo
Exercício 1 Se x,y ∈ Rn, demonstre que ‖x+ y‖ ≤ ‖x‖+ ‖y‖. Quando vale a igualdade? (A resposta não é
“quando x e y forem linearmente dependentes").
Exercício 2 (Desigualdade de Cauchy-Schwarz) Sejam x= (x1, . . . ,xn) e y= (y1, . . . ,yn). Demonstre que∣∣∣ n∑
i=1
xiyi
∣∣∣≤ ‖x‖‖y‖,
com a igualdade valendo se, e somente se, x e y forem linearmente dependentes.
Exercício 3 Sejam f e g funções integráveis em [a,b].
(i) Demonstre que ∣∣∣∫ b
a
f gdx
∣∣∣≤ (∫ b
a
f 2dx
)1/2(∫ b
a
g2dx
)1/2
.
Sugestão: considere separadamente os casos 0=
∫ b
a
( f −λg)2dx para algum λ ∈ R e 0<
∫ b
a
( f −λg)2dx
para todo λ ∈ R.
(ii) No caso em que temos igualdade, é verdade que f = λg para algum λ ∈ R? E se f e g forem contínuas?
(iii) Existe alguma relação entre a desigualdade do item (i) com a desigualdade do Exercício 2?
Exercício 4 Uma transformação linear T : Rn → Rn preserva norma se ‖Tx‖ = ‖x‖ para qualquer x ∈ Rn e
preserva produto interno se 〈Tx,Ty〉= 〈x,y〉 para quaisquer x,y ∈ Rn. Demonstre que estas duas propriedades
são equivalentes. Demonstre ainda que, neste caso, T é bijetora e T−1 também satisfaz as mesmas propriedades.
Exercício 5 Definimos o ângulo entre dois vetores não nulos x,y ∈ Rn por
∠(x,y) := arccos
( 〈x,y〉
‖x‖‖y‖
)
.
A transformação linear T : Rn → Rn preserva ângulo se T é bijetora e ∠(Tx,Ty) = ∠(x,y) para vetores não
nulos x e y.
(i) Demonstre que se T preserva norma, então T preserva ângulo.
(ii) Suponha que exista uma base {x1, . . . ,xn} ortonormal de Rn e números λ1, . . . ,λn tais que Txi = λixi, i =
1, . . . ,n. Demonstre que T preserva ângulo se, e somente se, |λi| são todos iguais.
1.7. EXERCÍCIOS DO CAPÍTULO 11
Exercício 6 Sejam 0≤ θ < pi e T : R2 →R2 dada na forma matricial por[
cosθ senθ
−senθ cosθ
]
.
Mostre que T preserva ângulo e que, se x 6= 0, ∠(x,Tx) = θ .
Exercício 7 Se T : Rm →Rn é uma transformação linear, mostre que existe uma constante M > 0 tal que
‖Tx‖ ≤M‖x‖,
para qualquer x ∈ Rm.
Sugestão: estime ‖Tx‖ em termos de ‖x‖ e das entradas da matriz de T .
Exercício 8 Seja X um espaço métrico e suponha que a11, . . . ,amn sejam mn funções contínuas de X em R. Para
cada p ∈ X, seja Ap a transformação linear de Rn em Rm cuja matriz é (ai j(p))m×n. Mostre que p 7−→ Ap é
contínua de X em L(Rn,Rm).
Exercício 9 Dois vetores x,y ∈ Rn são ortogonais se 〈x,y〉= 0. Demonstre ou dê um contra exemplo:
(i) se x é ortogonal à y, então ‖x+λy‖ ≥ ‖x‖ para qualquer λ ∈ R;
(ii) se ‖x+λy‖ ≥ ‖x‖ para qualquer λ ∈ R, então x é ortogonal à y.
Exercício 10 Seja f : Rn → R uma função contínua. Suponha que f (x) > 0 para qualquer x 6= 0 e que f (cx) =
c f (x) para qualquer x ∈ Rn e qualquer c ∈ R, c> 0. Mostre que existem constantes a> 0 e b> 0 tais que
a‖x‖ ≤ f (x)≤ b‖x‖.
Sugestão: Considere primeiramente o conjunto {x ∈ Rn : ‖x‖= 1}.
Exercício 11 Seja (X ,d) um espaço métrico. Mostre que, para cada M > 0, existe uma métrica dM tal que
dM(x,y)≤M, para quaisquer x,y ∈ X e ainda (X ,d) e (X ,dM) são homeomorfos. Equivalentemente, todo espaço
métrico é homeomorfo a um espaço métrico limitado.
Exercício 12 (Conjunto de Cantor) Seja C= [0,1]\ (A1∪A2∪ . . .), onde A1 = ( 13 , 23), A2 = ( 19 , 29)∪ ( 79 , 89), A3 =
( 127 ,
2
27)∪ . . .∪ ( 2527 , 2627 ) e A j é a união de 2 j−1 intervalos abertos de comprimento 3− j escolhidos similarmente.
Mostre que C é fechado e que não existe conjunto aberto no qual C seja denso.
Observação: uma das propriedades interessantes do conjunto de Cantor é que ele nos dá um exemplo de
conjunto não enumerável de medida nula, conceito que trabalharemos mais adiante no curso.
Exercício 13 Seja α um número irracional fixado e Rα o conjunto de todas as retas da forma
y= αx+(n−αm),
onde n,m ∈ Z. Mostre que R é um subconjunto denso de R2.
Sugestões:
• basta demonstrar que o conjunto {n−αm | n,m ∈ Z} é denso no eixo y;
• assuma que, dado ε > 0, existem números inteiros n′ e m′ suficientemente grandes tais que
0<
n′
m′
−α < 1
m′2
e
1
m′
< ε.
Este fato pode ser utilizado sem a demonstração (consulte [8]).
12 CAPÍTULO 1. REVISÃO DE TOPOLOGIA EM RN
Exercício 14 Seja R+ o conjunto dos números reais positivos.
a) Mostre que a função contínua f : R+ → R dada por f (x) = 11+ x é limitada mas não possui máximo nem
mínimo.
b) Mostre que a função contínua g : R+ →R dada por g(x) = sen 1x é limitada mas não uniformemente contí-
nua em R+.
Exercício 15 Sejam X = (−1,1)×{0}⊂R2 eU = B1(0)⊂R2. Note que X ⊂ B1(0). Mostre que não existe ε > 0
tal que a ε–vizinhança de X em R2 esteja contida em U.
Exercício 16 Uma função f : Rn \ {0} → R é dita positivamente homogênea de grau d ∈ R se f (tx) = td f (x),
para qualquer x 6= 0 e todo t > 0. Suponhamos que f seja contínua. Demonstre que, se f possui uma extensão
contínua para todo Rn, então o seguinte ocorre:
a) se d < 0, então f ≡ 0;
b) se d = 0, então f é uma função constante;
c) se d > 0, então não é necessária qualquer condição adicional em f .
Em cada um dos casos, indique o valor que f deve assumir em 0.
Exercício 17 Sejam f ,g : A⊂ Rn → Rm duas funções contínuas.
a) Demonstre que o conjunto {x ∈ A | f (x) = g(x)} é fechado.
b) Se m= 1, demonstre que {x ∈ A | f (x)> g(x)} é aberto em A.
Capítulo 2
Diferenciabilidade
Neste capítulo vamos estudar o cálculo diferencial de funções f : Rn → Rm. As vezes, chamaremos uma função
de várias variáveis com valores em Rm de uma aplicação. A teoria se baseia na aproximação linear local dessas
aplicações como no caso em que m = n = 1. Dentre os resultados que obteremos está o que trata da diferencia-
bilidade da composta de duas funções (Regra da Cadeia). Além disso, sendo a derivada uma aproximação linear
de uma função em um ponto onde ela é diferenciável, estudaremos que tipo de informações qualitativas podemos
obter analisando somente a derivada. Os principais resultados nessa direção são o Teorema da Função Inversae o
Teorema da Função Implícita. O primeiro destes teorema ainda nos fornecerá consequências importantes que são
as Formas Locais das Imersões e das Submersões e o Teorema do Posto.
Primeira aula ↓
2.1 Definições básicas
Uma primeira tentativa para definirmos a diferenciabilidade de uma função f : Rn →Rm seria a seguinte: fixamos
n−1 variáveis e tratamos f como sendo uma função de apenas uma variável. Isto feito, supondo que f está sendo
considerada como função de xi, definimos a derivada parcial de f na direção xi como no caso de uma variável.
Assim, as derivadas parciais dão informações a respeito de f ao longo das direções dadas pelos eixos coordenados.
Existe porém uma pequena modificação deste conceito que estuda a variação de f localmente em direções dadas
por um vetor fixado u.
Definição 2.1.1 Sejam A⊂Rn um aberto, x0 ∈ A, u 6= 0 um vetor em Rn e f : A→Rm. A derivada direcional de
f em x0 na direção de u, denotada por f ′(x0;u), é definida por
f ′(x0;u) := lim
h→0
f (x0+ hu)− f (x0)
h
,
sempre que este limite existir.
Outra notação para f ′(x0;u) é
∂ f
∂u
(x0).
Observação 2.1.2 No caso em que u= ei, onde ei é o i-ésimo vetor da base canônica de Rn, temos que a derivada
direcional de f na direção de u coincide com a derivada parcial de f na direção ei, e denotamos por
∂ f
∂xi
.
Exemplo 2.1.3 Seja f : Rn →R dada por f (x) = ‖x‖2 e u ∈ Rn qualquer vetor fixado. Então
f (x+ hu)− f (x) = 〈x+ hu,x+ hu〉−‖x‖2
= ‖x‖2+ 2h〈x,u〉+ h2‖u‖2−‖x‖2
= 2h〈x,u〉+ h2‖u‖2.
13
14 CAPÍTULO 2. DIFERENCIABILIDADE
Segue que f ′(x;u) = 2〈x,u〉.
Ao tentarmos obter informações sobre a continuidade de uma função analisando suas derivadas direcionais
encontraremos alguns problemas.
Exemplo 2.1.4 Seja f : R2 →R dada por
f (x,y) =
{
x+ y se xy= 0,
1 caso contrário.
Então
∂ f
∂x
(0,0) =
∂ f
∂y
(0,0) = 1. Entretanto, f não é contínua na origem. Note ainda que, para qualquer direção
u= (a,b), com a 6= 0 e b 6= 0, temos que
f (0+ ha,0+ hb)− f (0,0)
h
=
f (ha,hb)
h
=
1
h
e assim, não existe f ′(0,0;u).
No exemplo anterior a derivada direcional não existia em direções diferentes daquelas dadas pelos eixos.
Existem ainda funções que possuem derivadas direcionais em todas as direções em um dado ponto x0 mas que
supreendetemente são descontínuas em x0.
Exemplo 2.1.5 Seja f : R2 →R dada por
f (x,y) =
 xy
2
x2+ y4
se x 6= 0,
0 se x= 0.
Consideremos um vetor u= (a,b) qualquer. Temos então que, se a 6= 0,
f (0+ ha,0+ hb)− f (0,0)
h
=
h3ab2
h(h2a2+ h4b4)
=
ab2
a2+ h2b4)
.
Segue que
f ′(0,0;u) =
{
b2/a se a 6= 0,
0 se x= 0.
Assim, existem as derivadas direcionais de f em (0,0) em todas as direções. Entretanto, f não é contínua em
(0,0). De fato, f (0,0) = 0 mas, se calcularmos o limite de f em (0,0) sobre a parábola x= y2 obteremos 1/2.
Para obtermos continuidade necessitamos de um conceito mais forte que derivadas direcionais que é a dife-
renciabilidade. Recordemos o caso de funções de R em R.
Dada uma função f : R→ R, definimos a derivada de f por meio do limite (se ele existir)
f ′(x) := lim
h→0
f (x+ h)− f (x)
h
.
Definamos
g˜(h) :=
f (x+ h)− f (x)
h
− f ′(x).
Então g˜ não está definida em h= 0, mas
lim
h→0
g˜(h) = 0.
No caso em que h 6= 0 podemos escrever
f (x+ h)− f (x) = f ′(x)h+ hg˜(h).
2.1. DEFINIÇÕES BÁSICAS 15
Quando h< 0 escrevemos
f (x+ h)− f (x) = f ′(x)h− h(−g˜(h)).
Definimos g da seguinte forma:
g(0) = 0, g(h) = g˜(h),h> 0, g(h) =−g˜(h),h< 0.
Podemos então verificar que, se f é diferenciável, existe uma função g tal que
f (x+ h)− f (x) = f ′(x)h+ |h|g(h),
lim
h→0
g(h) = 0. (2.1)
Reciprocamente, suponha que existe λ ∈ R e uma função g tal que
f (x+ h)− f (x) = λh+ |h|g(h),
lim
h→0
g(h) = 0. (2.2)
Se h 6= 0 temos que
f (x+ h)− f (x)
h
= λ +
|h|
h
g(h).
Logo, tomando o limite h→ 0 na expressão acima e observando que
lim
h→0
|h|
h
g(h) = 0,
obtemos que f é diferenciável e que sua derivada f ′(x) vale justamente λ .
Segue dessa análise que a existência de um número λ e de uma função g satisfazendo (2.2) poderia ser
usada como definição de diferenciabilidade de funções de uma variável real. Notemos ainda na expressão (2.1)
que a quantidade T (h) := f ′(x)h é linear em h. A derivada total de uma função de várias variáveis será definida
preservando as propriedades acima.
Definição 2.1.6 Seja A ⊂ Rn e f : A→ Rm. Suponha que A contenha uma vizinhança de x0. Dizemos que f é
diferenciável em x0 se existe uma matriz B, do tipo m× n, tal que
lim
H→0
f (x0+H)− f (x0)−B ·H
|H| = 0.
A matriz B é chamada de derivada ou diferencial de f em x0, e é denotada por B= Df (x0).
NaDefinição 2.1.6 utilizamos a norma do sup,mas poderíamos ter utilizado a norma euclidiana sem nenhuma
perda. Para que esta definição faça sentido devemos observar que a matriz Df (x0), quando existe, é única.
Lema 2.1.7 A derivada de f : A⊂ Rn →Rm, quando existe, é única.
Demonstração. Suponha que B e C sejam duas matrizes que satisfazem a condição na definição de derivada.
Segue que
lim
H→0
(C−B) ·H
|H| = 0.
Fixado u 6= 0, tomamos H = tu e fazemos t → 0. Segue que (C−B) ·u= 0 e, como u é qualquer,C = B. �
No caso em que a derivada de f : A⊂ Rn → Rm existe em todo ponto do aberto A dizemos que f é diferen-
ciável em A. Neste caso a aplicação derivada de f é a aplicação
Df : A→L (Rn,Rm), com (Df )(x) = Df (x).
16 CAPÍTULO 2. DIFERENCIABILIDADE
Exemplo 2.1.8 Qualquer matriz B ∈ L (Rn,Rm) pode ser vista ais simplesmente como uma função entre esses
espaços. Mas por linearidade, B(x0+H)−B(x0) = B(H). Segue que DB(x0) = B
Mostremos que a definição de diferenciabilidade que acabamos de dar, na qual a matriz Df (x0) é conheci-
da como derivada de Fréchet, é mais forte que o conceito de derivada direcional, conhecida como derivada de
Gâteaux. De fato, diferenciabilidade implica em continuidade.
Teorema 2.1.9 Seja A⊂ Rn e f : A→ Rm. Se f é diferenciável em x0 ∈ A então f é contínua em x0.
Demonstração. Para H pequeno de forma que x0+H ∈ A temos que
f (x0+H)− f (x0) = |H|
( f (x0+H)− f (x0)−Df (x0) ·H
|H|
)
+Df (x0) ·H.
Como a expressão dentro do parênteses tende a 0 quando H → 0 temos que
lim
H→0
f (x0+H)− f (x0) = 0.
Logo f é contínua em x0. �
Podemos ainda recuperar o conceito de derivada direcional utilizando o conceito de diferenciabilidade.
Proposição 2.1.10 Seja A⊂Rn e f : A→Rm. Se f é diferenciável em x0 ∈ A então f ′(x0;u) existe para qualquer
vetor u ∈ Rn e
f ′(x0;u) = Df (x0) ·u.
Em particular, se m= 1 então
D f (x0) =
( ∂ f
∂x1
(x0), . . . ,
∂ f
∂xn
(x0)
)
.
Demonstração. Seja B := Df (x0). Tomemos H = tu, t 6= 0, e substituimos na definição de diferenciabilidade.
Obtemos que
lim
t→0
f (x0+ tu)− f (x0)−B · tu
|tu| = 0. (2.3)
Multiplicamos (2.3) por |u| ou por −|u|, dependendo se t > 0 ou t < 0, respectivamente. Em ambos os casos
obtemos
lim
t→0
( f (x0+ tu)− f (x0)
t
)
−B ·u= 0.
Segue que f ′(x0;u) = B ·u.
Suponhamos agora que m= 1. Então, por definição, Df (x0) é uma matriz 1×m que escrevemos como
Df (x0) = (λ1 . . .λm).
Pela primeira parte deste teorema temos que
∂ f
∂x j
(x0) = f
′(x0;e j) =Df (x0) · e j = λ j, j = 1, . . . ,m.
O resultado segue. �
Observação 2.1.11 No caso em que f : A⊂ Rn →R é diferenciável em x0, usamos a notação
∇ f (x0) :=
( ∂ f
∂x1
(x0), . . . ,
∂ f
∂xn
(x0)
)
,
chamado de gradiente de f em x0.
2.2. O TEOREMA DO VALOR MÉDIO 17
Sejam {e1, . . . ,en} e {u1, . . . ,um} as bases canônicas de Rn e Rm respectivamente. Dada f : A ⊂ Rn → Rm
diferenciável em x0 ∈ A, definamos a transformação linear T : Rn → Rm por
T (ei) := Df (x0) · ei = f ′(x0;ei).
Suponhamos que f = ( f1, . . . , fm), isto é,
f (x) =
m
∑
j=1
f j(x)u j.
Com esta notação temosque
f ′(x0;ei) = lim
t→0
f (x0+ tei)− f (x0)
t
= lim
t→0
m
∑
j=1
f j(x0+ tei)− f j(x0)
t
u j. (2.4)
Fazendo o produto interno de ambos os lados da igualdade (2.4) com u j, j = 1, . . . ,m, vemos que cada termo na
soma possui limite, o qual é justamente
∂ f j
∂xi
(x0), ou seja
m
∑
j=1
∂ f j
∂xi
(x0)u j = f
′(x0;ei) = T (ei).
Segue que a matriz de T com relação às bases canônicas de Rn e Rm é
∂ f1
∂x1
(x0)
∂ f1
∂x2
(x0) . . .
∂ f1
∂xn
(x0)
...
...
...
...
∂ fm
∂x1
(x0)
∂ fm
∂x2
(x0) . . .
∂ fm
∂xn
(x0)
 .
Tal matriz é chamada de Jacobiana de f em x0, sendo denotada por Df (x0). Ela está definida em qualquer
ponto de Rn onde f é diferenciável.
Segunda aula ↓
Vamos resumir a discussão sobre matrizes e derivadas na proposição a seguir.
Proposição 2.1.12 Seja f : A⊂ Rn →Rm uma função com f = ( f1, . . . , fm).
a) A função f é diferenciável em x0 ∈ A se, e somente se, cada uma de suas componentes f1, . . . , fm são
diferenciáveis em x0.
b) Se f é diferenciável em x0 ∈ A, então a matriz Jacobiana de f em x0 é a matriz da derivada de f em x0.
2.2 O Teorema do Valor Médio
Para uma função diferenciável g : R→ R, o Teorema do Valor Médio afirma que
g(x)− g(y) = g′(z)(x− y),
para algum z ∈ (x,y). Entretanto esta relação não é válida em geral para funções de Rn em Rm. Vamos demonstrar
que uma versão corrigida do teorema é válida. Utilizaremos a seguinte notação: para x,y ∈Rn, definimos
L(x,y) := {tx+(1− t)y | 0≤ t ≤ 1}.
18 CAPÍTULO 2. DIFERENCIABILIDADE
Teorema 2.2.1 (Teorema do Valor Médio) Sejam A ⊂ Rn um aberto e f : A→ Rm diferenciável em todo ponto
de A. Sejam x,y ∈ A tais que L(x,y) ⊂ A. Então, para todo a ∈ Rm, existe z ∈ L(x,y) tal que〈
a,( f (y)− f (x))〉 = 〈a,Df (z) · (y− x)〉.
Demonstração. Seja u = y− x. Como A é aberto e L(x,y) ⊂ A, temos que existe δ > 0 tal que x+ tu ∈ A, para
qualquer−δ < t < 1+ δ (basta usar o Teorema 1.5.8). Agora fixemos a ∈ Rm e definamos F : (−δ ,1+ δ )→Rm
por
F(t) :=
〈
a, f (x+ tu)
〉
.
Notemos que
lim
h→0
F(t+ h)−F(t)
h
=
〈
a, f ′(x+ tu;u)
〉
.
Em particular, F é diferenciável em (0,1). Segue do Teorema do Valor Médio de uma variável que existe 0< θ < 1
tal que
F(1)−F(0) = F ′(θ ) = 〈a, f ′(x+θu;u)〉= 〈a, f ′(z;y− x)〉= 〈a,Df (z) · (y− x)〉,
onde z := x+θu ∈ L(x,y). O resultado segue notando que F(1)−F(0) = 〈a,( f (y)− f (x))〉. �
Observação 2.2.2 É interessante observar que o Teorema do ValorMédio 2.2.1 possui implicações simples, porém
já interessantes.
a) No caso em que m= 1, tomando a= 1, o Teorema 2.2.1 implica que
f (y)− f (x) = 〈∇ f (z),(y− x)〉,
para algum z ∈ L(x,y).
b) Tomando a = f (y)− f (x) podemos usar a Desigualdade de Cauchy-Schwarz do Exercício 2 para, após
dividirmos por ‖ f (y)− f (x)‖, obtermos do Teorema 2.2.1 que
‖ f (y)− f (x)‖ ≤M‖y− x‖,
onde M é a norma de D f (z), para algum z ∈ L(x,y). Em particular, se A é convexo e as derivadas parciais
de f são limitadas em A, então f é Lipschitz, uma vez que, para quaisquer y,x ∈ A, temos que L(x,y)⊂ A.
2.3 Uma condição suficiente para diferenciabilidade
Até agora obtemos resultados que são consequências da hipótese de diferenciabilidade de uma função. Entretanto,
vimos também que nem a existência das derivadas direcionais em todas as direções de uma certa função em um
dado ponto não implicam na diferenciabilidade desta função neste ponto (já que pode acontecer de não termos
nem mesmo continuidade). O principal resultado desta seção mostra que a continuidade das derivadas parciais
é suficiente para garantirmos a diferenciabilidade. Antes vamos explicitr uma versão mais simples da Regra da
Cadeia que já utilizamos na demonstração do Teorema do Valor Médio.
Lema 2.3.1 Seja g : A⊂ Rn →R uma função diferenciável no aberto A e considere φ(t) = g(x0+ tu). Para todo
t de maneira que φ esteja bem definida temos
φ ′(t) = 〈∇g(x0+ tu),u〉.
Teorema 2.3.2 Seja A ⊂ Rn um aberto e f : A→ Rm, com f = ( f1, . . . , fm). Suponha que as derivadas parciais
∂ f j
∂xi
das funções componentes existem em cada ponto de A e são contínuas em A. Então f é diferenciável em A.
2.3. UMA CONDIÇÃO SUFICIENTE PARA DIFERENCIABILIDADE 19
Demonstração. Primeiramente notemos que é suficiente demonstrarmos o teorema no caso de uma função com
valores em R. De fato, a diferenciabilidade de f = ( f1, . . . , fm) é equivalente à diferenciabilidade de cada compo-
nente.
Dados x0 ∈ A e ε > 0, consideremos o pontos x ∈ A tais que |x− x0| < ε . Seja H = (h1, . . . ,hn) ∈ Rn com
0 < |H| < ε . Consideremos então os seguintes pontos de Rn que são vértices de um paralelepípedo retângulo
centrado em x0:
p0 = x0,
p1 = x0+ h1e1,
...
pn = x0+ h1e1+ . . .+ hnen = x0+H.
Podemos escrever
f (x0+H)− f (x0) =
n
∑
j=1
(
f (p j)− f (p j−1)
)
. (2.5)
Suponhamos h j 6= 0 e definamos φ(t) := f (p j−1+ te j), t ∈ [−δ ,h j+ δ ], para algum δ > 0. Notemos ainda
que φ é diferenciável em t pelo Lema 2.3.1 (pois as derivadas parciais de f existem e são contínuas). Aplicando o
Teorema do Valor Médio à φ concluimos que
f (p j)− f (p j−1) = φ(h j)−φ(0) = φ ′(c j)h j = ∂ f
∂x j
(q j)h j, (2.6)
para algum c j ∈ (0,h j), onde q j = p j−1+ c je j. Notemos que se h j = 0, então (2.6) vale automaticamente. Substi-
tuindo (2.6) em (2.5) obtemos
f (x0+H)− f (x0) =
n
∑
j=1
∂ f
∂x j
(q j)h j. (2.7)
Subtraindo 〈∇ f (x0),H〉 em ambos os lados da igualdade (2.7) e dividindo por |H| chegamos na identidade
f (x0+H)− f (x0)−〈∇ f (x0),H〉
|H| =
n
∑
j=1
( ∂ f
∂x j
(q j)− ∂ f
∂x j
(x0)
) h j
|H| .
Fazendo H → 0, vemos que q j → x0. Usando a continuidade das derivadas pariciais e a limitação do quociente
h j/|H| obtemos o resultado. �
Uma função f : A ⊂ Rn → Rm cujas derivadas parciais existem e são contínuas em A é chamada de conti-
nuamente diferenciável ou de classe C1 em A, ou ainda f ∈C1(A,Rm). No decorrer deste texto usaremos ainda a
notação
D j f (x) :=
∂ f
∂x j
.
Suponha que f : A⊂ Rn → Rm e que as derivadas pariciais das componentes de f , dadas por D j fi, existam.
Estas são, novamente, funções de A em R. Podemos então considerar as suas derivadas parciais
Dk(D j fi) = Dk, j fi,
que são as chamadas derivadas parciais de segunda ordem de fi. Similarmente definimos as derivadas de terceira
ordem, e assim por diante. Se as derivadas parciais de fi até ordem r existem e são contínuas para i = 1, . . . ,m,
dizemos que f é de classe Cr e escrevemos f ∈ Cr(A,Rm). Dizemos ainda que f é de classe C∞ se as derivadas
parciais de todas as ordens de todas as componentes de f existem. Notemos queC∞(A,Rm) = ∩r∈NCr(A,Rm).
20 CAPÍTULO 2. DIFERENCIABILIDADE
2.4 O Teorema de Clairaut-Schwarz
Se uma função f : A ⊂ Rn → Rm possui derivadas parciais até segunda ordem, não necessariamente temos que
DiD j f = D jDi f .
Exemplo 2.4.1 (Peano) Seja f : R2 →R dada por
f (x,y) = xyg(x,y),
onde g : R2 →R é uma função limitada. Então, para qualquer y ∈ R,
∂ f
∂x
(0,y) = lim
x→0
f (x,y)− f (0,y)
x
= y lim
x→0
g(x,y),
o que nos dá
∂ 2 f
∂y∂x
(0,0) = lim
y→0
y limx→0 g(x,y)
y
= lim
y→0
lim
x→0
g(x,y),
desde que os limites existam. Similarmente
∂ 2 f
∂x∂y
(0,0) = lim
x→0
lim
y→0
g(x,y).
Escolhendo, por exemplo,
g(x,y) =
x2− y2
x2+ y2
, (x,y) 6= 0,
obtemos
lim
x→0
g(x,y) =−1, (y 6= 0), lim
y→0
g(x,y) = 1, (x 6= 0).
Segue que
∂ 2 f
∂x∂y
(0,0) = 1,
∂ 2 f
∂y∂x
(0,0) =−1.
O Teorema de Clairaut-Schwarz nos dá condições sob as quais temos a igualdade das derivadas parciais de
segunda ordem mistas Dk, j f e D j,k f .
Teorema 2.4.2 (Teorema de Clairaut-Schwarz) Seja A ⊂ Rn um aberto e f : A→ R uma função de classe C1.
Suponhamos que DkD j f e D jDk f , k 6= j, existem e são contínuas. Então, para cada x0 ∈ A,
DkD j f (x0) = D jDk f (x0).Demonstração. Iniciamos com o caso n = 2. Queremos então demonstrar que D1D2 f (x0,y0) = D2D1 f (x0,y0),
(x0,y0)∈A fixado. Seja δ > 0 tal que a δ–vizinhança de (x0,y0) esteja contida em A e consideremos s∈R pequeno
de maneira que a expressão abaixo esteja bem definida:
Q(s) :=
1
s2
( f (x0+ s,y0+ s)− f (x0,y0+ s)− f (x0+ s,y0)+ f (x0,y0)) .
Q(s) é chamado de quociente de diferença de segunda ordem. Definamos
g(x) = f (x,y0+ s)− g(x,y0)
para cada x ∈R de maneira que (x,y0+ s), (x,y0) ∈ A. Observe que o domínio de g é um aberto em R que contém
o intervalo fechado [x0,x0+ s]. Além disso,
g′(x) = f1(x,y0+ s)− f1(x,y0).
2.4. O TEOREMA DE CLAIRAUT-SCHWARZ 21
Assim, g é de classe C1, pois f1 é contínua, e tabém
Q(s) =
1
s2
(g(x0+ s)− g(x0)).
Aplicando o Teorema do Valor Médio à g vemos que existe ξ ∈ (x0,x0+ s) tal que
Q(s) =
1
s
g′(ξ ) =
1
s
( f1(ξ ,y0+ s)− f1(ξ ,y0)).
Observe que ξ depende de s. Seja agora
h(y) = f1(ξ ,s),
para cada y ∈ R de maneira que (ξ ,y) ∈ A. Novamente, o domínio de h é aberto e contém o intervalo [y0,y0+ s].
Além disso,
h′(y) = f12(xi,s)
e h é de classe C1. Temos então
Q(s) =
1
s
(h(y0+ s)− h(y0)).
Aplicando novamente o Teorema do Valor Médio obtemos que
Q(s) = f12(ξ ,η)
para algum η ∈ (y0,y0+ s), dependendo de s.
Repetindo este processo trocando-se o papel de x e y enocntramos que
Q(s) = f21(ξ
∗,η∗).
para certos ξ ∗ ∈ (x0,x0+ s), η∗ ∈ (y0,y0+ s).
Pela continuidade de f12 e f21 temos que, dado ε > 0, existe δ > 0 tal que, para 0< s< δ ,
| f12(ξ ,η)− f12(x0,y0)|< ε, | f21(ξ ∗,η∗)− f21(x0,y0)|< ε.
Portanto, no limite
lim
s→0
Q(s) = f12(x0,y0) = f21(x0,y0),
demonstrando o teorema no caso n= 2.
Suponhamos agora que n> 2 e que, sem perda de generalidade, i< j. Dado x0 = (x10, . . . ,x
n
0) ∈ A, definamos
φ(x,y) = f (x10, . . . ,x
i−1
0 ,x,x
i+1
0 , . . . ,x
j−1
0 ,y,x
j+1
0 , . . . ,xn),
que está bem definida em algum aberto de R2 contendo (x)i0,x
j
0). Aplicando a primeira parte da demonstração à φ
encontramos
fi j(x0) = φ12(x
i
0,x
j
0) = φ21(x
i
0,x
j
0) = f ji(x0).
Isto finaliza a demonstração do teorema. �
Observe que o Teorema 2.4.2 implica que, se f é de classe C3, então f123 = f132 = f112 e assim por diante.
Terceira aula ↓
22 CAPÍTULO 2. DIFERENCIABILIDADE
2.5 A Regra da Cadeia
Para funções f e g tais que a composta h = f ◦ g pode ser calculada, a regra da cadeia nos diz como calcular a
derivada total de h em termos da derivada total de f e de g.
Teorema 2.5.1 Sejam A ⊂ Rn e B ⊂ Rm abertos. Consideremos as funções f : A→ Rm e g : B→ Rp tais que
f (A) ⊂ B e com f (x0) = y0. Se f é diferenciável em x0 e g é diferenciável em y0, então a composta g ◦ f é
diferenciável em x0 e, além disso,
D(g ◦ f )(x0) = Dg(y0) ·Df (x0),
onde o ponto “·” indica o produto das matrizes jacobianas de g e f respectivamente.
Demonstração. Pela continuidade de g em y0, podemos tomar ε > 0 tal que g está definida no conjunto Cε (y0).
Similarmente, escolhemos δ > 0 tal que f esteja definida em Cδ (x0) e ainda, f (x) ∈ Cε(y0), para qualquer x ∈
Cδ (x0). Segue que a composta g ◦ f está definida emCδ (x0).
f g
c
y0x0
δ ε
Tomemos H ∈ Rn tal que 0< |H|< δ . Assim,
g ◦ f (x0+H)− g ◦ f (x0) = g( f (x0+H))− g( f (x0)) = g(z+ y0)− g(y0),
onde y0 = f (x0) e z= f (x0+H)− f (x0). Pela diferenciabilidade de f em x0 podemos escrever
z= f (x0+H)− f (x0) = Df (x0) ·H+ |H|E f (H),
onde lim
H→0
E f (H) = 0.
(2.8)
Analogamente, a diferenciabilidade de g em y0 implica que
g(z+ y0)− g(y0) = Dg(y0) · z+ |z|Eg(z),
onde lim
z→0
Eg(z) = 0.
(2.9)
Substituindo (2.8) em (2.9) obtemos
g(z+ y0)− g(y0) = Dg(y0)
[
Df (x0) ·H
]
+ |H|Dg(y0)E f (H)+ |z|Eg(z)
= Dg(y0)
[
Df (x0) ·H
]
+ |H|E(H),
onde
E(H) := Dg(y0)E f (H)+
|z|
|H|Eg(z), H 6= 0, E(0) = 0.
A demonstração estará completa se tivermos que
lim
H→0
E(H) = 0.
Notemos que z→ 0 quando H → 0. Logo, E f (H)→ 0 e Eg(z)→ 0 quando H → 0. Vamos então mostrar que o
quociente
|z|
|H| está limitado quando H → 0, o que finalizará a demontração. Segue de (2.8) que
|z|
|H| =
|Df (x0) ·H+ |H|E f (H)|
|H| ≤ |Df (x0)|+ |E f (H)| ≤ |Df (x0)|+M, (2.10)
2.6. O TEOREMA DA FUNÇÃO INVERSA 23
onde |E f (H)| ≤M. �
Abaixo temos duas consequências da regra da cadeia.
Corolário 2.5.2 Sejam A⊂ Rn e B⊂ Rm. Consideremos as funções f : A→ Rm e g : B→ Rp tais que f (A) ⊂ B.
Se f e g são de classe Cr, então a composta g ◦ f também será de classe Cr.
Corolário 2.5.3 Sejam A⊂Rn aberto, f : A→Rm com f (x0) = y0. Suponha que g é uma função definida em uma
vizinhaça de y0 com imagem em Rn que ainda satisfaz g(y0) = x0 e
g( f (x)) = x
para todo x e uma vizinhança de x0. Se f for diferenciável em x0 e g for diferenciável em y0, então
Dg(y0) = [Df (x0)]
−1.
Demonstração. Seja i : Rn → Rn a função identidade. Sua derivada é a matriz In. Segue que
Dg(y0) ·Df (x0) = In.
Como a inversa a direita de uma matriz é também inversa à esquerda (Teorema 2.5 de [10]), temos o resultado. �
2.6 O Teorema da Função Inversa
Nesta seção consideraremos um dos teoremas mais básicos da teoria que desenvolveremos no curso. Juntamente
com o Teorema da Função Implícita, o Teorema da Função Inversa ilustra a idéia de que um sistema não linear
de equações se comporta essencialmente como sua linearização enquanto os termos lineares dominarem (em um
certo sentido) os termos não lineares. Resultados dessa natureza são muito importantes em Análise, em particular
em equações diferenciais.
A demonstração que apresentaremos nestas notas é baseada Teorema do Ponto Fixo de Banach (Teorema
2.6.7). Para uma demonstração baseada em estimativas elementares encorajamos a leitura de [13] ou [10]. Histo-
ricamente, o uso do Teorema 2.6.7 na demonstração do Teorema da Função Inversa possui suas raízes no método
iterativo de Goursat ([7]), que é inspirado no método iterativo de Picard para existência de soluções de equações
diferenciais ordinárias. O fato de o mesmo princípio utilizado na demonstração ser utilizado em outras áreas da
Análise nos motivou a apresentar esta demonstração.
Definição 2.6.1 SejamU eV subconjuntos abertos de Rn. Dizemos que f : U →V é um difeomorfismo de classe
Cr se:
1. f é um homeomorfismo;
2. tanto f quanto f−1 são de classe Cr.
Exemplo 2.6.2 Fixados a,b ∈ Rn, a aplicação Ta,b : Rn → Rn dada por Ta,b(x) = x+(b− a) é um difeomorfismo
de classe C∞.
Exemplo 2.6.3 Dada uma matriz An×n não singular (detA 6= 0), a função TA : Rn →Rn dada por TA(x) = Ax é um
difeomorfismo de classe C∞.
O seguinte resultado reflete o fato da existência de um difeomorfismo ser uma relação de equivalência entre
os subconjuntos abertos de Rn.
Lema 2.6.4 Sejam U,V,W subconjuntos abertos de Rn. Consideremos as funções f : U → V, g : V →W e a
composição h= g◦ f : U→W. Se quaisquer duas destas funções forem um difeomorfismo, então a terceira também
será.
24 CAPÍTULO 2. DIFERENCIABILIDADE
Enunciamos agora o principal resultado desta seção.
Teorema 2.6.5 (Teorema da Função Inversa) SejaW um subconjunto aberto deRn e considere f : W →Rn uma
função de classe Cr, r = 1,2, . . . ,∞. Se x0 ∈W e D f (x0) é não singular, então existe uma vizinhança aberta U
de x0, U ⊂W, tal que V = F(U) é aberto e F : U → V é um difeomorfismo de classe Cr. Além disso, se x ∈U e
y= f (x), então temos a seguinte fórmula para a derivada de f−1 em y:
D f−1(y) =
[
Df (x)
]−1
.
Para demonstrarmos o Teorema 2.6.5 ainda necessitamos alguns fatos, já que utilizaremos o Teorema do
Ponto Fixo de Banach.
Definição 2.6.6 Seja (X ,d) um espaço métrico. Dizemos que {xn}n∈N ⊂ X é uma sequência de Cauchy em X
se d(xi,x j)→ 0 quando i, j → ∞. O espaço X é chamado de completo se toda sequência de Cauchy em X é
convergente.
Teorema 2.6.7 (Teorema do Ponto Fixo de Banach) Seja (X ,d) um espaço métrico completo eT : X → X uma
função. Suponhamos que exista uma constante 0≤ λ < 1 tal que, para quaisquer x,y ∈ X,
d(T (x),T (y))≤ λd(x,y).
Então T possui um único ponto fixo em X.
Demonstração. Aplicando T repetidamente temos que d(T n(x),T n(y))≤ λ nd(x,y).
Afirmação: se escolhemos x0 ∈ X arbitrário e definimos xk := T k(x0), então existe uma constante L ≥ 0
independente de k, j tal que d(xk,xk+ j)≤ λ kK. De fato,
d(xk,xk+ j) = d(T
k(x0),T
k(T j(x0)))≤ λ kd(x0,T j(x0)).
Pela Desigualdade Triangular,
d(x0,T
j(x0))≤ d(x0,T (x0))+ d(T (x0),T 2(x0))+ . . .+ d(T j−1(x0),T j(x0))
≤ (1+λ + . . .+λ j−1)d(x0,T (x0))≤ 11−λ d(x0,T (x0)).
A afirmação segue se tomarmos L=
1
1−λ d(x0,T (x0)).
Segue que {xk} possui um limite, o qual denotamos por a. Como {xk+1} possui obviamente o mesmo limite,
temos que
d(a,T (a)) = lim
k→∞
d(xk,T (xk)) = lim
k→∞
d(xk,xk+1) = 0.
Logo T (a) = a. Note que, se tivéssemos dois pontos fixos a e b com a 6= b, então
d(a,b) = d(T (a),T (b))≤ λd(a,b),
contradizendo o fato de 0≤ λ < 1. �
Observação 2.6.8 Suponha que X seja um espaço de Banach e que φ : X → X seja uma aplicação não linear.
Dado y ∈ X , consideremos a equação
y= φ(x).
Podeos reescreve-la na forma
x= g(x), com g(x) = x−φ(x)+ y.
Dessa forma, a equação y= φ(x) é equivalente a encontrar um ponto fixo de g. Se g for uma contração, o Teorema
do Ponto Fixo de Banach nos garante a existência de um ponto fixo e a convergência exponencial da sequência
(xn) definida por
x0 ∈ X , xn+1 = xn−φ(xn)+ y,
para o ponto fixo de g.
2.6. O TEOREMA DA FUNÇÃO INVERSA 25
Demonstração do Teorema 2.6.5.
Vamos organizar a demonstração em vários passos.
Passo (i): podemos assumir que x0 = 0, f (0) = 0 e D f (0) = In, a matriz identidade.
De fato, o caso geral segue da seguinte forma: compondo com os difeomorfismos do Exemplo 2.6.2 po-
demos transladar a origem para x0 e depois y0 para a origem; após isso, compomos a função resultante com o
difeomorfismo do Exemplo 2.6.3 com A= [Df (x0)]−1; finalmente usamos o Lema 2.6.4.
Definamos agora
g(x) = x− f (x).
Então g(0) = 0 e Dg(0) = 0n (a matriz nula de ordem n).
Passo (ii): existe um número real r > 0 tal que D f é não singular na bola fechada B2r(0)⊂W e, para quaisquer
x1,x2 ∈ Br(0), temos que
|g(x1)− g(x2)| ≤ 12 |x1− x2| (2.11)
e
|x1− x2| ≤ 2| f (x1)− f (x2)|. (2.12)
Para verificarmos esta afirmação tomamos inicialmente r1 > 0 tal que B2r1(0) ⊂W . Além disso, como
det(Df (x0)) é uma função contínua de x ∈W e não se anula em uma vizinhança de 0, selecionamos r2 > 0 tal que
det(Df (0)) não se anula em B2r2(0). Finalmente, como ‖Dg(0)‖= 0, podemos tomar r3 > 0 tal que ‖Dg(x)‖≤ 1/2
para x ∈ B2r3(0). Consideremos r = min{r1,r2,r3}. A desigualdade (2.11) segue do item 2 da Observação 2.2.2.
A desigualdade (2.12) por sua vez segue substituindo g(xi) por xi− f (xi), i= 1,2. De fato:
|x1− f (x1)− x2+ f (x2)| ≤ 12 |x1− x2|
por (2.11), e Pela continuidade da norma,
|x1− x2|− | f (x1)− f (x2)| ≤ |(x1− x2)− ( f (x1)− f (x2))|.
Combinando estas duas desigualdades teremos (2.12).
Passo (iii): se |x| ≤ r, então |g(x)| ≤ r/2, isto é, g(Br(0)) ⊂ Br/2(0). Além disso, para cada y ∈ Br/2(0), existe
x ∈ Br(0) tal que f (x) = y.
A primeira parte da afirmação segue de (2.11) tomando-se x1 = x e x2 = 0. Já a segunda parte necessitará do
Teorema 2.6.7. Para cada y ∈ Br/2(0) e cada x ∈ Br(0) temos que
|y+ g(x)| ≤ |y|+ |g(x)| ≤ r
2
+
r
2
= r.
Segue que a aplicação Ty : Br(0)→ Br(0) dada por Ty(x) := y+ g(x) está bem definida. Além disso satisfaz
|Ty(x1)−Ty(x2)|= |g(x1)− g(x2)| ≤ 12 |x1− x2|.
Assim, como Br(0) é um espaço métrico completo, Ty possui um único ponto fixo x e Ty(x) = x se, e somente se,
y= x− g(x) = x− (x− f (x)) = f (x). Como isto é válido para qualquer y ∈ Br/2(0), vemos que f−1 fica definida
neste conjunto.
Segue da continuidade de f queU = f−1(Br/2(0)) é aberto emW . Seja V = Br/2(0).
Passo (iv): f é um homeomorfismo do conjunto aberto U ⊂W sobre o conjunto aberto V .
26 CAPÍTULO 2. DIFERENCIABILIDADE
Como a existência de f−1 segue do passo (iii), falta mostrarmos sua continuidade. Sejam x1,x2 ∈ U e
y1 = f (x1), y2 = f (x2). Segue de (2.12) que
| f−1(y1)− f−1(y2)| ≤ 2|y1− y2|,
e f−1 : V →U é contínua.
Passo (v): seja b= f (a) em V. Então f−1 é diferenciável em b e D f−1(b) = [Df (a)]−1.
Pela diferenciabilidade de f em a podemos escrever:
f (a+H)− f (a) = Df (a) ·H+ |H|E f (H),
onde limH→0E f (H) = 0. Tomando x := a+H, segue que
f (x)− f (a) = Df (a) · (x− a)+ |x− a|R(x,a),
onde R(x,a)→ 0 quando x→ a. Pelo passo (ii), Df (a) é não singular. Seja A= [Df (a)]−1. Multiplicando ambos
os lados da expressão anterior por A e usando y= f (x) nós obtemos
A · (y− b) = f−1(y)− f−1(b)+ | f−1(y)− f−1(b)|A ·R( f−1(y), f−1(b)).
Isto implica que
f−1(y)− f−1(b) = A · (y− b)+ |y− b|R˜(y,b),
onde
R˜(y,b) :=−| f
−1(y)− f−1(b)|
|y− b| A ·R( f
−1(y), f−1(b)).
Para finalizarmos a prova do passo (v) falta mostrarmos que R˜(y,b)→ 0 quando y→ b. Para tanto notemos que a
desigualdade (2.12) implica que ∣∣∣− | f−1(y)− f−1(b)||y− b| ∣∣∣≤ 2.
Como f−1 é contínua e A é uma matriz constante, segue que R˜(y,b)→ 0 quando y→ b. Tomando y= b+ H˜ segue
que f−1 é diferenciável em b e que
Df−1(b) = A= [Df (a)]−1.
Para finalizarmos a demonstração do Teorema da Função Inversa temos que demonstrar o seguinte:
Passo (vi): se f é de classe Cr em U, então f−1 é de classe Cr em V .
Para y ∈V , vimos que Df−1(y) = [Df ( f−1(y))]−1. Agora notemos que f−1 é contínua em V e sua imagem
éU , Df é de classeCr−1 e não singular emU e, finalmente, as entradas da inversa de uma matriz não singular são
funçõesC∞ das entradas da matriz. Segue que Df−1 é pelo menos contínua em V e f−1 é C1. Com um raciocínio
indutivo vemos que f−1 é de classe Cr. �
Quarta aula ↓
Temos como consequência imediata do Teorema 2.6.5 o seguinte corolário:
Corolário 2.6.9 Se D f é não singular em todo ponto de W, então f é uma aplicação aberta, isto é, aplica W e
subconjuntos abertos de Rn contidos emW em subconjuntos abertos de Rn.
Exemplo 2.6.10 Seja f : R2 →R2 dada por
f (x,y) = (x+ x2h(x,y),y+ y2g(x,y)),
onde h e g são de classe C1. Então
Df (0,0) = Id2×2.
Consequentemente f é inversível em (0,0) com inversa de classe C1. Podemos ver f como uma perturbação da
identidade. Note que esta perturbação é pequena se (x,y) está próximo de (0,0).
2.6. O TEOREMA DA FUNÇÃO INVERSA 27
Exemplo 2.6.11 (Coordenadas cofocais elípticas) Seja g : R2 →R2 dada por
g(s, t) = (coshscos t,senhssen t).
Então
Dg(s, t) =
[
senhscos t −coshssen t
coshssen t senhscost
]
.
Segue que det(Dg(s, t)) = senh2 scos2 t+ cosh2 ssen2 t = senh2 s+ sen2 t, onde usamos que cos2 t + sen2 t = 1 e
cosh2 s= 1+ senh2 s.
Definamos ∆ := {(s, t) ∈ R2 | s > 0}. Segue que, em ∆, senhs > 0 e assim det(Dg(s, t)) > 0. Segue do
Teorema da Função Inversa que g é localmente inversível. Pela periodicidade de cos e de sen, temos que g(s, t+
2pi) = g(s, t). Assim g não é injetora. Mas pelo Corolário 2.6.9 temos que g(∆) é aberto em R2.
Seja ∆˜ = {(s, t) ∈ R2 | s > 0,0 < t < 2pi} e g˜ := g
∣∣
∆˜
. Vamos mostrar que g˜ possui uma inversa. Não é fácil
resolver explicitamente o sistema
x= coshscost, y= senhssen t.
Entretanto, vamos verificar o que acontece ao fixarmos s= c. Para cada c> 0, g(c, t) representa a elipse
x2
cosh2 c
+
y2
senh2 c
= 1.
Note que cada uma dessas elipses possui −e1 e e1 como foco e, além disso, g(c,0) = g(c,2pi) = (coshc)e1.
Se s1 6= s2, então os pontos de g˜(s1, t) e g˜(s2, t) estão em elipses diferentes. Além disso, g˜(s, t1) = g˜(s, t2)
implica que t1 = t2. Consequentemente, g˜(s1, t1) = g˜(s2, t2) implica que s1 = s2 e t1 = t2 e g˜ é injetora. A imagem
de ∆˜ por g˜ é R2 com a semi-reta no eixo x de −e1 a +∞ deletada. A parte do bordo de ∆˜ no eixo s é aplicada por
g˜ na semi-reta de e1 a +∞ e a parte vertical do bordo de ∆˜é aplicada por g˜ no segmento que liga −e1 a e1. Note
que, por periodicidade g(∆) é R2 com o segmento ligando−e1 a e1 removido.
x
y
s
t
2pi
c
g
∆˜
A seguir daremos um exemplo que mostra que a não podemos retirar a hipótese de continidade das derivadas
no Teorema da Função Inversa.
Exemplo 2.6.12 Dado 0< α < 1, consideremos a função
f (x) =
{
αx+ x2 sen
1
x
se x 6= 0,
0 se x= 0.
Calculando a derivada de f temos que
f ′(x) =
{
α + 2xsen
1
x
− cos 1
x
se x 6= 0,
α 6= 0 se x= 0,
28 CAPÍTULO 2. DIFERENCIABILIDADE
onde a derivada em x= 0 foi calculada diretamente examinando o limite da definição.
Notemos que f ′ não é contínua em x = 0, o que implica que a hipótese de continuidade da derivada do
Teorema da Função Inversa não é satisfeita. Vamos mostrar que f não posui inversa local em qualquer vizinhança
da origem.
Utilizaremos o seguinte fato: se f ′(x) = 0 e f ′′(x) 6= 0, então f não possui inversa local em uma vizinhança
de x. Afirmamos que existem infinitos pontos desta forma em qualquer vizinhança de x = 0. Note que f ′(x) = 0,
x 6= 0 se
α + 2xsen
1
x
= cos
1
x
.
Como 0< α < 1, analisando o gráfico das expressões em ambos os lados da igualdade acima vemos que f ′ possui
infinitos zeros em qualquer vizinhança de x= 0. Resta mostrarmos que tais zeros de f ′ não são zeros de f ′′. Isto é
feito por contradição. Calculamos:
f ′′(x) =
(
2− 1
x2
)
sen
1
x
−
(2
x
)
cos
1
x
, x 6= 0.
Se tivéssemos f ′(x) = 0 e f ′′(x) = 0 com x 6= 0, deveríamos ter que o sistema
2xS−C=−α(
2− 1
x2
)
S−
(2
x
)
C = 0,
possui solução, onde S = sen
1
x
eC = cos
1
x
. Por outro lado, pela Regra de Cramer,
S = α
−2x
1+ 2x2
,
C = α
1− 2x2
1+ 2x2
.
Segue que
1= S2+C2 = α2
1+ 4x4
(1+ 2x2)2
,
e tomando x pequeno o bastante vemos que o lado direito da igualdade acima é menor que 1, obtendo uma contra-
dição.
2.7 O Teorema da Função Implícita
Nas disciplinas de Cálculo nos deparamos com um resultado que nos diz quando a equação f (x,y) = 0 determina
implicitamente uma das variáveis x ou y como função da outra. Esta afirmação é correta em uma vizinhançaU de
qualquer ponto (x0,y0) tal que f (x0,y0) = 0 e sempre que pelo menos uma das derivadas parciais
∂ f
∂x
(x0,y0) ou
∂ f
∂y
(x0,y0) não se anule. Este é uma caso especial do Teorema da Função Implícita que apresentamos nesta seção.
Este resultado é de grande importância no estudo de variedades e subvariedades.
Teorema 2.7.1 (Teorema da Função Implícita) Seja A⊂Rk+n :=Rk×Rn um subconjunto aberto e f : A→ Rn
de classeCr. Denotaremos um ponto deRk+n por (x,y), significando que x∈Rk e y∈Rn. Além disso, denotaremos
D f (x,y) =
[
∂ f
∂x
∂ f
∂y
]
.
Suponha que (x0,y0) ∈ A satisfazem f (x0,y0) = 0 e
det
(∂ f
∂y
(x0,y0)
)
6= 0.
2.7. O TEOREMA DA FUNÇÃO IMPLÍCITA 29
Então existe uma vizinhança B de x0 em Rk e uma única função g : B→ Rn tal que g(x0) = y0 e
f (x,g(x)) = 0, para qualquer x ∈ B.
Além disso, g é de classe Cr em B.
Demonstração. Vamos construir uma função F que satisfaz as hipóteses do Teorema da Função Inversa. Defini-
mos F : A→Rk+n por
F(x,y) = (x, f (x,y)).
Note que F é de classe Cr em A e
DF =
 Ik 0∂ f
∂x
∂ f
∂y
 .
Utilizando desenvolvimento por meio de cofatores para o cálculo de determinantes temos que
det(DF) = det
(∂ f
∂y
)
.
Segue daí que DF é não singular em (x0,y0).
Observe que F(x0,y0) = (x0,0). Pelo Teorema da Função Inversa aplicado à F concluímos que existe um
conjunto abertoU ×V ⊂ Rk+n, vizinhança de (x0,y0) tal que:
1. F aplicaU×V difeomorficamente sobre um conjunto abertoW ⊂ Rk+n, com (x0,0) ∈W ;
2. a função G : W →U×V inversa de F é de classe Cr.
Como F(x,y) = (x, f (x,y)), temos que
(x,y) = G(x, f (x,y)),
ou seja, G deixa fixo as k primeiras coordenadas. Logo, podemos escrever
G(x,z) = (x,h(x,z)),
para alguma h : W →Rn. Ademais, como G é de classe Cr, h deve ser de classe Cr.
Seja B uma vizinhança conexa de x0 ∈ Rk, escolhida de forma que B×{0}⊂W . Se x ∈ B temos que
G(x,0) = (x,h(x,0)),
e aplicando F em ambos os lados vemos que
(x,0) = F(x,h(x,0)) = (x, f (x,h(x,0))).
Comparando as coordenadas temos que f (x,h(x,0)) = 0 sempre que x ∈ B. Definimos então g : B → Rn por
g(x) := h(x,0). Segue que g é de classe Cr e satisfaz f (x,g(x)) = 0 para x ∈ B. Além disso,
(x0,y0) = G(x0,0) = (x0,h(x0,0)) = (x0,g(x0)),
e g(x0) = y0 como desejado.
Resta mostrarmos que g é única e para isto usaremos que B é conexo.
Seja g0 : B0 →Rn uma outra função que satisfaz as conclusões do teorema. Em particular,
g0(x0) = g(x0) = y0 e f (x,g0(x)) = 0 para todo x ∈ B0.
Como g(x0) ∈ V, pela continuidade de g0 temos que, diminuindo B0 se nevessário, g0(x) ∈ V para todo x ∈ B0, o
qual também vamos assumir conexo. Vamos demonstrar que se g0 coincide com g em u ponto x˜ ∈ B0, então g0
30 CAPÍTULO 2. DIFERENCIABILIDADE
coincide com g em uma vizinhança menor B˜ de x˜. Mas como g0(B˜) ⊂ V, temos que f (x,g0(x)) = 0 em B˜, o que
implica em
F(x,g0(x)) = (x,0),
ou seja,
(x,g0(x)) = G(x,0) = (x,h(x,0)) = (x,g(x)).
Assim, g0 e g coincidem em B˜.
Segue que o conjunto B1 := {x ∈ B | |g0(x)−g(x)|= 0} é aberto em B e, por continuidade, também é aberto
o conjunto B2 := {x ∈ B | |g0(x)− g(x)|> 0}. Mas B0 = B1∪B2 com B1 6= /0 e B1∩B2 = /0. Pela conexidade de
B0 segue que B2 = /0 e o teorema está demonstrado. �
Quinta aula ↓
2.8 Submersões e imersões locais
Nesta seção descreveremos duas ferramentas técnicas importantes no estudo de variedades diferenciáveis que são
conseque˜ncias do Teorema da Função Inversa: as formas locais das imersões e das submersões. Essencialmente,
queremos obter condições suficientes para que possamos, localmente, “endireitar” a imagem (no caso de imersões)
ou o domínio (no caso de submersões) de uma função f na vizinhança de um ponto, de maneira que f se comporte
localente como uma inclusão (no caso de imersões) ou como uma projeção (no caso de uma submersão).
Definição 2.8.1 Seja A⊂Rk+n um aberto. Uma aplicação diferenciável f : A→Rn é chamada de submersão se,
para qualquer x ∈ A, a derivada D f (x) : Rk+n →Rn é sobrejetora.
A submersão canônica é a projeção pi : Rk+n → Rn dada por pi(x,y) = y. De fato, do ponto de vista local,
toda submersão se comporta localmente como a projeção.
Teorema 2.8.2 (Forma Local das Submersões) Sejam A ⊂ Rk+n um aberto e f : A→ Rn uma função de classe
Cr, r ≥ 1. Suponha que, no ponto z0 ∈ A, a derivada D f (z0) seja sobrejetora. Consideremos uma decomposição
em soma direta N⊕E = Rk+n e escrevemos z0 = (x0,y0) com x0 ∈ N e y0 ∈ E. Escolhemos N e E de forma que
D f (z0)
∣∣
E seja um isomorfismo. Então, existem abertos V,W e Z tais que
x0 ∈V, V ⊂ N,
z0 ∈ Z, Z ⊂ A,
f (z0) ∈W, W ⊂ Rn,
e um difeomorfismo de classe Cr h : V ×W → Z tal que f ◦ h(x,y) = y.
Demonstração. Como já observamos anteriormente, este resultado já está essencialmente contido no Teorema da
Função Implícita, e portanto devemos seguir as idéias da demonstração daquele teorema.
Lembremos que, dada uma transformação linear T : Rk+n → Rn sobrejetora, existe uma decomposição
Rk+n = N ⊕E , dimN = k e dimE = n, e tal que T ∣∣E é um isomorfismo. De fato, {Te1, . . . ,Tek+n} geram Rn
e assim podemos tomar neste conjunto n vetores linearmente independentes.
Podemos supor ainda que N = Rk e E = Rn. De fato, basta usarmos difeomorfismos que permutam as
coordenadas.
Agora procedemos como na demonstração do Teorema 2.7.1. Definamos F : A→ Rk ×Rn por F(x,y) =
(x, f (x,y)). Então DF(x0,y0) é não singular e, se f (x0,y0) = c0, podemos aplicar o Teorema da Função Inversa
para escolhermos uma vizinhança de (x0,y0) que é aplicada difeomorficamente em uma vizinhança V ×W de
(x0,c0). Aí definimos
Z = F−1(V ×W), F−1 : V ×W → Z.
2.8. SUBMERSÕES E IMERSÕES LOCAIS31
A
z0
Z
f(z0)
f
x0
y0 W
V
h
W
Notemos que F−1(x, f (x,y)) = (x,y), ou seja, F−1 fixa a primeira coordenada. Seja h := F−1. Segue que h(x,y) =
(x,h1(x,y)).Mas assim, se (x,y) ∈V ×W,
(x,y) = F ◦ h(x,y) = F(h(x,y)) = F(x,h1(x,y))
= (x, f (x,h1(x,y))) = (x, f (h(x,y))) = (x, f ◦ h(x,y)),
isto é, f ◦ h(x,y) = y, para qualquer (x,y) ∈V ×W . �
Agora vamos considerar uma função diferenciável para a qual a dimensão do domínio é menor que a dimen-
são da imagem. Do ponto de vista da diferenciabilidade, o melhor que podemos esperar neste caso é que a derivada
seja injetora.
Definição 2.8.3 Seja A ⊂ Rk um aberto. Uma aplicação diferenciável f : A→ Rk+n é chamada de imersão se,
para qualquer x ∈ A, a derivada D f (x) : Rk → Rk+n é injetora.
A imersão canônica é a inclusão i : Rk → Rk+n dada por i(x) = (x,0). De fato, do ponto de vista local, toda
imersão se comporta localmente como a inclusão.
Teorema 2.8.4 (Forma Local das Imersões) Sejam A⊂ Rk um aberto e f : A→ Rk+n uma função de classe Cr,
r ≥ 1. Suponha que, no ponto x0 ∈ A, a derivada D f (x0) seja injetora. Então, existem abertos V,W e Z tais que
f (x0) ∈ Z, Z ⊂ Rk+n,
x0 ∈V, V ⊂ A⊂ Rk,
0 ∈W, W ⊂ Rn,
e um difeomorfismo h : Z→V ×W, de classe Cr, tal que h ◦ f (x) = (x,0).
Demonstração. Seja E =Df (x0)(Rk) e tomemos P qualquer subespaço complementar de E , isto é, Rk+n = E⊕P.
Por injetividade e compondo com difeomorfismos que permutam a base, vamos supor que E = Rk e P= Rn. Isto
nos permite definir G : A×Rn→ Rk+n por
G(x,y) = f (x)+ (0,y),
de forma que G é de classe Cr, G(x0,0) = f (x0) e
Dg(x0,0) =
[
Df (x0) 0
0 In
]
,
32 CAPÍTULO 2. DIFERENCIABILIDADE
já que permutamos a base de maneira que Df (x0)(Rk) = Rk. Segue que DG(x0,0) é não singular. Pelo Teorema
da Função Inversa,G é um difeomorfismo de classeCr de uma vizinhança de (x0,0), a qual escolheremos da forma
V ×W ⊂ A×Rn, em uma vizinhança de f (x0). Definamos Z :=G(V ×W ) e h :=G−1 : Z→V ×W . Uma vez que
G(x,0) = f (x), temos que
h ◦ f (x) = h(G(x,0)) = G−1(G(x,0)) = (x,0),
para qualquer x ∈V , demonstrando o teorema. �
2.9 O Teorema do posto
Definição 2.9.1 Seja T : Rk →Rn uma aplicação linear. O posto de T é a dimensão de sua imagem T (Rk).
Da Álgebra Linear sabemos que o posto de T : Rk →Rn é igual a ρ se, e somente se, a matriz que representa
T possui um determinante menor de ordem ρ×ρ não nulo e todo determinante menor de ordem (ρ +1)× (ρ+1)
é nulo.
Definição 2.9.2 Sejam A⊂Rk aberto e f : A→Rn uma função diferenciável. O posto de f em x ∈ A é o posto de
sua derivada D f (x).
Seja f : A⊂ Rk →Rn diferenciável no aberto A. Se f é uma submersão, então o posto de f é n em qualquer
ponto x ∈ A. Já no caso em que f é uma imersão, o posto de f é k em qualquer ponto x ∈ A. Por esta razão, as
imersões e submersões são chamadas de aplicações de posto máximo.
Lembrando que o determinante é uma função contínua das entradas de uma matriz, vemos que, se f : A ⊂
Rk → Rn é de classe C1 e se o posto de Df (x) é ρ , então em alguma vizinhança de x o posto de Df (x) será maior
ou igual a ρ .
Sempre que compormos uma função diferenciável f com difeomorfismos teremos que o posto dessa com-
posição será igual ao posto de f . Isto segue de fatos de Álgebra Linear e do fato de difeomorfismos possuirem
derivadas não singulares.
O teorema que apresentaremos nesta seção nos diz que funções de classe C1 que possuem posto constante
e igual a k em um aberto de Rn são, essencialmente, funções de n− k variáveis. Dito de outra forma, o teorema
nos diz que estas funções se comportam localmente como uma projeção seguida de uma inclusão e, em particular,
generaliza as formas locais das imersões e das submserões.
Exemplo 2.9.3 Seja f : R2 → R2 dada por f (x,y) = (x− y,−2x+ 2y). Então D f (x,y) possui posto constante e
igual a 1 em todo R2. Seja g1(x,y) = (x+ y,y). Então
f ◦ g1(x,y) = (x,−2x).
Definindo ainda g2(x,y) = (−x− y,2x+ y) vemos que
g2 ◦ f ◦ g1(x,y) = (x,0),
o que nos diz que, a menos dos difeomorfismos g1 e g2, a aplicação f não depende da variável y.
Antes de enunciarmos o Teorema do Posto, deixe-nos fazer um comentário sobre notação que utilizaremos
no decorrer da sua demonstração. Dada uma função f : A⊂Rn →Rm diferenciável, sejam f1, . . . , fm suas funções
componentes. A matriz Jacobiana Df é também denotada por
Df =
∂ ( f1, . . . , fm)
∂ (x1, . . . ,xn)
.
Teorema 2.9.4 (Teorema do Posto) Sejam A0 ⊂Rn um aberto e f : A0→Rm uma função de classe Cr. Suponha-
mos que o posto de f seja constante e igual a k em todo A0. Se x0 ∈ A0 e y0 = f (x0), então existem conjuntos
2.9. O TEOREMA DO POSTO 33
abertos A⊂ A0 e B⊂ Rm com x0 ∈ A e y0 ∈ B, e difeomorfismos g : A→U ⊂ Rn e h : B→V ⊂ Rm, de classe Cr,
tais que
h ◦ f ◦ g−1 : U →V
e
h ◦ f ◦ g−1(x1, . . . ,xn) = (x1, . . . ,xk,0, . . . ,0).
Demonstração. Vamos supor por simplicidade que x0 = 0 ∈ Rn e y0 = 0 ∈ Rm. O caso geral segue ao consi-
derarmos f˜ (u) = f (u+ x0)− y0. Além disso, compondo com difeomorfismos que permutam as bases, podemos
assumir que o determinante menor de ordem k× k em Df (x0) que não se anula é justamente aquele dado pelas
primeiras k colunas e k linhas. Assim, se denotarmos fˆ = ( f1, . . . , fk), então o determinates menor que não se anula
é justamente
D fˆ =

∂ f1
∂u1
. . . ∂ f1∂uk
...
...
∂ fk
∂u1
. . . ∂ fk∂uk
 ,
onde f = ( fˆ , fk+1, . . . , fm) e omitimos o ponto x0 no qual a matriz acima está sendo avaliada.
Definamos g : A0 →Rn por
g(u) := ( f1(u), . . . , fk(u),uk+1, . . . ,un), u= (u1, . . . ,uk,uk+1, . . . ,un).
Segue que g é de classe Cr e que
Dg=

∂ f1
∂u1
. . . ∂ f1∂uk
...
... ∗
∂ fk
∂u1
. . . ∂ fk∂uk
0 In−k
 ,
onde os termos na matriz indicada por ∗ não nos interessa. Segue que Dg(x0) é não-singular e, pelo Teorema da
Função Inversa, existe um conjunto aberto A1 ⊂ A0 contendo x0 onde g é um difeomorfismo sobre um conjunto
(aberto) U1 = g(A1). Notemos que, pela definição de g, f ◦ g−1(0) = 0 e obviamente f ◦ g−1(U1) ⊂ Rm. Além
disso,
f ◦ g−1(x) = (x1, . . . ,xk, f k+1(x), . . . , fm(x)),
com f k+i(x) := fk+i ◦ g−1(x), i = 1, . . . ,m− k. De fato, basta observarmos que g é bijetora e, portanto, para cada
j = 1, . . . ,k, temos x j = f j(u), com u ∈ g−1(U1), ou seja, f j ◦ g−1(x) = f j(u) = x j.
Podemos então calcular D( f ◦ g−1) (sem usar a Regra da Cadeia) e encontraremos que, emU1,
D( f ◦ g−1) =

Ik 0
∂ f k+1
∂xk+1
. . .
∂ f k+1
∂xn
∗ ... ...
∂ fm
∂xk+1
. . .
∂ fm
∂xn
 .
Por outro lado, como Dg−1 é não-singular em U1 e g−1(U1) = A1 ⊂ A0, temos que o posto de D( f ◦ g−1) =
Df ·Dg−1 emU1 é constante e igual ao posto de Df em A0, isto é, igual a k. Logo, o determinante menor da matriz
D( f ◦ g−1) formado pelas k+ 1 primeiras linhas e k+ 1 primeiras colunas deve ser nulo. Este fato implica que
necessariamente devemos ter
∂ f k+1
∂xk+1
= 0 em U1. Raciocinando indutivamente vemos que f k+i, i = 1, . . . ,m− k,
dependem somente das variáveis x1, . . . ,xk.
Vamos agora definir o difeomorfismo h. Seja H uma função definida em uma vizinhançaV1 de 0∈Rm e dada
pela expressão
H(y) :=
(
y1, . . . ,yk,yk+1+ f k+1(y1, . . . ,yk), . . . ,ym+ fm(y1, . . . ,yk)
)
.
Note que o domínio V1 deve ser escolhido pequeno o suficiente de maneira que, para y ∈ V1, as funções f k+i
estejam definidas em y.
34 CAPÍTULO 2. DIFERENCIABILIDADE
Observemos que H(0) = 0 e que a matriz de DH é não-singular em todo V1, pois
DH =
[
Ik 0
∗ Im−k
]
.
Logo, H é um difeomorfismo de classe Cr de uma vizinhançaV de 0 ∈V1 sobre uma vizinhança B⊂ B1.
Escolhemos agora uma vizinhança U ⊂ U1 da origem em Rn tal que f ◦ g−1(U) ⊂ B e seja A = g−1(U).
Definamos então h := H−1. Segue que g−1 : U → A, f : A→ B e h : B→V são todas de classe Cr, e g−1 e h são
difeomorfismos. Finalmente,
h ◦ f ◦ g−1(x) =h( f ◦ g−1(x))
= h
(
x1, . . . ,xk, f k+1(x), . . . , fm(x)
)
= h
(
x1, . . . ,xk, f k+1(x1, . . . ,xk), . . . , fm(x1, . . . ,xk)
)
= H−1
(
x1, . . . ,xk,0+ f k+1(x1, . . . ,xk), . . . ,0+ fm(x1, . . . ,xk)
)
= (x1, . . . ,xk,0, . . . ,0),
finalizando a demonstração. �
Sexta aula ↓
2.10 Fórmula de Taylor
Seja f : A⊂ Rn →R uma função de classe Ck. Então podemos calcular as derivadas parciais iteradas de f em um
ponto interior x0 ∈ A sem levar em consideração a ordem (pelo Teorema de Clairaut-Schwarz). A notação para a
derivada parcial de f em x0 tamada primeiro na direção ei1 , depois na direção ei2 , e assim por diante, é
fi1...iq(x0), 1≤ il ≤ n, l = 1, . . . ,k.
Lema 2.10.1 Seja f : A⊂ Rn →R uma função de classe Ck no aberto A, sendo k um inteiro positivo. Se x0 ∈ A e
H é um vetor fixado, definimos φ(t) = f (x0+ tH) com t pequeno de forma que x0+ tH ∈ A. Então
φ ′(t) =
(
(〈H,∇〉) f )(x0+ tH)
e, mais geralmente,
φ (k)(t) =
(
(〈H,∇〉)k f )(x0+ tH).
Aqui, (〈H,∇〉)k significa a composição dos operadores diferenciais.
Demonstração. Para o caso k = 1 basta uma aplicação simples da Regra da Cadeia. De fato,
φ ′(t) = 〈∇ f (x0+ tH),H〉
= H1
∂ f
∂x1
(x0+ tH)+ . . .+Hn
∂ f
∂xn
(x0+ tH)
= 〈H,∇〉 f (x0+ tH).
Continuamos a demonstração utilizando indução. Supondo o resultado válido para k= r−1 temos φ (r−1)(t)=
(〈H,∇〉)r−1 f (x0+ tH), então pelo que acabmos de demonstrar
dφ (r−1)
dt
(t) = 〈H,∇〉(〈H,∇〉)r−1 f (x0+ tH),
que é a fórmula geral. �
2.10. FÓRMULA DE TAYLOR 35
A fórmula do Lema 2.10.1 pode ser reescrita como
φ ′(t) =
n
∑
i=1
fi(x0+ tH)Hi,
φ ′′(t) =
n
∑
i=1
(
n
∑
j=1
fi j(x0+ tH)H j
)
Hi,
...
φ (k)(t) =
n
∑
i1,...,ik=1
fi1...ik (x0+ tH)Hi1 . . .Hik .
Suponhamos que H = x− x0 ∈ A. Então o domínio de φ contém o intervalo [0,1]. A Fórmula de Taylor para
funções de uma variável implica que existe um número τ ∈ (0,1) tal que
φ(1) = φ(0)++φ ′(0)+
1
2!
φ ′′(0)+ . . .+
1
(k− 1)!φ
k−1(0)+
1
k!
φ (k)(τ). (2.13)
Lema 2.10.2 (Fórmula de Taylor) Seja f uma função definida em um aberto A ⊂ Rn possuindo derivadas par-
ciais contínuas até ordem k. Seja x0 ∈ A e H ∈ Rn um vetor de forma que x0+ tH ∈ A, para qualquer t ∈ (0,1).
Então existe τ ∈ [0,1] tal que
f (x0+H) = f (x0)+
(
(〈H,∇〉) f )(x0)
1!
+ . . .+
(
(〈H,∇〉)k−1 f )(x0)
(k− 1)! +
(
(〈H,∇〉)k f )(x0+ τH)
k!
.
Demonstração. Basta usar que φ(1) = f (x) e φ(0) = f (x0) e aplicar a fórmula (2.13). �
Definimos o resto de ordem k na fórumla de Taylor por
Rk(H) =
(
(〈H,∇〉)k f )(x0+ τH)
k!
.
SejaK⊂A um subconjunto convexo tal que x,x0 ∈K.Então x0+τH ∈K para todo τ ∈ [0,1], ondeH = x−x0.
Suponhamos que todas as derivadas de ordem k de f satisfazem
| fi1...ik (x)| ≤C, para todo x ∈ K.
Então podemos estimar o erro por
|Rk(H)| ≤ Ck!
n
∑
i1,...,ik=1
|Hi1 | . . . |Hik |=
C
k!
(
n
∑
i=1
|Hi|
)k
≤ Cn
k/2
k!
‖H‖k.
Definição 2.10.3 Uma função f : A⊂ Rn → R é chamada analítica real se f é de classe C∞ e, para x = x0+H
em uma vizinhaça de x0 ∈ A,
f (x0+H) = f (x0)+
(
(〈H,∇〉) f )(x0)
1!
+ . . .+
(
(〈H,∇〉)k f )(x0)
k!
+ . . . ,
que é chamada de Série de Taylor de f .
Lema 2.10.4 Seja f ∈C∞(A). Suponhamos que qualquer x0 ∈ A possua uma vizinhançaU tal que a estimativa∣∣∣ ∂ k f
∂xi1 · · ·∂xik
(x)
∣∣∣≤Mk
seja válida emU para alguma constante M e qualquer inteiro positivo r. Então f é analítica real.
Demonstração. Basta observar que neste caso o erro Rk(H) satisfaz a estimativa
|Rk(H)| ≤ B
k
k!
para alguma constante B> 0. Segue daí que Rk(H)→ 0 quando k→ ∞. �
36 CAPÍTULO 2. DIFERENCIABILIDADE
2.11 Pontos críticos
Nesta seção considerareos o problema de estudar mínimos de uma função f : A⊂ Rn → R sobre o aberto A.
Definição 2.11.1 Sejam A⊂ Rn aberto e f : A→ R uma função. Fixemos x0 ∈ A. Então:
i) x0 é um mínimo local se existe uma vizinhança B de x0 tal que f (x0)≤ f (x) para todo x ∈ B;
ii) x0 é um mínimo local estrito se existe uma vizinhança B de x0 tal que f (x0)< f (x) para todo x ∈ B\ {x0};
iii) x0 é um mínimo absoluto se f (x0)≤ f (x) para todo x ∈ A;
iv) x0 é um mínimo absoluto estrito se f (x0)< f (x) para todo x ∈ A\ {x0}.
As noções de máximo absoluto e máximo relativo são definidos similarmente trocando-se as desigualdades. Um
máximo ou mínimo é chamado de extremo.
Definição 2.11.2 Seja f : A⊂ Rn → R uma função que possui derivadas parciais no aberto A. Um ponto x0 ∈ A
é chamado de ponto crítico de f se ∇ f (x0) = 0.
Se a função f for diferenciável, podemos nos restringir aos pontos críticos de f para encontramos os pontos
de máximo ou de mínimo relativos.
Proposição 2.11.3 Se f possui um extremo local em x0 e f é diferenciável em x0, então x0 é um ponto crítico de
f .
Demonstração. Seja H ∈Rn um vetor fixado e definamos φ(t) = f (x0+ tH), onde t ∈ (−δ ,δ ), para algum δ > 0.
Então φ possui um extremo local em t = 0 e, portanto, φ ′(0) = 0. Como φ ′(t) = 〈∇ f (x0 + tH),H〉, temos que
〈∇ f (x0),H〉= 0 para todo H ∈ Rn. Isto implica que ∇ f (x0) = 0. �
Suponhamos agora que x ∈ A não seja um ponto crítico. A derivada direcional de f em x na direção de v
satisfaz
〈∇ f (x),v〉 ≤ ‖∇ f (x)‖‖v‖
pela Desigualdaade de Cauchy. Além disso, a igualdade é válida somente quando v= v(x), onde
v(x) =
∇ f (x)
‖∇ f (x)‖ .
Segue que o valor máximo da derivada direcional de f em x é atingido quando a direção v é a direção do vetor
gradiente de f em x. De fato,
〈∇ f (x),v(x)〉 = 1‖∇ f (x)‖〈∇ f (x),∇ f (x)〉 = ‖∇ f (x)‖.
Suponhamos agora que f : A⊂Rn→R seja de classeC2 no aberto A. Para cada x∈ A definimosQx : Rn→R
por
Qx(H) =
n
∑
i, j=1
fi j(x)HiH j, H = (H1, . . . ,Hn).
O polinômio quadráticoQx é chamado de forma quadrática correspondente à matriz n×n simétrica (pelo Teorema
de Clairaut-Schwarz) definida pelas derivadas de segunda ordem de f em x, isto é, ( fi j(x)).
Vamos escrever Qx ≥ 0 se Qx(H) ≥ 0 para todo H ∈ Rn e Qx > 0 se Qx(H) > 0 para todo H ∈ Rn \ {0}.
Similar notação para Qx ≤ 0 e Qx < 0.
Definição 2.11.4 Como relação à forma quadrática Qx, x ∈ A, temos a seguinte nomenclatura:
2.11. PONTOS CRÍTICOS 37
i) Qx é positiva semidefinida se Qx ≥ 0;
ii) Qx é positiva definida se Qx > 0;
iii) Qx é negativa semidefinida se Qx ≤ 0;
iv) Qx é negativa definida se Qx < 0;
v) Qx é indefinida se Qx não possui sinal.
Fixemos um ponto x0 ∈ A e seja U ⊂ A uma vizinhança convexa de x0 suficientemente pequena. Para cada
x ∈ U seja H = x− x0 e consideremos os segmentos da forma x0 + sH, com s ∈ [0,1]. Aplicando a fórmula de
Taylor para f em x0 com k = 2 obtemos facilmente que
f (x) = f (x0)+ 〈∇ f (x),H〉+ 12Qx0+sH(H).
Se x0 é um ponto crítico obtemos
f (x) = f (x0)+
1
2
Qx0+sH(H). (2.14)
Segue que se f possui um mínimo local em x0 então Qx0+sH é positiva semidefinida para todo x ∈U. Vamos agora
melhorar este resultado. Necessitaremos de um lema técnico (veja o Exercício 10).
Lema 2.11.5 Seja g : Rn → R definida por
g(h) =
n
∑
i, j=1
ci jHiH j,
onde (ci j) é uma matriz n× n. Se g(H)> 0 para todo H ∈ Rn \ {0}, então existe m> 0 tal que
g(H)≥ m‖H‖2, para todo H ∈ Rn.
Além disso, se tivermos |Ci j− ci j|< εn−1 para cada i, j = 1, . . . ,n, e se definimos
G(H) =
n
∑
i, j=1
Ci jHiH j.
então G(H)≥ (m− ε)‖H‖2 para qualquer H ∈ Rn. Em particular, G> 0 se ε <m.
Demonstração. Observemos que g
∣∣
Sn−1 > 0, onde S
n−1 é a esfera de raio 1 em Rn, que é compacta. Segue que
g
∣∣
Sn−1 posssui um mínimo m> 0, ou seja, g(H)≥ m para todo H ∈ Sn−1. Em particular,
g
(
H
‖H‖
)
=
1
‖H‖2 g(H)≥ m,
o que demonstra a prineira parte do lema.
Para a segunda parte, observamos inicialmente que∣∣(Ci j− ci j)|Hi||H j|∣∣< εn−1|Hi||H j| ≤ εn−1‖H‖‖H‖.
Portanto,
G(H) =
n
∑
i, j=1
(Ci j− ci j)HiH j+ g(H)
>−ε‖H‖2+m‖H‖2,
o que finaliza

Continue navegando