Análise em Espaços Métricos e Vetoriais, Roberto Imbuzeiro IMPA 2021

Exatas

Pedro H
em 16/02/2022
Material
Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?
Ao continuar, você aceita os Termos de Uso e Política de Privacidade
Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?
Ao continuar, você aceita os Termos de Uso e Política de Privacidade
Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?
Ao continuar, você aceita os Termos de Uso e Política de Privacidade
Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?
Ao continuar, você aceita os Termos de Uso e Política de Privacidade
Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?
Ao continuar, você aceita os Termos de Uso e Política de Privacidade
Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?
Ao continuar, você aceita os Termos de Uso e Política de Privacidade
Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?
Ao continuar, você aceita os Termos de Uso e Política de Privacidade
Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?
Ao continuar, você aceita os Termos de Uso e Política de Privacidade
Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?
Ao continuar, você aceita os Termos de Uso e Política de Privacidade
Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?
Ao continuar, você aceita os Termos de Uso e Política de Privacidade
Prévia do material em texto
Análise em espaços métricos e vetoriais
Roberto Imbuzeiro Oliveira1
30 de junho de 2021
1IMPA, Rio de Janeiro, RJ, Brazil, 22430-040.
2
Conteúdo
I Os objetos fundamentais 9
1 Prólogo 11
1.1 Fatos sobre R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.1.1 Intervalos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.1.2 Limites e convergência de sequências . . . . . . . . . . . . . . . . . . . . . . . 11
1.1.3 Limites superior e inferior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.1.4 Limites e convergência de séries . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.1.5 Limites de funções, continuidade, máximos e mı́nimos . . . . . . . . . . . . . 15
1.1.6 Derivadas e integrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2 Algumas funções especiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.1 A função exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.2 A função logaritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.2.3 As funções seno e cosseno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.3 A desigualdade das médias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.4 Mais um fato útil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2 Espaços vetoriais e normas 25
2.1 Um caso concreto: o espaço Rd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.1.1 Operações em Rd e suas propriedades . . . . . . . . . . . . . . . . . . . . . . 25
2.1.2 Produto interno e a norma euclideana em Rd . . . . . . . . . . . . . . . . . . 26
2.2 Definições gerais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.2.1 O que é um espaço vetorial? . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.2.2 Subespaços de espaços vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2.3 Normas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3 Mais exercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3 Espaços métricos, convergência e completude 41
3.1 Espaços métricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.1.1 A reta real como espaço métrico . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.1.2 Os números complexos como espaço métrico . . . . . . . . . . . . . . . . . . 42
3.1.3 A métrica discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.1.4 Espaços vetoriais: normas nos dão métricas . . . . . . . . . . . . . . . . . . . 42
3.1.5 Métricas induzidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.2 Sequências, limites e completude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.2.1 Subsequências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3
3.2.2 Convergência em Rd com as normas `p . . . . . . . . . . . . . . . . . . . . . . 46
3.2.3 Convergência sob a métrica discreta . . . . . . . . . . . . . . . . . . . . . . . . 48
3.2.4 Convergência em C(I, R) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.3 Equivalência de métricas e normas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.4 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4 Funções e continuidade 57
4.1 Funções contı́nuas de X em R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.2 Funções Lipschitz e distâncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.3 Funções contı́nuas sobre o espaço de funções contı́nuas . . . . . . . . . . . . . . . . . 60
4.4 Funções contı́nuas de X em Rd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.5 Transformações e funcionais lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.6 Transformações multilineares e tensores . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.6.1 Tensores em dimensão finita . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.6.2 Alguns exemplos em dimensão infinita . . . . . . . . . . . . . . . . . . . . . . 69
4.7 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
II Topologia e geometria em espaços métricos 73
5 Abertos, fechados e topologias 75
5.1 Os abertos formam uma topologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.2 Outros conceitos topológicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.3 Caracterizações métricas dos conceitos topológicos . . . . . . . . . . . . . . . . . . . 82
5.4 Continuidade, abertos e fechados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
5.5 Topologia relativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.6 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
6 Compactos: teoria geral 89
6.1 Compactos do ponto de vista de Topologia Geral . . . . . . . . . . . . . . . . . . . . 90
6.2 Espaços métricos compactos: o grande teorema de equivalência . . . . . . . . . . . . 93
6.2.1 Roteiro da prova . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
6.2.2 Compactos são completos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
6.2.3 Cobertura, empacotamento e limitação total . . . . . . . . . . . . . . . . . . . 96
6.2.4 O critério das subsequências convergentes . . . . . . . . . . . . . . . . . . . . 99
6.2.5 O fim da prova da grande equivalência . . . . . . . . . . . . . . . . . . . . . . 101
6.3 Mais sobre compactos e funções contı́nuas . . . . . . . . . . . . . . . . . . . . . . . . 102
6.3.1 Funções sobre compactos com contradomı́nio completo . . . . . . . . . . . . 102
6.3.2 Funções sobre compactos com contradomı́nio Banach . . . . . . . . . . . . . 104
6.3.3 Continuidade uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
6.4 Compacidade de subconjuntos de um espaço métrico completo . . . . . . . . . . . . 107
6.5 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
4
7 Compactos: casos particulares 111
7.1 Compactos de Rd: o Teorema de Heine-Borel . . . . . . . . . . . . . . . . . . . . . . . 111
7.2 Aplicações do teorema de Heine-Borel . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
7.2.1 Todas as normas sobre Rd são equivalentes . . . . . . . . . . . . . . . . . . . 112
7.2.2 Convergência uniforme sobre compactos . . . . . . . . . . . . . . . . . . . . . 114
7.3 Compactos nos espaços de funções contı́nuas . . . . . . . . . . . . . . . . . . . . . . . 119
7.3.1 Bolas fechadas não são compactas . . . . . . . . . . . . . . . . . . . . . . . . . 120
7.3.2 O teorema de Arzelà-Ascoli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
7.4 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
8 Caminhos e conexidade 127
8.1 Conexidade por caminhos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
8.1.1 Conectando pontos por curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
8.1.2 Exemplos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
8.2 Conexidade topológica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
8.2.1 Formas equivalentes do conceito . . . . . . . . . . . . . . . . . . . . . . . . . . 131
8.2.2 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
8.2.3 Um pouco mais sobre conexidade e topologia induzida . . . . . . . . . . . . 135
8.3 Exemplos mais interessantesdas definições . . . . . . . . . . . . . . . . . . . . . . . . 136
8.3.1 Matrizes ortogonais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
8.3.2 Um conjunto conexo que não é conexo por caminhos . . . . . . . . . . . . . . 140
8.3.3 Concordância para abertos de espaços vetoriais . . . . . . . . . . . . . . . . . 141
8.4 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
III Cálculo em espaços vetoriais 145
9 Preâmbulo 147
10 Funções a um parâmetro: derivadas e integrais 149
10.1 Derivadas: definição e resultados preliminares . . . . . . . . . . . . . . . . . . . . . . 149
10.2 A desigualdade do valor médio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
10.3 Integração de funções sobre intervalos . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
10.4 O teorema fundamental do Cálculo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
10.5 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
11 A derivada como transformação linear 157
11.1 Definição de derivada de Fréchet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
11.1.1 Unicidade da derivada de Fréchet e derivadas direcionais . . . . . . . . . . . 158
11.2 Alguns casos simples da derivada de Fréchet . . . . . . . . . . . . . . . . . . . . . . . 159
11.2.1 Quando o domı́nio está na reta . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
11.2.2 Derivadas envolvendo funções lineares . . . . . . . . . . . . . . . . . . . . . . 161
11.2.3 A derivada quando V tem dimensão finita e W = R . . . . . . . . . . . . . . 161
11.2.4 O caso em que W tem dimensão finita . . . . . . . . . . . . . . . . . . . . . . 163
11.2.5 A derivada do determinante . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
11.3 Boas propriedades da derivada de Fréchet . . . . . . . . . . . . . . . . . . . . . . . . 166
5
11.3.1 A regra da cadeia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
11.3.2 A desigualdade do valor médio . . . . . . . . . . . . . . . . . . . . . . . . . . 168
11.4 Derivadas mais complicadas de se calcular . . . . . . . . . . . . . . . . . . . . . . . . 169
11.4.1 Exemplos no espaço de operadores lineares . . . . . . . . . . . . . . . . . . . 169
11.4.2 Um exemplo sobre as funções contı́nuas . . . . . . . . . . . . . . . . . . . . . 173
11.5 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
12 Derivadas de ordem superior 179
12.1 Já sabemos definir, mas... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
12.2 Segunda derivada, transformações bilineares e simetria . . . . . . . . . . . . . . . . . 180
12.2.1 Relação de L(V,L(V, W)) com transformações bilineares . . . . . . . . . . . 180
12.2.2 A segunda derivada é bilinear . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
12.2.3 Simetria da segunda derivada (quando contı́nua) . . . . . . . . . . . . . . . . 183
12.2.4 Derivadas parciais de ordem 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
12.3 Derivadas de ordem maior que dois . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
12.3.1 Onde vivem as derivadas e um kit para cuidar dos isomorfismos . . . . . . . 186
12.3.2 A derivada de ordem k ≥ 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
12.4 A fórmula de Taylor geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
12.5 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
13 Pontos fixos, funções inversas, funções implı́citas e EDOs 195
13.1 O teorema do ponto fixo de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
13.2 O teorema da função inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
13.3 O teorema da função implı́cita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
13.4 Aplicações às equações diferenciais ordinárias . . . . . . . . . . . . . . . . . . . . . . 206
13.4.1 Existência, unicidade e dependência contı́nua: um teorema global . . . . . . 206
13.4.2 Suavidade da solução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
13.5 Mais exercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
14 Esboço da teoria de subvariedades de Rd 213
14.1 Os dois primeiros exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
14.1.1 Abertos de Rd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
14.1.2 Gráficos de funções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
14.2 Parametrizações que viram difeomorfismos . . . . . . . . . . . . . . . . . . . . . . . . 214
14.3 O espaço tangente e a dimensão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
14.4 Subvariedades definidas implicitamente . . . . . . . . . . . . . . . . . . . . . . . . . . 219
14.4.1 Exemplos de subvariedades definidas implicitamente . . . . . . . . . . . . . 220
14.4.2 Um resultado intermediário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
14.4.3 Prova do Teorema 14.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
14.5 Trocas de cartas, funções diferenciáveis e estrutura intrı́nseca . . . . . . . . . . . . . 224
14.5.1 Trocas de cartas são difeomorfismos . . . . . . . . . . . . . . . . . . . . . . . . 225
6
IV EDOs: unicidade e dependência suave das condições iniciais 227
15 Existência e unicidade para certas EDOs 229
15.1 Existência e unicidade globais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
15.2 Existência e unicidade locais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
15.3 Diferenciabilidade local - esboço . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
15.4 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
V Mais sobre espaços de funções contı́nuas 235
16 Sequências e séries de funções 237
16.1 Séries de funções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
16.1.1 Somando séries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
16.1.2 Tomando derivadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
16.2 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
16.3 O método de Euler e a existência de soluções para EDOs . . . . . . . . . . . . . . . . 241
16.3.1 Localização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
16.3.2 A aproximação de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
16.3.3 O problema em forma integral . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
16.3.4 Aproximações de Euler são pontos quase-fixos . . . . . . . . . . . . . . . . . 244
16.3.5 Fim da demonstração . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
17 Subconjuntos densos de C(K, R): o teorema de Stone-Weierstrass 247
17.1 O teorema geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
17.1.1 Prova do teorema de Stone-Weierstrass . . . . . . . . . . . . . . . . . . . . . . 249
17.1.2 Prova do Lema Fundamental . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252
18 Restos das versões anteriores 257
18.1 Conjuntos conexos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
18.1.1 Conexidade e funções contı́nuas . . . . . . . . . . . . . . . . . . . . . . . . . . 258
18.1.2 Os conjuntos conexos de R são os intervalos . . . . . . . . . . . . . . . . . . . 259
18.1.3 Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
7
8Parte I
Os objetos fundamentais
9
Capı́tulo 1
Prólogo
Nota de 05/03/2021: este capı́tulo não foi revisto.
O objetivo deste curso será começar um estudo de Análise em espaços vetoriais e (de forma
mais geral) em espaços métricos. Por um lado, estes dois conceitos generalizam a reta real R. Por
outro, fazer Análise nestes espaços requer contas e resultados vindos do mundo unidimensional
da reta real. Portanto, há dois pré-requisitos fundamentais para nosso curso: um bom curso de
Análise na Reta e um conhecimento operacional de Álgebra Linear. É possı́vel que alguns alunos
sobrevivam sem um dos pré-requisitos, mas será basicamente por conta própria: não poderemos
parar por muito tempo para rever estes dois assuntos.
Nesta seção recordaremos alguns fatos e resultados importantes para tudo que vem a seguir.
1.1 Fatos sobre R
Toda a Análise que estudaremos neste curso é baseada no que você já sabe (ou deveria saber)
sobre a reta real. Nesta seção recordamos alguns fatos e resultados lá de Análise na Reta.
1.1.1 Intervalos
Lembre-se que um intervalo I ⊂ R é um conjunto da forma [a, b), (a, b], (a, b) ou [a, b] com a, b ∈
R ∪ {±∞}. Por convenção, o intervalo é vazio se a > b; além disso, só permitimos a, b = ±∞
quando a extremidade correspondente do intervalo for aberta. Chamamos I de intervalo compacto
se a, b 6= ±∞ e as suas duas extremidades são fechadas. Usaremos a notação R+ := [0, ∞).
Usaremos muitas vezes o resultado a seguir.
Exercı́cio 1.1 Um subconjunto S ⊂ R da reta é um intervalo se e somente se satisfaz a seguinte proprie-
dade: ∀x, y ∈ S : (x, y) ⊂ S.
1.1.2 Limites e convergência de sequências
Uma sequência de números reais {xn}n∈N ⊂ R converge a x ∈ R – ou xn → x, ou x = limn∈N xn
– se, dado qualquer ε > 0, podemos encontrar um n0 ∈ N tal que, para qualquer n ∈ N com
11
n ≥ n0, temos |x− xn| < ε. Simbolicamente, podemos escrever isto da seguinte forma
“x = lim
n∈N
xn” := “∀ε ∈ R+∃n0 ∈N∀n ∈N : n ≥ n0 ⇒ |x− xn| < ε.”
É um exercı́cio conhecido mostrar que a definição não se altera quando trocamos |x− xn| < ε
por |x − xn| ≤ ε acima. Um outro resultado conhecido (que não vamos provar aqui) é que R é
completo. Isto é, uma sequência em R é convergente se e somente se é Cauchy, o que quer dizer:
∀ε ∈ R+∃n0 ∈N∀n, m ∈N : n, m ≥ n0 ⇒ |xm − xn| < ε.
Dado um subconjunto infinito N ⊂ N, N = {n1 < n2 < n3 < n4 < . . . }, a subsequência
{xn}n∈N é (por definição) igual à sequência {yk}k∈N dada por yk := xnk , k ∈ N. Podemos então
falar do limite limn∈N xn := limk∈N yk. Pode-se mostrar que
“x = lim
n∈N
xn” := “∀ε ∈ R+∃n0 ∈ N∀n ∈ N : n ≥ n0 ⇒ |x− xn| < ε.”
Além disso, se uma sequência converge, toda subsequência sua converge ao mesmo limite.
Nada impede, aliás, de tomarmos subsequências de subsequências, como faremos algumas vezes
abaixo.
Uma propriedade importante dos intervalos compactos I 6= ∅ é que toda sequência em I
possui uma subsequência convergindo a um ponto de I.
1.1.3 Limites superior e inferior
Podemos falar também dos limites superior e inferior de uma sequência {xn}n∈N ⊂ R.
lim sup
n∈N
xn := inf
n∈N
sup
m∈N,m≥n
xn ∈ R∪ {+∞}.
lim inf
n∈N
xn := sup
n∈N
inf
m∈N,m≥n
xn ∈ R∪ {−∞}.
temos lim inf xn ≤ lim sup xn, com igualdade se e somente se ∃ limn xn.
1.1.4 Limites e convergência de séries
Dados números a1, a2, . . . , an, · · · ∈ R, dizemos que a série ∑n an converge se existe limn→+∞ ∑nj=0 aj.
Caso ∑n |an| convirja, dizemos que ∑n an é absolutamente convergente. Pode-se provar que, a con-
vergência absoluta implica convergência usual. No entanto, a recı́proca não vale.
As condições lim supn |an+1|/|an| < 1 e lim supn |an|1/n < 1 são suficientes para garantir que
∑n∈N an é absolutamente convergente. De fato, nos dois casos a prova da convergência absoluta
se baseia em progressões geométricas, ou seja, no fato que:
∀ρ ∈ R+,
∞
∑
n=0
ρn =
{
1
1−ρ , 0 ≤ ρ < 1;
+∞, ρ ≥ 1.
O critério de Leibniz diz que uma série do tipo
∑
n∈N
(−1)n xn, com cada xn ∈ R+,
12
converge se e somente se xn → 0. De modo geral, o fato de que ∑n an converge implica que
an → 0, mas a recı́proca não vale.
Se ∑n∈N an e ∑n∈N bn são absolutamente convergentes, o mesmo vale para ∑n∈N(an + bn) e
além disso:
∑
n∈N
(an + bn) = ∑
n∈N
an + ∑
n∈N
bn.
Vamos utilizar algumas vezes o lema a seguir.
Lema 1.1 Suponha que ∑n∈N an e ∑n∈N bn são absolutamente convergentes. Então ∑n∈N (∑
n
i=0 aibn−i)
também é absolutamente convergente e vale a identidade:
∑
n∈N
(
n
∑
i=0
aibn−i
)
=
(
∑
n∈N
an
) (
∑
n∈N
bn
)
.
Prova: Definimos para cada k ∈N
Pk :=
(
∑
i≤k
ai
) (
∑
j≤k
bj
)
;
Hk :=
k
∑
n=0
(
n
∑
i=0
aibn−i
)
=
k
∑
s=0
(
s
∑
i=0
ai bs−i
)
.
Por hipótese, sabemos que limk Pk = (∑n∈N an) (∑n∈N bn). Além disso, as duas séries neste
produto são convergentes. Podemos ainda observar que as duas somas se parecem, no seguinte
sentido:
Pk =
2k
∑
s=0
(
∑
0≤i,j≤k : i+j=s
ai bj
)
=
2k
∑
s=0
(
s
∑
i=0
ai bs−iξi,s,k
)
,
onde
ξi,s,k =
{
1 se i ≤ k e s− i ≤ k;
0 em caso contrário.
Começamos a prova com um caso particular do teorema.
Passo 1: se os ai e bj são não-negativos, então vale o teorema.
Note que, neste caso, {Hk}k∈N é uma sequência de somas parciais de uma série com termos
não-negativos. Se provarmos que ela converge a (∑n∈N an) (∑n∈N bn), garantimos automatica-
mente que a série limk Hk converge absolutamente.
Basta, portanto, provar que limk Hk = limk Pk. Para fazer isto, observe primeiramente que
todos os termos da soma que define H2k, que é
H2k =
2k
∑
s=0
(
s
∑
i=0
ai bs−i
)
13
aparecem na soma Pk multiplicados por ξi,s,k ∈ {0, 1}. Ou seja, Pk é a soma de alguns termos que
aparecem em H2k. Como todos estes termos são não-negativos, concluı́mos que Pk ≤ H2k. (Se o
leitor preferir, pode fazer um argumento mais algébrico:
H2k − Pk =
2k
∑
s=0
(
s
∑
i=0
ai bs−i(1− ξi,s,k)
)
≥ 0
porque todas as quantidades do lado direito são não-negativas.)
Por outro lado, se s ≤ k e i ≤ s, ξi,s,k = 1 sempre. Segue que a soma que define Pk contem
todos os termos com ai bs−i com 0 ≤ i ≤ s ≤ k, além de alguns outros que são não-negativos.
Concluı́mos que
Pk ≥
k
∑
s=0
(
s
∑
i=0
ai bs−i
)
= Hk
e portanto Hk ≤ Pk ≤ H2k para todo k ∈N.
Note agora que Pk converge a (∑n∈N an) (∑n∈N bn). Além disso, como os ai e bj são todos
≥ 0, {Hk}k∈N é crescente. Concluı́mos que Hk é limitada, portanto converge a um limite. Como
{H2k}k∈N é uma subsequência de {Hk}k∈N, ela converge ao mesmo limite que a sequência inteira.
Deduzimos:
lim
k
Hk ≤ lim
k
Pk =
(
∑
n∈N
an
) (
∑
n∈N
bn
)
≤ lim
k
H2k = lim
k
Hk,
ou seja,
lim
k
Hk =
(
∑
n∈N
an
) (
∑
n∈N
bn
)
.
Isto conclui o Passo 1.
Passo 2: estendendo a prova para ai e bj gerais.
Até agora trabalhamos supondo que ai, bj ≥ 0. Vamos agora ver o que acontece no caso geral.
Usando o Passo 1, vemos que
∑
n∈N
(
n
∑
i=0
|ai| |bn−i|
)
=
(
∑
n∈N
|an|
) (
∑
n∈N
|bn|
)
< +∞, (1.1)
já que, por hipótese, as séries ∑n an e ∑n bn são absolutamente convergentes. Concluı́mos que
também vale
∑
n∈N
∣∣∣∣∣
(
n
∑
i=0
aibn−i
)∣∣∣∣∣ ≤ ∑n∈N
(
n
∑
i=0
|ai||bn−i|
)
=
(
∑
n∈N
|an|
) (
∑
n∈N
|bn|
)
< +∞.
14
Portanto, {Hk}k converge absolutamente. Por outro lado, seguindo o raciocı́nio de antes,
|Pk − H2k| =
∣∣∣∣∣ 2k∑s=0
(
s
∑
i=0
ai bs−i(ξi,s,k − 1)
)∣∣∣∣∣
≤
2k
∑
s=0
(
s
∑
i=0
|ai| |bs−i||ξi,s,k − 1|
)
(|1− ξi,s,k| ≤ 1 e vale 0 se s ≤ k) ≤
2k
∑
s=k+1
(
s
∑
i=0
|ai| |bs−i|
)
≤
∞
∑
s=k+1
(
s
∑
i=0
|ai| |bs−i|
)
O último termo acima é a cauda da série ∑n (∑
s
i=0 |ai| |bs−i|), que aparece do lado esquerdo de
(1.1). Como esta série converge, sua cauda vai a 0 e concluı́mos |Pk − Hk| → 0. Portanto,
lim
k
Hk = lim
k
H2k = lim
k
Pk =
(
∑
n
an
) (
∑
m
bm
)
.
2
1.1.5 Limites de funções, continuidade, máximos e mı́nimos
Dado um intervalo I, uma função f : I → R e um ponto x ∈ R que é limite de pelo menos uma
sequência em I, dizemos quelim
y→x
f (y) = a
se para qualquer sequência {yn}n∈N ⊂ I\{x} com yn → x temos também f (yn) → a. Dizemos
que f é contı́nua em x ∈ I se limy→x f (y) = f (x).
Se I é compacto, toda função contı́nua tem duas propriedades adicionais automaticamente.
A primeira é que ela atinge seus supremo e ı́nfimo: isto é,
∃xmin, xmax ∈ I ∀x ∈ I : f (xmin) ≤ f (x) ≤ f (xmax).
Em particular, f é limitada.
A segunda propriedade que temos sobre intervalos compactos é que f é limitada. Isto quer
dizer que, se definimos o módulo de continuidade de f :
m f (δ) := sup{| f (x)− f (y)| : x, y ∈ I, |x− y| ≤ δ} (δ ∈ R+),
então m f (δ)→ 0 quando δ→ 0.
Exercı́cio 1.2 Dê exemplos de funções contı́nuas sobre I aberto que não são limitadas ou uniformemente
contı́nuas.
15
1.1.6 Derivadas e integrais
Dados um intervalo I, pontos a, b ∈ I com a < b (e portanto [a, b] ⊂ I) e f : I → R, dizemos que
f é diferenciável em x ∈ I se
∃ f ′(x) := lim
y→x
f (y)− f (x)
y− x .
O Teorema Fundamental do Cálculo nos diz que a derivada é a basicamente a operação inversa
da Integral definida:
I( f )(x) :=
∫ x
a
f (t) dt = lim
n→+∞
x− a
n
n−1
∑
i=0
f
(
a +
i (x− a)
n
)
.
Ou seja, I( f ′)(t) = f (x)− f (a) e I(g)′(x) = g(x).
Recordamos ainda que toda função diferenciável é contı́nua.
1.2 Algumas funções especiais
Neste capı́tulo recordamos alguns resultados fundamentais sobre quatro funções especiais: ex-
ponencial, logaritmo, seno e cosseno. A ideia é provar algumas propriedades destas funções
diretamente, sem recorrer à teoria de diferenciação de séries de potência.
1.2.1 A função exponencial
Definimos a função exponencial através da série de potência usual.
exp(t) :=
+∞
∑
n=0
tn
n!
, t ∈ R. (1.2)
Note que a definição acima faz sentido porque a série converge absolutamente para qualquer
t ∈ R. Pode-se verificar isto a partir do teste da razão:
|t|n+1/(n + 1)!
|t|n/n! =
|t|
n + 1
→ 0 quando n→ +∞.
Vemos ainda que exp(0) = 1.
Proposição 1.1 (Adição e produto) Dados quaisquer t, s ∈ R,
exp(t + s) = exp(t) exp(s).
Prova: Recorde a fórmula binomial:
(t + s)n =
n
∑
i=0
(
n
i
)
tisn−i, onde
(
n
i
)
=
n!
i! (n− i)! .
Aplicando a fórmula termo a termo na série de exp(t + s), descobrimos que
exp(t + s) :=
+∞
∑
n=0
(t + s)n
n!
=
∞
∑
n=0
(
n
∑
i=0
ti
i!
tn−i
(n− i)!
)
.
16
Observe que isto tem a forma
∞
∑
n=0
(
n
∑
i=0
ai bn−i
)
,
onde an = tn/n! e bn = sn/n! para cada n ∈N. Como ∑n tn/n! converge absolutamente a exp(t),
e analogamente para exp(s), deduzimos do Lema 1.1 que:
exp(t + s) =
(
∑
n
an
) (
∑
n
bn
)
= exp(t) exp(s).
2
Proposição 1.2 exp′(t) = exp(t) para cada t ∈ R.
Prova: Queremos mostrar que
Queremos:
exp(t + h)− exp(t)
h
→ exp(t) quando h→ 0.
Usando o fato que exp(t + h) = exp(t) exp(h), observamos que o que queremos equivale a:
Queremos (equivalente):
(exp(h)− 1) exp(t)
h
→ exp(t) para todo t,
e para isto basta provar que
Basta:
exp(h)− 1
h
→ 1.
Para tal, observe que
exp(h)− 1 =
∞
∑
n=1
hn
n!
= h + R(h)
com
R(h) = ∑
n≥2
hn
n!
.
Como n! ≥ 1 sempre, podemos comparar a série de R(h) termo a termo com a série geométrica:
∀|h| ≤ 1/2 : |R(h)| ≤ ∑
n≥2
|h|n
n!
≤ ∑
n≥2
|h|n = |h|
2
1− |h| .
Em particular, isto quer dizer que
∀|h| ≤ 1/2
∣∣∣∣exp(h)− 1h − 1
∣∣∣∣ = |R(h)||h| ≤ |h|1− |h| .
Como o lado direito desta desigualdade tende a 0 quando h → 0, deduzimos que |(exp(h) −
1)/h− 1| → 0, o que encerra a prova. 2
17
Proposição 1.3 exp(t) > 0 para todo t ∈ R.
Prova: Como exp é diferenciável, ela é contı́nua em todo R, em particular ao redor de t = 0.
Como exp(0) = 1, sabemos que existe um ε > 0 tal que exp(a) > 1/2 sempre que |a| < ε. Por
outro lado, dado t ∈ R qualquer, podemos encontrar um n ∈ N tal que |t/n| < ε, de modo que
exp(t/n) > 1/2. Desta forma, podemos aplicar a regra de “adição vira produto” para deduzir
que
exp(t) = exp
(
n
t
n
)
=
[
exp
(
t
n
)]n
>
1
2n
> 0.
2
Proposição 1.4 exp é estritamente crescente. Além disso, limt→+∞ exp(t) = +∞ e limt→+∞ exp(−t) =
0.
Prova: As duas proposições anteriores implicam que exp tem derivada estritamente positiva em
todo ponto da reta. Portanto, exp é estritamente crescente. Em particular, isto quer dizer que há
um a > 0 com exp(a) = m > 1 = exp(0). Usando o raciocı́nio da proposição anterior, vemos que
exp(na) ≥ mn → +∞ quando n→ +∞, já que m > 1.
Em particular, dado M > 0 existe um t ∈ R como exp(t) > M. Como exp é crescente, isto
implica que exp(t)→ +∞ quando t→ +∞.
Por outro lado, a regra de que adição vira produto implica que
exp(−t) = 1
exp(t)
→ 0 quando t→ +∞.
2
Proposição 1.5 exp(R) = R+\{0} Além disso, exp é uma bijeção entre domı́nio e imagem.
Prova: Já vimos que exp(t) ∈ R+\{0} para todo t. Resta mostrar que, dado x ∈ R+\{0}, existe
um único t com exp(t) = x. Veja que a unicidade segue do fato que exp é estritamente crescente.
Para provar existência, observe que, pela proposição anterior, certamente existem t−, t+ com
exp(t−) ≤ x ≤ exp(t+) (e necessariamente t− ≤ t+, posto que exp é estritamente crescente).
Como exp é diferenciável, ela é contı́nua e o Teorema do Valor Intermediário nos diz que existe
um t ∈ [t−.t+] com exp(t) = x. 2
1.2.2 A função logaritmo
Como exp : R → R+\{0} é uma bijeção estritamente crescente, ela tem uma função inversa
log : R+\{0} → R que também é uma bijeção estritamente crescente. Como a exponencial
transforma soma em produto, esta função, chamada de logaritmo, deve fazer o contrário.
Proposição 1.6 (Prova omitida) log(xy) = log x + log y para quaisquer x, y > 0.
Da mesma forma, como exp(t)→ +∞ e exp(−t)→ 0 quando t cresce, podemos provar que:
18
Proposição 1.7 (Prova omitida) log(x)→ −∞ se x→ 0 e log(x)→ +∞ se x→ +∞.
Agora calcularemos a derivada do logaritmo, provando, em particular, que ela existe.
Proposição 1.8 log′(x) = 1/x para qualquer x > 0.
Prova: Fixo x > 0, devemos provar que
Queremos: lim
h→0
log(x + h)− log x
h
=
1
x
.
Para isso, vamos fixar uma sequência {hn}n∈N com hn → 0 e min{hn, x + hn} > 0 para todo n.
Nosso objetivo é provar que, não importando qual sequência deste tipo escolhemos,
Queremos (equivalente): lim
h→0
log(x + hn)− log x
hn
=
1
x
.
Tome então t com exp(t) = x e tn com exp(tn) = x + hn para cada n ∈ N. Afirmamos que,
obrigatoriamente, tn → t. Note que isto quer dizer que:
lim
n→+∞
log(x + hn)− log x
hn
= lim
n→+∞
tn − t
exp(tn)− exp(t)
=
1
exp(t)
1
x
.
Portanto, se provarmos a afirmação, teremos encerrado a prova.
Para provar a afirmação, recorde que exp(tn) = x + hn → x = exp(t). Tome ε > 0 e defina
a+ := exp(t + ε), a− := exp(t − ε). Como exp é estritamente crescente, a− < exp(t) < a+,
portanto exp(tn) ∈ (a−, a+) para todo n suficientemente grande. Usando novamente o fato que
exp é estritamente crescente, deduzimos que tε < tn < t + ε para todo n suficientemente grande.
Como ε é arbitrário, isto implica tn → t. 2
Observação 1.1 A mesma prova acima mostra que, se f é contı́nua e estritamente crescente, então sua
inversa tem as mesmas propriedades.
1.2.3 As funções seno e cosseno
Definimos agora duas novas funções via séries de potência (para t ∈ R).
cos(t) :=
+∞
∑
n=0
(−1)n t
2n
(2n)!
sin(t) :=
+∞
∑
n=1
(−1)n+1 t
2n+1
(2n + 1)!
.
Repare que os termos destas séries são termos da série da exponencial, agora multiplicados
por sinais alternados. Podemos portanto usar uma comparação com a série da exponencial para
provar que as duas séries convergem.
Proposição 1.9 cos(t+ s) = cos(t) cos(s)− sin(t) sin(s) e sin(t+ s) = sin(t) cos(s)+ cos(t) cos(s)
para todos t, s ∈ R.
19
Prova: Provaremos apenas a primeira identidade, já que a segunda é similar.
Usando um argumento parecido com a fórmula da exponencial:
cos(t + s) =
+∞
∑
n=0
(−1)n (t + s)
2n
(2n)!
=
+∞
∑
n=0
(−1)n
(
2n
∑
i=0
ti
i!
s2n−i
(2n− i)!
)
Em cada somatório interno podemos dividir os ı́ndices i entre os da forma 2j (com 0 ≤ j ≤ n) e
os da forma 2k+ 1 (com 0 ≤ k ≤ n− 1). Temos, então
(−1)n
2n
∑
i=0
ti
i!
s2n−i
(2n− i)! =
n
∑
j=0
(−1)j t2j
(2j)!
(−1)n−j s2(n−j)
(2(n− j))!
+
n−1
∑
k=0
(−1)k t2k+1
(2k + 1)!
(−1)n−k s2(n−k)+1
(2n− 2k + 1)! .
Deduzimos que cos(t + s) é igual a:
+∞
∑
n=0
(
n
∑
j=0
(−1)j t2j
(2j)!
(−1)n−js2(n−j)
(2(n− j))! +
n−1
∑
k=0
(−1)k t2k+1
(2k + 1)!
(−1)n−k s2(n−k)+1
(2n− 2k + 1)!
)
.
Usando o Lema 1.1, podemos reconhecer os seguintes termos acima:
∞
∑
n=0
(
n
∑
j=0
(−1)j t2j
(2j)!
(−1)n−js2(n−j)
(2(n− j))!
)
= cos(t) cos(s)
e
∞
∑
n=0
(
n−1
∑
k=0
(−1)k t2k+1
(2k + 1)!
(−1)n−k s2(n−k)−1
(2n− 2k− 1)!
)
= − sin(s) sin(s),
com convergência uniforme em ambos os casos. Como a soma destas séries para cos(t) cos(s) e
− sin(t) sin(s) é a série de cos(t + s), temos a identidade desejada. 2
Proposição 1.10 cos′(t) = − sin(t) e sin′(t) = cos(t).
Prova: Apenas esboçaremos a prova do primeiro fato acima, já que a segunda é similar. Veja que,
dado h 6= 0, podemos utilizar a identidade das somas acima para escrever
cos(t + h)− cos(t)
h
=
(
cos(h)− 1
h
)
cos(t)− sin h
h
sin t.
Seguindo a conta que fizemos para a exponencial, podemos mostrar que sin h/h → 1 (cos h−
1)/h→ 1: basta separar
sin h = h + resto da ordem |h|3 e cos h = 1 + resto da ordem |h|2.
2
20
Proposição 1.11 sin2(t) + cos2(t) = 1 para todo t ∈ R.
Prova: Isto vale se t = 0 por inspeção. Além disso, sin2(t) + cos2(t) é constante:
(sin2(t) + cos2(t))′ = 2 sin(t) sin′(t)− 2 cos(t) cos′(t) = 0.
2
Proposição 1.12 Dados t, s ∈ R (cos t, sin t) = (cos s, sin s), implica cos(t− s) = 1, sin(t− s) = 0.
Prova: Pelas fórmulas para senos e cossenos de t + s
cos t = cos s⇒ cos t = cos s cos(t− s)− sin(t− s) sin s.
sin t = sin s⇒ sin t = sin s cos(t− s) + sin(t− s) cos s.
Escrevendo a := cos t = cos s, b := sin t = sin s, x = cos(t− s), y = sin(t− s), temos que{
a x− b y = a
b x + a y = b
Se a b 6= 0, o sistema acima tem como única solução x = 1, y = 0. Se a = 0, então b 6= 0 (já que
a2 + b2 = 1) e chegamos à mesma conclusão que x = 1, y = 0. O mesmo vale ainda se b = 0 (e
portanto a = 1). 2
Proposição 1.13 Existe um p > 0 tal que cos p = 0 e cos t > 0 para t ∈ [0, p). Temos também sin t = p
e 0 < sin t < 1 para t ∈ [0, p) (No que segue, π := 2p).
Prova: Por um lado, cos 0 = 1. Por outro lado, temos:
cos 2 = 1− 2
2
2!
+
24
4!
− 2
6
6!
+ · · ·+ 2
4n
(4n)!
− 2
4n+2
(4n + 2)!
+ . . . .
Como 1− 222! = 0 e
24n
(4n)! <
24n+2
(4n+2)! para n ≥ 1, temos que cos 2 < 0. Isto é, cos 0 > 0 > cos 2.
O cosseno é diferenciável e portanto contı́nuo; isto nos permite aplicar o Teorema do Valor
Intermediário para provar que existe um x ∈ (0, 2) com cos x = 0. Definimos então
p := inf{x ∈ (0,+∞) : cos x = 0}.
Note que p ≥ 0 está bem definido porque cos x = 0 para ao menos um x e o conjunto de x
considerados é limitado por baixo. Veja ainda que, como p = limn xn para alguma sequência
{xn}n com cos xn = 0, temos cos p = 0 e portanto p > 0. Mais ainda, não pode ser verdade que
cos t = 0 para 0 ≤ t < p e isto quer dizer que cos t não pode trocar de sinal neste intervalo. Ou
seja cos t > 0 para 0 ≤ t < p.
Para terminar, observe que para 0 ≤ t < p, sin t é crescente (já que sua derivada é cos t),
portanto 0 < sin t < 1. Em particular, como sin é contı́nuo, sin p > 0. Como cos p = 0 e portanto
sin2 p = 1, concluı́mos que sin p = 1. 2
21
Proposição 1.14 cos(t + p) = − sin(t) e sin(t + p) = cos t para todo t ∈ R. Portanto, os únicos
pontos onde cos t = 0 ou sin t = 0 são os múltiplos de p.
Prova: A primeira afirmação segue das fórmulas para cos(t + s) e sin(t + s) aplicadas a s := p.
Para a segunda, veja que podemos escrever qualquer t ∈ R na forma t = ±p n + a com
0 ≤ a < p e n ∈ N. Usando indução em n, podemos provar a partir da primeira parte que
cos(±np + a) ∈ {± cos a,± sin a} para qualquer n ∈N. Deduzimos que
cos t = 0⇔ cos a = 0 ou sin a = 0⇔ a ∈ {0, p} (pois a ∈ [0, p)) .
Portanto t = np ou t = (n + 1) p. O mesmo vale se sin t = 0. 2
Proposição 1.15 (cos t, sin t) = (cos s, sin s) se e somente se t− s é múltiplo inteiro de 2π.
Prova: A hipótese equivale a cos(t− s) = 1, sin(t− s) = 0. Pela proposição anterior, é necessário
que t− s = np seja múltiplo de p, com cos(np) = 1. No entanto, é fácil ver usando a proposição
anterior que
cos(0) = 1, cos(±p) = 0, cos(±2p) = −1, cos(±3p) = 0,
cos(±4p) = 1, cos(±5p) = 0, cos(±6p) = −1, cos(±7p) = 0,
cos(±8p) = 1, cos(±9p) = 0, cos(±10p) = −1, cos(±11p) = 0 . . .
Portanto, para qualquer n ∈ Z cos(np) = 1 se e somente se n é divisı́vel por 4. 2
Proposição 1.16 A aplicação “t 7→ (cos t, sin t)” é uma bijeção entre [0, 2π) e o cı́rculo unitário:
S1 := {(x, y) ∈ R2 : x2 + y2 = 1}.
Prova: Como cos2 t + sin2 t = 1, todo t é levado em S1. Além disso, a aplicação é injetiva para
t ∈ [0, 2π) pela proposição anterior.
Para provar a sobrejetividade, fixamos (x, y) ∈ S1 para mostrar que existe um t0 ∈ [0, π/2] e
um m ∈ {0, 1, 2, 3} tal que
Queremos: (x, y) = (cos(t0 + mπ/2), sin(t0 + mπ/2)).
Verificamos que, como cos 0 = 1, cos(π/2) = 0 e cos é contı́nuo, existe um tx ∈ [0, π/2] com
cos tx = |x| e portanto sin tx = |y| (já que y2 = 1− x2 = 1− cos2 t e sin t ≥ 0 para t ∈ [0, π/2]).
Do mesmo modo, há um ty ∈ [0, π/2] com cos ty = |y| e sin ty = |x|. Portanto, temos o seguinte:
1. Se x ≥ 0, y ≥ 0, (x, y) = (cos tx, sin tx).
2. Se x < 0, y ≥ 0, observamos que
(x, y) = (− sin ty, cos ty) = (cos(ty + π/2), sin(ty + π/2)).
3. Se x ≤ 0, y ≤ 0,
(x, y) = (cos(tx + π), sin(tx + π)).
4. Se x > 0, y ≤ 0, observamos que
(x, y) = (sin ty,− cos ty) = (cos(ty + 3π/2), sin(ty + 3π/2)).
Portanto, provamos o que querı́amos em todos os quatro casos. 2
22
1.3 A desigualdade das médias
Encerramos este capı́tulo provando a conhecida desigualdade entre as médias aritmética e geométrica.
Teorema 1.1 (Desigualdade das médias aritmética e geométrica) Sejam α1, . . . , αk números positi-
vos com soma 1. Dados t1, . . . , tk ∈ R+, temos a desigualdade:
k
∏
i=1
tαii ≤
k
∑
i=1
αi ti.
Além disso, vale igualdade se e somente se t1 = t2 = · · · = tk.
Prova: O passo fundamental neste resultado é estabelecer o resultado para k = 2 e depois gene-
ralizá-lo por indução.
Fixemos então k = 2. Para facilitar um pouco a notação, definimos x := tα11 , y = t
α2
2 , p = 1/α1,
q = 1/α2. Veja que x, y ≥ 0, p, q > 1 e (1/p) + (1/q) = 1. Desejamos provar que
Queremos: ∀x, y ≥ 0 : xy ≤ x
p
p
+
yq
q
, com igualdade se e somente se xp = yq.
Isto é trivial quando x = 0, logo vamos supôr x > 0. O que queremos, então, é equivalente a
provar que:
Queremos (de forma equivalente): ∀x ∈ R+\{0} :
sup
y∈R+
(
xy− y
q
q
)
=
xp
p
, atingido só quando yq = xp.
Para provar esta propriedade, fixe x ∈ R+\{0} e defina φx(y) := xy− yq/q, y ∈ R+. Recordando
que q > 1, x > 0, vemos que φx é diferenciável e que
φ′x(y) = x− yq−1

> 0 se y < x
1
q−1 ;
= 0 se y = x
1
q−1 ;
< 0 se y > x
1
q−1 .
Segue que y∗ := x
1
q−1 é o único máximo global da função φx. Note ainda que, como (1/p) +
(1/q) = 1, temos p = q/(q− 1) = 1 + 1/(q− 1), portanto y∗ é o único ponto com yq∗ = xp.
Vamos calcular agora φx(y∗). A conta abaixo usa novamente o fato que p = q/(q − 1) =
1 + 1/(q− 1):
φx(y∗) = x
1+ 1q−1 − x
q
q−1
q
= xp − x
p
q
=
xp
p
.
O que deduzimos então é o seguinte:
1. Como y∗ é máximo global de φx, vale que, para qualquer y ∈ R+,
φx(y) = xy−
yq
q
≤ φx(y∗) =
xp
p
.
2. Além disso, apenas y∗, que satisfaz y
q
∗ = xp, atinge este máximo global.
23
Isto era exatamente o que querı́amos provar e encerra a demonstração para k = 2.
Vejamos agora a prova para k > 2. A ideia é fazer indução forte em k tomando k = 2 como
base. Se k > 2, defina novos expoentes
βi :=
αi
1− αk
i = 1, 2, . . . , k− 1.
Observe que
k
∏
i=1
tαii = T
1−αk tαkk , (1.3)
onde (por hipótese de indução)
T :=
k−1
∏
i=1
tβii ≤ S :=
k−1
∑
i=1
βi ti =
∑k−1i=1 αi ti
1− αk
,
com igualdade se e somente se t1 = · ·· = tk−1 Aplicando o caso k = 2 a (1.3), temos
k
∏
i=1
tαii ≤ (1− αk) T + αk tk ≤ (1− αk) S + αk tk =
k
∑
i=1
αi ti.
Além disso, a igualdade só vale se T = S – e portanto T = t1 = t2 = · · · = tk−1 – e além disso
tk = T. Portanto, para que a igualdade valha, é necessário que t1 = · · · = tk. 2
Exercı́cio 1.3 Sejam 1 < p, q < +∞ com (1/p) + (1/q) = 1. Mostre que para quaisquer x, y ∈ R,
xy ≤ |x|
p
p
+
|y|q
q
com igualdade se e somente valem seguintes condições:
• |x|p = |y|q;
• ou x = y = 0, ou x 6= 0 6= y e os sinais de x e y coincidem.
Exercı́cio 1.4 Sejam 1 < p, q < +∞ com (1/p) + (1/q) = 1. Mostre que para quaisquer x, y ∈ R e
λ > 0,
xy ≤ |x|
p
p λp
+
λq|y|q
q
.
Além disso, se x, y ∈ R+, existe uma escolha de λ tal que
|xy| = |x|
p
p λp
+
λq |y|q
q
.
1.4 Mais um fato útil
24
Capı́tulo 2
Espaços vetoriais e normas
O principal objetivo deste curso é estender a Análise que aprendemos na reta a espaços mais
gerais: os chamados espaços métricos. Antes de defini-los, vamos começar com a classe mais
restrita, mas muito importante, de espaços vetoriais normados. Aqui já veremos alguns dos desafios
de levar a Análise a uma dimensão mais alta.
2.1 Um caso concreto: o espaço Rd
Começamos de forma ainda mais particular pelo espaço vetorial que todo mundo conhece (ou
deveria conhecer): o espaço euclideano real de d dimensões.
Dado d ∈N\{0}, definimos Rd como um produto cartesiano:
Rd := R×R× · · · ×R︸ ︷︷ ︸
d vezes
.
Os elementos x ∈ Rd são d-tuplas de números reais, x = (x[i])di=1. Os números x[1], . . . , x[d] ∈ R
são chamados de coordenadas de x. Esta notação que usamos para as coordenadas é inspirada
pelo MatLab!
É bom especificar logo de cara d + 1 vetores especiais em Rd:
• O vetor nulo 0Rd cujas coordenadas são 0Rd [i] = 0, i = 1, . . . , d.
• Os vetores ej, 1 ≤ j ≤ d, da base canônica de Rd cujas coordenadas são
ej[i] =
{
1, i = j;
0, i 6= j; 1 ≤ i, j ≤ d.
2.1.1 Operações em Rd e suas propriedades
Há duas operações fundamentais em Rd:
1. Soma (e diferença): dados x, y ∈ Rd, x± y ∈ Rd é o vetor cujas coordenadas são (x± y)[i] =
x[i]± y[i], 1 ≤ i ≤ d.
2. Multiplicação por escalar: dados x ∈ Rd e λ ∈ R λ x ∈ Rd é o vetor cujas coordenadas são
(λ x)[i] = λ x[i], 1 ≤ i ≤ d.
25
Não é difı́cil verificar as seguintes propriedades:
• 0 é o elemento neutro da soma: para todos x, y ∈ Rd, x + y = x se e somente se y = 0.
• 0 x = 0 para todo x ∈ Rd.
• 1 é o elemento neutro da multiplicação por escalar: para todos x ∈ Rd, λ ∈ R, λ x = x se e
somente se x = 0 e/ou λ = 1.
• As operações são todas associativas. A soma é comutativa também.
• A multiplicação por escalar é distributiva das duas maneiras pssı́veis: se λ, η ∈ R, x, y ∈ Rd:
(λ + η) x = λ x + η x e λ (x + y) = λ x + λ y.
Exercı́cio 2.1 Prove que:
∀x ∈ Rd : x =
d
∑
i=1
x[i] ei.
2.1.2 Produto interno e a norma euclideana em Rd
Grosso modo, uma norma em Rd é uma maneira de medir a distância desde 0 até os demais
pontos de Rd. Desta forma, os axiomas a seguir são naturais.
Definição 2.1 Uma norma sobre Rd é uma função ‖ · ‖ : Rd → R com as seguintes propriedades:
• A norma é positiva definida, isto é, para todo x ∈ Rd, ‖x‖ ≥ 0, e ‖x‖ = 0 se e somente se x = 0.
• A norma é homogênea positiva, isto é, para quaisquer λ ∈ R, x ∈ Rd, ‖λ x‖ = |λ| ‖x‖.
• A norma é sub-aditiva, isto é, para quaisquer x, y ∈ Rd, ‖x + y‖ ≤ ‖x‖+ ‖y‖.
Como podemos definir uma norma em Rd? Quase todos já sabemos que a norma euclideana
serve:
|x|2 :=
√√√√ d∑
i=1
(x[i])2 (x ∈ Rd).
Essa é a noção de “tamanho de um vetor” que aprendemos desde cedo nos cursos de Álgebra
Linear ou Geometria Analı́tica. A pergunta, no entanto, é a seguinte: como podemos provar que
esta norma euclideana é mesmo uma norma?
Provar que a norma é positiva definida é simples. Primeiro, observamos que |x|2 é bem
definida porque |x|22 é uma soma de termos (x[i])2 não-negativos; logo, a raı́z quadrada desta
quantidade é bem-definida e não-negativa. Além disso, |x|2 se anula se e somente se esta soma
de termos não negativos se anula, o que só pode ocorrer se cada termo é nulo: x[i]2 = 0 para cada
1 ≤ i ≤ d, ou seja, x = 0Rd .
Agora argumentamos a homogeneidade positiva: tomando x ∈ Rd e λ ∈ R, queremos de-
monstrar que |λx|2 = |λ| |x|2. Para isso, para cada i = 1, 2, . . . , d, a i-ésima coordenada de λx é
λx[i]. Como o quadrado de um produto é o produto dos quadrados, temos:
|λx|22 =
d
∑
i=1
(λx[i])2 = λ2
d
∑
i=1
x[i]2 = λ2 |x|22.
26
Lembramos agora que a raı́z quadrada de λ2 é |λ| (por definição). Como a raı́z de um produto é
o produto das raı́zes, obtemos |λx|2 = |λ||x|2, como querı́amos demonstrar.
Como último passo, precisamos provar que a norma euclideana é subaditiva. Em geral esta
é a parte mais difı́cil de se provar que uma candidata a norma é mesmo norma. No caso que
estamos analisando, faremos isso a partir das propriedades do produto interno que quase todos
conhecem. Dados x, y ∈ Rd, definimos:
x · y :=
d
∑
i=1
x[i] y[i] ∈ R.
A relação entre norma euclideana e produto interno é que |x|22 = x · x. Nossa prova da subaditi-
vidade da norma será baseada nas propriedades do produto interno listadas a seguir.
Lema 2.1 (Propriedades básicas do produto interno) Dados x, x′ ∈ Rd:
1. Positividade: x · x ≥ 0, com igualdade se e somente se x = 0.
2. Simetria: x · x′ = x′ · x.
3. Linearidade: se λ ∈ R, a, b ∈ Rd e x = λa + b, então x′ · x = x · x′ = λ (a · x′) + (b · x′).
Prova: A primeira propriedade é exatamente a mesma coisa que dizer que a norma euclideana é
positiva definida, o que já provamos acima.
A propriedade 2 é consequência do fato que x[i] x′[i] = x′[i] x[i] para cada coordenada i ∈
{1, . . . , d}, de modo que
x · y =
d
∑
i=1
x[i] x′[i] =
d
∑
i=1
y[i] x[i] = x′ · x.
A propriedade 3 vem do fato que, por definição das operações de Rd
x = λa + b⇒ x[i] = λa[i] + b[i]
de modo que, pelas distributividade e associatividade de R,
x · x′ =
d
∑
i=1
x[i] x′[i] =
d
∑
i=1
(λ a[i] + b[i]) x′[i]
= λ
d
∑
i=1
a[i] x′[i] +
d
∑
i=1
b[i] x′[i]
= λ (a · x′) + (b · x′).
2
A subaditividade vai precisar de um passo a mais, derivado do último lema: a desigualdade
de Cauchy-Schwartz.
Teorema 2.1 (Desigualdade de Cauchy Schwartz) Para quaisquer x, y ∈ Rd, vale |x · y|2 ≤ |x|2 |y|2.
A igualdade vale exatamente quando x = 0Rd ou y = 0Rr ou y/|y|2 = x/|x|2.
27
Prova: O teorema é trivialmente verdadeiro se x = 0Rd ou y = 0Rd . Podemos então supôr que
nenhum dos dois vetores se anula. Neste caso, podemos considerar v := x/|x|2 e w := y/|y|2,
notando que estes vetores têm norma 1. Pela linearidade do produto interno,
x · y ≤ |x|2 |y|2 ⇔ v · w ≤ 1.
Provaremos a seguir que v · w ≤ 1 com igualdade se e somente se v = w, o que claramente
implica o teorema.
Para provar que |v · w| ≤ 1, escrevemos:
v · w =
d
∑
i=1
v[i]w[i]
≤
d
∑
i=1
|v[i]w[i]| (2.1)
(média geo. ≤ aritmética p/ cada termo) ≤
d
∑
i=1
|v[i]|2 + |w[i]|2
2
(2.2)
(|v|2 = |w|2 = 1) = 1.
Como podemos ter igualdade acima? Em primeiro lugar, (2.1) deve ser uma igualdade, o que
acontece se e somente se todos os termos da soma forem maiores ou iguais a zero. Ou seja,
queremos que v[i] e w[i] tenham o mesmo sinal para cada ı́ndice i. Em segundo lugar, precisamos
de igualdade na aplicação da desigualdade das médias em (2.2), o que só ocorre quando |v[i]|2 =
|w[i]|2 – ou seja, v[i] = ±w[i] – para cada i. Deduzimos que v · w = 1 se e somente se v = w, o
que ocorre se e somente se y = |y|2x/|x|2. 2
Terminamos a seção usando Cauchy-Schwartz para provar que a norma é sub-aditiva.
Teorema 2.2 Vale a identidade:
∀x ∈ Rd : |x|2 = max{x · z : z ∈ Rd, |z|2 = 1}
Em particular, a norma euclideana é subaditiva (e portanto é mesmo uma norma).
Prova: A igualdade vem de Cauchy-Schwartz. Temos x · z ≤ |x|2 para todo z de norma 1, com
igualdade se e somente se x = 0Rd ou z = x/|x|2.
Para a subaditividade, tome x e y em Rd. Dado qualquer z ∈ Rdde norma 1,
z · (x + y) = z · x + z · y ≤ |x|2 + |y|2 (por Cauchy-Schwartz aplicada a z.x e z.y).
Portanto,
|x + y|2 = max{z · (x + y) : z ∈ Rd, |z|2 = 1} ≤ |x|2 + |y|2.
2
Observação 2.1 Um caminho ainda mais simples para provar a subaditividade é observar que, pela bili-
nearidade do produto interno e Cauchy-Schwartz
|x + y|22 = |x|22 + |y|22 + 2 x.y ≤ |x|22 + |y|22 + 2 |x|2|y|2 = (|x|2 + |y|2)2.
Como a raı́z quadrada é uma função monótona, obtemos |x + y|2 ≤ |x|2 + |y|2. No entanto, a ideia contida
no Teorema 2.2 de expressar a norma como máximo se aplica de forma ainda mais geral; veja os Exemplos
2.3 e 2.4 e o Exercı́cio 2.16.
28
2.2 Definições gerais
2.2.1 O que é um espaço vetorial?
Acima vimos (ou recordamos a teoria básica do espaço Rd com sua norma mais básica e suas
operações. Veremos ao longo do curso muitos outros espaços com estrutura semelhante.
Definição 2.2 (Espaço vetorial) Chamamos de espaço vetorial sobre R um conjunto V 6= ∅ com
operações de soma
(v, w) ∈ V2 7→ v + w ∈ V
e multiplicação por escalar
(λ, v) ∈ R×V 7→ λ v ∈ V,
além de um elemento distinguido 0 ∈ V, definidos de modo a satisfazer os axiomas a seguir:
1. Comutatividade e associatividade da soma: v + w = w + v e (v + w) + z = v + (w + z) para
todos v, w, z ∈ V.
2. Associatividade do produto: para quaisquer λ, η ∈ R, v ∈ V, λ(ηv) = (λη) v.
3. Distributividade: para todos v, w ∈ V, λ, ξ ∈ R, (λ + ξ) (v + w) = λv + λw + ξv + ξw.
4. Elemento neutro: 0 + v = v para todo v ∈ V.
5. Multiplicação por 1 e 0: 1.v = v e 0.v = 0 para todo v ∈ V.
O espaço Rd discutido acima é um espaço vetorial segundo esta definição. Note que d = 1 é
uma escolha válida, ou seja: com as operações usuais, R é um espaço vetorial sobre R!
Veremos agora mais dois exemplos.
Exemplo 2.1 (Matrizes `× d) Sejam agora `, d ∈ N\{0}. Considere o conjunto R`×d de todas as
matrizes com ` linhas, d colunas e entradas reais.
Um elemento A deste espaço tem a seguinte “cara”.
` linhas


A[1, 1] A[1, 2] . . . A[1, d]
A[2, 1] A[2, 2] . . . A[2, d]
. . . . . .
A[`, 1] A[`, 2] . . . A[`, d]

︸ ︷︷ ︸
d colunas
.
Ou seja, as entradas (ou “coordenadas”) de uma matriz `× d são chamadas de A[i, j], com
1 ≤ i ≤ ` e 1 ≤ j ≤ d. Podemos definir a soma e subtração de matrizes, além do produto
de uma matriz por escalar, fazendo tudo entrada a entrada. Como no caso de Rd, a estrutura
resultante nos dá um espaço vetorial. Isso não chega a ser uma surpresa porque, afinal, uma
matriz ` × d pode ser reescrita como um vetor de ` d números reais. No entanto, o fato que
matrizes representam transformações lineares sugere maneiras diferentes de se medir os elementos
de R`×d.
O exemplo a seguir é um tanto quanto diferente.
29
Exemplo 2.2 (Funções contı́nuas) Dado um subconjunto I ⊂ R, I 6= ∅, considere o conjunto
C(I, R) := { f : I → R : f contı́nua}.
Este espaço tem uma estrutura natural de espaço vetorial. O elemento 0 é a função que se anula
em todo ponto. A soma é exatamente a soma usual de funções, o que “funciona” porque a soma
de funções contı́nuas é contı́nua. O produto por escalar consiste em tomar a função f e o escalar
λ e definir uma nova função λ f que leva t ∈ I em λ f (t). É um exercı́cio mostrar que estas
operações realmente satisfazem todos axiomas de espaço vetorial.
Observação 2.2 (Vetores são funções e vice-versa) O espaço de funções tem uma certa relação de ana-
logia o Rd. Numa direção, podemos conceber cada vetor x ∈ Rd como uma representação de uma função
de x : {1, . . . , d} → R associando cada 1 ≤ i ≤ d um valor x[i]. Na outra direção, podemos pensar numa
função f : I → R como um ”vetor” cujas coordenadas f (t) são indexadas pelos elementos t ∈ I. Isso nos
mostra que pensar em C(I, R) como espaço vetorial, além de ser formalmente correto, tem um significado
intuitivo também. Manter isso em mente pode ajudar a compreender várias provas abaixo.
2.2.2 Subespaços de espaços vetoriais
Ocasionalmente, será importante olharmos para subespaços de espaços vetoriais.
Definição 2.3 (Subespaço vetorial) Chamamos um subconjunto W ⊂ V, W 6= ∅ de subespaço veto-
rial de V se ele é fechado pelas operações de soma e multiplicação por escalar. Ou seja:
∀w, w′ ∈W, ∀λ ∈ R : λ w + w′ ∈W.
Por exemplo, dado qualquer a ∈ Rd, o conjunto
Ha := {x ∈ Rd : a · x = 0}
é um subespaço de Rd; isto segue da linearidade do produto interno.
Exercı́cio 2.2 O conjunto das matrizes d× d simétricas – isto é, as A ∈ Rd×d com A[i, j] = A[j, i] para
cada par 1 ≤ i, j ≤ d – é um subespaço de Rd×d
Exercı́cio 2.3 Dado J ⊂ R, o conjunto C(I, J) de funções contı́nuas de I em J é um subconjunto de
C(I, R). Para que escolhas de J este conjunto é um subespaço vetorial de C(I, R)?
Exercı́cio 2.4 Dados t ∈ I e ξ ∈ R, o conjunto W de funções contı́nuas de I em R com f (t) = ξ é um
subconjunto de C(I, R). Para que escolhas de ξ este conjunto é um subespaço vetorial de C(I, R)?
2.2.3 Normas
Para fazermos Análise, vamos precisar medir distâncias em espaços vetoriais. Isto nos leva à
definição de norma, que é exatamente aquela que usamos em Rd.
Definição 2.4 Uma norma sobre um espaço vetorial real V é uma função ‖ · ‖ : V → R com as seguintes
propriedades:
30
• A norma é positiva definida, isto é, para todo x ∈ V, ‖x‖ ≥ 0, e ‖x‖ = 0 se e somente se x = 0.
• A norma é homogênea positiva, isto é, para quaisquer λ ∈ R, x ∈ V, ‖λ x‖ = |λ| ‖x‖.
• A norma é sub-aditiva, isto é, para quaisquer x, y ∈ V, ‖x + y‖ ≤ ‖x‖+ ‖y‖.
Em geral há alguma dificuldade de provar que uma candidata a norma é mesmo norma,
especialmente porque a subaditividade pode ser difı́cil de checar. Por exemplo, foi assim no
caso da norma euclideana em Rd, que abordamos acima. Veremos abaixo alguns exemplos que
requerem estratégias variadas.
Normas envolvendo máximos e supremos
Na nossa prova de que | · |2 é norma para Rd, usamos fortemente que |x|2 é o supremo de x.z
sobre vetores unitários z ∈ Rd. Outros casos de normas baseadas em supremos ou máximos são
apresentados abaixo.
Exemplo 2.3 Uma outra maneira de definir uma norma em Rd é tomando-se a norma do máximo, ou `∞.
|x|∞ := max
1≤i≤d
|x[i]| (x ∈ Rd).
Vejamos que esta é mesmo uma norma. Em primeiro lugar, ela é bem definida porque o
máximo de um conjunto finito sempre é bem definido. Ela é positiva-definida porque é sempre
não-negativa (o módulo de cada x[i] é não-negativo) e vale 0 se e somente todas as coordenadas
de x se anulam (afinal, |x[i]| ≤ |x|∞ para cada i). Também não é difı́cil ver que ela é homogênea
positiva, usando que |λx[i]| = |λ| |x[i]| para cada i = 1, . . . , d.
A subaditividade também não é difı́cil de se mostrar neste caso. Tome x, x′ ∈ Rd. Para cada
coordenada i =, . . . , d, podemos usar a sub-aditividade do valor absoluto (sobre os reais) e a
definição de | · |∞ e deduzir:
|(x + x′)[i]| ≤ |x[i]|+ |x′[i]|.
Como o valor absoluto de cada uma das coordenadas pode ser cotado por cima pelo máximo
dos valores absolutos, chegamos à seguinte desigualdade:
|x[i]|+ |x′[i]| ≤ max
1≤j≤d
|x[j]|+ max
1≤j≤d
|x′[j]| = |x|∞ + |x′|∞.
Concluı́mos todas as coordenadas satisfazem |(x + x′)[i]| ≤ |x|∞ + |x′|∞. Tomando o máximo
sobre i, deduzimos que |x + x′|∞ ≤ |x|∞ + |x′|∞, como querı́amos demonstrar.
O exemplo a seguir é só um pouco diferente.
Exemplo 2.4 Tome I ⊂ R compacto e escreva C := C(I, R). Para f ∈ C, definimos:
‖ f ‖I,∞ = sup
t∈R
| f (t)|.
Às vezes, quando o I estiver subentendido, ele será omitido da notação e escreveremos ‖ f ‖∞.
31
A razão pela qual ‖ f ‖I,∞ é bem definida é que toda função contı́nua sobre um compacto é
limitada, como já sabemos de Análise na Reta.
Vejamos por que ‖ · ‖∞ é mesmo norma. As demonstrações de que a norma é positiva-
definida e homogênia positiva ficam como exercı́cio. A prova da subaditividade não é difı́cil.
Sejam f , g ∈ C dadas. Observem que, pela subaditividadedo módulo sobre a reta,
∀t ∈ I : |( f + g)(t)| = | f (t) + g(t)| ≤ | f (t)|+ |g(t)|.
Sabermos ainda que | f (t)| ≤ sups∈I | f (s)| = ‖ f ‖∞ e |g(t)| ≤ sups∈I |g(s)| = ‖g‖∞, portanto
| f (t) + g(t)| ≤ ‖ f ‖∞ + ‖g‖∞ para cada t ∈ I. Assim, ‖ f ‖∞ + ‖g‖∞ é cota superior para os
valores de | f (t)| para t ∈ I. Como o supremo é a menor cota superior, deduzimos que:
‖ f + g‖∞ ≤ ‖ f ‖∞ + ‖g‖∞,
como querı́amos demonstrar.
Observação 2.3 (Vetores são funções e vice-versa) Comparando os dois últimos exemplos, vemos cla-
ramente como pode ser útil a analogia feita na Observação 2.2 entre vetores de Rd e funções. As duas provas
acima são essencialmente idênticas!
Normas `p: um argumento via convexidade
A estratégia de máximos nem sempre é fácil de se implementar, mas outros argumentos podem
funcionar. Vejamos um exemplo aqui.
Exemplo 2.5 Fixe um expoente 1 ≤ p < +∞. A norma `p sobre Rd é definida por:
|x|p :=
(
d
∑
i=1
|x[i]|p
) 1
p
(x ∈ Rd).
Há algumas razões pelas quais pode-se querer definir esta famı́lia geral de normas. Uma
delas é que normas codificam esparsidade aproximada. Isto é, um vetor de norma `p pequena tem
poucas coordenadas grandes e este efeito se acentua quando p é maior (veja o exercı́cio 2.13
abaixo).
Temos como missão provar que o Exemplo 2.5 de fato define uma norma. Para começar,
note que a candidata a norma é bem definida e que o caso p = 2 é precisamente o da norma
euclideana. A questão é se temos uma norma para um 1 ≤ p < +∞ arbitrário. Para responder
isso, precisamos checar que | · |p satisfaz os três axiomas de norma.
A prova de que | · |p é positiva-definida e homogênea positiva fica como um exercı́cio não
muito difı́cil para o leitor. A subaditividade pode ser provada de duas maneiras. No exercı́cio
2.16 abaixo, mostramos que | · |p é um supremo de produtos internos, o que nos permite usar a
estratégia do caso p = 2. Aqui apresentamos uma outra estratégia de prova, que se baseia na
ideia de convexidade.
A função “x 7→ xp” é crescente. Além disso, ela é convexa, isto é:
∀λ ∈ [0, 1] ∀t, s ≥ 0 : (λ t + (1− λ)s)p ≤ λ sp + (1− λ) sp. (2.3)
32
(Isto é consequência do fato que a a função é contı́nua e sua derivada segunda é positiva em todo
o ponto x > 0.)
Agora considere x, z ∈ Rd; queremos provar que |x+ z|p ≤ |x|p + |z|p. Se um dos dois vetores
se anula, esta desigualdade vale por inspeção. Portanto, suporemos a seguir que tanto x quanto
z não são nulos. Neste caso, podemos observar que, para cada coordenada i,
|(x + z)[i]|
|x|p + |z|p
=
|x[i] + z[i]|
|x|p + |z|p
≤ |x[i]|+ |z[i]||x|p + |z|p
= λ
|x[i]|
|x|p
+ (1− λ) |z[i]||z|p
,
onde
λ :=
|x|p
|x|p + |z|p
∈ [0, 1].
Usando que “x 7→ xp” é crescente e convexa, deduzimos:(
|(x + z)[i]|
|x|p + |z|p
)p
≤
(
λ
|x[i]|
|x|p
+ (1− λ) |z[i]||z|p
)p
≤ λ
(
|x[i]|
|x|p
)p
+ (1− λ)
(
|z[i]|
|z|p
)p
.
Isso vale para todo 1 ≤ i ≤ d. Somando sobre as coordenadas, obtemos:
d
∑
i=1
(
|(x + z)[i]|
|x|p + |z|p
)p
≤ λ
d
∑
i=1
(
|x[i]|
|x|p
)p
+ (1− λ)
d
∑
i=1
(
|z[i]|
|z|p
)p
.
Ou seja: ( |x + z|p
|x|p + |z|p
)p
≤ λ
|x|pp
|x|pp
+ (1− λ)
|z|pp
|z|pp
= 1.
Como a função “t ≥ 0 7→ t1/p” também é crescente, deduzimos que
|x + z|p
|x|p + |z|p
≤ 1,
como querı́amos demonstrar.
Exercı́cio 2.5 (Condições de igualdade para a subaditividade) Quando p > 1, a convexidade de
“x ≥ 0 7→ xp” é estrita: a derivada segunda desta função é positiva para todo x > 0. Uma consequência
disso é que desigualdade (2.3) é estrita sempre que t 6= s e 0 < λ < 1. Use este fato para mostrar que:
∀1 < p < +∞ ∀x, z ∈ Rd : |x + z|p = |x|p + |z|p ⇔ x = 0Rd , z = 0Rd ou
x
|x|p
=
z
|z|p
.
Ou seja, a norma só é aditiva quando um dos vetores se anula ou os dois têm as mesmas direção e sentido.
Esta propriedade não vale para quando d > 1 e p = 1, já que (por exemplo) |e1 + e2|1 = |e1|1 + |e2|1.
Normas baseadas em outras normas
O último exemplo que vemos de norma é fundamental para várias aplicações de Álgebra Linear.
Ela é uma norma “derivada” de outras “normas-base” e suas propriedades serão deduzidas das
normas base.
33
Exemplo 2.6 (Norma de operador em R`×d) Recorde do seu curso de Álgebra Linear que há uma
relação direta entre matrizes A ∈ R`×d e transformações lineares A : Rd → R` (usamos A duas ve-
zes por abuso de notação). De fato, dado x ∈ Rd, Ax ∈ R` é o vetor de coordenadas:
(Ax)[i] :=
d
∑
j=1
A[i, j] x[j], 1 ≤ i ≤ `.
A chamada norma de operador p2 → p1 sobre R`×d é definida da seguinte forma. Fixe expoentes
p2, p1 ∈ [1,+∞]. Definimos
‖A‖p2→p1 := sup
v∈Rd\{0}
|Av|p1
|v|p2
.
Normas como esta são muito importantes em Álgebra Linear Numérica. Um problema im-
portante é saber como diversos problemas envolvendo a matriz A se portam quando a matriz é
ligeiramente perturbada. Na maioria dos casos, tanto a formulação quanto a solução deste tipo
de problema tem a ver com normas de matrizes. O Exercı́cio 2.12 traz um exemplo disso.
Como podemos provar que ‖A‖p2→p1 é norma? Observe em primeiro lugar que, por lineari-
dade e homogeneidade positiva da norma,
|Av|p1
|v|p2
=
∣∣∣∣A v|v|p2
∣∣∣∣
p1
e v/|v|p2 tem norma 1. Portanto, podemos trocar o supremo na definição da norma de operador
por
‖A‖p2→p1 = sup
v∈Rd : |v|p2=1
|Av|p1 . (2.4)
Isso facilita um pouco a prova das propriedades de norma, que veremos a seguir.
Primeiramente, temos de mostrar que a norma é uma função bem-definida de R`×d em R.
Como o supremo é sempre unicamente definido como elemento de R ∪ {+∞}, o que nos resta
fazer é mostrar que o supremo na definição da (candidata a) norma é finito. Para isso, usaremos
a segunda fórmula, apresentada em (2.4) e algumas estimativas bastante “cruas”, mas válidas.
Veja que, em primeiro lugar, se v ∈ Rd tem norma |v|p2 = 1, todas as suas coordenadas estão
limitadas por 1 em valor absoluto. Desta forma, quando calculamos Av, cada coordenada do
vetor satisfaz:
|(Av)[i]| =
∣∣∣∣∣ d∑j=1 A[i, j]v[j]
∣∣∣∣∣ ≤ d∑j=1 |A[i, j]| |v[j]| ≤
d
∑
j=1
|A[i, j]| ≤ d M,
onde M := max1≤i≤`,1≤j≤d |A[i, j]| < +∞ (note que utilizamos a subaditividade da função
módulo sobre R!). Portanto, quando |v|p2 = 1, as coordenadas de Av são uniformememente
limitadas por dM, quantidade que não depende de v. Concluı́mos que:
∀v ∈ Rd : |v|p2 = 1⇒ |Av|
p1
p1 ≤ d
1+p1 Mp1 < +∞,
ou seja, |Av|p1 é limitada sobre os vetores de norma 1. Isto quer dizer que o supremo em (2.4) é
finito, como querı́amos demonstrar.
34
O próximo passo é mostrar que ‖ · ‖p2→p1 é positiva-definida. Como a norma é um supremo
de números não-negativos, ela certamente é não-negativa. Claramente a matriz 0R`×d tem norma
zero. Por outro lado, se ‖A‖p2→p1 = 0, isto quer dizer que, dado qualquer v ∈ Rd, |Av|p1 ≤ 0.
Como | · |p1 é positive definida, isso quer dizer que Av = 0R` para qualquer v ∈ Rd. Em
particular, se tomamos v = ei para cada um dos vetores da base canônica (com 1 ≤ i ≤ `), Aei é
o vetor cujas coordenadas são A[i, j]; logo, estas são a fortiori nulas. Concluı́mos: a hipótese de
que ‖A‖p2→p1 = 0 implica que A é a matriz nula.
A seguir, provamos que a norma é homogênea positiva. Para isso, usaremos o fato que | · |p1
tem esta propriedade e que, dados A ∈ R`×d e λ ∈ R,
∀v ∈ Rd : (λA)v = λ(Av).
De fato, isto é consequência da definição das operações envolvidas e nos permite concluir:
∀v ∈ Rd : |(λA)v|p1 = |λ(Av)|p1 = |λ| |Av|p1 .
Quando multiplicamos todos os elementos de um conjunto por |λ|, seu supremo é multiplicado
pelo mesmo valor. Desta forma,
‖λA‖p2→p1 = sup
v∈Rd, |v|p2=1
|(λA)v|p1
= sup
v∈Rd, |v|p2=1
|λ| |Av|p1
= |λ| sup
v∈Rd, |v|p2=1
|Av|p1
= |λ| ‖A‖p2→p1 .
Por fim, provaremos que a norma sobre matrizes é subaditiva. Se tomamos A, B ∈ R`×d e
v ∈ Rd, vemos que (A + B)v = Av + Bv por virtude das definições envolvidas. Portanto, para
qualquer vetor v ∈ Rd de norma 1,
|(A + B)v|p1 ≤ |Av|p1 + |Bv|p1 ≤ ‖A‖p2→p1 + ‖B‖p2→p1 .
Como a desigualdade vale para todo v de norma 1, o supremo do lado esquerdoé cotado pelo
lado direito, e obtemos:
‖A + B‖p2→p1 ≤ ‖A‖p2→p1 + ‖B‖p2→p1 .
Esta é a propriedade de subaditividade que querı́amos demonstrar.
2.3 Mais exercicios
Exercı́cio 2.6 Dado I ⊂ R compacto, considere o conjunto de todas as funções polinomiais de I
a R. Prove que este é um subespaço vetorial de C(I, R).
Exercı́cio 2.7 (Funções limitadas) Dado um conjunto qualquer I 6= ∅, chame de B(I, R) o con-
junto de todas as funções limitadas de I a R. Prove que este conjunto tem uma estrutura natural
de espaço vetorial e que a expressão
‖ f ‖∞ := sup
t∈I
| f (t)| ( f ∈ B(I, R))
35
define uma norma sobre B(I, R). Mostre ainda que, quando I ⊂ R é compacto, o espaço C(I, R)
definido acima é um subespaço de B(I, R).
Exercı́cio 2.8 (Submultiplicatividade da norma ‖ · ‖∞) Seguindo com a notação do exercı́cio an-
terior, mostre que o produto f g de dois elementos B(I, R) é um outro elemento de B(I, R) e que
‖ f g‖∞ ≤ ‖ f ‖∞ ‖g‖∞. Observe que o mesmo resultado vale para C(I, R).
Exercı́cio 2.9 (Submultiplicatividade da norma de operador) Considere matrizes A1 ∈ Rd1×d2 e
A2Rd2×d3 . Lembre-se que o produto de A1 e A2 é o elemento A1A2 ∈ Rd1×d3 com entradas
(A1A2)[i, j] :=
d2
∑
k=1
A1[i, k]A2[k, j] (1 ≤ i ≤ d1, 1 ≤ j ≤ d3).
Este produto é definido de modo que
∀v ∈ Rd1 : (A1A2) v = A1 (A2v).
Agora bote em cada Rdi uma norma `pi . Mostre que
‖A1A2‖p1→p3 ≤ ‖A1‖p2→p3 ‖A2‖p1→p2 .
Exercı́cio 2.10 Dada uma matriz A ∈ R`×d, sua transposta, denotada por AT, é a matriz em Rd×`
cujas entradas são definidas da seguinte forma:
AT[i, j] := A[j, i] (1 ≤ i ≤ d, 1 ≤ j ≤ `).
1. Prove que y.(Ax) = (ATy).x para quaisquer A ∈ R`×d, x ∈ Rd e y ∈ R`.
2. Mostre que ‖AT‖2→2 = ‖A‖2→2 para qualquer A ∈ R`×d.
Exercı́cio 2.11 Como já observado, podemos associar de modo natural o espaço de matrizes R`×d
com o espaço euclideano R` d. Isto nos permite definir uma norma correspondente à norma | · |2
sobre R`×d, que às vezes é chamada de norma de Frobenius:
‖A‖F :=
√√√√ `∑
i=1
d
∑
j=1
|A[i, j]|2 (A ∈ R`×d).
Outra norma natural é a versão da norma `∞ em R`×d: a magnitude da maior entrada.
‖A‖M := max
1≤i≤`
1≤j≤d
|A[i, j]| (A ∈ R`×d).
1. Mostre que ‖ · ‖M = ‖ · ‖1→∞.
2. Prove que as duas normas acima “sanduı́cham” a norma de operador ‖ · ‖2→2.
∀A ∈ R`×d : ‖A‖M ≤ ‖A‖2→2 ≤ ‖A‖F.
36
Exercı́cio 2.12 Chamamos de Id×d a matriz idendidade d× d, que tem 1 na diagonal e zeros em
todas as outras entradas. Uma matriz A ∈ Rd×d é dita inversı́vel se existe uma outra matriz
A−1 ∈ Rd×d tal que A A−1 = A−1 A = Id×d. Em cursos de Álgebra Linear, aprendemos que a
inversa existe e é única se e somente se o determinante de A não se anula.
Fixos dois expoentes p1, p2 ∈ [1,+∞], definimos:
σ−p1→p2(A) := infv∈Rd\{0
Rd}
|Av|p2 /|v|p1 .
1. Mostre que, se A é inversı́vel,
|A−1|p2→p1 =
1
σ−p1→p2(A)
; em particular, quando A é inversı́vel, σ−p1→p2(A) > 0.
2. Sabemos da Álgebra Linear que uma matriz quadrada é inversı́vel se e somente se o único
vetor v com Av = 0Rd é o vetor v = 0Rd . Use este fato para provar que uma A ∈ Rd×d é
inversı́vel se e somente se σ−p1→p2(A) > 0.
3. Prove que qualquer matriz B ∈ Rd×d com |A− B|p1→p2 < σ−p1→p2(A) é inversı́vel.
Observação: a quantidade
κ(A) := |A−1|2→2 |A|2→2
é chamada de número de condição da matriz A. Segue do primeiro item deste exercı́cio que ele é sempre
≥ 1. Quando o número de condição é muito grande, isto significa que o problema de se resolver um
sistema “Ax = b” é instável: pequenas alterações em b ou na matriz A podem levar a grandes mudanças
na solução. Por outro lado, o terceiro item acima implica que o número de condição não muda muito sob
pequenas perturbações de A. Mais informações sobre o número de condição estão disponı́veis no artigo
https: // en. wikipedia. org/ wiki/ Condition_ number .
Exercı́cio 2.13 Definimos acima as normas `p para 1 ≤ p ≤ +∞. No entanto, a função que leva
x ∈ Rd em |x|p também está bem definida quando 0 < p < 1.
1. Prove que | · |p para 0 < p < 1 não é subaditiva e portanto não é norma (dica: isso tem a ver
com concavidade estrita da função “t ≥ 0 7→ tp”).
2. Prove que, para qualquer x ∈ Rd, |x|0 := limp→0+ |x|
p
p é o número de coordenadas diferen-
tes de 0 de x.
3. Prove ainda que, dados quaisquer x ∈ Rd, t > 0 e p > 0,
#{1 ≤ i ≤ d : |x[i]| ≥ t} ≤
|x|pp
tp
.
Deste modo ter “norma `p pequena” quer dizer que poucas coordenadas são grandes.
Exercı́cio 2.14 Dados a ∈ Rd\{0} e ξ ∈ R, quando é verdade que o conjunto abaixo é um subespaço de
Rd?
Ha,ξ := {x ∈ Rd : a · x = ξ}.
37
https://en.wikipedia.org/wiki/Condition_number
Exercı́cio 2.15 Prove que, para qualquer x ∈ Rd e 1 ≤ p < +∞,
|x|∞ ≤ |x|p ≤ d1/p |x|∞ ≤ d1/p |x|2.
Deduza que |x|∞ = limp→+∞ |x|p para todo x ∈ Rd.
Exercı́cio 2.16 Apresentamos aqui uma forma alternativa de provar que as normas `p apresentadas no
Exemplo 2.5 são de fato normas. Como lá, definimos o expoente dual de p como q := p/(p− 1) quando
1 < p < +∞. Se p ∈ {1,+∞}, definimos q via um limite: portanto q = 1 se p = ∞ e q = ∞ se p = 1.
1. Nos próximos itens, mostraremos a relação de dualidade entre as normas `p e `q
Dualidade: ∀x ∈ Rd ∀p ∈ [1,+∞] : |x|p = sup{v · x : v ∈ Rd, |v|q = 1}.
Explique porque esta relação implica que a norma `p é de fato uma norma (ou seja, satisfaz os três
axiomas da definição).
2. Prove dualidade diretamente para p ∈ {1, ∞}.
3. A partir daqui supomos p ∈ (1,+∞). Mostre que a desigualdade entre as médias aritmética e
geométrica implica que
∀a, b ∈ R : ab ≤ |a|
p
p
+
|b|q
q
,
com igualdade se e somente se a, b têm o mesmo sinal e |a|p = |b|q.
4. Deduza do primeiro item que
∀x, y ∈ Rd\{0} : x · y|x|p |y|q
≤ 1
e obtenha a Desigualdade de Hölder x.y ≤ |x|p |y|q.
5. Cheque as condições de igualdade no item anterior para terminar a prova da dualidade. Mostre ainda
que, se x 6= 0Rd , o supremo na fórmula de dualidade só é atingido por um único vetor v.
Exercı́cio 2.17 Retorne ao exercı́cio 2.10 e use o resultado do exercı́cio 2.16 para mostrar que
‖AT‖p2→p1 = ‖A‖p1→p2 para quaisquer 1 ≤ p1, p2 ≤ +∞.
Exercı́cio 2.18 Considere o espaço C([a, b], R) com a < b reais. Dado 1 ≤ p < +∞, mostre que a
expressão:
‖ f ‖p :=
(∫ b
a
| f (t)|p dt
) 1
p
( f ∈ C([a, b], R))
define uma norma sobre C([a, b], R), para qualquer 1 ≤ p < +∞ fixo. Prove ainda uma versão
da desigualdade de Hölder para estas normas:
∀ f , g ∈ C([a, b], R) : ‖ f g‖1 ≤ ‖ f ‖p‖g‖q
onde q é o expoente dual de p definido no Exercı́cio 2.16. (Dica: este é mais um caso em que a
analogia contida na Observação 2.2 pode ser útil.)
38
Exercı́cio 2.19 Neste exercı́cio, apresentamos outras normas que “são subaditivas por motivos de conve-
xidade”. Considere uma função Ψ : [0,+∞)→ [0,+∞) com as seguintes propriedades:
• Ψ é crescente e convexa;
• Para todo x ∈ R+, Ψ(x) ≥ 0, com igualdade se e somente se x = 0;
• limx→+∞ Ψ(x) = +∞ e limx→0 Ψ(x) = 0.
Por exemplo, as funções definidas por Ψ1(x) := xp, Ψ2(x) := ex
p − 1 (com p ≥ 1 nos dois casos) e
Ψ3(x) = x (max{log x, 0}+ 1) têm as propriedades acima.
Prove que, dado d ∈N\{0}, a expressão:
‖x‖Ψ := inf
{
a > 0 :
d
∑
i=1
Ψ
(
|x[i]|
a
)
≤ 1
}
(x ∈ Rd)
define uma norma sobre Rd. Prove ainda que esta norma coincide com a norma `p usual no caso em que
Ψ1(x) = xp.
39
40
Capı́tulo 3
Espaços métricos, convergência e
completude
No capı́tulo anterior vimos vários espaços vetoriais V com suas respectivas normas ‖ · ‖. Isto nos
permite medir tamanhos de vetores e distância entre pontos v e v′.
Medir distâncias é bom porque nos permite tomar limites e fazer Análise. No entanto, é
muito fácil encontrar espaços em que se deseja fazer Análise e que não possuem a estrutura
linear de um espaço vetorial: ou seja, espaços em que tomar somas, diferenças ou produtos de
elementos não faz sentido. Por exemplo, a esfera d-dimensional e o conjunto de Cantor não têm
nada de “linear”, ainda que estejam ambos contidos em espaços vetoriais.No fim das contas, é bastante conveniente tomarmos um ponto de vista mais geral, baseado
apenas na noção de distância. Por isso estudaremos a partir daqui o conceito de espaço métrico.
Esta é a estrutura mı́nima que nos permite estender a Análise a que estamos acostumados, com
ε e δ, limites e tudo o mais. Todo espaço vetorial normado pode ser visto como espaço métrico,
mas a recı́proca não é verdadeira.
A classe de espaços métricos é a principal categoria de objetos que trataremos neste curso.
Ela é geral o suficiente para quase todos os nossos propósitos, mas ainda assim é tratável. Neste
capı́tulo veremos como ela é definida e como ela nos permite falar de convergência em conjuntos
muito gerais.
3.1 Espaços métricos
O que é, afinal, um espaço métrico? Eis a definição, devida a Fréchet.
Definição 3.1 Um espaço métrico é um conjunto X 6= ∅ munido de uma função d : X×X → [0,+∞),
chamada de métrica sobre X, com as seguintes propriedades.
1. d é não-negativa e separa pontos distintos: para quaisquer a, b ∈ X, d(a, b) = 0 se e somente
se a = b;
2. d é simétrica: para qualquer par (a, b) ∈ X× X, d(a, b) = d(b, a);
3. d satisfaz a desigualdade triangular: para quaisquer a, b, c ∈ X, d(a, b) ≤ d(a, c) + d(c, b).
41
Todas as propriedades de métrica acima têm uma interpretação intuitiva se pensamos em d
como uma noção de distância. A propriedade 1 diz que a distância de um lugar a ele mesmo é
nula, mas que qualquer outro lugar está a distância positiva. A segunda propriedade afirma que
ir de a a b não é mais fácil ou difı́cil que ir de b a a. A terceira propriedade afirma que ir de a
para c e depois para b não pode resultar em um caminho mais curto que a rota direta de a para
b. Apesar da clareza do que significam estas condições, veremos abaixo que nem todo espaço
métrico é fácil de se entender.
Veremos abaixo os principais exemplos de espaços métricos que serão recorrentes no curso.
Ocasionalmente usaremos a convenção de denotar por dX a métrica de X; isto será útil quando
tratarmos muitos espaços métricos de uma única vez.
3.1.1 A reta real como espaço métrico
Como primeiro exemplo, tomamos X = R com dR(a, b) := |a − b| ((a, b) ∈ R2). As duas
primeiras propriedades da definição de métrica são triviais. A terceira é consequência de “|x +
y| ≤ |x|+ |y|”aplicada a x = a− c e y = c− b. Em todas estas notas tomaremos esta métrica como a
métrica padrão sobre R, a não ser quando o contrário for dito.
3.1.2 Os números complexos como espaço métrico
O conjunto C é usualmente definido como o conjunto dos números da forma z := a + b
√
−1,
onde a = <(z) ∈ R é chamada de parte real de z, b = =(z) ∈ R é a parte imaginária, e
√
−1
– a unidade imaginária – é um número satisfazendo (
√
−1)2 = −1. Livros especializados em
Análise Complexa têm definições mais formais deste corpo. O ponto de mencioná-los aqui é
que C é basicamente R2 com uma estrutura de produto. Observamos ainda que a norma |z| é
multiplicativa: |zw| = |z| |w|.
3.1.3 A métrica discreta
Uma métrica relativamente trivial e “boba”pode ser definida sobre qualquer conjunto X 6= ∅: a
chamada métrica discreta.
ddisc(x, y) :=
{
1, x 6= y;
0, x = y.
Esta métrica é interessante por alguns (poucos) motivos. No momento só um deles nos interessa:
qualquer resultado que provarmos para todos os espaços métricos deverá valer para as métricas
discretas! Ou seja: se você quer entender um teorema, ou simplesmente testar se um enunciado
pode ser verdadeiro para todos os espaços métricos, estudá-lo no caso da métrica discreta é um
bom primeiro passo.
3.1.4 Espaços vetoriais: normas nos dão métricas
A maneira canônica de se definir uma métrica sobre um espaço normado é através da norma.
Proposição 3.1 Se (V, ‖ · ‖V) é um espaço normado, então a expressão
dV(a, b) := ‖a− b‖V (a, b ∈ V)
define uma métrica sobre V.
42
Prova: Sejam a, b, c ∈ Rd quaisquer. Nosso objetivo é provar que
• ‖a− b‖V ≥ 0, com igualdade se e somente se a = b;
• ‖a− b‖V = ‖b− a‖V ;
• ‖a− c‖V ≤ ‖a− b‖V + ‖b− c‖V .
Vamos escrever isto de outra forma. Defina x := a− b, y := b− c. Os itens acima são equivalentes
a:
• ‖x‖V ≥ 0, com igualdade se e somente se x = 0 (que vale porque a norma é positiva
definida).
• ‖x‖V = ‖ − x‖V (que segue da homogeneidade positiva da norma);
• ‖x + y‖V ≤ ‖x‖V + ‖y‖V (que vem da sub-aditividade).
2
Portanto, as normas que pusemos em Rd, C(I, R), etc todas induzem métricas. Como veremos
na seção seguinte, elas também induzem métricas sobre subconjuntos destes espaços que não são
necessariamente espaços vetoriais. Por exemplo, a norma euclidiana em Rd induz uma métrica
na esfera unitária:
Sd−1 := {x ∈ Rd : |x|2 = 1.}
3.1.5 Métricas induzidas
Se temos um espaço métrico (X, dX), qualquer subconjunto Y ⊂ X, Y 6= ∅ herda a métrica:
dY(y, y′) := dX(y, y′) ((y, y′) ∈ Y2).
Ou seja, dY = dX |Y×Y é obtida restringindo a função dX : X × X → [0,+∞) ao conjunto Y × Y.
Chamamos esta métrica de induzida. Por exemplo, a esfera unitária Sd−1 ⊂ Rd e o conjunto
Qd ⊂ Rd dos vetores com coordenadas racionais têm métricas induzidas pelas métricas naturais
sobre os espaços ambientes.
3.2 Sequências, limites e completude
O leitor deve lembrar que uma sequência de elementos em X, escrita {xn}n∈N ⊂ X, é tão somente
uma maneira de escrever uma função f : N→ X, de modo que xn = f (n) para cada n ∈N.
Tomamos como dado que o leitor já sabe o que é convergência de uma sequência em R, mas
lembramos a definição mesmo assim. Dados {xn}n∈N ⊂ R e x ∈ R, dizemos que xn → x, ou
limn∈N xn = x, ou ainda que xn converge a x, se
∀ε > 0 ∃n0(ε) ∈N ∀n ∈N : n ≥ n0(ε)⇒ |xn − x| < ε.
A noção de convergência em um espaço métrico é derivada desta.
43
Definição 3.2 Fixo um espaço métrico (X, dX), dizemos que uma sequência {xn}n∈N ⊂ X converge a
x ∈ X (segundo a métrica dX) se a sequência {dX(xn, x)}n∈N ⊂ R converge a 0, no sentido do parágrafo
anterior. Dito de outro modo: xn → x se
∀ε > 0 ∃ n0(ε) ∈N ∀n ∈N : n ≥ n0(ε)⇒ |dX(xn, x)− 0| = dX(xn, x) < ε.
Esta segunda forma de definir as coisas mostra que as duas noções de convergência coincidem
no caso de X = R com a métrica usual. Podemos mostrar facilmente que, como no caso de
números, trocar < ε por ≤ ε na segunda definição não muda nada. Além disso:
Proposição 3.2 (Unicidade do limite) Dados x, x′ ∈ X e uma sequência {xn}n∈N ⊂ X, se xn → x e
xn → x′, então x = x′.
Prova: Pelos axiomas de métrica, para provarmos que x = x′, basta mostrarmos que dX(x, x′) =
0. Pela desigualdade triangular, temos a seguinte desigualdade para cada n ∈N:
0 ≤ dX(x, x′) ≤ dX(x, xn) + dX(xn, x′).
Por hipótese, dX(x, xn)→ 0 e dX(x′, xn)→ 0 no sentido usual de R. Como “o limite da soma é a
soma dos limites”, temos:
lim
n∈N
(dX(x, xn) + dX(xn, x′)) = lim
n∈N
dX(x, xn) + lim
n∈N
dX(xn, x′) = 0.
Portanto, a distância dX(x, x′) está “sanduichada” entre a sequência constante 0 e uma outra
sequência que vai a 0. Deduzimos que dX(x, x′) = 0, como querı́amos demonstrar. 2
Um ponto importante é que, como veremos abaixo, a convergência ou não de uma sequência
depende da métrica escolhida. Ainda assim, na maior parte dos casos nós falaremos de con-
vergência sem mencionar a métrica.
Exercı́cio 3.1 Considere um espaço vetorial normado (V, ‖ · ‖V) com a métrica induzida pela norma. Se
{vn}n∈N ⊂ V e v ∈ V são dados, mostre que
vn → v⇔ vn − v→ 0V .
Vamos agora definir o que é uma sequência de Cauchy em um espaço métrico e o que é um
espaço métrico completo.
Definição 3.3 Fixo um espaço métrico (X, dX), dizemos que uma sequência {xn}n∈N ⊂ X é de Cauchy
se
lim
m,n→+∞
dX(xn, xm) = 0,
isto é,
∀ε > 0 ∃ n0(ε) ∈N ∀m, n ∈N : m, n ≥ n0(ε)⇒ dX(xn, xm) < ε.
(X, dX) é dito completo se toda sequência de Cauchy {xn}n∈N ⊂ X converge a algum x ∈ X.
A mesma prova conhecida de R de que toda sequência convergente é Cauchy vale paraespaços métricos gerais. Observe, no entanto, que nem todo espaço métrico é de Cauchy. Por
exemplo, (R, dR) é completo, mas Q com a métrica induzida não é completo. Veremos a seguir
vários exemplos naturais de espaços métricos que são completos e (com menos destaque) alguns
outros que não são. Antes, uma definição fundamental.
Definição 3.4 Um espaço vetorial normado (V, ‖ · ‖V) que é completo com a distância induzida pela
norma ‖ · ‖V é dito espaço de Banach.
44
3.2.1 Subsequências
Em vários momentos do texto, seremos forçados a falar de subsequências, definidas abaixo.
Definição 3.5 Considere um subconjunto infinito N ⊂ N. Dada uma sequência {xn}n∈N num espaço
métrico (X, dX), chamamos de subsequência {xn}n∈N (com ı́ndices em N) a sequência {yj}j∈N definida da
seguinte maneira: se n1 < n2 < . . . é a única enumeração crescente dos elementos de N, então yj := xnj
para cada j ∈ N. Normalmente escreveremos xnj ao invés de yj. Chamamos de limn∈N xn ou limj∈N xnj
o limite de yj (caso exista).
Ainda não teremos muito motivo para olhar subsequências nesta altura do texto, mas em
breve isto ocorrerá. Em geral a motivação para se definir uma subsequência é a seguinte. Preci-
samos de uma sequência com propriedades ”boas”. Isso pode ser difı́cil de se obte diretamente.
Talvez consigamos apenas uma sequência preliminar, que é ”parcialmente boa”, ou ”quase boa”.
Quando isso ocorre, é às vezes possı́vel obter a sequência desejada passando a uma subsequência
da sequência preliminar. De fato, veremos o primeiro exemplo disso já na próxima subseção.
Exercı́cio 3.2 Mostre que uma subsequência {xn}n∈N como a definida acima converge a x ∈ X se e
somente se:
∀ε > 0 ∃n0(ε) ∈ N ∀n ∈ N : n ≥ n0(ε)⇒ dX(xn, x) ≤ ε.
É conveniente enunciarmos de uma vez duas proposições muito úteis. A primeira diz que, ao
passarmos para uma subsequência, não ”estragamos”uma eventual convergência da sequência
original.
Proposição 3.3 Considere uma sequência {xn}n∈N num espaço métrico (X, dX). Se xn converge a um
limite x ∈ X, então qualquer subsequência converge ao mesmo x.
Prova: Tome {xn}n∈N e x ∈ X como acima. O fato que xn → x quer dizer que:
(?) ∀ε > 0 ∃n0(ε) ∈N ∀n ∈N : n ≥ n0(ε)⇒ dX(xn, x) ≤ ε.
Agora considere N ⊂N infinito. Queremos mostrar que limn∈N xn = x. Considerando xnj como
na definição de subsequência, precisamos provar que, dado um ε > 0,
queremos : ∃j0(ε) ∈N ∀j ∈N : j ≥ j0(ε)⇒ dX(xnj , x) ≤ ε.
Mas isso é simples. Como N := {n1 < n2 < n3 < . . . } é conjunto infinito, podemos escolher
j0(ε) com nj0(ε) ≥ n0(ε) (ver (?)). Deste modo, garantimos que nj ≥ n0(ε) para todo j ≥ j0(ε), de
modo a garantir dX(xnj , x) ≤ ε. 2
No próximo problema, veremos como podemos usar subsequências para garantir a con-
vergência de uma sequência inteira.
Proposição 3.4 Considere uma sequência de Cauchy {xn}n∈N num espaço métrico (X, dX) que tem uma
subsequência convergente. Então {xn}n∈N converge ao mesmo limite da sequência inteira.
45
Prova: Sejam x ∈ X o limite da subsequência e N ⊂ N o seu conjunto (infinito) de ı́ndices.
Como {xn}n∈N é Cauchy, dado ε > 0, podemos encontrar n0(ε) ∈ N tal que dX(xn, xm) ≤ ε
para n, m ≥ n0(ε). Ao mesmo tempo, como N é infinito, sabemos que existem infinitos ı́ndices
k ∈≥ n0(ε) com k ∈ N. Tomando um destes ı́ndices, vemos que:
∀n ≥ n0(ε) : dX(xn, x) ≤ dX(xn, xk) + dX(xk, x) ≤ ε + dX(xk, x).
Se agora mandamos k→ +∞ com k ∈ N, temos dX(xk, x)→ 0 e portanto:
∀n ≥ n0(ε) : dX(xn, x) ≤ ε.
Ou seja, o mesmo n0(ε) que vem da ”Cauchyaniedade” da sequência {xn}n se adequa à definição
de limite. 2
3.2.2 Convergência em Rd com as normas `p
Recorde o Exercı́cio 2.15 acima, onde apresentamos as normas `p, 1 ≤ p ≤ ∞, sobre Rd. Observe
que, para qualquer uma destas normas,
∀p ∈ [1,+∞), ∀x ∈ Rd : |x|∞ ≤ |x|p ≤ d1/p |x|∞.
Usamos este fato a seguir para obter o seguinte resultado.
Teorema 3.1 Dada uma sequência arbitrária {xn}n∈N ⊂ Rd:
1. se x ∈ Rd, xn → x de acordo com uma das normas `p acima se e somente se xn[i]→ x[i] para cada
uma das coordenadas i = 1, 2, . . . , d;
2. {xn}n∈N é Cauchy de acordo com uma das normas `p acima se e somente se cada uma das sequências
de coordenadas {xn[i]}n∈N ⊂ R, com i = 1, 2 . . . , d, é Cauchy.
Segue que (Rd, | · |p) é Banach: toda sequência em Rd que é Cauchy de acordo com a norma `p converge a
um limite em Rd.
Prova: Começamos com o primeiro item. Tome uma sequência {xn}n∈N ⊂ Rd e um x ∈ Rd.
Lembre-se do Exercı́cio 3.1 e veja que xn →`p x se e somente se xn − x →`p 0Rd . Pela observação
antes da prova relacionando as normas `p, deduzimos que:
xn →`p x ⇔ |x− xn|p → 0⇔ |x− xn|∞ → 0⇔ max1≤i≤d
|x[i]− xn[i]| = 0,
onde a última implicação é a definição da norma | · |∞.
Agora observe que, para cada j ∈ {1, . . . , d}, {|x[j]− xn[j]|}n∈N é uma sequência de números
reais maiores ou iguais a 0. Portanto,
0 ≤ |x[j]− xn[j]| ≤ max
1≤i≤d
|x[i]− xn[i]|.
Por um argumento de sanduı́che, vemos que, se max1≤i≤d |x[i]− xn[i]| → 0, então |x[j]− xn[j]| →
0, e portanto xn[j] → x[j], para cada j ∈ {1, . . . , d}. Por outro lado, se cada uma das sequências
46
{xn[j]}n∈N converge a x[j], temos que {|x[j]− xn[j]|}n∈N converge a 0 para cada j e o máximo
dessas sequências converge a 0 (um resultado de Análise na Reta!). Concluı́mos:
max
1≤i≤d
|x[i]− xn[i]| = 0⇔ ∀j ∈ {1, 2, . . . , d} : xn[j]→ x[j].
Combinando isso com as implicações anteiores, cumprimos com o item 1.
Para o segundo item, seguimos raciocı́nio parecido por isso, vamos mais rápido. Novamente
Vemos que:
|xn − xm|p
n,m→+∞−→ 0⇔ |xn − xm|∞
n,m→+∞−→ 0⇔ max
1≤j≤d
|xn[j]− xm[j]|
n,m→+∞−→ 0.
Do mesmo modo que acima, observamos que o máximo max1≤j≤d |xn[j]− xm[j]| converge a 0 se
e somente se |xn[j]− xm[j]| converge a 0 para cada coordenada j ∈ {1, 2, . . . , d}:
max
1≤j≤d
|xn[j]− xm[j]|
n,m→+∞−→ 0⇔ ∀ 1 ≤ j ≤ d : |xn[j]− xm[j]|
n,m→+∞−→ 0.
Assim,
|xn − xm|p
n,m→+∞−→ 0⇔ ∀ 1 ≤ j ≤ d : |xn[j]− xm[j]|
n,m→+∞−→ 0,
o que é a tradução em sı́mbolos matemáticos do item 2 do teorema.
Para terminar, provaremos que (Rd, | · |p) é completo. Para isso, tomamos uma sequência de
Cauchy {xn}n∈N ⊂ Rd arbitrária. Pelo item 2, cada sequência das coordenadas {xn[i]}n∈N ⊂ R
é Cauchy. Como R é completo, isto quer dizer que:
∀i ∈ {1, . . . , d} : ∃ lim
n→+∞
xn[i].
Agora defina x ∈ Rd como o vetor de coordenadas x[i] := limn→+∞ xn[i] (1 ≤ i ≤ d). Com esta
definição, garantimos que as coordenadas de xn convergem para as coordenadas de x e portanto
xn →`p x. Desta forma, provamos que a sequência de Cauchy {xn}n∈N ⊂ Rd (uma sequência de
Cauchy arbitrária em Rd) tem limite x ∈ Rd. 2
Fazemos uma pausa aqui para mostrar um fato importante, que será usado muitas vezes no
texto. Ele é um prelúdio para o assunto de compacidade, que será discutido mais adiante no
texto.
Proposição 3.5 (Sequências limitadas têm subsequências convergentes) Suponha que {xn}n∈N ⊂
Rd é uma sequência limitada, isto é, que supn∈N |xn|2 < +∞. Então existe uma subsequência {xnj}j∈N
convergente.
Prova: Vamos provar isso por indução na dimensão d ∈ N\{0}. O caso base é d = 1 é um
teorema conhecido de Análise na Reta.
Para o passo indutivo, suponha que o teorema é verdade para dimensão d− 1. Tome agora
{xn}n∈N ⊂ Rd limitada e chame de yn as projeções dos xn a Rd−1.
yn ∈ Rd−1 é o vetor com yn[i] = xn[i] para i ∈ [d− 1] (n ∈N).
47
Para cada n ∈ N, podemos usar o fato de que xn[d]2 ≥ 0 e
√
· é função crescente para observar
que:
|yn|2 =
√√√√d−1∑
i=1
|yn[i]|2 =
√√√√d−1∑
i=1
|xn[i]|2 ≤
√√√√ d∑
i=1
|xn[i]|2 = |xn|2.
Por esta razão, a sequência {yn}n∈N é limitada: supn∈N |yn|2 ≤ supn∈N |xn|2 < +∞. Por hipótese
de indução, podemos encontrar um subconjunto infinito Nd−1 ⊂ N tal que limn∈Nd−1 yn = y ∈
Rd−1. Como visto acima, isto quer dizer que
∀i ∈ [d− 1] : lim
n∈Nd−1
xn[i] = lim
n∈Nd−1
yn[i] = y[i].
Agora considere {xn[d]}n∈Nd−1 ⊂ R. Esta é uma sequência limitada de númerosreais, pois afinal:
sup
n
|xn[d]| ≤ sup
n
|xn|2 < +∞.
Por Análise na Reta, sabemos que existe um Nd ⊂ Nd−1 infinito tal que:
∃ lim
n∈Nd
xn[d] = z ∈ R.
Pela Proposição 3.3, sabemos que essa passagem a uma subsequência não estraga a convergência
das outras coordenadas, que havia sido garantida antes. Isto é, agora sabemos que:
∀i ∈ [d] : ∃ lim
n∈Nd−1
xn[i],
o que, como visto acima, é a mesma coisa que dizer que {xn}n∈N converge. 2
3.2.3 Convergência sob a métrica discreta
Vamos deixar este caso como um exercı́cio.
Exercı́cio 3.3 Considere um espaço (X, dX) com a métrica discreta. Dada {xn}n∈N ⊂ X, mostre que
xn → x ∈ X se e somente se existe um n0 ∈ N tal que xn = x para todo n ≥ n0. Prove ainda que
{xn}n∈N é Cauchy se e somente se existe um n0 ∈N tal que xn = xn0 para todo n ≥ n0.
3.2.4 Convergência em C(I, R)
Aqui I = [a, b] ⊂ R é um intervalo, C(I, R) é o espaço de funções contı́nuas de I em R e a norma
usada é a norma ∞:
‖ f ‖I,∞ := sup
t∈I
| f (t)|.
Vamos primeiro tentar entender do que estamos falando aqui. Vamos considerar em primeiro
lugar o que quer dizer fn → f nesta métrica. Como ‖ fn − f ‖I,∞ é um supremo, e além disso este
supremo é atingido, temos que
‖ fn − f ‖I,∞ → 0⇔ ∀ε > 0 ∃n0 = n0(ε) ∈N ∀n ≥ n0 ∀t ∈ T : | fn(t)− f (t)| < ε.
48
Esta é a chamada convergência uniforme em t ∈ I, ou simplesmente uniforme. Esta convergência
implica a chamada convergência pontual, que ocorre quando fn(x) → f (x) para cada x ∈ I. Isto
equivale a pedir que:
∀ε > 0 ∀t ∈ I ∃n0 = n0(ε, t) ∀n ≥ n0 : | fn(t)− f (t)| < ε.
Veja que, neste caso, o ı́ndice n0 a partir do qual a distância fica menor que ε depende tanto de
ε quanto do ponto t. Por outro lado, a convergência uniforme pede que seja achado, para cada
ε > 0, um n0 tal que | fn(t)− f (t)| < ε para qualquer t ∈ I, sempre que n ≥ n0. Ou seja, a escolha
de n0 deve ser uniforme em t.
Os exemplos abaixo nos mostram duas coisas. A primeira é que o limite pontual de funções
contı́nuas pode não ser uma função contı́nua.
Exemplo 3.1 Considere I = [0, 1] e fn(x) = xn, x ∈ I. O limite pontual das fn é f com f (1) = 1 e
f (x) = 0 para 0 ≤ x < 1.
No próximo exemplo, veremos que a convergência pontual a um limite contı́nuo não implica
convergência uniforme.
Exemplo 3.2 Considere C([0, 1], R) com a norma do sup. Existe uma sequência { fn}n∈N ⊂ C([0, 1], R)
de funções com ‖ fn‖[0,1],∞ = 1, mas fn(x)→ 0 para todo x ∈ [0, 1]..
A sequência { fn}n∈N para n > 0 é feita de ”tendas”. A fn é uma ”tenda”de altura 1 plantada
no intervalo (1/(n + 1), 1/n). Mais precisamente, fn será igual a 0 fora do intervalo (1/(n +
1), 1/n) e será um ”V invertido”dentro do intervalo.
Apresentamos agora a fórmula. Considere a função contı́nua Ψ : R→ R dada por:
Ψ(t) :=

0, t ≤ 0;
2t, 0 ≤ t ≤ 12 ;
1− 2
(
t− 12
)
, 12 ≤ t ≤ 1;
0, t ≥ 1.
(t ∈ R).
É um exercı́cio provar que Ψ é de fato contı́nua, que 0 ≤ Ψ ≤ 1 e que Ψ(1/2) = 1. Agora defina
f0 ≡ 0 e, para n > 0:
fn(t) := Ψ
(
1
an
(
t− 1
n + 1
))
(t ∈ [0, 1]),
onde
an :=
1
n
− 1
n + 1
=
1
n(n + 1)
é o comprimento do intervalo (1/(n + 1), 1/n).
Exercı́cio 3.4 Prove que cada fn com n > 0 vale 0 fora do intervalo (1/(n + 1), 1/n) e vale 1 no ponto
médio deste intervalo. Deduza disso as propriedades enunciadas acima.
Por outro lado, nosso principal teorema nesta seção pode ser resumido dizendo-se que o limite
uniforme de funções contı́nuas é uma função contı́nua.
49
Teorema 3.2 C(I, R) é completo com a métrica induzida pela norma ‖ · ‖I,∞. Ou seja, uma sequência de
funções contı́nuas sobre I = [a, b] que converge uniformemente tem como limite uma função contı́nua.
Prova: Tomemos { fn}n∈N ⊂ C(I, R) que é de Cauchy, ou seja, tal que ‖ fn − fm‖I,∞ → 0 quando
n, m → +∞. Desejamos mostrar que existe uma função f ∈ C(I, R) tal que ‖ fn − f ‖I,∞ → 0.
Antes de entrar na prova, fazemos alguns comentários que serão úteis para entender o que
veremos a seguir.
Ideias gerais da prova
A dificuldade desta prova é que não sabemos de antemão como encontrar uma f candidata a
limite uniforme da sequência. Se tivéssemos essa f , só terı́amos que checar que esta f é mesmo
o limite. Como não temos, vamos primeiro construir a função f e depois provar que ela é o
limite que buscamos. Para isso, uma etapa fundamental será mostrar que as { fn}n∈N convergem
pontualmente a uma certa função f (passo 1). Para isso, mostraremos que, dado qualquer ∀t ∈ I,
{ fn(t)}n∈N é uma sequência de Cauchy em R.
Como convergência uniforme implica convergência pontual, sabemos que, se as fn conver-
gem, o limite tem mesmo de ser f . Por isso, a etapa seguinte da prova será mostrar que fn e f
estão uniformemente próximas para f grande (passo 2). A dificuldade aqui é que temos um ”limite
duplo” que tem de ser tomado com cuidado. Como último passo, mostraremos que f ∈ C(I, R),
ou seja, o limite uniforme de funções contı́nuas é função contı́nua (passo 3). Assim concluiremos a
prova.
Passo 1: existe uma f : I → R tal que fn(x)→ f (x) para cada x ∈ I.
Este é o passo da prova em que mostramos que as as fn convergem pontualmente a uma certa
f , que será a nossa candidata a limite uniforme da sequência fn.
Para provar a convergência pontual, usaremos o fato de que R é completo, ou seja, sequências
de Cauchy em R convergem. Por conta disto, temos
∀x ∈ I : | fn(x)− fm(x)| ≤ sup
t∈I
| fn(t)− fm(t)| = ‖ fn − fm‖I,∞
(n,m→+∞)→ 0. (3.1)
Ou seja,
∀x ∈ I : | fn(x)− fm(x)| → 0 quando n, m→ +∞,
o que quer dizer que { fn(x)}n ⊂ R é Cauchy, como querı́amos demonstrar. Isto quer dizer que
∃ f (x) := limn fn(x) para cada x ∈ I, o que define uma função f : I → R.
Passo 2: Proximidade entre fn e f .
O raciocı́nio por detrás de (3.1) nos diz que, para todo x ∈ I
| fn(x)− f (x)| = lim
m→+∞
| fn(x)− fm(x)|
≤ lim sup
m
‖ fn − fm‖I,∞
≤ sup
m≥n
‖ fn − fm‖I,∞.
50
Observe que o lado direito desta cadeia de desigualdades não depende de x e é uma cota superior
para todo x. Tomando o supremo, descobrimos que
‖ fn − f ‖I,∞ = sup
x∈I
| fn(x)− f (x)| ≤ sup
m≥n
‖ fn − fm‖I,∞.
Recordamos mais uma vez que { fn}n∈N ⊂ C(I, R) é Cauchy. Isto quer dizer que, dado ε > 0,
podemos encontrar n0(ε) tal que, se n, m ≥ n0(ε), então ‖ fn − fm‖I,∞ < ε. Tomando o sup em m,
vemos que
∃n0(ε) ∈N, ∀n ≥ n0(ε) : 0 ≤ ‖ fn − f ‖I,∞ = sup
x∈I
| fn(x)− f (x)| ≤ ε.
Como isto vale para todo ε, deduzimos que ‖ fn − f ‖I,∞ → 0, como querı́amos demonstrar.
Passo 3: f é contı́nua e o fim da prova.
Falta apenas um detalhe, que é provar que f ∈ C(I, R), ou seja, que f é contı́nua (ou: o
limite uniforme de funções contı́nuas é uma função contı́nua). Isto vale se e somente se para
toda sequência convergente {xj}j∈N ⊂ I e todo x ∈ I, xj → x ⇒ f (xj) → f (x). Para fazer isto,
basta provar que:
(Basta provar) ∀ε > 0 : lim sup
j
| f (xj)− f (x)| ≤ 0.
Para prova esta última desigualdade, observe que, pela desigualdade triangular:
| f (xj)− f (x)| = | f (xj)− fn(xj) + fn(xj)− fn(x) + fn(x)− f (x)|
≤ | f (xj)− fn(xj)|+ | fn(xj)− fn(x)|+ | fn(x)− f (x)|
O primeiro e o terceiro termo nesta última expressão são da forma | f (t) − fn(t)| com t ∈ I,
sendo, portanto cotados pelo supremo de | f (t)− fn(t)| sobre t ∈ I, que por sua vez é exatamente
‖ f − fn‖I,∞. Ou seja,
| f (xj)− f (x)| ≤ | fn(xj)− fn(x)|+ 2 ‖ fn − f ‖I,∞.
Esta desigualdade vale para cada j e n. Em particular, podemos tomar j → +∞: a continuidade
de fn nos garante que | fn(xj)− fn(x)| → 0 e portanto,
∀n ∈N : lim sup
j∈N
| f (xj)− f (x)| ≤ 2‖ fn − f ‖I,∞.
Por fim, mandando n → +∞, vemos que ‖ fn − f ‖I,∞ → 0 enquanto o lado esquerdo não muda.
Deduzimos:
lim sup
j∈N
| f (xj)− f (x)| ≤ 0,
o que significa | f (xj)− f (x)| → 0, como querı́amos demonstrar.
Feito isso, apenas verificamos que temos todos os ingredientes em nossas mãos. Partindo de
{ fn}n∈N ⊂ C(I, R) Cauchy, construı́mos uma f ∈ C(I, R) tal que fn → f segundo a norma que
escolhemos para C(I, R). 2
51
3.3 Equivalência de métricase normas
Na seção anterior nós vimos como descrever a convergência em alguns espaços onde isso não
é completamente óbvio à primeira vista. Um ponto importante de se enfatizar é que em vários
casos mostramos que definições diferentes de métrica ou norma conduziram a uma única noção
de convergência. Isto é um ponto importante, que merece uma definição.
Definição 3.6 Considere um conjunto X 6= ∅ e duas métricas d1, d2 definidas sobre ele. Dizemos que as
duas métricas são equivalentes se
∀{xn}n∈N ⊂ X, ∀x ∈ X : d1(xn, x)→ 0⇔ d2(xn, x)→ 0.
Quando X é um espaço vetorial e as duas distâncias são induzidas por normas ‖ · ‖1, ‖ · ‖2, dizemos que
as duas normas são equivalentes quando as métricas induzidas são equivalentes de acordo com a definição
acima.
Por exemplo, a Seção 3.2.2 mostra que as métricas induzidas pelas normas `p sobre Rd são
todas equivalentes. Agora apresentamos um caso de não-equivalência de normas (e métricas).
Exemplo 3.3 Vamos mostrar que duas normas que vimos acima sobre C([0, 1], R) não são equivalentes.
A primeira é a nossa “norma preferencial”:
‖ f ‖∞ := sup
t∈[0,1]
| f (t)|
e a segunda também é natural (e foi definida no Exercı́cio 2.18):
‖ f ‖1 :=
∫ 1
0
| f (t)| dt.
Como | f (t)| ≤ ‖ f ‖∞ para cada t ∈ [0, 1], vemos facilmente que ‖ f ‖1 ≤ ‖ f ‖∞ para toda f ∈
C([0, 1], R). Disto podemos facilmente deduzir que
‖ fn − f ‖∞ → 0⇒ ‖ fn − f ‖1 → 0.
A recı́proca, no entanto, não é verdadeira. Considere por exemplo a sequência de funções
{ fn}n∈N definidas da seguinte forma:
fn(t) :=
{
0, t ≤ 1− 1n
nt− n + 1, 1− 1n < t ≤ 1.
O leitor pode checar que fn ∈ C([0, 1], R) é não negativa e que
‖ fn‖1 =
∫ 1
0
fn(t) dt =
1
2n
.
Portanto ‖ fn − 0‖1 → 0. No entanto, para todo n
‖ fn‖∞ = fn(1) = 1 6→ 0,
o que nos diz que fn 6→ 0 de acordo com a norma ‖ · ‖∞.
52
Exercı́cio 3.5 Estenda as considerações acima às demais normas ‖ · ‖p (com 1 ≤ p < +∞) apresentadas
no Exercı́cio 2.18.
Em resumo, as normas ‖ · ‖1 e ‖ · ‖∞ sobre C não são equivalentes porque há vetores com
norma ‖ · ‖∞ “grande” (igual a 1) e norma ‖ · ‖1 “arbitrariamente pequena” (próxima de 0). O
teorema a seguir e a sua prova mostram que isto é geral: duas normas são equivalentes se a
razão delas (quando definida) nunca está nem muito perto de zero, nem de infinito.
Teorema 3.3 Duas normas ‖ · ‖1 e ‖ · ‖2 sobre o mesmo espaço vetorial V são equivalentes se e somente
se existem constantes C, c > 0 tais que
∀v ∈ V : c ‖v‖1 ≤ ‖v‖2 ≤ C ‖v‖1.
Prova: Deixamos como exercı́cio provar que, se tais constantes existem, as métricas são equiva-
lentes. Vejamos agora que, se as normas são equivalentes, então existem constantes C, c > 0
com as propriedades desejadas. Recorde que a equivalência das normas é a mesma coisa que a
equivalência das métricas induzidas pelas normas. Portanto, nossa hipótese é que
Hip: ∀{vn}n∈N ⊂ V ∀v ∈ V : ‖vn − v‖1 → 0⇔ ‖vn − v‖2 → 0.
Em particular, vale o que escrevemos acima quando v = 0.
Hip’: ∀{vn}n∈N ⊂ V : ‖vn‖1 → 0⇔ ‖vn‖2 → 0.
Agora suporemos para chegar a uma contradição que não existe a constante C apontada acima. Ou
seja
(?) ∀C > 0 ∃vC ∈ V : ‖vC‖2 > C ‖vC‖1.
Em particular, podemos encontrar um vetor vn ∈ V com ‖vn‖2 > (n+ 1) ‖vn‖1, para cada n ∈N.
Note que tal vetor não pode ser 0 porque neste caso terı́amos ‖vn‖2 = (n + 1) ‖vn‖1. Portanto,
podemos (se necessário) substituir cada vetor vn por vn/(n + 1)‖vn‖1 e deduzir que
(?) ⇒ ∃{vn}n∈N ⊂ V ∀n ∈N : ‖vn‖1 =
1
n + 1
e ‖vn‖2 > (n + 1) ‖vn‖1 = 1.
No entanto, isto contradiz Hip’: afinal, ‖vn‖1 → 0 e ‖vn‖2 6→ 0. Isto quer dizer que (?) nos levou
a uma contradição, o que implica que existe, sim, a constante C que querı́amos encontrar. Uma
prova semelhante mostra que a c > 0 desejada também existe. 2
3.4 Mais exercı́cios
Exercı́cio 3.6 Seja (X, dX) um espaço métrico. Considere:
d′X(x, x
′) := min{dX(x, x′), 1}.
Prove que esta é outra métrica sobre X e que ela é equivalente à métrica original.
Exercı́cio 3.7 Defina
φ(t) :=
t
1 + |t| (t ∈ R).
53
1. Prove que φ é uma bijeção estritamente crescente e contı́nua entre R e (−1, 1). Obs: por um
resultado de Análise na Reta, que você pode usar abaixo, o item 1 implica que φ−1 : (−1, 1) → R
também é uma bijeção estritamente crescente e contı́nua.
2. Defina:
d(t, s) := |φ(t)− φ(s)| ((t, s) ∈ R2).
Mostre que d é uma métrica sobre R e que esta métrica é equivalente à usual.
3. Prove que a sequência {n}n∈N é Cauchy segundo d, mas não converge. Portanto, (R, d)
não é completo (isso mostra que duas métricas podem ser equivalentes e ainda assim “dis-
cordar” no que diz respeito a completude).
Exercı́cio 3.8 (Métricas em grafos) Um grafo é um par G = (V,∼) onde V 6= ∅ é um conjunto
de elementos chamados vértices e “∼” é uma relação simétrica sobre pares de elementos de V:
dados x, y ∈ V, x ∼ y se e somente se y ∼ x (pares xy com x ∼ y são chamados de arestas do
grafo).
Dado um grafo G como acima, definimos novas relações “↔k” entre vértices para cada k ∈N,
da seguinte forma:
• Para k = 0, y↔0 x se e somente se y = x;
• Dado k > 0, y↔k x se existe um vértice z ∈ V com y ∼ z e z↔ x.
Suponha agora que G é conexo: isto é, dados x, y ∈ V, existe um k ∈ N com x ↔k y. Prove que a
expressão abaixo define uma métrica sobre V:
dG(x, y) := min{k ∈N : x ↔k y} (x, y,∈ V).
Exercı́cio 3.9 Considere Ψ : [0,+∞)→ [0,+∞). Seja (X, dX) um espaço métrico e defina
dX,ψ(x, x′) := Ψ(dX(x, x′)).
Dê condições suficientes sobre Ψ para que dX,ψ seja uma nova métrica sobre X, para qualquer (X, dX).
Exercı́cio 3.10 (Métricas produto) Suponha que (Xi, dXi), i = 1, . . . , d, são espaços métricos. Escreve-
remos os elementos de
X := X1 × X2 × · · · × Xd
como x = (x[1], . . . , x[d]), com cada coordenada x[i] ∈ Xi. Mostre que, para qualquer p ∈ [1,+∞), a
expressão
dp(x, y) := p
√√√√ d∑
i=1
dXi(x[i], y[i])p (x, y ∈ X)
define uma métrica sobre X. Mostre ainda que
d∞(x, y) := max
1≤i≤k
dXi(x[i], y[i])
p (x, y ∈ X)
também define uma métrica sobre X. Prove ainda que uma sequência {xn}n∈N ⊂ X converge a um x ∈ X
e acordo com a métrica dp (com 1 ≤ p ≤ +∞) se e somente se {xn[i]}n∈N ⊂ Xi converge x[i] ∈ X para
cada coordenada 1 ≤ i ≤ d. Prove um resultado semelhante para a propriedade de Cauchy e deduza que
(X, dp) é completo se e somente se cada espaço (Xi, dp) é completo. Mostre ainda que as métricas definidas
acima são todas equivalentes umas às outras.
54
Exercı́cio 3.11 Considere um espaço vetorial V. Já vimos que uma norma sobre V induz naturalmente
uma métrica sobre V. No entanto, nem toda métrica sobre V vem de uma norma. Dê condições necessárias
e suficientes que uma métrica dV deve satisfazer para que exista uma norma ‖ · ‖V tal que
∀v, w ∈ V : ‖v− w‖V = dV(v, w).
Exercı́cio 3.12 Mostre que a métrica discreta e a métrica induzida por R são equivalentes sobre N ou Z,
mas não sobre Q.
Exercı́cio 3.13 Suponha que (V, ‖ · ‖V) é um espaço vetorial completo e ‖ · ‖′V é uma outra norma sobre
V. Se as duas normas são equivalentes, é necessariamente verdade que (V, ‖ · ‖′V) é completo?
Exercı́cio 3.14 Considere uma famı́lia enumerável de espaços métricos (Xi, di), i ∈ N\{0}. Chamamos
de X o produto cartesiano infinito
X := X1 × X2 × X3 × X4 × . . .
e denotamos os elementos x ∈ X com x = (x[i])+∞i=1 , com cada x[i] ∈ Xi. Mostre que a expressão
dX(x, y) :=
+∞
∑
i=1
2−i min{di(x[i], y[i]), 1} (x, y ∈ X)
define uma métrica sobre X e que
∀{xn}n∈N ⊂ X, ∀x ∈ X : dX(xn, x)→ 0⇔ ∀i ∈N\{0}, di(xn[i], x[i])→ 0.
Prove ainda que (X, dX) é completo se e somente se cada (Xi, di) é completo.
Exercı́cio 3.15 Dado um espaço métrico (X, dX), dizemos que D ⊂ X é denso em X se e somente se todo
elemento de X é o limite de alguma sequência de elementos de D. Dizemos que (X, dX) é separável se X
tem um subconjunto denso e enumerável. Prove que Rd e C([0, 1], R) são separáveis com suas métricas
usuais.
Exercı́cio 3.16 Defina `∞(N)como sendo o conjunto de todas as sequências limitadas {an}n∈N ⊂ R.
Defina uma função sobre este espaço da seguinte forma:
‖{an}n∈N‖∞ := sup
n∈N
|an| ({an}n∈N ∈ `∞(N)).
Prove que podemos dar a `∞(N) uma estrutura de espaço vetorial segundo a qual (`∞(N), ‖ · ‖∞) é um
espaço vetorial normado completo. Este espaço é separável?
Exercı́cio 3.17 (Um teorema de Fréchet) A tese de doutorado de Maurice Fréchet introduziu os concei-
tos gerais de espaço métrico e compacidade. Ele também demonstrou o seguinte resultado.
Teorema: todo espaço métrico (X, dX) separável e de diâmetro finito pode ser “posto
dentro de `∞(N)” no seguinte sentido: se ‖ · ‖∞ é a norma do problema anterior,
então:
(?) ∃φ : X → `∞(N) ∀x, x′ ∈ X : ‖φ(x)− φ(x′)‖∞ = dX(x, x′).
55
Ou seja, há uma bijeção que preserva distâncias entre X (com a métrica dX) e um subconjunto S =
φ(X) ⊂ `∞(N) (com a métrica induzida por `∞(N)). Note que o diâmetro de (X, dX) é definido por
diam(X, dX) := supx,x′∈X dX(x, x
′).
Para definir esta função φ, seja {xn}n∈N uma enumeração de um subconjunto denso de X. Dado
x ∈ X, definimos:
φ(x) := {an(x)}n∈N, onde an(x) := dX(x, xn) (n ∈N)
Ou seja, φ(x) “lista” a distância de x a cada um dos pontos da sequência {xn}n∈N. Prove que esta função
satisfaz (?).
56
Capı́tulo 4
Funções e continuidade
O capı́tulo anterior nos ensinou o que é convergência em espaços métricos. Isto nos permite
definir continuidade de maneira fácil.
Definição 4.1 Considere dois espaços métricos (X, dX) e (Y, dY) e D ⊂ X Dizemos que f : D → Y é
contı́nua em x ∈ D se
∀{xn}n∈N ⊂ D : xn → x ∈ D ⇒ f (xn)→ f (x).
Dito de outro modo, queremos que:
∀{xn}n∈N ⊂ D, ∀x ∈ D : dX(xn, x)→ 0⇒ dY( f (xn), f (x))→ 0.
Dizemos que f é (simplesmente) contı́nua se ela é contı́nua em todos os pontos do domı́nio D.
Esta definição é das mais importantes do curso e vamos gastar bastante tempo analisando-
a e testando-a em exemplos. Uma primeira observação (praticamente trivial) está contida no
exercı́cio a seguir.
Exercı́cio 4.1 Formalize e prove a seguinte afirmação: a composição de funções contı́nuas é uma função
contı́nua.
Outra observação às vezes útil é que:
Exercı́cio 4.2 A noção de continuidade não é modificada se as métricas do domı́nio e do contradomı́nio são
trocadas por outras métricas equivalentes.
Veremos a seguir alguns exemplos de funções contı́nuas.
4.1 Funções contı́nuas de X em R
Aqui o melhor é proceder a partir de exemplos.
Em primeiro lugar, conhecemos as funções contı́nuas f : D → R com D ⊂ R. Tome agora
uma nova função:
fi : x ∈ Di := {z ∈ Rd : z[i] ∈ D} 7→ f (x[i]) ∈ R.
57
Por exemplo, se f (t) = log t, com domı́nio D = R+, fi(x) := log x[i], com domı́nio Di := {z ∈
Rd : z[i] ∈ R+}. Dizemos que este tipo de função só depende da i-ésima coordenada.
Afirmamos que esta função é contı́nua sempre que a f original é contı́nua. Para isto, pre-
cisamos provar que, se {xn}n∈N ⊂ Di é uma sequência arbitrária com xn → x ∈ Di, então
fi(xn)→ fi(x). Para demonstrar isso, recorde que nosso critério de convergência para sequências
em Rd nos diz que xn[i]→ x[i] em R. Além disso, a definição de Di garante que {xn[i]}n∈N ⊂ D,
x ∈ D. Concluı́mos que f (xn[i])→ f (x[i]) porque f é contı́nua sobre D. Ou seja, fi(xn)→ fi(x),
como querı́amos demonstrar.
Vejamos agora alguns exemplos mais interessantes.
Exercı́cio 4.3 Sabemos que o limite de um produto ou soma de sequências convergentes é o produto (ou
soma) dos limites. Deduza disto que, se D ⊂ X e f , g : D → R são contı́nuas, o mesmo vale para λ f + g
e f g (com λ ∈ R fixo). Com a hipótese adicional de que g não se anula, prove que f /g também é contı́nua.
Exercı́cio 4.4 Chame uma função f : Rd → R de polinômio multivariado se existem um k ∈ N e
coeficientes reais α(p1,...pd) com (p1, . . . , pd) ∈ [k]
d com
f (x) = ∑
(p1,...,pd)∈[k]d
α(p1,...pd) (x[1])
p1 (x[2])p2 . . . (x[d])pd (x ∈ Rd).
Prove que todo polinômio multivariado é função contı́nua.
Exercı́cio 4.5 Mostre que as normas ‖ · ‖p, 1 ≤ p ≤ +∞, são funções contı́nuas de Rd em R.
4.2 Funções Lipschitz e distâncias
Continuando na linha anterior, vamos definir e analisar a continuidade de algumas funções
baseadas em distâncias. Para isso vai ser útil introduzir o conceito de função Lipschitz.
Definição 4.2 Considere dois espaços métricos (X, dX) e (Y, dY) e D ⊂ X Dada uma constante L > 0,
dizemos que f : D → Y é L-Lipschitz se
∀x, x′ ∈ D : dY( f (x), f (x′)) ≤ L dX(x, x′).
Já é sabido de Análise na Reta que funções L-Lipschitz são contı́nuas. Verifiquemos isto para
espaços métricos arbitrários. Suponha f : D → Y é L-Lipschitz, {xn}n∈N ∪ {x} ⊂ D e xn → x,
isto é, dX(xn, x)→ 0. Veja que
0 ≤ dY( f (xn), f (x)) ≤ L dX(xn, x)→ 0,
logo dY( f (xn), f (x)) está entre duas sequências que vão a 0. Deduzimos que dY( f (xn), f (x))→ 0,
ou seja f (xn) → f (x). Como isto vale para todos {xn}n∈N ∪ {x} e f como acima, podemos
deduzir que funções Lipschitz são sempre contı́nuas.
Observação 4.1 Uma notação útil para a constante de Lipschitz de uma f : D → Y é a seguinte:
‖ f ‖Lip := sup
x,x′∈D, x 6=x′
dY( f (x), f (x′))
dX( f (x), f (x′)
.
Este é um supremo de números não-negativos e, portanto, pertence a R ∪ {+∞}. Como veremos num
dos exercı́cios, f é L-Lipschitz para algum L > 0 se e somente se ‖ f ‖Lip < +∞. Além disso, quando
‖ f ‖Lip < +∞, então ‖ f ‖Lip < +∞ é a menor constante de Lipschitz possı́vel para f .
58
Nos próximos exemplos, observamos que algumas funções f : X → R derivadas da distância
dX são 1-Lipschitz.
Exemplo 4.1 Fixo x0 ∈ X, a função x ∈ X 7→ dX(x, x0) ∈ R é 1-Lipschitz. De fato, para quaisquer
x, x′ ∈ X, a desigualdade triangular nos diz que
dX(x, x0) ≤ dX(x′, x0) + dX(x, x′)
e
dX(x′, x0) ≤ dX(x, x0) + dX(x, x′),
portanto
dR(dX(x, x0), dX(x′, x0)) = |dX(x, x0)− dX(x′, x0)| ≤ dX(x, x′).
Exemplo 4.2 Fixe agora um conjunto S ⊂ X, a função
x ∈ X 7→ dX(x, S) := inf
s∈S
dX(x, s) ∈ R
é bem definida, no sentido que os valores dX(x, s) são todos cotados inferiormente por 0 (afinal, a métrica é
positiva definida). Veja que, do mesmo jeito que provamos acima,
dX(x, S) = inf
s∈S
dX(x, s) ≤ inf
s∈S
(dX(x′, s) + dX(x, x′)) = dX(x′, S) + dX(x, x′).
Repetindo a conta trocando os papeis de x e x′ e reusando as ideias da prova anterior, deduzimos que
dR(dX(x, S), dX(x′, S)) = |dX(x, x0)− dX(x′, x0)| ≤ dX(x, x′).
Exemplo 4.3 Como um último exemplo, tomamos uma sequência de Cauchy {xn}n∈N ⊂ X. Afirmamos
que a expressão
f (x) := lim
n
dX(x, xn) (x ∈ X)
define uma função 1-Lipschitz f : X → R.
Para provar isso, primeiro temos que mostrar que o valor de f (x) está bem definido para todo
x ∈ X. Ou seja, devemos provar que o limite acima existe. Para isso, basta reusar um exemplo
acima e observar que
quando m, n→ +∞, |dX(x, xn)− dX(x, xm)| ≤ dX(xn, xm)→ 0.
Deste modo, para cada x ∈ X fixo, a sequência de números reais {dX(x, xn)}n é Cauchy e portanto
convergente.
Para provar que f é 1-Lipschitz, tomamos x, x′ ∈ X arbitrários e, novamente usando as ideias
anteriores, observamos o seguinte:
| f (x)− f (x′)| = lim
n∈N
|dX(x, xn)− dX(x′, xn)| ≤ dX(x, x′).
A principal “graça” deste problema é que ele resulta no exercı́cio a seguir, que será importante
quando estudarmos conjuntos compactos.
Exercı́cio 4.6 Prove que, se (X, dX) não é completo, então existe uma função f : X → (0, 1] com
f (x) > 0 para todo x ∈ X, mas infx∈X f (x) = 0.
59
4.3 Funções contı́nuas sobre o espaço de funções contı́nuas
Consideremos agora o espaço C := C(I, R), com I = [a, b] ⊂ R um intervalo fechado e limitado
munido da norma ‖ · ‖C := ‖ · ‖I,∞. Os elementos de C são funções contı́nuas f : I → R. Mas
também podemos definir algumas funções contı́nuas sobre este espaço. Eis alguns exemplos
naturais.
Exemplo 4.4 Dado t ∈ I, defina a aplicação et : C → R que leva f ∈ C em f (t). Esta é uma função de
C em R.
Vejaque, dadas f , g ∈ C
|et( f )− et(g)| = | f (t)− g(t)| ≤ sup
s∈I
| f (s)− g(s)| = ‖ f − g‖I,∞.
Portanto, et é uma aplicação 1-Lipschitz de C em R. Em particular, ela é uma aplicação contı́nua.
Exemplo 4.5 Dados a ≤ x, y ≤ b, defina a aplicação Ix,y : C → R que leva f ∈ C na integral definida
Ix,y( f ) :=
∫ y
x f (t) dt ∈ R. Esta também é uma função de C em R.
Dadas f , g ∈ C, as propriedades usuais da integral definida nos dizem que:
|Ix,y( f )− Ix,y(g)| =
∣∣∣∣∫ yx ( f (t)− g(t)) dt
∣∣∣∣
≤ |x− y| sup
t∈[x,y]
| f (t)− g(t)|
≤ |y− x| sup
t∈I
| f (t)− g(t)|
≤ |y− x| ‖ f − g‖I,∞.
Ou seja, Ix,y é uma função L-Lipschitz de C em R, com L := |y− x|.
Exemplo 4.6 Vamos agora considerar uma função de I : C → C que associa a cada f ∈ C uma nova
função I( f ) ∈ C. Para definir esta função I( f ) precisamos definir para cada t ∈ I um valor I( f )(t).
Faremos isso dizendo que
I( f )(t) :=
∫ t
a
f (s) ds (t ∈ I).
Ou seja, I( f ) é a única função com as seguintes duas propriedades: a derivada de I( f ) é f e I( f )(a) = 0.
Obviamente I( f ) ∈ C, pois toda função diferenciável é contı́nua.
Provemos agora que I : C → C é (b− a)-Lipschitz. O que queremos é mostrar que, dadas
f , g ∈ C:
‖I( f )− I(g)‖I,∞ = sup
t∈I
∣∣∣∣∫ ta ( f (s)− g(s)) ds
∣∣∣∣ ≤ (b− a) ‖ f − g‖I,∞.
Mas isto segue do fato que |
∫ t
a ( f (s)− g(s)) ds| ≤ (t− a) sups∈[a,t] | f (s)− g(s)| para cada t ∈ I.
Exercı́cio 4.7 Mostre que Ix,y = ey ◦ I − ex ◦ I .
60
Exemplo 4.7 (EDOs e pontos fixos) Dados (t0, x0) ∈ R×R e Ψ : R → R contı́nua, definimos uma
nova aplicação TΨ,t0,x0 : C → C da seguinte forma: dada f ∈ C, TΨ,t0,x0( f ) ∈ C é a função cujos valores
em cada ponto t ∈ I são dados por
TΨ,t0,x0( f )(t) := x0 +
∫ t
t0
Ψ( f (s)) ds.
Novamente é fácil ver que TΨ,t0,x0 é uma função dem-definida de C em C. A importância dela tem a ver com
a teoria de equações diferenciais ordinárias (ou EDOs). De fato, é um exercı́cio mostrar que uma função
f : I → R resolve o problema de Cauchy autônomo no tempo{
f ′(t) = Ψ( f (t)) (t ∈ I)
f (t0) = x0
se e somente se f é um ponto fixo de TΨ,t0,x0 , ou seja, f = TΨ,t0,x0( f ). Mais adiante desenvolveremos
ferramentas para provar que certas funções contı́nuas têm um único ponto fixo, provando assim que o
problema de Cauchy acima tem uma única solução.
Queremos agora provar que T = TΨ,t0,x0 é contı́nua. Ou seja, dadas { fn}n∈N ∪ { f } ⊂ C,
precisamos mostrar que:
‖ fn − f ‖∞ → 0⇒ ‖T ( fn)− T ( f )‖∞ → 0.
Vamos proceder por partes. Note que
‖T ( fn)− T ( f )‖∞ = ‖I(Ψ ◦ fn)− I(Ψ ◦ f )‖∞ ≤ (b− a) ‖Ψ ◦ fn −Ψ ◦ f ‖∞.
Portanto, o que precisamos é provar que Ψ ◦ fn converge a Ψ ◦ f uniformemente sobre I. Ou
seja, queremos mostrar que:
∀ε > 0 ∃n0 ∈N ∀n ≥ n0 : ‖Ψ ◦ fn −Ψ ◦ f ‖∞ ≤ ε.
Antes de partir para prova, faremos algumas observações. A convergência pontual está asse-
gurada porque Ψ é contı́nua e fn → f pontualmente, de modo que:
∀t ∈ I : fn(t)→ f (t) e portanto Ψ ◦ fn(t) = Ψ( fn(t))→ Ψ( f (t)) = Ψ ◦ f (t).
A convergência uniforme é um pouco mais sutil. O fato de que fn(t) converge uniformemente
a f (t) não implica diretamente que Ψ ◦ fn(t) → Ψ ◦ f (t) de forma uniforme. Para isso, teremos
de usar o fato que Ψ é uniformemente contı́nua sobre intervalos compactos. Ou seja, precisamos nos
recordar que:
∀M > 0 ∀η > 0 ∃δ = δ(M, η) > 0 : ∀x, y ∈ [−M, M], |x− y| ≤ δ⇒ |Ψ(x)−Ψ(y)| ≤ ε.
Note que, em nossa prova, queremos estudar os valores de |Ψ(x)− Ψ(y)| quando x = fn(t)
e y = f (t). Por isso, tomaremos M de modo que os valores de fn(t) e f (t) estejam em [−M, M]
para todo n. De fato, veja que
0 ≤ |‖ fn‖∞ − ‖ f ‖∞| ≤ ‖ fn − f ‖∞ → 0⇒ ‖ fn‖∞ → ‖ f ‖∞ ⇒ M := sup
n∈N
‖ fn‖∞ < +∞.
61
Com essa escolha de M, temos que
∀n ∈N, ∀t ∈ I : | fn(t)| ≤ ‖ fn‖∞ ≤ M, ou seja, fn(t) ∈ [−M, M]
e o mesmo vale para os valores de f (t).
Fixo este M, e dado um ε > 0, podemos tomar δ = δ(M, ε). Sabemos que existe um n0 = n0(ε)
tal que:
∀n ≥ n0, ∀t ∈ I : fn(t), f (t) ∈ [−M, M] e | fn(t)− f (t)| ≤ ‖ fn − f ‖∞ ≤ δ.
Portanto, pela nossa escolha de δ,
∀n ≥ n0 ∀t ∈ I : |Ψ( fn(t))−Ψ( f (t))| ≤ ε.
Ou seja:
∀n ≥ n0 : ‖Ψ ◦ fn −Ψ ◦ f ‖∞ ≤ ε.
Trocando em miúdos, dado ε > 0, fomos capazes de encontrar n0 tal que para todo n ≥ n0 vale
que ‖Ψ ◦ fn −Ψ ◦ f ‖∞ ≤ ε.
Nosso último exemplo é de uma função que não é contı́nua.
Exemplo 4.8 Suponha I = [0, 1] e seja D ⊂ C(I, R) o conjunto de todas as funções diferenciáveis em
t = 1/2. Defina D : D → R como D( f ) := f ′(1/2), f ∈ D. Argumentamos que D não é contı́nua.
De fato, basta observar que existem funções próximas de 0 na norma do sup que têm derivada
arbitrariamente grande em t = 1/2. Por exemplo, tomando
fk(x) :=
1
k
sin(k2(x− 1/2)), (x ∈ [0, 1])
temos que ‖ fk‖I,∞ = 1/k→ 0, mas D( fk) = f ′k(1/2) = k→ +∞.
A observação inocente de que a derivada não é contı́nua tem consequências importantes. Um
problema que abordaremos mais tarde é o de diferenciar uma função f = limk fk. Gostarı́amos
de dizer que f ′(t) = limk→+∞ f ′k(t), mas, como vimos acima, isto nem sempre é verdade. Deste
modo, o problema de diferenciar um limite de funções não é trivial. Em geral só conseguiremos
tratar este problema trocando a derivada, que é mal comportada, por um problema equivalente
envolvendo integrais. Por exemplo, é por esta razão que formulamos o problema de Cauchy em
termos de integrais e não de derivadas.
4.4 Funções contı́nuas de X em Rd
Aqui só temos uma observação a fazer. Se f : D ⊂ X → Rd e x ∈ D são dados, podemos escrever
o vetor f (x) ∈ Rd em coordenadas
f (x) = ( f [1](x), f [2](x), . . . , f [d](x)).
Isto induz funções f [i] : X → R. Como a convergência de elementos de Rd é equivalente à
convergência de todas as coordenadas, vemos que f (xn) → f (x) se e somente se f [i](xn) →
f [i](x) para cada 1 ≤ i ≤ d. Usando isto, não é difı́cil provar o resultado a seguir.
Exercı́cio 4.8 Prove que f : D ⊂ X → Rd é contı́nua em x ∈ D se e somente se cada uma das funções-
coordenada f [i] : D → X definidas acima é contı́nua.
62
4.5 Transformações e funcionais lineares
Uma classe especial de funções (possivelmente) contı́nuas merece uma consideração especial.
Definição 4.3 Se V, W são espaços vetoriais reais, uma função T : V → W é dita uma transformação
linear se:
∀v, v′ ∈ V, ∀λ ∈ R : T(λ v + v′) = λT(v) + T(v′).
Se W = R, dizemos que T é um funcional linear.
Se V = Rd e W = R`, sabemos de Álgebra Linear que há uma correspondência entre
transformações lineares e matrizes. Isso será útil para o exemplo a seguir.
Exemplo 4.9 Qualquer transformação linear T : Rd → R` é Lipschitz (e portanto contı́nua), quando
botamos a norma `p1 em Rd e a norma `p2 em R`.
De fato, sabemos que existe um elemento AT ∈ R`×d que representa T, no sentido que
ATv = T(v) para todo v ∈ Rd. Recordando a definição da norma de operador no Exemplo 2.6,
deduzimos que:
‖T‖Lip := sup
v,v′∈Rd, v 6=v′
|T(v)− T(v′)|p2
|v− v′|p1
(linearidade de T) = sup
v,v′∈Rd, v 6=v′
|T(v− v′)|p2
|v− v′|p1
(tome h = v− v′) = sup
h∈Rd, h 6=0
Rd
|T(h)|p2
|h|p1
(AT representa T + def. da norma de op.) = sup
h∈Rd, h 6=0
Rd
|ATh|p2
|h|p1
= ‖AT‖p1→p2 < +∞.
Em geral, transformações lineares no espaço das funções contı́nuas (ou em subespaços dele)
podem não ser contı́nuas. No entanto, vimos acima dois exemplos importantes de transformações
que são, sim, contı́nuas; de fato, ambas são Lipschitz.
Exemplo 4.10 Usando a notação da Seção 4.3, as funções et, Ix,y : C → R são funcionais lineares
contı́nuos (posto que Lipschitz), I : C → C também é Lipschitz (logo contı́nua) e TΨ,t0,x0 em geral
não é linear. O operador D é um funcional linear descontı́nuo sobre o subconjunto D ⊂ C das funções
diferenciáveis em t = 1/2, que também é um espaço vetorial real.
O teorema abaixo nos diz que uma transformação linear é contı́nua se e somente se é Lips-
chitz.
Teorema 4.1 Considere dois espaços vetoriais reais normados (V, ‖ · ‖V), (W, ‖ · ‖W). Dada umatransformação
linear T : V →W, são equivalentes:
1. T é limitada, ou seja:
‖T‖V→W := sup
v∈V,‖v‖V=1
‖T(v)‖W < +∞.
63
2. T é L-Lipschitz para algum L > 0.
3. T é contı́nua no ponto 0V .
Prova: 1⇒2. Chame de L := ‖T‖V→W . Afirmamos que para quaisquer v, v′ ∈ V vale a desi-
gualdade ‖T(v) − T(v′)‖W ≤ L ‖v − v′‖V . De fato, esta desigualdade é trivialmente satisfeita
se v = v′. Caso contrário, podemos olhar para o vetor z := (v− v′)/‖v− v′‖V ; ele tem norma
‖z‖V = 1 e portanto ‖T(z)‖W ≤ ‖T‖V→W = L. Deduzimos por linearidade que
T(z) =
T(v)− T(v′)
‖v− v′‖V
, portanto
‖T(v)− T(v′)‖W
‖v− v′‖V
= ‖T(z)‖W ≤ L,
como querı́amos demonstrar.
2⇒3 é direto.
3⇒1. A ideia da prova é muito semelhante à que usamos na prova do Teorema 3.3. Supondo
(para chegar a uma contradição) que T não é limitado, podemos encontrar, para cada n ∈ N,
um vetor vn ∈ V com ‖vn‖V = 1 e ‖T(vn)‖W ≥ n + 1. Isto quer dizer que, por um lado,
vn/(n + 1)→ 0V , mas, por outro lado (usando linearidade),∥∥∥∥T( vnn + 1
)∥∥∥∥
W
=
‖T(vn)‖W
n + 1
= 1 6→ 0.
Isto quer dizer que T não é contı́nuo, o que contradiz a hipótese 3. Deduzimos que T é, sim,
limitado, como querı́amos demonstrar. 2
Exercı́cio 4.9 Prove que, de fato,
‖T‖V→W = sup
v∈V\{0}V
‖Tv‖W
‖v‖V
= ‖T‖Lip
e que, portanto, ‖Tv‖W ≤ ‖T‖V→W ‖v‖V para todo v ∈ V.
Exercı́cio 4.10 Chame de L(V, W) o espaço das transformações lineares limitadas entre V e W (como no
teorema acima), com a estrutura ”natural” de soma e produto por escalar. Mostre que
(L(V, W), ‖ · ‖V→W)
é espaço vetorial normado. Prove ainda que este espaço é Banach sempre que (W, ‖ · ‖W) é Banach.
[Dica: a ideia para provar que é espaço normado é mostrar logo de cara que ‖ · ‖V→W é subaditiva.
Para provar que é Banach, mostre que, se {Tn}n∈N ⊂ L(V, W) é uma sequência de Cauchy, então
{Tnv}b∈N é Cauchy para qualquer v ∈ V; deduza que há convergência pontual e pode-se definir
um limite Tv = limn Tnv. Não é difı́cil provar que T é linear pela convergência pontual. Como
provar que T ∈ L(V, W) e ‖Tn − T‖V→W → 0?]
64
4.6 Transformações multilineares e tensores
Uma extensão importante das espaços vetoriais é a de transformações multilineares.
Definição 4.4 Considere espaços vetoriais reais V1, V2, . . . , Vk, W com suas respectivas normas. Uma
função:
Q : V1 ×V2 × · · · ×Vk →W
é dita transformação k-linear se é linear em cada argumento, isto é, se, dados um ı́ndice i ∈ [k] e vetores
vj ∈ Vj, j ∈ [k]\{i}, a função
Qi : ṽi ∈ Vi 7→ Q(v1, . . . , vi−1, ṽi, vi+1, . . . , vk) ∈W
é uma transformação linear de Vi em W. Dizemos que Q é limitada se
‖Q‖V1×...Vk→W := sup
(v1,...,vk)∈(V1\{0V1})×···×(Vk\{0Vk})
‖Q(v1, v2, . . . , vk)‖W
∏ki=1 ‖vi‖Vi
< +∞.
Ou seja, Q é multilinear se é “linear em cada coordenada”. Veremos mais adiante no curso
que as funções k-lineares aparecem como as derivadas de ordem k de funções entre espaços
vetoriais.
Logo de cara, provamos um teorema parecido com o Teorema 4.1 relacionando continuidade
e limitação.
Teorema 4.2 No contexto da definição acima, dote o espaço produto V := V1 ×V2 × · · · ×Vk da norma:
‖(v1, . . . , vk)‖V :=
k
∑
i=1
‖vi‖Vi ((v1, . . . , vk) ∈ V).
Então Q : V →W é contı́nua se e somente se é limitada.
Veja que, neste caso, não garantimos que Q é Lipschitz. De fato, funções bilienares em geral
não são Lipschitz. O exemplo mais simples é o da função produto Q : R×R→ R que leva (x, y)
em xy.
Prova: Vamos começar provando que “limitada⇒contı́nua”.
Suponha que L := ‖Q‖V1×...Vk→W < +∞. Imagine que temos uma sequência {vn}n∈N ⊂ V e
um ponto v ∈ V com vn → v. Nosso objetivo será mostrar que Q(vn)→ Q(v).
Escrevemos
vn = (vn,1, vn,2, . . . , vn,k) ∈ V1 ×V2 × · · · ×Vk
e
v = (v1, v2, . . . , vk) ∈ V1 ×V2 × · · · ×Vk.
A ideia principal da prova é a seguinte. A convergência vn → v implica que vn,i → vi, como
veremos a seguir. Deste modo, esperamos que vn,i esteja próximo de vi para n grande. Nossa
ideia será usar essa proximidade “coordenada a coordenada” para comparar Q(vn) e Q(v). Para
isso, vamos tentar escrever Q(v)− Q(vn) passando de v a vn de uma forma que só muda uma
coordenada de cada vez, porque aı́ poderemos usar a linearidade.
65
Para ilustrar isso, vamos considerar o caso em que k = 2 e Q é bilinear. Dados v = (v1, v2), u =
(u1, u2) ∈ V podemos escrever:
Q(v1, v2)−Q(u1, u2) = Q(v1, v2)−Q(u1, v2)+Q(u1, v2)−Q(u1, u2) = Q(v1−u1, v2)+Q(u1, v2−u2).
Portanto,
‖Q(v1, v2)−Q(u1, u2)‖ ≤ ‖Q‖V→W‖v1 − u1‖V1 ‖v2‖V2 + ‖Q‖V→W ‖u1‖V1‖v2 − u2‖V2 .
Disso podemos deduzir que, se u1 → v1 e u2 → v2, então Q(u1, u2) → Q(v1, v2). Daremos mais
detalhes abaixo na prova para Q geral.
Comecemos com a parte de convergência. Nossa hipótese diz que
‖v− vn‖V =
k
∑
i=1
‖vi − vn,i‖Vi → 0.
Como os termos da soma acima são não-negativos, temos que
0 ≤ min
1≤i≤k
‖vi − vn,i‖Vi ≤ max1≤i≤k
‖vi − vn,i‖Vi → 0.
Portanto,
∀1 ≤ i ≤ k : ‖vi − vn,i‖Vi → 0.
Em particular, cada sequência ‖vi − vn,i‖Vi é limitada, de modo que existe um C > 0 com
∀1 ≤ i ≤ k, ∀n ∈N : ‖vi − vn,i‖Vi ≤ C.
Consideramos agora termos “intermediários”w(j)n entre vn e v, com j = 0, . . . , k, que definimos
da seguinte forma.
w(j)n = (w
(j)
n,1, w
(j)
n,2, . . . , w
(j)
n,k) ∈ V1 ×V2 × · · · ×Vk
onde
w(j)n,i =
{
vn,i, i ≤ j;
vi, i > j.
(i ∈ [k])
Deste modo, w(0)n = v, w
(k)
n = vn e cada w
(j)
n difere de w
(j−1)
n apenas na j-ésima coordenada.
Usando uma soma telescópica, podemos escrever:
Q(v)−Q(vn) =
k
∑
j=1
Q(w(j)n )−Q(w
(j−1)
n ).
Portanto,
‖Q(v)−Q(vn)‖W ≤
k
∑
j=1
‖Q(w(j)n )−Q(w
(j−1)
n )‖W .
Recorde agora que cada w(j)n difere de w
(j−1)
n apenas na j-ésima coordenada. Esse é o tipo de
situação em que a multilinearidade de Q se aplica. Mais exatamente, vemos que
Q(w(j)n )−Q(w
(j−1)
n ) = Q(x
(j)
n,1, . . . , x
(j)
n,k) onde x
(j)
n,k =

vn,i, i < j;
vn,j − vj, i = j;
vi, i > j.
(i ∈ [k]).
66
Portanto,
‖Q(w(j)n )−Q(w
(j−1)
n )‖W ≤ ‖Q‖V1×···×Vk→W
k
∏
j=1
‖x(j)n,k‖Vj ≤ L C
k−1 ‖vn,j − vj‖Vj .
Deduzimos que
‖Q(v)−Q(vn)‖W ≤ L Ck−1
k
∑
j=1
‖vn,j − vj‖W → 0,
como querı́amos demonstrar.
Resta provar que “contı́nua⇒limitada”. De fato, usaremos a forma contrapositiva “não-
limitada⇒não-contı́nua”. Se Q não é limitada, então para qualquer n ∈ N existem vn,1 ∈
V1\{0V1}, . . . , vn,k ∈ Vk\{0Vk} com
‖Q(vn,1, vn,2, . . . , vn,k)‖W
∏ki=1 ‖vn,i‖Vi
≥ n.
Se definimos un,i = vn,i/ ln n‖vn,i‖Vi e
un = (un,1, . . . , un,k) ∈ V,
vemos que
Q(un,1, un,2, . . . , un,k) =
Q(vn,1, vn,2, . . . , vn,k)
∏ki=1 (ln n ‖vn,i‖Vi)
e portanto ‖Q(un,1, un,2, . . . , un,k)‖W ≥ n/(ln n)k → +∞. Por outro lado,
‖(un,1, un,2, . . . , un,k)‖V =
k
∑
i=1
‖un,i‖Vi =
k
ln n
→ 0.
Portanto, achamos uma sequência {un}n∈N ⊂ V que converge a 0V , sem que Q(un) converja a
Q(0V). 2
Exercı́cio 4.11 Por que escolhemos a função ln n na hora de “renormalizar os vn,i” na prova acima?
Mostre que, de fato, poderı́amos ter tomado a função n1/k−a acima, com qualquer 0 < a < 1/k, e a mesma
estratégia ainda funcionaria.
Exercı́cio 4.12 Chame de Lk(V1 × · · · × Vk, W) o espaço das transformações k-lineares limitadas entre
V1, . . . , Vk e W (como no teorema acima), com a estrutura ”natural” de soma e produto por escalar. Mostre
que
(Lk(V1 × · · · ×Vk, W), ‖ · ‖V1×···×Vk→W)
é espaço vetorial normado. Prove ainda que este espaço é Banach sempre que (W, ‖ · ‖W)é Banach.
67
4.6.1 Tensores em dimensão finita
Como são as funções multilineares Q : Rd1 ×Rd2 × . . . Rdk → R com k ≥ 2? Vamos chamar de
{e(dj)i }
dj
i=1 a base canônica de R
dj . Como todo xj ∈ Rdj é da forma
xj =
dj
∑
i=1
xj[i] e
(dj)
i
temos que
Q(x1, . . . , xk) =
d1
∑
i1=1
· · ·
dk
∑
ik=1
A[i1, . . . , ik]
k
∏
j=1
xj[ij] (x1 ∈ Rd1 , . . . , xk ∈ Rdk). (4.1)
onde A[i1, . . . , ik] := Q(e
(d1)
i1
, . . . , e(dk)ik ) ∈ R.
Do mesmo modo, se chamados de tensor qualquer elemento do espaço
Rd1×d2×···×dk := {A = (A[i1, . . . , ik])i1∈[d1]....,ik∈[dk ] : cada A[i1, . . . , ik] ∈ R},
vemos que cada tensor defineuma transformação multilinear de Rd1 × . . . Rdk em R. Portanto,
há uma correspondência biunı́voca entre tensores e tais transformações. Em particular, no caso
k = 2, os tensores são matrizes as funções bilineares correspondentes são formas quadráticas.
Q(x, y) = x · Ay para alguma matriz A.
A extensão para o caso em que o contradomı́nio é (W, ‖ · ‖W) é imediata.
Um ponto importante é que, no contexto em que estamos trabalhando, toda Q multilinear é
contı́nua.
Proposição 4.1 Toda transformação multilinear Q : Rd1 ×Rd2 × . . . Rdk → R é contı́nua.
Prova: Como sabemos, basta provar que Q é limitada.
Considere o tensor A correspondente e chame de
L := max
(i1,...,ik)∈[d1]×···×[dk ]
|A[i1, . . . , ik]|.
Veja que, dado (x1, . . . , xk) no domı́nio do tensor:
|Q(x1, . . . , xk)| =
∣∣∣∣∣ d1∑i1=1 · · ·
dk
∑
ik=1
A[i1, . . . , ik] x1[i1] x2[i2] . . . xk[ik]
∣∣∣∣∣
≤
d1
∑
i1=1
· · ·
dk
∑
ik=1
|A[i1, . . . , ik]| |x1[i1]| |x2[i2]| . . . |xk[ik]|
≤ L
d1
∑
i1=1
· · ·
dk
∑
ik=1
|x1[i1]| |x2[i2]| . . . |xk[ik]|
= L
k
∏
i=1
‖xi‖1
≤ L d k2
k
∏
i=1
‖xi‖2.
Deduzimos que a norma de Q é no máximo L dk/2. 2
68
4.6.2 Alguns exemplos em dimensão infinita
Agora tomamos C = C(I, R) com I = [a, b], a < b reais. Veremos dois exemplos de transformação
bilinear de C× C em C.
Exemplo 4.11 (Produto) Defina Prod : C× C → C via a fórmula
Prod( f , g) := f g.
Ou seja, a função Prod toma como entrada duas funções contı́nuas e retorna seu produto f g.
Como o produto de funções contı́nuas é uma função contı́nua, esta é uma aplicação bem
definida de C× C em C.
A bilinearidade de Prod fica como exercı́cio. Para mostrar que esta aplicação é limitada, e
portanto contı́nua, basta observar que:
‖Prod( f , g)‖∞ ≤ ‖ f ‖∞ ‖g‖∞
e portanto
‖Prod‖C×C→C ≤ 1.
Exemplo 4.12 (Convolução) Suponha para simplificar que [a, b] = [0, 1]. Defina Conv : C × C → C
via a fórmula
Conv( f , g)(t) = f ∗ g(t) :=
∫ t
0
f (s) g(t− s) ds (t ∈ I).
Para fixar, a expressão acima quer dizer o seguinte: dadas as funções f , g : I → R, formamos
uma nova função Conv( f , g) = f ∗ g. Essa função estará definida do momento em que espe-
cificamos o valor de f ∗ g(t) para cada ponto t ∈ I. Nossa especificação é dada pela integral
acima.
Queremos provar que esta é uma operação bilinear limitada (contı́nua) Conv : C× C → C. A
bilinearidade é evidente e a limitação vem do fato de que
∀t ∈ [0, 1] :
∣∣∣∣∫ t0 f (s) g(t− s) ds
∣∣∣∣ ≤ sup
t,s∈I
| f (s)| |g(t− s)| ≤ ‖ f ‖∞ ‖g‖∞.
Portanto,
∀ f , g ∈ C : ‖Conv( f , g)‖∞ ≤ ‖ f ‖∞ ‖g‖∞.
A parte mais difı́cil do argumento é mostrar que f ∗ g é uma função contı́nua para quaisquer
f , g ∈ C. Para fazer isso, fixamos primeiramente um t′ ∈ I e estimamos a diferença:
f ∗ g(t)− f ∗ g(t′)
no caso em que |t− t′| = δ. Para facilitar, supomos que t′ ≤ t, pois o outro caso é análogo. Veja
que
f ∗ g(t)− f ∗ g(t′) =
∫ t
0
f (s) g(t− s) ds−
∫ t′
0
f (s) g(t′ − s) ds
=
∫ t′
0
f (s) (g(t− s)− g(t′ − s)) ds +
∫ t
t′
f (s) g(t− s) ds
=: (I) + (I I).
69
O termo (I I) acima é no máximo:
|(I I)| =
∣∣∣∣∫ tt′ f (s) g(t− s) ds
∣∣∣∣ ≤ |t− t′| sup
t,s∈I
| f (s)| |g(t− s)| ≤ δ ‖ f ‖∞ ‖g‖∞.
Já o primeiro termo (I) é limitado por:
|(I)| =
∣∣∣∣∫ t′0 f (s) (g(t− s)− g(t′ − s)) ds
∣∣∣∣
≤ sup
t,t′,s∈I : |t−t′|≤δ
| f (s)||g(t− s)− g(t′ − s)|
≤ ‖ f ‖∞ sup
a,b∈I, |a−b|≤δ
|g(a)− g(b)|.
Portanto,
|t− t′| = δ⇒ 0 ≤ | f ∗ g(t)− f ∗ g(t′)| ≤ δ ‖ f ‖∞ ‖g‖∞ + ‖ f ‖∞ sup
a,b∈I, |a−b|≤δ
|g(a)− g(b)|.
Agora imagine que t′ → t, de modo que δ → 0. Veja que o primeiro termo do lado direito
vai a 0. O segundo também, porque g : I → R é contı́nua e portanto uniformemente contı́nua.
Deduzimos que:
0 ≤ lim
t′→t
| f ∗ g(t)− f ∗ g(t′)| ≤ lim sup
δ→0
(δ ‖ f ‖∞ ‖g‖∞ + ‖ f ‖∞ sup
a,b∈I, |a−b|≤δ
|g(a)− g(b)|) = 0.
Ou seja, f ∗ g é contı́nua em t, para qualquer t ∈ I.
4.7 Mais exercı́cios
Exercı́cio 4.13 Tome a norma 2→ 2 nos espaços de matrizes Rd1×d2 e Rd2×d3 . Prove que a aplicação
Mult : Rd1×d2 ×Rd2×d3 → Rd1×d3
que leva (A1, A2) ∈ Rd1×d2 ×Rd2×d3 em A1A2 é bilinear e limitada, com norma
‖Mult‖
Rd1×d2×Rd2×d3→Rd1×d3 = 1.
Enuncie e esboce a prova de uma versão do resultado acima para o produto de k > 2 matrizes.
Exercı́cio 4.14 Dado um espaço métrico (X, dX), chamamos de BC = BC(X, Rd) o espaço de funções
contı́nuas e limitadas de X a Rd. Isto é, uma f : X → Rd pertence a BC se é contı́nua e ‖ f ‖∞ :=
supx∈X | f (x)|2 < +∞. Prove que (BC(X, Rd), ‖ · ‖∞) é espaço de Banach (a estrutura de espaço vetorial
em BC(X, Rd) é definida da maneira “natural”).
Exercı́cio 4.15 Veremos neste exercı́cio e nos próximos algumas propriedades da notação ‖ f ‖Lip introdu-
zida na observação 4.1 acima. Como lá, supomos que f : D → Y com D ⊂ X e (X, dX), (Y, dY) espaços
métricos. Prove que:
∀L ∈ R+ : f é L-Lipschitz ⇔ L ≥ ‖ f ‖Lip.
Deduza que f é Lipschitz (com alguma constante) se e somente se ‖ f ‖Lip < +∞.
70
Exercı́cio 4.16 Seguimos com a notação do exercı́cio anterior, mas agora no caso especı́fico em que Y = R
com a métrica usual.
1. Mostre que ‖ · ‖Lip é subaditiva e positiva-homogênea, mas ‖ f ‖Lip = 0 não implica f = 0.
2. Dadas f , g : D → R, mostre que
‖min{ f , g}‖Lip, ‖max{ f , g}‖Lip ≤ max{‖ f ‖Lip, ‖g‖Lip};
em particular, o mı́nimo e o máximo de funções Lipschitz também é Lipschitz.
3. Suponha que F é uma famı́lia de funções Lipschitz de D em R tal que
∀x ∈ D, inf
f∈F
f (x) ∈ R.
Mostre que a funcão f∗ : D → R que associa a cada x ∈ D o valor f∗(x) = inf f∈F f (x) satisfaz:
‖ f∗‖Lip ≤ sup
f∈F
‖ f ‖Lip.
4. Suponha agora que F é uma famı́lia de funções Lipschitz de D em R tal que
∀x ∈ D, sup
f∈F
f (x) ∈ R.
Mostre que a funcão f ∗ : D → R que associa a cada x ∈ D o valor f ∗(x) = sup f∈F f (x) satisfaz:
‖ f ∗‖Lip ≤ sup
f∈F
‖ f ‖Lip.
(Juntos, este item e o anterior mostram que o ı́nfimo e supremo de funções Lipschitz com constantes
uniformemente limitadas também é Lipschitz.)
5. Finalmente, suponha que fn : D → R (n ∈N) converge pontualmente a f : D → R. Prove que
‖ f ‖Lip ≤ lim inf
n∈N
‖ fn‖Lip.
Exercı́cio 4.17 Complementando o exercı́cio anterior, considere o espaço BL(X, R) de todas as funções
f : X → R satisfazendo ‖ f ‖∞ := supx∈R | f (x)| < +∞ e ‖ f ‖Lip < +∞ (este é o espaço das funções
“bounded Lipschitz”, ou seja, Lipschitz e limitadas). Prove as seguintes propriedades.
1. BL(X, R) é espaço vetorial com as operações naturais de soma e multiplicação por escalar. Além
disso,
‖ f ‖BL := ‖ f ‖∞ + ‖ f ‖Lip ( f ∈ BL(X, R))
é norma sobre este espaço.
2. (BL(X, R), ‖ · ‖BL) é Banach.
3. Dadas f , g ∈ BL(X, R), temos que f .g, min{ f , g} e max{ f , g} também pertencem a BL(X, R).
71
Exercı́cio 4.18 Este exercı́cio mostra que toda função contı́nua e limitada de um espaço métrico em R é
o limite pontual de uma sequência crescente de funções Lipschitz. Nos últimos itens, discutiremos se esta
convergência pode ser tomada uniforme.
Tome um espaço métrico (X, dX) e uma função limitada f : X → R. Dado M > 0, chame de fM a
seguinte aproximação de f , chamada de ı́nfimo-convolução:
fM(x) := inf
y∈X
( f (y) + M dX(x, y)).
1. Mostre que fM(x) ≤ f (x) para todo x ∈ X.
2. Prove que fM é M-Lipschitz e que fM = f se ‖ f ‖Lip ≤ M.
3. Demonstre que se x ∈ X e M < M′ são dados, fM(x) ≤ fM′(x).
4. Prove que, quando M ↗ +∞, fM(x) ↗ f (x) para todo ponto x ∈ X onde f é contı́nua. [Dica:
observe que o inf na definição de fM pode ser tomado no conjunto de pontos y ∈ X com
d(x, y) ≤ 2‖ f ‖∞/M.]
5. A convergência no item anterior pode ser sempre tomada uniforme em x ∈ X? Explique.
6. Recorde que f é uniformemente contı́nua
∀ε > 0 ∃δ > 0 ∀x, y ∈ X : d(x, y) ≤ δ⇒ | f (x)− f (y)| ≤ ε.
Mostre que, se f é uniformemente contı́nua, então ‖ fM − f ‖∞ → 0.
Mais adiante você poderá provar que ‖ fM − f ‖∞ → 0 quando X é compacto.
Exercı́cio 4.19 Recorde a definição de convolução de f , g : [0, 1]→ R nas notas de aula.
1. Suponha que f , g :[0, 1] → R são dadas, que g ∈ C([0, 1], R) e que f é contı́nua por partes:
isto é, existem a0 = 0 < a1 < · · · < ak = 1 e funções contı́nuas fi : [ai−1, ai] → R tais que
f |(ai−1,ai)= fi |(ai−1,ai). Suponha ainda que f é limitada. Prove que f ∗ g é bem definida e contı́nua.
2. Suponha agora que f ∈ C([0, 1], R) e g ∈ C([0, 1], R) é diferenciável com g′ ∈ C([0, 1], R). Mostre
que f ∗ g é diferenciável com derivada contı́nua.
Exercı́cio 4.20 Mostre que o operador de convolução iterada f1 ∗ f2 ∗ · · · ∗ fk é um operador k-linear e
limitado sobre (C([0, 1], R))k.
72
Parte II
Topologia e geometria em espaços
métricos
73
Capı́tulo 5
Abertos, fechados e topologias
Neste capı́tulo, começaremos a discutir conceitos topológicos. Veremos o que são conjuntos aber-
tos e fechados em um espaço métrico; discutiremos porque os abertos formam o que se chama de
topologia; relacionaremos continuidade a estes dois conceitos; e ainda, trataremos da topologia re-
lativa que um conjunto pode herdar de outro maior. A linguagem e os resultados desenvolvidos
aqui serão importantes para tudo o que vem a seguir.
Ao longo deste capı́tulo, (X, dX) será um espaço métrico dado. Dados x ∈ X e r ≥ 0,
denotamos por B(X,dX)(x, r) BX(x, r) ou apenas B(x, r) a chamada bola aberta de raio r ao redor de x:
B(x, r) := {y ∈ X : d(x, y) < r}.
Também definimos a bola fechada B(X,dX)[x, r], BX[x, r] ou B[x, r] como
B[x, r] := {y ∈ X : d(x, y) ≤ r}.
Exercı́cio 5.1 Mostre que, dados 0 ≤ r′ < r,
B(x, 0) = ∅ ⊂ B[x, 0] = {x} ⊂ B[x, r′] ⊂ B(x, r) ⊂ B[x, r].
Mostre ainda que B[x, 0] = B[x, 1/2] = B(x, 1) = {x} se a métrica é discreta.
Agora podemos apresentar as principais definições de topologia de espaços métricos.
Definição 5.1 A ⊂ X é dito aberto (segundo a métrica dX) se para todo x ∈ X existe um δ > 0 tal que
BX(x, δ) ⊂ A. F ⊂ X é dito fechado (também segundo a métrica dX) se X\F é aberto.
Frequentemente falaremos de abertos da seguinte maneira: um conjunto é aberto se todo
x ∈ A tem uma ”bolha protetora”(BX(x, δ) com δ > 0) que o ”protege do mundo exterior” por
estar toda contida em A.
Vejamos como se comportam os conceitos de ”aberto” e ”fechado” sob a métrica discreta.
Exemplo 5.1 Todos os subconjuntos são abertos e fechados se a métrica é discreta. Isto porque, como visto
acima, todo dado A ⊂ X, temos
∀x ∈ A : {x} = BX(x, 1) ⊂ A.
Do mesmo modo, Ac também é aberto.
75
Também observamos que toda bola aberta é aberta. A prova é simples, mas será apresentada
inteira para que possamos praticar o conceito.
Exemplo 5.2 Toda bola aberta é um conjunto aberto.
Para ver isso, tome uma bola B(x, r) com r > 0 e um elemento y ∈ B(x, r). Nosso objetivo
é mostrar que existe um raio positivo δ > 0 tal que B(y, δ) ⊂ B(x, r). Para isso, é necessário
provar que δ > 0 tem a seguinte propriedade: todo z ∈ B(y, δ) também está em B(x, r). Usando
as definições das bolas, isto significa que devemos mostrar o seguinte:
Queremos: ∃δ > 0 ∀z ∈ X : d(z, y) < δ⇒ d(z, x) < r.
O que nos permite achar este δ é a desigualdade triangular. Afinal, sabemos que
∀δ > 0 ∀z ∈ X : d(z, y) < δ⇒ d(x, z) ≤ d(z, y) + d(y, x) < δ + d(y, x).
Logo, precisamos escolher δ tal que δ + d(y, x) < r e δ > 0. Como d(x, y) < r (já que y ∈ B(x, r)),
podemos escolher δ := r− d(x, y) > 0 e terminar assim a prova.
Exemplo 5.3 De forma semelhante, toda bola fechada B[x, r] é um subconjunto fechado de X, onde agora
r ≥ 0.
De fato, isto equivale a mostrar que X\B[x, r] é aberto, ou seja, que para todo todo y ∈
X\B[x, r] existe um δ > 0 tal que B(y, δ) ⊂ X\B[x, r]. A condição necessária sobre δ desta vez é
que
Queremos: ∃δ > 0 ∀z ∈ X : d(z, y) < δ⇒ d(z, x) > r.
Novamente é a desigualdade triangular que usaremos para achar este δ. Afinal
d(z, y) < δ⇒ d(x, z) ≥ −d(z, y) + d(y, x) > d(y, x)− δ.
Como y 6∈ B[x, r], d(x, y) > r, podemos tomar δ = r− d(x, y) e garantir que d(z, y) < δ implica
d(z, x) > r.
Exercı́cio 5.2 Prove que ∅ e X são ambos abertos e fechados.
Exercı́cio 5.3 Prove que os intervalos abertos e fechados de R são mesmo abertos e fechados, segundo a
definição acima. (De fato, todo intervalo aberto ou fechado de comprimento finito é uma bola aberta.)
Exercı́cio 5.4 Dados (X, dX), x ∈ X e r1, r2 > 0, prove que BX(x, r1)∪ BX(x, r2) = BX(x, max{r1, r2})
e BX(x, r1) ∩ BX(x, r2) = BX(x, min{r1, r2}). Prove um resultado semelhante para bolas fechadas.
Nas definições acima definimos fechado em função de aberto. O próximo resultado nos permite
definir o que é um conjunto fechado em termos de limites de sequências.
Teorema 5.1 F ⊂ X é fechado se e somente se limn xn ∈ F para toda sequência convergente {xn}n∈N ⊂
F.
76
Prova: [do Teorema 5.1] Fixe um conjunto F ⊂ X. Como a definição de fechado é em função da
de aberto, temos de recorrer a A := X\F. O que a proposição diz é:
A é aberto ⇔ toda seq. convergente {xn}n ⊂ X\A tem limite em X\A.
Vamos provar primeiro a direção “⇒”. Supondo que A é aberto, seja {xn}n qualquer sequência
convergente contida em X\A e seja x = limn xn. Suponha (para chegar a uma contradição) que
x 6∈ X\A, ou seja, x ∈ A. Como A é aberto, existe um r > 0 tal que B(y, r) ⊂ A. Por outro lado,
como xn 6∈ A para todo n, temos:
∀n ∈N : xn 6∈ B(x, r), isto é, d(xn, x) ≥ r.
Segue que d(xn, x) não converge a 0, ou seja, x não é o limite da sequência. Como isto é uma
contradição, deduzimos que x ∈ X\A.
Agora mostraremos a direção “⇐” da equivalência via a afirmação contrapositiva. Isto é,
mostraremos que:
se A não é aberto, então ∃{xn} ⊂ X\A com limn xn ∈ A.
Vejamos: se A não é aberto, então existe um ponto x ∈ A tal que B(x, r) 6⊂ A para qualquer
r > 0. Em particular, dado n ∈ N, podemos sempre encontrar um elemento xn ∈ B(x, 1/(n +
1)) ∩ (X\A). Isto quer dizer que:
xn ∈ B(x, 1/(n + 1)) ∩ (X\A)
(intersecção)⇒
{
xn ∈ B(x, 1/(n + 1)) ⇒ dX(x, xn) < 1/(n + 1); e
xn ∈ X\A.
Deste modo, vemos que x ∈ A, dX(xn, x) → 0(ou seja, xn → x) e {xn}n∈N ⊂ X\A. Ou seja,
supondo que A não é aberto, provamos que há uma sequência contida em X\A com limite em A.
2
Exercı́cio 5.5 Demonstre o seguinte escólio da demonstração acima: um ponto x ∈ X é o limite de uma
sequência de pontos em S ⊂ X se e somente se B(x, r) ∩ S 6= ∅ para todo r > 0.
5.1 Os abertos formam uma topologia
Nesta seção provaremos que os abertos de um espaço métrico formam uma topologia. Primeiro
temos de definir esta palavra.
Definição 5.2 Uma topologia sobre um conjunto X 6= ∅ é uma coleção T de subconjuntos de X, chama-
dos de abertos da topologia T , ou ainda abertos de X segundo T , com as seguintes propriedades.
Axioma 1: ∅, X ∈ T (o vazio e o espaço inteiro são abertos).
Axioma 2: Dada A ⊂ T , temos ∪A∈A A ∈ T (uniões de abertos são sempre abertas).
Axioma 3: Dados A, A′ ∈ T , temos A ∩ A′ ∈ T (interseções de pares de abertos são abertas).
Os conjuntos F ⊂ X com X\F ∈ T são chamados de fechados de T .
77
Exercı́cio 5.6 Todo X possui duas topologias extremas: Tgrossa = {∅, X} e T f ina = {todos os subconjun-
tos de X}. Mostre que estas topologias são mesmo topologias.
Exercı́cio 5.7 Mostre que a interseção de um número finito de conjuntos abertos é sempre um conjunto
aberto.
O principal resultado desta seção é que os abertos de um espaço métrico formam uma topo-
logia.
Teorema 5.2 Considere um espaço métrico (X, dX). Seja T(X,dX) a coleção de todos os subconjuntos de X
que são abertos na noção dada pela métrica dX. Então T(X,dX) é uma topologia sobre X.
Como veremos na prova, o conteúdo deste teorema é basicamente o seguinte.
Corolário 5.1 Qualquer união de abertos em (X, dX) é também um conjunto aberto. Qualquer interseção
de dois conjuntos abertos em X é aberta (do mesmo modo, qualquer interseção finita é aberta).
Note que interseções infinitas podem não ser abertas. Por exemplo, em R (com a métrica
usual), a coleção de conjuntos
A := {(−t, t) : t > 0}
tem interseção {0},que não é aberto.
Prova: [Teorema 5.2] Veja que ∅, X são abertos de X: nenhum elemento está contido em ∅
(logo ele é aberto por vacuidade) e todas as bolas estão contidas em X (que é aberto, portanto).
Concluı́mos que ambos pertencem a TdX , so seja, vale o primeiro axioma de uma topologia.
Provaremos agora que vale o segundo axioma. Dada uma coleção qualquer de abertos A ⊂ TdX ,
queremos provar que ∪A∈AA ∈ TdX . Recorde o que isto quer dizer: se tomarmos um elemento
qualquer x ∈ ∪A∈AA, deve existir um raio positivo r com BX(x, r) ⊂ ∪A∈AA. Para achar o raio,
lembramos que um dado x só pode pertencer à união se pertence a pelo menos um dos conjuntos
Ax ∈ A. Como todos os elementos de A são abertos, sabemos que Ax é aberto e x ∈ Ax. Logo,
existe um r > 0 tal que BX(x, r) ⊂ Ax. Também sabemos que Ax ⊂ ∪A∈AA, pois a união dos
conjuntos A ∈ A contem todos os conjuntos A ∈ A. Como a relação “⊂” é transitiva, deduzimos
que BX(x, r) ⊂ ∪A∈AA. Dito de outro modo: como x está num conjunto da união, ele tem uma
“bolha” ao seu redor dentro deste conjunto e, portanto, tem uma bolha na união.
Consideremos agora o terceiro axioma, que fala da interseção de dois abertos A, A′ ⊂ X. Para
provar que A ∩ A′ é aberto, devemos mostrar que, dado um x ∈ A ∩ A′, temos B(x, r) ⊂ A ∩ A
para algum r > 0. Para isto, partimos do fato de que A e A′ são ambos abertos e que x pertence
aos dois; afinal, só assim x pode estar na interseção. Deduzimos:
x ∈ A ∩ A′ (intersecção)⇒
{
x ∈ A ⇒ ∃R > 0 : B(x, R) ⊂ A (porque A é aberto)
x ∈ A′ ⇒ ∃R′ > 0 : B(x, R′) ⊂ A (porque A′ é aberto)
Tomemos então r = min{R, R′}. Como R, R′ > 0, r > 0 também. Além disso, B(x, r) ⊂ B(x, R) ⊂
A e B(x, r) ⊂ B(x, R′) ⊂ A′, de modo que B(x, r) ⊂ A ∩ A′. Ou seja, mostramos que a “menor
das bolhas” que x tem dentro de A e A′ está inteiramente contida na interseção. 2
78
Exercı́cio 5.8 De modo geral, chamamos uma topologia T sobre X de metrizável se ela provem de uma
métrica, ou seja, se existe uma métrica sobre X tal que T = TdX . Mostre que existem topologias não
metrizáveis; por exemplo, a topologia grossa definida acima não é metrizável.
O estudo de espaços topológicos gerais é chamado de Topologia Geral. Esta área tem relações
profundas com a Lógica e a Teoria de Conjuntos. De fato, muitas propriedades que já estudamos
e ainda estudaremos são demonstradas com apelos simples às leis de DeMorgan para operações
com conjuntos. Por exemplo:
1. O complementar do complementar é o próprio conjunto. Fixo X, o complementar de S ⊂ X é
Sc := {x ∈ X : x 6∈ S} = X\S.
A operação complementar é idempotente: ou seja, (Sc)c = S.
2. O complementar da união é a interseção dos complementares. Com X como acima, se A é uma
coleção de subconjuntos de X,
(
⋃
A∈A
A)c =
⋂
A∈A
Ac.
Estas leis são uma ótima maneira de passarmos de propriedades de abertos para as de fecha-
dos. Por exemplo, o exercı́cio abaixo segue diretamente desse tipo de observação.
Exercı́cio 5.9 Mostre que, em qualquer espaço topológico, qualquer interseção de conjuntos fechados é
fechada. Prove ainda que a união de um número finito de conjuntos fechados resulta em outro conjunto
fechado. (Estes dois fatos seguem das leis sobre complementares de uniões e interseções aplicadas às propri-
edades dos abertos.)
5.2 Outros conceitos topológicos
Vamos definir aqui algumas outras noções topológicas e fazer alguns comentários sobre elas.
Começamos supondo apenas que (X, T ) é um espaço topológico e abertos e fechados são defi-
nidos a partir de T .
Definição 5.3 (Interior, fecho e fronteira) O interior de S ⊂ X, denotado por So, é definido por:
So :=
⋃
A⊂S : A aberto
A.
O fecho de S é:
S :=
⋂
F⊃S : F fechado
F.
A fronteira de S é ∂S := S ∩ Sc, onde Sc é definido como na seção anterior.
A primeira coisa para observar sobre estes conceitos é um resultado simples.
Proposição 5.1 Com as definições acima, So é aberto, enquanto S e ∂S são sempre fechados.
Prova: So é união de abertos, logo aberto. S é interseção de fechados, logo fechado. Por fim, ∂S é
a interseção de fechados, logo fechado. 2
79
Proposição 5.2 O complementar do fecho de S ⊂ X é o interior do complementar de S: (S)c = (Sc)o.
Prova: A principal observação na prova é que um conjunto F ⊂ X é um fechado com F ⊃ S se e
somente se A = Fc é um aberto com A = Fc ⊂ Sc. Isto decorre do fato que a operação de tomar
o complementar troca a ordem de inclusões (o que vale em geral para conjuntos) e também troca
fechados por abertos (o que sempre vale em espaços topológicos).
Dada a afirmação acima, e a regra para interseções e uniões de complementares, deduzimos:
(S)c =
( ⋂
F⊃S fechado
F
)c
=
⋃
F⊃S fechado
Fc =
⋃
A⊂Sc aberto
A = (Sc)o.
2
Agora vamos tentar pensar no que os conceitos significam, partindo do princı́pio que um
conjunto aberto “protege” seus elementos do mundo exterior (como falamos das bolhas acima).
Segue das regras da união que um ponto x ∈ X é elemento de So se e somente se existe um
aberto A ⊂ X com x ∈ A; isto é, x ∈ So se está “protegido do complementar de S”. Por esta
razão, o resultado abaixo é natural.
Proposição 5.3 S é aberto se e somente se S = So.
Prova: Se S = So, S é aberto porque So é aberto. Por outro lado, se S é aberto, o próprio S é um
daqueles conjuntos A ⊂ S abertos na definição do interior. Deduzimos:
S ⊂
⋃
A⊂S aberto
A = So ⊂ S⇒ So = S.
2
Para o fecho, temos um resultado análogo ao acima.
Exercı́cio 5.10 S é fechado se e somente se S = S.
Veremos agora que um ponto x ∈ X está em S se “não há como protegê-lo de S”.
Proposição 5.4 Dado x ∈ X,
x ∈ S⇔ “∀A ⊂ X aberto , x ∈ A⇒ A ∩ S 6= ∅.”
Prova: Provaremos a direção “⇐” em forma contrapositiva. Suponha que x ∈ X é dado e existe
um aberto A ⊂ X com x ∈ A e S ∩ A = ∅, ou melhor Sc ⊃ A. Note que F := X\A = Ac é um
fechado e S ⊂ F (pois tomar complementares inverte a relação de inclusão). Portanto, F é um
daqueles fechados que aparecem na interseção que define o fecho de S. Concluı́mos que S ⊂ F
e, como x ∈ A = Fc, temos x 6∈ S. Ou seja, um ponto x ∈ X “protegido” de S por um aberto
A 3 x com A ∩ S = ∅ não está no fecho de S.
Agora, provemos “⇒”. Suponha que x ∈ X é tal que, para todo aberto A ⊂ X com x ∈ A,
temos A ∩ S 6= ∅. Para mostrar que x ∈ S, é necessário e suficiente que x ∈ F para qualquer
fechado F ⊃ S. Tome então um tal F. Note que A = Fc = X\F é aberto e não intersecta S. Por
hipótese, todo aberto contendo x intersecta S: portanto, x 6∈ A. Como A e F são complementares,
deduzimos que x ∈ F, como querı́amos demonstrar. 2
80
Exercı́cio 5.11 Mostre que
∂S = {x ∈ X : ∀A ⊂ X aberto com x ∈ A, A ∩ S 6= ∅ e A ∩ Sc 6= ∅}.
Por fim, apresentamos mais uma definição topológica relacionada à de fecho. Como acaba-
mos de ver, x ∈ S se e somente se não está protegido de S. Isso pode acontecer simplesmente
porque x ∈ S, mas essa é a forma “boba” de estar desprotegido. O mais interessante é quando
um ponto não está protegido de S\{x}.
Definição 5.4 Dado x ∈ X e S ⊂ X, dizemos que x é ponto de acumulação de S se e somente se qualquer
aberto A ⊂ X com x ∈ A satisfaz A∩ (S\{x}) 6= ∅ (dá no mesmo pedir que A∩ S 6= ∅ e A∩ S 6= {x}).
Chamamos de S′ o conjunto de pontos de acumulação de S, também chamado de conjunto derivado de S.
Claramente, S = S ∪ S′ sempre. Um fato interessante é que o conjunto derivado é fechado
sempre que a topologia em questão satisfaz uma propriedade simples.
Proposição 5.5 Suponha que a topologia T é tal que todo conjunto unitário é fechado. S′ é fechado para
qualquer S ⊂ X.
Observação 5.1 Topologias com a propriedade de que todo conjunto unitário é fechado são chamadas de
T1. Sem esta propriedade, pode ser que S′ não seja fechado (veja os exercı́cios 5.27, 5.28 e 5.29 no fim da
seção). De qualquer modo, toda topologia que vem de uma métrica é T1, porque {x} = B[x, 0] é sempre
fechado.
Prova: Devemosmostrar que X\S′ é aberto. Para isso, vamos mostrar que X\S′ é uma união de
abertos Ax que definiremos a seguir.
Tome x ∈ X\S′, ou seja, um x que não é ponto de acumulação. Tal x está contido em um
aberto Ax 3 x tal que Ax ∩ S = ∅ ou {x}. Veja que A = ∪x∈X\S′Ax é aberto e que A ⊃ X\S′,
porque cada x no complementar de S′ está no seu Ax.
Para demonstrar que S′ é fechado, é suficiente mostrar que o aberto A é igual a X\S′. Como
já sabemos A ⊃ X\S′, basta mostrar que A ⊂ X\S′. Mais ainda, como A é a união dos Ax para
x ∈ X\S, basta provarmos que cada um destes conjuntos Ax está contido em X\S′. Ou seja,
queremos provar o seguinte:
Afirmação: Dado x ∈ X\S′, todo z ∈ Ax não é ponto de acumulação de S.
Se z = x isso já vale, então suporemos que z 6= x. Para provar que z não é ponto de
acumulação, temos de achar um aberto Oz 3 z com Oz ∩ S = ∅ ou {z}.
Vejamos que
Oz := Ax\{x} = Ax ∩ {x}c
funciona. Para argumentar que Oz e baerto, observamos que {x}c tem de ser aberto (o conjunto
unitário é fechado por hipótese!), logo Oz é interseção de dois abertos. Além disso, z ∈ Oz porque
z ∈ Ax e z ∈ {x}c (afinal, z 6= x). Por fim, sabemos que Ax ∩ S = ∅ ou Ax ∩ S = x, portanto
Oz ∩ S = ∅ obrigatoriamente. Ou seja, provamos que z ∈ Oz aberto e Oz ∩ S = ∅, o que garante
que z 6∈ S′. 2
Exercı́cio 5.12 Mostre que N′ = ∅ e Q′ = R (como subconjuntos de R, com a topologia dada pela
métrica usual).
81
5.3 Caracterizações métricas dos conceitos topológicos
A partir de agora, voltamos ao caso particular em que (X, dX) é espaço métrico e usamos sobre X
a topologia T(X,dX) que vem da métrica. Sabemos que, neste caso, os conjuntos fechados podem
ser identificados a partir de limites de sequências, ou seja, a partir da métrica. Agora veremos
como podemos fazer isso com os outros conceitos que estudamos.
Proposição 5.6 Dados S ⊂ X aberto, So é o conjunto dos x ∈ S tais que existe um δ > 0 com B(x, δ) ⊂
S.
Prova: Como vimos, acima x ∈ So se e somente se x ∈ A ⊂ S para um aberto A. Por esta razão,
todo ponto x ∈ S que está contido numa bola aberta B(x, δ) ⊂ S com δ > 0 satisfaz x ∈ So; afinal,
bolas abertas são abertos. Por outro lado, se x ∈ A ⊂ S com A aberto, sabemos que existe um
δ > 0 com B(x, δ) ⊂ A, de modo que B(x, δ) ⊂ S também. Por esta razão,
x ∈ B(x, δ) ⊂ S para algum δ > 0⇔ x ∈ A ⊂ S para algum A ⊂ S aberto.
Mas o lado direito desta equivalência vale se e somente se
x ∈
⋃
A⊂S aberto
A = So.
Portanto, qualquer x ∈ X tem uma “bolha protetora” dentro de S se e somente se x ∈ So, o que
conclui a prova. 2
Exercı́cio 5.13 Prove ainda que A ⊂ X é aberto se e somente se A = ∪B∈BB, onde B é uma coleção de
bolas abertas em X.
Proposição 5.7 Dado S ⊂ X, S é conjunto de pontos que são limites de sequências de X.
Prova: Suponha que {xn}n∈N ⊂ S é uma sequência que converge a x ∈ X. Veja que, para
qualquer fechado F ⊃ S,{xn}n∈N ⊂ F e portanto x = limn xn ∈ F. Portanto:
∀F ⊃ S fechado, x ∈ F, portanto x ∈
⋂
F⊃S fechado
F = S.
Por outro lado, tome x ∈ S. Pela Proposição 5.4 acima, qualquer aberto contendo x intersecta S.
Em particular, para qualquer δ > 0 tem-se B(x, δ) ∩ S 6= ∅. Concluı́mos pelo exercı́cio 5.5 que x
é o limite de uma sequência de pontos em S. 2
Corolário 5.2 ∂S é precisamente o conjunto dos pontos que são limites tanto de sequências em S, quanto
de sequências em Sc.
Exercı́cio 5.14 Mostre que S′ é o conjunto de pontos x ∈ X que são limites de sequências de pontos em
S\{x}.
Exercı́cio 5.15 Se S 6= ∅, S = {x ∈ X : d(x, S) = 0}.
82
5.4 Continuidade, abertos e fechados
Nosso objetivo nesta seção é apresentar a ideia de continuidade de forma topológica, ao invés da
forma métrica (via limites) que já mostramos acima. Na prova da equivalência a seguir, veremos
ainda uma outra definição métrica de continuidade.
Recorreremos a uma notação que será muito usada no que segue: dados f : X → Y e S ⊂ Y,
f−1(S) := {x ∈ X : f (x) ∈ S}.
Exercı́cio 5.16 Mostre que, dada uma famı́lia A de subconjuntos de Y,
f−1(∪A∈AA) = ∪A∈A f−1(A) e f−1(∩A∈AA) = ∩A∈A f−1(A).
Ou seja, f−1 “comuta” com uniões e interseções de conjuntos. Prove ainda que
f−1(Y\A) = X\ f−1(A).
Teorema 5.3 Sejam (X, dX) e (Y, dY) espaços métricos. Dada f : X → Y, as seguintes afirmações são
equivalentes.
1. f é contı́nua, isto é, se {xn}n ∪ {x} ⊂ X e xn → x (segundo a métrica dX), então f (xn) → f (x)
(segundo a métrica dY).
2. Para qualquer F ⊂ Y fechado em Y, f−1(F) ⊂ X é fechado em X.
3. Para qualquer A ⊂ Y aberto, f−1(A) ⊂ X é aberto.
4. Para todos x ∈ X e ε > 0, existe δ > 0 tal que:
∀x′ ∈ X : “dX(x, x′) < δ”⇒ “dY( f (x), f (x′)) < ε”.
Prova: Passo 1 ⇒ 2. Tome f contı́nua e F ⊂ Y fechado. Dada uma sequência convergente
{xn}n∈N ⊂ f−1(F) com limite x ∈ X, devemos provar que x ∈ f−1(F), ou seja, que f (x) ∈ F.
Mas isto é simples, já que f (xn)→ f (x) (por continuidade), { f (xn)}n∈N ⊂ F (já que xn ∈ f−1(F)
para cada n) e F é fechado (de modo que o limite de qualquer sequência convergente em F
também está em F).
Passo 2 ⇒ 3. Vem do exercı́cio anterior à prova juntamente com o fato de que A é aberto se e
somente se X\A é fechado.
Passo 3 ⇒ 4. Fixos ε > 0 e x ∈ X, vamos encontrar o δ desejado. Para fazer isto observe que
a bola BY( f (x), ε) ⊂ Y é um aberto de Y, de modo que (pelo item 3) f−1(BY( f (x), ε)) é aberto.
Como f (x) ∈ BY( f (x), ε), x é um elemento do aberto f−1(BY( f (x), ε)); pela definição de aberto,
isto implica que ∃δ > 0 tal que BX(x, δ) ∈ f−1(BY( f (y), ε)). Isto quer dizer que, para todo
x′ ∈ B(x, δ) – ou seja, todo x′ ∈ X com dX(x, x′) < δ – temos f (x′) ∈ BY( f (x), ε) – ou seja,
dY( f (x), f (x′)) < ε. Em outras palavras, o δ que apresentamos é precisamente o que tı́nhamos
de encontrar.
83
Passo 4 ⇒ 1. Suponha que xn → x em X; nosso objetivo é provar que limn f (xn) = f (x), ou
seja, que dado ε > 0 existe um n0 ∈ N tal que dY( f (xn), f (x)) < ε se n ≥ n0. Fixemos então um
ε > 0. Pelo item 4 podemos encontrar δ > 0 tal que dX(x′, x) < δ implica dY( f (x′), f (x)) < ε.
Como xn → x, existe n0 ∈ N tal que dX(xn, x) < δ sempre que n ≥ n0. Mas então temos
dY( f (xn), f (x)) < ε sempre que n ≥ n0. Ou seja, este n0 assegura a propriedade desejada. 2
Observação 5.2 No restante das notas, às vezes falaremos de funções contı́nuas entre espaços topológicos.
Neste caso, usaremos a definição dada pelos itens 2 e 3 acima, que são sempre equivalentes.
5.5 Topologia relativa
O resultado acima sobre continuidade só serve para o caso em que o domı́nio D da função f é
todo o espaço X. Mas e se D ⊂ X é um subconjunto próprio e f : D → Y? Não é difı́cil ver o
que acontece: se usamos sobre D a métrica induzida por X, então continuidade é equivalente à
seguinte condição:
∀A ⊂ Y aberto, f−1(A) ⊂ D é aberto na métrica induzida.
Isso suscita a pergunta: como sabemos se um dado subconjunto U ⊂ D é aberto na métrica
induzida? Isto também não é difı́cil de deduzir. Veja que
U ⊂ D é aberto ⇔ ∀x ∈ U ∃r > 0 BD(x, r) ⊂ U,
e ainda
BD(x, r) = {y ∈ D : dD(x, y) < r}
= {y ∈ X : y ∈ D e dX(x, y) < r}
= BX(x, r) ∩ D.
Ou seja
U ⊂ D é aberto ⇔ ∀x ∈ U ∃r > 0 BX(x, r) ∩ D ⊂ U.
Isto nos leva naturalmente à definição de topologia induzida. Note que ela não tem nada a
ver com a de métrica, em princı́pio.
Definição 5.5 Considere um conjunto X 6= ∅ munido de uma topologia TX. Dado D ⊂ X, a topologia
TD induzida por TX é definida como:
TD := {A ∩ D : A ∈ TX}.
Ou seja, U ∈ TD se existe um aberto A de X com U = A ∩ D.
Não é difı́cil provar que TD é mesmo uma topologia: a ideia é só mostrar que a união e a
interseção de conjuntos da forma A ∩ D é ela própria desta forma.
Teorema 5.4 Considere (X, dX). Dote D ⊂ X da métrica dD induzida por X. Considere as topologias
TdX e TdD induzidas pelas métricas de X e D, respectivamente. Então TdD é a topologia induzida por TdX
sobre D.
84
Prova: O que temos que provar é que:
U ⊂ D é aberto de D ⇔ ∃A ⊂ X abertode X com U = A ∩ D.
Começamos a prova pela direção “⇒”. Como observamos acima, U é aberto de D quando para
cada x ∈ U existe um raio rx > 0 tal que B(x, rx) ∩ D ⊂ U. Se definimos
A := ∪x∈U B(x, rx),
vemos imediatamente que A é aberto, posto que é uma união de abertos. Afirmamos que A ∩
D = U e provaremos isso mostrando A ∩ D ⊂ U e U ⊂ A ∩ D. De um lado, temos a inclusão
A ∩ D = ∪x∈U(B(x, rx) ∩ D) ⊂ U
por conta do fato que B(x, rx) ∩ D ⊂ U para cada x ∈ U. Por outro lado, cada x ∈ U pertence
a B(x, rx) ∩ D: isto quer dizer que todo x ∈ U pertence à união ∪x∈U(B(x, rx) ∩ D) = A ∩ D, o
que nos diz U ⊂ A ∩ D e termina a prova de que U = A ∩ D. Ou seja, dado U ⊂ D aberto,
encontramos A ⊂ X aberto de X com U = A ∩ D. Isto termina a prova da direção “⇒”.
Tratemos agora da direção “⇐”. Suponha que U = A ∩ D com A ⊂ X aberto de X. Dado
x ∈ X, devemos encontrar rx > 0 tal que BD(x, rx) = BX(x, rx)∩D ⊂ U = A∩D. Mas para isto é
evidente que basta pedir BX(x, rx) ⊂ A, o que é possı́vel (com algum rx > 0) exatamente porque
A é aberto em X. 2
Observamos o seguinte corolário dos resultados acima.
Corolário 5.3 Se D ⊂ X é aberto de X, então A ⊂ D é aberto na topologia relativa se e somente se é
aberto na topologia de X. O mesmo vale se trocamos “aberto” por “fechado”.
Prova: Faremos a prova apenas no caso de D aberto. Sabemos que, para que A ⊂ D seja aberto
de D, é necessário e suficiente que exista B ⊂ X aberto de X com A = B∩D. Em particular, se D
é aberto e tal B existe, o conjunto A é a interseção de dois abertos; portanto, ele próprio é aberto.
Por outro lado, se A é aberto de X, podemos escrever A = A∩D; ou seja, A e a interseção de
um aberto de X com D, sendo portanto um aberto da topologia relativa. 2
Exercı́cio 5.17 Dado um espaço métrico (X, dX), um subconjunto S ⊂ X é dito separado se infs′∈S\{s} dX(s, s′) >
0 para qualquer s ∈ S. Mostre que S é separado se e somente se a topologia induzida por T(X,dX) em S é a
topologia fina (aquela em que qualquer conjunto é aberto).
5.6 Mais exercı́cios
Exercı́cio 5.18 Dado (X, dX), mostre que F ⊂ X é fechado se e somente se existem um subconjunto
Γ ⊂ R que é fechado em R e uma função contı́nua f : X → R tal que F = f−1(Γ). Deduza um análogo
deste resultado para conjuntos abertos A ⊂ X.
Exercı́cio 5.19 Dado (X, dX), uma função f : X → R é semicontı́nua por baixo se
∀{xn}n∈N ⊂ X : xn → x ∈ X ⇒ lim inf
n∈N
f (xn) ≥ f (x).
Ou seja, f é semicontı́nua por baixo se não pode ter uma “salto para cima no limite”. Mostre que, para
qualquer f : X → R,
f é semicontı́nua por baixo⇔ ∀t ∈ R, f−1((−∞, t]) é fechado de X.
85
Exercı́cio 5.20 (Topologia de Zariski) Neste exercı́cio, apresentamos a “topologia de Zariski afim” so-
bre Rd. Ela é prima da “topologia de Zariski projetiva”, que é extremente importante em Geometria
Algébrica.
Dado um conjunto S de polinômios multivariados p : Rd → R, chamamos de variedade de S o
conjunto V(S) := {x ∈ Rd : ∀p ∈ S, p(x) = 0} (se S = ∅, tomamos V(S) = Rd por definição). Um
subconjunto A ⊂ Rd é (por definição) um aberto de Zariski se A = Rd\V(S) para algum S como acima.
Mostre que os abertos de Zariski formam uma topologia sobre Rd. Mostre ainda que todo aberto de Zariski
é aberto no sentido usual.
Exercı́cio 5.21 Considere um espaço-produto X = X1 × · · · × Xd com uma das métricas-produto dX
definidas no Exercı́cio 3.10 acima.
1. Para cada i = 1, . . . , d, tome um subconjunto aberto Ai ⊂ Xi. Prove que A1 × A2 × · · · × Ad é
aberto.
2. Mostre que um subconjunto A ⊂ X é aberto se e somente se ele pode ser escrito como a união de
conjuntos A1 × · · · × Ad, onde cada Ai é aberto do Xi correspondente.
Exercı́cio 5.22 Fixe um espaço métrico (X, dX). Tome alguma métrica produto sobre X × R. Dada
f : X → R, chamamos de gráfico de f o conjunto
gr( f ) := {(x, f (x)) : x ∈ X} ⊂ X×R
e de epı́grafo de f o seguinte conjunto
epi( f ) := {(x, t) : (x, t) ∈ X×R, t ≥ f (x)}.
1. Prove que, se f é contı́nua, então gr( f ) é fechado. A recı́proca vale?
2. Prove que, se f é semicontı́nua por baixo (como definimos no exercı́cio 5.19), epi( f ) é fechado. A
recı́proca vale?
Exercı́cio 5.23 Suponha que (X, dX) é completo e F ⊂ X. Mostre que F é fechado em X se e somente se
(F, dF) é completo, onde dF é a métrica induzida por (X, dX).
Exercı́cio 5.24 Dê um exemplo de espaço métrico (X, dX) onde X′ = ∅.
Exercı́cio 5.25 Considere um espaço de Banach (V, ‖ · ‖V). Como já vimos, um subespaço de V é um
subconjunto W ⊂ V contendo 0V e fechado pelas operações de espaço vetorial (isto é, para quaisquer
w, w′ ∈W e λ ∈ R, λ w + w′ ∈W).
1. Mostre que o fecho de um subespaço de V também é um subespaço de V.
2. Mostre que o interior de um subespaço W 6= V é vazio.
3. Fixo 0 ≤ ρ < 1, prove que um subespaço fechado W ⊂ V satisfaz W = V se e somente se ele tem a
seguinte propriedade: dado qualquer v ∈ V, existe um w ∈W com ‖v− w‖V ≤ ρ‖v‖V .
Exercı́cio 5.26 Considere as duas definições abaixo de separabilidade.
86
• Um espaço métrico (X, dX) é separável se possui um subconjunto enumerável denso; isto é, se existe
D ⊂ Rd enumerável tal que D = X.
• Um espaço topológico (X, TX) é separável se existe um subconjunto enumerável B ⊂ TX (chamado
de base enumerável da topologia) tal que qualquer aberto A ∈ TX pode ser escrito como uma união
de elementos de B.
Prove que o espaço métrico (X, dX) é separável (de acordo com a primeira definição) se e somente se o
espaço topológico correspondente (X, T(X,dX)) é separável (de acordo com a segunda definição). Deduza
que Rd e C(I, R) são espaços topológicos separáveis com suas topologias usuais.
Exercı́cio 5.27 Suponha que X tem pelo menos dois elementos e usamos a topologia grossa sobre ele.
Mostre que {x}′ = X\{x} não é fechado para qualquer x ∈ X. Ou seja, há exemplos simples de topologias
em que conjuntos derivados não são necessariamente fechados.
Exercı́cio 5.28 A topologia grossa é um tanto quanto patológica. Uma propriedade simples adicional que
pode se pedir de uma topologia é que ela seja T0:
Propriedade T0: dados dois pontos distintos x, x′ ∈ X, há um aberto A ⊂ X que contem
exatamente um destes pontos.
Esta propriedade é sutilmente diferente da T1 descrita acima, que é equivalente à propriedade abaixo:
Propriedade T1: dados dois pontos distintos x, x′ ∈ X, há um aberto A ⊂ X que contem x′ e não
x (e vice-versa).
Prove que esta formulação da propriedade T1 é equivalente à que vimos acima (todo conjunto unitário é
fechado).
Exercı́cio 5.29 Neste exercı́cio, apresentamos uma topologia T0 não-padrão (de acordo com a definição do
exercı́cio anterior) no espaço X = [−1, 1] para a qual {0}′ não é fechado. Definimos:
TX := {A ⊂ X : ∃t > 0, A ⊃ (−t, t)} ∪ {∅}.
1. Mostre que TX é de fato uma topologia sobre X.
2. Mostre que TX tem a propriedade T0, mas não tem a propriedade T1 (de fato, {0} não é fechado).
3. Calcule {0}′ e mostre que ele não é fechado segundo TX.
Exercı́cio 5.30 Dados um espaço de Banach (V, ‖ · ‖V) e subconjuntos A, B ⊂ V, a soma de Min-
kowski de A e B é definida por:
A + B := {a + b : (a, b) ∈ A× B}.
1. Prove que, A = BV [xA, rA] e B = BV [xB, rB] (com xA, xB ∈ V e rA, rB > 0), então A + B =
BV [xA + xB, rA + rB];
2. Mostre que, se um dentre A e B é aberto, então A + B é aberto;
3. Dê um exemplo em que V = R2, A e B são ambos fechados, mas A + B não é fechado.
87
Exercı́cio 5.31 Encontre os fechos, interiores e conjuntos de acumulação de cada um dos subconjuntos
abaixo de C = C([0, 1], R) (com a métrica usual).
D := { f ∈ C : ∃ f ′};
Mk := { f ∈ C : ∀i = 1, 2, . . . , k, f (1/i) < 1/i} (onde k ∈N\{0}).
Exercı́cio 5.32 Um espaço métrico (X, dX) é perfeito se X′ = X.
1. Prove que Rd é perfeito.
2. Prove que qualquer espaço métrico perfeito e completo não pode ser enumerável. (Em particular, um
subconjunto S 6= ∅ fechado e perfeito de um (X, dX) completo não é enumerável.)
88Capı́tulo 6
Compactos: teoria geral
Muitos problemas em Matemática Pura e Aplicada podem ser postos na forma de problemas de
minimização de funções sobre conjuntos.
Dado um conjunto S e uma função f : S → R, encontre s∗ ∈ S tal que f (s∗) ≤ f (s) para
todo s ∈ S.
São exemplos de problemas deste tipo: achar o mı́nimo de uma função f : U ⊂ Rd → R;
de achar a curva de menor comprimento ligando dois pontos em uma superfı́cie; e achar uma
superfı́cie de área mı́nima para um contorno dado. Note que nem todo problema desta forma
tem solução. Por exemplo, a função f (x) = −1/x não atinge um valor mı́nimo no domı́nio
S = (0,+∞).
Como veremos abaixo, espaços compactos têm a propriedade de que toda função contı́nua
atinge seu ı́nfimo e seu supremo. Nossa discussão deste conceito começa na Topologia Geral,
de maneira bem abstrata. Depois, veremos que, no caso métrico, essa definição tem várias
reformulações interessantes. No Teorema 6.2, veremos algumas versões equivalentes para ele.
De fato, veremos que cada uma das condições abaixo (em forma mais precisa) é equivalente a pedir
que (X, dX) seja compacto:
1. toda função contı́nua de X em R atinge seu ı́nfimo e seu supremo;
2. toda função contı́nua de X em R é limitada;
3. o espaço não tem buracos e é bem aproximado por subconjuntos finitos, a menos de um
erro e arbitrariamente pequeno;
4. toda sequência em X tem subsequência convergente.
Outros teoremas serão provados mostrando propriedades boas de compactos; por exemplo,
toda função contı́nua sobre um compacto é uniformemente contı́nua.
Um ponto interessante é que, na lista acima, condições 1 e 2 falam de funções contı́nuas e as
3 e 4 são “geométricas”. Entender a relação entre comportamento de funções e “geometria” do
espaço um problema fundamental. Como veremos, o estudo da conexidade é outro exemplo
nesta categoria.
89
6.1 Compactos do ponto de vista de Topologia Geral
A definição de um espaço compacto usando apenas Topologia é um tanto quanto abstrata.
Mesmo assim, veremos que ela serve para provar alguns resultados interessantes.
Definição 6.1 Um espaço topológico (X, T ) é dito compacto se, dada qualquer coleção de abertosA ⊂ T
com X = ∪A∈AA, então existe uma subcoleção B ⊂ A, com B finito, tal que X = ∪A∈BA. Um
subconjunto K ⊂ X é dito compacto se é compacto com a topologia induzida, isto é, dada qualquer coleção
de abertos A ⊂ T com K ⊂ ∪A∈AA, então existe uma subcoleção F ⊂ B, com B finito, tal que
X ⊂ ∪B∈BB.
É bom explicarmos brevemente o “isto é” acima. Lembre que os abertos de K são os conjuntos
da forma Ã = A∩K com A ⊂ X aberto. Uma coleção de abertos Ã de K é, portanto, uma coleção
de conjuntos com a forma Ã{A ∩ X : A ∈ A}, onde A é uma coleção de abertos de X. Usando
as regras de De Moivre, obtemos:
⋃
Ã∈Ã
Ã =
⋃
A∈A
(A ∩ K) =
( ⋃
A∈A
A
)
∩ K.
Portanto,
K =
⋃
Ã∈Ã
Ã⇔ K ⊂
⋃
A∈A
A.
Do mesmo modo, uma subcoleção finita B̃ ⊂ Ã de abertos de K cobre K se e somente se a
subcoleção finita B ⊂ A correspondente de abertos de X satisfaz K ⊂ ∪A∈BA.
Normalmente a definição de compacto é resumida dizendo-se o seguinte: um conjunto é
compacto se qualquer cobertura dele por abertos tem uma subcobertura finita. Será útil termos
uma forma equivalente dessa definição que envolve conjuntos fechados.
Proposição 6.1 Um espaço topológico (X, T ) é compacto se e somente se ele tem a chamada ”propriedade
da interseção fechada”, que é a seguinte: dada qualquer coleção F de fechados de X, ∩F∈F F = ∅ se e
somente se existe uma subcoleção finita G ⊂ F com ∩F∈GF = ∅.
Prova: Este é mais um daqueles argumentos em que usamos o fato de que os complementares
de fechados são abertos e o complementar de uma união é uma interseção.
Vejamos. Dada uma coleção de fechados F , temos uma coleção de abertos A feita pelos
complementares dos elementos de F . Do mesmo modo, podemos passar de uma coleção de
abertos A para uma coleção de fechados F .
Agora observe que: ⋂
F∈F
F = ∅⇔ (
⋂
F∈F
F)c =
⋃
F∈F
Fc = ∅c = X.
Ou seja, ⋂
F∈F
F = ∅⇔
⋃
A∈A
A = X;
ou ainda, dizendo de outro modo, uma coleção de fechados tem interseção vazia se e somente se
a coleção de abertos correspondente cobre X.
90
Do mesmo modo, existe um G ⊂ F finito com ∩F∈GF = ∅ se e somente se existe uma
subcoleção B ⊂ A, formada pelos complementares dos elementos de G, tal que
⋃
A∈B
A =
⋃
F∈G
Fc =
(⋂
F∈G
F
)c
= ∅c = X.
Ou seja, subfamı́lias finitas de F que têm interseção vazia correspondem exatamente às subco-
berturas finitas de X.
Com o que já fizemos, a prova da equivalência fica direta. 2
A propriedade da interseção finita nos dá um bom critério para determinarmos que um
espaço não é compacto. Eis alguns exemplos disso.
Exemplo 6.1 (R não é compacto) A reta não é compacta com sua topologia usual. Para ver isso, notem
que os intervalos da forma (−∞, t], com t ∈ R são uma coleção de fechados com interseção vazia. Ao
mesmo tempo, dados t1, . . . , tk ∈ R,
k⋂
i=1
(−∞, ti] = (−∞, min
1≤i≤k
ti] 6= ∅.
Exercı́cio 6.1 Prove que forma análoga que Rd e C([0, 1], R) não são compactos com suas topologias
usuais.
Exemplo 6.2 (Intervalos abertos e semiabertos não são compactos) Considere agora um subconjunto
S da reta da forma S = (a, b] ou S = (a, b), com a < b reais. Use em S a topologia induzida pela tradicio-
nal em R. Veja que a coleção:
F := {(a, t] : t ∈ (a, b)}
é uma coleção de fechados de S na topologia relativa ((a, t] = (−∞, t] ∩ S). Seguindo o raciocı́nio do
exercı́cios anterior, vê-se que ∩F∈F F = ∅, mas qualquer subcoleção finita tem interseção não-vazia.
Uma tarefa mais difı́cil será provar que um espaço topológico é, sim, compacto. Não tratare-
mos disso nesta seara de espaços topológicos, com a exceção do exemplo abaixo.
Exercı́cio 6.2 Considere a topologia discreta (ou ”fina”) sobre um X 6= ∅ em que todos os subconjuntos
são abertos. Mostre que X é compacto com esta topologia se e somente se ele é finito.
O principal resultado sobre conjuntos compactos nesta seção é o Teorema 6.1 abaixo, que
diz que funções reais contı́nuas sobre compactos sempre atingem seus ı́nfimos. Antes dele, no
entanto, há outras coisas interessantes para provar, que são um tanto quanto mais fáceis. Vamos
a elas.
O primeiro desses resultados mais diretos nos diz que ”fechado em compacto também é
compacto”.
Proposição 6.2 Um subconjunto fechado de um espaço topológico compacto é compacto.
Prova: De fato, seja (X, T ) compacto e considere F ⊂ X fechado.
Se F ⊂ ∪A∈AA, onde A é uma coleção de abertos de X, então Ã := A∪ {Fc} é uma coleção
de abertos que cobre todo X; afinal, todo ponto de X ou está em F, e é coberto por A, ou não
está em F, e é coberto por Fc.
Como (X, T ) é compacto, Ã tem uma subcobertura finita B̃. Tomando B := B̃\{Fc}, temos
uma subcoleção de A que cobre F. 2
91
O próximo resultado fala que ”a imagem de um compacto por uma função contı́nua é sempre
um compacto”.
Proposição 6.3 Considere dois espaços topológicos (X, TX) e (Z, TZ). Se (X, TX) é compacto e f : X →
Z é contı́nua, então a imagem de f , f (X) ⊂ Z, é compacta.
Prova: Suponha que X Z e f são como acima. Tome uma cobertura A qualquer de f (X) por
abertos de Z: isto é, f (X) ⊂ ∪A∈AA. Mostraremos que A tem uma subcobertura finita.
Como f é contı́nua, os conjuntos f−1(A) com A ∈ A são abertos de X; além disso, eles
cobrem X porque, para cada x ∈ X, f (x) ∈ ∪A∈AA e portanto existe um A ∈ A com f (x) ∈ A e
x ∈ f−1(A)
Por hipótese, X é compacto. Logo, existe uma subcoleção finita B ⊂ A com X = ∪A∈B f−1(A).
Mas note que f (X) ⊂ ∪A∈BA porque, dado z = f (x) ∈ f (X), existe um A ∈ B com x ∈ f−1(A)
e z = f (x) ∈ A. 2
Agora, sim, mostraremos que toda função contı́nua sobre um espaço topológico atinge seu
ı́nfimo.
Teorema 6.1 Se (X, T ) é um espaço métrico compacto, então, dada uma função contı́nua f: X → R,
existe um x? ∈ X com f (x?) = infx∈X f (x). Em particular, infx∈X f (x) > −∞.
Exercı́cio 6.3 Prove que o supremo de f também é atingido.
Prova: Na verdade, nossa prova mostra que toda função semicontı́nua por baixo atinge o ı́nfimo. Por
definição, uma f : X → R é semicontı́nua por baixo se, dado qualquer t ∈ R, o conjunto
Ft := f−1((−∞, t])
é fechado (veja o exercı́cio 5.19 acima para uma caracterização equivalente). Como (−∞, t] é
fechado de R, toda função contı́nua de X em R é semicontı́nua por baixo.
Em toda prova, faremos referência ao ı́nfimo de f : infx∈X f (x). Isso pode parecer suspeito,
pois ainda não temos como garantir que os valores de f são mesmo limitados por baixo. A
verdade é que isso não importa. Admitimos que, em princı́pio, seria possı́vel que infx∈X f (x) =
−∞. Nada do que dizemos abaixo é afetado por essa possibilidade, que será finalmente afastada
no fim da prova.
Vamos, então, fazer uma afirmação envolvendo o ı́nfimo, que diz respeito aos conjuntos Ft.
Ft 6= ∅ para qualquer t > inf
x∈X
f (x). (6.1)
Afinal, se t > infx∈X f (x), t não é cota inferior para os valores de f e há pelo menos um xt ∈ X
com f (xt) ≤ t, o que quer dizer xt ∈ f−1((−∞, t]) = Ft.
Feita essaa afirmação, vem um passo crucial: a observação de que
(?)
⋂
t>infx∈X f (x)
Ft = {x? ∈ X : f (x?) = inf
x∈X
f (x)}.
Na verdade, vale igualdade acima. Aqui dizemos que, se a interseção do lado esquerdo não for vazia, o
ı́nfimo de f é atingido.
92
Para provar a igualdade (?), observe primeiro que, se há de fato um x? atingindo o ı́nfimo,
ele está na interseção do lado esquerdo. Por outro lado, se x? está na interseção, sabemos que
f (x?) ≥ infx∈X f (x) (o ı́nfimo é cota inferior para todo mundo) e
∀t ∈ R : t > inf
x∈X
f (x)⇒ x? ∈ Ft ⇒ f (x?) ≤ t.
Isto quer dizer:
∀t ∈ R : t > inf
x∈X
f (x)⇒ inf
x∈X
f (x) ≤ f (x?) ≤ t, ou seja, f (x?) = inf
x∈X
f (x).
Note que provamos (?) sem supôr a priori que infx∈X f (x) > −∞!
Resulta de (?) que a existência de um ponto x? ∈ X atingindo o ı́nfimo de f é equivalente
a
⋂
t>infx∈X f (x) Ft 6= ∅. Para provar que a interseção não é vazia, usaremos a propriedade da
interseção finita. Em forma contrapositiva, essa propriedade nos diz que, se todas as subcoleções
finitas dos Ft com t > infx∈X f (x) não têm interseção vazia, o mesmo vale para a interseção de
toda a coleção.
Tome, então, uma coleção finita dos Ft: Ft1 , . . . , Ftk , com cada ti > infx∈X f (x). Queremos
demonstrar que a interseção destes conjuntos não é vazia. Para isso, voltamos ao Exemplo 6.1,
sabemos que
k⋂
i=1
(−∞, ti] = (−∞, min
1≤i≤k
ti]
e portanto
k⋂
i=1
Fti =
k⋂
i=1
f−1((−∞, ti])
= f−1
(
k⋂
i=1
(−∞, ti]
)
= f−1
(
(−∞, min
1≤i≤k
ti]
)
= Fmin1≤i≤k ti .
Como cada ti > infx∈X f (x), min1≤i≤k ti > infx∈X f (x) também e (6.1) implica que Fmin1≤i≤k ti 6= ∅,
como querı́amos demonstrar.
Terminamos recapitulando a prova de trás para frente. Acabamos de mostrar toda subcoleção
finita dos Ft com t > infx∈X f (x) tem interseção não-vazia. Como os Ft são fechados e X é com-
pacto, a propriedade da interseção finita implica que
⋂
t>infx∈X f (x) Ft 6= ∅. Portanto, a identidade
(?) garante que há pelo menos um ponto x? em que f atinge o ı́nfimo. 2
6.2 Espaços métricos compactos: o grande teorema de equivalência
A partir de agora, vamos nos restringir a espaços métricos, sempre usando a topologia métrica.
Nosso principal resultado será uma série de equivalências descritas no próximo teorema.
93
Teorema 6.2 Dado um espaço métrico (K, dK) com a topologia T(K,dK) dada pela métrica, as seguintes
afirmações são equivalentes.
1. (K, T(K,dK)) é compacto;
2. para qualquer função contı́nua f : K → R, existem x−, x+ ∈ K com infx∈K f (x) = f (x−) e
supx∈K f (x) = f (x+);
3. toda função contı́nua f : K → R é limitada por cima e por baixo, isto é, −∞ < infx∈K f (x) ≤
supx∈K f (x) < +∞;
4. (K, dK) é um espaço métrico completo e totalmente limitado (isto quer dizer que, dado um e > 0
qualquer, K pode ser coberto por um número finito de bolas de raio e);
5. (K, dK) é sequencialmente compacto, isto é, toda sequência {xn}n∈N ⊂ K possui uma subsequência
convergente {xnk}k∈N com limite x ∈ K;
Note que aqui supomos que nosso interesse é saber se um espaço métrico ”inteiro” é com-
pacto. Na próxima seção, especializamos esse teorema para o caso de subconjuntos K ⊂ X e
teremos de falar da topologia induzida.
A prova do Teorema 6.2 será trabalho pra várias subseções. No entanto, algumas etapas são
bastante simples e podemos apresentá-las aqui.
Proposição 6.4 Considere um espaço métrico (K, dK) que tem a propriedade 2 do Teorema 6.2. Então ele
também tem a propriedade 3 do mesmo teorema.
Prova: Suponha que K satisfaz o item 2, tome f : K → R e defina m± = f (x±) como no dito
item. Como f tem valores reais, m−, m+ ∈ R. Além disso, sabemos que m− = infx∈K f (x) e
m+ = supx∈K f (x). Portanto, f (K) ⊂ [m−, m+] e f é limitada. 2
O próximo resultado normalmente é provado (num caso particular) em cursos de Análise na
Reta.
Proposição 6.5 Considere um espaço métrico (K, dK) que tem a propriedade 5 do Teorema 6.2. Então ele
também tem a propriedade 2 do mesmo teorema.
Prova: Supondo a propriedade 5, mostraremos que vale a 2. Mais precisamente, mostraremos
que existe um ponto em que f atinge seu ı́nfimo; a prova para o supremo é análoga (ou então
você pode achar o ponto em que − f atinge o ı́nfimo, o que é o mesmo que o ponto em que f
atinge o supremo).
Tome m− := infx∈K f (x). Em princı́pio, pode ser que m− ∈ R ou m− = −∞. De um modo
ou de outro, é possı́vel achar uma sequência de números reais {mn}n∈N ⊂ R, todos estritamente
maiores que m−, mas escolhidos de modo que mn → m−.
Para cada n, temos então que mn > m− = infx∈X f (x): por esta razão, existe um xn ∈ K com
m− ≤ f (xn) ≤ mn. Usando a propriedade 5, podemos escolher uma subsequência {xnk}k∈N com
xnk → x− ∈ K. Note que também temos mnk → m− já que {mnk}k∈N é subsequência de uma
sequência que converge a m−. Como f é contı́nua, temos que f (xnk)→ f (x−); mas então
m− ≤ f (x−) = lim
k→+∞
f (xnk) ≤ limk→+∞ mnk = m−.
Concluı́mos que f (x−) = m−, isto é, x− atinge o ı́nfimo de f sobre K. 2
94
Cumpridos esses passos simples, partimos para a tarefa mais complicada que é provar todos
os demais itens do Teorema 6.2. Um roteiro para a prova é dado logo a seguir.
6.2.1 Roteiro da prova
Fixe um espaço métrico (K, dK). Acima provamos vimos acima que 1⇒ 2 (Teorema 6.1) e 2⇒ 3
(Proposição 6.4). Vimos ainda que 5⇒ 2 (Proposição 6.5).
Como próximos passos, veremos que um espaço métrico onde toda função contı́nua é li-
mitada tem de ser completo (§6.2.2) e totalmente limitado (§6.2.3). Juntas, essas duas provas
mostram 3⇒ 4 no Teorema.
Depois, mostraremos no §6.2.4 que um espaço métrico completo é sequencialmente compacto;
isto é a implicação 4⇒ 5 no Teorema.
Neste ponto da prova, já saberemos que 1⇒ 2 e que 2⇒ 3⇒ 4⇒ 5⇒ 2. Portanto, 2 a 5 são
equivalentes e uma forma de terminar a prova é mostrar que estas propriedades juntas implicam
1. É isso que será feito no §6.2.5, onde a prova será encerrada.
6.2.2 Compactos são completos
Começamos com o fato de que todo compacto é completo do ponto de vista métrico. Isto é um
pedaço da prova que 3⇒ 4 no Teorema 6.2.
Lema 6.1 Qualquer espaço métrico compacto (K, dK) tal que funções contı́nuas de K em R são limitadas
é um espaço métrico completo.
Prova: Vamos provar que se K não é completo, então há uma função contı́nua de K em R sem cota
inferior.
Suponha que K não é completo: existe {xn}n∈N ⊂ K que é Cauchy, mas não converge a
qualquer elemento em K. O Exemplo 4.3 acima mostra que
g(x) := lim
n∈N
dK(x, xn) (x ∈ K)
é contı́nua. Veja que
g(xm) = lim
n∈N
dK(xm, xn) ≤ sup
n≥m
dK(xn, xm)→ 0 quando m→ +∞
porque {xn}n é Cauchy. Logo g(xm) → 0 quando m cresce. Por outro lado, g(x) > 0 paratodo
x porque, se não, dK(x, xn) → 0 e x seria o limite de xn, que supomos não existir. Portanto
a imagem de g está contida em (0,+∞). Como a função x 7→ 1/x é contı́nua sobre (0,+∞),
deduzimos que
f (x) :=
1
limn dK(xn, x)
=
1
g(x)
é contı́nua e f (xm) → +∞ quando m → +∞, de modo que f não tem cota superior. Segue que
K não é compacto. 2
95
6.2.3 Cobertura, empacotamento e limitação total
Agora consideramos o conceito de ”totalmente limitado” que apresentamos no item 4 do Teorema
6.2. Antes disso, definimos os números de e-cobertura e empacotamento de um subconjunto de
um espaço métrico. É conveniente enunciar essas definições no caso de subconjuntos de um
espaço métrico maior.
Definição 6.2 Fixe um espaço métrico (X, dX). Dado um subconjunto K ⊂ X, dizemos que um sub-
conjunto R ⊂ K é uma e-rede para K se para qualquer x ∈ K existe um x′ ∈ R com dX(x, x′) ≤ e.
Chamamos de número de e-cobertura de K, N(K, e), o menor n ∈ N ∪ {+∞} tal que K possui uma
e-rede com n elementos. K é dito totalmente limitado se N(K, e) < +∞ para todo e > 0.
Uma maneira de pensar na definição de ”totalmente limitado” é a seguinte. Uma e-rede é
uma ”discretização”para K em que todo ponto é representado com ”precisão”e. Portanto, K é
totalmente limitado se e somente se, para qualquer precisão escolhida, ele tem uma discretização
finita com esta precisão.
Antes de seguir, notamos o seguinte fato: N(K, e) ≤ n se e somente se existem x1, . . . , xn ∈ K
com K ⊂ ∪ni=1BX[xi, e] (exercı́cio). Se K = X, então o contenimento se transforma em K =
∪ni=1BK[xi, e].
Os números de empacotamento são uma espécie de ”dual”dos números de cobertura. Isso
ficará claro quando apresentarmos a proposição a seguir.
Definição 6.3 Fixe um espaço métrico (X, dX). Dado um subconjunto K ⊂ X, dizemos que um Q ⊂ K
é um δ-empacotamento em K (com δ > 0) se quaisquer x, x′ ∈ Q com x 6= x′ satisfazem dX(x, x′) > δ.
Chamamos de número de δ-empacotamento de K, P(K, δ), o supremo sobre todos os n ∈ N tais que K
possui um δ-empacotamento com n elementos.
Proposição 6.6 Usando a notação acima, as desigualdades abaixo valem para quaisquer K ⊂ X e e > 0:
N(K, e) ≤ P(K, e) ≤ N(K, e/2).
(Em particular, K é totalmente limitado se e somente se P(K, e) < +∞ para todo e > 0.)
Prova: Vamos começar mostrando que P(K, e) ≤ N(K, e/2).. Para isso, basta supor que N(K, e/2) =
m ∈N, pois o caso N(K, e/2) = ∞ é trivial. Considere, então, uma e/2-rede x1, . . . , xm em K. Isto
quer dizer que K é coberto pelas m bolas BX[xi, e/2]. Afirmo que um e-empacotamento em K não
pode conter mais do que um elemento em cada uma dessas bolas; afinal, quaisquer dois elemen-
tos q, q′ ∈ BX[xi, e/2], então dX(q, q′) ≤ dX(q, xi) + dX(q′, xi) ≤ e. Da afirmação conclui-se que
qualquer e-empacotamento em K tem no máximo m elementos, o que demonstra P(K, e) ≤ m.
Agora provamos que N(K, e) ≤ P(K, e). Se P(K, e) = +∞, não há o que mostrar. Em
caso contrário, P(K, e) = k ∈ N e pode-se tomar um empacotamento Q ⊂ K com k elementos.
Mostraremos que Q também é uma e-rede para K, o que mostra que N(K, e) ≤ k.
Para mostrar que Q é uma e-rede, tomamos um x ∈ K arbirtrário e mostramos que existe um
q ∈ Q com dX(x, q) ≤ e. Isso é trivial se x ∈ Q, portanto suporemos x 6∈ Q.
Neste caso, o conjunto Q∪ {x} tem mais elementos que Q. A cardinalidade de Q é o tamanho
do maior e-empacotamento em K. Sendo assim, Q ∪ {x} não é e-empacotamento. Portanto, há
dois elementos distintos q1, q2 ∈ Q ∪ {x} a distância no máximo e um do outro. Como Q é
e-empacotamento, não pode ser verdade que q1, q2 ∈ Q: um dos dois tem de ser x e o outro, um
q ∈ Q. Logo, dX(x, q) ≤ e para este q, como querı́amos demonstrar. 2
96
Um último fato sobre conjuntos que não são totalmente limitados será importante a seguir.
Note que, se K não é totalmente limitado, então há δ-empacotamentos em K com tamanho finito,
mas arbitrariamente grande. Abaixo vemos que há, de fato, um empacotamento infinito em
qualquer conjunto que não é totalmente limitado.
Proposição 6.7 Com a notação acima, se K ⊂ X não é totalmente limitado, então existe um e-empacotamento
dentro de K com cardinalidade infinita, para algum e > 0.
Prova: Se K não é totalmente limitado, então N(K, e) = +∞ para algum e > 0. Portanto, qualquer
subconjunto finito de K não é uma e-rede. Com base nisso, podemos construir uma sequência de
pontos da seguinte forma.
1. Escolha x1 ∈ K arbitrariamente.
2. Dados x1, . . . , xn ∈ K, escolha xn+1 ∈ K de modo que dX(xn+1, xi) > e para todo 1 ≤ i ≤ n
(esse ponto existe porque {x1, . . . , xn} não é e-rede).
É fácil verificar que o conjunto S := {xn : n ∈N} ⊂ K é um e-empacotamento infinito. 2
Agora podemos relacionar funções contı́nuas ao fato do espaço métrico ser ou não totalmente
limitado.
Lema 6.2 Considere um espaço métrico (K, dK) tal que que funções contı́nuas de K em R são sempre
limitadas. Então (K, dK) é totalmente limitado.
Prova: Vamos mostrar que um espaço métrico (X, dX) que não é totalmente limitado tem uma
função contı́nua f : X → R com supx∈X f (x) = +∞. Para isto, usamos a Proposição 6.7:
ela garante que, para algum δ > 0, há um δ-empacotamento S ⊂ X de cardinalidade infinita:
d(s, s′) ≥ δ para quaisquer elementos distintos s, s′ ∈ S. Sem perda de generalidade, suporemos
que S é enumerável e escreveremos S = {sj : j ∈ N}. Nosso objetivo será construir uma função
contı́nua f : X → R com sup{ f (x) : x ∈ S} = +∞. Na verdade, mostraremos o seguinte
resultado.
Afirmação 6.1 Existe uma função g : X → R tal que g(x) > 0 para todo x ∈ X, ‖g‖Lip ≤ 1 e
g(sj) ≤ 1/(j + 1) para todo j ∈N.
Esta g toma valores estritamente maiores que 0 em todo ponto, mas g(sj) → 0 quando j →
+∞. Em particular, se definimos
f (x) :=
1
g(x)
(x ∈ X),
podemos observar que f é contı́nua (já que o denominador não se anula) e f (sj) ≥ j + 1 → +∞
quando j→ +∞; deste modo, f não é limitada.
Para construir g, vamos fazer uma colagem de várias funções. Para cada j ∈ N, definimos
uma função gj : X → R da seguinte forma:
gj(x) := d(x, sj) +
1
j + 1
(x ∈ X).
97
Claramente, ‖gj‖Lip ≤ 1 e gj(x) ≥ 1/(j + 1) > 0 para todo x ∈ X. Agora defina g : X → R pela
receita:
g(x) := inf
j∈N
gj(x) (x ∈ X).
Note que g(x) ∈ R está bem definida porque os valores de gj(x) são limitados por baixo por 0
para qualquer x ∈ X, e portanto o ı́nfimo na definição sempre nos dá um número real. Além
disso, ‖g‖Lip ≤ supj∈N ‖gj‖Lip ≤ 1 pelo Exercı́cio 4.16. Note ainda que:
∀k ∈N : g(sk) = inf
j∈N
gj(x) ≤ gk(sk) =
1
k + 1
.
Para terminar a prova da Afirmação, precisamos mostrar que g(x) > 0 para todo x ∈ X. Para
isso, fixamos x ∈ X e observamos duas possibilidades.
• Se d(x, sj) ≥ δ/2 para todos j ∈N, deduzimos que
gj(x) = d(x, sj) ≥ δ/2 > 0
pra todo j ∈N. Isto quer dizer que
δ
2
é cota inferior para {gj(x) : j ∈N};
como o ı́nfimo é a maior cota inferior, deduzimos que
g(x) = inf
j∈N
gj(x) ≥
δ
2
> 0.
• Agora suponha que d(x, sk) < δ/2 para algum k ∈N (o que em particular ocorre se x = sk).
Observe que, dado qualquer outro ı́ndice ` ∈ N\{k}, podemos usar o fato de que {sj}j∈N
é δ-empacotamento para deduzir que
δ < d(sk, s`) ≤ d(sk, x) + d(x, s`) <
δ
2
+ d(x, s`),
donde segue d(x, s`) > δ/2. Portanto, temos que
gk(x) ≥
1
k + 1
e g`(x) ≥ d(x, s`) ≥
δ
2
quando ` 6= k.
Deduzimos que
δ′ := min
{
δ
2
,
1
k + 1
}
é cota inferior para {gj(x) : j ∈N}
e, como antes, obtemos g(x) ≥ δ′ > 0.
2
98
6.2.4 O critério das subsequências convergentes
Nesta subseção vamos mostrar que a compacidade de um espaço métrico pode ser avaliada a
partir de subsequências. Na verdade, o que faremos será mostrar que, num espaço métrico
completo e totalmente limitado, toda sequência tem uma subsequência que converge a um limite
dentro do espaço.
Primeiro, lembremos o que são subsequências.
Definição 6.4 Dados um conjunto infinito N ⊂ N e uma sequência {xn}n∈N, a subsequência {xn}n∈Né definida da forma {x̃j}j∈N com x̃j := {xnj}, onde n1 < n2 < n3 < . . . é a única enumeração crescente
dos elementos de N. Também escrevemos {xnj}j∈N diretamente. Falamos que limn∈N xn = x se xnj → x
quando j→ +∞.
Exercı́cio 6.4 Mostre que xn → x implica xnj → x.
Agora provamos a implicação 4⇒ 5 do Teorema 6.2.
Proposição 6.8 Um espaço métrico completo e totalmente limitado é sequencialmente compacto, isto é:
toda sequência nesse espaço tem uma subsequência que converge nesse mesmo espaço.
Prova: Fixe um espaço métrico (K, dK) que é completo e totalmente limitado. Dada {xn}n∈N ⊂
K, nosso principal objetivo será provar que {xn}n∈N possui uma subsequência de Cauchy. Como
(K, dK) é completo, isto basta para provar que sempre há uma subsequência convergente.
Não é muito simples achar esta subsequência buscada. Começamos a busca por ela com um
resultado mais fraco que apenas garante o seguinte: sempre há uma subsequência “apertada”.
Afirmação 6.2 Dado qualquer r > 0 existe subsequência {xn}n∈N com dK(xm, xn) < r para todos
m, n ∈ N.
De fato, como estamos supondo que K é totalmente limitado, a Proposição 6.7 nos diz que
podemos cobrir K por um número finito de bolas de raio r/2. Como o número de bolas é finito,
uma das bolas, que chamaremos de B(z, r/2), é tal que o conjunto
N := {n ∈N : xn ∈ B(z, r/2)}
é infinito, e um argumento simples mostra que {xn}n∈N tem a propriedade desejada.
O que vem a seguir é uma espécie de “truque diagonal” que mostra como esta afirmação
pode ser usada para achar uma subsequência de Cauchy. A primeira ideia deste truque diagonal é
que, aplicando a afirmação infinitas vezes, podemos encontrar subsequências encaixadas e cada
vez mais apertadas. Mais precisamente:
1. A afirmação implica que existe N1 ⊂ N infinito tal que dK(xn, xm) < 1/2 para todos
n, m ∈ N1.
2. Suponha (recursivamente) que existem conjuntos infinitos N1 ⊃ N2 ⊃ · · · ⊃ Nk, todos
contidos em N, tais que, para qualquer 1 ≤ i ≤ k e quaisquer n, m ∈ Ni, vale a desigualdade
dK(xn, xm) < 2−i. Vamos mostrar como construir um conjunto Nk+1 de forma a estender
por mais um passo esta construção. Para isto, aplicaremos a afirmação à sequência
{xnj}j∈N onde {nj : j ∈N} = Nk.
99
com r = 2−k−1. Isto nos dá um conjunto N e podemos definir Nk+1 := {nj : j ∈ N}, de
modo a termos as propriedades desejadas.
Nossa tarefa final é extrair destas subsequências encaixadas e cada vez mais apertadas uma
subsequência de Cauchy. Uma tentativa poderia ser definir {xn}n∈Ñ com Ñ := ∩kNk, mas isto
não pode funcionar em geral: afinal,
n, m ∈ Ñ ⇒ n, m ∈ Nk para todo k⇒ ∀k ∈N, dK(xn, xm) ≤ 2−k ⇒ xn = xm.
Ou seja, para que nosso truque não falhe, é necessário que a sequência original tenha infinitos
termos iguais.
A segunda ideia do truque diagonal é uma maneira “diagonal” de selecionar um subconjunto
infinito N∗ de modo que N∗ ⊂ Nk “quase vale”, isto é, N∗\Nk tem apenas um número finito de
termos. Vamos escrever
N∗ := {n1 < n2 < n3 < . . . }
onde os nk são definidos recursivamente.
1. Em primeiro lugar, definimos n1 = min N1 (isto é válido porque N1 6= ∅ é subconjunto dos
naturais).
2. Definidos n1 < · · · < nk, observamos que, como Nk+1 é infinito,
Nk+1\[nk] 6= ∅.
Como ele também é subconjunto dos naturais, podemos definir
nk+1 := min(Nk+1\[nk])
e observamos que nk+1 6∈ [nk], de modo que nk+1 > nk.
Pela construção temos n1 < n2 < . . . . Além disto, para k, r ∈N com k < r, temos que
nk ∈ Nk, nr ∈ Nr ⊂ Nk
e como dK(xn, xm) < 2−k para n, m ∈ Nk, isto implica
∀k, r ∈N : k < r ⇒ dK(xnk , xnr) < 2−k.
Exercı́cio 6.5 Para terminar a prova, deduza disto que {xnk}k∈N é Cauchy, provando que, dado e > 0,
existe um k0 ∈N tal que dX(xnk , xn`) ≤ e para quaisquer ı́ndices k, ` ≥ k0.
2
100
6.2.5 O fim da prova da grande equivalência
Chegamos finalmente ao fim da prova do Teorema 6.2.
Prova: [do Teorema 6.2] Voltando ao roteiro descrito em §6.2.1 acima, observamos que já sabemos
que as propriedades de 2 a 5 no Teorema 6.2 são equivalentes. Além disso, sabemos que 1 implica
2. O que nos falta é provarmos que 2 a 5 juntas implicam 1.
Na verdade, não são todas as propriedades de 2 a 5 que serão usadas. Ao invés disso,
provaremos o seguinte.
Queremos: Seja (K, dK) um espaço métrico totalmente limitado (item 4 do Teorema)
com a propriedade de que toda f : X → R contı́nua atinge seu ı́nfimo (item 2 to
Teorema). Então toda cobertura de K por abertos possui uma subcobertura finita
(item 1 do Teorema).
Fixamos, então, um espaço métrico com as propriedades dos itens 2 e 4. Considere uma
coberturaA de K por abertos. Lembrando, A é uma coleção de abertos de K tais que K = ∪A∈AA.
Observe que todo x ∈ K pertence a algum aberto A ∈ A. Portanto existe um δ = δ(x) > 0
com B(x, δ) ⊂ A para algum A ∈ A. Reduzindo δ se necessário, podemos supôr que δ(x) ≤ 1.
A principal ideia desta prova é mostrar o seguinte.
Ideia: podemos escolher um valor δ > 0 que funciona para todos os x ∈ K simultaneamente.
Ou seja, existe um δ > 0 tal que, dado qualquer x ∈ K, B(x, δ) ⊂ A para algum A ∈ A. Na
verdade, esta ”ideia” suscita duas perguntas:
1. Por que achar este δ > 0 é uma boa ideia? Como K é compacto, ele é totalmente limitado e
pode ser coberto por um número finito de bolas de raio δ > 0. Mas cada bola destas pode
ser coberta por um elemento da cobertura A. Deste modo, K pode ser coberto por um
número finito de elementos de A.
2. Como sabemos que este δ existe? Vamos exprimir δ em termos do ı́nfimo de uma função
contı́nua r : K → (0, 1] que associa a cada x o seu “maior δ particular”. Como cada x tem
seu δ > 0, o ı́nfimo de r será positivo.
Para transformar esta ideia em prova, definimos r : K → (0, 1] da seguinte forma. Primeiro
observe, dado x ∈ K, o conjunto
I(x) := {δ ∈ (0, 1] : ∃A ∈ A, BK(x, δ) ⊂ A}
não é vazio. De fato ele é um intervalo: se δ ∈ I(x), então para qualquer 0 < δ′ < δ temos
∃A ∈ A : BK(x, δ′) ⊂ BK(x, δ) ⊂ A⇒ δ′ ∈ I(x).
Como I(x) também é limitado por 1, podemos definir r : K → [0, 1] como
r(x) := sup I(x) (x ∈ K).
Como I(x) contem elementos positivos, vale que r(x) > 0 para todo x ∈ K. Intuitivamente, r(x)
é basicamente o “maior” δ(x) que podemos escolher. Uma explicação para esta escolha é que, se
queremos achar um único δ que sirva para todos os x, é boa ideia partir do maior δ(x) possı́vel
para cada x.
A afirmação a seguir é chave para a prova.
101
Afirmação 6.3 r é uma função contı́nua.
Prova: [da Afirmação] Vamos mostrar que r é 1-Lipschitz, o que implica que r é
contı́nua. Para isto basta mostrar que:
Objetivo: ∀x, x′ ∈ K : r(x)− r(x′) ≤ dK(x, x′). (6.2)
De fato, se temos isto, podemos trocar os papeis de x, x′ e mostrar que também vale
r(x′)− r(x) ≤ dK(x, x′), de modo que |r(x′)− r(x)| ≤ dK(x, x′) para todos x, x′ ∈ X.
Para provar nosso objetivo, tome qualquer 0 < r < r(x) e um conjunto A ∈ A com
B(x, r) ⊂ A. Note que B(x′, r− dX(x, x′)) ⊂ BK(x, r); afinal,
∀y ∈ BK(x′, r− dK(x, x′)) : dK(y, x) ≤ dK(y, x′) + dK(x, x′) < r.
Portanto também temos BK(x′, r − dK(x, x′)) ⊂ A ∈ A e isto implica r(x′) ≥ r −
dX(x, x′). Tomando o supremo em r, vemos que r(x′) ≥ r(x) − dK(x, x′), como
querı́amos demonstrar. [Fim da prova da afirmação.] 2
Entre outras coisas, esta afirmação nos diz que infx∈K r(x) = r(x∗) para algum x ∈ K; afinal,
K é compacto! Mas note então que r(x∗) > 0, porque r é positiva em todos os pontos de K.
Deduzimos que infx∈K r(x) > 0, o que nos permite escolher um δ ∈ (0, infx∈K r(x)).
Este δ nos permite terminar a prova. Veja que, dado x ∈ K, r(x) > δ. Pela definição de r(x),
isto quer dizer que 0 < δ < sup I(x); como I(x) é intervalo, isto quer dizer que δ ∈ I(x) e existe
um A ∈ A com BK(x, δ) ⊂ A.
Lembre-se que K é totalmente limitado, portanto K = ∪ki=1BK(xi, δ) para alguma escolha de
x1, . . . , xk ∈ K. Mas então podemos escolher, para cada 1 ≤ i ≤ k, um aberto Ai ∈ A com
B(xi, δ) ⊂ Ai, e observamos que K ⊂ ∪ki=1Ai. Deste modo, B :={Ai : 1 ≤ i ≤ k} é uma
subcoleção finita de A que cobre K. 2
Observação 6.1 Um dado importante que surgiu na prova acima é que, se K é compacto, então toda
cobertura A de K por abertos possui um número de Lebesgue, isto é, um δ > 0 tal que, se x, x′ ∈ K e
dK(x, x′) < δ, então x, x′ ∈ A para algum A ∈ A. Isto é, se dK(x, x′) < δ, x, x′ pertencem ao mesmo
aberto da cobertura. Usaremos isto mais adiante.
6.3 Mais sobre compactos e funções contı́nuas
A esta altura já sabemos que o conceito de compacidade pode ser caracterizado por funções
contı́nuas. Há muitas outras relações entre estes dois conceitos: como veremos, elas se estendem
ao caso em que o contradomı́nio não é a reta.
6.3.1 Funções sobre compactos com contradomı́nio completo
Até este ponto, o principal espaço de funções contı́nuas que tratamos foi o C(I, R) com I ⊂ R
compacto. Agora, estamos em condições de estender o que sabemos para um caso bem mais
102
geral. De fato, tomaremos (K, dK) e (Z, dZ) espaços métricos, com K compacto e Z completo, e
falaremos de:
C = C(K, Z) := { f : K → Z : f continua }.
O próximo resultado mostra que é possı́vel dar uma métrica a C e que o espaço métrico
resultante é completo.
Teorema 6.3 Suponha que (Z, dZ) é completo. Dadas f , g ∈ C, defina:
dC( f , g) := sup
t∈K
dZ( f (t), g(t)).
Então dC é uma métrica sobre C e (C, dC) é um espaço métrico completo.
Prova: Esta prova deve muito à prova de que C(I, R) é espaço métrico completo (Teorema 3.2).
Faremos abaixo um esboço dos passos que são iguais e assinalaremos as principais diferenças.
Primeiro vamos provar que o supremo na definição de dC é atingido por algum t∗ ∈ K; em
particular, dC( f , g) ∈ R está bem definida. Para ver que o sup é atingido, como K é compacto,
basta ver que a função
t ∈ K 7→ dZ( f (t), g(t)) ∈ R
é contı́nua. Isto é verdade porque, sempre que tn → t em K,
|dZ( f (t), g(t))− dZ( f (tn), g(tn))| ≤ |dZ( f (t), g(t))− dZ( f (tn), g(t))|
+|dZ( f (tn), g(t))− dZ( f (tn), g(tn))|
(desig. triangular nos dois termos) ≤ dZ( f (tn), f (t)) + dZ(g(tn), g(t))
→ 0 quando n→ +∞.
Portanto dZ( f (t), g(t)) = limn dZ( f (tn), g(tn)).
Acabamos de ver que dC está bem definida. As propriedades de métrica são provadas como
no caso de C(I, R), observando que, para f , g, h ∈ C:
∀t ∈ K : dZ( f (t), g(t)) ≤ dZ( f (t), h(t)) + dZ(g(t), h(t)) ≤ dC( f , h) + dC(h, g),
e aı́ tomando o supremo em t ∈ K do lado esquerdo.
A completude também é provada como antes, nos mesmos três passos da prova do Teorema
3.2. Dada { fn}n∈N ⊂ C Cauchy, temos o seguinte.
1. Para cada t ∈ K,
0 ≤ dZ( fn(t), fm(t)) ≤ dC( fn, fm)
n,m→+∞→ 0.
Logo { fn(t)}t∈N ⊂ Z é Cauchy e, como Z é completo, existe o limite pontual f (t) =
limn fn(t) para cada t ∈ K.
2. Para cada n ∈N e t ∈ K, a existência do limite pontual diz que
dZ( fn(t), f (t)) = limm dZ( fn(t), fm(t))
≤ sup
m≥n
dZ( fn(t), fm(t))
≤ sup
m≥n
dC( fn, fm).
103
Logo
0 ≤ sup
t∈K
dZ( fn(t), f (t)) ≤ sup
m≥n
dC( fn, fm)→ 0 porque { fn}n∈N é Cauchy.
Deduzimos que fn → f uniformemente.
3. Por fim, dada uma sequência tk → t em K, para qualquer n ∈N
dZ( f (tk), f (t)) ≤ dZ( fn(tk), fn(t))
+dZ( fn(tk), f (tk)) + dZ( fn(t), f (t))
≤ dZ( fn(tk), fn(t)) + 2dC( fn, f ).
(Aqui abusamos notação e usamos dC( fn, f ) apesar de ainda não sabemos que f ∈ C!).
Como fn é contı́nua, fn(tk)→ fn(t) e
0 ≤ lim sup
k
dZ( f (tk), f (t)) ≤ 2dC( fn, f )
e mandar n → +∞ nos mostra que o lim sup é 0, logo f (tk) → f (t). Como isto vale para
qualquer sequência como acima, f ∈ C é contı́nua.
2
6.3.2 Funções sobre compactos com contradomı́nio Banach
Um caso particular do resultado acima é aquele em que Z = V é espaço de Banach (e dZ vem da
norma). O próximo resultado mostra que C(K, V) também é Banach.
Começamos observando que, assim como no caso de C(I, R), que já estudamos, este espaço
tem uma estrutura natural de espaço vetorial. Seu elemento nulo 0C é a função constante igual a
0V . Dadas funções f , g ∈ C e um escalar λ ∈ R, uma nova função λ f + g é definida via:
(λ f + g)(t) = λ f (t) + g(t) (t ∈ K).
A única diferença para o caso em que V = R é que as operações de soma e produto do lado
direito são em V e não em R.
Há muitas boas razões para se considerar essa classe de funções. Por exemplo, se V =
R3, podemos vizualizar cada elemento de C como uma trajetória no espaço tridimensional. Se
queremos modelar a evolução de posição e momento de N particulas clássicas em R3, precisamos
tomar V = R6N . Em outros contextos, pode ser interessante tomar V ainda mais geral.
O próximo resultado define uma norma em C(K, V).
Teorema 6.4 Se (K, dK) é compacto e (V, ‖ · ‖V) é Banach, a expressão abaixo define uma norma ‖ · ‖V
em C:
‖ f ‖C := sup
t∈I
‖ f (t)‖V ( f ∈ C).
Com essa norma, (C, ‖ · ‖C) é completo (Banach).
104
Prova: Primeiro devemos observar que o supremo é finito. Para isso, basta observar que a função
que associa a cada t ∈ K o valor ‖ f (t)‖V ∈ R é contı́nua, já que
∀t, s ∈ K : |‖ f (t)‖V − ‖ f (s)‖V | ≤ ‖ f (t)− f (s)‖V .
Agora vamos checar as propriedades de norma. Como ‖ f (t)‖V ≥ 0 sempre, temos que ‖ f ‖C ≥ 0.
Portanto, ‖ · ‖C : C → [0,+∞) é uma função bem-definida. Para provar que ela é uma norma,
precisamos provar que ela é positiva definida, homogênea positiva e subaditiva. Como a prova é
bem semelhante à do caso em que V = R, demonstraremos apenas a subaditividade.
De fato, dadas f , g ∈ C, podemos usar a subaditividade de ‖ · ‖V e a definição de ‖ · ‖C para
provar que:
∀t ∈ I : ‖ f (t) + g(t)‖V ≤ ‖ f (t)‖V + ‖g(t)‖V ≤ ‖ f ‖C + ‖g‖C.
Portanto, ‖ f ‖C + ‖g‖C é cota superior para os valores de ‖ f (t) + g(t)‖V , donde deduzimos que
‖ f + g‖C = sup
t∈I
‖ f (t) + g(t)‖V ≤ ‖ f ‖C + ‖g‖C
para quaisquer f , g ∈ C. Ou seja, ‖ · ‖C é mesmo subaditiva.
Falta demonstrar que (C, ‖ · ‖C) é completo, mas isto segue do Teorema 6.3. Afinal, a norma
‖ · ‖C induz uma métrica que coincide com a que estudamos naquele teorema quando V = Z.
Como V é completo, o teorema se aplica e garante a completude de C com a norma que acabamos
de construir. 2
6.3.3 Continuidade uniforme
Nosso próximo passo é falar de continuidade uniforme, uma versão mais forte do conceito de
continuidade.
Definição 6.5 Uma função f : K → Z entre espaços métricos (K, dK) e (Z, dZ) é dita uniformemente
contı́nua se seu módulo de continuidade, denotado por
m f (δ) := sup{dZ( f (x), f (x′)) : dK(x, x′) ≤ δ} (δ > 0),
converge a 0 quando δ→ 0+.
Uma função uniformemente contı́nua é contı́nua (exercı́cio!). Por outro lado, uma função
contı́nua pode não ser uniformemente contı́nua: por exemplo, “t 7→ t2”, definida na reta, tem
m f (δ) = +∞ para todo δ > 0, já que:
lim
t→+∞
[(t + δ)2 − t2] = +∞.
O resultado abaixo estende um teorema conhecido de Análise na Reta. Ele garante que
qualquer função contı́nua sobre domı́nio compacto é uniformemente contı́nua. Note que, ao
contrário da subseção anterior, aqui não precisamos supôr que o contradomı́nio Z é completo com
a métrica dZ.
Teorema 6.5 Uma função contı́nua f : K → Z entre espaços métricos (K, dK) e (Z, dZ), com (K, dK)
compacto, é necessariamente uniformemente contı́nua.
105
Prova: Apresentamos uma prova baseada na ideia de número de Lebesgue, contida na observação
6.1 acima. O Exercı́cio 6.6 apresenta um argumento mais clássico, baseado em subsequências.
Tome f : K → Z contı́nua. Dado um ε > 0, mostraremos que existe um δ0 > 0 tal que
m f (δ) ≤ ε para todo 0 < δ < δ0. Isto implica lim supδ→0+ m f (δ) ≤ ε, para qualquer ε > 0.
Note que, dado qualquer x′′ ∈ K, o conjunto
Ax′′ := {x ∈ K : dZ( f (x), f (x′′)) < ε/2}
é aberto de K, já que Ax = f−1(BY( f (x), ε/2)). Note ainda que, se x, x′ ∈ Ax′′ para um mesmo
x′′, naturalmente dZ( f (x′), f (x′′)) < ε pela desigualdade triangular:
dZ( f (x), f (x′)) ≤ dZ( f (x), f (x′′)) + dY( f (x′′), f (x′)) < ε.
Os abertos Ax′′ , com x′′ ∈ K, cobrem K; afinal, cadax′′ ∈ K pertence ao seu próprio Ax′′ .
Deduzimos que
A := {Ax′′ : x′′ ∈ K}
é uma cobertura de K por abertos. Pela Observação 6.1, existe um δ0 > 0 tal que, dados quaisquer
x, x′ ∈ K com dK(x, x′) < δ0, existe um conjunto Ax′′ com x, x′ ∈ Ax′′ , o que, como observado
acima, garante que dZ( f (x), f (x′)) < ε. Portanto,
∀x, x′ ∈ K : dK(x, x′) ≤ δ < δ0 ⇒ dY( f (x), f (x′)) < ε,
e m f (δ) ≤ ε para todo 0 < δ < δ0, como querı́amos demonstrar. 2
Antes de prosseguirmos, observamos que há outras definições equivalentes para a continui-
dade uniforme.
Proposição 6.9 Dada uma função f : K → Z entre espaços métricos (K, dK) e (Z, dZ), as seguintes
propriedades são equivalentes.
1. f é uniformemente contı́nua;
2. dado qualquer ε > 0, existe um δ > 0 tal que, se x, x′ ∈ K satisfazem dK(x, x′) ≤ δ, então
dZ( f (x), f (x′)) ≤ ε;
3. se {xn}n∈N e {x′n}n∈N são sequências em K,
dK(xn, x′n)→ 0⇒ dZ( f (xn), f (x′n))→ 0.
Prova: Uma primeira observação da prova é que a função m f (·) é monótona não-decrescente. De
fato, se 0 < δ < δ′, o conjunto de pares (x, x′) com dK(x, x′) ≤ δ está contido no conjunto de
pares com dK(x, x′) ≤ δ′; portanto, o supremo que define m f (δ) é tomado sobre um conjunto
menor do que o supremo que define m f (δ′).
Usamos a observação acima para provar que 1 e 2 são equivalentes. Sendo m f crescente,
sabemos que existe o limite de m f (δ) quando δ→ 0+ e vemos que:
lim
δ→0+
m f (δ) = 0⇔ ∀ε > 0 ∃δ > 0 : m f (δ) ≤ ε.
Do lado esquerdo da equivalência, temos a continuidade uniforme; do direito, temos a proprie-
dade 2 escrita de outra forma. Deste modo, temos a equivalência de 1 e 2.
106
Agora vejamos que 1⇒ 3. Sejam {xn}n∈N e {x′n}n∈N como no item 3. Note que, por definição
de m f ,
0 ≤ dZ( f (xn), f (x′n)) ≤ m f (dK(xn, x′n))
e que dK(xn, x′n)→ 0. Deduzimos que dY( f (xn), f (x′n))→ 0.
Concluı́mos a prova mostrando que “não 1⇒não 3”. Suponha que 1 não vale. Como observa-
mos acima, m f é monótona-não-decrescente: por esta razão, limδ→0+ m f (δ) existe, podendo ser
um número real não-negativo ou +∞. Se 1 não vale, existe um a > 0 com limδ→0+ m f (δ) > a > 0
e portanto m f (δ) > a para todo δ > 0. Em particular, tomando δ = 1/n e retornando à definição
de m f , vemos que existe um par (xn, x′n) ∈ K2 com dX(xn, x′n) ≤ 1/n e dZ( f (xn), f (x′n)) > a.
Portanto, as sequências {xn}n∈N e {x′n}n∈N, ambas contidas em K, satisfazem dX(xn, x′n) → 0 e
dZ( f (xn), f (x′n)) 6→ 0. Ou seja, se 1 não é verdadeira, a propriedade 3 não vale. 2
Exercı́cio 6.6 Escreva uma prova do Teorema 6.5 baseada no item 3 da Proposição acima. Para isso, siga
os seguintes passos: tome uma sequência {δn}n decrescendo a 0 e observe que limδ→0+ m f (δ) se e somente
se m f (δnk)→ 0 ao longo de uma subsequência {δnk}k. Para cada n, tome xn, x′n ∈ K com dK(xn, x′n) ≤ δn
e dY( f (xn), f (x′n)) ≥ m f (δn)− 1/n. Mostre agora que é possı́vel encontrar uma subsequência {nk}k tal
que xnk , x
′
nk → x ∈ K e use a continuidade de f em x para terminar a prova.
6.4 Compacidade de subconjuntos de um espaço métrico completo
No próximo capı́tulo, e também pelo restante da vida, estaremos interessados no caso em que
K ⊂ X com (X, dX) completo. Na maior parte do tempo, X será algum dos nossos espaços
usuais: métrica discreta, Rd ou C(I, R).
Primeiramente, observaremos como formular compacidade em termos da métrica e da topo-
logia de X (e não a métrica e a topologia que X induz em K).
1. A definição de compacidade via cobertutas de abertos (ou via propriedade da interseção
finita) é igual.
2. Quando (X, dX) é completo (como é o caso aqui), pedir que K seja completo com a métrica
induzida é a mesma coisa que pedir que K seja fechado de X (cf. Exercı́cio 5.23). Logo, ao
invés de pedir que K seja completo, pediremos que ele seja fechado. Portanto, se (X, dX) é
completo, um K ⊂ X é compacto se e somente se é fechado e totalmente limitado.
Convém fazer alguns comentários sobre os números de cobertura de K. Lembre-se que o
número de e-cobertura de (K, dK) é dado por:
N(K, e) := inf{k ∈N : ∃x1, . . . , xk ∈ K, K = ∪ki=1BK[xi, e]}.
Como dissemos acima, estamos interessados no caso em que K ⊂ X e dK é a distância induzida
por dX. Sabemos que, neste caso, temos BK[xi, e] = K ∩ BX[xi, e] para cada 1 ≤ i ≤ k e e > 0.
Segue disto que
N(K, e) := inf{k ∈N : ∃x1, . . . , xk ∈ K, K ⊂ ∪ki=1BX[xi, e]}. (6.3)
No entanto, é possı́vel uma outra definição:
N′(K, e) := inf{k ∈N : ∃x′1, . . . , x′k ∈ X, K ⊂ ∪ki=1BX[x′i , e]}. (6.4)
107
A diferença para (6.3) é que, neste segundo caso, os centros das bolas podem estar dentro ou fora
de K. O exercı́cio abaixo mostra que isso não faz muita diferença para o que nos interessa.
Exercı́cio 6.7 Prove que, para qualquer espaço métrico (X, dX) e qualquer K ⊂ X,
N(K, e) ≤ N′(K, e) ≤ N(K, 2e).
Deduza que K é totalmente limitado (isto é, N(K, e) < +∞ para todo e > 0) se e somente se N′(K, e) <
+∞ para todo e > 0.
Curiosamente, essa pequena diferença entre os números de e-cobertura N e N′ não tem
análogo para os números de e-empacotamento: neste caso, sempre pedimos que os elementos
do empacotamento estejam dentro de K.
6.5 Mais exercı́cios
Exercı́cio 6.8 Considere um espaço topológico compacto (X, TX) e um outro espaço topológico (Y, TY).
Suponha que f : X → Y é uma bijeção contı́nua. Mostre que a função inversa f−1 : Y → X também é
contı́nua; portanto, f é um homeomorfismo de espaços topológicos.
Exercı́cio 6.9 Considere um espaço vetorial normado (V, ‖ · ‖V) e subconjuntos não-vazios A, B ⊂ V.
Defina a soma de Minkowski A + B como no Exercı́cio 5.30:
A + B := {a + b : (a, b) ∈ A× B}.
Prove que A + B é compacto se e somente se A e B são compactos.
Exercı́cio 6.10 (Espaços pseudocompactos) Um espaço topológico compacto (X, TX) é dito pseudo-
compacto se toda função contı́nua de X em R é limitada. Procure o verbete da Wikipedia a respeito.
Exercı́cio 6.11 Determine quais dos subconjuntos de C([0, 1], R) abaixo são compactos.
1. Todas as funções Lipschitz.
2. Todas as funções L-Lipschitz, para um L > 0 fixo.
3. Todos os polinômios com grau 3.
4. Todos os polinômios com grau 3 e coeficientes no intervalo [−1, 1].
(Obs: mais adiante provaremos um critério para compacidade neste espaço, o teorema de Ascoli-
Arzelà. Estes exemplos podem ser estudados sem se utilizar este teorema.)
Exercı́cio 6.12 Considere um espaço métrico compacto (K, dK). Chame p ∈ K de ponto isolado se existe
um δ > 0 tal que BK(p, δ) = {p} (ou seja, não há qualquer ponto de K, além do próprio p, a distância
< δ do p). Prove que o conjunto de pontos isolados de K é vazio, finito ou enumerável.
Exercı́cio 6.13 Suponha que (X, dX) é um espaço métrico e que {xn}n∈N ⊂ X é Cauchy. Mostre que o
conjunto S := {xn : n ∈N} é totalmente limitado.
108
https://en.wikipedia.org/wiki/Pseudocompact_space
Exercı́cio 6.14 Recorde que um espaço métrico é separável se possui um subconjunto denso e enumerável.
Mostre que todo espaço métrico compacto é separável.
Exercı́cio 6.15 Sejam (Ti, di) espaços métricos totalmente limitados, 1 ≤ i ≤ k. Mostre que
T := T1 × T2 × · · · × Tk
é espaço métrico totalmente limitado com qualquer uma das métricas-produto consideradas no exercı́cio
3.10, em particular
d∞(x, y) := max
1≤i≤k
di(x[i], y[i]) (x, y ∈ T).
Faça isso provando uma cota explı́cita para o valor dos números de cobertura de T (com a métrica d∞):
∀e > 0 : N(T, e) ≤
k
∏
i=1
N(Ti, e).
Mais exatamente, mostre que, se Ri ⊂ Ti é e-rede para cada Ti (com a métrica di), então R := R1 × R2 ×
· · · × Rk é ε-rede para T. Conclua observando que |R| = ∏i |Ri|.
Exercı́cio 6.16 Seguindo a linha do exercı́cio acima, mostre que T é compacto se e somente se cada Ti é
compacto.
Exercı́cio 6.17 Sejam (X, dX) um espaço métrico completo e S ⊂ X um subconjunto. Mostre que S é
totalmente limitado se e somente se S é compacto.
Exercı́cio 6.18 Demonstre que a primeiradas afirmações abaixo é verdadeira e a segunda é falsa.
1. Um espaço métrico (X, dX) é compacto se e somente se toda função Lipschitz f : X → R satisfazendo
f (x) > 0 para todo x ∈ X tem ı́nfimo positivo.
2. Um espaço métrico (X, dX) é compacto se e somente se toda função Lipschitz f : X → R é limitada
inferiormente.
Exercı́cio 6.19 É verdade que um espaço métrico (X, dX) é compacto se e somente se toda função contı́nua
f : X → R é uniformemente contı́nua? Mostre que a resposta é não considerando qualquer conjunto X
infinito com a métrica discreta. (Na verdade, há exemplos de mais complicados de espaços que não são
compactos, mas são perfeitos – X′ = X – e tais que qualquer função contı́nua é uniformemente contı́nua.
Ou seja: a resposta “não” acima não tem nada a ver com métrica discreta só ter pontos isolados.)
Exercı́cio 6.20 Considere um espaço vetorial normado (V, ‖ · ‖V). Dado um S ⊂ V, S 6= ∅, uma
combinação convexa de elementos de S é um elemento v ∈ V da forma:
v =
m
∑
i=1
λisi,
onde m ∈ N\{0}, s1, . . . , sm ∈ S e os escalares λ1, . . . , λm ≥ 0 têm soma ∑mi=1 λi = 1. Chamamos de
conv(S), ou fecho convexo de S, o conjunto cujos elementos são as combinações convexas dos elementos de
S. Prove que, se S é totalmente limitado, conv(S) também é.
109
110
Capı́tulo 7
Compactos: casos particulares
Agora que já sabemos quem são os espaços compactos e que propriedades importantes eles têm,
veremos como este conceito se aplica a subconjuntos de Rd e das funções contı́nuas.
No caso do Rd, provaremos o Teorema de Heine-Borel, que diz que um conjunto K ⊂ Rd é
compacto se e somente se ele é fechado e limitado. Logo depois, usaremos este resultado para
dois fins: mostrar que todas as normas sobre Rd são equivalentes e construir uma métrica sobre
as funções contı́nuas de A ⊂ Rd aberto em R.
O próximo passo será apresentar o Teorema de Arzelà-Ascoli, que descreve subconjuntos
compactos de espaços de funções contı́nuas. As aplicações deste teorema são mais complicadas
e são deixadas para outros capı́tulos, onde discutirmos curvas de comprimento mı́nimo (a incluir)
e existência de soluções para Equações Diferenciais Ordinárias.
7.1 Compactos de Rd: o Teorema de Heine-Borel
Quem são os compactos de X = Rd com a métrica usual? O resultado a seguir é um clássico da
Análise, que responde a essa pergunta.
Teorema 7.1 (Heine Borel) Um subconjunto K ⊂ Rd é compacto se e somente se é fechado e limitado.
Prova: Apresentamos dois argumentos. No primeiro, usamos o fato de que K é compacto se e
somente se é fechado e totalmente limitado. Desta forma, para provar o teorema, basta provar
que qualquer um subconjunto K ⊂ Rd é limitado se e somente se é totalmente limitado. Mas isto
é simples:
• Se K é totalmente limitado, K ⊂ ∪mi=1BRd(xi, δ). Mas então a desigualdade triangular mostra
que dRd(0, x) ≤ max{dRd(0, xi)}1≤i≤n + δ para todo x ∈ K, ou seja, K é limitado.
• Se K ⊂ Rd é limitado, temos que K ⊂ [−n, n]d para algum n ∈N. Dividindo cada intervalo
[−n, n] em intervalos de comprimento < δ/
√
d, vemos que [−n, n]d é dividido em um
número finito de cubos tais que |x − x′| < δ para quaisquer dois elementos no mesmo
cubo. Tomando um ponto xi em cada cubo, vemos que K ⊂ [−n, n]d ⊂ ∪mi=1BRd(xi, δ) para
uma certa coleção finita de pontos. Deste modo, K é totalmente limitado.
Como segundo argumento, usaremos o critério das subsequências convergentes. Voltamos ao
§3.2.1 e lembramos que toda sequência limitada em Rd tem uma subsequência convergente. Em
111
particular, se K ⊂ Rd é fechado e limitado, toda sequência em K tem subsequência com limite
em K (que é fechado!).
Por outro lado, se K não é fechado ou não é limitado, há nele uma sequência que não tem
subsequência convergente em K (e portanto K não é compacto). Vejamos o porquê.
• Se K não é fechado, há uma sequência {xn}n∈N ⊂ K convergindo a x 6∈ K. Qualquer
subsequência de {xn}n∈N também converge a x, logo não há subsequência convergindo a
elemento de K.
• Se K não é limitado, para todo n ∈N há um xn ∈ K com |xn|2 ≥ n e é fácil ver que {xn}n∈N
não tem subsequência convergente.
2
Exercı́cio 7.1 Use o Teorema de Heine-Borel para decidir quais dentre os seguintes subconjuntos de Rd
são compactos: Rd; ∅; BRd(0, 1); BRd [0, 1];
Sd−1 := {x ∈ Rd : |x|2 ≤ 1};
∆d := {x ∈ Rd+ :
d
∑
i=1
x[i] = 1};
Od := {x ∈ Rd+ : x[1] ≤ x[2] ≤ x[3] ≤ · · · ≤ x[d]};
a “versão” do Od com “x[1] < x[2] < · · · < x[d]”(desigualdades estritas).
Exercı́cio 7.2 Para cada um dos conjuntos S ⊂ Rd que não são compactos apresentados no exercı́cio
anterior, encontre uma f : S → R com infs∈S f (s) = −∞ e uma cobertura de S por abertos que não tem
subcobertura finita. (Você já sabe que uma tal f e uma tal subcobertura existem pela teoria geral, claro.)
Exercı́cio 7.3 Considere uma função contı́nua f : Rd → R satisfazendo lim|x|2→+∞ f (x) = +∞. Dado
c ∈ R, mostre que seus conjuntos de “nı́vel c”e “subnı́vel c”
Fc := {x ∈ Rd : f (x) = c} e S≤c := {x ∈ Rd : f (x) ≤ c}
são compactos.
7.2 Aplicações do teorema de Heine-Borel
Poucos teoremas na Análise são tão usados quanto o de Heine-Borel. Nesta seção, não fazemos
mais do que apresentar duas situações em que ele é útil: para entender normas em Rd e discutir
o conceito de convergência sobre compactos para funções contı́nuas.
7.2.1 Todas as normas sobre Rd são equivalentes
Aqui provamos algo que prometemos há muito tempo: que todas as normas em Rd são equiva-
lentes. Em particular, os fatos a seguir todos seguem disso.
• Todas as normas sobre Rd definem a mesma topologia.
112
• Rd é completo com qualquer norma.
Abaixo, enunciamos “por extenso” o que significa dizer que uma norma é equivalente à
norma Euclideana. É boa ideia recordar o Teorema 3.3 antes de lê-lo.
Teorema 7.2 Considere uma norma ‖ · ‖ sobre Rd e seja | · | a norma Euclideana. Então existem C, c > 0
tais que
∀x ∈ Rd : c |x|2 ≤ ‖x‖ ≤ C |x|2. (7.1)
Em particular, a norma ‖ · ‖ e a norma Euclideana definem a mesma topologia sobre Rd.
Prova: Lembre-se de que e1, . . . , ed são os vetores da base canônica de Rd: fixo 1 ≤ i ≤ d, ei tem a
i-ésima coordenada igual a 1 e as demais coordenadas iguais a 0. Recorde ainda que
∀x ∈ Rd : x =
d
∑
i=1
x[i] ei.
Vamos provar agora a existência de C > 0 como acima. Veja que, dado x ∈ Rd qualquer
‖x‖ = ‖
d
∑
i=1
x[i]ei‖
(subaditividade) ≤
d
∑
i=1
‖x[i] ei‖
(homogeneidade positiva) =
d
∑
i=1
|x[i]| ‖ei‖
≤
d
∑
i=1
|x[i]| max
1≤j≤d
‖ej‖
= max
1≤j≤d
‖ej‖ (|x|1)
(| · |1 ≤
√
d | · |2) ≤ (
√
d max
1≤j≤d
‖ej‖) |x|2.
Logo a constante C :=
√
d max1≤j≤d ‖ej‖ satisfaz o que queremos. Note que C > 0 porque ei 6= 0
para cada i e portanto ‖ei‖ > 0 para cada i.
Provaremos agora que existe c > 0 como acima usando a primeira parte. Considere a esfera
unitária Sd−1 ⊂ Rd, dada por
Sd−1 = {x ∈ Rd : |x|2 = 1}.
Como f (x) = |x|2 = dRd(x, 0) (x ∈ Rd) é contı́nua, Sd−1 = f−1({1}) é subconjunto fechado de
Rd. Além disso, Sd−1 é limitado. Deduzimos que a esfera Sd−1 é compacta. Além disso, a função
g(x) := ‖x‖ (com x ∈ Sd−1) é C-Lipschitz, já que
∀x, x′ ∈ Sd−1 : |g(x)− g(x′)| = |‖x‖ − ‖x′‖| ≤ ‖x− x′‖ ≤ C |x− x′|2.
Portanto, g é uma função contı́nua sobre um compacto e existe um x∗ ∈ Sd−1 com c := g(x∗) =
infx∈Sd−1 ‖x‖. A fortiori, c > 0, já que x∗ ∈ Sd−1 ⇒ x∗ 6= 0 e ‖ · ‖ é uma norma.
Basta checar agora que c “funciona” para nossos propósitos. Para isto, tome x ∈ Rd qualquer.
Se x = 0, claramente ‖x‖ = 0 ≥ c|x|2 = 0. Se x 6= 0, então x/|x|2 ∈ Sd−1, logo ‖x/|x|2‖ ≥ c e
‖x‖ ≥ c |x|2 pela homogeneidade positiva da norma. 2
113
Exercı́cio 7.4 Mostre que quaisquer duas normas sobre um espaço de matrizes Rd×` são equivalentes.
7.2.2 Convergência uniforme sobre compactos
Nesta seção, A ⊂ Rd é um aberto com A 6= ∅, (V, ‖ · ‖V) é um espaço de Banach e C := C(A, V)
é o espaço de funções contı́nuas de A em V. Como de costume,este espaço tem uma estrutura
de espaço vetorial, em que as somas e produtos por escalar são definidos para cada t ∈ A.
Como podemos medir distâncias neste espaço? A definição das métricas de convergência
uniforme em espaços do tipo C(K, Z) que vimos nos §6.3.1 e 6.3.2 depende do fato que K é
compacto: só assim garantimos que os supremos naquelas definições fazem sentido. Por outro
lado, as métricas que pusemos sobre aqueles espaços pressupõem o conceito de convergência
uniforme, que não é o mais natutal sobre C(A, V).
Exemplo 7.1 Considere o caso particular em que A = V = R (com as métricas/normas usuais). A
sequência de funções “ fn : t ∈ R 7→ t2/(n + 1)” converge a 0C pontualmente, mas não converge
uniformememnte já que fn(n) → +∞. No entanto, esta é uma sequência “bem comportada” em vários
sentidos: por exemplo, para quaisquer a < b reais,
∫ b
a fn(t) dt→ 0.
A definição mais usada de convergência em C(A, V) é a de convergência uniforme sobre com-
pactos. Usaremos abaixo a seguinte notação: dados K ⊂ A compacto e não vazio, e dada f ∈ C,
‖ f ‖K,∞ := sup
t∈K
‖ f (t)‖V .
Note que este supremo é um número real porque a restrição de f a K é contı́nua e, portanto,
limitada. Além disso, pode-se verificar que ‖ · ‖K,∞ é homogênea positiva e subaditiva:
∀ f , g ∈ C∀λ ∈ R : ‖λ f ‖K,∞ = |λ| ‖ f ‖K,∞ e ‖ f + g‖K,∞ ≤ ‖ f ‖K,∞ + ‖g‖K,∞.
Note que ‖ · ‖K não é positiva-definida em geral: a função f (·) = dRd(·, K) se anula em K, de
modo que ‖ f ‖K,∞ = 0, mas f > 0 em A\K. Uma função homogênea positiva e subaditiva que
não é necessariamente positiva-definida é dita uma seminorma.
A definição de convergência uniforme em compactos é dada abaixo.
Definição 7.1 Dados elementos { fn}n∈N ∪ { f } ⊂ C, dizemos que fn converge a f uniformemente sobre
compactos se limn∈N ‖ fn− f ‖K,∞ = 0 para todo K ⊂ A compacto. Dizemos ainda que { fn}n∈N é Cauchy
uniformemente sobre compactos se limm,n∈N ‖ fn − fm‖K,∞ = 0 para todo K ⊂ A compacto.
Exercı́cio 7.5 Para esquentar, prove que a sequência de funções { fn}n∈N ⊂ C(R, R) no Exemplo 7.1
converge a 0C uniformemente sobre compactos.
O próximo teorema é o principal resultado desta subseção. Ele nos diz que a noção de con-
vergência uniforme sobre compactos corresponde a uma métrica bem-comportada sobre C(A, V)
Teorema 7.3 Existe uma métrica dC sobre C = C(A, V) com as seguintes propriedades.
1. uma sequência em C é convergente (ou Cauchy) uniformemente sobre compactos se e somente se ela
é convergente (ou Cauchy) com a métrica dC;
114
2. (C, dC) é completo.
Trocando em miúdos: a noção de convergência uniforme sobre compactos corresponde a uma
métrica sobre C(A, V) e o espaço métrico (C(A, V), dC) é completo.
Para provar este teorema, precisaremos de um resultado preliminar, que segue do teorema
de Heine-Borel.
Lema 7.1 (Exaustão de A por número enumerável de compactos) Dado A ⊂ Rd aberto e não-vazio,
existe uma sequência de compactos {Kn}n∈N de Rd com
∅ 6= K0 ⊂ K1 ⊂ K2 ⊂ · · · ⊂ A
tais que ∪n∈NKn = A e com a propriedade que qualquer K ⊂ A compacto está contido num dos Kn.
Prova: Se A = Rd, basta tomar Kn := BRd [0Rd , n] (n ∈N) e observar que cada K ⊂ Rd é limitado
e portanto está contido numa destas bolas.
Considere agora o caso em que o aberto A 6= Rd, de modo que F := Rd\A é fechado e não é
vazio. Isto quer dizer que a função:
“ψ : x ∈ Rd 7→ dRd(x, F) := infy∈F |x− y|2”
é bem definida, não-negativa, 1-Lipschitz e ψ−1(0) = F. Desta forma, A = {a ∈ Rd : ψ(a) > 0}.
Como A 6= ∅, existe um a0 ∈ A. Desta forma, vale a seguinte propriedade:
∀a ∈ Rd : a ∈ A⇔ ∃n ∈N : |a|2 ≤ n + |a0|2 e ψ(a) ≥
ψ(a0)
n + 1
. (7.2)
A partir destas propriedade, definiremos os compactos que buscamos. De fato, veremos que a
definição a seguir funciona:
Kn :=
{
a ∈ Rd : |a|2 ≤ n + |a0|2 e ψ(a) ≥
ψ(a0)
n + 1
}
(n ∈N).
Para provar que de fato funciona, checamos primeiramente que os conjuntos Kn são todos com-
pactos de Rd. Percebe-se por inspeção que:
∀n ∈N : Kn := BRd [0Rd , n + |a0|2] ∩ ψ−1
([
ψ(a0)
n + 1
,+∞
))
.
Como ψ é contı́nua, os dois conjuntos da interseção são fechados de Rd, logo Kn também é
fechado de Rd. Além disso, Kn está contido na bola de raio n + |a0|2 ao redor da origem e é,
portanto, limitado. Deduzimos do Teorema de Heine-Borel que cada Kn é compacto.
O próximo passo é mostrar que:
∅ 6= K0 ⊂ K1 ⊂ K2 ⊂ · · · ⊂ A e ∪n∈N Kn = A.
De fato, K0 não é vazio porque vê-se que a0 ∈ K0. O fato de que Kn ⊂ Kn+1 para cada n ∈ N
segue do fato que
∀a ∈ Rd : |a|2 ≤ n + |a0| e ψ(a) ≥
ψ(a0)
n + 1
⇒ |a|2 ≤ n + 1 + |a0| e ψ(a) ≥
ψ(a0)
n + 2
115
(já que ψ(a0) > 0). Por fim, ∪n∈NKn = A segue do fato de que, comparando (7.2) com a definição
de Kn, temos que um a ∈ Rd pertence a A se e somente se a ∈ Kn para algum n ∈N.
Falta apenas mostrar que todo K ⊂ A compacto está contido em algum Kn. Para isso, fixe
um tal K e observe que, como K ⊂ A, ψ(x) > 0 para todo x ∈ K. A continuidade de ψ e a
compacidade de K garantem que o ı́nfimo de ψ sobre K é atingido e portanto infx∈K ψ(x) > 0.
Além disso, sabemos que K é limitado, logo supx∈K |x|2 < +∞. Se n ∈ N é grande o suficiente,
podemos garantir que
inf
x∈K
ψ(x) ≥ ψ(a0)
n + 1
e sup
x∈K
|x|2 ≤ n + |a0|.
Deste modo, teremos:
∀a ∈ K : |a|2 ≤ sup
x∈K
|x|2 ≤ n + |a0| e ψ(a) ≥
ψ(a0)
n + 1
,
ou seja,
∀a ∈ K : a ∈ Kn.
Isto quer dizer que K ⊂ Kn se n é grande o suficiente. 2
O Lema 7.1 vai nos permitir definir a métrica que nos interessa. A ideia intuitiva seria
tomarmos uma soma das seminormas ‖ · ‖Kn,∞. No entanto, isso não é viável porque em princı́pio
seminormas podem tomar valores muito grandes. Por essa razão, a proposição abaixo será útil.
Proposição 7.1 Dado K ⊂ A compacto e não vazio, a função αK : C → [0, 1] definida por:
αK( f , g) := min{‖ f − g‖K,∞, 1} (( f , g) ∈ C2)
é simétrica, toma valores entre 0 e 1 e satisfaz a desigualdade triangular.
Prova: Omitimos a prova das duas primeiras propriedades. Resta mostrar a desigualdade trian-
gular. Queremos provar que, para f , g, h ∈ C:
Queremos : min{‖ f − g‖K,∞, 1} ≤ min{‖ f − h‖K,∞, 1}+ min{‖h− g‖K,∞, 1}.
Isso vem do fato que, se c, a, b são reais não-negativos,
c ≤ a + b⇒ min{c, 1} ≤ min{a, 1}+ min{b, 1},
que pode ser checado por inspeção. Aceitando isso, observamos que, pela subaditividade da
norma,
c := ‖ f − g‖K,∞ ≤ a + b := ‖ f − h‖K,∞ + ‖g− h‖K,∞
portanto a desigualdade acima se aplica. 2
Agora provaremos o teorema, mostrando que uma soma das “semimétricas” αKn (com pesos
adequados) nos dá a métrica que buscamos. Os exercı́cios abaixo serão necessários na prova.
Exercı́cio 7.6 Dados K ⊂ F compactos contidos em A, mostre que αK( f , g) ≤ αF( f , g) para todas as
funções f , g ∈ C.
116
Prova: [do Teorema 7.3] Fixe uma sequência {Kn}n∈N de compactos com as propriedades especifi-
cadas no Lema 7.1 e defina, para f , g ∈ C:
dC( f , g) := ∑
n∈N
αKn( f , g)
2n
,
onde as αKn vêm da Proposição 7.1. Note que, como as funções αKn tomam valores entre 0 e 1, a
série acima é cotada pela soma da progressão geométrica 1/2n. Portanto, a série é absolutamente
convergente para quaisquer f , g. Logo, dC( f , g) é bem-definida.
A próxima etapa da demonstração é mostrar o seguinte.
dC satisfaz os axiomas de uma métrica.
Em primeiro lugar, verificamos que dC é positiva-definida. De fato, dC( f , g) ≥ 0 porque cada
αKn( f , g) ≥ 0. Claramente, dC( f , g) = 0 se f = g. Por outro lado, como a série definindo dC( f , g)
é feita de termos não-negativos,
dC( f , g) = 0⇔ ∀n ∈N : αKn( f , g) = 0⇔ ∀n ∈N : ‖ f − g‖Kn,∞ = 0.
Em particular, se f (t) 6= g(t) para algum t ∈ A, o Lema 7.1 garante que t ∈ Kn para algum
n ∈ N (afinal, A = ∪nKn) e vê-se que ‖ f − g‖Kn,∞ ≥ | f (t)− g(t)| > 0. Ou seja, f 6= g implica
dC( f , g) > 0. Isto concui a prova de que dC é positiva-definida. (Repare que aqui usamos o fato
de que A = ∪n∈NKn pela primeira vez. A outra propriedade garantida pelo Lema só seráusada
mais para o final da prova abaixo.)
Ainda nos resta provar que dC é simétrica e satisfaz a desigualdade triangular. Para isso, usamos
novamente a Proposição 7.1: a simetria vem do fato de que cada αKn é simétrica e a desigualdade
triangular vem do fato que, dadas f , g, h ∈ C:
∀n ∈N : αKn( f , g) ≤ αKn( f , h) + αKn(h, g)
e podemos aplicar isso termo a termo na definição de dC (usando o fato de que séries absoluta-
mente convergentes podem ser “somadas termo a termo”). Concluı́mos assim a prova de que dC
é de fato uma métrica.
Nosso próximo passo é relacionar a convergência e a propriedade de Cauchy segundo dC aos
conceitos de convergência e Cauchy uniformes sobre compactos. Para isso, a afirmação a seguir
será fundamental: ela relaciona o comportamento de dC e das seminormas ‖ · ‖Kn,∞ (ou melhor,
com as semimétricas αKn definidas a partir destas normas).
Afirmação 7.1 Dado n0 ∈N, valem as desigualdades:
∀ f , g ∈ C :
αKn0 ( f , g)
2n0
≤ dC( f , g) ≤ 2αKn0 ( f , g) +
1
2n0
.
Prova: [da Afirmação 7.1] A cota inferior segue da definição de dC e do fato que todos os termos
da forma αKn( f , g)/2
n aparecendo naquela definição são não-negativos.
Para a cota superior, usamos as seguintes estimativas:
αKn( f , g) ≤
{
αKn0 ( f , g), se 0 ≤ n ≤ n0 (pelo Exercı́cio 7.6);
1, se n > n0 (pela Proposição 7.1).
117
Deste modo,
dC( f , g) =
+∞
∑
n=0
αKn( f , g)
2n
≤
n0
∑
n=0
αKn0 ( f , g)
2n
+ ∑
n>n0
1
2n
= (2− 2−n0) αKn0 ( f , g) +
1
2n0
≤ 2αKn0 ( f , g) +
1
2n0
.
2
De posse da afirmação, vai ser relativamente fácil terminar a prova. Começamos mostrando
o seguinte.
Dadas { f j}j∈N ∪ { f } ⊂ C, dC( f j, f )→ 0 se e somente se f j → f uniformemente sobre
compactos.
Para ver isso, suponha primeiramente que dC( f j, f )→ 0. Dado K ⊂ A compacto e não-vazio,
queremos provar que ‖ f j − f ‖K,∞ → 0, o que é o mesmo que αK( f j, f ) → 0. O Lema 7.1 garante
que K ⊂ Kn0 para algum n0 ∈ N e então o Exercı́cio 7.6 garante que αK( f j, f ) ≤ αKn( f j, f ).
Usando a Afirmação, concluı́mos que
0 ≤ αK( f j, f ) ≤ αKn0 ( f j, f ) ≤ 2
n0 dC( f j, f )→ 0,
e um raciocı́nio de sanduı́che implica αK( f j, f )→ 0.
Por outro lado, se f j → f uniformemente sobre compactos, temos que αK( f j, f ) → 0 para
todo K ⊂ A compacto. Em particular, isso vale quando K = Kn0 para qualquer n0 ∈N. Segue da
Afirmação que:
∀n0 ∈N : lim sup
j∈N
dC( f j, f ) ≤ 2 lim sup
j∈N
αKn0 ( f j, f ) +
1
2n0
=
1
2n0
.
Como isto vale para todo n0 ∈N, podemos mandar n0 → +∞ e obter:
lim sup
j∈N
dC( f j, f ) ≤ 0,
o que garante que dC( f j, f )→ 0.
Agora tratamos de propriedades tipo Cauchy.
Dada { f j}j∈N ⊂ C, dC( f j, f`)→ 0 se e somente se { f j}j∈N é uniformemente Cauchy sobre
compactos.
A prova é bastante parecida com a anterior e será apenas esboçada. Se { f j}j∈N é Cauchy
sobre compactos, então ‖ f j − f`‖Kn,∞ → 0 (e portanto αKn( f j, f`) → 0) para qualquer n ∈ N.
Fixando um n0 ∈N\{0}, a Afirmação nos dá a estimativa:
dC( f j, f`) ≤ 2αKn0 ( f j, f`) +
1
2n0
.
118
Tomando j, `→ +∞, deduzimos:
∀n0 ∈N : lim sup
j,l→+∞
dC( f j, f`) ≤
1
2n0
e podemos concluir que dC( f j, f`)→ 0 como na prova anterior.
Suponha agora que { f j}j∈N é Cauchy de acordo com a métrica dC. Fixo um compacto K ⊂ A,
precisamos mostrar que ‖ f j− f`‖K,∞ → 0 quando j, `→ +∞. De fato, é fácil ver que é equivalente
mostrar que αK( f j, f`) → 0. Para isso, seguimos o raciocı́nio anterior, tomando n0 ∈ N com
K ⊂ Kn0 e observando que
0 ≤ αK( f j, f`) ≤ 2n0dC( f j, f`)
j,`→+∞−→ 0,
donde segue o αK( f j, f`)→ 0.
Para terminar a prova, mostramos a afirmação final do teorema.
(C, dC) é completo.
Tome uma sequência { f j}j∈N que é Cauchy segundo dC. Mostramos abaixo que existe f ∈ C
com dC( f j, f )→ 0.
Em primeiro lugar, sabemos (pelos itens acima) que { f j}j∈N é uniformemente Cauchy sobre
compactos. Em particular, para cada t ∈ A, { f j(t)}j∈N ⊂ V é Cauchy (já que {t} é compacto) e
existe o limite pontual:
f (t) := lim
j→+∞
f j(t).
Além disso, podemos provar pelo raciocı́nio usual que ‖ f j − f ‖K,∞ → 0 para qualquer K ⊂ A
compacto.
Dado t ∈ A arbitrário, precisamos mostrar que f é contı́nua em t. Para isso, usamos que A é
aberto e portanto existe um δ > 0 tal que a bola fechada BRd [t, δ] ⊂ A. Como esta bola fechada
é compacta (por Heine-Borel!), f j → f uniformemente sobre a bola. Mas sabemos que o limite
uniforme de funções contı́nuas sobre um compacto é uma função contı́nua. Deduzimos que a
restrição de f à bola BRd [t, δ] é contı́nua, o que implica (exercı́cio!) a continuidade de f em t.
Agora, sabemos que f é contı́nua em cada t ∈ A, logo f ∈ C. Como vimos acima, ‖ f j −
f ‖K,∞ → 0 para qualquer K ⊂ A compacto. Já sabemos que isso é equivalente a dC( f j, f ) → 0.
Ou seja: provamos (como querı́amos) que { f j}j∈N converge em C. 2
7.3 Compactos nos espaços de funções contı́nuas
Acima mostramos que os subconjuntos compactos de Rd têm uma “cara” simples: são simples-
mente os fechados e limitados. Em particular, bolas fechadas são sempre compactas. Abaixo,
veremos que este resultado não se estende a espaços de funções contı́nuas. No entanto, conse-
guiremos uma caracterização dos compactos via um teorema chamado de Arzelà-Ascoli.
119
7.3.1 Bolas fechadas não são compactas
Considere C([0, 1], R) com a norma do sup usual. É um fato que existe uma sequência { fn}n∈N ⊂
C([0, 1], R) de funções com ‖ fn‖[0,1],∞ = 1 e ‖ fn − fm‖[0,1],∞ = 1 para todos m, n ∈ N. Por-
tanto a bola unitária fechada ao redor de 0 não é totalmente limitada: ela contem um 1/2-
empacotamento infinito.
Exercı́cio 7.7 Cheque que a sequência de ”tendas” construı́da no Exemplo 3.2 tem as propriedades reque-
ridas acima acima.
Na verdade, o que ocorre é um fenômeno muito mais geral: C([0, 1], R) não tem bolas com-
pactas porque não é um espaço vetorial de dimensão finita.
Lema 7.2 (Lema de Riesz) Considere um espaço de Banach (V, ‖ · ‖V). Então, as bolas fechadas de V
são compactas se e somente se V tem dimensão finita.
Não provaremos este resultado aqui, embora a prova não seja muito difı́cil. No entanto,
ele indica que um critério para achar quem são os compactos de C([0, 1], Rd) tem de ser mais
complicado que o teorema de Heine-Borel. Veremos o critério adequado quando estudarmos o
teorema de Arzèla-Ascoli, no capı́tulo adequado.
7.3.2 O teorema de Arzelà-Ascoli
Agora passamos ao contexto geral em que (K, dK) é compacto, (Z, dZ) é completo e C := C(K, Z)
é espaço métrico com a norma do supremo:
dC( f , g) := sup
t∈K
dZ( f (t), g(t)).
Como podemos caracterizar os compactos de C? Como C é completo, sabemos que F ⊂ C é
compacto se e somente se é fechado e totalmente limitado. O teorema a seguir – um resultado
fundamental de Análise – mostra quem são os subconjuntos uniformemente limitados de C.
Abaixo, recorde que m f (·) é o módulo de continuidade de f : K → Z, definido como no §6.3.3:
m f (δ) := sup{dZ( f (x), f (x′)) : x, x′ ∈ K, dX(x, x′) ≤ δ} ( f : K → Z, δ > 0).
Teorema 7.4 (Arzelà-Ascoli) Uma famı́lia de funções F ⊂ C(K, Z) (com (K, dK) compacto e (Z, dZ)
completo) é totalmente limitada se e somente se ela tem as duas propriedades abaixo.
1. F é pontualmente totalmente limitada: dado qualquer t ∈ K, o conjunto de valores
F (t) := { f (t) : f ∈ F}
é totalmente limitado.
2. F é equicontı́nua: limδ→0+ sup f∈F m f (δ) = 0.
Observação 7.1 Em particular, o teorema nos diz que, se F ⊂ C satisfaz 1 e 2, então toda sequência em
F tem uma subsequência convergente.
120
A prova do Teorema 7.4 está contida nos Lemas 7.3 e 7.4 abaixo. Antes de apresentar os
lemas, vamos tentar entender as duas condições no teorema. O ponto é que as duas condições
valem se F tem um número finito de funções: a propriedade 1 é trivial e a 2 vale porque cada
f ∈ C é uniformemente contı́nua e portanto limδ→0+ m f (δ) = 0 para cada f ∈ F . O que o
teorema nos diz, para famı́lias gerais de funções, é queas propriedades 1 e 2 valem se e somente
se F pode ser bem aproximada por uma famı́lia finita de funções; isto é, se F tem e-redes finitas
para qualquer e > 0.
O próximo resultado mostra uma direção do Teorema de Arzèla-Ascoli.
Lema 7.3 (Necessidade das condições no teorema) Com a notação do Teorema 7.4, vale que, se F é
totalmente limitada, então valem as condições 1 e 2.
Prova: Suponha que F é totalmente limitada e fixe um e > 0 qualquer. Iremos mostrar que:
(i) Dado t ∈ K, podemos cobrir F (t) por um número finito de bolas fechadas de raio e.
(ii) Temos que lim supδ→0+ sup f∈F m f (δ) ≤ 2e.
De fato, se (i) vale para qualquer e > 0, isto nos diz que cada conjunto F (t) pode ser coberto
por um número finito de bolas de raio e; ou seja, cada F (t) é totalmente limitado. Ao mesmo
tempo, se (ii) vale para qualquer e > 0, lim supδ→0+ sup f∈F m f (δ) ≤ 0 e (como m f (δ) ≥ 0
sempre) temos limδ→0+ sup f∈F m f (δ) = 0. Portanto, provar (i) e (ii) será suficiente para concluir
a prova deste lema.
Para demonstrar (i) e (ii), usaremos o fato de que F é totalmente limitado. Deste modo,
existe uma e-rede finita R ⊂ F , que satisfaz:
∀ f ∈ F∃g f ∈ R : dC(g f , f ) ≤ e. (7.3)
A existência desta rede finita nos permite provar a propriedade (i). De fato, veremos que
R(t) := {g(t) : g ∈ R}
é e-rede de F (t) (e é finita porque R é finito). Para mostrar isso, tome um a ∈ F (t) qualquer.
Pela definição de F (t), a = f (t) para alguma f ∈ F . Considere agora g f ∈ R como em (7.3) e
note que b := g f (t) ∈ R(t) satisfaz:
dZ(a, b) = d( f (t), g f (t)) ≤ sup
s∈K
dZ( f (s), g f (s)) = dC( f , g f ) ≤ e.
Portanto, dado a ∈ F (t), há um b ∈ R(t) com dZ(a, b) ≤ e. Ou seja, R(t) é mesmo e-rede.
Agora usaremos R para mostrar a propriedade (ii). Observe que, dados quaisquer x, x′ ∈ K
com dX(x, x′) ≤ δ e qualquer f ∈ F (com g f como em (7.3))
dZ( f (x), f (x′)) ≤ dZ(g f (x), g f (x′)) + dZ(g f (x), f (x)) + dZ(g f (x′), f (x′))
≤ sup
s,t∈K : dX(s,t)≤δ
dZ(g f (t), g f (s)) + 2 sup
t∈K
dZ(g f (x), g f (x′))
(use defs. de mg f e dC) ≤ mg f (δ) + 2dC( f , g f )
(use (7.3) e g f ∈ R) ≤ max
g∈R
mg(δ) + 2e.
121
Note que usamos maxg∈R (e não supg∈R) na última linha porque R é finito. Note ainda que
este último termo é independente de f , x, x′. Ou seja, a desigualdade
dZ( f (x), f (x′)) ≤ max
g∈R
mg(δ) + 2e
vale para toda função f ∈ F e para todos os pares de pontos x, x′ ∈ K com dX(x, x′) ≤ δ.
Tomando supremos, deduzimos que:
sup
f∈F
m f (δ) ≤ max
g∈R
mg(δ) + 2e.
Como já observamos antes da prova do teorema, o fato de que K é compacto implica que cada
g ∈ R é uniformemente contı́nua, de modo que limδ→0+ mg(δ) = 0. Usando novamente a finitude
de R, deduzimos que limδ→0+ maxg∈R mg(δ) = 0. Portanto,
lim sup
δ→0+
sup
f∈F
m f (δ) ≤ 2e,
o que prova (ii). 2
Finalmente, apresentamos o fim da prova do Teorema 7.4.
Lema 7.4 (Suficiência das condições no teorema) Com a notação do Teorema 7.4, se F satisfaz as
condições 1 e 2, então F é totalmente limitada.
Prova: Provaremos que, dado qualquer e > 0, se F satisfaz 1 e 2, então F não contem um
e-empacotamento infinito. Isso basta pela Proposição 6.7.
Como faremos isso? A prova será por contradição. Suporemos que F satisfaz as propriedades
1 e 2 e ao mesmo tempo contem um e-empacotamento infinito. Veremos que isso implicaria
a existência de um (e/2)-empacotamento infinito em F (t1) × F (t2) × . . .F (tk), para alguma
escolha de pontos t1, . . . , tk ∈ K. Veremos que isso contradiz o fato de que cada F (ti) é totalmente
limitado (a propriedade 1 no teorema).
Uma questão crucial é como escolher os pontos ti. A ideia é que estes pontos sejam tais que
cada função f ∈ F seja “bem representada” pelos valores f (ti) nos pontos t1, . . . , tk. Para isso,
usaremos a propriedade 2: sabemos controlar uniformemente sobre f ∈ F a variação de f (t)
quando t muda: deste modo, bastará tomar uma δ-rede {t1, . . . , tk} para um δ bem escolhido
para garantir que os valores de f (ti) “determinam f a menos de um erro pequeno”. A afirmação
abaixo apresenta este raciocı́nio de forma precisa.
Afirmação 7.2 Dado e > 0, e supondo que F satisfaz 1 e 2, existem um k ∈N\{0} e pontos t1, . . . , tk ∈
K tais que, se
∀ f1, f2 ∈ F : max
1≤i≤k
dZ( f1(ti), f2(ti)) ≤ dC( f1, f2) ≤ max
1≤i≤k
dZ( f1(ti), f2(ti)) +
e
2
.
Prova: [da Afirmação] Como e > 0, a propriedade 2 implica que existe um δ > 0 tal que
sup f∈F m f (δ) ≤ e/4. Como K é compacto (e portanto totalmente limitado), existe uma δ-rede
finita {t1, . . . , tk} ⊂ K. Pela definição de δ-rede, sabemos que, para cada x ∈ K, existe um ti
122
com dX(x, ti) ≤ δ, de modo que dZ( f (ti), f (x)) ≤ e/4 para qualquer f ∈ F . Mas então, dadas
quaisquer f1, f2 ∈ K e dado qualquer x ∈ K:
∃1 ≤ i ≤ k : dZ( f1(x), f2(x)) ≤ dZ( f1(ti), f2(ti)) + 2m f (δ) ≤ max
1≤i≤k
dZ( f1(ti), f2(ti)) +
e
2
.
Em particular, tomando o sup em x, deduzimos:
∀ f1, f2 ∈ F : dC( f1, f2) ≤ max
1≤i≤k
dZ( f1(ti), f2(ti)) +
e
2
.
Isso dá a cota inferior na desigualdade que consta do enunciado da Afirmação. A cota inferior
vem do fato que dZ( f1(t), f2(t)) ≤ dC( f1, f2) para quaisquer f1, f2 ∈ C e t ∈ K. [Fim da prova da
afirmação] 2
Para fazermos uso da afirmação, é conveniente criar um pouco de notação. Defina Ti :=
F (ti) ⊂ Z e di a restrição da métrica de Z a Ti. Consideraremos o espaço-produto:
T := T1 × T2 × · · · × Tk
munido da métrica-produto:
dT(x, y) := max
1≤i≤k
dTi(x[i], y[i]) (x = (x[i])
k
i=1, y = (y[i])
k
i=1 ∈ T).
A propriedade 1 no Teorema garante que cada (Ti, di) é totalmente limitado. O Exercı́cio 6.15
implica que (T, dT) também é totalmente limitado. Note que a função φ : F → T associando a
cada f ∈ F o vetor φ( f ) ∈ T com coordenadas φ( f )[i] := f (ti) (1 ≤ i ≤ k) é bem definida. A
Afirmação garanate que:
∀ f1, f2 ∈ F : dT(φ( f1), φ( f2)) ≤ dC( f1, f2) ≤ dT(φ( f1), φ( f2)) +
e
2
.
Agora usaremos a suposição (que fizemos para chegar a uma contradição) que há um e-empacotamento
infinito P ⊂ F . Num e-empacotamento, como sabemos, quaisquer dois elementos distintos estão
a distância estritamente maior do que e um do outro. Disso deduzimos que:
∀ f1, f2 ∈ P : f1 6= f2 ⇒ dT(φ( f1), φ( f2)) ≥ dC( f1, f2)−
e
2
>
e
2
.
Dito de outro modo, a função φ é injetiva sobre P e a imagem deste conjunto,
φ(P) := {φ( f ) : f ∈ P} ⊂ T,
é um (e/2)-empacotamento infinito em (T, dT). No entanto, a existência de φ(P) contradiz o fato
de que (T, dT) é totalmente limitado, que (como vimos) segue da propriedade 1 no Teorema e do
Exercı́cio 6.15. Isto quer dizer que chegamos a uma contradição. Portanto, qualquer famı́lia F
satisfazendo as propriedades 1 e 2 do Teorema tem de ser totalmente limitada. 2
Exercı́cio 7.8 Ao invés de fazermos uma prova por contradição, poderı́amos apresentar um argumento
direto mostrando que P(F , e) ≤ P(T, e/2), para o T construı́do acima. Utilize esta observação e
o Exercı́cio 6.15 para achar uma cota superior para P(F , e) (e portanto para N(F , e)) em termos de
supt∈K N(F (t), e) e N(K, δ).
123
7.4 Mais exercı́cios
Exercı́cio 7.9 Fixo d ∈ N\{0}, consideramos o conjunto Pd de todos os polinômios em uma variável
real que têm grau d ou menor. Observe que, para cada polinômio p ∈ Pd, podemos encontrar coeficientes
a0(p) . . . ad(p) tais que:
∀x ∈ R : p(x) =
d
∑
j=0
aj(p) xj.
Mostre que, dado qualquer conjunto S ⊂ R com mais de d + 1 pontos, existe uma constante Cd,S depen-
dendo apenas de d e S tal que:
∀p ∈ Pd : max
0≤i≤d
|ai(p)| ≤ Cd,S sup
x∈S
|p(x)|.
Exercı́cio 7.10 Deduza do Teorema de Heine-Borel o seguinte resultado: dados d, ` naturais positivos, um
subconjunto K ⊂ Rd×` é compacto (com a topologia dada por qualquer norma) se e somente se ele é fechado
e limitado. Use este resultado para decidir se os conjuntos abaixo são subconjuntos compactos de Rd×d.
1. O(d) := {A ∈ Rd×d : AT A = Id×d} (grupo das matrizes ortogonais d× d);
2. SL(d, R) := {A ∈ Rd×d : det(A) = 1} (grupo linear especialem d dimensões);
3. PSD1(d, R) := {A ∈ Rd×d : A = AT, ∀v ∈ Rd, v.Av ≥ 0 e tr(A) = 1}.
Exercı́cio 7.11 Tome d ∈ N\{0}. Lembre-se de Álgebra Linear que um autovalor de uma matriz A ∈
Rd×d é um número λ ∈ R tal que Ax = λx para algum x ∈ Rd\{0Rd}. Dado um conjunto S ⊂ Rd×d,
defina:
Eig(S) := {λ ∈ R : λ é autovalor de alguma A ∈ S}.
1. Prove que Eig(S) é fechado sempre que S é fechado.
2. Prove que Eig(S) é limitado sempre que S é limitado.
3. Deduza dos itens acima que Eig(S) é compacto sempre que S é compacto.
Exercı́cio 7.12 Prove que um espaço métrico (K, dK) é compacto se e somente se, dada qualquer função
contı́nua f : K → R, a imagem f (K) ⊂ R é compacta.
Exercı́cio 7.13 Considere K ⊂ Rd compacto e convexo (convexidade significa que, dados quaisquer dois
pontos x, x′ ∈ K, o segmento [x, x′] := {(1− λ)x + λx′ : 0 ≤ λ ≤ 1} está todo contido em K). Mostre
que um subconjunto F ⊂ C(K, R`) é totalmente limitado se e somente se ele é equicontı́nuo e existe um
ponto t0 ∈ K tal que F (t0) := { f (t0) : f ∈ F} é limitado.
Exercı́cio 7.14 Fixados α > 0 e espaços métricos (K, dK), (Z, dZ) como no inı́cio do §7.3.2, dizemos que
uma f : K → Z é α-Hölder com constante L > 0 se:
∀x, x′ ∈ K : dZ( f (x), f (x′)) ≤ L dK(x, x′)α.
Note que este conceito generaliza o conceito de função Lipschitz (o caso α = 1 da definição acima).
1. Mostre que toda f que é α-Hölder com alguma constante também é contı́nua.
124
2. No caso particular em que K ⊂ Rd é compacto e convexo (v. exercı́cio anterior) e dK é a métrica
induzida por | · |2, mostre que
f : K → Z α-Hölder com α > 1⇔ f constante.
3. Permita novamente que (K, dK) seja um espaço métrico compacto arbitrário e agora considere Z =
Rd com a métrica usual. Fixos L, α > 0 e um par (t0, z0) ∈ K×Rd, mostre que o conjunto a seguir
é um subconjunto compacto de (C(K, Z), dC):
HL,α,t0,z0 = { f : K → Rd : f é α-Hölder com constante L e f (t0) = z0}.
Exercı́cio 7.15 (Arzèla-Ascoli para funções contı́nuas sobre um aberto) Dado A ⊂ Rd aberto, con-
sidere o espaço C(A, V) com a métrica dC apresentada no §7.2.2. Dada uma função f ∈ C(A, V), pode-
mos definir, para cada compacto K ⊂ A, a restrição de f a K, denotada por f |K. Prove que uma famı́lia
F ⊂ C(A, V) é totalmente limitada de acordo com a métrica dC se e somente se ele tem as seguintes
propriedades:
1. F é pontualmente totalmente limitada, isto é, para todo t ∈ A,
F (t) := { f (t) : f ∈ F} é totalmente limitado;
2. F é equicontı́nua sobre compactos, isto é, para todo compacto não-vazio K ⊂ A:
lim
δ→0+
sup
f∈F
m f |K(δ) = 0.
Deduza que toda sequência { fn}n∈N ⊂ C(A, V) com as duas propriedades acima tem uma subsequência
{ fnk}k∈N com fnk → f ∈ C(A, V) uniformemente sobre compactos.
Exercı́cio 7.16 (Teorema de Dini) Considere um espaço topológico compacto (X, T ) e funções contı́nuas
{ f } ∪ { fn : n ∈ N} de X em R. Suponha que para todo x ∈ X a sequência { fn(x)}n∈N é monótona
e converge a f . Prove que fn tem de convergir uniformemente a f , isto é supx∈X | fn(x)− f (x)| → 0
quando n→ +∞.
Exercı́cio 7.17 Recorde o Exercı́cio 4.18. Naquele problema, tomamos um espaço métrico (X, dX) e uma
f : X → R dada. Dado M > 0, definimos uma nova função fM : X → R,
fM(x) := inf
y∈X
( f (y) + MdX(x, y)) (x ∈ X).
e mostramos que ‖ fM‖Lip ≤ M.
1. Mostre que, se (X, dX) é compacto e f é contı́nua, então fM → f uniformemente. Deduza que as
funções Lipschitz são densas em C(X, R) com a métrica do sup.
2. Suponha agora que X = A é aberto de Rd e dX é a métrica induzida pela norma Euclideana sobre
A. Prove que fM → f uniformemente sobre compactos; portanto, as funções Lipschitz também são
densas em C(A, R) com a métrica da convergência uniforme sobre compactos.
Exercı́cio 7.18 Considere um conjunto S ⊂ Rd não-vazio. Dizemos que uma curva (isto é, uma função
contı́nua) γ : [0, 1]→ Rd cobre S se γ([0, 1]) ⊃ S. Suponha agora que o conjunto
CS := {γ : [0, 1]→ Rd : γ cobre S e ‖γ‖Lip < +∞}
não é vazio. Mostre que existe um elemento γ? ∈ CS com
‖γ?‖Lip = inf{‖γ‖Lip : γ ∈ CS}.
125
126
Capı́tulo 8
Caminhos e conexidade
Se neste moment faz 30oC no Rio de Janeiro e −10oC em São Petesburgo, podemos garantir que
qualquer temperatura entre −10o e 30oC ocorre em algum ponto da superfı́cie do planeta? Este
é um exemplo de uma classe mais geral de perguntas.
Dada uma função real f : X → R, se ela atinge um par de valores a < b, é necessariamente
verdade que ela atinge todos os valores entre a e b? Ou seja, quando vale a implicação:
“∀a, b ∈ f (X) : a < b⇒ [a, b] ⊂ f (X)”?
Pelo Teorema do Valor Intermediário, a implicação acima vale quando X ⊂ R é um intervalo
e f é contı́nua.
O conceito de conexidade de um espaço topológico, apresentado neste capı́tulo, pode ser defi-
nido da seguinte maneira: um espaço é conexo se e somente se toda função contı́nua de X em R
tem a “Propriedade do Valor Intermediário” descrita acima. Outra definição, equivalente a esta,
é que um espaço topológico (X, T ) é conexo se toda divisão de X em duas partes não-triviais
gera uma “quebra”, ou melhor, uma “fronteira” onde as duas partes se encostam. A equivalência
dessas definições é parte do Teorema 8.1 abaixo.
Além de falarmos de conexidade, falaremos de uma outra definição relacionada: a de cone-
xidade por caminhos: um espaço é conexo por caminhos se quaisquer dois pontos são conectados
por uma curva contı́nua. Este segundo conceito é menos geral que a conexidade topológica, mas
é mais intuitivo que o primeiro e também é importante. Além disso, há alguns casos importantes
em que os dois conceitos coincidem. Começamos, então, falando de conexidade por caminhos.
8.1 Conexidade por caminhos
8.1.1 Conectando pontos por curvas
Fixe um espaço métrico (X, dX). Uma curva parametrizada é uma aplicação contı́nua γ : [0, 1]→ X.
Dizemos que γ conecta x ∈ X a x′ ∈ X se γ(0) = x e γ(1) = x′. Dizemos ainda que γ conecta x
a x′ em U ⊂ X se x, x′ ∈ U, γ conecta estes dois pontos e a imagem Im(γ) ⊂ U. Simbolizaremos
esta relação pelo sı́mbolo x U↔ x′.
Definição 8.1 Dizemos que U ⊂ X é conexo por caminhos se x U↔ x′ para todos x, x′ ∈ U.
127
Antes de compreender melhor esta definição, precisaremos de alguns fatos sobre a relação
“ U↔”. O primeiro ponto é mostrar que esta é uma relação de equivalência sobre os elementos de
U.
Lema 8.1 Dados x, x′, x′′ ∈ U, temos:
• Reflexividade: x U↔ x.
• Simetria: x U↔ x′ se e somente se x′ U↔ x.
• Transitividade: x U↔ x′ e x′ U↔ x′′ implicam x U↔ x′′.
Prova: Reflexividade segue do fato de que a curva γ(t) ≡ x, t ∈ [0, 1], conecta x a x. Simetria
vem do fato que γ conecta x a x′ se e somente se t 7→ γ(1− t) conecta x′ a x, e tanto γ quanto
t 7→ 1− t são contı́nuas.
Por fim, suponha x U↔ x′ U↔ x′′. Queremos demonstrar que x U↔ x′′, ou seja, que há uma curva
que conecta x a x′′ em U. Veja primeiramente que, por hipótese, existem curvas γ0, γ1 : [0, 1]→ U
com γ0(0) = x, γ0(1) = γ1(0) = x′ e γ1(1) = x′′. Defina agora:
γ(t) :=
{
γ0(2t), 0 ≤ t ≤ 1/2;
γ1(2t− 1), 1/2 < t ≤ 1.
A ideia é que nós “colamos” a curva γ0 com a curva γ1, o que resulta numa única curva contı́nua
porque γ0 termina onde γ1 começa. De fato, supondo por um instante que γ é contı́nua, vemos
que γ(t) ∈ U para todo t (afinal, γ(t) = γ0(s) ou γ1(s) para algum s ∈ [0, 1]) e conecta x a x′′, de
modo que x U↔ x′′.
Falta checar que γ é mesmo contı́nua. Há várias maneiras de fazer isso e aqui optamos pela
mais topológica.
Dado um conjunto F ⊂ U fechado em U, vamos mostrar que γ−1(F) ⊂ [0, 1] é fechado. Veja
que, dado um t ∈ [0, 1] qualquer,
t ∈ γ−1(F)⇔ (t ≤ 1/2 e γ0(2t) ∈ F) ou (t ≥ 1/2 e γ1(2t− 1) ∈ F).
O ponto sutil acima é que as duas cláusulas do “ou” serão verdade simultaneamente no caso em
que t = 1/2. Isto vem do simples fato que γ0(2t) = x′ = γ1(2t− 1) se t = 1/2. Aqui usamos o fato
de que γ0 termina onde γ1 começa, que é fundamental para termos a continuidade.Vamos agora terminar a prova observando o seguinte. Defina as funções contı́nuas φ0(t) :=
2t, definida para t ∈ [0, 1/2], e φ1(s) := 2s− 1, para s ∈ [1/2, 1]. A equivalência acima nos mostra
que
γ−1(F) = (γ0 ◦ φ0)−1(F) ∪ (γ1 ◦ φ1)−1(F).
Como γ0, γ1, φ0 e φ1 são contı́nuas, temos que (γ0 ◦ φ0)−1(F) ⊂ [0, 1/2] é fechado em [0, 1/2]
e (γ1 ◦ φ1)−1(F) ⊂ [1/2, 1] é fechado em [1/2, 1]. Como ambos os intervalos são fechados,
deduzimos que (γ0 ◦ φ0)−1(F) e (γ1 ◦ φ1)−1(F) são ambos fechados em [0, 1] e portanto γ−1(F),
que é a união dos outros dois, também é fechado em [0, 1], como querı́amos demonstrar. 2
128
8.1.2 Exemplos básicos
Vamos agora estudar alguns casos de conjuntos conexos por caminhos.
Exemplo 8.1 Os conjuntos conexos por caminhos em R são exatamente os intervalos.
Observe que um conjunto I ⊂ R é um intervalo se e somente se, dados x, x′ ∈ I com x < x′,
temos que qualquer ponto z ∈ (x, x′) está em I. Desta forma, sempre que I é um intervalo e
x < x′ estão em I, temos que a curva γ(t) := (1− t) x + t x′ (t ∈ [0, 1]) conecta x a x′ em I, o que
quer dizer que x I↔ x′ e vice-versa. Ou seja, se I é intervalo, então I é conexo por caminhos.
Para ter a recı́proca, suponha que I ⊂ R é conexo por caminhos. Queremos mostrar que
I é um intervalo, isto é, que, dados x, x′ ∈ I com x < x′, então qualquer ponto z ∈ (x, x′)
está também em I. Considere x < x′ como acima e tome uma curva contı́nua γ : [0, 1] → I
conectando x a x′ em I. Esta é uma aplicação contı́nua de [0, 1] em R, portanto o Teorema do
Valor Intermediário nos garante que, dado z ∈ (x, x′), há um t ∈ (0, 1) com γ(t) = z. Em
particular, como a imagem de γ está contida em I, isto quer dizer que z = γ(t) ∈ I. Como
z ∈ (x, x′) é arbitrário, isto encerra a prova.
Exemplo 8.2 Seja (V, ‖ · ‖V) um espaço vetorial normado e C ⊂ V um conjunto convexo, isto é tal que,
dados quaisquer v, v′ ∈ C e t ∈ [0, 1], (1− t) v + tv′ ∈ C. Geometricamente, isto quer dizer que, dados
dois pontos em C, todo o segmento de reta entre eles também está em C.
Veja que claramente C é conexo, dado que, dados v, v′, a curva γ(t) = (1− t) v + t v′, que é
contı́nua (por quê?), demonstra que v C↔ v′. O mais interessante é mostrar que toda bola em V é
convexa. De fato, se R > 0 e v0 ∈ V, a bola B(v0, R) é dada por:
B(v0, R) = {v ∈ V : ‖v− v0‖V < R.}
Mas então, para quaisquer v, v′ ∈ B(v0, R) e t ∈ [0, 1], temos ‖v− v0‖V < R, ‖v′ − v0‖V < R e
portanto
‖(1− t)v + tv′ − v0‖V = ‖(1− t)(v− v0) + t(v′ − v0)‖V
≤ (1− t)‖v− v0‖V + t‖v′ − v0‖V
< (1− t)R + tR = R,
ou seja, (1− t)v + tv′ ∈ B(v0, R).
Exemplo 8.3 Suponha que U, V ⊂ X são conexos por caminhos e têm um ponto em comum. Então
U ∪V é conexo por caminhos.
De fato, seja x0 ∈ U ∩ V. Então, para todo x ∈ U ∪ V, ou x ∈ U e x
U↔ x0 (já que U é
conexo por caminhos), ou x V↔ x0 (e vale o análogo para V). Em ambos os casos, x
U∪V↔ x0 e a
transitividade desta relação garante que x U∪V↔ x′′ para quaisquer x, x′′ ∈ U ∪V.
Exemplo 8.4 Seja U ⊂ X conexo por caminhos. Para qualquer função contı́nua f : U → Y, a imagem
f (U) é conexa por caminhos. Em particular, se Y = R, f (U) é um intervalo.
129
Para ver isso, observe que, dados x, x′ ∈ U e uma curva γ ligando estes dois pontos em U, a
composição f ◦ γ é contı́nua e conecta f (x) a f (x′) em f (U). Deste modo, como todos os pares
de pontos em U são conectados por curvas em U, quaisquer dois pontos y = f (x), y′ = f (x′) em
f (U) são conectados por caminhos em f (U). Ou seja, f (U) é conexo por caminhos.
Exemplo 8.5 Dado d ∈N\{0, 1}, a esfera unitária Sd−1 ⊂ Rd é conexa por caminhos.
Para provar este resultado, a ideia geométrica é a seguinte: dados x, x′ ∈ Sd−1, podemos
pensa na interseção da esfera com o plano que passa por x, x′ e a origem de Rd. Esta interseção
é um cı́rculo que passa pelos dois pontos e podemos tomar o arco do cı́rculo entre x e x′ como a
curva que conecta os dois pontos.
Formalizamos este raciocı́nio usando geometria analı́tica. Tome x, x′ ∈ Sd−1. Como ambos os
vetores estão na esfera, eles têm norma 1 e podemos achar um vetor x⊥ tal que:
x′ = (x.x′) x +
√
1− (x.x′)2 x⊥.
Como |x.x′| ≤ 1 por Cauchy Schwartz, podemos também escrever x.x′ = cos θ para algum
0 ≤ θ ≤ π; deste modo, sin θ ≥ 0 e a relação cos2 θ + sin2 θ = 1 nos diz que sin θ =
√
1− cos2 θ.
Deduzimos que:
x′ = cos θ x + sin θ x⊥.
Portanto, a curva
γ : t ∈ [0, θ] 7→ (cos t) x + (sin t) x⊥
é contı́nua, tem imagem na esfera (exercı́cio) e vai de γ(0) = x e γ(1) = x′. Como x e x′ são
arbitrários, Sd−1 é conexa por caminhos.
Exercı́cio 8.1 Determine se os conjuntos contidos em Rd (d > 1) abaixo são convexos e/ou conexos por
caminhos.
1. O simplexo
∆d :=
{
x ∈ Rd :
d
∑
j=1
x[j] = 1 e ∀i ∈ {1, . . . , d}, x[i] ≥ 0
}
.
2. A esfera unitária Sd−1 := {x ∈ Rd : |x|2 = 1.}
3. Rd\{0}.
Exercı́cio 8.2 Tome a métrica discreta sobre X e prove que este espaço é conexo por caminhos se e somente
se X tem apenas um elemento.
8.2 Conexidade topológica
O conceito de conexidade topológica é menos intuitivo que o de conexidade por curvas, mas é
mais geral e de certo modo mais robusto e mais importante.
Primeiro tentaremos entender a intuição deste conceito. Imagine que tentamos separar X em
duas partes L e R = Lc com L, R 6= ∅. Queremos dizer que, se X é conexo, qualquer divisão
130
deste tipo causará uma “quebra não-trivial”. Para definir isso, sugerimos a seguinte ideia: uma
“quebra” é um conjunto de pontos u ∈ X que “vê de perto” tanto L quanto Lc. Num espaço
métrico, é natural escrever esta condição na seguinte forma:
u está na quebra se BX(u, r) ∩ L 6= ∅ e BX(u, r) ∩ Lc 6= ∅ para todo r > 0.
É fácil ver que u satisfaz as condições acima se e somente se u ∈ ∂L = L ∩ R. Ou seja, quando
dividimos X em L e R = Lc, a quebra é o conjunto ∂L. Dizer que há quebra é, então, pedir que
∂L 6= ∅. Esta é uma maneira de motivar a seguinte definição.
Definição 8.2 Um espaço topológico (X, T ) é conexo se todo L ⊂ X com L 6= ∅, X tem ∂L 6= ∅. Um
subconjunto U ⊂ X é conexo se (U, TU) é conexo, onde TU é a topologia induzida por T em U.
Para esquentar, vale a pena tentar fazer o exercı́cio abaixo.
Exercı́cio 8.3 Suponha que X tem pelo menos dois elementos. Ele é conexo com a topologia grossa? E
com a topologia fina?
8.2.1 Formas equivalentes do conceito
O conceito de conexidade acima faz sentido, mas as consequências dele ainda não são totalmente
claras. Nosso próximo objetivo será provar o seguinte resultado.
Teorema 8.1 Dado um espaço topológico (X, T ), as seguintes propriedades são equialentes.
1. (X, T ) é conexo;
2. os únicos subconjuntos de X que são simultaneamente abertos e fechados são ∅ e X;
3. toda função contı́nua η : X → {0, 1} é constante (usamos a topologia da métrica discreta em {0, 1});
4. para toda toda função contı́nua f : X → R, f (X) := { f (x) : x ∈ X} é um intervalo.
Vejamos o que cada item diz. O primeiro é a nossa definição: X é conexo se qualquer maneira
de parti-lo em dois resulta numa “quebra”. O segundo, como veremos, tem a ver com a relação
entre “∂S = ∅” e um subconjunto ser simultaneamente aberto e fechado. O terceiro diz que não
dá para pintar os pontos de X usando duas cores (aqui representadas por 0 e 1) sem criar uma
região onde se “pula” abruptamente de uma cor pra outra (o que seria uma descontinuidade em
η). O último item nos fala que a imagem de X por f não pode ”pular”um ponto da reta; ou seja,
X é conexo se e somente se o Teorema do Valor Intermediário se aplica a X!
Faremos esta prova por partes e de uma forma que não é “econômica em implicações”.
Começamos com uma proposição que mostra “1⇔ 2”.
Proposição 8.1 Um espaço topológico (X, T ) é conexo se e somente se ∅ e X são os únicos conjuntos
simultaneamente abertos e fechados de X.
Prova: Olhando para a Definição 8.2, vemos que esta Proposição é equivalente à seguinte afirmação.
Afirmação 8.1 Em qualquer espaçotopológico (X, T ), um conjunto L ⊂ X satisfaz ∂L = ∅ se e somente
se L é ao mesmo tempo aberto e fechado.
131
Provemos, então, esta afirmação.
Começamos supondo que L ⊂ X é ao mesmo tempo aberto e fechado; nosso objetivo será
mostrar ∂L = ∅. Para isso, recorde que complementares de abertos/fechados são fechados/abertos
(respectivamente). Portanto, o complementar de L também é ao mesmo tempo aberto e fechado.
Sendo assim, L = L, Lc = Lc e
∂L = L ∩ Lc = L ∩ Lc = ∅, como querı́amos demonstrar.
Agora provamos a implicação na direção contrária. Suponha que L ⊂ X tem fronteira va-
zia; queremos provar que L é ao mesmo tempo aberto e fechado. Nossa hipótese diz que∂L =
L∩ Lc = ∅. Para quaisquer dois subconjuntos de X, A∩ B = ∅ implica A ⊂ Bc. Deste modo, de-
duzimos da igualdade acima que L ⊂ Lcc. Como a Proposição 5.2 nos diz que “o complementar
do fecho é o interior do complementar”, obtemos L ⊂ Lo. Mas também sabemos que Lo ⊂ L ⊂ L
sempre. Portanto, obtemos L = L = Lo. Como L é fechado e Lo é aberto, deduzimos que L é
fechado e aberto. Isto conclui a prova. 2
O próximo passo prova que “1⇔ 3” no Teorema 8.1.
Proposição 8.2 Um espaço topológico (X, T ) é conexo se e somente se toda função contı́nua η : X →
{0, 1} é constante (aqui tomamos a topologia discreta sobre {0, 1}, que é a mesma topologia induzida pela
métrica usual da reta real).
Prova: A prova se baseia caracterização de conexidade na Proposição 8.1 e na seguinte observação:
há uma bijeção natural entre funções contı́nuas η : X → {0, 1} e conjuntos L ⊂ X que são
simultaneamente abertos e fechados.
Para ver isso, tome η : X → {0, 1} contı́nua. Como {0}, {1} são subconjuntos simultanea-
mente abertos e fechados de {0, 1},
Lη := η−1({0}) é aberto e fechado em X.
Na direção contrária, se L ⊂ X é simultaneamente aberto e fechado, é fácil ver que a função:
ηL : x ∈ X 7→
{
0, x ∈ L;
1, x ∈ Lc;
é contı́nua. Note-se ainda que LηL = L e ηLη = η para quaisquer L, η como acima.
Provada a observação, podemos concluir a prova, notando que uma função contı́nua η : X →
{0, 1} é constante se e somente se Lη = ∅ ou Lη = X. 2
A próxima Proposição termina a prova do Teorema 8.1, mostrando que “3⇔ 4.
Proposição 8.3 Um espaço topológico (X, T ) tem a propriedade de que toda função contı́nua η : X →
{0, 1} é constante se e somente se para qualquer f : X → R contı́nua, f (X) é intervalo.
Prova: Provaremos as duas implicações na forma contrapositiva.
Se existe uma η : X → {0, 1} contı́nua e não constante, queremos mostrar que há uma
f : X → R contı́nua tal que f (X) não é intervalo. A ideia é tomarmos f = η, já que o fato de que
η não é constante implica que η(X) = {0, 1} não é intervalo. No entanto, esse argumento falha
por tecnicalidades:
132
• f deve ter contradomı́nio R, enquanto η tem contradomı́nio {0, 1}: elas não podem ser “a
mesma função”;
• mesmo que fossem a mesma função, não é completamente evidente que f seja contı́nua
(com contradomı́nio R e a topologia correspondente) só porque η é cotı́nua.
O primeiro ponto é resolvido observando que podemos definir f : X → R pela fórmula
∀x ∈ X : f (x) = η(x).
Na verdade, este truque é comum: sempre podemos “trocar o contradomı́nio” de uma função
η : S1 → S2 por um outro conjunto S3 6= S2, contanto que S3 ⊃ η(S1). Isso será feito de novo
a seguir e será chamado de “abuso de notação”. O segundo ponto acima também é um pouco
sutil. Resolvê-lo passa pelo fato que a topologia discreta sobre {0, 1} é precisamente a topologia
induzida pela métrica natural sobre a reta real. Deste modo, se S ⊂ R é dado, observe que
f−1(S) = η−1(S ∩ {0, 1}) e que S ∩ {0, 1} é sempre aberto em {0, 1}. Como η é contı́nua, isto
quer dizer que f−1(S) é aberto de X para todo S ⊂ R, o que é mais do que suficiente para garantir
que f : X → R é contı́nua.
Agora suporemos que existe uma f : X → R contı́nua tal que não é intervalo e mostraremos
que existe η : X → R contı́nua e não constante. Dizer que f (X) não é intervalo significa que
existem números reais r < r′ < r′′ na reta com r, r′′ ∈ f (X) e r′ 6∈ f (X). Observe que isso quer
dizer que f (X) ⊂ R\{r′}. Em particular, podemos “abusar notação” e dizer que o contradomı́nio
de f é R\{r′}.
Observe agora que a função ξ : R\{r′} → {0, 1} que leva t ∈ R\{r′} em 0 se t < r′ e em 1 se
t > r′, é contı́nua. Isso quer dizer que η := ξ ◦ f : X → {0, 1} também é contı́nua. Afirmamos
que η não é constante. Para ver isso, basta lembrarmos que r < r′ < r′′ com r, r′′ ∈ f (X), logo
existem x, x′′ ∈ X com f (x) = r, f (x′′) = r′′ e
η(x) = ξ(r) = 0 e η(x′′) = ξ(r′′) = 1.
Portanto, η não é constante. 2
8.2.2 Exemplos
Nossa próxima tarefa é analisar alguns exemplos em que a definição de convexidade é aplicada.
Começamos descobrindo quem são os conjuntos conexos da reta real.
Exemplo 8.6 Os subconjuntos conexos da reta R são precisamente os intervalos.
Para ver isso, tome I ⊂ R intervalo. Dada η : I → {0, 1} contı́nua, veremos que ela tem de
ser constante. Suponha (para chegar a uma contradição) que η não é constante. Como vimos na
prova da Proposição 8.3, podemos “abusar notação” e pensar em η como uma função contı́nua
de I em R. Como ela não é constante, há pontos t0, t1 ∈ I com η(t0) = 0 e η(t1) = 1. O
Teorema do Valor Intermediário implica que para cada x ∈ (0, 1) há um t ∈ I com γ(t) = x.
Mas isto contradiz o fato de que o contradomı́nio de η é {0, 1}. Portanto, se I é intervalo, toda
η : I → {0, 1} tem de ser constante.
133
Por outro lado, suponha que I não é intervalo. Mostraremos que I é desconexo usando uma
função análoga à ξ da prova da Proposição 8.3. Como I não é intervalo, existe um ponto r ∈ R\I
tal que inf I < r < sup I. A função
ξ(t) :=
{
0, t < r
1, t > r.
Esta função está definida para t ∈ R e é sabido que ela só é descontı́nua em t = x. Como x 6∈ I,
sua restrição η = η0 |I é contı́nua. Além disso, vemos que, como x > inf I, existe t0 ∈ (inf I, x)
com t0 ∈ I e portanto η(t0) = 0. Do mesmo modo, como x < sup I, existe t1 ∈ (x, sup I) com
η(t1) = 1. Portanto, o fato de que I não é um intervalo implica que existe η : I → {0, 1} contı́nua
e não constante.
Exemplo 8.7 Todo conjunto conexo por caminhos é conexo. (A recı́proca em geral é falsa.)
Um contraexemplo para a recı́proca será discutido na próxima seção. Para ver que conexidade
por caminhos implica conexidade, imagine que U é conexo por caminhos e que η : U → {0, 1} é
contı́nua. Sem perda de generalidade, supomos que U 6= ∅ e tomamos x0 ∈ U. Nossa tarefa será
mostrar que η(x) = η(x0) para todo x ∈ U. De fato, dado x ∈ U, sabemos que x
U↔ x0, portanto
existe γ : [0, 1] → U contı́nua com γ(0) = x0 e γ(1) = x. A composição η ◦ γ : [0, 1] → {0, 1} é
contı́nua; como [0, 1] é conexo, η ◦ γ é constante. Logo η(x) = η(γ(1)) = η(γ(0)) = η(x0), como
querı́amos demonstrar.
Exemplo 8.8 Se U ⊂ X é conexo, qualquer conjunto V contendo U e contido em U é conexo.
É um bom exercı́cio provar isso no caso em que a topologia de X é dada por uma métrica.
Abaixo, damos uma prova puramente topológica.
Considere η : V → {0, 1} contı́nua; nosso objetivo é provar que ela é constante. O primeiro
passo é observar que a restrição η |U também é contı́nua e, como U é conexo, η |U é constante.
Suporemos sem perda de generalidade que η(x) = 0 para todo x ∈ U. A ideia agora é provar
que η(y) = 0 para todo y ∈ V.
Para isso, é suficiente mostrar que, dado um ponto arbitrário y ∈ V, existe um x ∈ U com
η(x) = η(y). Fixe então um y ∈ V e tome b := η(y). Temos y ∈ η−1({b}). Como η é contı́nua,
η−1({b}) é aberto relativo de V, o que quer dizer que η−1({b}) = A ∩ V para algum aberto
A ⊂ X da topologia T . Então, y ∈ A com A aberto. Também sabemos que y ∈ V ⊂ U e que todo
aberto interceptando U também intercepta U; logo, existe um ponto x ∈ A ∩U. Como U ⊂ V,
x ∈ A ∩U ⊂ A ∩V = η−1({b})⇒ η(x) = b = η(y).
Ou seja, achamoso ponto x ∈ U com η(x) = η(y) de que precisávamos. Isso conclui a prova de
que V é conexo.
Exercı́cio 8.4 Utilize argumentos relacionados com os que vimos acima para mostrar o seguinte resultado:
se U ⊂ X é dado (não necessariamente conexo) e U ⊂ V ⊂ U, então V é o fecho de U na topologia relativa
de V.
Exemplo 8.9 Se U ⊂ X é conexo e f : U → Y é contı́nua, a imagem f (U) é conexa.
134
Tome U e f como acima. Considere η : f (U) → {0, 1} contı́nua. Então η ◦ f : U → {0, 1}
também é contı́nua. Como U é conexo, η ◦ f é constante. Em particular, dados quaisquer a =
f (u) ∈ f (U), a′ = f (u′) ∈ f (U),
η(a) = η( f (u)) = η( f (u′)) = η(a′).
Ou seja, η é constante sobre f (U). Como η : f (U) → {0, 1} é uma função contı́nua qualquer,
deduzimos que f (U) é conexo.
Exemplo 8.10 Se F é uma coleção de subconjuntos conexos de X e F∩ F′ 6= ∅ para quaisquer F, F′ ∈ F ,
então ∪F∈F F é conexo.
Note que provamos que uma união de dois conjuntos conexos por caminhos com ponto em
comum é conexa por caminhos. Aqui, a união é conexa mesmo que a coleção F tenha infinitos
elementos.
Para provar que vale a propriedade acima, tomemos η : ∪F∈F F → {0, 1} contı́nua e dois
pontos quaisquer x, x′ da união, para mostrar que η(x) = η(x′). Para isto, tome F, F′ ∈ F tais
que x ∈ F e x′ ∈ F′ (tais conjuntos têm de existir, porque x e x′ estão na união). Por hipótese,
podemos encontrar um elemento x0 ∈ F ∩ F′. Como F é conexo, η é contı́nua, a restrição de η a
F é constante; isto quer dizer que η(x) = η(x0) porque x0, x ∈ F. Do mesmo modo, a conexidade
de F′ implica η(x′) = η(x0). Deduzimos que η(x) = η(x′), como querı́amos demonstrar.
8.2.3 Um pouco mais sobre conexidade e topologia induzida
Consideramos agora em que (X, T ) é espaço topológico, D ⊂ X e TD é a topologia que T induz
sobre D.
Como podemos decidir se D é conexo? É mais fácil dizer quando D é desconexo: isso ocorre se
e somente se existe um subconjunto L ⊂ D, diferente tanto de D quanto de ∅, que é relativamente
aberto e fechado. Detalhemos estes pontos:
1. “L é relativamente aberto” é o mesmo que dizer que existe um aberto de X, A ⊂ X, com
A ∩ X = L.
2. “L é relativamente fechado” é o mesmo que dizer que o complementar de L em D é relati-
vamente aberto, ou seja, existe um aberto de X, B ⊂ X, com B ∩ D = D\L.
Destas observações, segue o seguinte fato.
Proposição 8.4 D é desconexo se e somente se existem abertos A, B ⊂ X de X tais que A ∩ B ∩ D = ∅
e A ∪ B ⊃ D.
Não provamos esta proposição, que fica como exercı́cio, mas observamos (para ajudar) que
as duas condições sobre A e B querem dizer que B ∩ D é o complementar de A ∩ D em D.
135
8.3 Exemplos mais interessantes das definições
Como vimos acima, as teorias de conexidade (topológica) e conexidade por caminhos são análogas.
De fato, no caso de subconjuntos da reta real R, há uma coincidência total entre as duas
definições: os intervalos são exatamente os subconjuntos conexos e também os conexos por cami-
nhos.
Nossos objetivos nesta seção são três. Em primeiro lugar, mostraremos a conexidade ou não-
conexidade do conjunto de matrizes ortogonais. Em segundo lugar, veremos que os conceitos de
conexidade e conexidade por caminhos, que são equivalentes em dimensão 1, não são equiva-
lentes já em dimensão 2. Por último, mostraremos que as duas noções de conexidade coincidem
sempre que falamos de abertos em espaços vetoriais normados.
8.3.1 Matrizes ortogonais
12/04/2021 - sendo escrita.
Nesta seção, tomamos d ∈ N\{0, 1} e consideraremos alguns subconjuntos de Rd×d. Obvia-
mente, este espaço inteiro é um espaço vetorial, logo convexo e conexo por caminhos. Precisare-
mos de algumas propriedades da função determinante:
det : Rd×d → R.
1. A matriz identitade d× d tem determinante det(Id×d) = 1.
2. Dadas A, B ∈ Rd×d, det(AB) = det(A)det(B).
3. O determinante não muda se tomamos a transposta da matriz.
4. Uma matriz A ∈ Rd×d tem determinante não-nulo se e somente se é inversı́vel.
5. Se a matriz A ∈ Rd×d tem a estrutura abaixo:
A =

0
Ã
...
0
0 . . . 0 1
 ;
isto é, se A[i, d] = A[d, i] = 0 para 1 ≤ i < d− 1, A[d, d] = a ∈ R e Ã ∈ R(d−1)×(d−1) tem
entradas A[i, j] para 1 ≤ i, j ≤ d− 1, então det(A) = a det(Ã).
O resultado abaixo é bastante útil para se estabelecer a conexidade por caminhos de outros
grupos de matrizes.
Teorema 8.2 Considere o conjunto de matrizes ortogonais
O(d) := {Q ∈ Rd×d : QTQ = Id×d}
e seus subconjuntos
SO(d) := {Q ∈ Rd×d : det(Q) = 1};
SO−(d) := {Q ∈ Rd×d : det(Q) = −1}.
136
Então O(d) = SO(d) ∪ SO−(d) (com união disjunta). O(d) é desconexo, mas SO(d) e SO−(d) são
conexos por caminhos.
Este resultado pode ser apreciado de duas maneiras. Uma é matemática: SO(d) e O(d) são
grupos de Lie – isto é, grupos que têm estruturas de variedade – e este resultado nos dá informação
sobre a topolgia do espaço.
Outra maneira é mais aplicada. Imagine que quero descolar um conjunto de pontos S ⊂ R3
para um outro, QS ⊂ R3 com Q ∈ SO(3). Podemos imaginar por exemplo que S é um pedaço
de chapa metálica que está deitado e queremos botar em outra posição. O fato de que SO(3)
é conexo por caminhos significa que há uma maneira contı́nua de passar de Q(0) = Id×d para
Q(1) = Q; ou seja, há como mexer S sem saltos para passar de uma posição a outra.
Esta prova dará um bocado de trabalho, mas a graça dela é termos a oportunidade de traba-
lhar com o grupo SO(d) mais de perto. Vários passos serão deixados como exercı́cios que não
são difı́ceis para quem lembra bem de Álgebra Linear.
Prova: Começamos a prova com algumas observações de Álgebra Linear, que deixamos como
exercı́cio.
Exercı́cio 8.5 O(d) e SO(d) são grupos (fechados por produtos e inversas). Além disso, uma matriz
pertence a O(d) se e somente se suas colunas são ortonormais (têm norma 1 e são ortogonais umas às
outras).
Nosso primeiro passo será mostrar o seguinte resultado.
O(d) = SO(d) ∪ SO−(d) é desconexo.
Para continuar, vamos entender porque O(d) tem duas partes. Veja que:
∀Q ∈ O(d) : det(Q)2 = det(QT)det(Q) = det(QTQ) = det(Id×d) = 1.
Como det(Q) toma valores reais, deduzimos que det(Q) ∈ {−1,+1} para qualquer matriz Q ∈
O(d), o que quer dizer que toda Q ∈ O(d) está ou em SO(d) ou em SO−(d). Além disso,
notamos que estes dois conjuntos não são vazios, já que a identidade está em SO(d) e a matriz
R =

0
Id−1
...
0
0 . . . 0 1
 ∈ SO−(d)
(em virtude da propriedade 5 do determinante). Concluı́mos que O(d) é a união disjunta de
SO(d) e SO−(d) e estes dois conjuntos não são vazios: em particular, a imagem da função
determinante sobre O(d) é det(O(d)) = {−1, 1}, que não é intervalo. Por isso, O(d) não é
conexo.
Agora que encontramos as duas “partes naturais” de O(d), mostraremos que as duas são co-
nexas por caminhos. De fato, o próximo argumento nos mostra que só precisamos nos preocupar
com uma delas.
Se SO(d) é conexo por caminhos, SO−(d) também é.
137
De fato, considere a matriz R definida acima. Usando a continuidade da multiplicação de
matrizes, vê-se facilmente (exercı́cio) que
ψ : Q ∈ SO(d) 7→ RQ ∈ SO−(d)
é uma bijeção contı́nua com inversa contı́nua. Em particular, SO−(d) = ψ(SO(d)). Completa-
mos este passo lembrando que a imagem de um espaço conexo por caminhos por uma função
contı́nua também é conexa por caminhos.
A partir daqui, usaremos indução em d ≥ 2 para provar que SO(d) é conexo por caminhos.
SO(d) é conexo por caminhos – caso base (d = 2).
Este caso é resolvido pelo seguinte exercı́cio.
Exercı́cio 8.6 Mostre que
SO(2) =
{(
cos θ − sin θ
sin θ cos θ
)
: θ ∈ R
}
e deduza que SO(2) é conexo por caminhos. (A dica é usar o fato que as colunas de Q ∈ SO(2) são
ortonormais para observar que a primeira coluna é Q1 = (cosθ, sin θ)T para algum θ. A outra coluna
é um dos dois vetores unitários ortogonais a Q1. A condição de determinante igual a 1 diz qual vetor
ortogonalescolher.)
SO(d) é conexo por caminhos – passo indutivo (d ≥ 3).
A ideia será encontrarmos dentro de SO(d) uma cópia (que na verdade é um subgrupo)
que é uma “cópia” de SO(d − 1) (e portanto é conexo por caminhos). Daı́, encerraremos a
prova mostrando que toda Q ∈ SO(d) pode ser conectada por uma curva contı́nua a alguma
Q1 ∈ H(d).
Exercı́cio 8.7 Mostre que as duas afirmações acima – H(d) conexo por caminhos e todo Q ∈ SO(d)
conectado por curva contı́nua a alguma Q1 ∈ H(d) – são suficientes para se deduzir que SO(d) é conexo
por caminhos.
Achando uma “cópia” de SO(d− 1) em SO(d). Para encontrarmosH(d), começamos definindo
uma função função Φd : R(d−1)×(d−1) → Rd×d da seguinte forma.
Φd(Q̃) :=

0
Q̃
...
0
0 . . . 0 1
 (Q̃ ∈ R(d−1)×(d−1)).
Pode-se verificar diretamente que Πd é contı́nua entrada a entrada e portanto é contı́nua.
ALém disso, ela tem as seguintes propriedades
Exercı́cio 8.8 Mostre que Πd(I(d−1)×(d−1)) = Id×d e que, para quaisquer Q̃1, Q̃2 ∈ R(d−1)×(d−1),
det(Πd(Q̃1)) = det(Q̃1), Πd(Q̃1)T = Πd(Q̃1)T e Πd(Q̃1)Πd(Q̃2) = Πd(Q̃1Q̃2).
138
Segue do exercı́cio acima que, dada uma Q̃ ∈ R(d−1)×(d−1) qualquer
Πd(Q̃) ∈ SO(d)⇔ Q̃ ∈ SO(d− 1). (8.1)
Chamamos de H(d) := Φd(SO(d − 1)) e verificamos que H(d) ⊂ SO(d). Pela hipótese de
indução, SO(d− 1) é conexo por caminhos. Como Πd é contı́nua, H(d) também é.
Conectando elementos de SO(d) a H(d). Nosso próximo passo será mostrar a seguinte afirmação.
Afirmação 8.2 Dada Q ∈ SO(d), existe uma Q1 ∈ H(d) com Q
SO(d)↔ Q1.
Para isso, precisamos primeiramente de uma informação adicional sobre H(d).
Observação 8.1 Um elemento Q ∈ SO(d) pertence a H(d) se e somente se sua d-ésima
coluna é ed.
Prova: Claramente, todo elemento de H(d) tem a última coluna igual a ed.
Por outro lado, tome Q ∈ SO(d) com a última coluna igual a ed. Queremos
mostrar que Q ∈ H(d), isto é, que existe uma Q̃ ∈ SO(d− 1) com Πd(Q̃) = Q
Note que, se a d-ésima coluna de Q é ed, todas as entradas Q[i, d] com 1 ≤ i < d são
0, enquanto Q[d, d] = 1. Além disso, as demais colunas Q1, . . . , Qd−1 de Q satisfazem
Qj[d] = Qj.ed = 0 (porque as colunas são ortonormais). Logo, vê-se que Q[j, d] = 0
para todo 1 ≤ j < d. Vê-se, então, que Q necessariamente tem a forma:
Q = Πd(Q̃) para alguma Q̃ ∈ R(d−1)×(d−1)
e a equação (8.1) garante que Q̃ ∈ SO(d− 1), como querı́amos demonstrar. 2
Agora tomamos uma Q ∈ SO(d) arbitrária e construı́mos um caminho contı́nuo γ : [0, θ] →
SO(d) (para algum θ ∈ R+) ligando Q a uma Q1 ∈ H(d). Pela observação acima, o que
devemos fazer é garantir que a última coluna de Q1 é ed, enquando a matriz γ(t) é ortogonal
com determinante 1 em cada 0 ≤ t ≤ θ.
Considere a última coluna de Q, que chamamos de Qd ∈ Rd. Seguindo os passos do Exemplo
8.5, podemos escrever ed na forma:
ed = cos θ Qd + sin θ Q⊥d com Q
⊥
d ⊥ Qd.
Se seguı́ssemos aquele Exemplo, traçarı́amos agora uma trajetória num cı́rculo na esfera unitária
para conectar Qd a ed. É isto que faremos abaixo, mas construindo um caminho γ0 no espaço de
matrizes SO(d) tal que γ0(θ)Qd = ed. Para isso, precisamos do seguinte primeiro passo.
Exercı́cio 8.9 Use o fato que d ≥ 3 para mostrar que existe uma transformação ortogonal V ∈ SO(d)
levando Qd em ed e Q⊥d em ed−1.
139
Agora considere
γ0(t) := VT Z(t)V, onde Z(t) :=

0
I(d−2)×(d−2)
...
0
0 . . . 0
cos t sin t
− sin t cos t
 (0 ≤ t ≤ θ).
Note que γ0(0) = Id×d (pois VTV = Id×d) e que γ0(t) ∈ SO(d) (porque é o produto de
V, VT, Z(t) ∈ SO(d), como se pode verificar diretamente) para cada 0 ≤ t ≤ θ. Portanto,
γ(·) := γ0(·) Q é uma curva com valores em SO(d) e γ(0) = Q. Também não é difı́cil verificar
que γ é contı́nua.
Para terminarmos a prova, veremos que γ(θ) ∈ H(d). Por tudo que já vimos até agora, isto se
resume a mostrar que a d-ésima coluna de γ(θ) = γ0(θ)Q é ed. Será útil usar o seguinte exercı́cio.
Exercı́cio 8.10 Prove que, dadas quaisquer matrizes A, B ∈ Rd×d, se Bj é a j-ésima coluna de B, ABj é a
j-ésima coluna de AB; ou seja, as colunas de AB são as colunas de B multiplicadas por A à esquerda.
Portanto:
• A última coluna de VQ é VQd = ed;
• A última coluna de Z(θ)VQ é Z(θ) ed = cos θed + sin θed−1.
• Como VT é a inversa de V, a última coluna de γ(t) = VTZ(θ)VQ é
V−1(cos θed + sin θed−1) = cos θQd + sin θ Q⊥d = ed.
Isto encerra a prova. 2
8.3.2 Um conjunto conexo que não é conexo por caminhos
Vejamos primeiro um caso em que as duas definições discordam.
Teorema 8.3 Defina Γ0 ⊂ R2 da seguinte forma:
Γ0 := {(x, sin(1/x)) : x ∈ (0, 1]}
e Γ = Γ0 ∪ {(0, 1)}. Este Γ é conexo, mas não é conexo por caminhos.
Prova: A prova terá três partes.
Passo 1 Primeiro provaremos que Γ0 é conexo por caminhos e portanto conexo.
Passo 2 Provaremos a seguir que Γ não é conexo por caminhos.
Passo 3 Veremos que Γ0 ⊂ Γ ⊂ Γ0, o que implica que Γ é conexo (pelo Exemplo 8.8).
140
Passo 1: Γ0 conexo por caminhos. A função f : (0, 1] → R2 que leva x ∈ (0, 1] em f (x) :=
(x, sin(1/x)) ∈ R2 é contı́nua coordenada a coordenada e portanto contı́nua. Como (0, 1] é
conexo por caminhos, sua imagem também é. Esta imagem é precisamente o conjunto Γ0.
Passo 2: Γ não é conexo por caminhos. Provaremos que os pontos p = (0, 1) e q = (1, sin(1)),
ambos pertencentes a Γ, não podem ser conectados por uma curva contı́nua em Γ. De fato,
suponha (para chegar a uma contradição) que existe γ : [0, 1] → Γ contı́nua com γ(0) = p
e γ(1) = q. Considere as coordenadas γ1(t), γ2(t) de γ(t). Como γ é contı́nua, γ1 e γ2 são
contı́nuas. Temos ainda que γ1(0) = 0 e γ1(1) = 1.
Como γ1 : [0, 1]→ R, o Teorema do Valor Intermediário nos garante que existe um t0 ∈ (0, 1)
com γ1(t0) = 1/(π/2). Suponha indutivamente que definimos
t0 > t1 > t2 > · · · > tn > 0
de modo que, para cada 0 ≤ m ≤ n, γ1(tm) = 1/(mπ + π/2). Veja que novamente γ1(0) <
1/((n + 1)π + π/2) < γ1(tn), logo existe um tn+1 ∈ (0, tn) com γ1(tn) = 1/((n + 1)π + π/2).
Desta forma, provamos que existe uma sequência decrescente {tn}n∈N ⊂ (0, 1) com
∀n ∈N : γ2(tn) = sin
(
1
γ1(tn)
)
= ±1,
dependendo se n é par ou ı́mpar.
Vemos que a sequência tn converge para um t ∈ [0, 1], posto que é decrescente. Isto implica
γ2(tn) → γ2(t), o que contradiz o fato que a sequência γ2(tn) alterna entre ±1, como vimos
acima. A contradição implica que não podemos conectar p e q por uma curva em Γ.
Passo 3: Γ0 ⊂ Γ ⊂ Γ0. A primeira inclusão é trivial. Para checar a segunda, basta ver que
o ponto p = (0, 1), que é o que adicionamos para formar Γ, está no fecho de Γ0. Mas para isso
basta ver que a sequência
pn =
(
1
π
2 + 2πn
, 1
)
(n ∈N)
está toda em Γ0 e converge a p. 2
Exercı́cio 8.11 Mostre que Γ0 = Γ0 ∪ ({0} × [−1, 1]).
8.3.3 Concordância para abertos de espaços vetoriais
Nesta seção mostramos um caso muito importante em que os dois conceitos de conexidade
concordam.
Teorema 8.4 Considere um espaço vetorial normado (V, ‖ · ‖V) e um subconjunto aberto A ⊂ V. Então
A é conexo se e somente se é conexo por caminhos.
Prova: Uma direção já está dada; além disso, o resultado é trivial se A = ∅. Só nos falta provar
que um A ⊂ V, A 6= ∅ que é aberto e conexo também é conexo por caminhos. O argumento que
usaremos é tı́pico de provas envolvendo conexidade.
Como A 6= ∅, podemos encontrar x0 ∈ A. Considere o subconjunto L ⊂ A de todos os
x ∈ A com x0
A↔ x. Nosso objetivo é provar que L = A; para isso, suporemos (para chegar
141
a uma contradição) que L 6= A, de modo que R = A\L 6= ∅. A contradição estará provada
quando mostrarmos que L e R são relativamente abertos em A, o que quer dizer que A é desconexo.
Vejamos, portanto, a prova destes fatos.
1. Queremos mostrar que L é relativamente aberto em A. Como A é aberto, isto é o mesmo
que mostrar que L é aberto de V. Para isto, dado x ∈ L, devemos encontrar δ > 0 tal que
B(x, δ) ⊂ L. Mas isto é simples. Como A é aberto, existe um δ > 0 com B(x, δ) ⊂ A.
A discussão logo após o Exemplo8.2 acima nos diz que B(x, δ) é convexa, logo qualquer
x′ ∈ B(x, δ) satisfaz x B(x,δ)↔ x′. Como B(x, δ) ⊂ A, isto também nos diz que x A↔ x′ para
todo x′ ∈ B(x, δ). Mas recorde que, pelo Lema 8.1, a relação “ A↔”é transitiva, logo o fato
de que x ∈ L, e portanto x A↔ x0, implica que x′
A↔ x0 para todo x′ ∈ B(x, δ). Ou seja,
B(x, δ) ⊂ L.
2. Do mesmo modo que acima, queremos provar que R ⊂ V é aberto. Para isto, dado x ∈ R,
tomamos δ > 0 com B(x, δ) ⊂ A. Novamente temos x′ A↔ x para todos x′ ∈ B(x, δ). Deste
modo, se algum x′ ∈ B(x, δ) satisfaz x′ A↔ x0, também teremos x
A↔ x0, o que contradiz o
fato que x 6∈ L. Deduzimos que x′ não está conectado em A a x0 para qualquer x′ ∈ B(x, δ),
ou seja, B(x, δ) ⊂ A\L = R.
2
8.4 Mais exercı́cios
Exercı́cio 8.12 Considere dois conjuntos abertos e conexos U, V ⊂ R2 com U ∩ V 6= ∅. É necessaria-
mente verdade que U ∩V é conexo? E o conjunto U ∪V? E se supomos que U e V são convexos?
Exercı́cio 8.13 (Componentes conexas) Tome um espaço topológico (X, T ). Dado x ∈ X, chamamos
da componente conexa de x em X o conjunto:
C(x) :=
⋃
U⊂X conexo
x∈U
U.
1. Prove que C(x) 6= ∅ é conexa para cada x ∈ X. Além disso, mostre que C(x) é fechado de X.
2. Prove que quaisquer dois pontos x, x′ ∈ X ou têm a mesma componente conexa (C(x) 6= C(x′)), ou
têm componentes disjuntas (C(x) ∩ C(x′) = ∅).
3. Deduza que existe A ⊂ X tal que X = ∪x∈AC(x) com união disjunta (ou seja, todo espaço
topológico é uma união disjunta de componentes conexas) e que qualquer U ⊂ X conexo está contido
em C(x) para algum x ∈ A.
Exercı́cio 8.14 (Componentes conexas da diferença) Tome um espaço topológico conexo (X, T ) e um
subconjunto conexo Y ⊂ X. Considere qualquer uma das componentes conexas CY\X(x) de Y\X e mostre
que Y ∪ CY\X(x) tem de ser conexo.
142
Exercı́cio 8.15 (Componentes conexas de abertos em espaços vetoriais) Consideramos agora o caso
particular da definição acima em que (V, ‖ · ‖V) é espaço vetorial, X ⊂ V é subconjunto aberto de V e T
é a topologia sobre V definida a partir da norma ‖ · ‖V . Prove que C(x) é aberto para cada x ∈ X. Mostre
ainda que:
∀x ∈ X : C(x) =
⋃
A⊂X conexo por caminhos
x∈A
A.
Exercı́cio 8.16 Considere espaços métricos (Xi, di), 1 ≤ i ≤ k, e construa o espaço-produto X com uma
das métricas-produto correspondente (cf. Exercı́cio 3.10). Dados conjuntos conexos e não vazios Ci ⊂ Xi
para i = 1, 2, . . . , k, prove que
C1 × C2 × · · · × Ck é conexo ⇔ Ci é conexo para cada i = 1, 2, 3, . . . , k.
Exercı́cio 8.17 Neste problema, seguimos a notação do Exercı́cio 5.30 e consideramos a soma de Min-
kowski A + B de dois subconjuntos não-vazios A, B ⊂ V de um espaço vetorial normado (V, ‖ · ‖V).
Prove os seguintes fatos:
1. se A e B são conexos por caminhos, A + B também é;
2. se A e B são conexos, A + B também é.
Exercı́cio 8.18 Considere um espaço vetorial normado (V, ‖ · ‖V). Dizemos que um conjunto A ⊂ V
é conexo por caminhos poligonais se, dados x0, x1 ∈ A, podemos encontrar um k ∈ N\{0} e pontos
y0 = x0, y1, . . . , yk = x1 ∈ A tais que, para cada i = 0, 1, . . . , k− 1, o s segmentos de reta [yi, yi+1] estão
contidos em A. Prove que, se A ⊂ V é aberto é conexo, então A é conexo por caminhos poligonais.
Exercı́cio 8.19 Um espaço métrico (X, dX) é localmente conexo por caminhos se para cada x ∈ X, existe
um δ0 > 0 tal que, dado qualquer δ ∈ (0, δ0), BX(x, δ) é conexa por caminhos. Mostre que, se (X, dX) é
localmente conexo por caminhos, então qualquer A ⊂ X aberto e conexo também é conexo por caminhos.
Exercı́cio 8.20 Mostre que um espaço métrico (X, dX) é conexo se a imagem de qualquer função contı́nua
f : X → R é um intervalo. Prove ainda que (X, dX) é conexo e compacto se e somente se a imagem de
qualquer função contı́nua f : X → R é um intervalo compacto.
Exercı́cio 8.21 Considere um espaço métrico (X, dX). Dizemos que uma coleção F de subconjuntos F ⊂
X é combinatorialmente conexa se dada qualquer partição F = F0 ∪F1 com F0,F1 6= ∅ e F0 ∪F1 = F ,
existem F0 ∈ F0 e F1 ∈ F1 com F0 ∩ F1 6= ∅. Prove que se F é combinatorialmente conexa e cada F ∈ F
é conexo, então a união ∪F∈F F é um subconjunto conexo de X.
143
144
Parte III
Cálculo em espaços vetoriais
145
Capı́tulo 9
Preâmbulo
Até aqui, apresentamos as definições de espaços métricos e vetoriais e estudamos Topologia com
foco nestes espaços. Aprendemos bastante, mas, para realmente fazermos Análise, precisamos ir
um passo além e aprender a diferenciar e integrar em espaços mais gerais que a reta real.
Começamos esta tarefa no capı́tulo 10 com derivadas e integrais de funções de intervalos da
reta a espaços vetoriais. Os conceitos de derivada e integral têm generalizações diretas a estes
espaços, que estudaremos em detalhes. No entanto, já aqui teremeos que lidar com o fato de
que funções em dimensão maior que 1 podem ter comportamente um tanto quanto diferente do
que na reta. O principal exemplo disso é o fato de que o Teorema do Valor Médio tem de ser
substituı́do pela Desigualdade do Valor Médio.
Considere agora o caso em que f : V → W, onde (V, ‖ · ‖V) e (W, ‖ · ‖W) são espaços
vetoriais normados. Se tentamos definir uma derivada via um quociente, como no caso V = R,
esbarramos em uma dificuldade importante: não sabemos “dividir” um elemento de W por um
elemento de V! De fato, mesmo quando V = W = R3 (por exemplo) não há uma maneira natural
de definir o quociente que levaria à derivada no caso V = R.
A saı́da para este problema é recorrer a uma outra maneira de definir derivada. No caso de
f : I → R, o valor f ′(t) da derivada em t ∈ I satisfaz o seguinte: α = f ′(t) é o único número real
com a seguinte propriedade.
lim
h→0
| f (t + h)− f (t)− α h|
|h| = 0.
Da mesma forma, podı́amos ter escrito que α = f ′(t) se, quando escrevemos:
rt(h) := f (t + h)− f (t)− α h,
temos |rt(h)|/|h| → 0 quando h→ 0.
Nesta definição alternativa dividimos não por h, mas sim por seu “tamanho”. A vantagem
é que isso faz sentido em todo espaço vetorial normado, quando medimos o tamanho de h ∈ V
por sua norma ‖h‖V .
Para chegar à definição de derivada, precisamos ainda entender quem (ou o que) faz o papel
do termo α h. A chave neste caso será pensar em f (t + h) ≈ f (t) + α h como uma aproximação
de f por uma função afim, isto é, a soma de uma função linear com uma constante. A analogia
natural para outros espaços é escrever
f (x + h) ≈ f (x) + A h
147
onde A é uma transformação linear.
Em linhas gerais, o que discutimos acima é a definição de derivada devida a Fréchet, que es-
tudaremos abaixo. Também discutiremos derivadas parciais e direcionais, mas ficará claro que a
definição de Fréchet tem propriedades melhores. Por exemplo, ela é a única destas definições que
satisfaz a regra da cadeia. Além disso, uma vez que aceitamos a derivada como transformação
linear, fica mais limpa a passagem para derivadas superiores e fica mais fácil derivar em espaços
que não são o Rd. De qualquer forma, tudo isso fará mais sentido depois da breve revisão de
Álgebra Linear que teremos a seguir.
Observação 9.1 O leitor pode se perguntar porque não tentamos definir derivadas em espaços ainda mais
gerais, por exemplo, espaços métricos. Uma resposta possı́vel é que a derivada é uma tentativa de aproximar
funções por somas de funções constantes e lineares, logo devemos trabalhar num espaço em que isso faça
sentido. Certamente há espaços métricos em que seria muito difı́cil de se falar disso. No entanto, veremos
neste curso que, ao menos em um caso particular – o das subvariedades de Rd – será possı́vel falar de
derivadas por causa de uma estrutura linear local.
148
Capı́tulo 10
Funções a um parâmetro: derivadas e
integrais
Nosso objetivo neste capı́tulo é desenvolver rudimentos de um Cálculo para funções com valores
em V Banach que dependem de um único parâmetro real. Boa parte do que vamos fazer éexatamente igual ao que se faz no caso de funções entre conjuntos da reta. Por esta razão, muitos
passos importantes serão tomados como exercı́cios.
Notação para este capı́tulo: Nos próximos resultados, I = [a, b] ⊂ R é um intervalo
fechado e limitado da reta (com a < b reais), (V, ‖ · ‖) é Banach, e f : I → V é dada.
10.1 Derivadas: definição e resultados preliminares
O primeiro passo será generalizar o conceito de derivada.
Definição 10.1 Dizemos que f é diferenciável em t ∈ I se existe o limite:
f ′(t) := lim
h→0
f (t + h)− f (t)
h
.
A definição é a mesma do caso real e podemos fazer algumas considerações gerais relacionadas.
Por exemplo, o fato abaixo decorre de que limites em Rd são sempre tomados coordenada a
coordenada.
Exercı́cio 10.1 Mostre que, se V = Rd, então f ′(t) existe se e somente se cada uma das funções coorde-
nadas f [i] é diferenciável em t. Neste caso,
f ′(t) = ( f ′[i](t))di=1.
Exercı́cio 10.2 Se f , g : I → V são ambas diferenciáveis em t ∈ I e λ ∈ R e um escalar, então:
(λ f + g)′(t) = λ f ′(t) + g′(t).
149
Exercı́cio 10.3 Fixe v ∈ V e uma função F : I → R diferenciável. Podemos definir uma nova função
f : I →W dada por:
f (t) := F(t) v (t ∈ I).
Supondo que F′(t) existe para um certo t ∈ I, mostre que f ′(t) = F′(t) v.
Exercı́cio 10.4 Fixe v ∈ V e uma função F : I → L(V, W) diferenciável. Podemos definir uma nova
função f : I →W dada por:
f (t) := F(t) v (t ∈ I).
Supondo que F′(t) existe para um certo t ∈ I, mostre que f ′(t) = F′(t) v.
Exercı́cio 10.5 Prove que toda f diferenciável em t ∈ I também é contı́nua em t.
Exercı́cio 10.6 (Regra de Leibniz geral) Suponha que V, W, Z são espaços vetoriais com respectivas
normas ‖ · ‖V , ‖ · ‖W e ‖ · ‖Z. Neste exercı́cio, supomos que B : V ×W → Z é bilinear e contı́nua. Eis
alguns exemplos abaixo.
1. V = Rd1×d2 , W = Rd2×d3 , Z = Rd1×d3 e B é o produto matricial.
2. V = W = Z = C([0, 1], R) e B é o produto de funções ou a operação de convolução.
Agora suponha que f : I → V e g : I → W são diferenciáveis em t ∈ I. Prove que B( f , g) : I → Z,
definida por:
B( f , g)(s) := B( f (s), g(s)) (s ∈ I)
tambem é diferenciável em t ∈ I e
B( f , g)′(t) = B( f ′(t), g(t)) + B( f (t), g′(t)).
10.2 A desigualdade do valor médio
Agora vamos assinalar uma diferença crucial entre a derivada na reta e casos mais gerais. Um
dos principais teoremas do caso V = R é o Teorema do Valor Médio, que diz que, dados x, y ∈ I,
se f é diferenciável no intervalo entre x e y, então existe um ponto θ nesse intervalo tal que
f (x)− f (y) = f ′(θ) (x− y).
Esse resultado não vale em geral quando V é um espaço vetorial qualquer. De fato, ele falha já
para V = R2.
Exercı́cio 10.7 Se f (t) = (t2, t3), t ∈ [0, 1], vemos que f (1)− f (0) 6= f ′(θ) para qualquer θ ∈ [0, 1].
O que podemos guardar do caso unidimensional é uma cota na magnitude de f (x)− f (y). De
fato, temos a Desigualdade do Valor Médio neste caso.
Teorema 10.1 (Desigualdade do Valor Médio) Dados t, s ∈ I e f : I → R contı́nua em I = [a, b] e
diferenciável em (a, b), suponha que
M := sup
x∈I
‖ f ′(x)‖V < +∞.
Então temos a desigualdade
∀t, s ∈ [a, b] : ‖ f (t)− f (s)‖V ≤ M |t− s|.
150
Prova: Note que basta provar a desigualdade acima para t, s ∈ (a, b). Afinal, como f é contı́nua,
o conjunto de pares (t, s) ∈ I × I com ‖ f (t) − f (s)‖V ≤ M |t − s| é fechado. Se este conjunto
contem (a, b)× (a, b), também deve conter o fecho deste conjunto, que é I × I.
Feita essa observação, suporemos (sem perda de generalidade) que t < s, sabendo que f é
diferenciável no intervalo [t, s] ⊂ (a, b).
Dado um M > M′, definimos o conjunto:
IM′ := {x ∈ [t, s] : ‖ f (x)− f (t)‖V ≤ M′ (x− t)}.
Ou seja, IM′ é o conjunto de pontos x ∈ [t, s] que satisfazem a estimativa dada pela desigualdade
do valor médio, mas com M′ substituindo M (esta “folga na constante” é uma tecnicalidade
importante na conta). Provaremos a seguir que:
Objetivo: ∀M′ > M : s ∈ IM′ , isto é, ‖ f (x)− f (t)‖V ≤ M′ (x− t).
Dado isso, a desigualdade desejada é deduzida tomando M′ → M.
Para atingir nosso objetivo, note primeiramente que IM′ não é vazio porque pelo menos t está
lá. Como além disso IM′ é limitado, sM′ := sup IM′ está bem definido. Também é verdade que
IM é fechado, por causa da continuidade de f . Logo, IM′ é compacto, e em particular sM′ ∈ IM′ .
Nosso objetivo será cumprido se provarmos que sM′ = s.
Suponha, então (para chegar a uma contradição) que sM′ < s. Como t ∈ IM′ , sabemos que
t ≤ sM′ < s e que portanto sM′ + h ∈ [t, s] para h > 0 suficientemente pequeno. Agora observe
que
lim
h→0,s+h∈I
∥∥∥∥ f (sM′ + h)− f (sM′)h
∥∥∥∥
V
= ‖ f ′(sM)‖V ≤ M < M′.
Portanto, se h > 0 é suficientemente pequeno, não só sM′ + h ∈ [t, s], como também∥∥∥∥ f (s + h)− f (s)h
∥∥∥∥
V
≤ M′,
o que quer dizer que
‖ f (sM′ + h)− f (s)‖V ≤ M′ h.
Por subaditividade, deduzimos que
‖ f (sM′ + h)− f (t)‖V ≤ ‖ f (sM′ + h)− f (sM′)‖V + ‖ f (sM′)− f (t)‖V ≤ M′ (h + sM′ − t).
Ou seja, sM′ + h ∈ IM′ e sM′ + h > sM′ = sup IM′ . Esta contradição ocorreu porque supusemos
que sM′ < s; portanto, mostramos que sM′ = s. 2
Exercı́cio 10.8 Prove que, para qualquer função diferenciável f : I → V,
‖ f ‖Lip = sup
t∈(a,b)
‖ f ′(t)‖V .
(Aqui admitimos que o supremo pode ser infinito.)
151
Exercı́cio 10.9 Suponha que γ : I → V é diferenciável e γ′ : I → V é contı́nua. Dado um subintervalo
J = [c, d] ⊂ [a, b] com a < c < d < b, e dado um h ∈ R com tal que |h| ≤ min{c− a, b− d}, definimos:
∆hγ : t ∈ J 7→
γ(t + h) + γ(t)
h
∈ V.
Mostre que
lim
ε→0+
sup
0<|h|≤ε
‖∆hγ− γ′‖J,∞ = 0.
10.3 Integração de funções sobre intervalos
Nosso próximo objetivo é estender a teoria de integração de funções contı́nuas sobre intervalos a
funções com valores em V (com V Banach). Nesta seção I := [a, b] ⊂ R com −∞ < a ≤ b < +∞.
Recorde de Análise na Reta que uma partição pontilhada P de [a, b] é um objeto do tipo:
P := {(tP0 , sP0 ), (tP1 , sP1 ), . . . , (tPnP , s
P
nP)}
com
tP0 = a ≤ sP0 ≤ tP1 ≤ sP1 ≤ tP2 ≤ · · · ≤ tPnP ≤ s
P
nP ≤ t
P
nP+1 =: b.
Note a convenção de que tPnP+1 = b sempre. Informalmente, dividimos [a, b] em intervalos
[tPi , t
P
i+1] e escolhemos um ponto s
P
i em cada intervalo. O tamanho da partição P é definido como
|P| := max0≤i≤nP(tPi+1 − tPi ).
Definição 10.2 Dada uma função f : I → V e uma partição pontilhada P como acima, definimos a soma
de Riemann para f sobre a partição pontilhada P da seguinte maneira:
s( f , P) :=
nP
∑
i=0
(tPi+1 − tPi ) f (sPi ) ∈ V.
Dizemos que f é Riemann-integrável sobre [a, b] se existe um limite para as somas de Riemann quando
|P| → 0, ou seja, quando existe um elemento Iba ( f ) ∈ V tal que, para qualquer sequência {Pj}j de
partições pontilhadas de [a, b],
|Pj| → 0⇒ s( f , P)→ Iba ( f ).
Quando f é Riemann-integrável sobre [a, b], em geral escrevemos
∫ b
a f (t) dt := I
b
a ( f )
Exercı́cio 10.10 (Linearidade da integral) Prove a partir da definição que, se f , g : I → V são Riemann-
integráveis e λ ∈ R, então λ f + g também é Riemann-integrável e∫ b
a
(λ f (t) + g(t)) dt = λ
∫ b
a
f (t) dt +
∫ b
a
g(t) dt.
Exercı́cio 10.11 Mostre que, se f ≡ c ∈ V é constante, então f é Riemann-integrável e∫ b
a
f (t) dt = c (b− a).
152
Observação 10.1 No caso de V = R, é costumeiro falar das somas de Riemann superior e inferior. Não
é possı́vel fazer o mesmo em nosso caso geral porque não há uma ordem total natural para os elementos de
V.
O restante da seção é dedicado à prova de um resultado fundamental.
Teorema 10.2 Toda f : I → V contı́nua é Riemann-integrável. Além disso, temos a estimativa:∥∥∥∥∫ ba f (t) dt
∥∥∥∥
V
≤
∫ b
a
‖ f (t)‖V dt ≤ (b− a) sup
t∈I
‖ f (t)‖V .
Esta prova será baseada num lema preliminar. Este lema nos permite comparar as somas de
Riemann de duas partições de tamanho pequeno.
Lema 10.1 Considere duas partições pontilhadas P, Q. Então:
‖s( f , P)− s( f , Q)‖V ≤ (b− a) (m f (|P|)+ m f (|Q|)).
Prova: A prova é muito similar a do caso de funções a valores reais.
Em primeiro lugar, tome um conjunto
R := {r0, r1, . . . , rk+1} ⊂ [a, b] com a = r0 ≤ r1 ≤ · · · ≤ rk+1 = b
de modo que:
• Existem ı́ndices jP0 = 0 < j
P
1 < · · · < jPnP+1 = k + 1 tais que t
P
i = rjPi para cada i =
0, 1, 2, . . . , nP;
• Existem ı́ndices jQ0 = 0 < j
Q
1 < · · · < jPnQ+1 = k + 1 tais que t
P
i = rjQi
para cada i =
0, 1, 2, . . . , nP.
Não provaremos que tal R existe porque isso é feito nos cursos de Análise na Reta.
Escreva:
S :=
k
∑
j=0
f (rj) (rj+1 − rj).
A ideia do restante da prova é mostrar que
‖s( f , P)− S‖V ≤ m f (|P|) (b− a) e ‖s( f , Q)− S‖V ≤ m f (|Q|) (b− a),
o que claramente implica nosso objetivo. Faremos a conta apenas para P porque o caso de Q é
análogo.
Com nossa notação, temos a seguinte fórmula para S:
S =
nP
∑
i=0
jPi+1−1
∑
j=jPi
f (rj) (rj+1 − rj).
De fato, tudo que fizemos foi quebrar a soma em j de acordo com o ı́ndice i tal que jPi ≤ j < jPi+1
(é fácil ver que este ı́ndice existe e é único para cada j).
153
Agora observe que, para cada ı́ndice 0 ≤ i ≤ nP,
tPi+1 − tPi = rjPi+1 − rjPi =
jPi+1−1
∑
j=jPi
(rj+1 − rj).
Além disso, para cada i e cada j = jPi , . . . , j
P
i+1 − 1, temos
rj, sPi ∈ [tPi , tPi+1]
e portanto |rj − sPi | ≤ tPi+1 − tPi ≤ |P|. Portanto
‖ f (rj)− f (sPi )‖V ≤ m f (|P|)
Deduzimos que∥∥∥∥∥∥(tPi+1 − tPi ) f (sPi )−
jPi+1−1
∑
j=jPi
(rj+1 − rj) f (rj)
∥∥∥∥∥∥
V
=
∥∥∥∥∥∥
jPi+1−1
∑
j=jPi
(rj+1 − rj)( f (sPi )− f (rj))
∥∥∥∥∥∥
V
≤ m f (|P|)(tPi+1 − tPi ).
Portanto,
‖s( f , P)− S‖V ≤
nP
∑
i=0
∥∥∥∥∥∥(tPi+1 − tPi ) f (sPi )−
jPi+1−1
∑
j=jPi
(rj+1 − rj) f (rj)
∥∥∥∥∥∥
V
≤ m f (|P|)
nP
∑
i=0
(tPi+1 − tPi ).
A soma telescópica do lado direito vale b− a. 2
Prova: [Prova do Teorema]Note que o Lema anterior mostra que, dada qualquer sequência {Pn}n∈N
como acima, com δn := |Pn| → 0,
∀m, n ∈N : ‖s( f , Pn)− s( f , Pm)‖V ≤ (m f (δn) + m f (δm)) (b− a)→ 0
quando m, n→ +∞. Deduzimos que {s( f , Pn)}n∈N é Cauchy e portanto converge.
Se {Qn}n∈N é outra sequência de partições pontilhadas com |Qn| → 0, podemos intercalá-la
numa só sequência com {Pn}n∈N para deduzir que s( f , Qn) converge ao mesmo limite. É este
limite que chamamos de
∫ b
a f (s) ds. Veja que:
‖s( f , Pn)‖V ≤
(
k
∑
i=1
(tPni − t
Pn
i−1)
)
‖ f (cPni )‖V ,
e a soma da direita é uma soma de Riemann para
∫ b
a ‖ f (s)‖V ds. Portanto, tomando limites,∥∥∥∥∫ ba f (s) ds
∥∥∥∥
V
≤
∫ b
a
‖ f (s)‖V ds.
2
Exercı́cio 10.12 Prove a partir das somas de Riemann que, se f ∈ C(I, V) e P é uma partição pontilhada,
‖s( f , P)−
∫ b
a
f (t) dt‖V ≤ (b− a)m f (|P|).
Exercı́cio 10.13 Prove a partir das somas de Riemann que, se f ∈ C(I, V) e a ≤ x ≤ y ≤ z ≤ b,∫ z
x
f (t) dt =
∫ y
x
f (t) dt +
∫ z
y
f (t) dt.
154
10.4 O teorema fundamental do Cálculo
A partir de agora, definimos
∫ y
x f (s) ds para y 6= x da forma usual se x < y e como∫ y
x
f (s) ds = −
∫ x
y
f (s) ds se x > y.
Com esta notação, é fácil provar que∥∥∥∥∫ yx f (s) ds
∥∥∥∥
V
≤ |y− x| sup
s∈[x,y]
‖ f (s)‖V .
Como também é evidente que
∀x, y ∈ I : x 6= y⇒
∫ y
x f (s) ds
y− x − f (x) =
∫ y
x ( f (s)− f (x)) ds
y− x .
Ou seja,∥∥∥∥∥
∫ y
x f (s) ds
y− x − f (x)
∥∥∥∥∥
V
≤ sup
s∈[x,y]
‖ f (s)− f (x)‖V ≤ m f (|y− x|)→ 0 quando y→ x.
Isto implica o seguinte resultado.
Teorema 10.3 (Teorema Fundamental do Cálculo) Dada f ∈ C(I, V), defina:
I( f )(t) :=
∫ t
a
f (s) ds (t ∈ I).
Então I : C(I, V)→ C(I, V) é contı́nua e além disso:
I( f )′ = f .
Exercı́cio 10.14 Dado um subintervalo J = [c, d] ⊂ [a, b] com a < c < d < b e uma f : I → V, mostre
que:
lim
ε→0+
sup
0<|h|≤ε
∥∥∥∥I( f )(·+ h)− I( f )(·)h − f
∥∥∥∥
J,∞
= 0.
10.5 Mais exercı́cios
Exercı́cio 10.15 Suponha que V = Rd. Mostre a partir da definição apresentada no texto que a integral
de f ∈ C(I, Rd) é dada por:
∫ y
x
f (t) dt =
(∫ y
x
f [i](t) dt
)d
i=1
(x, y ∈ I).
Exercı́cio 10.16 Mostre que a operação I definida implicitamente no Teorema Fundamental do Cálculo é
uma aplicação linear contı́nua de C(I, V) em C(I, V).
155
Exercı́cio 10.17 Considere espaços vetoriais (V, ‖ · ‖V) e (W, ‖ · ‖W) e T : V → W linear e contı́nua.
Mostre que, se f : [a, b]→ V é diferenciável em t ∈ [a, b], então
(T f )′(t) = T f ′(t).
Exercı́cio 10.18 (Série de Taylor) Suponha que f : I → V é k vezes diferenciável e que f (k)(t0)
existe num certo ponto t0 ∈ (a, b). Mostre que podemos escrever:
∀h ∈ R com t0 ∈ h ∈ [a, b] : f (t0 + h) = f (t0) +
k
∑
j=1
f (j)(t0)
j!
hj + rk(h),
com ‖rk(h)‖V/|h|k → 0 quando h→ 0.
Exercı́cio 10.19 (Série de Taylor com resto integral) Na mesma linha do exercı́cio acima, supo-
nha que f : I → V é k vezes diferenciável com k-ésima derivada contı́nua em todo intervalo.
Encontre uma fórmula explı́cita para rk(h) em termos de uma integral envolvendo a k-ésima
derivada.
156
Capı́tulo 11
A derivada como transformação linear
No capı́tulo anterior, fizemos a parte fácil do trabalho de diferenciar funções com valores veto-
riais. O tema deste capı́tulo é considerar funções cujas entradas e valores podem ser vetoriais.
Apresentaremos os principais conceitos da teoria e veremos muitos exemplos interessantes.
11.1 Definição de derivada de Fréchet
Fixamos dois espaços vetoriais normados (V, ‖ · ‖V) e (W, ‖ · ‖W). A definição geral de derivada
é a seguinte.
Definição 11.1 Dado um aberto U ⊂ V, dizemos que f : U → W é Fréchet-diferenciável em x ∈ U se
existe uma transformação linear contı́nua T ∈ L(V, W) tal que para h ∈ V, h→ 0V ,
f (x + h) = f (x) + T h + rx(h)
para uma “função-resto” rx com ‖rx(h)‖W/‖h‖V → 0. De forma equivalente, pedimos que rx(h) :=
f (x + h)− f (x)− T h satisfaça o seguinte:
∀ε > 0 ∃δ > 0 : ∀h ∈ BV(x, δ) ⊂ U, ‖rx(h)‖W ≤ ε ‖h‖V .
Chamamos T de derivada de Fréchet (ou simplesmente derivada) de f em x e escrevemos T = D f (x).
Um ponto fundamental da definição acima é que D f (x) deve ser uma transformação linear
contı́nua, ou limitada:
‖D f (x)‖V→W := sup
v∈V\{0V}
‖D f (x) v‖W
‖v‖V
< +∞.
Sabemos que toda transformação linear é contı́nua quando V = Rd, mas há transformações
lineares descontı́nuas em alguns outros casos. Portanto, quando V tem dimensão infinita, parte do
trabalho de provar que uma transformação linear T é a derivada de f em x é mostrar que ‖T‖V→W < +∞.
Outra observação básica é sobre notação. Frequentemente usaremos o(h) para denotar uma
função de h ∈ V (com norma pequena) que satisfaz o(h)/‖h‖V → 0 quando ‖h‖V → 0. Por isso,
a propriedade do resto na definição de derivada será escrita como:
rx(h) = f (x + h)− f (x)− T h = o(h).
157
Usaremos esta notação abaixo sem muita preocupação.
Antes de prosseguirmos, notamos uma propriedade simples de uma função diferenciável
num ponto.
Exercı́cio 11.1 Com V qualquer, note que, se f é diferenciável em x, então f também é contı́nua em x.
A dica para provar isso é mostrar que uma função o(h) tende a 0W quando h → 0V (isto é,
“nem precisa” dividir por ‖h‖V).
11.1.1 Unicidade da derivada de Fréchet e derivadas direcionais
Um outro ponto importante da definição é saber se T = D f (x) é unicamente definido. Para isso,
usamos a proposição abaixo.
Proposição 11.1 No contexto da definição acima, Suponha que S ∈ L(V, W) satisfaz:
f (x + h) = f (x) + S h + Rx(h), com
‖Rx(h)‖W
‖h‖V
→ 0,
assim como T. Então S = T. De fato, para cada v ∈ V, vale:
Sv = Tv = lim
t→+∞
f (x + tv)− f (x)
t
.
Prova: Veja que S 0V = T 0V = 0W por linearidade. Se v 6= 0V , podemos tomar h := tv, notando
que este vetor vai a 0V quando t→ 0 e ‖tv‖V = |t|‖v‖V . Deduzimos que∥∥∥∥ f (x + tv)− f (x)t − T v
∥∥∥∥
W
=
∥∥∥∥ f (x + tv)− f (x)− T (tv)t
∥∥∥∥
W
=
‖rx(tv)‖
‖t v‖V
‖v‖V → 0,
ou seja,
Tv = lim
t→0
f (x + tv)− f (x)
t
.
Repetindo a prova com S, deduzimos:
Sv = lim
t→0
f (x + tv)− f (x)
t
.
2
Esta prova pode deixar o leitor com a pulga atrás da orelha. Afinal, acabamos de mostrar
que:
D f (x) v = limh→0
f (x + h)− f (x)
h
e o limite do lado direito é bem mais palatável do que a derivada que acabamos de definir. De
fato, ele tem um nome.
Definição 11.2 O limite
∂v f (x) := lim
t→0
f (x + tv)− f (x)
t
,
quando existe, é chamado de derivada de Gâteaux (ou direcional) de f no ponto x e na direção v
158
Ao contrário da derivada de Fréchet, que às vezes é difı́cil de se calcular, a derivada de
Gâteaux se parece com as derivadas que já vimos antes. A prova da proposição 11.1 implica o
seguinte resultado:
Proposição 11.2 (Prova omitida.) Quando a derivada de Fréchet D f (x) existe para um certo x ∈ U,
então as derivadas de Gâteaux também existem neste ponto e em todas as direções. Além disso, D f (x).v =
∂v f (x) para todo v ∈ V.
A recı́proca da proposição não é verdadeira: há casos em que ∂v f (x) existe para todo v, mas f
não é nem sequer contı́nua. Isso pode ocorrer mesmo quando V = R2 e W = R, como mostra o
exemplo abaixo.
Exemplo 11.1 Considere
f (x) =
{
(x[1])3 x[2]
(x[1])6+(x[2])2 , x 6= 0R2
0, x = 0R2 .
É fácil ver que as derivadas direcionais ∂v f (0R2) existem e são todas iguais a 0. No entanto, f não é nem
sequer contı́nua em 0R2 . Por exemplo, se fazemos a(t) := (t, t3) (t > 0), vemos que a é contı́nua, mas
f ◦ a(t)→ 1/2 6= f ◦ a(0) quando t→ 0.
Uma explicação para esta discrepância é que as derivadas direcionais ∂v f (x) só ligam para o
comportamento de f ao longo de retas a partir de x. Por isso, elas não “enxergam” eventuais
descontinuidades de f sobre curvas.
Concluindo, a derivada de Fréchet é mais exigente que a de Gâteaux. Por essa razão, ela tem
propriedades melhores. Por exemplo, a existência de D f (x) implica continuidade de f em x,
e as derivadas de Fréchet satisfazem a regra da cadeia (discutida mais adiante). As derivadas
de Gâteaux são mais fracas e não garantem muita coisa sobre o comportamento de f numa
vizinhança de x. No entanto, a derivada de Gâteaux é mais simples de calcular: começar com ela
pode ser uma boa maneira de “adivinhar” quem deve ser a derivada de Fréchet. Além disso, há
situações em que sabemos de antemão que a derivada de Fréchet existe: nestes casos, sabemos
que calcular ∂v f (x) para cada v vai nos dizer quem é D f (x).
11.2 Alguns casos simples da derivada de Fréchet
11.2.1 Quando o domı́nio está na reta
Um caso simples desta definição se dá quando V = R e U ⊂ R é aberto. Neste caso, parece
natural definir a derivada como o limite usual.
f ′(x) := lim
h→0
f (x + h)− f (x)
h
.
Nesta seção mostraremos que a derivada de Fréchet coincide com esta definição por limite a
menos de um isomorfismo. A proposição a seguir esclarece o que seria este isomorfismo.
Proposição 11.3 Os espaços L(R, W) e W são isomorfos como espaços vetoriais normados. Isto é, há
uma bijeção linear entre estes dois espaços que preserva normas. De fato, esta bijeção leva T ∈ L(R, W)
em vT := T 1 ∈W.
159
Prova: Neste teorema, estamos pensando em R como espaço vetorial normado sobre o corpo
R. Por esta razão, podemos pensar num elemento x ∈ R como o produto x.1 do escalar x
com o elemento 1 deste espaço vetorial. Isto nos leva à constatação de que vT := T(1) define
inteiramente a transformação T, já que, dado qualquer x ∈ R,
T(x) = T(x.1) = (use linearidade) = x T(1) = x vT.
Agora argumentamos que a aplicação T 7→ vT nos dá uma bijeção linear de L(R, W) com W que
preserva normas. Veja em primeiro lugar que, dados T, T′ ∈ L(R, W) e λ ∈ R,
vλT+T′ = (λT + T′)(1) = λ T(1) + T′(1) = λ vT + vT′ .
Além disso, vT = 0W implica que T(x) = 0W para todo x ∈ W, ou seja, T = 0L(R,W). Isto implica
que T 7→ vT é injetiva. Temos ainda:
‖T‖R→W = sup
x∈R\{0}R
‖Tx‖W
|x| = supx∈R\{0}R
‖xvT‖W
|x| = ‖vT‖W .
Finalmente, T é sobrejetiva: dado qualquer v ∈ W, a transformação Tv que leva x ∈ R em
Tv(x) := x v tem vTv = v. Além disso, T é limitada pelo argumento acima. 2
Agora podemos enunciar o resultado que garante a coincidência entre as derivadas de Fréchet
e a “derivada como limite” a que estamos acostumados.
Lema 11.1 Dados U ⊂ R aberto, x ∈ U e f : U →W, são equivalentes:
1. f é diferenciável em x no sentido de Fréchet.
2. Existe o limite:
f ′(x) := lim
h→0
f (x + h)− f (x)
h
.
Além disso, quando f ′(x) e D f (x) estão ambas definidas, temos f ′(x) = D f (x)(1).
Prova: O ponto é que, dados T ∈ L(R, W), h ∈ R com x + h ∈ U,
f (x + h)− f (x)− T h = f (x + h)− f (x)− h vT
segundo o isomorfismo do exercı́cio anterior, com vT = T 1. Deste modo,
lim
h→0
‖ f (x + h)− f (x)− T h‖W
|h| = limh→0
∥∥∥∥ f (x + h)− f (x)h − vT
∥∥∥∥
W
.
O lema segue trivialmente desta última identidade já que um dos limites existe e é zero se e
somente se o outro também é. Isto é, vT = f ′(x) se e somente se T = D f (x). 2
160
11.2.2 Derivadas envolvendo funções lineares
Uma observação simples, mas importante para o que segue, é que, se T : V →W já é linear, então
sua derivada é DT(x) h = T h, para quaisquer x, h ∈ V. A prova deste fato fica como exercı́cio.
Um outro caso simples é descrito no exercı́cio abaixo.
Exercı́cio 11.2 Mostre que, quando f : U → W é diferenciável e T ∈ L(W, Z) para um outro espaço
vetorial normado Z. Neste caso, T ◦ f : U → Z tem derivada:
D(T ◦ f )(x) h = T D f (x) h
em todo ponto x ∈ U onde f é diferenciável.
O leitor é convidado a provar isto diretamente, mas observamos que esta é uma consequência
da regra da cadeia.
11.2.3 A derivada quando V tem dimensão finita e W = R
Nesta seção consideraremos o caso em que V tem dimensão finita e W = R. De fato, nos
contentaremos em entender bem o caso V = Rd e W = R; os mesmo resultados se estendem
aos outros espaços de dimensão finita porque todos os espaços de mesma dimensão finita são
isomorfos.
A tentação aqui é falar das derivadas parciais que já conhecemos do Cálculo. Cara derivada
parcial ∂ f /∂xi é obtida fixando um x ∈ U, variando a i-ésima coordenada de x e tomando o
limite adequado. Não é difı́cil ver que isto é a mesma coisa que a derivada direcional ∂ei f (x),
que nós chamaremos de ∂i f (x) para deixar a notação mais leve.
Nossa pergunta aqui é: que condições sobre as derivadas parciais garantem que D f (x) existe?
Além disso, o que sabemos sobre D f (x) a partir das derivadas parciais?
O Exemplo 11.1 acima nos mostra a simples existência de derivadas parciais não resolve
garante que f é Fréchet-diferenciável em x. No entanto, pode-se dizer algumas coisas sobre
como é D f (x), caso ela exista. Observe que, como W = R, se f : U → R é diferenciável, então
D f (x) ∈ L(Rd, R) é um funcional linear contı́nuo entre V = Rd e R. Em particular, dado v ∈ Rd:
D f (x) v := D f (x)
d
∑
i=1
v[i]ei =
d
∑
i=1
vi (D f (x) ei) =
d
∑
i=1
vi ∂i f (x).
Portanto, se existe D f (x), então o vetor gradiente ∇ f (x) = (∂i f (x))di=1 determina essa derivada,
no sentido que D f (x) · v = ∇ f (x) · v para cada v ∈ Rd. Esta conclusão, no entanto, não responde
nossa pergunta anterior, que é se podemos saber que D f (x) existe a partir das derivadas parciais.
O resultado a seguir nos diz que, se as derivadas parciais são contı́nuas numa vizinhança de
x, isso é suficiente para garantir que D f (x) existe.
Teorema 11.1 Suponha que U ⊂ Rd é aberto, f : U → R é dada e x ∈ U. Se as derivadas parciais
∂i f (1 ≤ i ≤ d) estão definidas em uma vizinhança aberta de x e são contı́nuas neste ponto, então D f (x)
existe (o que é o mesmo que dizer que f é diferenciável em x no sentido de Fréchet).
161
Prova: A ideia da prova é usar o Teorema do Valor Médio, que diz que, se g : I → R é di-
ferenciável num intervalo I e a, a + t ∈ I, então existe um ponto s com |s| ≤ |t|, a + s ∈ I e
g(a + t)− g(a) = g′(a + s) t.
Vamos aplicar este resultado às derivadas parciais que, no final das contas, são derivadas em
uma variável. Tome r > 0 tal que as derivadas parciais de f existem em BRd [x, r] ⊂ Rd. Veja que,
se Ii := [x[i]− r/√
d, x[i] + r/
√
d], então
Q := I1 × I2 × . . . Id ⊂ BRd [x, r].
Em particular, se x̃ ∈ Q e ti ∈ R é tal que x̃ + tiei ∈ Q, existe um si = si(x̃, ti) com |si| ≤ |ti|,
x̃ + siei ∈ Q e
f (x̃ + tiei)− f (x̃) = ti∂i f (x̃ + siei).
(Note que só podemos garantir x̃[i] + si ∈ Ii porque Q tem a estrutura de um produto cartesiano
de intervalos.) Vamos aplicar isso ao caso em que as coordenadas de h estão entre −r/
√
d e
r/
√
d, o que garante x + h ∈ Q. Recordamos que h = ∑di=1 h[i]ei. Observamos que para cada
j ∈ [d] ∪ {0} o vetor hj := ∑
j
i=1 h[i] ei ∈ Q também tem coordenadas entre −r/
√
d e r/
√
d.
Portanto, x + hj ∈ Q para cada um destes j e podemos escrever uma soma telescópica.
f (x + h)− f (x) =
d
∑
m=1
( f (x + hj)− f (x + hj−1)).
Como x + hj = x + hj−1 + h(j)ej para cada j ∈ [d], podemos encontrar um valor h̃(j) entre 0 e h(j),
tal que, se h̃j := hj−1 + h̃(j)ej,
f (x + hj)− f (x + hj−1) = h(j) ∂j f (x + h̃j).
Deduzimos que
f (x + h)− f (x) =
d
∑
m=1
h(j) ∂j f (x + h̃j).
Para terminar a prova, definimos ∇ f (x) como o vetor das derivadas parciais. Veja que:
f (x + h)− f (x)−∇ f (x) · h = rx(h) :=
d
∑
m=1
h(j) (∂j f (x + h̃j)− ∂j f (x)).
Por Cauchy-Schwartz,
|rx(h)| ≤ |h|2
√√√√ d∑
j=1
(∂j f (x + h̃j)− ∂j f (x))2.
Veja que |h̃j|2 ≤ |hj|2 ≤ |h|. Deste modo, quando h→ 0, cada h̃j converge a 0. Podemos combinar
isto com nossa hipótese de continuidade das derivadas parciais e concluir que o termo da raı́z
quadrada acima vai a 0. Portanto:
|rx(h)|
|h|2
≤
√√√√ d∑
m=1
(∂j f (x + h̃j)− ∂j f (x))2 → 0.
Ou seja, ∇ f (x) · h = D f (x) h, como querı́amos mostrar. 2
162
Um corolário importante deste resultado é o seguinte.
Exercı́cio 11.3 Dada f : U → R, as seguintes propriedades são equivalentes.
1. D f (x) está definido em todo U, e além disso D f : U → L(Rd, R) é função contı́nua;
2. ∇ f (x) está definido em todo U, e além disso ∇ f : U → Rd é função contı́nua;
3. todas as derivadas parciais de ∂i f (x) existem para qualquer x ∈ U e, além disso, as derivadas
parciais dependem continuamente de x.
No entanto, o exercı́cio abaixo mostra que a derivadada de Fréchet pode existir mesmo
quando as derivadas parciais são contı́nuas.
Exercı́cio 11.4 Considere f : R2 → R definida por:
f (x) :=
{
|x|22 sin
(
1
|x|2
)
, x 6= 0R2 ;
0, x = 0.
Prove que esta função é Fréchet diferenciável em 0R2 , mas não tem derivadas parciais contı́nuas neste
ponto.
11.2.4 O caso em que W tem dimensão finita
Também neste caso consideraremos apenas W = Rk. Neste caso, é possı́vel mostrar o seguinte
resultado.
Exercı́cio 11.5 f : U ⊂ Rk é diferenciável em x ∈ U se e somente se cada uma das funções coordenadas
é diferenciável. Isto é, se f [i] : U → R é diferenciável em x ∈ U para cada i ∈ [k], então f é diferenciável
em x e D f (x) h = (D f [i](x) h)ki=1; também vale a recı́proca.
Considere agora a restrição a V = Rd, de modo que U ⊂ Rd. Assim como o gradiente é o
candidato “natural” a derivada quando W = Rk, nossa melhor tentativa para a derivada de f é
a matriz jacobiana Jac( f )(x) ∈ Rk×d com entradas
Jac( f )(x)[i, j] = ∂j f [i](x) (1 ≤ i ≤ k, 1 ≤ j ≤ d).
De fato, os fatos abaixo seguem facilmente do que vimos no caso W = R.
Exercı́cio 11.6 Quando V = Rd, W = Rk, f é como acima, x ∈ U e D f (x) existe, então a matriz
jacobiana está bem definida e
∀v ∈ Rd : D f (x) v = Jac( f )(x) v.
Isto é, Jac( f )(x) ∈ Rk×d é a matriz que representa D f (x) ∈ L(Rd, Rk) na base canônica.
Exercı́cio 11.7 Quando V = Rd, W = Rk, f é como acima, x ∈ U, Jac( f )(·) está definida numa
vizinhança de x e é contı́nua em x, então f é Fréchet-diferenciável em x.
Exercı́cio 11.8 Dados U ⊂ Rd aberto e f : U → Rk, as seguintes propriedades são equivalentes:
163
1. D f (x) ∈ L(Rd, Rk) está definida para qualquer x ∈ U e além disso D f : U → L(Rd, Rk) é função
contı́nua;
2. A matriz jacobiana Jac( f )(x) ∈ Rk×d com entradas
Jac( f )(x)[i, j] = ∂j f [i](x) (1 ≤ i ≤ k, 1 ≤ j ≤ d)
está bem definida para qualquer x ∈ U e depende continuamente de x (o que é o mesmo que dizer
que suas entradas dependem continuamente de x).
Exercı́cio 11.9 (Coordenadas polares) Podemos escrever cada vetor x ∈ Rd\{0Rd} na forma r v, onde
r := |x|2 > 0 e v := x/|x|2 ∈ Sd−1. Note ainda que para cada v deste tipo há um único vetor
ṽ ∈ Rd−1 tal que v[i] = ṽ[i] para 1 ≤ i ≤ d− 1. Calcule a jacobiana da transformação que leva x em
(r, ṽ) ∈ R×Rd−1 ≡ Rd. Calcule ainda o determinante dessa transformação.
11.2.5 A derivada do determinante
Seção sendo escrita. Ao menos em princı́pio, as fórmulas acima nos permitem calcular as deri-
vadas de Fréchet para todas as funções entre espaços vetoriais. No entanto, há muitos casos em
que é mais fácil e mais interessante partir diretamente da definição. Veremos alguns exemplos
disso a seguir.
Exemplo 11.2 Considere a função det : Rd×d → R. Qual é a sua derivada em A ∈ Rd×d?
Note que o determinante é um polinômio multilinear nas entradas da matriz, portanto as
derivadas parciais de det existem e são contı́nuas. Concluı́mos que Ddet(A) existe para qualquer
A e é um funcional linear de Rd×d em R. Apresentamos duas maneiras de fazer isso abaixo.
Tratando Rd×d ∼= Rd2
Aqui aproveitamos a relação entre Rd×d e Rd
2
. Note que o produto interno natural entre matrizes
A, B ∈ Rd×d é dado por:
〈A, B〉 :=
d
∑
i,j=1
A[i, j]B[i, j] = tr(ABT) = tr(AB)
onde tr é o traço (soma das entradas diagonais). Adaptando a prova que vimos para Rd, sabemos
que a existência da derivada de Fréchet em todo ponto garante que:
Ddet(A) H = 〈∇det(A), H〉 = tr(∇det(A)T H),
onde ∇det(A) ∈ Rd×d tem entradas:
∇det(A)[i, j] = ∂det(A)
∂A[i, j]
(1 ≤ i, j ≤ d).
Para calcularmos as derivadas parciais, precisamos lembrar de como se escreve o determi-
nante a partir de uma linha de A e a chamada matriz de cofatores. Em primeiro lugar, defini-
mos, para cada par 1 ≤ i, j ≤ d, uma matriz Aij ∈ R(d−1)×(d−1): esta matriz é igual a A, exceto
164
que omitimos a i-ésima linha e a j-ésima coluna. A matriz de cofatores de A é definida como o
elemento C(A) ∈ Rd×d com entradas
C(A)[i, j] := (−1)i+j det(Aij) (1 ≤ i, j ≤ d).
Entre outras coisas, a matriz de cofatores é importante porque
det(A) 6= 0⇒ A−1 = C(A)
T
det(A)
. (11.1)
Além disso, sabemos que o determinante pode ser escrito a partir dos elementos da linha i
da matriz A e dos cofatores correspondentes.
det(A) =
d
∑
k=1
A[i, k]C(A)[i, k] =
d
∑
k=1
(−1)i+k A[i, k]det(Aik).
Agora tomamos a derivada parcial da fórmula acima na variável A[i, j]. Note que as matrizes Aik
não incluem a entrada A[i, j] porque a linha i for omitida de cada uma delas. Por isso, os termos
A[i, k]det(Aik) com k 6= j tem derivada parcial 0 com respeito a A[i, j]. Portanto:
∂det(A)
∂A[i, j]
=
∂
∂A[i, j]
A[i, j]C(A)[i, j] = C(A)[i, j].
Concluı́mos que:
∇det(A) = C(A)
e que
Ddet(A) H = tr(C(A)T H). (11.2)
Em particular, a equação (11.1) nos diz que:
det(A) 6= 0⇒ Ddet(A) H = det(A) tr(A−1H). (11.3)
Uma outra abordagem
Agora apresentamos um argumento para chegar rapidamente à fórmula (??). Com algum traba-
lho a mais, provaremos a fórmula mais geral (11.2).
Fixe uma A ∈ Rd×d inversı́vel. Como já sabemos que a derivada de Fréchet existe, ela tem de
coincidir com a derivada de Gâteaux.
Ddet(A) H = lim
ε→0+
det(A + ε H)− det(A)
ε
.
Usaremos agora o fato de que o determinante é multiplicativo: o determinante do produto é o
produto dos determinantes.
A + εH = A (I + εA−1H)⇒ det(A + ε H) = det(A)det(I + εA−1H).
Deduzimos que:
Ddet(A) H = det(A) lim
ε→0+
det(I + ε A−1H)− 1
ε
.
165
Para facilidar, escrevemos ∆ := A−1H. Note que o limite acima é igual a:
lim
ε→0+
det(I + ε A−1H)− 1
ε
= Ddet(I)∆.
Isto é, estamos calculando uma derivada de Fréchet (ou de Gâteaux, tanto faz) no ponto I ∈ Rd×d.
Para calcular este limite, lembramos desta vez que o determinante é uma função multili-
near das colunas da matriz ∆. Para usar isso da melhor maneira, usamos a seguintenotação:
se (v1, . . . , vd) ∈ (Rd)d são dados, det(v1, . . . , vd) é o determinante da matriz com colunas
(v1, . . . , vd). Desta forma, se chamamos de ∆j a j-ésima coluna de ∆,
det(I + ε∆) = det(e1 + ε∆1, e2 + ε∆2, . . . , ed + ε∆d).
Desenvolvendo o determinante, usando a multilinearidade, chegamos à seguinte expressão:
det(I + ε ∆) = det(I)
+ε (det(∆1, e2, . . . , ed−1, ed) + det(e1, ∆2, . . . , ed−1, ed) + · · ·+ det(e1, e2, . . . , ed−1, ∆d))
+
d
∑
k=2
εk ck,
onde os ck são certas constantes. Subtraindo det(I), dividindo por ε e mandando ε a 0, os termos
εkck desaparecem e ficamos com:
lim
ε→0+
det(I + ε A−1H)− 1
ε
= det(∆1, e2, . . . , ed−1, ed)+det(e1, ∆2, . . . , ed−1, ed)+ · · ·+det(e1, e2, . . . , ed−1, ∆d).
Cada matriz na soma do lado direito coincide com a identidade exceto na coluna j, que é igual
a ∆j. É um exercı́cio mostrar que o determinante de uma matriz deste tipo é ∆j[j] = ∆[j, j].
Portanto,
lim
ε→0+
det(I + ε A−1H)− 1
ε
= ∆[1, 1] + ∆[2, 2] + · · ·+ ∆[d, d] = tr(∆).
Lembrando que ∆ = A−1H e combinando com as igualdades anteriores, chegamos novamente
à fórmula (11.3). Para A ∈ Rd×d inversı́vel, ela implica que Ddet(A) H = tr(C(A)T H). Como
C(A) depende continuamente de A; as matrizes inversı́veis são densas em Rd×d; e sabemos que
Ddet(A) depende continuamente de A, concluı́mos que a fórmula mais geral (11.2) vale para
todas as matrizes A ∈ Rd×d e qualquer H ∈ Rd×d.
Exercı́cio 11.10 Descreva e justifique em detalhes o que aconteceu na última etapa da demonstração.
Exercı́cio 11.11 Considere Rd×d e também o subespaço Rd×dsim ⊂ Rd×d das matrizes simétricas.
Calcule a derivada de Fréchet da operação f : Rd×d → Rd×dsim que leva uma M ∈ Rd×d em MT M.
11.3 Boas propriedades da derivada de Fréchet
Nesta seção damos substância ao que já dissemos acima: a derivada de Fréchet tem boas propri-
edades teóricas. Os dois teoremas desta seção nos dizem que ela satisfaz uma regra da cadeia e
uma desigualdade assemelhada ao Teorema do Valor Médio.
166
11.3.1 A regra da cadeia
Enunciamos abaixo a versão geral da regra da cadeia. Tão importante quanto entender que ela
vale é observar que as derivadas direcionais não satisfazem a regra da cadeia; veja a Observação 11.1
abaixo.
Teorema 11.2 (Regra da cadeia) Suponha que (V, ‖ · ‖V), (W, ‖ · ‖W) e (Z, ‖ · ‖Z) são espaços vetori-
ais normados. Suponha que UV ⊂ V e UW ⊂ W são abertos, que f : UV → UW e g : UW → Z. Fixos
x ∈ UV e y = f (x) ∈ UW , suponha que as derivadas de Fréchet D f (x) e Dg(y) existem. Então a derivada
de g ◦ f em x também existe e é dada pelo produto de transformações lineares Dg ◦ f (x) = Dg(y) D f (x).
Prova: Fixe x e y = f (x) como acima. Dado h ∈ V com x + h ∈ UV , escrevemos: hy := f (x +
h)− f (x) = f (x + h)− y. Temos:
g ◦ f (x + h)− g ◦ f (x) = g(y + hy)− g(y) = Dg(y) hy + Ry(hy),
com Ry o termo de resto esperado. Do mesmo modo,
hy = D f (x) h + rx(h).
Concluı́mos que:
g ◦ f (x + h)− g ◦ f (x) = Dg(y) D f (x) h + Ry(hy) + Dg(y) rx(h).
Esta fórmula deixa clara a nossa missão: queremos provar que o termo Ry(hy) + rx(h) se com-
porta como esperamos de um resto. Ou seja, queremos que
Objetivo final:
‖Ry(hy) + Dg(y) rx(h)‖Z
‖h‖X
→ 0 quando h→ 0.
Vejamos como provar isso. O primeiro passo é quebrar a expressão em duas
‖Ry(hy) + Dg(y) rx(h)‖Z
‖h‖X
≤
‖Ry(hy)‖Z
‖h‖V
+
‖Dg(y) rx(h)‖Z
‖h‖V
e controlar o segundo termo. De fato, como Dg(y) é uma transformação linear limitada,
‖Dg(y) rx(h)‖Z
‖h‖V
≤ ‖Dg(y)‖V→W
‖rx(h)‖W
‖h‖V
h→0→ 0 porque ‖rx(h)‖W‖h‖V
h→0→ 0.
Ainda nos falta mostrar que ‖Ry(hy)‖Z/‖h‖X também converge a 0. Tome ε > 0 qualquer.
Como ‖Ry(a)‖Z/‖a‖V → 0 quando a→ 0 sabemos que existe um δ > 0 tal que,
∀a ∈W, ‖a‖W ≤ δ : y + a ∈ U e ‖Ry(a)‖Z ≤ ε ‖a‖W .
Por outro lado,
‖hy‖W
‖h‖V
=
‖ f (x + h)− f (x)‖W
‖h‖V
≤ ‖D f (x) h‖V + ‖rx(h)‖V‖h‖V
≤ ‖D f (x)‖V→W +
‖rx(h)‖V
‖h‖V
.
167
Portanto, quando h→ 0, hy → 0. Em particular, se h é pequeno o suficiente, hy ∈ BV(y, δ) e
‖Ry(a)‖Z
‖h‖V
≤ ε
(
‖D f (x)‖V→W +
‖rx(h)‖V
‖h‖V
)
.
Deduzimos que
lim sup
h→0
‖Ry(hy)‖Z
‖h‖V
≤ ε (‖D f (x)‖V→W) .
Como ε > 0 é arbitrário, o teorema segue. 2
Observação 11.1 É instrutivo ver em um exemplo de que o resultado acima falha quando usamos deriva-
das direcionais ao invés das de Fréchet. Considere a função f ◦ a do Exemplo 11.1 acima. Veja que a, além
de contı́nua, é diferenciável. Além disso, f tem derivadas direcionais ∂v f (x) para todos x, v ∈ R2. Apesar
disso, a função f ◦ a não é diferenciável em 0R2 ; de fato, ela não é sequer contı́nua. Isto tem a ver com os
comentários depois do Exemplo 11.1: as derivadas direcionais não se comportam bem quando calcularmos
f ao longo de certas curvas indo para 0R2 . Já Fréchet não sofre deste problema, o que foi importante na
prova acima porque hy é uma função não-linear de h.
11.3.2 A desigualdade do valor médio
Vimos no Teorema 10.1 acima que o Teorema do Valor Médio se generaliza na forma de desigualdade
para funções diferenciáveis γ : [0, 1] → W com W espaço vetorial. Aqui vemos uma extensão da
desigualdade para funções F entre espaços vetoriais mais gerais. Recorde que, dados dois pontos
x, y num mesmo espaço vetorial V, [x, y] denota o segmento de reta entre x e y, isto é:
[x, y] := {ty + (1− t)x : t ∈ [0, 1].}
Teorema 11.3 (Desigualdade do valor médio) Considere f : U → W com U ⊂ V aberto. Considere
x, y ∈ U e suponha que o segmento de reta [x, y] está contido em U. Defina M := supa∈[x,y] ‖D f (a)‖V→W .
Então ‖ f (x)− f (y)‖W ≤ M ‖x− y‖V .
Prova: Considere m : [−ε, 1 + ε]→ U definida por
m(t) := (1− t) x + t y (t ∈ [0, 1]).
Veja que m está bem definida para ε > 0: como [x, y] ⊂ U e U é aberto, existe um ε positivo tal
que m(t) ∈ U para todo t ∈ (−ε, 1 + ε). Além disso, m é diferenciável, com derivada:
m′(t) = (y− x).
A regra da cadeia garante que f ◦m : (−ε, 1 + ε) → W. De fato, levando em conta isomorfismos
e tudo mais, temos (exercı́cio!):
( f ◦m)′(t) = D f (m(t))m′(t) = D f (m(t)) (y− x).
Por sua vez, a desigualdade do valor médio para funções de [0, 1] em W (Teorema 10.1 acima) nos
garante que:
‖ f (y)− f (x)‖W = ‖( f ◦m)(1)− ( f ◦m)(0)‖W ≤ sup
t∈[0,1]
‖D f (m(t)) (y− x)‖W .
168
Para terminar, observamos que:
sup
t∈[0,1]
‖D f (m(t)) (y− x)‖W ≤ sup
t∈[0,1]
‖D f (m(t))‖V→W ‖y− x‖V = M ‖y− x‖V
porque o conjunto dos valores m(t) é exatamente [x, y]. 2
Antes de prosseguirmos, enunciamos aqui, para conveniência futura, um resultado de aproximação
que nos será muito útil. Grosso modo, ele diz que, se a derivada não oscila muito numa
vizinhança de x, então a aproximação de primeira ordem f (x′) ≈ g(x′) := f (x) + D f (x) (x′ − x)
ao redor de x é de alta qualidade. De fato, g aproxima f bem mesmo quando consideramos
diferenças de f entre pontos próximos de x.
Corolário 11.1 (Aproximação afim quando a derivada muda pouco) Suponha que f : U → W
como acima. Dados x ∈ U e r > 0 com BV(x, r) ⊂ U, suponha que f é diferenciável na bola BV(x, r) e
que
sup
x′∈BV(x,r)
‖D f (x′)− D f (x)‖V→W ≤ α.
Então a função g(x′) := f (x) + D f (x) (x′ − x) satisfaz Dg(x′) = D f (x) e
∀x′, x′′ ∈ BV(x, r) : ‖g(x′′)− g(x′)− ( f (x′′)− f (x′))‖W ≤ α ‖x′′ − x′‖V .
Prova: Isso segue de aplicar a desigualdade do valor médio à função f (x′) − g(x′) a cada par
x′, x′′ ∈ BV(x, r), notando que [x′, x′′] ⊂ BV(x, r) por convexidade e que
sup
x′∈BV(x,r)
‖D( f − g)(x′)‖V→W = sup
x′∈BV(x,r)
‖D f (x′)− D f (x)‖V→W ≤ α.
2
Exercı́cio 11.12 Considere U ⊂ V aberto e convexo e f : U →W diferenciável. Mostre que
‖ f ‖Lip = sup
a∈U
‖D f (a)‖V→W .
11.4 Derivadas mais complicadas de se calcular
Encerramos este primeiro capı́tulo sobre a derivada de Fréchet calculando derivadas de funções
que não são tão simples assim. O primeiro exemplo corresponde a funções de operadores lineares
e o segundo tem relação com o problema de existência e unicidade para EDOs. O que estes
exemplos têm em comum é que calcular as derivadas parciaisnão parece ser mais simples que
obter diretamente a derivada de Fréchet.
11.4.1 Exemplos no espaço de operadores lineares
Nesta seção, estaremos interessados no caso em que V = W = L(X, X) para algum espaço
vetorial normado (X, ‖ · ‖X). Escreveremos L(X) := L(X, X) e chamaremos as transformações
lineares T ∈ L(X) de operadores lineares sobre X. Tudo que faremos já é interessante no caso em
que X = Rd, ‖ · ‖X = | · |2 é a norma Euclideana e L(X) ≡ Rd×d com a norma de operador.
As operações que estamos interessados em derivar são as seguintes:
169
• Dado k ∈N, a aplicação que leva T ∈ L(X) em Tk.
• A aplicação que leva um T ∈ L(X) em T−1 ∈ L(X) (no caso de T ser uma bijeção e T−1 ser
limitado).
Mostraremos “no braço” que estas funções são diferenciáveis. Observe que isto envolve en-
contrar operadores lineares A ∈ L(L(X),L(X))! Isso pode parecer estranho, mas veremos que
não há nada muito sério quando consideramos os casos concretos.
Nossas estiamtivas usarão muito a submultiplicatividade da norma de operador:
∀T, S ∈ L(X) : ‖T S‖X→X ≤ ‖T‖X→X ‖S‖X→X.
Potências de operadores
Comecemos pela derivada de fk(T) := Tk.
Exemplo 11.3 Definimos fk(T) := Tk (T ∈ L(X)). Qual é sua derivada?
De fato, teremos interesse em calcular a derivada e estimar bem o termo de resto. A maior
dificuldade desta prova é que, ao contrário do caso em que T, H ∈ R a fórmular para (T + H)k é
bastante complicada por causa da não-comutatividade do produto de operadores. Daremos um
argumento que passará ao largo dessa dificuldade.
Considere o produto
(T + H)k := (T + H) (T + H) . . . (T + H)︸ ︷︷ ︸
k vezes
.
Para calcular o produto, devemos usar a propriedade distributiva. Ela diz que (T + H)k é a soma
de todos os 2k produtos de sequências do tipo THTTHHH . . . HTH com exatamente k termos.
Agruparemos estas sequências pelo número de vezes em que H aparece. Primeiramente, há
exatamente uma sequência em que H aparece 0 vezes: TTT . . . T = Tk.
Considere agora k sequências em que H aparece exatamente 1 vez. Elas são da forma
T . . . T︸ ︷︷ ︸
j termos
H TT . . . T︸ ︷︷ ︸
j− k− 1 termos
com 0 ≤ j ≤ k− 1. Sua contribuição conjunta é
Ak(T) H :=
k−1
∑
j=0
T j H Tk−1−j.
Note que, para cada T ∈ L(X), Ak(T) : L(X) → L(X) é um operador linear. Ele é limi-
tado,porque, pela submultiplicatividade da norma de operador,
‖Ak(T) H‖X→X ≤
k−1
∑
j=0
‖T‖jX→X ‖H‖X→X ‖T‖
k−1−j
X→X = k ‖T‖
k−1
X→X ‖H‖X→X. (11.4)
Portanto, Ak(T) ∈ L(L(X),L(X)).
170
Esta última estimativa tem algo de mágico. Tı́nhamos uma fórmula complicada paraAk(T) H.
Quando passamos a norma de operador, ela de repente ficou tão simples quanto o termo cor-
respondente do teorema binomial usual. Para terminarmos a prova, vamos usar um argumento
parecido para estimar os demais termos de (T + H)k, observando eles têm de ser o resto. E porque
sabemos disso? Ora estes termos que restam certamente não serão lineares em H, enquanto que
o termo correspondendo à derivada tem de ser linear!
Façamos então uma estimativa de
rT(H) :=
k
∑
n=2
(termos do produto com n ocorrências de H) = (T + H)k − Tk −Ak(T) H,
notando que, pela subaditividade da norma,
‖rT(H)‖X→X ≤
k
∑
n=2
‖(termos do produto com n ocorrências de H)‖X→X,
Foquemo-nos em um dos termos da soma. Há (kn) escolhas de sequências de Ts e Hs com
exatamente n termos iguais a H. Por sua vez, a norma de um produto de Ts e Hs deste tipo é
limitada pela submultiplicatividade da norma.
‖T . . . T H T . . . T H . . . ‖X→X ≤ ‖H‖nX→X ‖T‖k−nX→X.
Concluı́mos que
‖(termos do produto com n ocorrências de H)‖X→X ≤
(
k
n
)
‖H‖nX→X ‖T‖k−nX→X.
Somando estas cotas, obtemos:
‖rT(H)‖X→X ≤
k
∑
n=2
(
k
n
)
‖H‖nX→X ‖T‖k−nX→X
e a fórmula binomial nos dá uma expressão mais compacta:
‖rT(H)‖X→X ≤ (‖T‖X→X + ‖H‖X→X)k − ‖T‖kX→X − k ‖T‖k−1X→X ‖H‖X→X.
chame t := ‖T‖X→X e h := ‖H‖X→X. Observe que:
∀k ∈N\{0, 1}∀n ∈ {2, . . . , k} :
(
k
n
)
=
k(k− 1)
n(n− 1)
(
k− 2
n− 2
)
≤ k (k− 1)
2
(
k− 2
n− 2
)
,
logo
(t + h)k − tk − ktk−1 =
k
∑
n=2
k(k− 1)
n(n− 1)
(
k− 2
n− 2
)
tk−n hn ≤ k (k− 1) h
2
2
(t + h)k−2.
Portanto,
‖rT(H)‖X→X ≤
k(k− 1)
2
(t + h)k−2 h2.
Isto finalmente nos permite concluir que ‖rT(H)‖/‖H‖ → 0 quando H → 0. De fato, temos o
seguinte resultado.
171
Teorema 11.4 A aplicação fk(T) := Tk (T ∈ L(X)) é diferenciável. Sua derivada é dada pelo operador
limitado Ak(T) dado acima. O termo de resto:
rT(H) := (T + H)k − Tk −Ak(T) H
satisfaz:
‖rT(H)‖X→X ≤
k (k− 1)
2
(‖T‖X→X + ‖H‖X→X)k−2 ‖H‖2X→X.
Inversas de operadores
Temos agora um exemplo para tratar em que teremos muito mais trabalho.
Chame de U ⊂ L(X) o conjunto de todos os T que têm inversa T−1 ∈ L(X). Ou seja,
T ∈ L(X) se T é limitado, é uma bijeção de X em X e tem uma inversa satisfazendo T−1T =
TT−1 = IX que também é um operador linear limitado. Nosso objetivo será mostrar o seguinte
resultado.
Teorema 11.5 ‘U é aberto de L(X). A função Inv : U → L(X) que leva T ∈ U em T−1 é diferenciável e
DInv(T) H = −T−1HT−1.
Vamos começar com uma observação simples, que deixamos como exercı́cio.
Exercı́cio 11.13 Se A, B ∈ U são operadores inversı́veis, então BA também o é e (BA)−1 = A−1 B−1.
Nosso próximo passo é estudar Inv numa vizinhança do operador identidade I.
Lema 11.2 A bola aberta BL(X)(I, 1) está contida em U . Além disso
∀A = I + H ∈ BL(X)(I, 1) : A−1 = Inv(I + H) = ∑
n∈N
(−H)n.
Prova: Já provamos que, em um espaço vetorial normado completo V, se uma sequência de
vetores {vn}n∈N satisfaz ∑n∈N ‖vn‖V < +∞, então ∑n∈N vn converge. Aplicaremos isso a V =
L(X) com vn = Hn. No primeiro caso, observamos que
‖vn‖V = ‖(−H)n‖X→X ≤ ‖H‖nL(X) com ‖H‖X→X < 1,
portanto ∑n∈N (−H)n converge. Como a operação de tomar produtos em L(X) é contı́nua
(exercı́cio), temos
(I + H) ∑
n∈N
(−H)n = (I + H) lim
n→+∞
n
∑
j=0
(−H)j
= lim
n→+∞
n
∑
j=0
(I + H) (−H)j
= lim
n→+∞
n
∑
j=0
[(−H)j + (−1)j H j+1]
= lim
n→+∞
n
∑
j=0
[(−H)j − (−H)j+1]
(soma telescópica) = lim
n→+∞
(I − Hn+1)
(‖Hn+1‖X→X → 0) = I.
172
Do mesmo modo, (∑n∈N(−H)n) (I + H) = I. 2
Provemos agora o teorema.
Prova: Considere A ∈ U . Tome r = rA := 1/‖A−1‖X→X. Veja que, se H ∈ L(X) e ‖H‖X→X < r,
vale ‖A−1H‖X→X < 1. Portanto, o lema acima garante que
(I + A−1H)−1 = ∑
n∈N
(−A−1H)j.
Pelo exercı́cio anterior, descobrimos que
(A + H)−1 = [A (I + A−1H)]−1 = ∑
n∈N
(−A−1H)j A−1.
Em particular, provamos que, se A ∈ U , A + H ∈ U sempre que ‖H‖X→X < rA. Portanto, U é
aberto.
Para calcular a derivada, voltamos à série de potência. Observamos que a aplicação
DA : H 7→ −A−1HA−1
é linear de L(X) no próprio espaço. Além disso, ela é limitada porque:
∀H ∈ L(X) : ‖DA H‖L(X) ≤ ‖A−1‖2L(X) ‖H‖L(X).
Para provar que DA é a derivada de Inv no ponto A, veja que:
(A + H)−1 − A−1 −DA H = ∑
n≥2
(−A−1H)j A−1.
Como ‖H‖ ‖A−1‖ < 1,
‖(A + H)−1 − A−1 −DA H‖X→X ≤ ∑
n≥2
‖A−1‖j+1 ‖H‖j = ‖H‖
2 ‖A−1‖3
1− ‖H‖ ‖A−1‖ .
Com esta expressão é fácil concluir que
‖(A + H)−1 − A−1 −DA H‖X→X
‖H‖ ≤
‖H‖ ‖A−1‖3
1− ‖H‖ ‖A−1‖ → 0
quando H → 0. 2
11.4.2 Um exemplo sobre as funções contı́nuas
Dado um intervalo compacto [a, b] ⊂ R, defina o espaço usual C([a, b], Rd). A função I que
associa a cada f ∈ C sua integral indefinida é um operador linear, portanto:
DI( f ) h = I h =
∫ ·
a
h(t) dt.
Consideraremos agora um tipo de função sobre C(I, Rd) relacionado ao problema de resolver
EDOs. Dado U ⊂ Rd+1 aberto, considere o subconjunto U ⊂ C(I, Rd) de funções com f (I) ⊂ U.
173
Exercı́cio 11.14 Prove que U é aberto de C(I, Rd). (Dica: mostre primeiramente que
inf
t∈[a,b]
dRd( f (t), U
c) > 0.
Se você não conseguir, tudo bem: há uma prova deste fato implı́cita na proposição abaixo!)
Considere uma função contı́nua Ψ : I × U → Rd. Dados x0 ∈ Rd, t0 ∈ I, considere ainda a
operação TΨ : U → C(I, R) que leva f numa nova função T( f ) com
T( f )(t) := x0 +
∫ t
t0
Ψ(s, f (s)) ds.
Veja que este operador está bem definido porque Ψ(t, f (t)) é contı́nua em t sempre quef ∈ U .
Como sabemos, a importância deste operador reside no fato que os seus pontos fixos (se existem)
são precisamente as soluções de ξ ′(t) = Ψ(t, ξ(t)) com ξ(t0) = x0.
Quando estudarmos o problema de existência para EDOs, vimos que T : U → C(I, R) é
contı́nua. Veremos agora que, sob hipóteses adicionais, esta aplicação é diferenciável e calculare-
mos a sua derivada.
Proposição 11.4 Dados (t, x) ∈ I ×U, defina DxΨ(t, x) como a derivada da função em x ∈ U, com t
mantido fixo. Suponha que esta derivada existe para todo par (t, x) ∈ I ×U e que, além disso, ela depende
continuamente de (t, x). Então T é diferenciável em qualquer f ∈ U . Além disso, se v ∈ C(I, Rd),
DT( f ) ∈ L(C(I, R))
existe e é igual ao operador linear que leva v ∈ C(I, R) na função
(DT( f ) v)(t) :=
∫ t
t0
DxΨ(s, f (s)) v(s) ds (t ∈ I).
Prova: Veja que T( f ) é a soma de uma função constante igual a x0 com I ◦ F( f ), onde I ∈
L(C(I, Rd)) leva cada f em I( f )(·) =
∫ ·
t0
f (s) ds e F : U → C(I, Rd) leva f em Ψ(·, f (·)). Usando
os resultados da seção 11.2.2, descobrimos que, se provarmos que DF( f ) existe e satisfaz:
∀v ∈ C(I, Rd), ∀t ∈ I : (DF( f ) v)(t) = DxΨ(t, f (t)),
então DT = I DF. Além disso, como I é linear e limitado (logo contı́nuo), a continuidade de
DT será consequência da continuidade de DF.
Mostremos, então, que F é diferenciável com a derivada que dizemos que ela tem. Fixo um
f ∈ U , diferenciaremos F nos pontos ao redor de f , mostrando que esta derivada é contı́nua.
Em princı́pio podemos pensar num esquema simples para a prova da existência da derivada.
Nosso objetivo é provar que
(queremos provar)
‖F( f + h)− F( f )− DxΨ(·, f (·)) h(·)‖∞
‖h‖∞
→ 0.
O que sabemos, em princı́pio, é que Ψ é diferenciável em x, portanto podemos escrever:
F( f + h)(t)− F( f (t)) = Ψ(t, f (t) + h(t))−Ψ(t, f (t)) = DxΨ(t, f (t)) h(t) + r(t, f (t))(h(t)).
174
Para cada t ∈ I, poderı́amos mostrar algo na linha de
|r(t, f (t))(h(t))|2
‖h‖∞
≤
|r(t, f (t))(h(t))|2
|h(t)|2
→ 0.
No entanto, isso não resolve nosso problema, porque precisamos mostrar uma convergência
uniforme. Ou seja, a definição da derivada para funções F : U → C(I, Rd) nos obriga a mostrar
que o termo de resto satisfaz
supt∈I |r(t, f (t))(h(t))|2
‖h‖∞
→ 0
e isso é um pouco mais complicado.
Para vencermos esta dificuldade, será importante usar a continuidade uniforme de DxΨ. Para
isso, teremos de nos restringir a um compacto K ⊂ I ×U. Que compacto seria este? Ele deve
ser grande a ponto de podemos “variar” entre f e f + h lá dentro. Por esta razão, queremos
(t, f (t) + h(t)) ∈ K para cada t ∈ I e h próxima de 0. Garantiremos que isso vale tomando uma
“faixa” (se d = 1) ou “cilindro” (se d > 1) ao redor do gráfico de f . Ou seja, queremos um
conjunto da forma
K := {(t, x) : t ∈ [a, b], |x− f (t)| ≤ R}. (11.5)
A questão, então, é se podemos escolher um R > 0 de modo que K ⊂ U. Para concluirmos que
“sim, podemos”, devemos observar que f (t) ∈ U para cada t ∈ I = [a, b]. A aplicação
t ∈ I 7→ dRd( f (t), Uc)
é contı́nua (é a composição de funções contı́nuas) e positiva (Uc é fechado, logo dRd(x, U
c) = 0
se e somente se x ∈ Uc). Combinando estes fatos com a compacidade de I, deduzimos que
R0 := inf
t∈[a,b]
dRd( f (t), U
c) > 0.
Portanto, se 0 < R < R0, garantimos que o conjunto K em (11.5) realmente está contido em
U. Note que, se h ∈ C([a, b], V) e ‖h‖∞ ≤ R, então (t, f (t) + h(t)) ∈ K para cada t, portanto
f + h ∈ U .
(Note que acabamos de provar “sem querer” que há uma bola BC(I,Rd)[ f , R] ⊂ U . Notando
que podemos achar um R > 0 para cada f ∈ U , provamos que U é aberto!)
Tendo o compacto K, queremos usar a continuidade uniforme de DxΨ |K. Tome um (t, a), (t, b) ∈
K com |b− a| ≤ δ. Pelo corolário 11.1 acima (aplicado com x′ = a e x′′ = a + b),
∀(t, a), (t, a + b) ∈ K : |Ψ(t, a + b)−Ψ(t, a)− DxΨ(t, a) b|2 ≤ c(δ) |b|2.
onde
c(δ) := sup
(t,a),(t′,b)∈K : |(t′,b)−(t,a)|2≤δ
|DxΨ(t, a)− DxΨ(t, b)|.
Como DxΨ é contı́nua sobre I × U, e portanto é uniformemente contı́nua sobre o compacto K,
vemos que c(δ)→ 0 quando δ→ 0. Note que isto quer dizer que
sup
(t,a),(t,a+b)∈K : 0<|b|2≤δ
|Ψ(t, a + b)−Ψ(t, a)− DxΨ(t, a) b|2
|b|2
≤ c(δ)→ 0 quando δ→ 0.
175
De posse dessa desigualdade, não é difı́cil completar a prova. Considere f e f + h com
‖h‖∞ ≤ R, de modo que (t, f (t)) ∈ K e (t, f (t) + h(t)) ∈ K para cada t ∈ I. Como |h(t)|2 ≤ ‖h‖∞
para cada t, temos
∀t ∈ I : |Ψ(t, f (t) + h(t))−Ψ(t, f (t))− DxΨ(t, f (t)) h(t)|2 ≤ c(‖h‖∞) ‖h‖∞,
ou
‖F( f + h)− F( f )− DxΨ(·, f (·)) h(·)‖∞ ≤ c(‖h‖∞) ‖h‖∞.
Portanto,
‖F( f + h)− F( f )− DxΨ(·, f (·)) h(·)‖∞
‖h‖∞
≤ c(‖h‖∞)→ 0 quando h→ 0.
Isto demonstra que a derivada DF( f ) existe e é igual ao que dissemos que ela era.
Para terminar, observamos que esta derivada é contı́nua: se { fn}n∈N ⊂ C(I, Rd) e fn → f ,
temos (t, fn(t)) ∈ K para todo t e todo n grande, e aı́ vemos que
‖DF( fn)− DF( f )‖L(C,C) = sup
h∈C, ‖h‖∞≤1
‖(DxΨ(·, fn(·))− Dx(Ψ(·, f (·)))) h(·)‖∞
= sup
|h(t)|2≤1
t∈I
‖(DxΨ(t, fn(t))− DxΨ(t, f (t))) h(t)‖Rd
≤ sup
t∈I
‖DxΨ(t, fn(t))− DxΨ(·, f (·))‖Rd→Rd → 0
por continuidade uniforme de DxΨ em K. 2
Observação 11.2 O mesmo argumento que demos acima prova algo a mais. Considere um compacto
K ⊂ I ×U ⊂ Rd+1. Em primeiro lugar, vemos que existe uma função não-decrescente c = c(δ) ≥ 0 com
limδ→0 c(δ) = 0 tal que
∀(t, a), (t, b) ∈ K : |Ψ(t, a + δ)−Ψ(t, a)− DxΨ(t, a) (b− a)|2 ≤ c(|b− a|2) |b− a|2.
Agora chame de
K := { f ∈ C(I, Rd) : ∀t ∈ I, (t, f (t)) ∈ K}.
Neste caso, temos a estimativa:
∀t ∈ I, ∀ f , f + h ∈ K : |Ψ(t, f (t) + h(t))−Ψ(t, f (t))− DxΨ(t, f (t)) h(t)|2 ≤ c(‖h‖∞) ‖h‖∞,
o que se traduz em
∀ f , f + h ∈ K : ‖F( f + h)− F( f )− DF( f ) h|2 ≤ c(‖h‖∞) ‖h‖∞,
e
∀ f , f + h ∈ K : ‖T( f + h)− T( f )− DT( f ) h|2 ≤ (b− a) c(‖h‖∞) ‖h‖∞,
já que T = I ◦ F, DT = I ◦ DF e a norma de operador de I é ≤ (b− a).
176
11.5 Mais exercı́cios
Exercı́cio 11.15 (Mı́nimos são pontos crı́ticos) Suponha que (V, ‖ · ‖V) é espaço vetorial normado,
U ⊂ V é aberto e f : U → R dada. Mostre que, se x ∈ U, f é diferenciável em x e f (x) = infx′∈U f (x′),
então D f (x) = 0L(V,R).
Exercı́cio 11.16 (Derivadas de funções convexas) Suponha que (V, ‖ · ‖V) é espaço vetorial normado,
U ⊂ V é aberto convexo e f : U → R é diferenciável. Mostre que f é convexa (isto é, f (tx + (1− t)x′) ≤
t f (x) + (1− t) f (x′) para todos x, x′ ∈ U e 0 ≤ t ≤ 1) se e somente se:
∀x, x′ ∈ U : f (x′) ≥ f (x) + D f (x) (x′ − x).
Exercı́cio 11.17 Suponha que (V, ‖ · ‖V) é espaço vetorial normado, U ⊂ V é aberto e convexo e f : U →
V é diferenciável. Suponha ainda que f é bi-Lipschitz, isto é, ∃L−, L+ > 0 tais que
∀x, x′ ∈ U : x 6= x′ ⇒ L− ≤
‖ f (x)− f (x′)‖W
‖x− x′‖V
≤ L+.
Mostre que, neste caso, temos a seguinte desigualdade:
∀x ∈ U ∀h ∈ V : L−‖h‖V ≤ ‖D f (x) h‖W ≤ L+‖h‖V .
Exercı́cio 11.18 Seja (V, ‖ · ‖V) espaço vetorial normado. Dado k ∈ N, recorde-se que Vk também tem
estrutura de espaço normado, por exemplo com a norma:
‖v‖V :=
k
∑
i=1
‖v[i]‖V , (v = (v[i])ki=1 ∈ Vk).
Agora defina uma operação Tk : V → Vk que leva x ∈ V em (x, x, x, . . . , x) (x ∈ V). Qual é a derivada
de Fréchet desta operação Tk?
Exercı́cio 11.19 O permanente de uma matriz A ∈ Rd×d é dado por:
per(A) := ∑
σ∈Sd
d
∏
i=1
A[i, σ(i)].
Ou seja: o permanente é “quase igual” ao determinante, mas não aparecem os sinais alternados na fórmula.
(Estranhamente, isso o torna mais difı́cil de calcular, mas muito útil em certos modelos da Mecânica
Estatı́stica.) Mostre que per : Rd×d → R é Fréchet-diferenciável e calcule sua derivada.
Exercı́cio 11.20 Considere espaços vetoriais normados (V, ‖ · ‖V) e (Wi, ‖ · ‖Wi) para i = 1, 2, . . . , k.
Defina o espaço produto W := W1 ×W2 × · · · ×Wk com uma das normas-produto que já estudamos.
Dado um aberto U ⊂ V, considere funções fi : U → Wi, com i = 1, . . . , k. Construa uma nova função
f : U → W que leva x ∈ U na k-tupla f (x) = ( fi(x))ki=1 ∈ W. Mostre que f é diferenciável emum
certo x ∈ U se e somente se cada fi é diferenciável em x e calcule a derivada de Fréchet de f em termos das
derivadas D fi(x).
177
Exercı́cio 11.21 (“Regra de Leibniz” para derivada de Fréchet) Continue com a notação acima e
acrescente um novo espaço vetorial normado (Z, ‖ · ‖Z) e uma Q : W → Z k-linear e limitada. Defina
F : U → Z através da fórmula:
F(x) := Q( f1(x), . . . , fk(x)) (x ∈ U).
Mostre que, se todas as fi são diferenciáveis num certo x ∈ U, então DF(x) existe. Além disso, calcule
DF(x).
Exercı́cio 11.22 Neste problema, (X, ‖ · ‖X) é um espaço vetorial normado completo e L(X) é o espaço
dos operadores lineares limitados de X em X. Considerand uma sequência {an}n∈N, queremos encontrar
condições sob as quais a série de potência
f (T) := ∑
n∈N
an Tn
define uma função diferenciável sobre uma vizinhança de 0 em L(X). Como no caso de séries de potência
reais, definimos o raio de convergência:
R := (lim sup
n∈N
|an|1/n)−1.
1. Mostre que a série definindo f converge se ‖T‖X→X < R.
2. Lembre da definição de Ak acima e mostre que a expressão
D f (T) H := ∑
n≥1
anAn(T) H (H ∈ L(X))
define um operador linear sobre L(X), que é a derivada de Fréchet de f em T.
178
Capı́tulo 12
Derivadas de ordem superior
No capı́tulo anterior, tratamos da noção de derivada devida a Fréchet, estudamos suas propri-
edades e entendemos alguns exemplos. Nosso trabalho agora será estender este conceito para
derivadas de ordem k > 1. Isso nos permitirá escrever uma versão da fórmula de Taylor neste
contexto geral.
12.1 Já sabemos definir, mas...
Considere espaços vetoriais normados (V, ‖ · ‖V), (W, ‖ · ‖W). Vimos acima que, quando U ⊂ V
é aberto, f : U →W é dada e x ∈ U, a derivada de f em x, se existir, é o operador linear limitado
D f (x) ∈ L(V, W) tal que
lim
h→0
‖ f (x + h)− f (x)− D f (x) h‖W
‖h‖V
= 0.
Suponhamos agora que D f (x) está definida para todo x, de modo que D f : U → L(V, W).
(L(V, W), ‖ · ‖V→W) também é um espaço vetorial normado.
No cálculo em uma dimensão, a segunda derivada é tão somente a “derivada da derivada”.
Isso continua a fazer sentido aqui e podemos dizer que a segunda derivada de f em x, se existir,
tem de ser uma transformação linear limitada D2 f (x) ∈ L(V,L(V, W)) tal que:
lim
h→0
‖D f (x + h)− D f (x)− D2 f (x) h‖V→W
‖h‖V
= 0.
Do mesmo modo, se D2 f : U → L(V, W) está definida em todo U, a terceira derivada em x, se
existir, deve ser uma transformação linear limitada D3 f (x) ∈ L(VL(V,L(V, W))) tal que
lim
h→0
‖D2 f (x + h)− D2 f (x)− D3 f (x) h‖V→L(V,W)
‖h‖V
= 0.
Poderı́amos continuar com estas fórmulas ligeiramente estranhas, mas antes devemos parar e
pensar:
o que está acontecendo aqui?
Nada do que fizemos aqui está errado, mas a derivada que definimos não se presta a uma
compreensão muito intuitiva. Vamos pensar atentamente no que ela quer dizer para compreendê-
la um pouco melhor.
179
12.2 Segunda derivada, transformações bilineares e simetria
A principal mensagem desta seção é que a segunda derivada pode ser pensada como uma
transformação bilinear limitada.
Definição 12.1 (Transformação bilinear) Uma transformação B : V2 → W é dita bilinear se é linear
nos seus dois argumentos. Isto é:
1. dados v1, v2, v′ ∈ V e λ ∈ R, B(λv1 + v2, v′) = λ B(v1, v′) + B(v2, v′);
2. dados v, v′1, v
′
2 ∈ V e λ′ ∈ R, B(v, λ′v′1 + v′2) = λ′ B(v, v′1) + B(v, v′2).
Dizemos que uma transformação bilinear B : V2 →W é limitada se
‖B‖V2→W := sup
(v,v′)∈(V\{0V})2
‖B(v, v′)‖W
‖v‖V ‖v′‖V
< +∞.
Chamamos de L2(V, W) o conjunto das transformações bilineares limitadas.
Na próxima subseção, mostraremos que L(V,L(V, W)) – o espaço onde “mora” a segunda
derivada – é isomorfo ao espaço de transformações bilineares limitadas.
12.2.1 Relação de L(V,L(V, W)) com transformações bilineares
Os elementos de L(V, (L(V, W)) são transformações lineares T : V → L(V, W). Uma tal T
associa a cada v ∈ V um T(v) ∈ L(V, W) de forma linear, de modo que
∀v1, v2 ∈ V ∀λ ∈ R : T(λ v1 + v2) = λ T(v1) + T(v2).
Quando fixamos um v ∈ V, T(v), pertence a L(V, W). Portanto, T(v) : V → W associa a cada
v′ ∈ V um elemento T(v) v′ ∈W de forma linear. Dito de outro modo:
∀v ∈ V ∀v′1, v′2 ∈ V ∀λ′ ∈ R : T(v)(λ′ v′1 + v′2) = λ T(v) v′1 + T(v) v′2.
O resumo disto tudo é que a cada T ∈ L(V,L(V, W)), podemos associar uma função:
BT : V2 → W
(v, v′) 7→ T(v) v′.
O que esta função tem de especial é que ela é bilinear. De fato, o que vemos é que a cada
T : V → L(V, W) podemos associar uma transformação bilinear BT : V2 → W. De fato, o
seguinte resultado é fácil de provar.
Exercı́cio 12.1 A aplicação que leva T em BT é uma bijeção linear entre o conjunto das transformações
lineares
T : V → {transformações lineares de V em W}
e o conjunto das transformações bilineares B : V2 →W. Dica: observe que a inversa de “T 7→ BT” leva
uma transformação bilinear B : V2 →W em
TB : v ∈ V 7→ B(v, ·).
180
Há no entanto um fato que ainda não consideramos: T é uma transformação linear limitada
entre os espaços normados (V, ‖ · ‖V) e (L(V, W), ‖ · ‖V→W). Mais concretamente: recorde que,
se (Z, ‖ · ‖Z) é espaço normado, a norma ‖ · ‖V→Z a norma V → Z sobre L(V, Z) é dada por:
‖S‖V→Z = sup
v∈V\{0V}
‖Sv‖Z
‖v‖V
(S ∈ L(V, Z)).
Se seguimos este raciocı́nio, descobrimos que a norma adequada sobre L(V,L(V, W)) é:
‖T‖V→L(V,W) = sup
v∈V\{0V}
‖T(v)‖V→W
‖v‖V
= sup
v∈V\{0V}
(
sup
v′∈V\{0V}
‖T(v)v′‖W
‖v‖V ‖v′‖V
)
(T ∈ L(V,L(V, W))).
Vamos encontrar uma expressão mais simples para esta norma.
Proposição 12.1 Para qualquer transformação linear T : V → L(V, W) (não necessariamente limitada),
‖T‖V→L(V,W) = sup
(v,v′)∈(V\{0V})2
‖BT(v, v′)‖V→W
‖v‖V ‖v′‖V
;
Ou seja, na definição acima, não importa se tomamos o supremo primeiro em v ou em v′. (Nos dois casos
admitimos a hipótese de que ‖T‖V→L(V,W) pode ser infinito.)
Prova: Defina
a(v, v′) :=
‖BT(v, v′)‖V→W
‖v‖V ‖v′‖V
.
Nosso objetivo é provar que
sup
v∈V\{0V}
sup
v′∈V\{0V}
a(v, v′) = sup
v′∈V\{0V}
sup
v∈V\{0V}
a(v, v′) = sup
(v,v′)∈S×S′
a(v, v′).
De fato, o que vamos provar o seguinte resultado.
Lema 12.1 Considere conjuntos A, B e uma função h : A× B→ R+. Então:
sup
a∈A
(
sup
b∈B
h(a, b)
)
= sup
(a,b)∈A×B
h(a, b).
Prova: Chame de S o supremo do lado direito. Veja que, por definição:
∀a ∈ A ∀b ∈ B : h(a, b) ≤ S
e portanto, para cada a ∈ A fixo, S é cota superior para os valores de h(a, b), b ∈ B.
Deduzimos que
∀a ∈ A : sup
b∈B
h(a, b) ≤ S
e portanto
sup
a∈A
sup
b∈B
h(a, b) ≤ S.
181
Agora observe que para todo (a, b) ∈ A× B,
h(a, b) ≤ sup
b′∈B
h(a, b′) ≤ sup
a′∈A
sup
b′∈B
h(a′, b′).
Ou seja,
sup
a′∈A
sup
b′∈B
h(a′, b′) é cota superior para os valores de h(a, b), (a, b) ∈ A× B.
Deduzimos que
sup
a′∈A
sup
b′∈B
h(a′, b′) ≥ sup
(a,b)∈A×B
h(a, b) = S.
2
2
Podemos agora concluir esta subseção com um exercı́cio e um teorema.
Exercı́cio 12.2 Mostre que L2(V, W) é um espaço vetorial e que ‖ · ‖V2→W é uma norma sobre este espaço.
Teorema 12.1 A aplicação que associa cada T ∈ L(V,L(V, W)) a BT ∈ L2(V, W) é um isomorfismo de
espaços lineares normados. Isto é, “T 7→ BT”é uma bijeção linear e
∀T ∈ L(V,L(V, W)) : ‖T‖V 7→L(V,W) = ‖BT‖V2→W .
Prova: Este teorema basicamente já foi provado acima. Falta apenas juntar os pedaços. O último
exercı́cio mostra que (L2(V, W), ‖ · ‖V2→W) é um espaço vetorial normado. O exercı́cio 12.1 nos
diz que “T 7→ BT” é bijeção linear (e portanto tem inversa linear). Finalmente, a proposição 12.1
garante que esta transformação preserva normas. 2
12.2.2 A segunda derivada é bilinear
Recorde que estávamos considerando a segunda derivada de f : U ⊂ V → W. Tudo o que
acabamos de ver nos diz que temos duas formas completamente equivalentes de pensar na
segunda derivada.
• D(D f )(x) é uma transformação linear limitada de V em L(V, W);
• D2 f (x) é uma transformação bilinear de V2 em W.
Isto nos permite escrever que
D(Df )(x)(h1) h2 = D2 f (x) (h1, h2).
De fato, no lado esquerdo da expressão pensamos em D(D f )(x) ∈ L(V,L(V, W)). Aplica-
mos este objeto a h1 e obtemos D2 f (x)(h1) ∈ L(V, W), aı́ tomamos o resultado, que é uma
transformação linear, e o aplicamos a h1. Do lado direito, D2 f (x) é simplesmente vista como
182
transformação bilinear. Um fato que será importante a seguir é que toda forma bilinear limitada
tem uma derivada. Para isso, é bom lembrar de que, como já vimos anotes, o conjunto
V2 := {(v1, v2) : v1, v2 ∈ V}
tem uma estrutura natural de espaço vetorial (com operações coordenada a coordenada) e pode
ser dotado da norma
‖(v1, v2)‖V2 = ‖v1‖V + ‖v2‖V ((v1, v2) ∈ V2).
Proposição 12.2 Toda B ∈ L2(V, W) é diferenciável e
DB(v1, v2) (h1, h2) = B(v1, h2) + B(h1, v2) ((v1, v2) ∈ V2, (h1, h2) ∈ V2).
12.2.3 Simetria da segunda derivada (quando contı́nua)
Agora vamos mostrar que, sob condições de continuidade, a derivada segunda é simétrica em
seus argumentos.
Proposição 12.3 Suponha que
D2 f : U → L2(V, W)
é contı́nua em x ∈ U. Então D2 f (x) é simétrica, isto é:
∀v, v′ ∈ V : D2 f (x) (v, v′) = D2 f (x) (v′, v).
Prova: Como U 3 x é aberto, podemos achar um aberto A ⊂ R2 contendo 0R2 onde a função
φ : A ⊂ R2 →W abaixo está bem definida.
φ(t, s) := f (x + tv + sv′)− f (x + sv′)− f (x + tv) + f (x) ((t, s) ∈ R2).
Mostraremos que
φ(t, s)
ts
→ D2 f (x)(v′, v) quando t, s→ 0.
Isto nos bastará porque, trocando os papéis de v e v′ (ou de t e s) em φ, também obtemos
φ(t, s)
ts
→ D2 f (x)(v, v′) quando t, s→ 0
o que nos dá a simetria desejada pela unicidade do limite.
Considere então
φ(t, s)− tsD2 f (x) (v′, v) = [ f (x + θ v + sv′)− f (x + θv)− θ sD2 f (x) (v′, v)] |θ=tθ=0 .
Podemos cotar a norma deste termo usando a desigualdade do valor médio aplicada ao termo
dentro do colchete como função de θ.
É importante pararmos para fazer esta parte da conta com atenção. Pela Regra da Cadeia, a
derivada em θ é exatamente:
D f (x + θ v + sv′) v− D f (x + θv) v− sD2 f (x) (v′, v).
183
Agora veja que esta expressão pode ser reescrita como{
D f (x + θ v + sv′)− D f (x + θv)− sD(D f )(x) (v′)
}
v.
onde aqui usamos o isomorfismo
L(V,L(V, W)) ∼= L(V,L(V, W))
para passar de D2 f (x) ∈ L2(V, W) para D(D f )(x) ∈ L(V,L(V, W)). deste modo, D(D f ) f (x)(v′) ∈
L(V, W) correspondente. Esta passagem é conveniente para a conta, pois teremos que diferenciar
D f : U → L(V, W) e a derivada D(D f )(x)L(V,L(V, W)) ocorrerá naturalmente.
Voltando à conta acima, concluı́mos que:
‖{D f (x + θ v + sv′) v− D f (x + θv) v− sD(D f )(x) (v′)} v‖W
≤ ‖v‖V ‖D f (x + θ v + sv′)− D f (x + θv)− sD(D f ) f (x) (v′)‖L(V,W)
Portanto, pela desigualdade do valor médio.
‖φ(t, s)− tsD2 f (x) (v′, v)‖W
≤ |t| sup0≤θ≤t ‖D f (x + θ v + sv′) v− D f (x + θv) v− sD(D f )(x)(v′).v‖W
≤ |t|‖v‖V sup0≤θ≤t ‖D f (x + θ v + sv′)− D f (x + θv)− sD(D f )(x) (v′)‖V→W .
Observe agora que para cada θ ∈ [0, t] fixo, podemos aplicar a desigualdade do valor médio a
D f (x + θ v + sv′)− D f (x + θv)− sD(D f )(x) (v) = [D f (x + θ v + ηv′)− η D(D f )(x)] |η=sη=0
como função de s, obtendo:
‖[D f (x + θ v + ηv′)− η D(D f ) f (x)] |η=sη=0 ‖V→W
≤ |s| sup
0≤η≤s
‖D(D f )(x + θ v + ηv′)(v′)− D(D f )(x)(v′)‖L(V,W)
(norma V → L(V, W)) ≤ |s|‖v′‖ ‖D(D f )(x + θ v + ηv′)− D(D f )(x)‖V→L(V,W)
use
L2(V, W))
∼=
L(V,L(V, W))
 = |s|‖v′‖ ‖D2 f (x + θ v + ηv′)− D2 f (x)‖V2→W
≤ |s| ‖v′‖V sup
|x′−x|≤|t|‖v‖+|s|‖v′‖
‖D2 f (x′)− D2 f (x)‖V2→W
já que x′ := x + θ v + ηv′ está sempre a distância no máximo |t|‖v‖+ |s|‖v′‖ de x para os valores
de θ e η considerados acima. Deduzimos:
‖φ(t, s)− tsD2 f (x) (v′, v)‖W ≤ |ts| ‖v‖V‖v′‖V sup
|x′−x|≤|t|‖v‖+|s|‖v′‖
‖D2 f (x′)− D2 f (x)‖V2→W .
Dividindo por |ts| dos dois lados, obtemos:∥∥∥∥φ(t, s)ts − D2 f (x) (v′, v)
∥∥∥∥
W
≤ ‖v‖V‖v′‖V sup
|x′−x|≤|t|‖v‖+|s|‖v′‖
‖D2 f (x′)− D2 f (x)‖V2→W
t,s→0→ 0
porque |t|‖v‖+ |s|‖v′‖ vai a 0 e D2 f é contı́nua em x, por hipótese. 2
184
12.2.4 Derivadas parciais de ordem 2
Finalmente, colecionamos aqui algumas observações sobre a relação entre D2 f (x) e as derivadas
parciais de ordem 2 quando V = Rd e W = R (tudo pode ser estendido a W = Rk se trabalhamos
coordenada a coordenada).
Há uma bijeção entre formas bilineares B ∈ L2(Rd, R) e matrizes A ∈ Rd×d. De fato, a
cada B podemos associar a matriz A de entradas Ai,j := B(ei, ej) e aı́ a bilinearidade implica
B(v, v′) = v · Av′.
No nosso caso, queremos estudar a matriz correspondente a D2 f (x). Como esta é a derivada
do gradiente ∇ f (x), esperamos que, se D2 f (x) existe, ela corresponda às derivadas parciais
∂i∂j f (x) das coordenadas de ∇ f (x). Logo, a matriz correspondente a D2 f (x) é deve ser a matriz
Hessiana, das derivadas parciais de ordem 2.
Façamos este passo em detalhes. Suponha que D f (·) existe em todo U e que D(D f )(x)
existe num determinado ponto x. Agora fize v, v′ ∈ Rd A relação entre derivadas de Fréchet e
direcionais nos garante que:
D2 f (x) (v, v′) = (D(D f )(x) v) =
(
lim
ε→0
D f (x + εv)− D f (x)
ε
)
v′.
É um exercı́cio mostrar que podemos passar o v′ para dentro do limite. Quando fazemos isso,
temos termos D f (x + εv) v′ = ∇ f (x + εv).v′ e D f (x) v′ = ∇ f (x).v′. Logo:
D2 f (x) (v, v′) = lim
ε→0
(
∇ f (x + εv).v′ −∇ f (x).v
ε
)
.
Ou seja, a existência de D2 f (x) garante que o limite acima existe para quaisquer v, v′ ∈ Rd.
Tomando v = ei e v′ = ej, e lembrando que a j-ésima coordenada de ∇ f (x) é ∂j f (x), obtemos:
∇ f (x + εv).v′ −∇ f (x).v
ε
=
∂j f (x + εei)− ∂j f (x)
ε
e o limite da expressão acima é a derivada parcial da derivada parcial: ∂i∂j f (x). Concluı́mos:
∀1 ≤ i, j ≤ d : D2 f (x) (ei,j ) = ∂i∂j f (x);
portanto, estas derivadas parciais de ordem 2 todas existem e concluı́mos que
D2 f (x) corresponde à matriz Hessiana ∇2 f (x) = (∂i∂j f (x))di,j=1.
Provamos a fórmula acima supondo que D2 f (x) existe. Como no caso das primeiras deriva-
das, é possı́vel achar um teorema na direção contrária se supomos a continuidade das derivadas
parciais de ordem 2.
Exercı́cio 12.3 D2 f : U → L2(Rd, R) é existe e contı́nua se e somente se cada derivada parcial ∂i∂j f :
U → R existe e é contı́nua. Mostre ainda que, sob estas hipóteses, a matriz Hessiana ∇2 f (x) é simétricxa
para todo x ∈ Rd.
185
12.3 Derivadas de ordem maior que dois
Vamos agora estudar como estender a relação entre derivadas de ordem 2 e formas bilineares
para derivadas de ordem superior. Em linhas gerais, provaremos o seguinte.
• As derivadas de ordem k ≥ 2 de uma função de V em W podem ser encaradas como
transformações k-lineares de Vk em W.
• Sob hipóteses de continuidade, estas derivadas são simétricas em seus argumentos.
• Se V = Rd, W = R e as derivadas parciais de ordem ≤ k são contı́nuas, então f é k vezes
diferenciável.
Como no caso de ordem 2, o primeiro passo é compreender o espaço em que “vivem” as
derivadas de ordem k ≥ 2 dada. Mais uma vez teremos que lidar com isomorfismos e optamos
por abordar logo de cara o trabalho sujo para dar conta dessa tarefa.
12.3.1 Onde vivem as derivadas e um kit para cuidar dos isomorfismos
Como veremos, a derivada será definida por aplicação sucessiva da operação “D” seguida
com isomorfismos, para terminarmos com uma transformação s-linear limitada entre Vs e W.
Começamos definindo este espaço de transformações s-lineares limitadas.
Definição 12.2 Dado s ≥ 1, uma função Q : Vs → W é dita s-linear se vale a seguinte propriedade:
dados quaisquer (v1, . . . , vs) ∈ Vs e um ı́ndice i ∈ [s], a função Qi dada por
Qi : ṽi ∈ V 7→ Q(v1, . . . , vi−1, ṽi, vi+1, . . . , vs) ∈W
é uma transformação linear de V em W. Dizemos que Q é limitada se
‖Q‖Vs→W := sup
(v1,...,vs)∈(V\{0V})s
‖Q(v1, v2, . . . , vs)‖W
∏si=1 ‖vi‖V
< +∞.
Chamamos de Ls(V, W) o espaço de todas transformações s-lineares limitadas de Vs em W.
O resultado abaixo é um exercı́cio importante.
Exercı́cio 12.4 Prove que Ls(V, W) é um espaço vetorial e que ‖ · ‖Vs→Wé uma norma sobre Ls(V, W).
Prove ainda que, se W é Banach, então (Ls(V, W), ‖ · ‖Vs→W) também é completo.
Para realmente definirmos a derivada e analisarmos as propriedades, estaremos obriga-
dos a considerar expressões do tipo Ds1 Ds2 . . . Dsr f (x) e provar que elas são “isomorfas” a
Ds1+···+sr f (x). Para começar, temos que provar e usar o fato que:
Ls1(V,Ls2(V, . . . ,Lsr(V, W) . . . )) ∼= Ls1+s2+···+sr(V, W).
Informalmente isto é simples. No final das contas, um elemento do lado direito pega de entrada
uma s1-tupla em V; depois uma s2-tupla em V; depois . . . uma sr-tupla em V; e produz uma
saı́da em W; tudo isso de forma linear em cada variável e contı́nua no geral. Isso dá no mesmo
que pegar uma (s1 + s2 + · · ·+ sr)-tupla em V e levar em W de maneira multilinear e contı́nua.
O trabalho aparece quando queremos descrever isso de forma precisa. Considere números
r ∈ N\{0, 1} e s1, . . . , sr ∈ N\{0} com s1 + s2 + · · ·+ sr = s. Considere o espaço Ls(V, W) e o
um segundo espaço S = S1 definido da seguinte forma:
186
1. Sr := Lsr(V, W), com a norma ‖ · ‖Sr := ‖ · ‖Vsr→W ;
2. para i = r− 1, r− 2, . . . , 1, Si := Lsi(V,Si+1) com a norma ‖ · ‖Si := ‖ · ‖Vsi→Si+1 , ou seja,
Si = Lsi(V,Lsi+1(V, . . . ,Lsr(V, W) . . . ));
3. Finalmente,
S := S1 = Ls1(V,Ls2(V, . . . ,Lsr(V, W) . . . ))
com a norma definida acima.
Dado T ∈ S1, queremos definir QT ∈ Ls(V, W) correspondente. Isso quer dizer que devemos
definir, para cada v = (v1, . . . , vs) ∈ Vs, um valor
QT v = QT (v1, . . . , vs) ∈W
que corresponda de forma “natural” a T. Para isso, convém primeiro escrevermos:
Vs ∼= Vs1 ×Vs2 × · · · ×Vsr ;
isto é, a cada v = (vj)sj=1 ∈ Vs associamos:
v(1) := (vj)
s1
j=1 ∈ V
s1 , v(i) := (vj)
s1+···+si
j=s1+···+si−1 ∈ V
si (2 ≤ i ≤ r);
e notamos que a aplicação levando v ∈ Vs em (v(1), . . . , v(r)) ∈ V1× · · · ×Vr é uma bijeção. Além
disso, dado u = (uj)kj=1 ∈ Vk para algum k ∈ N\{0}, definimos mk(u) := ∏
k
j=1 ‖uj‖V e notamos
que:
∀v ∈ V : ms(v) =
r
∏
i=1
msi(v
(i)).
Agora definimos QT v da seguinte forma. Como T ∈ Ls1(V,S2), o valor T v(1) ∈ S2 está bem
definido. Como S2 = Ls2(V,S3), também podemos calcular (T v(1)) v(2) ∈ S3. Seguindo assim,
chegamos a:
QT v := (. . . ((T v(1)) v(2)) . . . ) v(r).
Portanto, definimos, para cada v ∈ Vs, um valor QT v ∈ W. Isto é, QT : Vs → W. Abaixo
relatamos algumas propriedades desta transformação.
QT é s-linear.
É um exercı́cio mostrar esta propriedade. De fato, isso segue da observação que “v(1) 7→
Tv(1)”é multilinear e que, para i = 2, . . . , r− 1,
(. . . (Tv(1)) . . . ) v(i−1) ∈ Si = Lsi(V,Si+1),
e portanto
“v(i) 7→ [(. . . (Tv(1)) . . . ) v(i−1)] v(i)” é multilinear.
O próximo passo é mostrar que QT é limitada e tem a mesma norma que T.
187
‖T‖S1 = ‖QT‖Vs→W .
Para isso, usamos repetidamente a nossa notação ms e o fato que podemos tomar o supremo
na ordem que quisermos:
‖QT‖Vs→W = sup
v∈(V\{0V})s
‖QTv‖W
ms(v)
(Vs ∼= Vs1 × · · · ×Vsr ) = sup
v(i)∈(V\{0V})
si
i=1,...,r
‖(. . . (Tv(1))v(2) . . . v(r−1))v(r)‖W
∏ri=1 msi(v(i))
.
Considere o lado direito da expressão quando tomamos o supremo em v(r). Como
(. . . (Tv(1))v(2) . . . )v(r−1) ∈ Lsr(V, W) = Sr,
temos que:
sup
v(r)∈(V\{0V})sr
‖(. . . (Tv(1))v(2) . . . v(r−1))v(r)‖W
msr(v(r))
= ‖(Tv(1))v(2) . . . v(r−1)‖Sr .
Portanto,
‖QT‖Vs→W = sup
v(i)∈(V\{0V})
si
i=1,...,r−1
‖(Tv(1))v(2) . . . v(r−1)‖Sr
∏r−1i=1 msi(v(i))
.
Podemos repetir este raciocı́nio tomando agora o supremo em v(r−1) e lembrando que
(Tv(1))v(2) . . . v(r−2) ∈ Sr−1 = Lsr−1(V,Sr).
Obtemos:
‖QT‖Vs→W = sup
v(i)∈(V\{0V})
si
i=1,...,r−2
‖(Tv(1))v(2) . . . v(r−2)‖Sr−1
∏r−2i=1 msi(v(i))
.
Repetindo este procedimento, chegamos a:
‖QT‖Vs→Q = sup
v(1)∈(V\{0})s1
‖Tv(1)‖S2
m1(v(1))
= ‖T‖S1
já que S1 = Ls1(V,S2).
A aplicação que leva T ∈ S em QT ∈ Ls(V, W) é uma bijeção linear que preserva normas.
Este também é um exercı́cio. A linearidade é bastante direta das definições e a preservação de
normas já foi provada. A propriedade de bijeção vem de construirmos, para cada Q ∈ Ls(V, W),
uma T ∈ S com QT = T.
188
12.3.2 A derivada de ordem k ≥ 3
Agora podemos definir a derivada de Fréchet de ordem k indutivamente.
Definição 12.3 Considere V, W e U como acima e um certo k ≥ 2. Suponha que f : U → W é
(k − 1)-vezes diferenciável. Se Dk−1 f é diferenciável em x0 ∈ U, chamamos de Dk f (x0) o elemento
de Lk(V, W) correspondente a D(Dk−1 f )(x0) ∈ L(V,Lk−1(V, W)) pelo isomorfismo que definimos na
subseção anterior.
Em particular, notamos que:
∀v = (vj)kj=1 ∈ Vk : Dk f (x) v = (D (Dk−1 f )(x) v1) (vj)kj=2
Portanto, a derivada de ordem k é (isomorfa a) uma derivada de uma função Dk−1 f : U →
Lk−1(V, W). Como a derivada direcional recupera a derivada de Fréchet (toda vez que esta
última existe), temos que:
D (Dk−1 f )(x) v1 = lim
ε→0
Dk−1 f (x + εv1)− Dk−1 f (x)
ε
.
Agora observe que, fixos (v2, . . . , vk), a operação que associa a Q ∈ Lk−1(V, W) a Q(v2, . . . , vk) é
contı́nua (exercı́cio). Portanto, a equação acima mostra que:
∀v = (vj)kj=2 ∈ Vk : Dk f (x) (v1, . . . , vk) = lim
ε→0
[(
Dk−1 f (x + εv1)− Dk−1 f (x)
ε
)
(vj)kj=2
]
. (12.1)
Esta identidade será usada para provar a proposição “óbvia” abaixo.
Proposição 12.4 Dada f : U → W, com U ⊂ V aberto e V, W como acima, dados inteiros k ≥ 1 e
s1, . . . , sr ≥ 1 com ∑ri=1 si = k, e dado um x ∈ U, as seguintes afirmações são equivalentes:
1. f é k− 1 vezes diferenciável em U e tem k-ésima derivada em x;
2. a derivada iterada Ds1−1Ds2 . . . Dsr f está definida em U e Ds1 Ds2 . . . Dsr f (x) existe.
Quando estas derivadas em x existem, temos ainda que
Ds1 Ds2 . . . Dsr f (x) ∼= Dk f (x),
ou melhor dizendo: o isomorfismo Is1,...,sr que construı́mos entre S = Ls1(V, . . . ,Lsr(V, W)) e Lk(V, W)
leva Ds1 Ds2 . . . Dsr f (x) em Dk f (x).
Prova: Podemos provar isso por indução em k. Quando k = 1, temos s1 = r = 1 e não há o que
provar.
Agora considere o caso em que k > 1 e suponha que o resultado que queremos provar vale
para k− 1. Provaremos que ele se estende também a k. Para isso, consideraremos s1, . . . , sr como
no enunciado, mas trataremos apenas do caso em que s1 ≥ 2 (a demonstração para s1 = 1 é mais
fácil).
Usando a hipótese de indução, já sabemos que o isomorfismo
Is1−1,s2,...,sr : Ls1−1(V,Ls2(V, . . .Lsr(V, W) . . . ))→ Lk−1(V, W)
189
leva Ds1−1Ds2 . . . Dsr f (x′) em Dk−1 f (x′) para cada x′ ∈ U. Portanto,
∀x′ ∈ U : Is1−1,s2,...,sr(Ds1−1Ds2 . . . Dsr f (x′)) = Dk−1 f (x). (12.2)
Se queremos saber o que isto significa por extenso, podemos identificar
Vk−1 ∼= Vs1−1 ×Vs2 × · · · ×Vsr
e observar que (12.2) nos diz que, se v = (v(i))i=1 ∈ Vk−1 com v(1) ∈ Vs1−1 e cada v(i) ∈ Vsi
(2 ≤ i ≤ r), temos que, para qualquer x′ ∈ U:
Dk−1 f (x) (v(i))ri=1 = (. . . (D
s1−1Ds2 . . . Dsr f (x′) v(1)) v(2) . . . ) v(r).
Para abreviar isso, chamamos de G(x′) := Ds2 . . . Dsr f (x′) e deduzimos:
Dk−1 f (x) (v(i))ri=1 = (. . . (D
s1−1G(x′) v(1)) v(2) . . . ) v(r), (12.3)
novamente para todos os x′ ∈ U.
Repare que Is1−1,s2,...,sr é contı́nua, linear e inversı́vel com inversa linear contı́nua. Por esta
razão, segue da Regra da Cadeia que o lado esquerdo de (12.2) é diferenciável em x se e somente
se o direito é.
Por fim, suponha que um dos lados é diferenciável (e portanto os dois são). Agora identifica-
remos
Vk ∼= V ×Vs1−1 ×Vs2 × · · · ×Vsr
acrescentando um v(0) ∈ V à “lista” (v(i))ri=1 definida acima. Note que, pela equação (12.1),
Dk f (x) (v(i))ri=0 = lim
ε→0
(
Dk−1 f (x + εv(0))− Dk−1 f (x)
ε
)
(v(i))ri=1.
Este limite pode ser calculado de outra maneira se recorremos a (12.3) (e usando novamente
(12.1):(
. . .
(
Ds1−1G(x + εv(0))− Ds1−1G(x)
ε
v(1)
)
v(2) . . .
)
v(r) = (. . . (Ds1 G(x) (v(0), v(1)) ) v(2) . . . ) v(r).
Portanto,
Dk f (x) (v(i))ri=0 = (. . . (D
s1 G(x) (v(0), v(1)) ) v(2) . . . ) v(r).
Como (v(i))ri=0 ∈ Vk é arbitrário, deduzimos que Ds1 G(x) = Ds1 Ds2 . . . Dsr f (x) é o “isomorfo” de
Dk f (x).2
Nosso próximo resultado significa que Dk f é simétrica sempre que é contı́nua como função
de x ∈ U.
Proposição 12.5 Suponha que f : U ⊂ V → W é k vezes diferenciável (com k ≥ 2) e que a função
Dk f : U → Lk(V, W) é contı́nua em um certo x ∈ U. Então a derivada Dk f (x) também é simétrica, ou
seja:
∀(v1, . . . , vk) ∈ Vk, Dk f (x) (v1, . . . , vk) é invariante por permutações de v1, . . . , vk.
190
Prova: Provaremos isto por indução em k ≥ 2. O caso k = 2 já foi discutido acima.
Pense agora em k > 2 e suponha que a simetria já foi provada para k− 1. Observamos que
o grupo de permutações de k elementos {v1, v2, . . . , vk} é gerado transposição de v1 e v2 e pelas
permutações de {v2, . . . , vk}. Portanto, basta provar que Dk f (x) (v1, . . . , vk) é invariante por estas
operações.
Em primeiro lugar, observamos que
∀x′ ∈ U : Dk f (x)(v1, v2, v3, . . . , vk = (D2G(x′)(v1, v2)) (v3, . . . , vk),
onde G(x′) := Dk−2 f (x′) (para x′ ∈ U). Como Dk f e D2G estão ligadas por um dos isomorfismos
que construı́mos, e além disso Dk f é contı́nua em x, temos que D2G também é contı́nua em x.
Portanto, esta segunda derivada é simétrica e temos:
(D2G(x)(v1, v2)) (v3, . . . , vk) = (D2G(x′)(v2, v1)) (v3, . . . , vk) = Dk f (x) (v2, v1, v3, . . . , vk).
Falta provar a simetria em (v2, . . . , vk). Para isso, usamos mais uma vez a equação (12.1):
Dk f (x) (v1, . . . , vk) = lim
ε→0
Dk−1 f (x + εv1) (v2, . . . , vk)− Dk−1 f (x) (v2, . . . , vk)
ε
.
Como Dk f existe em todo x′ ∈ U, a derivada Dk−1 f (x′) é função contı́nua de x′ e portanto é
simétrica em todos os pontos de U. Segue que a expressão “dentro do limite” acima é simétrica
por permutações de (v2, . . . , vk). É um exercı́cio mostrar que esta propriedade se preserva no
limite. 2
12.4 A fórmula de Taylor geral
Nesta seção enunciaremos a fórmula de Taylor na sua versão mais geral para funções k vezes
diferenciáveis.
Teorema 12.2 Tome k ∈ N\{0}. Suponha que f : U ⊂ V → W é (k − 1) vezes diferenciável no
conjunto U e que Dk f (x0) ∼= D(Dk−1 f )(x0) existe. Defina o polinômio de Taylor de f de ordem k ao
redor de x0 como:
Px0,k(h) := f (x0) +
k
∑
j=1
1
j!
Dj f (x) (h, . . . , h)︸ ︷︷ ︸
j vezes
.
Então:
f (x0 + h) = Px0,k(h) + rk(h)
onde rk(h)/‖h‖kV → 0W quando h→ 0V .
Prova: Na verdade, provaremos um resultado bem mais forte. Dados um r > 0 com BV(x0, r) ⊂
U e um h ∈ V com ‖h‖V < r, escreva
Rk(h) := Dk−1 f (x0 + h)− Dk−1 f (x0)− D(Dk−1 f )(x0) h ∈ Lk−1(V, W).
191
Note que ‖Rk(h)‖Vk−1→W/‖h‖V → 0 quando h → 0V porque Dk−1 f é diferenciável em x0. Nós
provaremos por indução em k ≥ 1 que, se h 6= 0V , então:
Objetivo:
‖rk(h)‖W
‖h‖kV
≤ sup
θ∈(0,1]
‖Rk(θ h)‖
θ‖h‖V
,
o que certamente garante rk(h)/‖h‖kV → 0 quando h→ 0V .
Base: k = 1. Este caso segue simplesmente da definição da derivada de Fréchet.
Passo indutivo. Suponha que k ≥ 2 e o teorema vale para k − 1. Se ‖h‖V é suficientemente
pequeno, de modo que x0 + th ∈ U para todo |t| ≤ 2, podemos definir
γ(t) := f (x + th)− Px0,k(th) (t ∈ (−2, 2)).
Vê-se que γ(0) = 0W porque Px0,k(0V) = f (x0). Por isso,
‖ f (x0 + h)− Px0,k(h)‖W = ‖γ(1)− γ(0)‖W ≤ sup
t∈[0,1]
‖γ′(t)‖W .
Para calcular γ′, observamos que
d
dt
f (x + th) = D f (x + th).h,
enquanto
d
dt
Px0,k(th) =
d
dt
 k∑
j=1
tj
j!
Dj f (x) (h, . . . , h)︸ ︷︷ ︸
j vezes

=
k
∑
j=1
tj−1
(j− 1)! D
j f (x) (h, . . . , h)︸ ︷︷ ︸
j vezes
(isom.) =
k
∑
j=1
tj−1
(j− 1)! [D
j−1(D f )(x) (h, . . . , h)︸ ︷︷ ︸
j−1 vezes
].h
= Qx0,k−1(th).h
onde Qx0,k−1 é o polinômio de Taylor de ordem k− 1 da função D f : U → L(V, W). Portanto, se
h 6= 0V ,
‖ f (x0+h)−Px0,k(h)‖W
‖h‖kV
≤ supt∈[0,1]
‖[D f (x0+th)−Qx0,k−1(th)].h‖W
‖h‖kV
≤ supt∈[0,1]
‖D f (x0+th)−Qx0,k−1(th)‖V→W
‖h‖k−1V
.
Note que a expressão no supremo vale 0 em t = 0, logo podemos tomar um supremo sobre
t ∈ (0, 1]. Assim, podemos trocar h por th no denominador e ter uma cota superior. Isso nos
192
traz ao caso k − 1 do resultado, com f substituı́da por D f . Aplicando a hipótese de indução,
deduzimos que:
‖D f (x0 + th)−Qx0,k−1(th)‖V→W
‖th‖k−1V
≤ sup
θ∈(0,1]
‖R′k−1(tθ h)‖
tθ‖h‖V
onde
R′k−1(h
′) := Dk−2(D f )(x0 + h)− Dk−2(D f )(x0)− D(Dk−2(D f ))(x0).h.
Usando nossos isomorfismos com algum cuidado, podemos ver que R′k−1(h
′) tem a mesma
norma que Rk(h′) e isso encerra a prova porque 0 < tθ ≤ 1 na expressão acima. 2
Exercı́cio 12.5 Como no caso da reta, há outras versões da Fórmula de Taylor. Uma delas é útil quando
Dk f existe numa vizinhança de x0 e a função x 7→ Dk f (x) é contı́nua neste ponto x0. Mostre que, neste
caso, para ‖h‖V suficientemente pequeno,
f (x0 + h) = Px0,k(h) + Rx0,k(h)
com resto
‖Rx0,k(h)‖W
‖h‖kV
≤
supa∈[x0,x0+h] ‖D
k f (a)− Dk f (x0)‖Vk→W
k!
h→0V→ 0.
12.5 Mais exercı́cios
Exercı́cio 12.6 Dada f : U ⊂ Rd → R, prove que f é Ck (Dk f (x) existe em todo x ∈ U e depende
continuamente de x) se e somente se todas as derivadas parciais de ordem k de f estão definidas sobre todo
o conjunto U e são funções contı́nuas. Mostre ainda que as derivadas parciais são simétricas (têm o mesmo
valor para qualquer ordem que se tome as derivadas).
Exercı́cio 12.7 Enuncie de forma precisa e prove o seguinte resultado: a composição de funções k vezes
diferenciáveis é k vezes diferenciável.
Exercı́cio 12.8 Volte à Proposição 11.4 e suponha agora que Dkxψ(t, x) existe e é contı́nua, para algum
k ≥ 0. Prove que as funções Tψ e Fψ definidas na prova daquela proposição são k vezes diferenciáveis e
calcule suas derivadas de ordem até k.
Exercı́cio 12.9 Considere Q ∈ Lk(V, W) (com V e W “como sempre”e k ∈ N\{0, 1}) e defina f (v) :=
Q(v, v, . . . , v) (v ∈ V). Calcule as derivadas de todas as ordens desta função. Explique como a fórmula se
simplifica quando Q é simétrica.
Exercı́cio 12.10 Dados espaços vetoriais normados (V, ‖ · ‖V), (W, ‖ · ‖W), chame de Lsimk (V, W) o con-
junto das transformações k-lineares e simétricas de Vk em W. Mostre que este conjunto é um subconjunto
fechado de Lk(V, W). Mostre ainda que podemos definir sobre Lsimk (V, W) uma norma ‖ · ‖sim que é
equivalente à restrição da norma usual de Lk(V, W) a este subespaço:
‖Q‖sim := sup
v∈V\{0V}
‖Q(v, v, . . . , v)‖W
‖v‖kV
.
193
Dica: para v ∈ V, escreva vk := (v, v, . . . , v) ∈ Vk. Mostre que existem
m ∈N\{0} e {a(i)}mi=1 ∪ {α
(i)
j }1≤i≤m,1≤j≤k ⊂ R
tais que, para quaisquer vetores v1, . . . , vk ∈ V e qualquer Q : Vk →W k-linear,
Q(v1, v2, . . . , vk) =
m
∑
i=1
a(i) Q
(
(
k
∑
j=1
α
(i)
j vj)
k
)
.
Depois explique porque a existência destes números implica que existe um Ck > 0 tal que
‖Q‖Vk→W ≤ Ck ‖Q‖sim para qualquer Q ∈ Lsimk (V, W).
Exercı́cio 12.11 (“Regra de Leibniz” para derivada de Fréchet) Dados espaços vetoriais normados
(V, ‖ · ‖V), (W, ‖ · ‖W) e (Z, ‖ · ‖Z); um aberto U ⊂ V; uma Q ∈ Lk(W, Z); e funções f1, . . . , fk : U →
W. Defina uma nova função F : U → Z via:
F(x) := Q( f1(x), . . . , fk(x)) (x ∈ U).
Mostre que, se todas as fi são diferenciáveis num certo x ∈ U, então DF(x) existe. Além disso, calcule
DF(x).
Exercı́cio 12.12 Recorde o Teorema 11.5 acima, onde consideramos (X, ‖ · ‖X) Banach, o subconjunto
aberto U ⊂ L(X) de operadores lineares inversı́veis e definimos Inv : U → U como a operação que
associa cada operador inversı́vel a sua inversa. Agora defina , para cada r ∈ N\{0, 1}, uma operação
Opr : L(X) 7→ Lr−1(L(X),L(X)) que associa a cada A ∈ L(X) a transformação (r− 1)-linear Opr(A)
definida a seguir.
Opr(A) (H1, . . . , Hr−1) := (−1)
r−1 1
(r− 1)! ∑
σ∈Sr−1
AHσ(1)AHσ(2) . . . AHσ(r−1)A ((H1, . . . , Hr−1) ∈ L(X)r−1).
1. Prove que cada Opr é diferenciável e calcule a sua derivada.
2. Demonstre via regra da cadeia e indução que DkInv = Opk+1 ◦ Inv. (Uma dica é observar que, se
esta fórmula vale para algum k, vê-se automaticamente que DkInv existe e pode-se usar derivadas
direcionais para calculá-la.)
194
Capı́tulo 13
Pontos fixos, funções inversas, funções
implı́citase EDOs
Neste capı́tulo abordaremos um teorema bem abstrato e duas consequências importantes dele
para o cálculo diferencial em espaços vetoriais. O que une estes temas é a necessidade de achar
pontos em um espaço V com uma certa propriedade desejada. Nosso meio de fazer isso será
procurar pontos fixos de certas operações.
Exemplo 13.1 (Problema de Cauchy para EDOs) No Exemplo 4.7, vimos que o problema de achar
uma solução para uma EDO é equivalente ao de achar um ponto fixo para uma certa função T : C(I, V)→
C(I, V).
Exemplo 13.2 Imagine que f : U0 ⊂ V → V com U0 ⊂ V aberto. Na prova do Teorema da Função
Inversa, que será vista abaixo, nos depararemos com o problema de provar que, sob certas condições em
f , f (U0) é um conjunto aberto. Repare que este tipo de resultado é bem forte. Dada uma f bem pouco
conhecida, um x ∈ U0 e um y = f (x) ∈ V, temos que provar que existe um raio positivo δ > 0 tal que
todo ponto y′ ∈ BV(y, δ) tem uma preimagem em U0. Mas como podemos construir estas pré-imagens?
Veremos que a maneira conveniente de fazer isso é achar um ponto fixo para uma certa operação.
A mensagem deste capı́tulo é que há uma metodologia para estes problemas que funciona
em muitos casos.
Considere um espaço métrico (X, dX). Você precisa provar que existe um ponto x∗ ∈ X com
certas propriedades. Uma estratégia é converter este problema no de achar um ponto fixo de
uma transformação H : X → X e depois mostrar que o ponto fixo existe usando o Teorema do
Ponto Fixo de Banach, provado logo a seguir.
13.1 O teorema do ponto fixo de Banach
Nesta seção daremos o enunciado e a prova deste teorema de Banach. Primeiro, algumas
definições.
Definição 13.1 Dada H : X → X, um ponto fixo de H é um x∗ ∈ X com H(x∗) = x∗.
195
Abaixo usaremos a notação
Hi := H ◦ H ◦ H ◦ · · · ◦ H︸ ︷︷ ︸
i vezes
(i ∈N\{0})
com H0 := I a função identidade sobre X.
O exercı́cio a seguir nos diz que os pontos fixos são exatamente os limites de órbitas {Hi(x)}i∈N
Exercı́cio 13.1 Supondo que H é contı́nua e (X, dX) é completo, mostre que x∗ é ponto fixo de H se e
somente se existe um x ∈ X com Hi(x)→ x∗ quando i→ +∞.
Teorema 13.1 (Ponto Fixo de Banach) Suponha que (X, dX) é um espaço métrico completo e que H :
X → X é tal que cada Hi é κi-Lipschitz (i ∈N). Suponha que
M :=
+∞
∑
i=0
κi < +∞.
Então:
(a) H tem um único ponto fixo x∗.
(b) Hi(x)→ x∗ para qualquer x ∈ X.
(c) dX(x, x∗) ≤ M d(x, H(x)) para qualquer x ∈ X.
O uso deste teorema será fundamental no restante da seção. Observamos antes da prova um
caso especial importante e dois exemplos que explicam as hipóteses do teorema.
Exercı́cio 13.2 Mostre que as hipóteses do Teorema seguem quando H é κ-Lipschitz com κ < 1, já que
neste caso podemos tomar κi = κi.
Exemplo 13.3 Note que a hipótese de que (X, dX) é completo é fundamental. Por exemplo, considere
X = R\{0} e H(x) = x/2 (x ∈ X).
Exemplo 13.4 Neste exemplo mostramos que é possı́vel se ter X completo, H : X → X tal que
∀x, x′ ∈ X : dX(H(x), H(x′)) < dX(x, x′),
mas tais que H não tem ponto fixo. Por esta razão, é importante que a constante de Lipschitz seja estrita-
mente menor do que um.
Tome X = [1,+∞) ⊂ R. Este é um conjunto fechado da reta e é, portanto, um espaço métrico completo
com a métrica induzida por R. Defina H(x) = x + x−1 (x ∈ X). Observe que:
∀x, x′ ∈ X : |H(x)− H(x′)| = |x− x′|
∣∣∣∣1− 1xx′
∣∣∣∣ < |x− x′|.
Por outro lado, se existisse um ponto fixo x ∈ X, terı́amos x = x + x−1, o que dá x−1 = 0, o que é
impossı́vel.
Antes da prova, convém enunciarmos um lema simples.
196
Lema 13.1 Se (X, dX) é completo, então uma sequência {xi}i∈N ⊂ X satisfazendo
∑
i∈N
dX(xi, xi+1) < +∞
é convergente. Além disso,
∀k ∈N : dX(xk, lim
i∈N
xi) ≤ ∑
i≥k
dX(xi, xi+1).
Prova: Fixando uma tal {xi}i∈N, mostraremos que ela necessariamente é Cauchy. Para
isso, usaremos o fato de que a cauda de uma série convergente vai a zero:
ck := ∑
i≥k
dX(xi, xi+1)
k→+∞−→ 0,
Agora estimaremos a distância entre xk e x` com k < ` naturais. Veja que podemos
aplicar a desigualdade triangular várias vezes e deduzir que:
dX(xk, x`) ≤ dX(xk, xk+1) + dX(xk+1, x`) ≤ · · · ≤
`−1
∑
i=k
dX(xi, xi+1) ≤ ck,
onde a última desigualdade segue do fato que todos os termos na série ck são não-
negativos.
A cota acima foi feita para k < `. Ela também funciona para k > ` se trocamos os
papeis dos ı́ndices e certamente vale para k = `. Concluı́mos que:
∀k, ` ∈N : 0 ≤ dX(xk, x`) ≤ cmin{k,`}.
Quando k, ` → +∞, cmin{k,`} → 0, portanto dX(xk, x`) → 0. Ou seja, a sequência
{xi}i∈N é Cauchy, como querı́amos demonstrar. Como (X, dX) é completo, existe um
limite x∗ para a sequência. Além disso, veja que, quando ` → +∞, x` → x∗; como
` ≥ k para todo ` grande, a estimativa acima nos permite deduzir:
∀k ∈N : dX(xk, x`) ≤ ck.
2
Prova: [Prova do Teorema de Ponto Fixo de Banach] Nosso primeiro passo é provar que, dado
qualquer x ∈ X, {Hi(x)}i∈N converge a um x∗ ∈ X que satisfaz a desigualdade do item (c)
acima.
De fato, como (X, dX) é completo, sabemos do Lema acima uma condição suficiente para uma
sequência {xi}i∈N ⊂ X convergir é que
∑
i∈N
dX(xi, xi+1) < +∞.
197
Mais ainda, quando vale este critério, podemos usar a desigualdade triangular para obter:
dX(x0, lim
i∈N
xi) ≤ ∑
i∈N
dX(xi, xi+1).
Aplicaremos tudo isso a xi := Hi(x), i ∈N, observando que neste caso
dX(xi−1, xi) = dX(Hi−1(x), Hi−1(H(x))) ≤ κi−1 dX(x, H(x))
porque Hi−1 é κi−1-Lipschitz. Portanto,
∑
i∈N
dX(xi, xi+1) ≤ ∑
i∈N
κi dX(x, H(x)) = M dX(x, H(x)) < +∞
e temos tanto a convergência de {Hi(x)}i∈N a um x∗ quando a cota de (c) para dX(x, x∗). Isto
conclui a primeira parte da prova.
O restante da demonstração é basicamente uma série de observações simples. Veja que o
argumento acima garante que pontos fixos existem: afinal, qualquer x∗ = limi Hi(x) é ponto fixo
pelo exercı́cio 13.1. Para provar unicidade, provaremos que quaisquer dois pontos fixos x∗, y∗ são
iguais. Primeiro notamos que, quando x∗ e y∗ são pontos fixos, então Hi(x∗) = x∗ e Hi(y∗) = y∗.
Em particular, como M < +∞ isto vale para algum i ∈N com κi < 1/2. Mas então:
0 ≤ dX(x∗, y∗) = dX(Hi(x∗), Hi(y∗)) ≤ κi−1 dX(x∗, y∗) <
dX(x∗, y∗)
2
⇒ dX(x∗, y∗) = 0⇒ x∗ = y∗.
Finalmente, juntamos os ingredientes.
• O ponto fixo existe e é único, como pede (a);
• Como cada sequência {Hi(x)}i∈N converge a um limite (pela primeira parte da prova) e
este limite é um ponto fixo (pelo exercı́cio 13.1), temos que Hi(x) converge a x∗, o único
ponto fixo de H, não importando qual seja x. Isto é a parte (b) do teorema.
• Finalmente, a estimativa (c) foi provada no primeiro passo, onde tratamos x∗ como o limite
de Hi(x) para um dado x. Como agora sabemos que este limite é o único ponto fixo, está
encerrada a prova.
2
13.2 O teorema da função inversa
Nesta seção provaremos um dos teoremas clássicos do Cálculo em várias variáveis: o teorema da
função inversa. Convém enunciar uma definição antes de começar.
Definição 13.2 Dados abertos U0, U1 ⊂ V, dizemos que f : U0 → U1 é um difeomorfismo de classe C`
(` ∈N\{0}) se f é uma bijeção entre U0 e U1 e tanto f quanto f−1 são funções com derivadas contı́nuas
até ordem `.
198
Os difeomorfismos são importantes porque são correspondências entre conjuntos que preser-
vam não só cardinalidade (como seria se fossem só bijeções) ou topologia (como seria se f e f−1
são contı́nuos), mas também qualquer “estrutura diferenciável até ordem `”que podemos botar
nos conjuntos U0 e U1. De fato, os “difeos” serão muito importantes na hora de falarmos de
variedades.
Uma observação simples é que, para que uma função f : U0 → U1 seja um difeomorfismo C1,
é necessário que derivada de f seja um operador linear inversı́vel. De fato, supondo que f seja
mesmo um difeo, podemos aplicar a regra da cadeia às expressões
∀x ∈ U0, f−1 ◦ f (x) = x e ∀y ∈ U1, f ◦ f−1(y) = y
e descobrir que, dados x ∈ U0 e y = f (x) ∈ U1,
D f−1(y)D f (x) = D f (x) D f−1(y) = IdV ,
o operador identidade de V. Desta forma,
D f−1 = Inv ◦ D f ◦ f−1.
Exercı́cio 13.3 Use a representação acima para D f−1 para provar o segunte resultado. Se f : U0 → U1 é
bijeção de classe C` e a função inversa f−1 é diferenciável, então f−1 também é de classe C` (para ` = 1,
isso segue do fato de que D f−1 é a composição de três funções contı́nuas.
Por outro lado, a simples invertibilidade da derivada não é suficiente para garantir que f é
um difeomorfismo.
Exemplo 13.5 Considere a parametrização de U0 = U1 = R2\{0R2} por coordenadas polares.
f : R2\{0} → R2\{0R2}
(r, θ) 7→ (r cos θ, r sin θ).
Podemos calcular a derivada de f na forma matricial através da matriz de derivadas parciais.
D f (r, θ) =
(
cos θ −r sin θ
sin θ r cos θ
)
.
Como o determinante desta matriz é r > 0, D f (r, θ) é sempre inversı́vel. No entanto, f não é um
difeomorfismo. De fato, ela não é nem mesmo uma bijeção, já que é periódica na segunda coordenada.
O que o Teorema da Função Inversa é que a invertibilidade da derivada num único ponto x0
do domı́nio garante que f é um difeomorfismo local, ou seja, ao redor de x0.
Teorema 13.2 (Teorema da função inversa) Considere um espaço vetorial normado completo (V, ‖ ·
‖V). Suponha que U ⊂ V é aberto de V, que f : U →W é C`, ` ∈N\{0}. Suponha ainda que, para um
certo ponto x0 ∈ U, D f (x0) é inversı́vel. Então há um aberto U0 ⊂ U com x ∈ U0 tal que:
1. U1 := f (U0) é aberto;
2. f |U0 : U0 → U1 é um difeomorfismo C`.
199
A prova será apresentada ao longo de vários lemas abaixo. Convem entender desde agora a
intuição e a dificuldade técnica da prova. A intuição é simples. Localmente, f (x) se parece muito
com a função afim y0 + T(x− x0), com y0 = f (x0) e T = D f (x0). Como T é inversı́vel, a função
afim também é e tudo indica que f deve ter as mesmas caracterı́sticas numa vizinhança de x0.
A maior dificuldade técnica da prova será provar que U1 é aberto. Para entender o desafio,
imagine que você tem em mãos um y ∈ U1 = f (U0). Tudo o que sabemos, em princı́pio, é que
y = f (x) para algum x ∈ U0. Para provar que U1 é aberto, precisamos encontrar um δ > 0 tal
que todo y′ a distância < δ de y tem uma pré-imagem x′ em U0. Como poderemos fazer isso? A
resposta curta será reformular o problema como se fosse um problema de ponto fixo.
A prova do Teorema da função inversa será dada em várias etapas. A primeira é o lema
a seguir, que formaliza a ideia que f (x) ≈ y0 + T (x − x0). (Manteremos a notação de que
T = D f (x0) em toda a prova.) De fato, se tivéssemos f (x) = y0 + T (x− x0) exatamente, valeria
T−1( f (x′)− f (x′′)) = x′ − x′′.
Lema 13.2 Existe um r > 0 com U0 := BV(x0, r) ⊂ U onde f satisfaz a seguinte estimativa.
∀x′, x′′ ∈ U0 : ‖T−1( f (x′)− f (x′′))− (x′ − x′′)‖V ≤
‖x′ − x′′‖V
2
.
Prova: Sob as nossas hipóteses, x 7→ D f (x) é contı́nua e portanto x 7→ T−1D f (x) é contı́nua.
Como T−1D f (x0) = T−1 T = IdV , existe uma vizinhança U0 = BV(x0, r) ⊂ U onde ‖T−1D f (x)−
IdV‖V→V ≤ 1/2. Agora observe que U0 é convexo e que, pela desigualdade do valor médio, vale
a seguinte desigualdade sempre que x′, x′′ ∈ U0:
‖T−1( f (x′)− f (x′′))− (x′ − x′′)‖V = ‖[T−1 f (z)− z]z=x
′
z=x′′‖V
≤
(
sup
z∈[x′,x′′]
‖T−1D f (x)− IdV‖V→V
)
‖x′ − x′′‖V
(‖T−1D f (x)− IdV‖V→V ≤ 1/2 em U0) ≤
‖x′ − x′′‖V
2
.
2
O Lema acima tem diversas consequências. A principal delas é a seguinte.
Corolário 13.1 A função f |U0 é bi-Lipschitz, isto é, existem constantes c0, c1 > 0 tais que:
∀x, x′ ∈ U0 : c0‖x− x′‖V ≤ ‖ f (x)− f (x′)‖V ≤ C0‖x− x′‖V .
Em particular, se U1 = f (U0), f é uma bijeção Lipschitz com inversa Lipschitz entre U0 e U1.
Prova: Segue do Lema anterior e da subaditividade da norma que:
∀x, x′ ∈ U0 : |‖T−1( f (x)− f (x′))‖V−‖x− x′‖V | ≤
‖x− x′‖V
2
ou
‖x− x′‖V
2
≤ ‖T−1( f (x)− f (x′))‖V ≤
3
2
‖x− x′‖V .
Portanto, dados quaisquer x, x′ ∈ U0,
‖ f (x)− f (x′)‖V = ‖T T−1( f (x)− f (x′))‖V ≤ ‖T‖V→V‖T−1( f (x)− f (x′))‖V ≤
3‖T‖V→V
2
‖x− x′‖V
200
e ao mesmo tempo
‖ f (x)− f (x′)‖V ≥
‖T−1( f (x)− f (x′))‖V
‖T−1‖V→V
≥ 1
2‖T−1‖V→V
.
Estas estimativas implicam que f |U0 é injetiva e portanto é uma bijeção entre U0 e U1 = f (U0).
É um exercı́cio deduzir destas estimativas que f (restrita a U0) e f−1 são Lipschitz. 2
O próximo lema é a parte mais difı́cil da prova. É precisamente nele que usaremos o argu-
mento de ponto fixo.
Lema 13.3 U1 := f (U0) é aberto.
Antes de provar o Lema, vejamos como ele implica o Teorema.
Prova: [Fim da prova do Teorema da Função Implı́cita supondo o Lema 13.3] A partir daqui,
suporemos que f : U0 → U1. Já vimos acima que ela é uma bijeção bi-Lipschitz e estamos
supondo que U1 é aberto. O que nos falta, então, é provar é f−1 diferenciável, mas, pelo Exercı́cio
13.3, basta mostrar que f−1 é diferenciável.
Fixe y ∈ U1 e x ∈ U0 com f (x) = y. Observe em primeiro lugar que, pela nossa escolha de
U0,
∀x ∈ U0 : ‖T−1D f (x)− IdV‖V→V ≤ 1/2 < 1,
logo T−1D f (x) é inversı́vel e D f (x) também é inversı́vel. Logo, se y = f (x) ∈ U1, a regra da
cadeia (como exposta no inı́cio da seção) nos faz pensar que D f−1(y) deve ser igual a S :=
D f (x)−1.
Provaremos abaixo que isso é verdade. Dado h tal que y + h ∈ U1, podemos definir uh com
x + uh ∈ U0 tal que f (x + uh) = y + h. Como f é bi-Lipschitz,
c0‖uh‖V ≤ ‖ f (x + uh)− f (x)‖V = ‖h‖V ≤ c1‖uh‖V
com c0, c1 > 0 constantes. Por esta razão, uh 6= 0V se h 6= 0V . Por fim, temos as identidades:
h = y + h− h = f (x + uh)− f (x) = S−1 uh + r(uh),
onde r é um termo de resto, e
f−1(y + h)− f−1(y)− S h = x + uh − x− S h = uh − Sh.
Concluı́mos que
‖ f−1(y + h)− f−1(y)− S h‖V
‖h‖V
=
‖uh − S h‖V
‖h‖V
=
‖S (S−1uh − h)‖V
‖h‖V
≤ ‖S‖V→V
‖S−1uh − h‖V
‖h‖V
= ‖S‖V→V
‖r(uh)‖V
‖h‖V
(use ‖uh‖V ≥ c−10 ‖h‖V) ≤ c0‖S‖V→V
‖r(uh)‖V
‖uh‖V
(use que h→ 0V implica uh → 0V) → 0
201
Estas equações mostram para nós que a derivada de f−1 em y é mesmo dada por:
D f−1(y) = [D f ( f−1(y))]−1 (y ∈ U1).
2
Falta, então, provar o Lema 13.3. É o que faremos a seguir.
Prova: [Prova do Lema 13.3] Tome y ∈ f (U0), y = f (x) com x ∈ U0. Precisamos mostrar que
existe um δ > 0 tal que BV(y, δ) ⊂ f (U0). Isto é o mesmo que provar que
Queremos: existe um δ > 0 tal que, sempre que y′ ∈ V e ‖y′ − y‖V < δ, existe um x′ ∈ U0
com f (x′) = y′.
Nossa ideia será reinterpretar x′ como a solução de um problema de ponto fixo. Defina:
H′y(x
′) := x′ + T−1(y′ − f (x′)) (x′ ∈ U).
Podemos reformular nosso objetivo como sendo o seguinte: Veja que o problema de achar um
ponto fixo de Hy′ é o mesmo de achar x′ com f (x′) = y. Por outro lado, uma propriedade boa
desta função é que ela é automaticamente 1/2-Lipschitz, pelo lema anterior.
∀x′, x′′ ∈ U0 : ‖H′y(x′)− Hy(x′′)‖V = ‖(x′ − x′′)− T−1( f (x′)− f (x′′))‖V ≤
‖x′ − x′′‖V
2
.
(Isso explica, aliás, porque usamos T−1 f no Lema e na definição de Hy′ .)
Tudo isto vale para qualquer y′ ∈ V. Nosso objetivo (reformulado) é mostrar:
Queremos: existe um δ > 0 tal que, sempre que y′ ∈ V e ‖y′ − y‖V < δ, a aplicação Hy′
tem um ponto fixo.
Iremos aplicar o Teorema de Ponto Fixo de Banach para resolver problema. Para aplicar o
Teorema, basta garantir duas condições:
1. Hy′ é κ-Lipschitz, com κ < 1 (esta parte já está feita).
2. Hy′ leva um certo espaço métrico completo X em si mesmo.
A questão então é como cumprir com a segunda exigência. Como y′ estará numa bola perto
de y, é razoável esperar que sua pré-imagem esteja perto de x. De fato, escolhemos o domı́nio:
X := BV [x, η], com 0 < η < r− ‖x− x0‖V .
Note que X ⊂ BV(x0, r) porque x ∈ BV(x0, r). Além disso, X é um fechado num espaço vetorial
completo, sendo, portanto, completo com a métrica induzida.
Ainda falta verificar que Hy′ : X → X é uma transformação deste X em si mesmo. É aqui que
a escolha do δ > 0, que ainda não especificamos, será importante. Mais especificamente, mostraremos
que a escolha de
δ :=
η
2‖T−1‖V→V
funciona.
202
Análise em Espaços Métricos e Vetoriais, Roberto Imbuzeiro IMPA 2021

Exatas

Ferramentas de estudo

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Mais conteúdos dessa disciplina