Logo Passei Direto
Buscar

Análise em Espaços Métricos e Vetoriais, Roberto Imbuzeiro IMPA 2021

User badge image
Pedro H

em

Ferramentas de estudo

Material
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

Análise em espaços métricos e vetoriais
Roberto Imbuzeiro Oliveira1
30 de junho de 2021
1IMPA, Rio de Janeiro, RJ, Brazil, 22430-040.
2
Conteúdo
I Os objetos fundamentais 9
1 Prólogo 11
1.1 Fatos sobre R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.1.1 Intervalos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.1.2 Limites e convergência de sequências . . . . . . . . . . . . . . . . . . . . . . . 11
1.1.3 Limites superior e inferior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.1.4 Limites e convergência de séries . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.1.5 Limites de funções, continuidade, máximos e mı́nimos . . . . . . . . . . . . . 15
1.1.6 Derivadas e integrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2 Algumas funções especiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.1 A função exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.2 A função logaritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.2.3 As funções seno e cosseno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.3 A desigualdade das médias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.4 Mais um fato útil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2 Espaços vetoriais e normas 25
2.1 Um caso concreto: o espaço Rd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.1.1 Operações em Rd e suas propriedades . . . . . . . . . . . . . . . . . . . . . . 25
2.1.2 Produto interno e a norma euclideana em Rd . . . . . . . . . . . . . . . . . . 26
2.2 Definições gerais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.2.1 O que é um espaço vetorial? . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.2.2 Subespaços de espaços vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2.3 Normas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3 Mais exercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3 Espaços métricos, convergência e completude 41
3.1 Espaços métricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.1.1 A reta real como espaço métrico . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.1.2 Os números complexos como espaço métrico . . . . . . . . . . . . . . . . . . 42
3.1.3 A métrica discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.1.4 Espaços vetoriais: normas nos dão métricas . . . . . . . . . . . . . . . . . . . 42
3.1.5 Métricas induzidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.2 Sequências, limites e completude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.2.1 Subsequências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3
3.2.2 Convergência em Rd com as normas `p . . . . . . . . . . . . . . . . . . . . . . 46
3.2.3 Convergência sob a métrica discreta . . . . . . . . . . . . . . . . . . . . . . . . 48
3.2.4 Convergência em C(I, R) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.3 Equivalência de métricas e normas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.4 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4 Funções e continuidade 57
4.1 Funções contı́nuas de X em R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.2 Funções Lipschitz e distâncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.3 Funções contı́nuas sobre o espaço de funções contı́nuas . . . . . . . . . . . . . . . . . 60
4.4 Funções contı́nuas de X em Rd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.5 Transformações e funcionais lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.6 Transformações multilineares e tensores . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.6.1 Tensores em dimensão finita . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.6.2 Alguns exemplos em dimensão infinita . . . . . . . . . . . . . . . . . . . . . . 69
4.7 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
II Topologia e geometria em espaços métricos 73
5 Abertos, fechados e topologias 75
5.1 Os abertos formam uma topologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.2 Outros conceitos topológicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.3 Caracterizações métricas dos conceitos topológicos . . . . . . . . . . . . . . . . . . . 82
5.4 Continuidade, abertos e fechados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
5.5 Topologia relativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.6 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
6 Compactos: teoria geral 89
6.1 Compactos do ponto de vista de Topologia Geral . . . . . . . . . . . . . . . . . . . . 90
6.2 Espaços métricos compactos: o grande teorema de equivalência . . . . . . . . . . . . 93
6.2.1 Roteiro da prova . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
6.2.2 Compactos são completos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
6.2.3 Cobertura, empacotamento e limitação total . . . . . . . . . . . . . . . . . . . 96
6.2.4 O critério das subsequências convergentes . . . . . . . . . . . . . . . . . . . . 99
6.2.5 O fim da prova da grande equivalência . . . . . . . . . . . . . . . . . . . . . . 101
6.3 Mais sobre compactos e funções contı́nuas . . . . . . . . . . . . . . . . . . . . . . . . 102
6.3.1 Funções sobre compactos com contradomı́nio completo . . . . . . . . . . . . 102
6.3.2 Funções sobre compactos com contradomı́nio Banach . . . . . . . . . . . . . 104
6.3.3 Continuidade uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
6.4 Compacidade de subconjuntos de um espaço métrico completo . . . . . . . . . . . . 107
6.5 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
4
7 Compactos: casos particulares 111
7.1 Compactos de Rd: o Teorema de Heine-Borel . . . . . . . . . . . . . . . . . . . . . . . 111
7.2 Aplicações do teorema de Heine-Borel . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
7.2.1 Todas as normas sobre Rd são equivalentes . . . . . . . . . . . . . . . . . . . 112
7.2.2 Convergência uniforme sobre compactos . . . . . . . . . . . . . . . . . . . . . 114
7.3 Compactos nos espaços de funções contı́nuas . . . . . . . . . . . . . . . . . . . . . . . 119
7.3.1 Bolas fechadas não são compactas . . . . . . . . . . . . . . . . . . . . . . . . . 120
7.3.2 O teorema de Arzelà-Ascoli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
7.4 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
8 Caminhos e conexidade 127
8.1 Conexidade por caminhos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
8.1.1 Conectando pontos por curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
8.1.2 Exemplos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
8.2 Conexidade topológica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
8.2.1 Formas equivalentes do conceito . . . . . . . . . . . . . . . . . . . . . . . . . . 131
8.2.2 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
8.2.3 Um pouco mais sobre conexidade e topologia induzida . . . . . . . . . . . . 135
8.3 Exemplos mais interessantesdas definições . . . . . . . . . . . . . . . . . . . . . . . . 136
8.3.1 Matrizes ortogonais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
8.3.2 Um conjunto conexo que não é conexo por caminhos . . . . . . . . . . . . . . 140
8.3.3 Concordância para abertos de espaços vetoriais . . . . . . . . . . . . . . . . . 141
8.4 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
III Cálculo em espaços vetoriais 145
9 Preâmbulo 147
10 Funções a um parâmetro: derivadas e integrais 149
10.1 Derivadas: definição e resultados preliminares . . . . . . . . . . . . . . . . . . . . . . 149
10.2 A desigualdade do valor médio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
10.3 Integração de funções sobre intervalos . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
10.4 O teorema fundamental do Cálculo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
10.5 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
11 A derivada como transformação linear 157
11.1 Definição de derivada de Fréchet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
11.1.1 Unicidade da derivada de Fréchet e derivadas direcionais . . . . . . . . . . . 158
11.2 Alguns casos simples da derivada de Fréchet . . . . . . . . . . . . . . . . . . . . . . . 159
11.2.1 Quando o domı́nio está na reta . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
11.2.2 Derivadas envolvendo funções lineares . . . . . . . . . . . . . . . . . . . . . . 161
11.2.3 A derivada quando V tem dimensão finita e W = R . . . . . . . . . . . . . . 161
11.2.4 O caso em que W tem dimensão finita . . . . . . . . . . . . . . . . . . . . . . 163
11.2.5 A derivada do determinante . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
11.3 Boas propriedades da derivada de Fréchet . . . . . . . . . . . . . . . . . . . . . . . . 166
5
11.3.1 A regra da cadeia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
11.3.2 A desigualdade do valor médio . . . . . . . . . . . . . . . . . . . . . . . . . . 168
11.4 Derivadas mais complicadas de se calcular . . . . . . . . . . . . . . . . . . . . . . . . 169
11.4.1 Exemplos no espaço de operadores lineares . . . . . . . . . . . . . . . . . . . 169
11.4.2 Um exemplo sobre as funções contı́nuas . . . . . . . . . . . . . . . . . . . . . 173
11.5 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
12 Derivadas de ordem superior 179
12.1 Já sabemos definir, mas... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
12.2 Segunda derivada, transformações bilineares e simetria . . . . . . . . . . . . . . . . . 180
12.2.1 Relação de L(V,L(V, W)) com transformações bilineares . . . . . . . . . . . 180
12.2.2 A segunda derivada é bilinear . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
12.2.3 Simetria da segunda derivada (quando contı́nua) . . . . . . . . . . . . . . . . 183
12.2.4 Derivadas parciais de ordem 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
12.3 Derivadas de ordem maior que dois . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
12.3.1 Onde vivem as derivadas e um kit para cuidar dos isomorfismos . . . . . . . 186
12.3.2 A derivada de ordem k ≥ 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
12.4 A fórmula de Taylor geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
12.5 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
13 Pontos fixos, funções inversas, funções implı́citas e EDOs 195
13.1 O teorema do ponto fixo de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
13.2 O teorema da função inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
13.3 O teorema da função implı́cita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
13.4 Aplicações às equações diferenciais ordinárias . . . . . . . . . . . . . . . . . . . . . . 206
13.4.1 Existência, unicidade e dependência contı́nua: um teorema global . . . . . . 206
13.4.2 Suavidade da solução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
13.5 Mais exercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
14 Esboço da teoria de subvariedades de Rd 213
14.1 Os dois primeiros exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
14.1.1 Abertos de Rd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
14.1.2 Gráficos de funções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
14.2 Parametrizações que viram difeomorfismos . . . . . . . . . . . . . . . . . . . . . . . . 214
14.3 O espaço tangente e a dimensão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
14.4 Subvariedades definidas implicitamente . . . . . . . . . . . . . . . . . . . . . . . . . . 219
14.4.1 Exemplos de subvariedades definidas implicitamente . . . . . . . . . . . . . 220
14.4.2 Um resultado intermediário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
14.4.3 Prova do Teorema 14.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
14.5 Trocas de cartas, funções diferenciáveis e estrutura intrı́nseca . . . . . . . . . . . . . 224
14.5.1 Trocas de cartas são difeomorfismos . . . . . . . . . . . . . . . . . . . . . . . . 225
6
IV EDOs: unicidade e dependência suave das condições iniciais 227
15 Existência e unicidade para certas EDOs 229
15.1 Existência e unicidade globais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
15.2 Existência e unicidade locais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
15.3 Diferenciabilidade local - esboço . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
15.4 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
V Mais sobre espaços de funções contı́nuas 235
16 Sequências e séries de funções 237
16.1 Séries de funções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
16.1.1 Somando séries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
16.1.2 Tomando derivadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
16.2 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
16.3 O método de Euler e a existência de soluções para EDOs . . . . . . . . . . . . . . . . 241
16.3.1 Localização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
16.3.2 A aproximação de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
16.3.3 O problema em forma integral . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
16.3.4 Aproximações de Euler são pontos quase-fixos . . . . . . . . . . . . . . . . . 244
16.3.5 Fim da demonstração . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
17 Subconjuntos densos de C(K, R): o teorema de Stone-Weierstrass 247
17.1 O teorema geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
17.1.1 Prova do teorema de Stone-Weierstrass . . . . . . . . . . . . . . . . . . . . . . 249
17.1.2 Prova do Lema Fundamental . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252
18 Restos das versões anteriores 257
18.1 Conjuntos conexos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
18.1.1 Conexidade e funções contı́nuas . . . . . . . . . . . . . . . . . . . . . . . . . . 258
18.1.2 Os conjuntos conexos de R são os intervalos . . . . . . . . . . . . . . . . . . . 259
18.1.3 Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
7
8Parte I
Os objetos fundamentais
9
Capı́tulo 1
Prólogo
Nota de 05/03/2021: este capı́tulo não foi revisto.
O objetivo deste curso será começar um estudo de Análise em espaços vetoriais e (de forma
mais geral) em espaços métricos. Por um lado, estes dois conceitos generalizam a reta real R. Por
outro, fazer Análise nestes espaços requer contas e resultados vindos do mundo unidimensional
da reta real. Portanto, há dois pré-requisitos fundamentais para nosso curso: um bom curso de
Análise na Reta e um conhecimento operacional de Álgebra Linear. É possı́vel que alguns alunos
sobrevivam sem um dos pré-requisitos, mas será basicamente por conta própria: não poderemos
parar por muito tempo para rever estes dois assuntos.
Nesta seção recordaremos alguns fatos e resultados importantes para tudo que vem a seguir.
1.1 Fatos sobre R
Toda a Análise que estudaremos neste curso é baseada no que você já sabe (ou deveria saber)
sobre a reta real. Nesta seção recordamos alguns fatos e resultados lá de Análise na Reta.
1.1.1 Intervalos
Lembre-se que um intervalo I ⊂ R é um conjunto da forma [a, b), (a, b], (a, b) ou [a, b] com a, b ∈
R ∪ {±∞}. Por convenção, o intervalo é vazio se a > b; além disso, só permitimos a, b = ±∞
quando a extremidade correspondente do intervalo for aberta. Chamamos I de intervalo compacto
se a, b 6= ±∞ e as suas duas extremidades são fechadas. Usaremos a notação R+ := [0, ∞).
Usaremos muitas vezes o resultado a seguir.
Exercı́cio 1.1 Um subconjunto S ⊂ R da reta é um intervalo se e somente se satisfaz a seguinte proprie-
dade: ∀x, y ∈ S : (x, y) ⊂ S.
1.1.2 Limites e convergência de sequências
Uma sequência de números reais {xn}n∈N ⊂ R converge a x ∈ R – ou xn → x, ou x = limn∈N xn
– se, dado qualquer ε > 0, podemos encontrar um n0 ∈ N tal que, para qualquer n ∈ N com
11
n ≥ n0, temos |x− xn| < ε. Simbolicamente, podemos escrever isto da seguinte forma
“x = lim
n∈N
xn” := “∀ε ∈ R+∃n0 ∈N∀n ∈N : n ≥ n0 ⇒ |x− xn| < ε.”
É um exercı́cio conhecido mostrar que a definição não se altera quando trocamos |x− xn| < ε
por |x − xn| ≤ ε acima. Um outro resultado conhecido (que não vamos provar aqui) é que R é
completo. Isto é, uma sequência em R é convergente se e somente se é Cauchy, o que quer dizer:
∀ε ∈ R+∃n0 ∈N∀n, m ∈N : n, m ≥ n0 ⇒ |xm − xn| < ε.
Dado um subconjunto infinito N ⊂ N, N = {n1 < n2 < n3 < n4 < . . . }, a subsequência
{xn}n∈N é (por definição) igual à sequência {yk}k∈N dada por yk := xnk , k ∈ N. Podemos então
falar do limite limn∈N xn := limk∈N yk. Pode-se mostrar que
“x = lim
n∈N
xn” := “∀ε ∈ R+∃n0 ∈ N∀n ∈ N : n ≥ n0 ⇒ |x− xn| < ε.”
Além disso, se uma sequência converge, toda subsequência sua converge ao mesmo limite.
Nada impede, aliás, de tomarmos subsequências de subsequências, como faremos algumas vezes
abaixo.
Uma propriedade importante dos intervalos compactos I 6= ∅ é que toda sequência em I
possui uma subsequência convergindo a um ponto de I.
1.1.3 Limites superior e inferior
Podemos falar também dos limites superior e inferior de uma sequência {xn}n∈N ⊂ R.
lim sup
n∈N
xn := inf
n∈N
sup
m∈N,m≥n
xn ∈ R∪ {+∞}.
lim inf
n∈N
xn := sup
n∈N
inf
m∈N,m≥n
xn ∈ R∪ {−∞}.
temos lim inf xn ≤ lim sup xn, com igualdade se e somente se ∃ limn xn.
1.1.4 Limites e convergência de séries
Dados números a1, a2, . . . , an, · · · ∈ R, dizemos que a série ∑n an converge se existe limn→+∞ ∑nj=0 aj.
Caso ∑n |an| convirja, dizemos que ∑n an é absolutamente convergente. Pode-se provar que, a con-
vergência absoluta implica convergência usual. No entanto, a recı́proca não vale.
As condições lim supn |an+1|/|an| < 1 e lim supn |an|1/n < 1 são suficientes para garantir que
∑n∈N an é absolutamente convergente. De fato, nos dois casos a prova da convergência absoluta
se baseia em progressões geométricas, ou seja, no fato que:
∀ρ ∈ R+,
∞
∑
n=0
ρn =
{
1
1−ρ , 0 ≤ ρ < 1;
+∞, ρ ≥ 1.
O critério de Leibniz diz que uma série do tipo
∑
n∈N
(−1)n xn, com cada xn ∈ R+,
12
converge se e somente se xn → 0. De modo geral, o fato de que ∑n an converge implica que
an → 0, mas a recı́proca não vale.
Se ∑n∈N an e ∑n∈N bn são absolutamente convergentes, o mesmo vale para ∑n∈N(an + bn) e
além disso:
∑
n∈N
(an + bn) = ∑
n∈N
an + ∑
n∈N
bn.
Vamos utilizar algumas vezes o lema a seguir.
Lema 1.1 Suponha que ∑n∈N an e ∑n∈N bn são absolutamente convergentes. Então ∑n∈N (∑
n
i=0 aibn−i)
também é absolutamente convergente e vale a identidade:
∑
n∈N
(
n
∑
i=0
aibn−i
)
=
(
∑
n∈N
an
) (
∑
n∈N
bn
)
.
Prova: Definimos para cada k ∈N
Pk :=
(
∑
i≤k
ai
) (
∑
j≤k
bj
)
;
Hk :=
k
∑
n=0
(
n
∑
i=0
aibn−i
)
=
k
∑
s=0
(
s
∑
i=0
ai bs−i
)
.
Por hipótese, sabemos que limk Pk = (∑n∈N an) (∑n∈N bn). Além disso, as duas séries neste
produto são convergentes. Podemos ainda observar que as duas somas se parecem, no seguinte
sentido:
Pk =
2k
∑
s=0
(
∑
0≤i,j≤k : i+j=s
ai bj
)
=
2k
∑
s=0
(
s
∑
i=0
ai bs−iξi,s,k
)
,
onde
ξi,s,k =
{
1 se i ≤ k e s− i ≤ k;
0 em caso contrário.
Começamos a prova com um caso particular do teorema.
Passo 1: se os ai e bj são não-negativos, então vale o teorema.
Note que, neste caso, {Hk}k∈N é uma sequência de somas parciais de uma série com termos
não-negativos. Se provarmos que ela converge a (∑n∈N an) (∑n∈N bn), garantimos automatica-
mente que a série limk Hk converge absolutamente.
Basta, portanto, provar que limk Hk = limk Pk. Para fazer isto, observe primeiramente que
todos os termos da soma que define H2k, que é
H2k =
2k
∑
s=0
(
s
∑
i=0
ai bs−i
)
13
aparecem na soma Pk multiplicados por ξi,s,k ∈ {0, 1}. Ou seja, Pk é a soma de alguns termos que
aparecem em H2k. Como todos estes termos são não-negativos, concluı́mos que Pk ≤ H2k. (Se o
leitor preferir, pode fazer um argumento mais algébrico:
H2k − Pk =
2k
∑
s=0
(
s
∑
i=0
ai bs−i(1− ξi,s,k)
)
≥ 0
porque todas as quantidades do lado direito são não-negativas.)
Por outro lado, se s ≤ k e i ≤ s, ξi,s,k = 1 sempre. Segue que a soma que define Pk contem
todos os termos com ai bs−i com 0 ≤ i ≤ s ≤ k, além de alguns outros que são não-negativos.
Concluı́mos que
Pk ≥
k
∑
s=0
(
s
∑
i=0
ai bs−i
)
= Hk
e portanto Hk ≤ Pk ≤ H2k para todo k ∈N.
Note agora que Pk converge a (∑n∈N an) (∑n∈N bn). Além disso, como os ai e bj são todos
≥ 0, {Hk}k∈N é crescente. Concluı́mos que Hk é limitada, portanto converge a um limite. Como
{H2k}k∈N é uma subsequência de {Hk}k∈N, ela converge ao mesmo limite que a sequência inteira.
Deduzimos:
lim
k
Hk ≤ lim
k
Pk =
(
∑
n∈N
an
) (
∑
n∈N
bn
)
≤ lim
k
H2k = lim
k
Hk,
ou seja,
lim
k
Hk =
(
∑
n∈N
an
) (
∑
n∈N
bn
)
.
Isto conclui o Passo 1.
Passo 2: estendendo a prova para ai e bj gerais.
Até agora trabalhamos supondo que ai, bj ≥ 0. Vamos agora ver o que acontece no caso geral.
Usando o Passo 1, vemos que
∑
n∈N
(
n
∑
i=0
|ai| |bn−i|
)
=
(
∑
n∈N
|an|
) (
∑
n∈N
|bn|
)
< +∞, (1.1)
já que, por hipótese, as séries ∑n an e ∑n bn são absolutamente convergentes. Concluı́mos que
também vale
∑
n∈N
∣∣∣∣∣
(
n
∑
i=0
aibn−i
)∣∣∣∣∣ ≤ ∑n∈N
(
n
∑
i=0
|ai||bn−i|
)
=
(
∑
n∈N
|an|
) (
∑
n∈N
|bn|
)
< +∞.
14
Portanto, {Hk}k converge absolutamente. Por outro lado, seguindo o raciocı́nio de antes,
|Pk − H2k| =
∣∣∣∣∣ 2k∑s=0
(
s
∑
i=0
ai bs−i(ξi,s,k − 1)
)∣∣∣∣∣
≤
2k
∑
s=0
(
s
∑
i=0
|ai| |bs−i||ξi,s,k − 1|
)
(|1− ξi,s,k| ≤ 1 e vale 0 se s ≤ k) ≤
2k
∑
s=k+1
(
s
∑
i=0
|ai| |bs−i|
)
≤
∞
∑
s=k+1
(
s
∑
i=0
|ai| |bs−i|
)
O último termo acima é a cauda da série ∑n (∑
s
i=0 |ai| |bs−i|), que aparece do lado esquerdo de
(1.1). Como esta série converge, sua cauda vai a 0 e concluı́mos |Pk − Hk| → 0. Portanto,
lim
k
Hk = lim
k
H2k = lim
k
Pk =
(
∑
n
an
) (
∑
m
bm
)
.
2
1.1.5 Limites de funções, continuidade, máximos e mı́nimos
Dado um intervalo I, uma função f : I → R e um ponto x ∈ R que é limite de pelo menos uma
sequência em I, dizemos quelim
y→x
f (y) = a
se para qualquer sequência {yn}n∈N ⊂ I\{x} com yn → x temos também f (yn) → a. Dizemos
que f é contı́nua em x ∈ I se limy→x f (y) = f (x).
Se I é compacto, toda função contı́nua tem duas propriedades adicionais automaticamente.
A primeira é que ela atinge seus supremo e ı́nfimo: isto é,
∃xmin, xmax ∈ I ∀x ∈ I : f (xmin) ≤ f (x) ≤ f (xmax).
Em particular, f é limitada.
A segunda propriedade que temos sobre intervalos compactos é que f é limitada. Isto quer
dizer que, se definimos o módulo de continuidade de f :
m f (δ) := sup{| f (x)− f (y)| : x, y ∈ I, |x− y| ≤ δ} (δ ∈ R+),
então m f (δ)→ 0 quando δ→ 0.
Exercı́cio 1.2 Dê exemplos de funções contı́nuas sobre I aberto que não são limitadas ou uniformemente
contı́nuas.
15
1.1.6 Derivadas e integrais
Dados um intervalo I, pontos a, b ∈ I com a < b (e portanto [a, b] ⊂ I) e f : I → R, dizemos que
f é diferenciável em x ∈ I se
∃ f ′(x) := lim
y→x
f (y)− f (x)
y− x .
O Teorema Fundamental do Cálculo nos diz que a derivada é a basicamente a operação inversa
da Integral definida:
I( f )(x) :=
∫ x
a
f (t) dt = lim
n→+∞
x− a
n
n−1
∑
i=0
f
(
a +
i (x− a)
n
)
.
Ou seja, I( f ′)(t) = f (x)− f (a) e I(g)′(x) = g(x).
Recordamos ainda que toda função diferenciável é contı́nua.
1.2 Algumas funções especiais
Neste capı́tulo recordamos alguns resultados fundamentais sobre quatro funções especiais: ex-
ponencial, logaritmo, seno e cosseno. A ideia é provar algumas propriedades destas funções
diretamente, sem recorrer à teoria de diferenciação de séries de potência.
1.2.1 A função exponencial
Definimos a função exponencial através da série de potência usual.
exp(t) :=
+∞
∑
n=0
tn
n!
, t ∈ R. (1.2)
Note que a definição acima faz sentido porque a série converge absolutamente para qualquer
t ∈ R. Pode-se verificar isto a partir do teste da razão:
|t|n+1/(n + 1)!
|t|n/n! =
|t|
n + 1
→ 0 quando n→ +∞.
Vemos ainda que exp(0) = 1.
Proposição 1.1 (Adição e produto) Dados quaisquer t, s ∈ R,
exp(t + s) = exp(t) exp(s).
Prova: Recorde a fórmula binomial:
(t + s)n =
n
∑
i=0
(
n
i
)
tisn−i, onde
(
n
i
)
=
n!
i! (n− i)! .
Aplicando a fórmula termo a termo na série de exp(t + s), descobrimos que
exp(t + s) :=
+∞
∑
n=0
(t + s)n
n!
=
∞
∑
n=0
(
n
∑
i=0
ti
i!
tn−i
(n− i)!
)
.
16
Observe que isto tem a forma
∞
∑
n=0
(
n
∑
i=0
ai bn−i
)
,
onde an = tn/n! e bn = sn/n! para cada n ∈N. Como ∑n tn/n! converge absolutamente a exp(t),
e analogamente para exp(s), deduzimos do Lema 1.1 que:
exp(t + s) =
(
∑
n
an
) (
∑
n
bn
)
= exp(t) exp(s).
2
Proposição 1.2 exp′(t) = exp(t) para cada t ∈ R.
Prova: Queremos mostrar que
Queremos:
exp(t + h)− exp(t)
h
→ exp(t) quando h→ 0.
Usando o fato que exp(t + h) = exp(t) exp(h), observamos que o que queremos equivale a:
Queremos (equivalente):
(exp(h)− 1) exp(t)
h
→ exp(t) para todo t,
e para isto basta provar que
Basta:
exp(h)− 1
h
→ 1.
Para tal, observe que
exp(h)− 1 =
∞
∑
n=1
hn
n!
= h + R(h)
com
R(h) = ∑
n≥2
hn
n!
.
Como n! ≥ 1 sempre, podemos comparar a série de R(h) termo a termo com a série geométrica:
∀|h| ≤ 1/2 : |R(h)| ≤ ∑
n≥2
|h|n
n!
≤ ∑
n≥2
|h|n = |h|
2
1− |h| .
Em particular, isto quer dizer que
∀|h| ≤ 1/2
∣∣∣∣exp(h)− 1h − 1
∣∣∣∣ = |R(h)||h| ≤ |h|1− |h| .
Como o lado direito desta desigualdade tende a 0 quando h → 0, deduzimos que |(exp(h) −
1)/h− 1| → 0, o que encerra a prova. 2
17
Proposição 1.3 exp(t) > 0 para todo t ∈ R.
Prova: Como exp é diferenciável, ela é contı́nua em todo R, em particular ao redor de t = 0.
Como exp(0) = 1, sabemos que existe um ε > 0 tal que exp(a) > 1/2 sempre que |a| < ε. Por
outro lado, dado t ∈ R qualquer, podemos encontrar um n ∈ N tal que |t/n| < ε, de modo que
exp(t/n) > 1/2. Desta forma, podemos aplicar a regra de “adição vira produto” para deduzir
que
exp(t) = exp
(
n
t
n
)
=
[
exp
(
t
n
)]n
>
1
2n
> 0.
2
Proposição 1.4 exp é estritamente crescente. Além disso, limt→+∞ exp(t) = +∞ e limt→+∞ exp(−t) =
0.
Prova: As duas proposições anteriores implicam que exp tem derivada estritamente positiva em
todo ponto da reta. Portanto, exp é estritamente crescente. Em particular, isto quer dizer que há
um a > 0 com exp(a) = m > 1 = exp(0). Usando o raciocı́nio da proposição anterior, vemos que
exp(na) ≥ mn → +∞ quando n→ +∞, já que m > 1.
Em particular, dado M > 0 existe um t ∈ R como exp(t) > M. Como exp é crescente, isto
implica que exp(t)→ +∞ quando t→ +∞.
Por outro lado, a regra de que adição vira produto implica que
exp(−t) = 1
exp(t)
→ 0 quando t→ +∞.
2
Proposição 1.5 exp(R) = R+\{0} Além disso, exp é uma bijeção entre domı́nio e imagem.
Prova: Já vimos que exp(t) ∈ R+\{0} para todo t. Resta mostrar que, dado x ∈ R+\{0}, existe
um único t com exp(t) = x. Veja que a unicidade segue do fato que exp é estritamente crescente.
Para provar existência, observe que, pela proposição anterior, certamente existem t−, t+ com
exp(t−) ≤ x ≤ exp(t+) (e necessariamente t− ≤ t+, posto que exp é estritamente crescente).
Como exp é diferenciável, ela é contı́nua e o Teorema do Valor Intermediário nos diz que existe
um t ∈ [t−.t+] com exp(t) = x. 2
1.2.2 A função logaritmo
Como exp : R → R+\{0} é uma bijeção estritamente crescente, ela tem uma função inversa
log : R+\{0} → R que também é uma bijeção estritamente crescente. Como a exponencial
transforma soma em produto, esta função, chamada de logaritmo, deve fazer o contrário.
Proposição 1.6 (Prova omitida) log(xy) = log x + log y para quaisquer x, y > 0.
Da mesma forma, como exp(t)→ +∞ e exp(−t)→ 0 quando t cresce, podemos provar que:
18
Proposição 1.7 (Prova omitida) log(x)→ −∞ se x→ 0 e log(x)→ +∞ se x→ +∞.
Agora calcularemos a derivada do logaritmo, provando, em particular, que ela existe.
Proposição 1.8 log′(x) = 1/x para qualquer x > 0.
Prova: Fixo x > 0, devemos provar que
Queremos: lim
h→0
log(x + h)− log x
h
=
1
x
.
Para isso, vamos fixar uma sequência {hn}n∈N com hn → 0 e min{hn, x + hn} > 0 para todo n.
Nosso objetivo é provar que, não importando qual sequência deste tipo escolhemos,
Queremos (equivalente): lim
h→0
log(x + hn)− log x
hn
=
1
x
.
Tome então t com exp(t) = x e tn com exp(tn) = x + hn para cada n ∈ N. Afirmamos que,
obrigatoriamente, tn → t. Note que isto quer dizer que:
lim
n→+∞
log(x + hn)− log x
hn
= lim
n→+∞
tn − t
exp(tn)− exp(t)
=
1
exp(t)
1
x
.
Portanto, se provarmos a afirmação, teremos encerrado a prova.
Para provar a afirmação, recorde que exp(tn) = x + hn → x = exp(t). Tome ε > 0 e defina
a+ := exp(t + ε), a− := exp(t − ε). Como exp é estritamente crescente, a− < exp(t) < a+,
portanto exp(tn) ∈ (a−, a+) para todo n suficientemente grande. Usando novamente o fato que
exp é estritamente crescente, deduzimos que tε < tn < t + ε para todo n suficientemente grande.
Como ε é arbitrário, isto implica tn → t. 2
Observação 1.1 A mesma prova acima mostra que, se f é contı́nua e estritamente crescente, então sua
inversa tem as mesmas propriedades.
1.2.3 As funções seno e cosseno
Definimos agora duas novas funções via séries de potência (para t ∈ R).
cos(t) :=
+∞
∑
n=0
(−1)n t
2n
(2n)!
sin(t) :=
+∞
∑
n=1
(−1)n+1 t
2n+1
(2n + 1)!
.
Repare que os termos destas séries são termos da série da exponencial, agora multiplicados
por sinais alternados. Podemos portanto usar uma comparação com a série da exponencial para
provar que as duas séries convergem.
Proposição 1.9 cos(t+ s) = cos(t) cos(s)− sin(t) sin(s) e sin(t+ s) = sin(t) cos(s)+ cos(t) cos(s)
para todos t, s ∈ R.
19
Prova: Provaremos apenas a primeira identidade, já que a segunda é similar.
Usando um argumento parecido com a fórmula da exponencial:
cos(t + s) =
+∞
∑
n=0
(−1)n (t + s)
2n
(2n)!
=
+∞
∑
n=0
(−1)n
(
2n
∑
i=0
ti
i!
s2n−i
(2n− i)!
)
Em cada somatório interno podemos dividir os ı́ndices i entre os da forma 2j (com 0 ≤ j ≤ n) e
os da forma 2k+ 1 (com 0 ≤ k ≤ n− 1). Temos, então
(−1)n
2n
∑
i=0
ti
i!
s2n−i
(2n− i)! =
n
∑
j=0
(−1)j t2j
(2j)!
(−1)n−j s2(n−j)
(2(n− j))!
+
n−1
∑
k=0
(−1)k t2k+1
(2k + 1)!
(−1)n−k s2(n−k)+1
(2n− 2k + 1)! .
Deduzimos que cos(t + s) é igual a:
+∞
∑
n=0
(
n
∑
j=0
(−1)j t2j
(2j)!
(−1)n−js2(n−j)
(2(n− j))! +
n−1
∑
k=0
(−1)k t2k+1
(2k + 1)!
(−1)n−k s2(n−k)+1
(2n− 2k + 1)!
)
.
Usando o Lema 1.1, podemos reconhecer os seguintes termos acima:
∞
∑
n=0
(
n
∑
j=0
(−1)j t2j
(2j)!
(−1)n−js2(n−j)
(2(n− j))!
)
= cos(t) cos(s)
e
∞
∑
n=0
(
n−1
∑
k=0
(−1)k t2k+1
(2k + 1)!
(−1)n−k s2(n−k)−1
(2n− 2k− 1)!
)
= − sin(s) sin(s),
com convergência uniforme em ambos os casos. Como a soma destas séries para cos(t) cos(s) e
− sin(t) sin(s) é a série de cos(t + s), temos a identidade desejada. 2
Proposição 1.10 cos′(t) = − sin(t) e sin′(t) = cos(t).
Prova: Apenas esboçaremos a prova do primeiro fato acima, já que a segunda é similar. Veja que,
dado h 6= 0, podemos utilizar a identidade das somas acima para escrever
cos(t + h)− cos(t)
h
=
(
cos(h)− 1
h
)
cos(t)− sin h
h
sin t.
Seguindo a conta que fizemos para a exponencial, podemos mostrar que sin h/h → 1 (cos h−
1)/h→ 1: basta separar
sin h = h + resto da ordem |h|3 e cos h = 1 + resto da ordem |h|2.
2
20
Proposição 1.11 sin2(t) + cos2(t) = 1 para todo t ∈ R.
Prova: Isto vale se t = 0 por inspeção. Além disso, sin2(t) + cos2(t) é constante:
(sin2(t) + cos2(t))′ = 2 sin(t) sin′(t)− 2 cos(t) cos′(t) = 0.
2
Proposição 1.12 Dados t, s ∈ R (cos t, sin t) = (cos s, sin s), implica cos(t− s) = 1, sin(t− s) = 0.
Prova: Pelas fórmulas para senos e cossenos de t + s
cos t = cos s⇒ cos t = cos s cos(t− s)− sin(t− s) sin s.
sin t = sin s⇒ sin t = sin s cos(t− s) + sin(t− s) cos s.
Escrevendo a := cos t = cos s, b := sin t = sin s, x = cos(t− s), y = sin(t− s), temos que{
a x− b y = a
b x + a y = b
Se a b 6= 0, o sistema acima tem como única solução x = 1, y = 0. Se a = 0, então b 6= 0 (já que
a2 + b2 = 1) e chegamos à mesma conclusão que x = 1, y = 0. O mesmo vale ainda se b = 0 (e
portanto a = 1). 2
Proposição 1.13 Existe um p > 0 tal que cos p = 0 e cos t > 0 para t ∈ [0, p). Temos também sin t = p
e 0 < sin t < 1 para t ∈ [0, p) (No que segue, π := 2p).
Prova: Por um lado, cos 0 = 1. Por outro lado, temos:
cos 2 = 1− 2
2
2!
+
24
4!
− 2
6
6!
+ · · ·+ 2
4n
(4n)!
− 2
4n+2
(4n + 2)!
+ . . . .
Como 1− 222! = 0 e
24n
(4n)! <
24n+2
(4n+2)! para n ≥ 1, temos que cos 2 < 0. Isto é, cos 0 > 0 > cos 2.
O cosseno é diferenciável e portanto contı́nuo; isto nos permite aplicar o Teorema do Valor
Intermediário para provar que existe um x ∈ (0, 2) com cos x = 0. Definimos então
p := inf{x ∈ (0,+∞) : cos x = 0}.
Note que p ≥ 0 está bem definido porque cos x = 0 para ao menos um x e o conjunto de x
considerados é limitado por baixo. Veja ainda que, como p = limn xn para alguma sequência
{xn}n com cos xn = 0, temos cos p = 0 e portanto p > 0. Mais ainda, não pode ser verdade que
cos t = 0 para 0 ≤ t < p e isto quer dizer que cos t não pode trocar de sinal neste intervalo. Ou
seja cos t > 0 para 0 ≤ t < p.
Para terminar, observe que para 0 ≤ t < p, sin t é crescente (já que sua derivada é cos t),
portanto 0 < sin t < 1. Em particular, como sin é contı́nuo, sin p > 0. Como cos p = 0 e portanto
sin2 p = 1, concluı́mos que sin p = 1. 2
21
Proposição 1.14 cos(t + p) = − sin(t) e sin(t + p) = cos t para todo t ∈ R. Portanto, os únicos
pontos onde cos t = 0 ou sin t = 0 são os múltiplos de p.
Prova: A primeira afirmação segue das fórmulas para cos(t + s) e sin(t + s) aplicadas a s := p.
Para a segunda, veja que podemos escrever qualquer t ∈ R na forma t = ±p n + a com
0 ≤ a < p e n ∈ N. Usando indução em n, podemos provar a partir da primeira parte que
cos(±np + a) ∈ {± cos a,± sin a} para qualquer n ∈N. Deduzimos que
cos t = 0⇔ cos a = 0 ou sin a = 0⇔ a ∈ {0, p} (pois a ∈ [0, p)) .
Portanto t = np ou t = (n + 1) p. O mesmo vale se sin t = 0. 2
Proposição 1.15 (cos t, sin t) = (cos s, sin s) se e somente se t− s é múltiplo inteiro de 2π.
Prova: A hipótese equivale a cos(t− s) = 1, sin(t− s) = 0. Pela proposição anterior, é necessário
que t− s = np seja múltiplo de p, com cos(np) = 1. No entanto, é fácil ver usando a proposição
anterior que
cos(0) = 1, cos(±p) = 0, cos(±2p) = −1, cos(±3p) = 0,
cos(±4p) = 1, cos(±5p) = 0, cos(±6p) = −1, cos(±7p) = 0,
cos(±8p) = 1, cos(±9p) = 0, cos(±10p) = −1, cos(±11p) = 0 . . .
Portanto, para qualquer n ∈ Z cos(np) = 1 se e somente se n é divisı́vel por 4. 2
Proposição 1.16 A aplicação “t 7→ (cos t, sin t)” é uma bijeção entre [0, 2π) e o cı́rculo unitário:
S1 := {(x, y) ∈ R2 : x2 + y2 = 1}.
Prova: Como cos2 t + sin2 t = 1, todo t é levado em S1. Além disso, a aplicação é injetiva para
t ∈ [0, 2π) pela proposição anterior.
Para provar a sobrejetividade, fixamos (x, y) ∈ S1 para mostrar que existe um t0 ∈ [0, π/2] e
um m ∈ {0, 1, 2, 3} tal que
Queremos: (x, y) = (cos(t0 + mπ/2), sin(t0 + mπ/2)).
Verificamos que, como cos 0 = 1, cos(π/2) = 0 e cos é contı́nuo, existe um tx ∈ [0, π/2] com
cos tx = |x| e portanto sin tx = |y| (já que y2 = 1− x2 = 1− cos2 t e sin t ≥ 0 para t ∈ [0, π/2]).
Do mesmo modo, há um ty ∈ [0, π/2] com cos ty = |y| e sin ty = |x|. Portanto, temos o seguinte:
1. Se x ≥ 0, y ≥ 0, (x, y) = (cos tx, sin tx).
2. Se x < 0, y ≥ 0, observamos que
(x, y) = (− sin ty, cos ty) = (cos(ty + π/2), sin(ty + π/2)).
3. Se x ≤ 0, y ≤ 0,
(x, y) = (cos(tx + π), sin(tx + π)).
4. Se x > 0, y ≤ 0, observamos que
(x, y) = (sin ty,− cos ty) = (cos(ty + 3π/2), sin(ty + 3π/2)).
Portanto, provamos o que querı́amos em todos os quatro casos. 2
22
1.3 A desigualdade das médias
Encerramos este capı́tulo provando a conhecida desigualdade entre as médias aritmética e geométrica.
Teorema 1.1 (Desigualdade das médias aritmética e geométrica) Sejam α1, . . . , αk números positi-
vos com soma 1. Dados t1, . . . , tk ∈ R+, temos a desigualdade:
k
∏
i=1
tαii ≤
k
∑
i=1
αi ti.
Além disso, vale igualdade se e somente se t1 = t2 = · · · = tk.
Prova: O passo fundamental neste resultado é estabelecer o resultado para k = 2 e depois gene-
ralizá-lo por indução.
Fixemos então k = 2. Para facilitar um pouco a notação, definimos x := tα11 , y = t
α2
2 , p = 1/α1,
q = 1/α2. Veja que x, y ≥ 0, p, q > 1 e (1/p) + (1/q) = 1. Desejamos provar que
Queremos: ∀x, y ≥ 0 : xy ≤ x
p
p
+
yq
q
, com igualdade se e somente se xp = yq.
Isto é trivial quando x = 0, logo vamos supôr x > 0. O que queremos, então, é equivalente a
provar que:
Queremos (de forma equivalente): ∀x ∈ R+\{0} :
sup
y∈R+
(
xy− y
q
q
)
=
xp
p
, atingido só quando yq = xp.
Para provar esta propriedade, fixe x ∈ R+\{0} e defina φx(y) := xy− yq/q, y ∈ R+. Recordando
que q > 1, x > 0, vemos que φx é diferenciável e que
φ′x(y) = x− yq−1

> 0 se y < x
1
q−1 ;
= 0 se y = x
1
q−1 ;
< 0 se y > x
1
q−1 .
Segue que y∗ := x
1
q−1 é o único máximo global da função φx. Note ainda que, como (1/p) +
(1/q) = 1, temos p = q/(q− 1) = 1 + 1/(q− 1), portanto y∗ é o único ponto com yq∗ = xp.
Vamos calcular agora φx(y∗). A conta abaixo usa novamente o fato que p = q/(q − 1) =
1 + 1/(q− 1):
φx(y∗) = x
1+ 1q−1 − x
q
q−1
q
= xp − x
p
q
=
xp
p
.
O que deduzimos então é o seguinte:
1. Como y∗ é máximo global de φx, vale que, para qualquer y ∈ R+,
φx(y) = xy−
yq
q
≤ φx(y∗) =
xp
p
.
2. Além disso, apenas y∗, que satisfaz y
q
∗ = xp, atinge este máximo global.
23
Isto era exatamente o que querı́amos provar e encerra a demonstração para k = 2.
Vejamos agora a prova para k > 2. A ideia é fazer indução forte em k tomando k = 2 como
base. Se k > 2, defina novos expoentes
βi :=
αi
1− αk
i = 1, 2, . . . , k− 1.
Observe que
k
∏
i=1
tαii = T
1−αk tαkk , (1.3)
onde (por hipótese de indução)
T :=
k−1
∏
i=1
tβii ≤ S :=
k−1
∑
i=1
βi ti =
∑k−1i=1 αi ti
1− αk
,
com igualdade se e somente se t1 = · ·· = tk−1 Aplicando o caso k = 2 a (1.3), temos
k
∏
i=1
tαii ≤ (1− αk) T + αk tk ≤ (1− αk) S + αk tk =
k
∑
i=1
αi ti.
Além disso, a igualdade só vale se T = S – e portanto T = t1 = t2 = · · · = tk−1 – e além disso
tk = T. Portanto, para que a igualdade valha, é necessário que t1 = · · · = tk. 2
Exercı́cio 1.3 Sejam 1 < p, q < +∞ com (1/p) + (1/q) = 1. Mostre que para quaisquer x, y ∈ R,
xy ≤ |x|
p
p
+
|y|q
q
com igualdade se e somente valem seguintes condições:
• |x|p = |y|q;
• ou x = y = 0, ou x 6= 0 6= y e os sinais de x e y coincidem.
Exercı́cio 1.4 Sejam 1 < p, q < +∞ com (1/p) + (1/q) = 1. Mostre que para quaisquer x, y ∈ R e
λ > 0,
xy ≤ |x|
p
p λp
+
λq|y|q
q
.
Além disso, se x, y ∈ R+, existe uma escolha de λ tal que
|xy| = |x|
p
p λp
+
λq |y|q
q
.
1.4 Mais um fato útil
24
Capı́tulo 2
Espaços vetoriais e normas
O principal objetivo deste curso é estender a Análise que aprendemos na reta a espaços mais
gerais: os chamados espaços métricos. Antes de defini-los, vamos começar com a classe mais
restrita, mas muito importante, de espaços vetoriais normados. Aqui já veremos alguns dos desafios
de levar a Análise a uma dimensão mais alta.
2.1 Um caso concreto: o espaço Rd
Começamos de forma ainda mais particular pelo espaço vetorial que todo mundo conhece (ou
deveria conhecer): o espaço euclideano real de d dimensões.
Dado d ∈N\{0}, definimos Rd como um produto cartesiano:
Rd := R×R× · · · ×R︸ ︷︷ ︸
d vezes
.
Os elementos x ∈ Rd são d-tuplas de números reais, x = (x[i])di=1. Os números x[1], . . . , x[d] ∈ R
são chamados de coordenadas de x. Esta notação que usamos para as coordenadas é inspirada
pelo MatLab!
É bom especificar logo de cara d + 1 vetores especiais em Rd:
• O vetor nulo 0Rd cujas coordenadas são 0Rd [i] = 0, i = 1, . . . , d.
• Os vetores ej, 1 ≤ j ≤ d, da base canônica de Rd cujas coordenadas são
ej[i] =
{
1, i = j;
0, i 6= j; 1 ≤ i, j ≤ d.
2.1.1 Operações em Rd e suas propriedades
Há duas operações fundamentais em Rd:
1. Soma (e diferença): dados x, y ∈ Rd, x± y ∈ Rd é o vetor cujas coordenadas são (x± y)[i] =
x[i]± y[i], 1 ≤ i ≤ d.
2. Multiplicação por escalar: dados x ∈ Rd e λ ∈ R λ x ∈ Rd é o vetor cujas coordenadas são
(λ x)[i] = λ x[i], 1 ≤ i ≤ d.
25
Não é difı́cil verificar as seguintes propriedades:
• 0 é o elemento neutro da soma: para todos x, y ∈ Rd, x + y = x se e somente se y = 0.
• 0 x = 0 para todo x ∈ Rd.
• 1 é o elemento neutro da multiplicação por escalar: para todos x ∈ Rd, λ ∈ R, λ x = x se e
somente se x = 0 e/ou λ = 1.
• As operações são todas associativas. A soma é comutativa também.
• A multiplicação por escalar é distributiva das duas maneiras pssı́veis: se λ, η ∈ R, x, y ∈ Rd:
(λ + η) x = λ x + η x e λ (x + y) = λ x + λ y.
Exercı́cio 2.1 Prove que:
∀x ∈ Rd : x =
d
∑
i=1
x[i] ei.
2.1.2 Produto interno e a norma euclideana em Rd
Grosso modo, uma norma em Rd é uma maneira de medir a distância desde 0 até os demais
pontos de Rd. Desta forma, os axiomas a seguir são naturais.
Definição 2.1 Uma norma sobre Rd é uma função ‖ · ‖ : Rd → R com as seguintes propriedades:
• A norma é positiva definida, isto é, para todo x ∈ Rd, ‖x‖ ≥ 0, e ‖x‖ = 0 se e somente se x = 0.
• A norma é homogênea positiva, isto é, para quaisquer λ ∈ R, x ∈ Rd, ‖λ x‖ = |λ| ‖x‖.
• A norma é sub-aditiva, isto é, para quaisquer x, y ∈ Rd, ‖x + y‖ ≤ ‖x‖+ ‖y‖.
Como podemos definir uma norma em Rd? Quase todos já sabemos que a norma euclideana
serve:
|x|2 :=
√√√√ d∑
i=1
(x[i])2 (x ∈ Rd).
Essa é a noção de “tamanho de um vetor” que aprendemos desde cedo nos cursos de Álgebra
Linear ou Geometria Analı́tica. A pergunta, no entanto, é a seguinte: como podemos provar que
esta norma euclideana é mesmo uma norma?
Provar que a norma é positiva definida é simples. Primeiro, observamos que |x|2 é bem
definida porque |x|22 é uma soma de termos (x[i])2 não-negativos; logo, a raı́z quadrada desta
quantidade é bem-definida e não-negativa. Além disso, |x|2 se anula se e somente se esta soma
de termos não negativos se anula, o que só pode ocorrer se cada termo é nulo: x[i]2 = 0 para cada
1 ≤ i ≤ d, ou seja, x = 0Rd .
Agora argumentamos a homogeneidade positiva: tomando x ∈ Rd e λ ∈ R, queremos de-
monstrar que |λx|2 = |λ| |x|2. Para isso, para cada i = 1, 2, . . . , d, a i-ésima coordenada de λx é
λx[i]. Como o quadrado de um produto é o produto dos quadrados, temos:
|λx|22 =
d
∑
i=1
(λx[i])2 = λ2
d
∑
i=1
x[i]2 = λ2 |x|22.
26
Lembramos agora que a raı́z quadrada de λ2 é |λ| (por definição). Como a raı́z de um produto é
o produto das raı́zes, obtemos |λx|2 = |λ||x|2, como querı́amos demonstrar.
Como último passo, precisamos provar que a norma euclideana é subaditiva. Em geral esta
é a parte mais difı́cil de se provar que uma candidata a norma é mesmo norma. No caso que
estamos analisando, faremos isso a partir das propriedades do produto interno que quase todos
conhecem. Dados x, y ∈ Rd, definimos:
x · y :=
d
∑
i=1
x[i] y[i] ∈ R.
A relação entre norma euclideana e produto interno é que |x|22 = x · x. Nossa prova da subaditi-
vidade da norma será baseada nas propriedades do produto interno listadas a seguir.
Lema 2.1 (Propriedades básicas do produto interno) Dados x, x′ ∈ Rd:
1. Positividade: x · x ≥ 0, com igualdade se e somente se x = 0.
2. Simetria: x · x′ = x′ · x.
3. Linearidade: se λ ∈ R, a, b ∈ Rd e x = λa + b, então x′ · x = x · x′ = λ (a · x′) + (b · x′).
Prova: A primeira propriedade é exatamente a mesma coisa que dizer que a norma euclideana é
positiva definida, o que já provamos acima.
A propriedade 2 é consequência do fato que x[i] x′[i] = x′[i] x[i] para cada coordenada i ∈
{1, . . . , d}, de modo que
x · y =
d
∑
i=1
x[i] x′[i] =
d
∑
i=1
y[i] x[i] = x′ · x.
A propriedade 3 vem do fato que, por definição das operações de Rd
x = λa + b⇒ x[i] = λa[i] + b[i]
de modo que, pelas distributividade e associatividade de R,
x · x′ =
d
∑
i=1
x[i] x′[i] =
d
∑
i=1
(λ a[i] + b[i]) x′[i]
= λ
d
∑
i=1
a[i] x′[i] +
d
∑
i=1
b[i] x′[i]
= λ (a · x′) + (b · x′).
2
A subaditividade vai precisar de um passo a mais, derivado do último lema: a desigualdade
de Cauchy-Schwartz.
Teorema 2.1 (Desigualdade de Cauchy Schwartz) Para quaisquer x, y ∈ Rd, vale |x · y|2 ≤ |x|2 |y|2.
A igualdade vale exatamente quando x = 0Rd ou y = 0Rr ou y/|y|2 = x/|x|2.
27
Prova: O teorema é trivialmente verdadeiro se x = 0Rd ou y = 0Rd . Podemos então supôr que
nenhum dos dois vetores se anula. Neste caso, podemos considerar v := x/|x|2 e w := y/|y|2,
notando que estes vetores têm norma 1. Pela linearidade do produto interno,
x · y ≤ |x|2 |y|2 ⇔ v · w ≤ 1.
Provaremos a seguir que v · w ≤ 1 com igualdade se e somente se v = w, o que claramente
implica o teorema.
Para provar que |v · w| ≤ 1, escrevemos:
v · w =
d
∑
i=1
v[i]w[i]
≤
d
∑
i=1
|v[i]w[i]| (2.1)
(média geo. ≤ aritmética p/ cada termo) ≤
d
∑
i=1
|v[i]|2 + |w[i]|2
2
(2.2)
(|v|2 = |w|2 = 1) = 1.
Como podemos ter igualdade acima? Em primeiro lugar, (2.1) deve ser uma igualdade, o que
acontece se e somente se todos os termos da soma forem maiores ou iguais a zero. Ou seja,
queremos que v[i] e w[i] tenham o mesmo sinal para cada ı́ndice i. Em segundo lugar, precisamos
de igualdade na aplicação da desigualdade das médias em (2.2), o que só ocorre quando |v[i]|2 =
|w[i]|2 – ou seja, v[i] = ±w[i] – para cada i. Deduzimos que v · w = 1 se e somente se v = w, o
que ocorre se e somente se y = |y|2x/|x|2. 2
Terminamos a seção usando Cauchy-Schwartz para provar que a norma é sub-aditiva.
Teorema 2.2 Vale a identidade:
∀x ∈ Rd : |x|2 = max{x · z : z ∈ Rd, |z|2 = 1}
Em particular, a norma euclideana é subaditiva (e portanto é mesmo uma norma).
Prova: A igualdade vem de Cauchy-Schwartz. Temos x · z ≤ |x|2 para todo z de norma 1, com
igualdade se e somente se x = 0Rd ou z = x/|x|2.
Para a subaditividade, tome x e y em Rd. Dado qualquer z ∈ Rdde norma 1,
z · (x + y) = z · x + z · y ≤ |x|2 + |y|2 (por Cauchy-Schwartz aplicada a z.x e z.y).
Portanto,
|x + y|2 = max{z · (x + y) : z ∈ Rd, |z|2 = 1} ≤ |x|2 + |y|2.
2
Observação 2.1 Um caminho ainda mais simples para provar a subaditividade é observar que, pela bili-
nearidade do produto interno e Cauchy-Schwartz
|x + y|22 = |x|22 + |y|22 + 2 x.y ≤ |x|22 + |y|22 + 2 |x|2|y|2 = (|x|2 + |y|2)2.
Como a raı́z quadrada é uma função monótona, obtemos |x + y|2 ≤ |x|2 + |y|2. No entanto, a ideia contida
no Teorema 2.2 de expressar a norma como máximo se aplica de forma ainda mais geral; veja os Exemplos
2.3 e 2.4 e o Exercı́cio 2.16.
28
2.2 Definições gerais
2.2.1 O que é um espaço vetorial?
Acima vimos (ou recordamos a teoria básica do espaço Rd com sua norma mais básica e suas
operações. Veremos ao longo do curso muitos outros espaços com estrutura semelhante.
Definição 2.2 (Espaço vetorial) Chamamos de espaço vetorial sobre R um conjunto V 6= ∅ com
operações de soma
(v, w) ∈ V2 7→ v + w ∈ V
e multiplicação por escalar
(λ, v) ∈ R×V 7→ λ v ∈ V,
além de um elemento distinguido 0 ∈ V, definidos de modo a satisfazer os axiomas a seguir:
1. Comutatividade e associatividade da soma: v + w = w + v e (v + w) + z = v + (w + z) para
todos v, w, z ∈ V.
2. Associatividade do produto: para quaisquer λ, η ∈ R, v ∈ V, λ(ηv) = (λη) v.
3. Distributividade: para todos v, w ∈ V, λ, ξ ∈ R, (λ + ξ) (v + w) = λv + λw + ξv + ξw.
4. Elemento neutro: 0 + v = v para todo v ∈ V.
5. Multiplicação por 1 e 0: 1.v = v e 0.v = 0 para todo v ∈ V.
O espaço Rd discutido acima é um espaço vetorial segundo esta definição. Note que d = 1 é
uma escolha válida, ou seja: com as operações usuais, R é um espaço vetorial sobre R!
Veremos agora mais dois exemplos.
Exemplo 2.1 (Matrizes `× d) Sejam agora `, d ∈ N\{0}. Considere o conjunto R`×d de todas as
matrizes com ` linhas, d colunas e entradas reais.
Um elemento A deste espaço tem a seguinte “cara”.
` linhas


A[1, 1] A[1, 2] . . . A[1, d]
A[2, 1] A[2, 2] . . . A[2, d]
. . . . . .
A[`, 1] A[`, 2] . . . A[`, d]

︸ ︷︷ ︸
d colunas
.
Ou seja, as entradas (ou “coordenadas”) de uma matriz `× d são chamadas de A[i, j], com
1 ≤ i ≤ ` e 1 ≤ j ≤ d. Podemos definir a soma e subtração de matrizes, além do produto
de uma matriz por escalar, fazendo tudo entrada a entrada. Como no caso de Rd, a estrutura
resultante nos dá um espaço vetorial. Isso não chega a ser uma surpresa porque, afinal, uma
matriz ` × d pode ser reescrita como um vetor de ` d números reais. No entanto, o fato que
matrizes representam transformações lineares sugere maneiras diferentes de se medir os elementos
de R`×d.
O exemplo a seguir é um tanto quanto diferente.
29
Exemplo 2.2 (Funções contı́nuas) Dado um subconjunto I ⊂ R, I 6= ∅, considere o conjunto
C(I, R) := { f : I → R : f contı́nua}.
Este espaço tem uma estrutura natural de espaço vetorial. O elemento 0 é a função que se anula
em todo ponto. A soma é exatamente a soma usual de funções, o que “funciona” porque a soma
de funções contı́nuas é contı́nua. O produto por escalar consiste em tomar a função f e o escalar
λ e definir uma nova função λ f que leva t ∈ I em λ f (t). É um exercı́cio mostrar que estas
operações realmente satisfazem todos axiomas de espaço vetorial.
Observação 2.2 (Vetores são funções e vice-versa) O espaço de funções tem uma certa relação de ana-
logia o Rd. Numa direção, podemos conceber cada vetor x ∈ Rd como uma representação de uma função
de x : {1, . . . , d} → R associando cada 1 ≤ i ≤ d um valor x[i]. Na outra direção, podemos pensar numa
função f : I → R como um ”vetor” cujas coordenadas f (t) são indexadas pelos elementos t ∈ I. Isso nos
mostra que pensar em C(I, R) como espaço vetorial, além de ser formalmente correto, tem um significado
intuitivo também. Manter isso em mente pode ajudar a compreender várias provas abaixo.
2.2.2 Subespaços de espaços vetoriais
Ocasionalmente, será importante olharmos para subespaços de espaços vetoriais.
Definição 2.3 (Subespaço vetorial) Chamamos um subconjunto W ⊂ V, W 6= ∅ de subespaço veto-
rial de V se ele é fechado pelas operações de soma e multiplicação por escalar. Ou seja:
∀w, w′ ∈W, ∀λ ∈ R : λ w + w′ ∈W.
Por exemplo, dado qualquer a ∈ Rd, o conjunto
Ha := {x ∈ Rd : a · x = 0}
é um subespaço de Rd; isto segue da linearidade do produto interno.
Exercı́cio 2.2 O conjunto das matrizes d× d simétricas – isto é, as A ∈ Rd×d com A[i, j] = A[j, i] para
cada par 1 ≤ i, j ≤ d – é um subespaço de Rd×d
Exercı́cio 2.3 Dado J ⊂ R, o conjunto C(I, J) de funções contı́nuas de I em J é um subconjunto de
C(I, R). Para que escolhas de J este conjunto é um subespaço vetorial de C(I, R)?
Exercı́cio 2.4 Dados t ∈ I e ξ ∈ R, o conjunto W de funções contı́nuas de I em R com f (t) = ξ é um
subconjunto de C(I, R). Para que escolhas de ξ este conjunto é um subespaço vetorial de C(I, R)?
2.2.3 Normas
Para fazermos Análise, vamos precisar medir distâncias em espaços vetoriais. Isto nos leva à
definição de norma, que é exatamente aquela que usamos em Rd.
Definição 2.4 Uma norma sobre um espaço vetorial real V é uma função ‖ · ‖ : V → R com as seguintes
propriedades:
30
• A norma é positiva definida, isto é, para todo x ∈ V, ‖x‖ ≥ 0, e ‖x‖ = 0 se e somente se x = 0.
• A norma é homogênea positiva, isto é, para quaisquer λ ∈ R, x ∈ V, ‖λ x‖ = |λ| ‖x‖.
• A norma é sub-aditiva, isto é, para quaisquer x, y ∈ V, ‖x + y‖ ≤ ‖x‖+ ‖y‖.
Em geral há alguma dificuldade de provar que uma candidata a norma é mesmo norma,
especialmente porque a subaditividade pode ser difı́cil de checar. Por exemplo, foi assim no
caso da norma euclideana em Rd, que abordamos acima. Veremos abaixo alguns exemplos que
requerem estratégias variadas.
Normas envolvendo máximos e supremos
Na nossa prova de que | · |2 é norma para Rd, usamos fortemente que |x|2 é o supremo de x.z
sobre vetores unitários z ∈ Rd. Outros casos de normas baseadas em supremos ou máximos são
apresentados abaixo.
Exemplo 2.3 Uma outra maneira de definir uma norma em Rd é tomando-se a norma do máximo, ou `∞.
|x|∞ := max
1≤i≤d
|x[i]| (x ∈ Rd).
Vejamos que esta é mesmo uma norma. Em primeiro lugar, ela é bem definida porque o
máximo de um conjunto finito sempre é bem definido. Ela é positiva-definida porque é sempre
não-negativa (o módulo de cada x[i] é não-negativo) e vale 0 se e somente todas as coordenadas
de x se anulam (afinal, |x[i]| ≤ |x|∞ para cada i). Também não é difı́cil ver que ela é homogênea
positiva, usando que |λx[i]| = |λ| |x[i]| para cada i = 1, . . . , d.
A subaditividade também não é difı́cil de se mostrar neste caso. Tome x, x′ ∈ Rd. Para cada
coordenada i =, . . . , d, podemos usar a sub-aditividade do valor absoluto (sobre os reais) e a
definição de | · |∞ e deduzir:
|(x + x′)[i]| ≤ |x[i]|+ |x′[i]|.
Como o valor absoluto de cada uma das coordenadas pode ser cotado por cima pelo máximo
dos valores absolutos, chegamos à seguinte desigualdade:
|x[i]|+ |x′[i]| ≤ max
1≤j≤d
|x[j]|+ max
1≤j≤d
|x′[j]| = |x|∞ + |x′|∞.
Concluı́mos todas as coordenadas satisfazem |(x + x′)[i]| ≤ |x|∞ + |x′|∞. Tomando o máximo
sobre i, deduzimos que |x + x′|∞ ≤ |x|∞ + |x′|∞, como querı́amos demonstrar.
O exemplo a seguir é só um pouco diferente.
Exemplo 2.4 Tome I ⊂ R compacto e escreva C := C(I, R). Para f ∈ C, definimos:
‖ f ‖I,∞ = sup
t∈R
| f (t)|.
Às vezes, quando o I estiver subentendido, ele será omitido da notação e escreveremos ‖ f ‖∞.
31
A razão pela qual ‖ f ‖I,∞ é bem definida é que toda função contı́nua sobre um compacto é
limitada, como já sabemos de Análise na Reta.
Vejamos por que ‖ · ‖∞ é mesmo norma. As demonstrações de que a norma é positiva-
definida e homogênia positiva ficam como exercı́cio. A prova da subaditividade não é difı́cil.
Sejam f , g ∈ C dadas. Observem que, pela subaditividadedo módulo sobre a reta,
∀t ∈ I : |( f + g)(t)| = | f (t) + g(t)| ≤ | f (t)|+ |g(t)|.
Sabermos ainda que | f (t)| ≤ sups∈I | f (s)| = ‖ f ‖∞ e |g(t)| ≤ sups∈I |g(s)| = ‖g‖∞, portanto
| f (t) + g(t)| ≤ ‖ f ‖∞ + ‖g‖∞ para cada t ∈ I. Assim, ‖ f ‖∞ + ‖g‖∞ é cota superior para os
valores de | f (t)| para t ∈ I. Como o supremo é a menor cota superior, deduzimos que:
‖ f + g‖∞ ≤ ‖ f ‖∞ + ‖g‖∞,
como querı́amos demonstrar.
Observação 2.3 (Vetores são funções e vice-versa) Comparando os dois últimos exemplos, vemos cla-
ramente como pode ser útil a analogia feita na Observação 2.2 entre vetores de Rd e funções. As duas provas
acima são essencialmente idênticas!
Normas `p: um argumento via convexidade
A estratégia de máximos nem sempre é fácil de se implementar, mas outros argumentos podem
funcionar. Vejamos um exemplo aqui.
Exemplo 2.5 Fixe um expoente 1 ≤ p < +∞. A norma `p sobre Rd é definida por:
|x|p :=
(
d
∑
i=1
|x[i]|p
) 1
p
(x ∈ Rd).
Há algumas razões pelas quais pode-se querer definir esta famı́lia geral de normas. Uma
delas é que normas codificam esparsidade aproximada. Isto é, um vetor de norma `p pequena tem
poucas coordenadas grandes e este efeito se acentua quando p é maior (veja o exercı́cio 2.13
abaixo).
Temos como missão provar que o Exemplo 2.5 de fato define uma norma. Para começar,
note que a candidata a norma é bem definida e que o caso p = 2 é precisamente o da norma
euclideana. A questão é se temos uma norma para um 1 ≤ p < +∞ arbitrário. Para responder
isso, precisamos checar que | · |p satisfaz os três axiomas de norma.
A prova de que | · |p é positiva-definida e homogênea positiva fica como um exercı́cio não
muito difı́cil para o leitor. A subaditividade pode ser provada de duas maneiras. No exercı́cio
2.16 abaixo, mostramos que | · |p é um supremo de produtos internos, o que nos permite usar a
estratégia do caso p = 2. Aqui apresentamos uma outra estratégia de prova, que se baseia na
ideia de convexidade.
A função “x 7→ xp” é crescente. Além disso, ela é convexa, isto é:
∀λ ∈ [0, 1] ∀t, s ≥ 0 : (λ t + (1− λ)s)p ≤ λ sp + (1− λ) sp. (2.3)
32
(Isto é consequência do fato que a a função é contı́nua e sua derivada segunda é positiva em todo
o ponto x > 0.)
Agora considere x, z ∈ Rd; queremos provar que |x+ z|p ≤ |x|p + |z|p. Se um dos dois vetores
se anula, esta desigualdade vale por inspeção. Portanto, suporemos a seguir que tanto x quanto
z não são nulos. Neste caso, podemos observar que, para cada coordenada i,
|(x + z)[i]|
|x|p + |z|p
=
|x[i] + z[i]|
|x|p + |z|p
≤ |x[i]|+ |z[i]||x|p + |z|p
= λ
|x[i]|
|x|p
+ (1− λ) |z[i]||z|p
,
onde
λ :=
|x|p
|x|p + |z|p
∈ [0, 1].
Usando que “x 7→ xp” é crescente e convexa, deduzimos:(
|(x + z)[i]|
|x|p + |z|p
)p
≤
(
λ
|x[i]|
|x|p
+ (1− λ) |z[i]||z|p
)p
≤ λ
(
|x[i]|
|x|p
)p
+ (1− λ)
(
|z[i]|
|z|p
)p
.
Isso vale para todo 1 ≤ i ≤ d. Somando sobre as coordenadas, obtemos:
d
∑
i=1
(
|(x + z)[i]|
|x|p + |z|p
)p
≤ λ
d
∑
i=1
(
|x[i]|
|x|p
)p
+ (1− λ)
d
∑
i=1
(
|z[i]|
|z|p
)p
.
Ou seja: ( |x + z|p
|x|p + |z|p
)p
≤ λ
|x|pp
|x|pp
+ (1− λ)
|z|pp
|z|pp
= 1.
Como a função “t ≥ 0 7→ t1/p” também é crescente, deduzimos que
|x + z|p
|x|p + |z|p
≤ 1,
como querı́amos demonstrar.
Exercı́cio 2.5 (Condições de igualdade para a subaditividade) Quando p > 1, a convexidade de
“x ≥ 0 7→ xp” é estrita: a derivada segunda desta função é positiva para todo x > 0. Uma consequência
disso é que desigualdade (2.3) é estrita sempre que t 6= s e 0 < λ < 1. Use este fato para mostrar que:
∀1 < p < +∞ ∀x, z ∈ Rd : |x + z|p = |x|p + |z|p ⇔ x = 0Rd , z = 0Rd ou
x
|x|p
=
z
|z|p
.
Ou seja, a norma só é aditiva quando um dos vetores se anula ou os dois têm as mesmas direção e sentido.
Esta propriedade não vale para quando d > 1 e p = 1, já que (por exemplo) |e1 + e2|1 = |e1|1 + |e2|1.
Normas baseadas em outras normas
O último exemplo que vemos de norma é fundamental para várias aplicações de Álgebra Linear.
Ela é uma norma “derivada” de outras “normas-base” e suas propriedades serão deduzidas das
normas base.
33
Exemplo 2.6 (Norma de operador em R`×d) Recorde do seu curso de Álgebra Linear que há uma
relação direta entre matrizes A ∈ R`×d e transformações lineares A : Rd → R` (usamos A duas ve-
zes por abuso de notação). De fato, dado x ∈ Rd, Ax ∈ R` é o vetor de coordenadas:
(Ax)[i] :=
d
∑
j=1
A[i, j] x[j], 1 ≤ i ≤ `.
A chamada norma de operador p2 → p1 sobre R`×d é definida da seguinte forma. Fixe expoentes
p2, p1 ∈ [1,+∞]. Definimos
‖A‖p2→p1 := sup
v∈Rd\{0}
|Av|p1
|v|p2
.
Normas como esta são muito importantes em Álgebra Linear Numérica. Um problema im-
portante é saber como diversos problemas envolvendo a matriz A se portam quando a matriz é
ligeiramente perturbada. Na maioria dos casos, tanto a formulação quanto a solução deste tipo
de problema tem a ver com normas de matrizes. O Exercı́cio 2.12 traz um exemplo disso.
Como podemos provar que ‖A‖p2→p1 é norma? Observe em primeiro lugar que, por lineari-
dade e homogeneidade positiva da norma,
|Av|p1
|v|p2
=
∣∣∣∣A v|v|p2
∣∣∣∣
p1
e v/|v|p2 tem norma 1. Portanto, podemos trocar o supremo na definição da norma de operador
por
‖A‖p2→p1 = sup
v∈Rd : |v|p2=1
|Av|p1 . (2.4)
Isso facilita um pouco a prova das propriedades de norma, que veremos a seguir.
Primeiramente, temos de mostrar que a norma é uma função bem-definida de R`×d em R.
Como o supremo é sempre unicamente definido como elemento de R ∪ {+∞}, o que nos resta
fazer é mostrar que o supremo na definição da (candidata a) norma é finito. Para isso, usaremos
a segunda fórmula, apresentada em (2.4) e algumas estimativas bastante “cruas”, mas válidas.
Veja que, em primeiro lugar, se v ∈ Rd tem norma |v|p2 = 1, todas as suas coordenadas estão
limitadas por 1 em valor absoluto. Desta forma, quando calculamos Av, cada coordenada do
vetor satisfaz:
|(Av)[i]| =
∣∣∣∣∣ d∑j=1 A[i, j]v[j]
∣∣∣∣∣ ≤ d∑j=1 |A[i, j]| |v[j]| ≤
d
∑
j=1
|A[i, j]| ≤ d M,
onde M := max1≤i≤`,1≤j≤d |A[i, j]| < +∞ (note que utilizamos a subaditividade da função
módulo sobre R!). Portanto, quando |v|p2 = 1, as coordenadas de Av são uniformememente
limitadas por dM, quantidade que não depende de v. Concluı́mos que:
∀v ∈ Rd : |v|p2 = 1⇒ |Av|
p1
p1 ≤ d
1+p1 Mp1 < +∞,
ou seja, |Av|p1 é limitada sobre os vetores de norma 1. Isto quer dizer que o supremo em (2.4) é
finito, como querı́amos demonstrar.
34
O próximo passo é mostrar que ‖ · ‖p2→p1 é positiva-definida. Como a norma é um supremo
de números não-negativos, ela certamente é não-negativa. Claramente a matriz 0R`×d tem norma
zero. Por outro lado, se ‖A‖p2→p1 = 0, isto quer dizer que, dado qualquer v ∈ Rd, |Av|p1 ≤ 0.
Como | · |p1 é positive definida, isso quer dizer que Av = 0R` para qualquer v ∈ Rd. Em
particular, se tomamos v = ei para cada um dos vetores da base canônica (com 1 ≤ i ≤ `), Aei é
o vetor cujas coordenadas são A[i, j]; logo, estas são a fortiori nulas. Concluı́mos: a hipótese de
que ‖A‖p2→p1 = 0 implica que A é a matriz nula.
A seguir, provamos que a norma é homogênea positiva. Para isso, usaremos o fato que | · |p1
tem esta propriedade e que, dados A ∈ R`×d e λ ∈ R,
∀v ∈ Rd : (λA)v = λ(Av).
De fato, isto é consequência da definição das operações envolvidas e nos permite concluir:
∀v ∈ Rd : |(λA)v|p1 = |λ(Av)|p1 = |λ| |Av|p1 .
Quando multiplicamos todos os elementos de um conjunto por |λ|, seu supremo é multiplicado
pelo mesmo valor. Desta forma,
‖λA‖p2→p1 = sup
v∈Rd, |v|p2=1
|(λA)v|p1
= sup
v∈Rd, |v|p2=1
|λ| |Av|p1
= |λ| sup
v∈Rd, |v|p2=1
|Av|p1
= |λ| ‖A‖p2→p1 .
Por fim, provaremos que a norma sobre matrizes é subaditiva. Se tomamos A, B ∈ R`×d e
v ∈ Rd, vemos que (A + B)v = Av + Bv por virtude das definições envolvidas. Portanto, para
qualquer vetor v ∈ Rd de norma 1,
|(A + B)v|p1 ≤ |Av|p1 + |Bv|p1 ≤ ‖A‖p2→p1 + ‖B‖p2→p1 .
Como a desigualdade vale para todo v de norma 1, o supremo do lado esquerdoé cotado pelo
lado direito, e obtemos:
‖A + B‖p2→p1 ≤ ‖A‖p2→p1 + ‖B‖p2→p1 .
Esta é a propriedade de subaditividade que querı́amos demonstrar.
2.3 Mais exercicios
Exercı́cio 2.6 Dado I ⊂ R compacto, considere o conjunto de todas as funções polinomiais de I
a R. Prove que este é um subespaço vetorial de C(I, R).
Exercı́cio 2.7 (Funções limitadas) Dado um conjunto qualquer I 6= ∅, chame de B(I, R) o con-
junto de todas as funções limitadas de I a R. Prove que este conjunto tem uma estrutura natural
de espaço vetorial e que a expressão
‖ f ‖∞ := sup
t∈I
| f (t)| ( f ∈ B(I, R))
35
define uma norma sobre B(I, R). Mostre ainda que, quando I ⊂ R é compacto, o espaço C(I, R)
definido acima é um subespaço de B(I, R).
Exercı́cio 2.8 (Submultiplicatividade da norma ‖ · ‖∞) Seguindo com a notação do exercı́cio an-
terior, mostre que o produto f g de dois elementos B(I, R) é um outro elemento de B(I, R) e que
‖ f g‖∞ ≤ ‖ f ‖∞ ‖g‖∞. Observe que o mesmo resultado vale para C(I, R).
Exercı́cio 2.9 (Submultiplicatividade da norma de operador) Considere matrizes A1 ∈ Rd1×d2 e
A2Rd2×d3 . Lembre-se que o produto de A1 e A2 é o elemento A1A2 ∈ Rd1×d3 com entradas
(A1A2)[i, j] :=
d2
∑
k=1
A1[i, k]A2[k, j] (1 ≤ i ≤ d1, 1 ≤ j ≤ d3).
Este produto é definido de modo que
∀v ∈ Rd1 : (A1A2) v = A1 (A2v).
Agora bote em cada Rdi uma norma `pi . Mostre que
‖A1A2‖p1→p3 ≤ ‖A1‖p2→p3 ‖A2‖p1→p2 .
Exercı́cio 2.10 Dada uma matriz A ∈ R`×d, sua transposta, denotada por AT, é a matriz em Rd×`
cujas entradas são definidas da seguinte forma:
AT[i, j] := A[j, i] (1 ≤ i ≤ d, 1 ≤ j ≤ `).
1. Prove que y.(Ax) = (ATy).x para quaisquer A ∈ R`×d, x ∈ Rd e y ∈ R`.
2. Mostre que ‖AT‖2→2 = ‖A‖2→2 para qualquer A ∈ R`×d.
Exercı́cio 2.11 Como já observado, podemos associar de modo natural o espaço de matrizes R`×d
com o espaço euclideano R` d. Isto nos permite definir uma norma correspondente à norma | · |2
sobre R`×d, que às vezes é chamada de norma de Frobenius:
‖A‖F :=
√√√√ `∑
i=1
d
∑
j=1
|A[i, j]|2 (A ∈ R`×d).
Outra norma natural é a versão da norma `∞ em R`×d: a magnitude da maior entrada.
‖A‖M := max
1≤i≤`
1≤j≤d
|A[i, j]| (A ∈ R`×d).
1. Mostre que ‖ · ‖M = ‖ · ‖1→∞.
2. Prove que as duas normas acima “sanduı́cham” a norma de operador ‖ · ‖2→2.
∀A ∈ R`×d : ‖A‖M ≤ ‖A‖2→2 ≤ ‖A‖F.
36
Exercı́cio 2.12 Chamamos de Id×d a matriz idendidade d× d, que tem 1 na diagonal e zeros em
todas as outras entradas. Uma matriz A ∈ Rd×d é dita inversı́vel se existe uma outra matriz
A−1 ∈ Rd×d tal que A A−1 = A−1 A = Id×d. Em cursos de Álgebra Linear, aprendemos que a
inversa existe e é única se e somente se o determinante de A não se anula.
Fixos dois expoentes p1, p2 ∈ [1,+∞], definimos:
σ−p1→p2(A) := infv∈Rd\{0
Rd}
|Av|p2 /|v|p1 .
1. Mostre que, se A é inversı́vel,
|A−1|p2→p1 =
1
σ−p1→p2(A)
; em particular, quando A é inversı́vel, σ−p1→p2(A) > 0.
2. Sabemos da Álgebra Linear que uma matriz quadrada é inversı́vel se e somente se o único
vetor v com Av = 0Rd é o vetor v = 0Rd . Use este fato para provar que uma A ∈ Rd×d é
inversı́vel se e somente se σ−p1→p2(A) > 0.
3. Prove que qualquer matriz B ∈ Rd×d com |A− B|p1→p2 < σ−p1→p2(A) é inversı́vel.
Observação: a quantidade
κ(A) := |A−1|2→2 |A|2→2
é chamada de número de condição da matriz A. Segue do primeiro item deste exercı́cio que ele é sempre
≥ 1. Quando o número de condição é muito grande, isto significa que o problema de se resolver um
sistema “Ax = b” é instável: pequenas alterações em b ou na matriz A podem levar a grandes mudanças
na solução. Por outro lado, o terceiro item acima implica que o número de condição não muda muito sob
pequenas perturbações de A. Mais informações sobre o número de condição estão disponı́veis no artigo
https: // en. wikipedia. org/ wiki/ Condition_ number .
Exercı́cio 2.13 Definimos acima as normas `p para 1 ≤ p ≤ +∞. No entanto, a função que leva
x ∈ Rd em |x|p também está bem definida quando 0 < p < 1.
1. Prove que | · |p para 0 < p < 1 não é subaditiva e portanto não é norma (dica: isso tem a ver
com concavidade estrita da função “t ≥ 0 7→ tp”).
2. Prove que, para qualquer x ∈ Rd, |x|0 := limp→0+ |x|
p
p é o número de coordenadas diferen-
tes de 0 de x.
3. Prove ainda que, dados quaisquer x ∈ Rd, t > 0 e p > 0,
#{1 ≤ i ≤ d : |x[i]| ≥ t} ≤
|x|pp
tp
.
Deste modo ter “norma `p pequena” quer dizer que poucas coordenadas são grandes.
Exercı́cio 2.14 Dados a ∈ Rd\{0} e ξ ∈ R, quando é verdade que o conjunto abaixo é um subespaço de
Rd?
Ha,ξ := {x ∈ Rd : a · x = ξ}.
37
https://en.wikipedia.org/wiki/Condition_number
Exercı́cio 2.15 Prove que, para qualquer x ∈ Rd e 1 ≤ p < +∞,
|x|∞ ≤ |x|p ≤ d1/p |x|∞ ≤ d1/p |x|2.
Deduza que |x|∞ = limp→+∞ |x|p para todo x ∈ Rd.
Exercı́cio 2.16 Apresentamos aqui uma forma alternativa de provar que as normas `p apresentadas no
Exemplo 2.5 são de fato normas. Como lá, definimos o expoente dual de p como q := p/(p− 1) quando
1 < p < +∞. Se p ∈ {1,+∞}, definimos q via um limite: portanto q = 1 se p = ∞ e q = ∞ se p = 1.
1. Nos próximos itens, mostraremos a relação de dualidade entre as normas `p e `q
Dualidade: ∀x ∈ Rd ∀p ∈ [1,+∞] : |x|p = sup{v · x : v ∈ Rd, |v|q = 1}.
Explique porque esta relação implica que a norma `p é de fato uma norma (ou seja, satisfaz os três
axiomas da definição).
2. Prove dualidade diretamente para p ∈ {1, ∞}.
3. A partir daqui supomos p ∈ (1,+∞). Mostre que a desigualdade entre as médias aritmética e
geométrica implica que
∀a, b ∈ R : ab ≤ |a|
p
p
+
|b|q
q
,
com igualdade se e somente se a, b têm o mesmo sinal e |a|p = |b|q.
4. Deduza do primeiro item que
∀x, y ∈ Rd\{0} : x · y|x|p |y|q
≤ 1
e obtenha a Desigualdade de Hölder x.y ≤ |x|p |y|q.
5. Cheque as condições de igualdade no item anterior para terminar a prova da dualidade. Mostre ainda
que, se x 6= 0Rd , o supremo na fórmula de dualidade só é atingido por um único vetor v.
Exercı́cio 2.17 Retorne ao exercı́cio 2.10 e use o resultado do exercı́cio 2.16 para mostrar que
‖AT‖p2→p1 = ‖A‖p1→p2 para quaisquer 1 ≤ p1, p2 ≤ +∞.
Exercı́cio 2.18 Considere o espaço C([a, b], R) com a < b reais. Dado 1 ≤ p < +∞, mostre que a
expressão:
‖ f ‖p :=
(∫ b
a
| f (t)|p dt
) 1
p
( f ∈ C([a, b], R))
define uma norma sobre C([a, b], R), para qualquer 1 ≤ p < +∞ fixo. Prove ainda uma versão
da desigualdade de Hölder para estas normas:
∀ f , g ∈ C([a, b], R) : ‖ f g‖1 ≤ ‖ f ‖p‖g‖q
onde q é o expoente dual de p definido no Exercı́cio 2.16. (Dica: este é mais um caso em que a
analogia contida na Observação 2.2 pode ser útil.)
38
Exercı́cio 2.19 Neste exercı́cio, apresentamos outras normas que “são subaditivas por motivos de conve-
xidade”. Considere uma função Ψ : [0,+∞)→ [0,+∞) com as seguintes propriedades:
• Ψ é crescente e convexa;
• Para todo x ∈ R+, Ψ(x) ≥ 0, com igualdade se e somente se x = 0;
• limx→+∞ Ψ(x) = +∞ e limx→0 Ψ(x) = 0.
Por exemplo, as funções definidas por Ψ1(x) := xp, Ψ2(x) := ex
p − 1 (com p ≥ 1 nos dois casos) e
Ψ3(x) = x (max{log x, 0}+ 1) têm as propriedades acima.
Prove que, dado d ∈N\{0}, a expressão:
‖x‖Ψ := inf
{
a > 0 :
d
∑
i=1
Ψ
(
|x[i]|
a
)
≤ 1
}
(x ∈ Rd)
define uma norma sobre Rd. Prove ainda que esta norma coincide com a norma `p usual no caso em que
Ψ1(x) = xp.
39
40
Capı́tulo 3
Espaços métricos, convergência e
completude
No capı́tulo anterior vimos vários espaços vetoriais V com suas respectivas normas ‖ · ‖. Isto nos
permite medir tamanhos de vetores e distância entre pontos v e v′.
Medir distâncias é bom porque nos permite tomar limites e fazer Análise. No entanto, é
muito fácil encontrar espaços em que se deseja fazer Análise e que não possuem a estrutura
linear de um espaço vetorial: ou seja, espaços em que tomar somas, diferenças ou produtos de
elementos não faz sentido. Por exemplo, a esfera d-dimensional e o conjunto de Cantor não têm
nada de “linear”, ainda que estejam ambos contidos em espaços vetoriais.No fim das contas, é bastante conveniente tomarmos um ponto de vista mais geral, baseado
apenas na noção de distância. Por isso estudaremos a partir daqui o conceito de espaço métrico.
Esta é a estrutura mı́nima que nos permite estender a Análise a que estamos acostumados, com
ε e δ, limites e tudo o mais. Todo espaço vetorial normado pode ser visto como espaço métrico,
mas a recı́proca não é verdadeira.
A classe de espaços métricos é a principal categoria de objetos que trataremos neste curso.
Ela é geral o suficiente para quase todos os nossos propósitos, mas ainda assim é tratável. Neste
capı́tulo veremos como ela é definida e como ela nos permite falar de convergência em conjuntos
muito gerais.
3.1 Espaços métricos
O que é, afinal, um espaço métrico? Eis a definição, devida a Fréchet.
Definição 3.1 Um espaço métrico é um conjunto X 6= ∅ munido de uma função d : X×X → [0,+∞),
chamada de métrica sobre X, com as seguintes propriedades.
1. d é não-negativa e separa pontos distintos: para quaisquer a, b ∈ X, d(a, b) = 0 se e somente
se a = b;
2. d é simétrica: para qualquer par (a, b) ∈ X× X, d(a, b) = d(b, a);
3. d satisfaz a desigualdade triangular: para quaisquer a, b, c ∈ X, d(a, b) ≤ d(a, c) + d(c, b).
41
Todas as propriedades de métrica acima têm uma interpretação intuitiva se pensamos em d
como uma noção de distância. A propriedade 1 diz que a distância de um lugar a ele mesmo é
nula, mas que qualquer outro lugar está a distância positiva. A segunda propriedade afirma que
ir de a a b não é mais fácil ou difı́cil que ir de b a a. A terceira propriedade afirma que ir de a
para c e depois para b não pode resultar em um caminho mais curto que a rota direta de a para
b. Apesar da clareza do que significam estas condições, veremos abaixo que nem todo espaço
métrico é fácil de se entender.
Veremos abaixo os principais exemplos de espaços métricos que serão recorrentes no curso.
Ocasionalmente usaremos a convenção de denotar por dX a métrica de X; isto será útil quando
tratarmos muitos espaços métricos de uma única vez.
3.1.1 A reta real como espaço métrico
Como primeiro exemplo, tomamos X = R com dR(a, b) := |a − b| ((a, b) ∈ R2). As duas
primeiras propriedades da definição de métrica são triviais. A terceira é consequência de “|x +
y| ≤ |x|+ |y|”aplicada a x = a− c e y = c− b. Em todas estas notas tomaremos esta métrica como a
métrica padrão sobre R, a não ser quando o contrário for dito.
3.1.2 Os números complexos como espaço métrico
O conjunto C é usualmente definido como o conjunto dos números da forma z := a + b
√
−1,
onde a = <(z) ∈ R é chamada de parte real de z, b = =(z) ∈ R é a parte imaginária, e
√
−1
– a unidade imaginária – é um número satisfazendo (
√
−1)2 = −1. Livros especializados em
Análise Complexa têm definições mais formais deste corpo. O ponto de mencioná-los aqui é
que C é basicamente R2 com uma estrutura de produto. Observamos ainda que a norma |z| é
multiplicativa: |zw| = |z| |w|.
3.1.3 A métrica discreta
Uma métrica relativamente trivial e “boba”pode ser definida sobre qualquer conjunto X 6= ∅: a
chamada métrica discreta.
ddisc(x, y) :=
{
1, x 6= y;
0, x = y.
Esta métrica é interessante por alguns (poucos) motivos. No momento só um deles nos interessa:
qualquer resultado que provarmos para todos os espaços métricos deverá valer para as métricas
discretas! Ou seja: se você quer entender um teorema, ou simplesmente testar se um enunciado
pode ser verdadeiro para todos os espaços métricos, estudá-lo no caso da métrica discreta é um
bom primeiro passo.
3.1.4 Espaços vetoriais: normas nos dão métricas
A maneira canônica de se definir uma métrica sobre um espaço normado é através da norma.
Proposição 3.1 Se (V, ‖ · ‖V) é um espaço normado, então a expressão
dV(a, b) := ‖a− b‖V (a, b ∈ V)
define uma métrica sobre V.
42
Prova: Sejam a, b, c ∈ Rd quaisquer. Nosso objetivo é provar que
• ‖a− b‖V ≥ 0, com igualdade se e somente se a = b;
• ‖a− b‖V = ‖b− a‖V ;
• ‖a− c‖V ≤ ‖a− b‖V + ‖b− c‖V .
Vamos escrever isto de outra forma. Defina x := a− b, y := b− c. Os itens acima são equivalentes
a:
• ‖x‖V ≥ 0, com igualdade se e somente se x = 0 (que vale porque a norma é positiva
definida).
• ‖x‖V = ‖ − x‖V (que segue da homogeneidade positiva da norma);
• ‖x + y‖V ≤ ‖x‖V + ‖y‖V (que vem da sub-aditividade).
2
Portanto, as normas que pusemos em Rd, C(I, R), etc todas induzem métricas. Como veremos
na seção seguinte, elas também induzem métricas sobre subconjuntos destes espaços que não são
necessariamente espaços vetoriais. Por exemplo, a norma euclidiana em Rd induz uma métrica
na esfera unitária:
Sd−1 := {x ∈ Rd : |x|2 = 1.}
3.1.5 Métricas induzidas
Se temos um espaço métrico (X, dX), qualquer subconjunto Y ⊂ X, Y 6= ∅ herda a métrica:
dY(y, y′) := dX(y, y′) ((y, y′) ∈ Y2).
Ou seja, dY = dX |Y×Y é obtida restringindo a função dX : X × X → [0,+∞) ao conjunto Y × Y.
Chamamos esta métrica de induzida. Por exemplo, a esfera unitária Sd−1 ⊂ Rd e o conjunto
Qd ⊂ Rd dos vetores com coordenadas racionais têm métricas induzidas pelas métricas naturais
sobre os espaços ambientes.
3.2 Sequências, limites e completude
O leitor deve lembrar que uma sequência de elementos em X, escrita {xn}n∈N ⊂ X, é tão somente
uma maneira de escrever uma função f : N→ X, de modo que xn = f (n) para cada n ∈N.
Tomamos como dado que o leitor já sabe o que é convergência de uma sequência em R, mas
lembramos a definição mesmo assim. Dados {xn}n∈N ⊂ R e x ∈ R, dizemos que xn → x, ou
limn∈N xn = x, ou ainda que xn converge a x, se
∀ε > 0 ∃n0(ε) ∈N ∀n ∈N : n ≥ n0(ε)⇒ |xn − x| < ε.
A noção de convergência em um espaço métrico é derivada desta.
43
Definição 3.2 Fixo um espaço métrico (X, dX), dizemos que uma sequência {xn}n∈N ⊂ X converge a
x ∈ X (segundo a métrica dX) se a sequência {dX(xn, x)}n∈N ⊂ R converge a 0, no sentido do parágrafo
anterior. Dito de outro modo: xn → x se
∀ε > 0 ∃ n0(ε) ∈N ∀n ∈N : n ≥ n0(ε)⇒ |dX(xn, x)− 0| = dX(xn, x) < ε.
Esta segunda forma de definir as coisas mostra que as duas noções de convergência coincidem
no caso de X = R com a métrica usual. Podemos mostrar facilmente que, como no caso de
números, trocar < ε por ≤ ε na segunda definição não muda nada. Além disso:
Proposição 3.2 (Unicidade do limite) Dados x, x′ ∈ X e uma sequência {xn}n∈N ⊂ X, se xn → x e
xn → x′, então x = x′.
Prova: Pelos axiomas de métrica, para provarmos que x = x′, basta mostrarmos que dX(x, x′) =
0. Pela desigualdade triangular, temos a seguinte desigualdade para cada n ∈N:
0 ≤ dX(x, x′) ≤ dX(x, xn) + dX(xn, x′).
Por hipótese, dX(x, xn)→ 0 e dX(x′, xn)→ 0 no sentido usual de R. Como “o limite da soma é a
soma dos limites”, temos:
lim
n∈N
(dX(x, xn) + dX(xn, x′)) = lim
n∈N
dX(x, xn) + lim
n∈N
dX(xn, x′) = 0.
Portanto, a distância dX(x, x′) está “sanduichada” entre a sequência constante 0 e uma outra
sequência que vai a 0. Deduzimos que dX(x, x′) = 0, como querı́amos demonstrar. 2
Um ponto importante é que, como veremos abaixo, a convergência ou não de uma sequência
depende da métrica escolhida. Ainda assim, na maior parte dos casos nós falaremos de con-
vergência sem mencionar a métrica.
Exercı́cio 3.1 Considere um espaço vetorial normado (V, ‖ · ‖V) com a métrica induzida pela norma. Se
{vn}n∈N ⊂ V e v ∈ V são dados, mostre que
vn → v⇔ vn − v→ 0V .
Vamos agora definir o que é uma sequência de Cauchy em um espaço métrico e o que é um
espaço métrico completo.
Definição 3.3 Fixo um espaço métrico (X, dX), dizemos que uma sequência {xn}n∈N ⊂ X é de Cauchy
se
lim
m,n→+∞
dX(xn, xm) = 0,
isto é,
∀ε > 0 ∃ n0(ε) ∈N ∀m, n ∈N : m, n ≥ n0(ε)⇒ dX(xn, xm) < ε.
(X, dX) é dito completo se toda sequência de Cauchy {xn}n∈N ⊂ X converge a algum x ∈ X.
A mesma prova conhecida de R de que toda sequência convergente é Cauchy vale paraespaços métricos gerais. Observe, no entanto, que nem todo espaço métrico é de Cauchy. Por
exemplo, (R, dR) é completo, mas Q com a métrica induzida não é completo. Veremos a seguir
vários exemplos naturais de espaços métricos que são completos e (com menos destaque) alguns
outros que não são. Antes, uma definição fundamental.
Definição 3.4 Um espaço vetorial normado (V, ‖ · ‖V) que é completo com a distância induzida pela
norma ‖ · ‖V é dito espaço de Banach.
44
3.2.1 Subsequências
Em vários momentos do texto, seremos forçados a falar de subsequências, definidas abaixo.
Definição 3.5 Considere um subconjunto infinito N ⊂ N. Dada uma sequência {xn}n∈N num espaço
métrico (X, dX), chamamos de subsequência {xn}n∈N (com ı́ndices em N) a sequência {yj}j∈N definida da
seguinte maneira: se n1 < n2 < . . . é a única enumeração crescente dos elementos de N, então yj := xnj
para cada j ∈ N. Normalmente escreveremos xnj ao invés de yj. Chamamos de limn∈N xn ou limj∈N xnj
o limite de yj (caso exista).
Ainda não teremos muito motivo para olhar subsequências nesta altura do texto, mas em
breve isto ocorrerá. Em geral a motivação para se definir uma subsequência é a seguinte. Preci-
samos de uma sequência com propriedades ”boas”. Isso pode ser difı́cil de se obte diretamente.
Talvez consigamos apenas uma sequência preliminar, que é ”parcialmente boa”, ou ”quase boa”.
Quando isso ocorre, é às vezes possı́vel obter a sequência desejada passando a uma subsequência
da sequência preliminar. De fato, veremos o primeiro exemplo disso já na próxima subseção.
Exercı́cio 3.2 Mostre que uma subsequência {xn}n∈N como a definida acima converge a x ∈ X se e
somente se:
∀ε > 0 ∃n0(ε) ∈ N ∀n ∈ N : n ≥ n0(ε)⇒ dX(xn, x) ≤ ε.
É conveniente enunciarmos de uma vez duas proposições muito úteis. A primeira diz que, ao
passarmos para uma subsequência, não ”estragamos”uma eventual convergência da sequência
original.
Proposição 3.3 Considere uma sequência {xn}n∈N num espaço métrico (X, dX). Se xn converge a um
limite x ∈ X, então qualquer subsequência converge ao mesmo x.
Prova: Tome {xn}n∈N e x ∈ X como acima. O fato que xn → x quer dizer que:
(?) ∀ε > 0 ∃n0(ε) ∈N ∀n ∈N : n ≥ n0(ε)⇒ dX(xn, x) ≤ ε.
Agora considere N ⊂N infinito. Queremos mostrar que limn∈N xn = x. Considerando xnj como
na definição de subsequência, precisamos provar que, dado um ε > 0,
queremos : ∃j0(ε) ∈N ∀j ∈N : j ≥ j0(ε)⇒ dX(xnj , x) ≤ ε.
Mas isso é simples. Como N := {n1 < n2 < n3 < . . . } é conjunto infinito, podemos escolher
j0(ε) com nj0(ε) ≥ n0(ε) (ver (?)). Deste modo, garantimos que nj ≥ n0(ε) para todo j ≥ j0(ε), de
modo a garantir dX(xnj , x) ≤ ε. 2
No próximo problema, veremos como podemos usar subsequências para garantir a con-
vergência de uma sequência inteira.
Proposição 3.4 Considere uma sequência de Cauchy {xn}n∈N num espaço métrico (X, dX) que tem uma
subsequência convergente. Então {xn}n∈N converge ao mesmo limite da sequência inteira.
45
Prova: Sejam x ∈ X o limite da subsequência e N ⊂ N o seu conjunto (infinito) de ı́ndices.
Como {xn}n∈N é Cauchy, dado ε > 0, podemos encontrar n0(ε) ∈ N tal que dX(xn, xm) ≤ ε
para n, m ≥ n0(ε). Ao mesmo tempo, como N é infinito, sabemos que existem infinitos ı́ndices
k ∈≥ n0(ε) com k ∈ N. Tomando um destes ı́ndices, vemos que:
∀n ≥ n0(ε) : dX(xn, x) ≤ dX(xn, xk) + dX(xk, x) ≤ ε + dX(xk, x).
Se agora mandamos k→ +∞ com k ∈ N, temos dX(xk, x)→ 0 e portanto:
∀n ≥ n0(ε) : dX(xn, x) ≤ ε.
Ou seja, o mesmo n0(ε) que vem da ”Cauchyaniedade” da sequência {xn}n se adequa à definição
de limite. 2
3.2.2 Convergência em Rd com as normas `p
Recorde o Exercı́cio 2.15 acima, onde apresentamos as normas `p, 1 ≤ p ≤ ∞, sobre Rd. Observe
que, para qualquer uma destas normas,
∀p ∈ [1,+∞), ∀x ∈ Rd : |x|∞ ≤ |x|p ≤ d1/p |x|∞.
Usamos este fato a seguir para obter o seguinte resultado.
Teorema 3.1 Dada uma sequência arbitrária {xn}n∈N ⊂ Rd:
1. se x ∈ Rd, xn → x de acordo com uma das normas `p acima se e somente se xn[i]→ x[i] para cada
uma das coordenadas i = 1, 2, . . . , d;
2. {xn}n∈N é Cauchy de acordo com uma das normas `p acima se e somente se cada uma das sequências
de coordenadas {xn[i]}n∈N ⊂ R, com i = 1, 2 . . . , d, é Cauchy.
Segue que (Rd, | · |p) é Banach: toda sequência em Rd que é Cauchy de acordo com a norma `p converge a
um limite em Rd.
Prova: Começamos com o primeiro item. Tome uma sequência {xn}n∈N ⊂ Rd e um x ∈ Rd.
Lembre-se do Exercı́cio 3.1 e veja que xn →`p x se e somente se xn − x →`p 0Rd . Pela observação
antes da prova relacionando as normas `p, deduzimos que:
xn →`p x ⇔ |x− xn|p → 0⇔ |x− xn|∞ → 0⇔ max1≤i≤d
|x[i]− xn[i]| = 0,
onde a última implicação é a definição da norma | · |∞.
Agora observe que, para cada j ∈ {1, . . . , d}, {|x[j]− xn[j]|}n∈N é uma sequência de números
reais maiores ou iguais a 0. Portanto,
0 ≤ |x[j]− xn[j]| ≤ max
1≤i≤d
|x[i]− xn[i]|.
Por um argumento de sanduı́che, vemos que, se max1≤i≤d |x[i]− xn[i]| → 0, então |x[j]− xn[j]| →
0, e portanto xn[j] → x[j], para cada j ∈ {1, . . . , d}. Por outro lado, se cada uma das sequências
46
{xn[j]}n∈N converge a x[j], temos que {|x[j]− xn[j]|}n∈N converge a 0 para cada j e o máximo
dessas sequências converge a 0 (um resultado de Análise na Reta!). Concluı́mos:
max
1≤i≤d
|x[i]− xn[i]| = 0⇔ ∀j ∈ {1, 2, . . . , d} : xn[j]→ x[j].
Combinando isso com as implicações anteiores, cumprimos com o item 1.
Para o segundo item, seguimos raciocı́nio parecido por isso, vamos mais rápido. Novamente
Vemos que:
|xn − xm|p
n,m→+∞−→ 0⇔ |xn − xm|∞
n,m→+∞−→ 0⇔ max
1≤j≤d
|xn[j]− xm[j]|
n,m→+∞−→ 0.
Do mesmo modo que acima, observamos que o máximo max1≤j≤d |xn[j]− xm[j]| converge a 0 se
e somente se |xn[j]− xm[j]| converge a 0 para cada coordenada j ∈ {1, 2, . . . , d}:
max
1≤j≤d
|xn[j]− xm[j]|
n,m→+∞−→ 0⇔ ∀ 1 ≤ j ≤ d : |xn[j]− xm[j]|
n,m→+∞−→ 0.
Assim,
|xn − xm|p
n,m→+∞−→ 0⇔ ∀ 1 ≤ j ≤ d : |xn[j]− xm[j]|
n,m→+∞−→ 0,
o que é a tradução em sı́mbolos matemáticos do item 2 do teorema.
Para terminar, provaremos que (Rd, | · |p) é completo. Para isso, tomamos uma sequência de
Cauchy {xn}n∈N ⊂ Rd arbitrária. Pelo item 2, cada sequência das coordenadas {xn[i]}n∈N ⊂ R
é Cauchy. Como R é completo, isto quer dizer que:
∀i ∈ {1, . . . , d} : ∃ lim
n→+∞
xn[i].
Agora defina x ∈ Rd como o vetor de coordenadas x[i] := limn→+∞ xn[i] (1 ≤ i ≤ d). Com esta
definição, garantimos que as coordenadas de xn convergem para as coordenadas de x e portanto
xn →`p x. Desta forma, provamos que a sequência de Cauchy {xn}n∈N ⊂ Rd (uma sequência de
Cauchy arbitrária em Rd) tem limite x ∈ Rd. 2
Fazemos uma pausa aqui para mostrar um fato importante, que será usado muitas vezes no
texto. Ele é um prelúdio para o assunto de compacidade, que será discutido mais adiante no
texto.
Proposição 3.5 (Sequências limitadas têm subsequências convergentes) Suponha que {xn}n∈N ⊂
Rd é uma sequência limitada, isto é, que supn∈N |xn|2 < +∞. Então existe uma subsequência {xnj}j∈N
convergente.
Prova: Vamos provar isso por indução na dimensão d ∈ N\{0}. O caso base é d = 1 é um
teorema conhecido de Análise na Reta.
Para o passo indutivo, suponha que o teorema é verdade para dimensão d− 1. Tome agora
{xn}n∈N ⊂ Rd limitada e chame de yn as projeções dos xn a Rd−1.
yn ∈ Rd−1 é o vetor com yn[i] = xn[i] para i ∈ [d− 1] (n ∈N).
47
Para cada n ∈ N, podemos usar o fato de que xn[d]2 ≥ 0 e
√
· é função crescente para observar
que:
|yn|2 =
√√√√d−1∑
i=1
|yn[i]|2 =
√√√√d−1∑
i=1
|xn[i]|2 ≤
√√√√ d∑
i=1
|xn[i]|2 = |xn|2.
Por esta razão, a sequência {yn}n∈N é limitada: supn∈N |yn|2 ≤ supn∈N |xn|2 < +∞. Por hipótese
de indução, podemos encontrar um subconjunto infinito Nd−1 ⊂ N tal que limn∈Nd−1 yn = y ∈
Rd−1. Como visto acima, isto quer dizer que
∀i ∈ [d− 1] : lim
n∈Nd−1
xn[i] = lim
n∈Nd−1
yn[i] = y[i].
Agora considere {xn[d]}n∈Nd−1 ⊂ R. Esta é uma sequência limitada de númerosreais, pois afinal:
sup
n
|xn[d]| ≤ sup
n
|xn|2 < +∞.
Por Análise na Reta, sabemos que existe um Nd ⊂ Nd−1 infinito tal que:
∃ lim
n∈Nd
xn[d] = z ∈ R.
Pela Proposição 3.3, sabemos que essa passagem a uma subsequência não estraga a convergência
das outras coordenadas, que havia sido garantida antes. Isto é, agora sabemos que:
∀i ∈ [d] : ∃ lim
n∈Nd−1
xn[i],
o que, como visto acima, é a mesma coisa que dizer que {xn}n∈N converge. 2
3.2.3 Convergência sob a métrica discreta
Vamos deixar este caso como um exercı́cio.
Exercı́cio 3.3 Considere um espaço (X, dX) com a métrica discreta. Dada {xn}n∈N ⊂ X, mostre que
xn → x ∈ X se e somente se existe um n0 ∈ N tal que xn = x para todo n ≥ n0. Prove ainda que
{xn}n∈N é Cauchy se e somente se existe um n0 ∈N tal que xn = xn0 para todo n ≥ n0.
3.2.4 Convergência em C(I, R)
Aqui I = [a, b] ⊂ R é um intervalo, C(I, R) é o espaço de funções contı́nuas de I em R e a norma
usada é a norma ∞:
‖ f ‖I,∞ := sup
t∈I
| f (t)|.
Vamos primeiro tentar entender do que estamos falando aqui. Vamos considerar em primeiro
lugar o que quer dizer fn → f nesta métrica. Como ‖ fn − f ‖I,∞ é um supremo, e além disso este
supremo é atingido, temos que
‖ fn − f ‖I,∞ → 0⇔ ∀ε > 0 ∃n0 = n0(ε) ∈N ∀n ≥ n0 ∀t ∈ T : | fn(t)− f (t)| < ε.
48
Esta é a chamada convergência uniforme em t ∈ I, ou simplesmente uniforme. Esta convergência
implica a chamada convergência pontual, que ocorre quando fn(x) → f (x) para cada x ∈ I. Isto
equivale a pedir que:
∀ε > 0 ∀t ∈ I ∃n0 = n0(ε, t) ∀n ≥ n0 : | fn(t)− f (t)| < ε.
Veja que, neste caso, o ı́ndice n0 a partir do qual a distância fica menor que ε depende tanto de
ε quanto do ponto t. Por outro lado, a convergência uniforme pede que seja achado, para cada
ε > 0, um n0 tal que | fn(t)− f (t)| < ε para qualquer t ∈ I, sempre que n ≥ n0. Ou seja, a escolha
de n0 deve ser uniforme em t.
Os exemplos abaixo nos mostram duas coisas. A primeira é que o limite pontual de funções
contı́nuas pode não ser uma função contı́nua.
Exemplo 3.1 Considere I = [0, 1] e fn(x) = xn, x ∈ I. O limite pontual das fn é f com f (1) = 1 e
f (x) = 0 para 0 ≤ x < 1.
No próximo exemplo, veremos que a convergência pontual a um limite contı́nuo não implica
convergência uniforme.
Exemplo 3.2 Considere C([0, 1], R) com a norma do sup. Existe uma sequência { fn}n∈N ⊂ C([0, 1], R)
de funções com ‖ fn‖[0,1],∞ = 1, mas fn(x)→ 0 para todo x ∈ [0, 1]..
A sequência { fn}n∈N para n > 0 é feita de ”tendas”. A fn é uma ”tenda”de altura 1 plantada
no intervalo (1/(n + 1), 1/n). Mais precisamente, fn será igual a 0 fora do intervalo (1/(n +
1), 1/n) e será um ”V invertido”dentro do intervalo.
Apresentamos agora a fórmula. Considere a função contı́nua Ψ : R→ R dada por:
Ψ(t) :=

0, t ≤ 0;
2t, 0 ≤ t ≤ 12 ;
1− 2
(
t− 12
)
, 12 ≤ t ≤ 1;
0, t ≥ 1.
(t ∈ R).
É um exercı́cio provar que Ψ é de fato contı́nua, que 0 ≤ Ψ ≤ 1 e que Ψ(1/2) = 1. Agora defina
f0 ≡ 0 e, para n > 0:
fn(t) := Ψ
(
1
an
(
t− 1
n + 1
))
(t ∈ [0, 1]),
onde
an :=
1
n
− 1
n + 1
=
1
n(n + 1)
é o comprimento do intervalo (1/(n + 1), 1/n).
Exercı́cio 3.4 Prove que cada fn com n > 0 vale 0 fora do intervalo (1/(n + 1), 1/n) e vale 1 no ponto
médio deste intervalo. Deduza disso as propriedades enunciadas acima.
Por outro lado, nosso principal teorema nesta seção pode ser resumido dizendo-se que o limite
uniforme de funções contı́nuas é uma função contı́nua.
49
Teorema 3.2 C(I, R) é completo com a métrica induzida pela norma ‖ · ‖I,∞. Ou seja, uma sequência de
funções contı́nuas sobre I = [a, b] que converge uniformemente tem como limite uma função contı́nua.
Prova: Tomemos { fn}n∈N ⊂ C(I, R) que é de Cauchy, ou seja, tal que ‖ fn − fm‖I,∞ → 0 quando
n, m → +∞. Desejamos mostrar que existe uma função f ∈ C(I, R) tal que ‖ fn − f ‖I,∞ → 0.
Antes de entrar na prova, fazemos alguns comentários que serão úteis para entender o que
veremos a seguir.
Ideias gerais da prova
A dificuldade desta prova é que não sabemos de antemão como encontrar uma f candidata a
limite uniforme da sequência. Se tivéssemos essa f , só terı́amos que checar que esta f é mesmo
o limite. Como não temos, vamos primeiro construir a função f e depois provar que ela é o
limite que buscamos. Para isso, uma etapa fundamental será mostrar que as { fn}n∈N convergem
pontualmente a uma certa função f (passo 1). Para isso, mostraremos que, dado qualquer ∀t ∈ I,
{ fn(t)}n∈N é uma sequência de Cauchy em R.
Como convergência uniforme implica convergência pontual, sabemos que, se as fn conver-
gem, o limite tem mesmo de ser f . Por isso, a etapa seguinte da prova será mostrar que fn e f
estão uniformemente próximas para f grande (passo 2). A dificuldade aqui é que temos um ”limite
duplo” que tem de ser tomado com cuidado. Como último passo, mostraremos que f ∈ C(I, R),
ou seja, o limite uniforme de funções contı́nuas é função contı́nua (passo 3). Assim concluiremos a
prova.
Passo 1: existe uma f : I → R tal que fn(x)→ f (x) para cada x ∈ I.
Este é o passo da prova em que mostramos que as as fn convergem pontualmente a uma certa
f , que será a nossa candidata a limite uniforme da sequência fn.
Para provar a convergência pontual, usaremos o fato de que R é completo, ou seja, sequências
de Cauchy em R convergem. Por conta disto, temos
∀x ∈ I : | fn(x)− fm(x)| ≤ sup
t∈I
| fn(t)− fm(t)| = ‖ fn − fm‖I,∞
(n,m→+∞)→ 0. (3.1)
Ou seja,
∀x ∈ I : | fn(x)− fm(x)| → 0 quando n, m→ +∞,
o que quer dizer que { fn(x)}n ⊂ R é Cauchy, como querı́amos demonstrar. Isto quer dizer que
∃ f (x) := limn fn(x) para cada x ∈ I, o que define uma função f : I → R.
Passo 2: Proximidade entre fn e f .
O raciocı́nio por detrás de (3.1) nos diz que, para todo x ∈ I
| fn(x)− f (x)| = lim
m→+∞
| fn(x)− fm(x)|
≤ lim sup
m
‖ fn − fm‖I,∞
≤ sup
m≥n
‖ fn − fm‖I,∞.
50
Observe que o lado direito desta cadeia de desigualdades não depende de x e é uma cota superior
para todo x. Tomando o supremo, descobrimos que
‖ fn − f ‖I,∞ = sup
x∈I
| fn(x)− f (x)| ≤ sup
m≥n
‖ fn − fm‖I,∞.
Recordamos mais uma vez que { fn}n∈N ⊂ C(I, R) é Cauchy. Isto quer dizer que, dado ε > 0,
podemos encontrar n0(ε) tal que, se n, m ≥ n0(ε), então ‖ fn − fm‖I,∞ < ε. Tomando o sup em m,
vemos que
∃n0(ε) ∈N, ∀n ≥ n0(ε) : 0 ≤ ‖ fn − f ‖I,∞ = sup
x∈I
| fn(x)− f (x)| ≤ ε.
Como isto vale para todo ε, deduzimos que ‖ fn − f ‖I,∞ → 0, como querı́amos demonstrar.
Passo 3: f é contı́nua e o fim da prova.
Falta apenas um detalhe, que é provar que f ∈ C(I, R), ou seja, que f é contı́nua (ou: o
limite uniforme de funções contı́nuas é uma função contı́nua). Isto vale se e somente se para
toda sequência convergente {xj}j∈N ⊂ I e todo x ∈ I, xj → x ⇒ f (xj) → f (x). Para fazer isto,
basta provar que:
(Basta provar) ∀ε > 0 : lim sup
j
| f (xj)− f (x)| ≤ 0.
Para prova esta última desigualdade, observe que, pela desigualdade triangular:
| f (xj)− f (x)| = | f (xj)− fn(xj) + fn(xj)− fn(x) + fn(x)− f (x)|
≤ | f (xj)− fn(xj)|+ | fn(xj)− fn(x)|+ | fn(x)− f (x)|
O primeiro e o terceiro termo nesta última expressão são da forma | f (t) − fn(t)| com t ∈ I,
sendo, portanto cotados pelo supremo de | f (t)− fn(t)| sobre t ∈ I, que por sua vez é exatamente
‖ f − fn‖I,∞. Ou seja,
| f (xj)− f (x)| ≤ | fn(xj)− fn(x)|+ 2 ‖ fn − f ‖I,∞.
Esta desigualdade vale para cada j e n. Em particular, podemos tomar j → +∞: a continuidade
de fn nos garante que | fn(xj)− fn(x)| → 0 e portanto,
∀n ∈N : lim sup
j∈N
| f (xj)− f (x)| ≤ 2‖ fn − f ‖I,∞.
Por fim, mandando n → +∞, vemos que ‖ fn − f ‖I,∞ → 0 enquanto o lado esquerdo não muda.
Deduzimos:
lim sup
j∈N
| f (xj)− f (x)| ≤ 0,
o que significa | f (xj)− f (x)| → 0, como querı́amos demonstrar.
Feito isso, apenas verificamos que temos todos os ingredientes em nossas mãos. Partindo de
{ fn}n∈N ⊂ C(I, R) Cauchy, construı́mos uma f ∈ C(I, R) tal que fn → f segundo a norma que
escolhemos para C(I, R). 2
51
3.3 Equivalência de métricase normas
Na seção anterior nós vimos como descrever a convergência em alguns espaços onde isso não
é completamente óbvio à primeira vista. Um ponto importante de se enfatizar é que em vários
casos mostramos que definições diferentes de métrica ou norma conduziram a uma única noção
de convergência. Isto é um ponto importante, que merece uma definição.
Definição 3.6 Considere um conjunto X 6= ∅ e duas métricas d1, d2 definidas sobre ele. Dizemos que as
duas métricas são equivalentes se
∀{xn}n∈N ⊂ X, ∀x ∈ X : d1(xn, x)→ 0⇔ d2(xn, x)→ 0.
Quando X é um espaço vetorial e as duas distâncias são induzidas por normas ‖ · ‖1, ‖ · ‖2, dizemos que
as duas normas são equivalentes quando as métricas induzidas são equivalentes de acordo com a definição
acima.
Por exemplo, a Seção 3.2.2 mostra que as métricas induzidas pelas normas `p sobre Rd são
todas equivalentes. Agora apresentamos um caso de não-equivalência de normas (e métricas).
Exemplo 3.3 Vamos mostrar que duas normas que vimos acima sobre C([0, 1], R) não são equivalentes.
A primeira é a nossa “norma preferencial”:
‖ f ‖∞ := sup
t∈[0,1]
| f (t)|
e a segunda também é natural (e foi definida no Exercı́cio 2.18):
‖ f ‖1 :=
∫ 1
0
| f (t)| dt.
Como | f (t)| ≤ ‖ f ‖∞ para cada t ∈ [0, 1], vemos facilmente que ‖ f ‖1 ≤ ‖ f ‖∞ para toda f ∈
C([0, 1], R). Disto podemos facilmente deduzir que
‖ fn − f ‖∞ → 0⇒ ‖ fn − f ‖1 → 0.
A recı́proca, no entanto, não é verdadeira. Considere por exemplo a sequência de funções
{ fn}n∈N definidas da seguinte forma:
fn(t) :=
{
0, t ≤ 1− 1n
nt− n + 1, 1− 1n < t ≤ 1.
O leitor pode checar que fn ∈ C([0, 1], R) é não negativa e que
‖ fn‖1 =
∫ 1
0
fn(t) dt =
1
2n
.
Portanto ‖ fn − 0‖1 → 0. No entanto, para todo n
‖ fn‖∞ = fn(1) = 1 6→ 0,
o que nos diz que fn 6→ 0 de acordo com a norma ‖ · ‖∞.
52
Exercı́cio 3.5 Estenda as considerações acima às demais normas ‖ · ‖p (com 1 ≤ p < +∞) apresentadas
no Exercı́cio 2.18.
Em resumo, as normas ‖ · ‖1 e ‖ · ‖∞ sobre C não são equivalentes porque há vetores com
norma ‖ · ‖∞ “grande” (igual a 1) e norma ‖ · ‖1 “arbitrariamente pequena” (próxima de 0). O
teorema a seguir e a sua prova mostram que isto é geral: duas normas são equivalentes se a
razão delas (quando definida) nunca está nem muito perto de zero, nem de infinito.
Teorema 3.3 Duas normas ‖ · ‖1 e ‖ · ‖2 sobre o mesmo espaço vetorial V são equivalentes se e somente
se existem constantes C, c > 0 tais que
∀v ∈ V : c ‖v‖1 ≤ ‖v‖2 ≤ C ‖v‖1.
Prova: Deixamos como exercı́cio provar que, se tais constantes existem, as métricas são equiva-
lentes. Vejamos agora que, se as normas são equivalentes, então existem constantes C, c > 0
com as propriedades desejadas. Recorde que a equivalência das normas é a mesma coisa que a
equivalência das métricas induzidas pelas normas. Portanto, nossa hipótese é que
Hip: ∀{vn}n∈N ⊂ V ∀v ∈ V : ‖vn − v‖1 → 0⇔ ‖vn − v‖2 → 0.
Em particular, vale o que escrevemos acima quando v = 0.
Hip’: ∀{vn}n∈N ⊂ V : ‖vn‖1 → 0⇔ ‖vn‖2 → 0.
Agora suporemos para chegar a uma contradição que não existe a constante C apontada acima. Ou
seja
(?) ∀C > 0 ∃vC ∈ V : ‖vC‖2 > C ‖vC‖1.
Em particular, podemos encontrar um vetor vn ∈ V com ‖vn‖2 > (n+ 1) ‖vn‖1, para cada n ∈N.
Note que tal vetor não pode ser 0 porque neste caso terı́amos ‖vn‖2 = (n + 1) ‖vn‖1. Portanto,
podemos (se necessário) substituir cada vetor vn por vn/(n + 1)‖vn‖1 e deduzir que
(?) ⇒ ∃{vn}n∈N ⊂ V ∀n ∈N : ‖vn‖1 =
1
n + 1
e ‖vn‖2 > (n + 1) ‖vn‖1 = 1.
No entanto, isto contradiz Hip’: afinal, ‖vn‖1 → 0 e ‖vn‖2 6→ 0. Isto quer dizer que (?) nos levou
a uma contradição, o que implica que existe, sim, a constante C que querı́amos encontrar. Uma
prova semelhante mostra que a c > 0 desejada também existe. 2
3.4 Mais exercı́cios
Exercı́cio 3.6 Seja (X, dX) um espaço métrico. Considere:
d′X(x, x
′) := min{dX(x, x′), 1}.
Prove que esta é outra métrica sobre X e que ela é equivalente à métrica original.
Exercı́cio 3.7 Defina
φ(t) :=
t
1 + |t| (t ∈ R).
53
1. Prove que φ é uma bijeção estritamente crescente e contı́nua entre R e (−1, 1). Obs: por um
resultado de Análise na Reta, que você pode usar abaixo, o item 1 implica que φ−1 : (−1, 1) → R
também é uma bijeção estritamente crescente e contı́nua.
2. Defina:
d(t, s) := |φ(t)− φ(s)| ((t, s) ∈ R2).
Mostre que d é uma métrica sobre R e que esta métrica é equivalente à usual.
3. Prove que a sequência {n}n∈N é Cauchy segundo d, mas não converge. Portanto, (R, d)
não é completo (isso mostra que duas métricas podem ser equivalentes e ainda assim “dis-
cordar” no que diz respeito a completude).
Exercı́cio 3.8 (Métricas em grafos) Um grafo é um par G = (V,∼) onde V 6= ∅ é um conjunto
de elementos chamados vértices e “∼” é uma relação simétrica sobre pares de elementos de V:
dados x, y ∈ V, x ∼ y se e somente se y ∼ x (pares xy com x ∼ y são chamados de arestas do
grafo).
Dado um grafo G como acima, definimos novas relações “↔k” entre vértices para cada k ∈N,
da seguinte forma:
• Para k = 0, y↔0 x se e somente se y = x;
• Dado k > 0, y↔k x se existe um vértice z ∈ V com y ∼ z e z↔ x.
Suponha agora que G é conexo: isto é, dados x, y ∈ V, existe um k ∈ N com x ↔k y. Prove que a
expressão abaixo define uma métrica sobre V:
dG(x, y) := min{k ∈N : x ↔k y} (x, y,∈ V).
Exercı́cio 3.9 Considere Ψ : [0,+∞)→ [0,+∞). Seja (X, dX) um espaço métrico e defina
dX,ψ(x, x′) := Ψ(dX(x, x′)).
Dê condições suficientes sobre Ψ para que dX,ψ seja uma nova métrica sobre X, para qualquer (X, dX).
Exercı́cio 3.10 (Métricas produto) Suponha que (Xi, dXi), i = 1, . . . , d, são espaços métricos. Escreve-
remos os elementos de
X := X1 × X2 × · · · × Xd
como x = (x[1], . . . , x[d]), com cada coordenada x[i] ∈ Xi. Mostre que, para qualquer p ∈ [1,+∞), a
expressão
dp(x, y) := p
√√√√ d∑
i=1
dXi(x[i], y[i])p (x, y ∈ X)
define uma métrica sobre X. Mostre ainda que
d∞(x, y) := max
1≤i≤k
dXi(x[i], y[i])
p (x, y ∈ X)
também define uma métrica sobre X. Prove ainda que uma sequência {xn}n∈N ⊂ X converge a um x ∈ X
e acordo com a métrica dp (com 1 ≤ p ≤ +∞) se e somente se {xn[i]}n∈N ⊂ Xi converge x[i] ∈ X para
cada coordenada 1 ≤ i ≤ d. Prove um resultado semelhante para a propriedade de Cauchy e deduza que
(X, dp) é completo se e somente se cada espaço (Xi, dp) é completo. Mostre ainda que as métricas definidas
acima são todas equivalentes umas às outras.
54
Exercı́cio 3.11 Considere um espaço vetorial V. Já vimos que uma norma sobre V induz naturalmente
uma métrica sobre V. No entanto, nem toda métrica sobre V vem de uma norma. Dê condições necessárias
e suficientes que uma métrica dV deve satisfazer para que exista uma norma ‖ · ‖V tal que
∀v, w ∈ V : ‖v− w‖V = dV(v, w).
Exercı́cio 3.12 Mostre que a métrica discreta e a métrica induzida por R são equivalentes sobre N ou Z,
mas não sobre Q.
Exercı́cio 3.13 Suponha que (V, ‖ · ‖V) é um espaço vetorial completo e ‖ · ‖′V é uma outra norma sobre
V. Se as duas normas são equivalentes, é necessariamente verdade que (V, ‖ · ‖′V) é completo?
Exercı́cio 3.14 Considere uma famı́lia enumerável de espaços métricos (Xi, di), i ∈ N\{0}. Chamamos
de X o produto cartesiano infinito
X := X1 × X2 × X3 × X4 × . . .
e denotamos os elementos x ∈ X com x = (x[i])+∞i=1 , com cada x[i] ∈ Xi. Mostre que a expressão
dX(x, y) :=
+∞
∑
i=1
2−i min{di(x[i], y[i]), 1} (x, y ∈ X)
define uma métrica sobre X e que
∀{xn}n∈N ⊂ X, ∀x ∈ X : dX(xn, x)→ 0⇔ ∀i ∈N\{0}, di(xn[i], x[i])→ 0.
Prove ainda que (X, dX) é completo se e somente se cada (Xi, di) é completo.
Exercı́cio 3.15 Dado um espaço métrico (X, dX), dizemos que D ⊂ X é denso em X se e somente se todo
elemento de X é o limite de alguma sequência de elementos de D. Dizemos que (X, dX) é separável se X
tem um subconjunto denso e enumerável. Prove que Rd e C([0, 1], R) são separáveis com suas métricas
usuais.
Exercı́cio 3.16 Defina `∞(N)como sendo o conjunto de todas as sequências limitadas {an}n∈N ⊂ R.
Defina uma função sobre este espaço da seguinte forma:
‖{an}n∈N‖∞ := sup
n∈N
|an| ({an}n∈N ∈ `∞(N)).
Prove que podemos dar a `∞(N) uma estrutura de espaço vetorial segundo a qual (`∞(N), ‖ · ‖∞) é um
espaço vetorial normado completo. Este espaço é separável?
Exercı́cio 3.17 (Um teorema de Fréchet) A tese de doutorado de Maurice Fréchet introduziu os concei-
tos gerais de espaço métrico e compacidade. Ele também demonstrou o seguinte resultado.
Teorema: todo espaço métrico (X, dX) separável e de diâmetro finito pode ser “posto
dentro de `∞(N)” no seguinte sentido: se ‖ · ‖∞ é a norma do problema anterior,
então:
(?) ∃φ : X → `∞(N) ∀x, x′ ∈ X : ‖φ(x)− φ(x′)‖∞ = dX(x, x′).
55
Ou seja, há uma bijeção que preserva distâncias entre X (com a métrica dX) e um subconjunto S =
φ(X) ⊂ `∞(N) (com a métrica induzida por `∞(N)). Note que o diâmetro de (X, dX) é definido por
diam(X, dX) := supx,x′∈X dX(x, x
′).
Para definir esta função φ, seja {xn}n∈N uma enumeração de um subconjunto denso de X. Dado
x ∈ X, definimos:
φ(x) := {an(x)}n∈N, onde an(x) := dX(x, xn) (n ∈N)
Ou seja, φ(x) “lista” a distância de x a cada um dos pontos da sequência {xn}n∈N. Prove que esta função
satisfaz (?).
56
Capı́tulo 4
Funções e continuidade
O capı́tulo anterior nos ensinou o que é convergência em espaços métricos. Isto nos permite
definir continuidade de maneira fácil.
Definição 4.1 Considere dois espaços métricos (X, dX) e (Y, dY) e D ⊂ X Dizemos que f : D → Y é
contı́nua em x ∈ D se
∀{xn}n∈N ⊂ D : xn → x ∈ D ⇒ f (xn)→ f (x).
Dito de outro modo, queremos que:
∀{xn}n∈N ⊂ D, ∀x ∈ D : dX(xn, x)→ 0⇒ dY( f (xn), f (x))→ 0.
Dizemos que f é (simplesmente) contı́nua se ela é contı́nua em todos os pontos do domı́nio D.
Esta definição é das mais importantes do curso e vamos gastar bastante tempo analisando-
a e testando-a em exemplos. Uma primeira observação (praticamente trivial) está contida no
exercı́cio a seguir.
Exercı́cio 4.1 Formalize e prove a seguinte afirmação: a composição de funções contı́nuas é uma função
contı́nua.
Outra observação às vezes útil é que:
Exercı́cio 4.2 A noção de continuidade não é modificada se as métricas do domı́nio e do contradomı́nio são
trocadas por outras métricas equivalentes.
Veremos a seguir alguns exemplos de funções contı́nuas.
4.1 Funções contı́nuas de X em R
Aqui o melhor é proceder a partir de exemplos.
Em primeiro lugar, conhecemos as funções contı́nuas f : D → R com D ⊂ R. Tome agora
uma nova função:
fi : x ∈ Di := {z ∈ Rd : z[i] ∈ D} 7→ f (x[i]) ∈ R.
57
Por exemplo, se f (t) = log t, com domı́nio D = R+, fi(x) := log x[i], com domı́nio Di := {z ∈
Rd : z[i] ∈ R+}. Dizemos que este tipo de função só depende da i-ésima coordenada.
Afirmamos que esta função é contı́nua sempre que a f original é contı́nua. Para isto, pre-
cisamos provar que, se {xn}n∈N ⊂ Di é uma sequência arbitrária com xn → x ∈ Di, então
fi(xn)→ fi(x). Para demonstrar isso, recorde que nosso critério de convergência para sequências
em Rd nos diz que xn[i]→ x[i] em R. Além disso, a definição de Di garante que {xn[i]}n∈N ⊂ D,
x ∈ D. Concluı́mos que f (xn[i])→ f (x[i]) porque f é contı́nua sobre D. Ou seja, fi(xn)→ fi(x),
como querı́amos demonstrar.
Vejamos agora alguns exemplos mais interessantes.
Exercı́cio 4.3 Sabemos que o limite de um produto ou soma de sequências convergentes é o produto (ou
soma) dos limites. Deduza disto que, se D ⊂ X e f , g : D → R são contı́nuas, o mesmo vale para λ f + g
e f g (com λ ∈ R fixo). Com a hipótese adicional de que g não se anula, prove que f /g também é contı́nua.
Exercı́cio 4.4 Chame uma função f : Rd → R de polinômio multivariado se existem um k ∈ N e
coeficientes reais α(p1,...pd) com (p1, . . . , pd) ∈ [k]
d com
f (x) = ∑
(p1,...,pd)∈[k]d
α(p1,...pd) (x[1])
p1 (x[2])p2 . . . (x[d])pd (x ∈ Rd).
Prove que todo polinômio multivariado é função contı́nua.
Exercı́cio 4.5 Mostre que as normas ‖ · ‖p, 1 ≤ p ≤ +∞, são funções contı́nuas de Rd em R.
4.2 Funções Lipschitz e distâncias
Continuando na linha anterior, vamos definir e analisar a continuidade de algumas funções
baseadas em distâncias. Para isso vai ser útil introduzir o conceito de função Lipschitz.
Definição 4.2 Considere dois espaços métricos (X, dX) e (Y, dY) e D ⊂ X Dada uma constante L > 0,
dizemos que f : D → Y é L-Lipschitz se
∀x, x′ ∈ D : dY( f (x), f (x′)) ≤ L dX(x, x′).
Já é sabido de Análise na Reta que funções L-Lipschitz são contı́nuas. Verifiquemos isto para
espaços métricos arbitrários. Suponha f : D → Y é L-Lipschitz, {xn}n∈N ∪ {x} ⊂ D e xn → x,
isto é, dX(xn, x)→ 0. Veja que
0 ≤ dY( f (xn), f (x)) ≤ L dX(xn, x)→ 0,
logo dY( f (xn), f (x)) está entre duas sequências que vão a 0. Deduzimos que dY( f (xn), f (x))→ 0,
ou seja f (xn) → f (x). Como isto vale para todos {xn}n∈N ∪ {x} e f como acima, podemos
deduzir que funções Lipschitz são sempre contı́nuas.
Observação 4.1 Uma notação útil para a constante de Lipschitz de uma f : D → Y é a seguinte:
‖ f ‖Lip := sup
x,x′∈D, x 6=x′
dY( f (x), f (x′))
dX( f (x), f (x′)
.
Este é um supremo de números não-negativos e, portanto, pertence a R ∪ {+∞}. Como veremos num
dos exercı́cios, f é L-Lipschitz para algum L > 0 se e somente se ‖ f ‖Lip < +∞. Além disso, quando
‖ f ‖Lip < +∞, então ‖ f ‖Lip < +∞ é a menor constante de Lipschitz possı́vel para f .
58
Nos próximos exemplos, observamos que algumas funções f : X → R derivadas da distância
dX são 1-Lipschitz.
Exemplo 4.1 Fixo x0 ∈ X, a função x ∈ X 7→ dX(x, x0) ∈ R é 1-Lipschitz. De fato, para quaisquer
x, x′ ∈ X, a desigualdade triangular nos diz que
dX(x, x0) ≤ dX(x′, x0) + dX(x, x′)
e
dX(x′, x0) ≤ dX(x, x0) + dX(x, x′),
portanto
dR(dX(x, x0), dX(x′, x0)) = |dX(x, x0)− dX(x′, x0)| ≤ dX(x, x′).
Exemplo 4.2 Fixe agora um conjunto S ⊂ X, a função
x ∈ X 7→ dX(x, S) := inf
s∈S
dX(x, s) ∈ R
é bem definida, no sentido que os valores dX(x, s) são todos cotados inferiormente por 0 (afinal, a métrica é
positiva definida). Veja que, do mesmo jeito que provamos acima,
dX(x, S) = inf
s∈S
dX(x, s) ≤ inf
s∈S
(dX(x′, s) + dX(x, x′)) = dX(x′, S) + dX(x, x′).
Repetindo a conta trocando os papeis de x e x′ e reusando as ideias da prova anterior, deduzimos que
dR(dX(x, S), dX(x′, S)) = |dX(x, x0)− dX(x′, x0)| ≤ dX(x, x′).
Exemplo 4.3 Como um último exemplo, tomamos uma sequência de Cauchy {xn}n∈N ⊂ X. Afirmamos
que a expressão
f (x) := lim
n
dX(x, xn) (x ∈ X)
define uma função 1-Lipschitz f : X → R.
Para provar isso, primeiro temos que mostrar que o valor de f (x) está bem definido para todo
x ∈ X. Ou seja, devemos provar que o limite acima existe. Para isso, basta reusar um exemplo
acima e observar que
quando m, n→ +∞, |dX(x, xn)− dX(x, xm)| ≤ dX(xn, xm)→ 0.
Deste modo, para cada x ∈ X fixo, a sequência de números reais {dX(x, xn)}n é Cauchy e portanto
convergente.
Para provar que f é 1-Lipschitz, tomamos x, x′ ∈ X arbitrários e, novamente usando as ideias
anteriores, observamos o seguinte:
| f (x)− f (x′)| = lim
n∈N
|dX(x, xn)− dX(x′, xn)| ≤ dX(x, x′).
A principal “graça” deste problema é que ele resulta no exercı́cio a seguir, que será importante
quando estudarmos conjuntos compactos.
Exercı́cio 4.6 Prove que, se (X, dX) não é completo, então existe uma função f : X → (0, 1] com
f (x) > 0 para todo x ∈ X, mas infx∈X f (x) = 0.
59
4.3 Funções contı́nuas sobre o espaço de funções contı́nuas
Consideremos agora o espaço C := C(I, R), com I = [a, b] ⊂ R um intervalo fechado e limitado
munido da norma ‖ · ‖C := ‖ · ‖I,∞. Os elementos de C são funções contı́nuas f : I → R. Mas
também podemos definir algumas funções contı́nuas sobre este espaço. Eis alguns exemplos
naturais.
Exemplo 4.4 Dado t ∈ I, defina a aplicação et : C → R que leva f ∈ C em f (t). Esta é uma função de
C em R.
Vejaque, dadas f , g ∈ C
|et( f )− et(g)| = | f (t)− g(t)| ≤ sup
s∈I
| f (s)− g(s)| = ‖ f − g‖I,∞.
Portanto, et é uma aplicação 1-Lipschitz de C em R. Em particular, ela é uma aplicação contı́nua.
Exemplo 4.5 Dados a ≤ x, y ≤ b, defina a aplicação Ix,y : C → R que leva f ∈ C na integral definida
Ix,y( f ) :=
∫ y
x f (t) dt ∈ R. Esta também é uma função de C em R.
Dadas f , g ∈ C, as propriedades usuais da integral definida nos dizem que:
|Ix,y( f )− Ix,y(g)| =
∣∣∣∣∫ yx ( f (t)− g(t)) dt
∣∣∣∣
≤ |x− y| sup
t∈[x,y]
| f (t)− g(t)|
≤ |y− x| sup
t∈I
| f (t)− g(t)|
≤ |y− x| ‖ f − g‖I,∞.
Ou seja, Ix,y é uma função L-Lipschitz de C em R, com L := |y− x|.
Exemplo 4.6 Vamos agora considerar uma função de I : C → C que associa a cada f ∈ C uma nova
função I( f ) ∈ C. Para definir esta função I( f ) precisamos definir para cada t ∈ I um valor I( f )(t).
Faremos isso dizendo que
I( f )(t) :=
∫ t
a
f (s) ds (t ∈ I).
Ou seja, I( f ) é a única função com as seguintes duas propriedades: a derivada de I( f ) é f e I( f )(a) = 0.
Obviamente I( f ) ∈ C, pois toda função diferenciável é contı́nua.
Provemos agora que I : C → C é (b− a)-Lipschitz. O que queremos é mostrar que, dadas
f , g ∈ C:
‖I( f )− I(g)‖I,∞ = sup
t∈I
∣∣∣∣∫ ta ( f (s)− g(s)) ds
∣∣∣∣ ≤ (b− a) ‖ f − g‖I,∞.
Mas isto segue do fato que |
∫ t
a ( f (s)− g(s)) ds| ≤ (t− a) sups∈[a,t] | f (s)− g(s)| para cada t ∈ I.
Exercı́cio 4.7 Mostre que Ix,y = ey ◦ I − ex ◦ I .
60
Exemplo 4.7 (EDOs e pontos fixos) Dados (t0, x0) ∈ R×R e Ψ : R → R contı́nua, definimos uma
nova aplicação TΨ,t0,x0 : C → C da seguinte forma: dada f ∈ C, TΨ,t0,x0( f ) ∈ C é a função cujos valores
em cada ponto t ∈ I são dados por
TΨ,t0,x0( f )(t) := x0 +
∫ t
t0
Ψ( f (s)) ds.
Novamente é fácil ver que TΨ,t0,x0 é uma função dem-definida de C em C. A importância dela tem a ver com
a teoria de equações diferenciais ordinárias (ou EDOs). De fato, é um exercı́cio mostrar que uma função
f : I → R resolve o problema de Cauchy autônomo no tempo{
f ′(t) = Ψ( f (t)) (t ∈ I)
f (t0) = x0
se e somente se f é um ponto fixo de TΨ,t0,x0 , ou seja, f = TΨ,t0,x0( f ). Mais adiante desenvolveremos
ferramentas para provar que certas funções contı́nuas têm um único ponto fixo, provando assim que o
problema de Cauchy acima tem uma única solução.
Queremos agora provar que T = TΨ,t0,x0 é contı́nua. Ou seja, dadas { fn}n∈N ∪ { f } ⊂ C,
precisamos mostrar que:
‖ fn − f ‖∞ → 0⇒ ‖T ( fn)− T ( f )‖∞ → 0.
Vamos proceder por partes. Note que
‖T ( fn)− T ( f )‖∞ = ‖I(Ψ ◦ fn)− I(Ψ ◦ f )‖∞ ≤ (b− a) ‖Ψ ◦ fn −Ψ ◦ f ‖∞.
Portanto, o que precisamos é provar que Ψ ◦ fn converge a Ψ ◦ f uniformemente sobre I. Ou
seja, queremos mostrar que:
∀ε > 0 ∃n0 ∈N ∀n ≥ n0 : ‖Ψ ◦ fn −Ψ ◦ f ‖∞ ≤ ε.
Antes de partir para prova, faremos algumas observações. A convergência pontual está asse-
gurada porque Ψ é contı́nua e fn → f pontualmente, de modo que:
∀t ∈ I : fn(t)→ f (t) e portanto Ψ ◦ fn(t) = Ψ( fn(t))→ Ψ( f (t)) = Ψ ◦ f (t).
A convergência uniforme é um pouco mais sutil. O fato de que fn(t) converge uniformemente
a f (t) não implica diretamente que Ψ ◦ fn(t) → Ψ ◦ f (t) de forma uniforme. Para isso, teremos
de usar o fato que Ψ é uniformemente contı́nua sobre intervalos compactos. Ou seja, precisamos nos
recordar que:
∀M > 0 ∀η > 0 ∃δ = δ(M, η) > 0 : ∀x, y ∈ [−M, M], |x− y| ≤ δ⇒ |Ψ(x)−Ψ(y)| ≤ ε.
Note que, em nossa prova, queremos estudar os valores de |Ψ(x)− Ψ(y)| quando x = fn(t)
e y = f (t). Por isso, tomaremos M de modo que os valores de fn(t) e f (t) estejam em [−M, M]
para todo n. De fato, veja que
0 ≤ |‖ fn‖∞ − ‖ f ‖∞| ≤ ‖ fn − f ‖∞ → 0⇒ ‖ fn‖∞ → ‖ f ‖∞ ⇒ M := sup
n∈N
‖ fn‖∞ < +∞.
61
Com essa escolha de M, temos que
∀n ∈N, ∀t ∈ I : | fn(t)| ≤ ‖ fn‖∞ ≤ M, ou seja, fn(t) ∈ [−M, M]
e o mesmo vale para os valores de f (t).
Fixo este M, e dado um ε > 0, podemos tomar δ = δ(M, ε). Sabemos que existe um n0 = n0(ε)
tal que:
∀n ≥ n0, ∀t ∈ I : fn(t), f (t) ∈ [−M, M] e | fn(t)− f (t)| ≤ ‖ fn − f ‖∞ ≤ δ.
Portanto, pela nossa escolha de δ,
∀n ≥ n0 ∀t ∈ I : |Ψ( fn(t))−Ψ( f (t))| ≤ ε.
Ou seja:
∀n ≥ n0 : ‖Ψ ◦ fn −Ψ ◦ f ‖∞ ≤ ε.
Trocando em miúdos, dado ε > 0, fomos capazes de encontrar n0 tal que para todo n ≥ n0 vale
que ‖Ψ ◦ fn −Ψ ◦ f ‖∞ ≤ ε.
Nosso último exemplo é de uma função que não é contı́nua.
Exemplo 4.8 Suponha I = [0, 1] e seja D ⊂ C(I, R) o conjunto de todas as funções diferenciáveis em
t = 1/2. Defina D : D → R como D( f ) := f ′(1/2), f ∈ D. Argumentamos que D não é contı́nua.
De fato, basta observar que existem funções próximas de 0 na norma do sup que têm derivada
arbitrariamente grande em t = 1/2. Por exemplo, tomando
fk(x) :=
1
k
sin(k2(x− 1/2)), (x ∈ [0, 1])
temos que ‖ fk‖I,∞ = 1/k→ 0, mas D( fk) = f ′k(1/2) = k→ +∞.
A observação inocente de que a derivada não é contı́nua tem consequências importantes. Um
problema que abordaremos mais tarde é o de diferenciar uma função f = limk fk. Gostarı́amos
de dizer que f ′(t) = limk→+∞ f ′k(t), mas, como vimos acima, isto nem sempre é verdade. Deste
modo, o problema de diferenciar um limite de funções não é trivial. Em geral só conseguiremos
tratar este problema trocando a derivada, que é mal comportada, por um problema equivalente
envolvendo integrais. Por exemplo, é por esta razão que formulamos o problema de Cauchy em
termos de integrais e não de derivadas.
4.4 Funções contı́nuas de X em Rd
Aqui só temos uma observação a fazer. Se f : D ⊂ X → Rd e x ∈ D são dados, podemos escrever
o vetor f (x) ∈ Rd em coordenadas
f (x) = ( f [1](x), f [2](x), . . . , f [d](x)).
Isto induz funções f [i] : X → R. Como a convergência de elementos de Rd é equivalente à
convergência de todas as coordenadas, vemos que f (xn) → f (x) se e somente se f [i](xn) →
f [i](x) para cada 1 ≤ i ≤ d. Usando isto, não é difı́cil provar o resultado a seguir.
Exercı́cio 4.8 Prove que f : D ⊂ X → Rd é contı́nua em x ∈ D se e somente se cada uma das funções-
coordenada f [i] : D → X definidas acima é contı́nua.
62
4.5 Transformações e funcionais lineares
Uma classe especial de funções (possivelmente) contı́nuas merece uma consideração especial.
Definição 4.3 Se V, W são espaços vetoriais reais, uma função T : V → W é dita uma transformação
linear se:
∀v, v′ ∈ V, ∀λ ∈ R : T(λ v + v′) = λT(v) + T(v′).
Se W = R, dizemos que T é um funcional linear.
Se V = Rd e W = R`, sabemos de Álgebra Linear que há uma correspondência entre
transformações lineares e matrizes. Isso será útil para o exemplo a seguir.
Exemplo 4.9 Qualquer transformação linear T : Rd → R` é Lipschitz (e portanto contı́nua), quando
botamos a norma `p1 em Rd e a norma `p2 em R`.
De fato, sabemos que existe um elemento AT ∈ R`×d que representa T, no sentido que
ATv = T(v) para todo v ∈ Rd. Recordando a definição da norma de operador no Exemplo 2.6,
deduzimos que:
‖T‖Lip := sup
v,v′∈Rd, v 6=v′
|T(v)− T(v′)|p2
|v− v′|p1
(linearidade de T) = sup
v,v′∈Rd, v 6=v′
|T(v− v′)|p2
|v− v′|p1
(tome h = v− v′) = sup
h∈Rd, h 6=0
Rd
|T(h)|p2
|h|p1
(AT representa T + def. da norma de op.) = sup
h∈Rd, h 6=0
Rd
|ATh|p2
|h|p1
= ‖AT‖p1→p2 < +∞.
Em geral, transformações lineares no espaço das funções contı́nuas (ou em subespaços dele)
podem não ser contı́nuas. No entanto, vimos acima dois exemplos importantes de transformações
que são, sim, contı́nuas; de fato, ambas são Lipschitz.
Exemplo 4.10 Usando a notação da Seção 4.3, as funções et, Ix,y : C → R são funcionais lineares
contı́nuos (posto que Lipschitz), I : C → C também é Lipschitz (logo contı́nua) e TΨ,t0,x0 em geral
não é linear. O operador D é um funcional linear descontı́nuo sobre o subconjunto D ⊂ C das funções
diferenciáveis em t = 1/2, que também é um espaço vetorial real.
O teorema abaixo nos diz que uma transformação linear é contı́nua se e somente se é Lips-
chitz.
Teorema 4.1 Considere dois espaços vetoriais reais normados (V, ‖ · ‖V), (W, ‖ · ‖W). Dada umatransformação
linear T : V →W, são equivalentes:
1. T é limitada, ou seja:
‖T‖V→W := sup
v∈V,‖v‖V=1
‖T(v)‖W < +∞.
63
2. T é L-Lipschitz para algum L > 0.
3. T é contı́nua no ponto 0V .
Prova: 1⇒2. Chame de L := ‖T‖V→W . Afirmamos que para quaisquer v, v′ ∈ V vale a desi-
gualdade ‖T(v) − T(v′)‖W ≤ L ‖v − v′‖V . De fato, esta desigualdade é trivialmente satisfeita
se v = v′. Caso contrário, podemos olhar para o vetor z := (v− v′)/‖v− v′‖V ; ele tem norma
‖z‖V = 1 e portanto ‖T(z)‖W ≤ ‖T‖V→W = L. Deduzimos por linearidade que
T(z) =
T(v)− T(v′)
‖v− v′‖V
, portanto
‖T(v)− T(v′)‖W
‖v− v′‖V
= ‖T(z)‖W ≤ L,
como querı́amos demonstrar.
2⇒3 é direto.
3⇒1. A ideia da prova é muito semelhante à que usamos na prova do Teorema 3.3. Supondo
(para chegar a uma contradição) que T não é limitado, podemos encontrar, para cada n ∈ N,
um vetor vn ∈ V com ‖vn‖V = 1 e ‖T(vn)‖W ≥ n + 1. Isto quer dizer que, por um lado,
vn/(n + 1)→ 0V , mas, por outro lado (usando linearidade),∥∥∥∥T( vnn + 1
)∥∥∥∥
W
=
‖T(vn)‖W
n + 1
= 1 6→ 0.
Isto quer dizer que T não é contı́nuo, o que contradiz a hipótese 3. Deduzimos que T é, sim,
limitado, como querı́amos demonstrar. 2
Exercı́cio 4.9 Prove que, de fato,
‖T‖V→W = sup
v∈V\{0}V
‖Tv‖W
‖v‖V
= ‖T‖Lip
e que, portanto, ‖Tv‖W ≤ ‖T‖V→W ‖v‖V para todo v ∈ V.
Exercı́cio 4.10 Chame de L(V, W) o espaço das transformações lineares limitadas entre V e W (como no
teorema acima), com a estrutura ”natural” de soma e produto por escalar. Mostre que
(L(V, W), ‖ · ‖V→W)
é espaço vetorial normado. Prove ainda que este espaço é Banach sempre que (W, ‖ · ‖W) é Banach.
[Dica: a ideia para provar que é espaço normado é mostrar logo de cara que ‖ · ‖V→W é subaditiva.
Para provar que é Banach, mostre que, se {Tn}n∈N ⊂ L(V, W) é uma sequência de Cauchy, então
{Tnv}b∈N é Cauchy para qualquer v ∈ V; deduza que há convergência pontual e pode-se definir
um limite Tv = limn Tnv. Não é difı́cil provar que T é linear pela convergência pontual. Como
provar que T ∈ L(V, W) e ‖Tn − T‖V→W → 0?]
64
4.6 Transformações multilineares e tensores
Uma extensão importante das espaços vetoriais é a de transformações multilineares.
Definição 4.4 Considere espaços vetoriais reais V1, V2, . . . , Vk, W com suas respectivas normas. Uma
função:
Q : V1 ×V2 × · · · ×Vk →W
é dita transformação k-linear se é linear em cada argumento, isto é, se, dados um ı́ndice i ∈ [k] e vetores
vj ∈ Vj, j ∈ [k]\{i}, a função
Qi : ṽi ∈ Vi 7→ Q(v1, . . . , vi−1, ṽi, vi+1, . . . , vk) ∈W
é uma transformação linear de Vi em W. Dizemos que Q é limitada se
‖Q‖V1×...Vk→W := sup
(v1,...,vk)∈(V1\{0V1})×···×(Vk\{0Vk})
‖Q(v1, v2, . . . , vk)‖W
∏ki=1 ‖vi‖Vi
< +∞.
Ou seja, Q é multilinear se é “linear em cada coordenada”. Veremos mais adiante no curso
que as funções k-lineares aparecem como as derivadas de ordem k de funções entre espaços
vetoriais.
Logo de cara, provamos um teorema parecido com o Teorema 4.1 relacionando continuidade
e limitação.
Teorema 4.2 No contexto da definição acima, dote o espaço produto V := V1 ×V2 × · · · ×Vk da norma:
‖(v1, . . . , vk)‖V :=
k
∑
i=1
‖vi‖Vi ((v1, . . . , vk) ∈ V).
Então Q : V →W é contı́nua se e somente se é limitada.
Veja que, neste caso, não garantimos que Q é Lipschitz. De fato, funções bilienares em geral
não são Lipschitz. O exemplo mais simples é o da função produto Q : R×R→ R que leva (x, y)
em xy.
Prova: Vamos começar provando que “limitada⇒contı́nua”.
Suponha que L := ‖Q‖V1×...Vk→W < +∞. Imagine que temos uma sequência {vn}n∈N ⊂ V e
um ponto v ∈ V com vn → v. Nosso objetivo será mostrar que Q(vn)→ Q(v).
Escrevemos
vn = (vn,1, vn,2, . . . , vn,k) ∈ V1 ×V2 × · · · ×Vk
e
v = (v1, v2, . . . , vk) ∈ V1 ×V2 × · · · ×Vk.
A ideia principal da prova é a seguinte. A convergência vn → v implica que vn,i → vi, como
veremos a seguir. Deste modo, esperamos que vn,i esteja próximo de vi para n grande. Nossa
ideia será usar essa proximidade “coordenada a coordenada” para comparar Q(vn) e Q(v). Para
isso, vamos tentar escrever Q(v)− Q(vn) passando de v a vn de uma forma que só muda uma
coordenada de cada vez, porque aı́ poderemos usar a linearidade.
65
Para ilustrar isso, vamos considerar o caso em que k = 2 e Q é bilinear. Dados v = (v1, v2), u =
(u1, u2) ∈ V podemos escrever:
Q(v1, v2)−Q(u1, u2) = Q(v1, v2)−Q(u1, v2)+Q(u1, v2)−Q(u1, u2) = Q(v1−u1, v2)+Q(u1, v2−u2).
Portanto,
‖Q(v1, v2)−Q(u1, u2)‖ ≤ ‖Q‖V→W‖v1 − u1‖V1 ‖v2‖V2 + ‖Q‖V→W ‖u1‖V1‖v2 − u2‖V2 .
Disso podemos deduzir que, se u1 → v1 e u2 → v2, então Q(u1, u2) → Q(v1, v2). Daremos mais
detalhes abaixo na prova para Q geral.
Comecemos com a parte de convergência. Nossa hipótese diz que
‖v− vn‖V =
k
∑
i=1
‖vi − vn,i‖Vi → 0.
Como os termos da soma acima são não-negativos, temos que
0 ≤ min
1≤i≤k
‖vi − vn,i‖Vi ≤ max1≤i≤k
‖vi − vn,i‖Vi → 0.
Portanto,
∀1 ≤ i ≤ k : ‖vi − vn,i‖Vi → 0.
Em particular, cada sequência ‖vi − vn,i‖Vi é limitada, de modo que existe um C > 0 com
∀1 ≤ i ≤ k, ∀n ∈N : ‖vi − vn,i‖Vi ≤ C.
Consideramos agora termos “intermediários”w(j)n entre vn e v, com j = 0, . . . , k, que definimos
da seguinte forma.
w(j)n = (w
(j)
n,1, w
(j)
n,2, . . . , w
(j)
n,k) ∈ V1 ×V2 × · · · ×Vk
onde
w(j)n,i =
{
vn,i, i ≤ j;
vi, i > j.
(i ∈ [k])
Deste modo, w(0)n = v, w
(k)
n = vn e cada w
(j)
n difere de w
(j−1)
n apenas na j-ésima coordenada.
Usando uma soma telescópica, podemos escrever:
Q(v)−Q(vn) =
k
∑
j=1
Q(w(j)n )−Q(w
(j−1)
n ).
Portanto,
‖Q(v)−Q(vn)‖W ≤
k
∑
j=1
‖Q(w(j)n )−Q(w
(j−1)
n )‖W .
Recorde agora que cada w(j)n difere de w
(j−1)
n apenas na j-ésima coordenada. Esse é o tipo de
situação em que a multilinearidade de Q se aplica. Mais exatamente, vemos que
Q(w(j)n )−Q(w
(j−1)
n ) = Q(x
(j)
n,1, . . . , x
(j)
n,k) onde x
(j)
n,k =

vn,i, i < j;
vn,j − vj, i = j;
vi, i > j.
(i ∈ [k]).
66
Portanto,
‖Q(w(j)n )−Q(w
(j−1)
n )‖W ≤ ‖Q‖V1×···×Vk→W
k
∏
j=1
‖x(j)n,k‖Vj ≤ L C
k−1 ‖vn,j − vj‖Vj .
Deduzimos que
‖Q(v)−Q(vn)‖W ≤ L Ck−1
k
∑
j=1
‖vn,j − vj‖W → 0,
como querı́amos demonstrar.
Resta provar que “contı́nua⇒limitada”. De fato, usaremos a forma contrapositiva “não-
limitada⇒não-contı́nua”. Se Q não é limitada, então para qualquer n ∈ N existem vn,1 ∈
V1\{0V1}, . . . , vn,k ∈ Vk\{0Vk} com
‖Q(vn,1, vn,2, . . . , vn,k)‖W
∏ki=1 ‖vn,i‖Vi
≥ n.
Se definimos un,i = vn,i/ ln n‖vn,i‖Vi e
un = (un,1, . . . , un,k) ∈ V,
vemos que
Q(un,1, un,2, . . . , un,k) =
Q(vn,1, vn,2, . . . , vn,k)
∏ki=1 (ln n ‖vn,i‖Vi)
e portanto ‖Q(un,1, un,2, . . . , un,k)‖W ≥ n/(ln n)k → +∞. Por outro lado,
‖(un,1, un,2, . . . , un,k)‖V =
k
∑
i=1
‖un,i‖Vi =
k
ln n
→ 0.
Portanto, achamos uma sequência {un}n∈N ⊂ V que converge a 0V , sem que Q(un) converja a
Q(0V). 2
Exercı́cio 4.11 Por que escolhemos a função ln n na hora de “renormalizar os vn,i” na prova acima?
Mostre que, de fato, poderı́amos ter tomado a função n1/k−a acima, com qualquer 0 < a < 1/k, e a mesma
estratégia ainda funcionaria.
Exercı́cio 4.12 Chame de Lk(V1 × · · · × Vk, W) o espaço das transformações k-lineares limitadas entre
V1, . . . , Vk e W (como no teorema acima), com a estrutura ”natural” de soma e produto por escalar. Mostre
que
(Lk(V1 × · · · ×Vk, W), ‖ · ‖V1×···×Vk→W)
é espaço vetorial normado. Prove ainda que este espaço é Banach sempre que (W, ‖ · ‖W)é Banach.
67
4.6.1 Tensores em dimensão finita
Como são as funções multilineares Q : Rd1 ×Rd2 × . . . Rdk → R com k ≥ 2? Vamos chamar de
{e(dj)i }
dj
i=1 a base canônica de R
dj . Como todo xj ∈ Rdj é da forma
xj =
dj
∑
i=1
xj[i] e
(dj)
i
temos que
Q(x1, . . . , xk) =
d1
∑
i1=1
· · ·
dk
∑
ik=1
A[i1, . . . , ik]
k
∏
j=1
xj[ij] (x1 ∈ Rd1 , . . . , xk ∈ Rdk). (4.1)
onde A[i1, . . . , ik] := Q(e
(d1)
i1
, . . . , e(dk)ik ) ∈ R.
Do mesmo modo, se chamados de tensor qualquer elemento do espaço
Rd1×d2×···×dk := {A = (A[i1, . . . , ik])i1∈[d1]....,ik∈[dk ] : cada A[i1, . . . , ik] ∈ R},
vemos que cada tensor defineuma transformação multilinear de Rd1 × . . . Rdk em R. Portanto,
há uma correspondência biunı́voca entre tensores e tais transformações. Em particular, no caso
k = 2, os tensores são matrizes as funções bilineares correspondentes são formas quadráticas.
Q(x, y) = x · Ay para alguma matriz A.
A extensão para o caso em que o contradomı́nio é (W, ‖ · ‖W) é imediata.
Um ponto importante é que, no contexto em que estamos trabalhando, toda Q multilinear é
contı́nua.
Proposição 4.1 Toda transformação multilinear Q : Rd1 ×Rd2 × . . . Rdk → R é contı́nua.
Prova: Como sabemos, basta provar que Q é limitada.
Considere o tensor A correspondente e chame de
L := max
(i1,...,ik)∈[d1]×···×[dk ]
|A[i1, . . . , ik]|.
Veja que, dado (x1, . . . , xk) no domı́nio do tensor:
|Q(x1, . . . , xk)| =
∣∣∣∣∣ d1∑i1=1 · · ·
dk
∑
ik=1
A[i1, . . . , ik] x1[i1] x2[i2] . . . xk[ik]
∣∣∣∣∣
≤
d1
∑
i1=1
· · ·
dk
∑
ik=1
|A[i1, . . . , ik]| |x1[i1]| |x2[i2]| . . . |xk[ik]|
≤ L
d1
∑
i1=1
· · ·
dk
∑
ik=1
|x1[i1]| |x2[i2]| . . . |xk[ik]|
= L
k
∏
i=1
‖xi‖1
≤ L d k2
k
∏
i=1
‖xi‖2.
Deduzimos que a norma de Q é no máximo L dk/2. 2
68
4.6.2 Alguns exemplos em dimensão infinita
Agora tomamos C = C(I, R) com I = [a, b], a < b reais. Veremos dois exemplos de transformação
bilinear de C× C em C.
Exemplo 4.11 (Produto) Defina Prod : C× C → C via a fórmula
Prod( f , g) := f g.
Ou seja, a função Prod toma como entrada duas funções contı́nuas e retorna seu produto f g.
Como o produto de funções contı́nuas é uma função contı́nua, esta é uma aplicação bem
definida de C× C em C.
A bilinearidade de Prod fica como exercı́cio. Para mostrar que esta aplicação é limitada, e
portanto contı́nua, basta observar que:
‖Prod( f , g)‖∞ ≤ ‖ f ‖∞ ‖g‖∞
e portanto
‖Prod‖C×C→C ≤ 1.
Exemplo 4.12 (Convolução) Suponha para simplificar que [a, b] = [0, 1]. Defina Conv : C × C → C
via a fórmula
Conv( f , g)(t) = f ∗ g(t) :=
∫ t
0
f (s) g(t− s) ds (t ∈ I).
Para fixar, a expressão acima quer dizer o seguinte: dadas as funções f , g : I → R, formamos
uma nova função Conv( f , g) = f ∗ g. Essa função estará definida do momento em que espe-
cificamos o valor de f ∗ g(t) para cada ponto t ∈ I. Nossa especificação é dada pela integral
acima.
Queremos provar que esta é uma operação bilinear limitada (contı́nua) Conv : C× C → C. A
bilinearidade é evidente e a limitação vem do fato de que
∀t ∈ [0, 1] :
∣∣∣∣∫ t0 f (s) g(t− s) ds
∣∣∣∣ ≤ sup
t,s∈I
| f (s)| |g(t− s)| ≤ ‖ f ‖∞ ‖g‖∞.
Portanto,
∀ f , g ∈ C : ‖Conv( f , g)‖∞ ≤ ‖ f ‖∞ ‖g‖∞.
A parte mais difı́cil do argumento é mostrar que f ∗ g é uma função contı́nua para quaisquer
f , g ∈ C. Para fazer isso, fixamos primeiramente um t′ ∈ I e estimamos a diferença:
f ∗ g(t)− f ∗ g(t′)
no caso em que |t− t′| = δ. Para facilitar, supomos que t′ ≤ t, pois o outro caso é análogo. Veja
que
f ∗ g(t)− f ∗ g(t′) =
∫ t
0
f (s) g(t− s) ds−
∫ t′
0
f (s) g(t′ − s) ds
=
∫ t′
0
f (s) (g(t− s)− g(t′ − s)) ds +
∫ t
t′
f (s) g(t− s) ds
=: (I) + (I I).
69
O termo (I I) acima é no máximo:
|(I I)| =
∣∣∣∣∫ tt′ f (s) g(t− s) ds
∣∣∣∣ ≤ |t− t′| sup
t,s∈I
| f (s)| |g(t− s)| ≤ δ ‖ f ‖∞ ‖g‖∞.
Já o primeiro termo (I) é limitado por:
|(I)| =
∣∣∣∣∫ t′0 f (s) (g(t− s)− g(t′ − s)) ds
∣∣∣∣
≤ sup
t,t′,s∈I : |t−t′|≤δ
| f (s)||g(t− s)− g(t′ − s)|
≤ ‖ f ‖∞ sup
a,b∈I, |a−b|≤δ
|g(a)− g(b)|.
Portanto,
|t− t′| = δ⇒ 0 ≤ | f ∗ g(t)− f ∗ g(t′)| ≤ δ ‖ f ‖∞ ‖g‖∞ + ‖ f ‖∞ sup
a,b∈I, |a−b|≤δ
|g(a)− g(b)|.
Agora imagine que t′ → t, de modo que δ → 0. Veja que o primeiro termo do lado direito
vai a 0. O segundo também, porque g : I → R é contı́nua e portanto uniformemente contı́nua.
Deduzimos que:
0 ≤ lim
t′→t
| f ∗ g(t)− f ∗ g(t′)| ≤ lim sup
δ→0
(δ ‖ f ‖∞ ‖g‖∞ + ‖ f ‖∞ sup
a,b∈I, |a−b|≤δ
|g(a)− g(b)|) = 0.
Ou seja, f ∗ g é contı́nua em t, para qualquer t ∈ I.
4.7 Mais exercı́cios
Exercı́cio 4.13 Tome a norma 2→ 2 nos espaços de matrizes Rd1×d2 e Rd2×d3 . Prove que a aplicação
Mult : Rd1×d2 ×Rd2×d3 → Rd1×d3
que leva (A1, A2) ∈ Rd1×d2 ×Rd2×d3 em A1A2 é bilinear e limitada, com norma
‖Mult‖
Rd1×d2×Rd2×d3→Rd1×d3 = 1.
Enuncie e esboce a prova de uma versão do resultado acima para o produto de k > 2 matrizes.
Exercı́cio 4.14 Dado um espaço métrico (X, dX), chamamos de BC = BC(X, Rd) o espaço de funções
contı́nuas e limitadas de X a Rd. Isto é, uma f : X → Rd pertence a BC se é contı́nua e ‖ f ‖∞ :=
supx∈X | f (x)|2 < +∞. Prove que (BC(X, Rd), ‖ · ‖∞) é espaço de Banach (a estrutura de espaço vetorial
em BC(X, Rd) é definida da maneira “natural”).
Exercı́cio 4.15 Veremos neste exercı́cio e nos próximos algumas propriedades da notação ‖ f ‖Lip introdu-
zida na observação 4.1 acima. Como lá, supomos que f : D → Y com D ⊂ X e (X, dX), (Y, dY) espaços
métricos. Prove que:
∀L ∈ R+ : f é L-Lipschitz ⇔ L ≥ ‖ f ‖Lip.
Deduza que f é Lipschitz (com alguma constante) se e somente se ‖ f ‖Lip < +∞.
70
Exercı́cio 4.16 Seguimos com a notação do exercı́cio anterior, mas agora no caso especı́fico em que Y = R
com a métrica usual.
1. Mostre que ‖ · ‖Lip é subaditiva e positiva-homogênea, mas ‖ f ‖Lip = 0 não implica f = 0.
2. Dadas f , g : D → R, mostre que
‖min{ f , g}‖Lip, ‖max{ f , g}‖Lip ≤ max{‖ f ‖Lip, ‖g‖Lip};
em particular, o mı́nimo e o máximo de funções Lipschitz também é Lipschitz.
3. Suponha que F é uma famı́lia de funções Lipschitz de D em R tal que
∀x ∈ D, inf
f∈F
f (x) ∈ R.
Mostre que a funcão f∗ : D → R que associa a cada x ∈ D o valor f∗(x) = inf f∈F f (x) satisfaz:
‖ f∗‖Lip ≤ sup
f∈F
‖ f ‖Lip.
4. Suponha agora que F é uma famı́lia de funções Lipschitz de D em R tal que
∀x ∈ D, sup
f∈F
f (x) ∈ R.
Mostre que a funcão f ∗ : D → R que associa a cada x ∈ D o valor f ∗(x) = sup f∈F f (x) satisfaz:
‖ f ∗‖Lip ≤ sup
f∈F
‖ f ‖Lip.
(Juntos, este item e o anterior mostram que o ı́nfimo e supremo de funções Lipschitz com constantes
uniformemente limitadas também é Lipschitz.)
5. Finalmente, suponha que fn : D → R (n ∈N) converge pontualmente a f : D → R. Prove que
‖ f ‖Lip ≤ lim inf
n∈N
‖ fn‖Lip.
Exercı́cio 4.17 Complementando o exercı́cio anterior, considere o espaço BL(X, R) de todas as funções
f : X → R satisfazendo ‖ f ‖∞ := supx∈R | f (x)| < +∞ e ‖ f ‖Lip < +∞ (este é o espaço das funções
“bounded Lipschitz”, ou seja, Lipschitz e limitadas). Prove as seguintes propriedades.
1. BL(X, R) é espaço vetorial com as operações naturais de soma e multiplicação por escalar. Além
disso,
‖ f ‖BL := ‖ f ‖∞ + ‖ f ‖Lip ( f ∈ BL(X, R))
é norma sobre este espaço.
2. (BL(X, R), ‖ · ‖BL) é Banach.
3. Dadas f , g ∈ BL(X, R), temos que f .g, min{ f , g} e max{ f , g} também pertencem a BL(X, R).
71
Exercı́cio 4.18 Este exercı́cio mostra que toda função contı́nua e limitada de um espaço métrico em R é
o limite pontual de uma sequência crescente de funções Lipschitz. Nos últimos itens, discutiremos se esta
convergência pode ser tomada uniforme.
Tome um espaço métrico (X, dX) e uma função limitada f : X → R. Dado M > 0, chame de fM a
seguinte aproximação de f , chamada de ı́nfimo-convolução:
fM(x) := inf
y∈X
( f (y) + M dX(x, y)).
1. Mostre que fM(x) ≤ f (x) para todo x ∈ X.
2. Prove que fM é M-Lipschitz e que fM = f se ‖ f ‖Lip ≤ M.
3. Demonstre que se x ∈ X e M < M′ são dados, fM(x) ≤ fM′(x).
4. Prove que, quando M ↗ +∞, fM(x) ↗ f (x) para todo ponto x ∈ X onde f é contı́nua. [Dica:
observe que o inf na definição de fM pode ser tomado no conjunto de pontos y ∈ X com
d(x, y) ≤ 2‖ f ‖∞/M.]
5. A convergência no item anterior pode ser sempre tomada uniforme em x ∈ X? Explique.
6. Recorde que f é uniformemente contı́nua
∀ε > 0 ∃δ > 0 ∀x, y ∈ X : d(x, y) ≤ δ⇒ | f (x)− f (y)| ≤ ε.
Mostre que, se f é uniformemente contı́nua, então ‖ fM − f ‖∞ → 0.
Mais adiante você poderá provar que ‖ fM − f ‖∞ → 0 quando X é compacto.
Exercı́cio 4.19 Recorde a definição de convolução de f , g : [0, 1]→ R nas notas de aula.
1. Suponha que f , g :[0, 1] → R são dadas, que g ∈ C([0, 1], R) e que f é contı́nua por partes:
isto é, existem a0 = 0 < a1 < · · · < ak = 1 e funções contı́nuas fi : [ai−1, ai] → R tais que
f |(ai−1,ai)= fi |(ai−1,ai). Suponha ainda que f é limitada. Prove que f ∗ g é bem definida e contı́nua.
2. Suponha agora que f ∈ C([0, 1], R) e g ∈ C([0, 1], R) é diferenciável com g′ ∈ C([0, 1], R). Mostre
que f ∗ g é diferenciável com derivada contı́nua.
Exercı́cio 4.20 Mostre que o operador de convolução iterada f1 ∗ f2 ∗ · · · ∗ fk é um operador k-linear e
limitado sobre (C([0, 1], R))k.
72
Parte II
Topologia e geometria em espaços
métricos
73
Capı́tulo 5
Abertos, fechados e topologias
Neste capı́tulo, começaremos a discutir conceitos topológicos. Veremos o que são conjuntos aber-
tos e fechados em um espaço métrico; discutiremos porque os abertos formam o que se chama de
topologia; relacionaremos continuidade a estes dois conceitos; e ainda, trataremos da topologia re-
lativa que um conjunto pode herdar de outro maior. A linguagem e os resultados desenvolvidos
aqui serão importantes para tudo o que vem a seguir.
Ao longo deste capı́tulo, (X, dX) será um espaço métrico dado. Dados x ∈ X e r ≥ 0,
denotamos por B(X,dX)(x, r) BX(x, r) ou apenas B(x, r) a chamada bola aberta de raio r ao redor de x:
B(x, r) := {y ∈ X : d(x, y) < r}.
Também definimos a bola fechada B(X,dX)[x, r], BX[x, r] ou B[x, r] como
B[x, r] := {y ∈ X : d(x, y) ≤ r}.
Exercı́cio 5.1 Mostre que, dados 0 ≤ r′ < r,
B(x, 0) = ∅ ⊂ B[x, 0] = {x} ⊂ B[x, r′] ⊂ B(x, r) ⊂ B[x, r].
Mostre ainda que B[x, 0] = B[x, 1/2] = B(x, 1) = {x} se a métrica é discreta.
Agora podemos apresentar as principais definições de topologia de espaços métricos.
Definição 5.1 A ⊂ X é dito aberto (segundo a métrica dX) se para todo x ∈ X existe um δ > 0 tal que
BX(x, δ) ⊂ A. F ⊂ X é dito fechado (também segundo a métrica dX) se X\F é aberto.
Frequentemente falaremos de abertos da seguinte maneira: um conjunto é aberto se todo
x ∈ A tem uma ”bolha protetora”(BX(x, δ) com δ > 0) que o ”protege do mundo exterior” por
estar toda contida em A.
Vejamos como se comportam os conceitos de ”aberto” e ”fechado” sob a métrica discreta.
Exemplo 5.1 Todos os subconjuntos são abertos e fechados se a métrica é discreta. Isto porque, como visto
acima, todo dado A ⊂ X, temos
∀x ∈ A : {x} = BX(x, 1) ⊂ A.
Do mesmo modo, Ac também é aberto.
75
Também observamos que toda bola aberta é aberta. A prova é simples, mas será apresentada
inteira para que possamos praticar o conceito.
Exemplo 5.2 Toda bola aberta é um conjunto aberto.
Para ver isso, tome uma bola B(x, r) com r > 0 e um elemento y ∈ B(x, r). Nosso objetivo
é mostrar que existe um raio positivo δ > 0 tal que B(y, δ) ⊂ B(x, r). Para isso, é necessário
provar que δ > 0 tem a seguinte propriedade: todo z ∈ B(y, δ) também está em B(x, r). Usando
as definições das bolas, isto significa que devemos mostrar o seguinte:
Queremos: ∃δ > 0 ∀z ∈ X : d(z, y) < δ⇒ d(z, x) < r.
O que nos permite achar este δ é a desigualdade triangular. Afinal, sabemos que
∀δ > 0 ∀z ∈ X : d(z, y) < δ⇒ d(x, z) ≤ d(z, y) + d(y, x) < δ + d(y, x).
Logo, precisamos escolher δ tal que δ + d(y, x) < r e δ > 0. Como d(x, y) < r (já que y ∈ B(x, r)),
podemos escolher δ := r− d(x, y) > 0 e terminar assim a prova.
Exemplo 5.3 De forma semelhante, toda bola fechada B[x, r] é um subconjunto fechado de X, onde agora
r ≥ 0.
De fato, isto equivale a mostrar que X\B[x, r] é aberto, ou seja, que para todo todo y ∈
X\B[x, r] existe um δ > 0 tal que B(y, δ) ⊂ X\B[x, r]. A condição necessária sobre δ desta vez é
que
Queremos: ∃δ > 0 ∀z ∈ X : d(z, y) < δ⇒ d(z, x) > r.
Novamente é a desigualdade triangular que usaremos para achar este δ. Afinal
d(z, y) < δ⇒ d(x, z) ≥ −d(z, y) + d(y, x) > d(y, x)− δ.
Como y 6∈ B[x, r], d(x, y) > r, podemos tomar δ = r− d(x, y) e garantir que d(z, y) < δ implica
d(z, x) > r.
Exercı́cio 5.2 Prove que ∅ e X são ambos abertos e fechados.
Exercı́cio 5.3 Prove que os intervalos abertos e fechados de R são mesmo abertos e fechados, segundo a
definição acima. (De fato, todo intervalo aberto ou fechado de comprimento finito é uma bola aberta.)
Exercı́cio 5.4 Dados (X, dX), x ∈ X e r1, r2 > 0, prove que BX(x, r1)∪ BX(x, r2) = BX(x, max{r1, r2})
e BX(x, r1) ∩ BX(x, r2) = BX(x, min{r1, r2}). Prove um resultado semelhante para bolas fechadas.
Nas definições acima definimos fechado em função de aberto. O próximo resultado nos permite
definir o que é um conjunto fechado em termos de limites de sequências.
Teorema 5.1 F ⊂ X é fechado se e somente se limn xn ∈ F para toda sequência convergente {xn}n∈N ⊂
F.
76
Prova: [do Teorema 5.1] Fixe um conjunto F ⊂ X. Como a definição de fechado é em função da
de aberto, temos de recorrer a A := X\F. O que a proposição diz é:
A é aberto ⇔ toda seq. convergente {xn}n ⊂ X\A tem limite em X\A.
Vamos provar primeiro a direção “⇒”. Supondo que A é aberto, seja {xn}n qualquer sequência
convergente contida em X\A e seja x = limn xn. Suponha (para chegar a uma contradição) que
x 6∈ X\A, ou seja, x ∈ A. Como A é aberto, existe um r > 0 tal que B(y, r) ⊂ A. Por outro lado,
como xn 6∈ A para todo n, temos:
∀n ∈N : xn 6∈ B(x, r), isto é, d(xn, x) ≥ r.
Segue que d(xn, x) não converge a 0, ou seja, x não é o limite da sequência. Como isto é uma
contradição, deduzimos que x ∈ X\A.
Agora mostraremos a direção “⇐” da equivalência via a afirmação contrapositiva. Isto é,
mostraremos que:
se A não é aberto, então ∃{xn} ⊂ X\A com limn xn ∈ A.
Vejamos: se A não é aberto, então existe um ponto x ∈ A tal que B(x, r) 6⊂ A para qualquer
r > 0. Em particular, dado n ∈ N, podemos sempre encontrar um elemento xn ∈ B(x, 1/(n +
1)) ∩ (X\A). Isto quer dizer que:
xn ∈ B(x, 1/(n + 1)) ∩ (X\A)
(intersecção)⇒
{
xn ∈ B(x, 1/(n + 1)) ⇒ dX(x, xn) < 1/(n + 1); e
xn ∈ X\A.
Deste modo, vemos que x ∈ A, dX(xn, x) → 0(ou seja, xn → x) e {xn}n∈N ⊂ X\A. Ou seja,
supondo que A não é aberto, provamos que há uma sequência contida em X\A com limite em A.
2
Exercı́cio 5.5 Demonstre o seguinte escólio da demonstração acima: um ponto x ∈ X é o limite de uma
sequência de pontos em S ⊂ X se e somente se B(x, r) ∩ S 6= ∅ para todo r > 0.
5.1 Os abertos formam uma topologia
Nesta seção provaremos que os abertos de um espaço métrico formam uma topologia. Primeiro
temos de definir esta palavra.
Definição 5.2 Uma topologia sobre um conjunto X 6= ∅ é uma coleção T de subconjuntos de X, chama-
dos de abertos da topologia T , ou ainda abertos de X segundo T , com as seguintes propriedades.
Axioma 1: ∅, X ∈ T (o vazio e o espaço inteiro são abertos).
Axioma 2: Dada A ⊂ T , temos ∪A∈A A ∈ T (uniões de abertos são sempre abertas).
Axioma 3: Dados A, A′ ∈ T , temos A ∩ A′ ∈ T (interseções de pares de abertos são abertas).
Os conjuntos F ⊂ X com X\F ∈ T são chamados de fechados de T .
77
Exercı́cio 5.6 Todo X possui duas topologias extremas: Tgrossa = {∅, X} e T f ina = {todos os subconjun-
tos de X}. Mostre que estas topologias são mesmo topologias.
Exercı́cio 5.7 Mostre que a interseção de um número finito de conjuntos abertos é sempre um conjunto
aberto.
O principal resultado desta seção é que os abertos de um espaço métrico formam uma topo-
logia.
Teorema 5.2 Considere um espaço métrico (X, dX). Seja T(X,dX) a coleção de todos os subconjuntos de X
que são abertos na noção dada pela métrica dX. Então T(X,dX) é uma topologia sobre X.
Como veremos na prova, o conteúdo deste teorema é basicamente o seguinte.
Corolário 5.1 Qualquer união de abertos em (X, dX) é também um conjunto aberto. Qualquer interseção
de dois conjuntos abertos em X é aberta (do mesmo modo, qualquer interseção finita é aberta).
Note que interseções infinitas podem não ser abertas. Por exemplo, em R (com a métrica
usual), a coleção de conjuntos
A := {(−t, t) : t > 0}
tem interseção {0},que não é aberto.
Prova: [Teorema 5.2] Veja que ∅, X são abertos de X: nenhum elemento está contido em ∅
(logo ele é aberto por vacuidade) e todas as bolas estão contidas em X (que é aberto, portanto).
Concluı́mos que ambos pertencem a TdX , so seja, vale o primeiro axioma de uma topologia.
Provaremos agora que vale o segundo axioma. Dada uma coleção qualquer de abertos A ⊂ TdX ,
queremos provar que ∪A∈AA ∈ TdX . Recorde o que isto quer dizer: se tomarmos um elemento
qualquer x ∈ ∪A∈AA, deve existir um raio positivo r com BX(x, r) ⊂ ∪A∈AA. Para achar o raio,
lembramos que um dado x só pode pertencer à união se pertence a pelo menos um dos conjuntos
Ax ∈ A. Como todos os elementos de A são abertos, sabemos que Ax é aberto e x ∈ Ax. Logo,
existe um r > 0 tal que BX(x, r) ⊂ Ax. Também sabemos que Ax ⊂ ∪A∈AA, pois a união dos
conjuntos A ∈ A contem todos os conjuntos A ∈ A. Como a relação “⊂” é transitiva, deduzimos
que BX(x, r) ⊂ ∪A∈AA. Dito de outro modo: como x está num conjunto da união, ele tem uma
“bolha” ao seu redor dentro deste conjunto e, portanto, tem uma bolha na união.
Consideremos agora o terceiro axioma, que fala da interseção de dois abertos A, A′ ⊂ X. Para
provar que A ∩ A′ é aberto, devemos mostrar que, dado um x ∈ A ∩ A′, temos B(x, r) ⊂ A ∩ A
para algum r > 0. Para isto, partimos do fato de que A e A′ são ambos abertos e que x pertence
aos dois; afinal, só assim x pode estar na interseção. Deduzimos:
x ∈ A ∩ A′ (intersecção)⇒
{
x ∈ A ⇒ ∃R > 0 : B(x, R) ⊂ A (porque A é aberto)
x ∈ A′ ⇒ ∃R′ > 0 : B(x, R′) ⊂ A (porque A′ é aberto)
Tomemos então r = min{R, R′}. Como R, R′ > 0, r > 0 também. Além disso, B(x, r) ⊂ B(x, R) ⊂
A e B(x, r) ⊂ B(x, R′) ⊂ A′, de modo que B(x, r) ⊂ A ∩ A′. Ou seja, mostramos que a “menor
das bolhas” que x tem dentro de A e A′ está inteiramente contida na interseção. 2
78
Exercı́cio 5.8 De modo geral, chamamos uma topologia T sobre X de metrizável se ela provem de uma
métrica, ou seja, se existe uma métrica sobre X tal que T = TdX . Mostre que existem topologias não
metrizáveis; por exemplo, a topologia grossa definida acima não é metrizável.
O estudo de espaços topológicos gerais é chamado de Topologia Geral. Esta área tem relações
profundas com a Lógica e a Teoria de Conjuntos. De fato, muitas propriedades que já estudamos
e ainda estudaremos são demonstradas com apelos simples às leis de DeMorgan para operações
com conjuntos. Por exemplo:
1. O complementar do complementar é o próprio conjunto. Fixo X, o complementar de S ⊂ X é
Sc := {x ∈ X : x 6∈ S} = X\S.
A operação complementar é idempotente: ou seja, (Sc)c = S.
2. O complementar da união é a interseção dos complementares. Com X como acima, se A é uma
coleção de subconjuntos de X,
(
⋃
A∈A
A)c =
⋂
A∈A
Ac.
Estas leis são uma ótima maneira de passarmos de propriedades de abertos para as de fecha-
dos. Por exemplo, o exercı́cio abaixo segue diretamente desse tipo de observação.
Exercı́cio 5.9 Mostre que, em qualquer espaço topológico, qualquer interseção de conjuntos fechados é
fechada. Prove ainda que a união de um número finito de conjuntos fechados resulta em outro conjunto
fechado. (Estes dois fatos seguem das leis sobre complementares de uniões e interseções aplicadas às propri-
edades dos abertos.)
5.2 Outros conceitos topológicos
Vamos definir aqui algumas outras noções topológicas e fazer alguns comentários sobre elas.
Começamos supondo apenas que (X, T ) é um espaço topológico e abertos e fechados são defi-
nidos a partir de T .
Definição 5.3 (Interior, fecho e fronteira) O interior de S ⊂ X, denotado por So, é definido por:
So :=
⋃
A⊂S : A aberto
A.
O fecho de S é:
S :=
⋂
F⊃S : F fechado
F.
A fronteira de S é ∂S := S ∩ Sc, onde Sc é definido como na seção anterior.
A primeira coisa para observar sobre estes conceitos é um resultado simples.
Proposição 5.1 Com as definições acima, So é aberto, enquanto S e ∂S são sempre fechados.
Prova: So é união de abertos, logo aberto. S é interseção de fechados, logo fechado. Por fim, ∂S é
a interseção de fechados, logo fechado. 2
79
Proposição 5.2 O complementar do fecho de S ⊂ X é o interior do complementar de S: (S)c = (Sc)o.
Prova: A principal observação na prova é que um conjunto F ⊂ X é um fechado com F ⊃ S se e
somente se A = Fc é um aberto com A = Fc ⊂ Sc. Isto decorre do fato que a operação de tomar
o complementar troca a ordem de inclusões (o que vale em geral para conjuntos) e também troca
fechados por abertos (o que sempre vale em espaços topológicos).
Dada a afirmação acima, e a regra para interseções e uniões de complementares, deduzimos:
(S)c =
( ⋂
F⊃S fechado
F
)c
=
⋃
F⊃S fechado
Fc =
⋃
A⊂Sc aberto
A = (Sc)o.
2
Agora vamos tentar pensar no que os conceitos significam, partindo do princı́pio que um
conjunto aberto “protege” seus elementos do mundo exterior (como falamos das bolhas acima).
Segue das regras da união que um ponto x ∈ X é elemento de So se e somente se existe um
aberto A ⊂ X com x ∈ A; isto é, x ∈ So se está “protegido do complementar de S”. Por esta
razão, o resultado abaixo é natural.
Proposição 5.3 S é aberto se e somente se S = So.
Prova: Se S = So, S é aberto porque So é aberto. Por outro lado, se S é aberto, o próprio S é um
daqueles conjuntos A ⊂ S abertos na definição do interior. Deduzimos:
S ⊂
⋃
A⊂S aberto
A = So ⊂ S⇒ So = S.
2
Para o fecho, temos um resultado análogo ao acima.
Exercı́cio 5.10 S é fechado se e somente se S = S.
Veremos agora que um ponto x ∈ X está em S se “não há como protegê-lo de S”.
Proposição 5.4 Dado x ∈ X,
x ∈ S⇔ “∀A ⊂ X aberto , x ∈ A⇒ A ∩ S 6= ∅.”
Prova: Provaremos a direção “⇐” em forma contrapositiva. Suponha que x ∈ X é dado e existe
um aberto A ⊂ X com x ∈ A e S ∩ A = ∅, ou melhor Sc ⊃ A. Note que F := X\A = Ac é um
fechado e S ⊂ F (pois tomar complementares inverte a relação de inclusão). Portanto, F é um
daqueles fechados que aparecem na interseção que define o fecho de S. Concluı́mos que S ⊂ F
e, como x ∈ A = Fc, temos x 6∈ S. Ou seja, um ponto x ∈ X “protegido” de S por um aberto
A 3 x com A ∩ S = ∅ não está no fecho de S.
Agora, provemos “⇒”. Suponha que x ∈ X é tal que, para todo aberto A ⊂ X com x ∈ A,
temos A ∩ S 6= ∅. Para mostrar que x ∈ S, é necessário e suficiente que x ∈ F para qualquer
fechado F ⊃ S. Tome então um tal F. Note que A = Fc = X\F é aberto e não intersecta S. Por
hipótese, todo aberto contendo x intersecta S: portanto, x 6∈ A. Como A e F são complementares,
deduzimos que x ∈ F, como querı́amos demonstrar. 2
80
Exercı́cio 5.11 Mostre que
∂S = {x ∈ X : ∀A ⊂ X aberto com x ∈ A, A ∩ S 6= ∅ e A ∩ Sc 6= ∅}.
Por fim, apresentamos mais uma definição topológica relacionada à de fecho. Como acaba-
mos de ver, x ∈ S se e somente se não está protegido de S. Isso pode acontecer simplesmente
porque x ∈ S, mas essa é a forma “boba” de estar desprotegido. O mais interessante é quando
um ponto não está protegido de S\{x}.
Definição 5.4 Dado x ∈ X e S ⊂ X, dizemos que x é ponto de acumulação de S se e somente se qualquer
aberto A ⊂ X com x ∈ A satisfaz A∩ (S\{x}) 6= ∅ (dá no mesmo pedir que A∩ S 6= ∅ e A∩ S 6= {x}).
Chamamos de S′ o conjunto de pontos de acumulação de S, também chamado de conjunto derivado de S.
Claramente, S = S ∪ S′ sempre. Um fato interessante é que o conjunto derivado é fechado
sempre que a topologia em questão satisfaz uma propriedade simples.
Proposição 5.5 Suponha que a topologia T é tal que todo conjunto unitário é fechado. S′ é fechado para
qualquer S ⊂ X.
Observação 5.1 Topologias com a propriedade de que todo conjunto unitário é fechado são chamadas de
T1. Sem esta propriedade, pode ser que S′ não seja fechado (veja os exercı́cios 5.27, 5.28 e 5.29 no fim da
seção). De qualquer modo, toda topologia que vem de uma métrica é T1, porque {x} = B[x, 0] é sempre
fechado.
Prova: Devemosmostrar que X\S′ é aberto. Para isso, vamos mostrar que X\S′ é uma união de
abertos Ax que definiremos a seguir.
Tome x ∈ X\S′, ou seja, um x que não é ponto de acumulação. Tal x está contido em um
aberto Ax 3 x tal que Ax ∩ S = ∅ ou {x}. Veja que A = ∪x∈X\S′Ax é aberto e que A ⊃ X\S′,
porque cada x no complementar de S′ está no seu Ax.
Para demonstrar que S′ é fechado, é suficiente mostrar que o aberto A é igual a X\S′. Como
já sabemos A ⊃ X\S′, basta mostrar que A ⊂ X\S′. Mais ainda, como A é a união dos Ax para
x ∈ X\S, basta provarmos que cada um destes conjuntos Ax está contido em X\S′. Ou seja,
queremos provar o seguinte:
Afirmação: Dado x ∈ X\S′, todo z ∈ Ax não é ponto de acumulação de S.
Se z = x isso já vale, então suporemos que z 6= x. Para provar que z não é ponto de
acumulação, temos de achar um aberto Oz 3 z com Oz ∩ S = ∅ ou {z}.
Vejamos que
Oz := Ax\{x} = Ax ∩ {x}c
funciona. Para argumentar que Oz e baerto, observamos que {x}c tem de ser aberto (o conjunto
unitário é fechado por hipótese!), logo Oz é interseção de dois abertos. Além disso, z ∈ Oz porque
z ∈ Ax e z ∈ {x}c (afinal, z 6= x). Por fim, sabemos que Ax ∩ S = ∅ ou Ax ∩ S = x, portanto
Oz ∩ S = ∅ obrigatoriamente. Ou seja, provamos que z ∈ Oz aberto e Oz ∩ S = ∅, o que garante
que z 6∈ S′. 2
Exercı́cio 5.12 Mostre que N′ = ∅ e Q′ = R (como subconjuntos de R, com a topologia dada pela
métrica usual).
81
5.3 Caracterizações métricas dos conceitos topológicos
A partir de agora, voltamos ao caso particular em que (X, dX) é espaço métrico e usamos sobre X
a topologia T(X,dX) que vem da métrica. Sabemos que, neste caso, os conjuntos fechados podem
ser identificados a partir de limites de sequências, ou seja, a partir da métrica. Agora veremos
como podemos fazer isso com os outros conceitos que estudamos.
Proposição 5.6 Dados S ⊂ X aberto, So é o conjunto dos x ∈ S tais que existe um δ > 0 com B(x, δ) ⊂
S.
Prova: Como vimos, acima x ∈ So se e somente se x ∈ A ⊂ S para um aberto A. Por esta razão,
todo ponto x ∈ S que está contido numa bola aberta B(x, δ) ⊂ S com δ > 0 satisfaz x ∈ So; afinal,
bolas abertas são abertos. Por outro lado, se x ∈ A ⊂ S com A aberto, sabemos que existe um
δ > 0 com B(x, δ) ⊂ A, de modo que B(x, δ) ⊂ S também. Por esta razão,
x ∈ B(x, δ) ⊂ S para algum δ > 0⇔ x ∈ A ⊂ S para algum A ⊂ S aberto.
Mas o lado direito desta equivalência vale se e somente se
x ∈
⋃
A⊂S aberto
A = So.
Portanto, qualquer x ∈ X tem uma “bolha protetora” dentro de S se e somente se x ∈ So, o que
conclui a prova. 2
Exercı́cio 5.13 Prove ainda que A ⊂ X é aberto se e somente se A = ∪B∈BB, onde B é uma coleção de
bolas abertas em X.
Proposição 5.7 Dado S ⊂ X, S é conjunto de pontos que são limites de sequências de X.
Prova: Suponha que {xn}n∈N ⊂ S é uma sequência que converge a x ∈ X. Veja que, para
qualquer fechado F ⊃ S,{xn}n∈N ⊂ F e portanto x = limn xn ∈ F. Portanto:
∀F ⊃ S fechado, x ∈ F, portanto x ∈
⋂
F⊃S fechado
F = S.
Por outro lado, tome x ∈ S. Pela Proposição 5.4 acima, qualquer aberto contendo x intersecta S.
Em particular, para qualquer δ > 0 tem-se B(x, δ) ∩ S 6= ∅. Concluı́mos pelo exercı́cio 5.5 que x
é o limite de uma sequência de pontos em S. 2
Corolário 5.2 ∂S é precisamente o conjunto dos pontos que são limites tanto de sequências em S, quanto
de sequências em Sc.
Exercı́cio 5.14 Mostre que S′ é o conjunto de pontos x ∈ X que são limites de sequências de pontos em
S\{x}.
Exercı́cio 5.15 Se S 6= ∅, S = {x ∈ X : d(x, S) = 0}.
82
5.4 Continuidade, abertos e fechados
Nosso objetivo nesta seção é apresentar a ideia de continuidade de forma topológica, ao invés da
forma métrica (via limites) que já mostramos acima. Na prova da equivalência a seguir, veremos
ainda uma outra definição métrica de continuidade.
Recorreremos a uma notação que será muito usada no que segue: dados f : X → Y e S ⊂ Y,
f−1(S) := {x ∈ X : f (x) ∈ S}.
Exercı́cio 5.16 Mostre que, dada uma famı́lia A de subconjuntos de Y,
f−1(∪A∈AA) = ∪A∈A f−1(A) e f−1(∩A∈AA) = ∩A∈A f−1(A).
Ou seja, f−1 “comuta” com uniões e interseções de conjuntos. Prove ainda que
f−1(Y\A) = X\ f−1(A).
Teorema 5.3 Sejam (X, dX) e (Y, dY) espaços métricos. Dada f : X → Y, as seguintes afirmações são
equivalentes.
1. f é contı́nua, isto é, se {xn}n ∪ {x} ⊂ X e xn → x (segundo a métrica dX), então f (xn) → f (x)
(segundo a métrica dY).
2. Para qualquer F ⊂ Y fechado em Y, f−1(F) ⊂ X é fechado em X.
3. Para qualquer A ⊂ Y aberto, f−1(A) ⊂ X é aberto.
4. Para todos x ∈ X e ε > 0, existe δ > 0 tal que:
∀x′ ∈ X : “dX(x, x′) < δ”⇒ “dY( f (x), f (x′)) < ε”.
Prova: Passo 1 ⇒ 2. Tome f contı́nua e F ⊂ Y fechado. Dada uma sequência convergente
{xn}n∈N ⊂ f−1(F) com limite x ∈ X, devemos provar que x ∈ f−1(F), ou seja, que f (x) ∈ F.
Mas isto é simples, já que f (xn)→ f (x) (por continuidade), { f (xn)}n∈N ⊂ F (já que xn ∈ f−1(F)
para cada n) e F é fechado (de modo que o limite de qualquer sequência convergente em F
também está em F).
Passo 2 ⇒ 3. Vem do exercı́cio anterior à prova juntamente com o fato de que A é aberto se e
somente se X\A é fechado.
Passo 3 ⇒ 4. Fixos ε > 0 e x ∈ X, vamos encontrar o δ desejado. Para fazer isto observe que
a bola BY( f (x), ε) ⊂ Y é um aberto de Y, de modo que (pelo item 3) f−1(BY( f (x), ε)) é aberto.
Como f (x) ∈ BY( f (x), ε), x é um elemento do aberto f−1(BY( f (x), ε)); pela definição de aberto,
isto implica que ∃δ > 0 tal que BX(x, δ) ∈ f−1(BY( f (y), ε)). Isto quer dizer que, para todo
x′ ∈ B(x, δ) – ou seja, todo x′ ∈ X com dX(x, x′) < δ – temos f (x′) ∈ BY( f (x), ε) – ou seja,
dY( f (x), f (x′)) < ε. Em outras palavras, o δ que apresentamos é precisamente o que tı́nhamos
de encontrar.
83
Passo 4 ⇒ 1. Suponha que xn → x em X; nosso objetivo é provar que limn f (xn) = f (x), ou
seja, que dado ε > 0 existe um n0 ∈ N tal que dY( f (xn), f (x)) < ε se n ≥ n0. Fixemos então um
ε > 0. Pelo item 4 podemos encontrar δ > 0 tal que dX(x′, x) < δ implica dY( f (x′), f (x)) < ε.
Como xn → x, existe n0 ∈ N tal que dX(xn, x) < δ sempre que n ≥ n0. Mas então temos
dY( f (xn), f (x)) < ε sempre que n ≥ n0. Ou seja, este n0 assegura a propriedade desejada. 2
Observação 5.2 No restante das notas, às vezes falaremos de funções contı́nuas entre espaços topológicos.
Neste caso, usaremos a definição dada pelos itens 2 e 3 acima, que são sempre equivalentes.
5.5 Topologia relativa
O resultado acima sobre continuidade só serve para o caso em que o domı́nio D da função f é
todo o espaço X. Mas e se D ⊂ X é um subconjunto próprio e f : D → Y? Não é difı́cil ver o
que acontece: se usamos sobre D a métrica induzida por X, então continuidade é equivalente à
seguinte condição:
∀A ⊂ Y aberto, f−1(A) ⊂ D é aberto na métrica induzida.
Isso suscita a pergunta: como sabemos se um dado subconjunto U ⊂ D é aberto na métrica
induzida? Isto também não é difı́cil de deduzir. Veja que
U ⊂ D é aberto ⇔ ∀x ∈ U ∃r > 0 BD(x, r) ⊂ U,
e ainda
BD(x, r) = {y ∈ D : dD(x, y) < r}
= {y ∈ X : y ∈ D e dX(x, y) < r}
= BX(x, r) ∩ D.
Ou seja
U ⊂ D é aberto ⇔ ∀x ∈ U ∃r > 0 BX(x, r) ∩ D ⊂ U.
Isto nos leva naturalmente à definição de topologia induzida. Note que ela não tem nada a
ver com a de métrica, em princı́pio.
Definição 5.5 Considere um conjunto X 6= ∅ munido de uma topologia TX. Dado D ⊂ X, a topologia
TD induzida por TX é definida como:
TD := {A ∩ D : A ∈ TX}.
Ou seja, U ∈ TD se existe um aberto A de X com U = A ∩ D.
Não é difı́cil provar que TD é mesmo uma topologia: a ideia é só mostrar que a união e a
interseção de conjuntos da forma A ∩ D é ela própria desta forma.
Teorema 5.4 Considere (X, dX). Dote D ⊂ X da métrica dD induzida por X. Considere as topologias
TdX e TdD induzidas pelas métricas de X e D, respectivamente. Então TdD é a topologia induzida por TdX
sobre D.
84
Prova: O que temos que provar é que:
U ⊂ D é aberto de D ⇔ ∃A ⊂ X abertode X com U = A ∩ D.
Começamos a prova pela direção “⇒”. Como observamos acima, U é aberto de D quando para
cada x ∈ U existe um raio rx > 0 tal que B(x, rx) ∩ D ⊂ U. Se definimos
A := ∪x∈U B(x, rx),
vemos imediatamente que A é aberto, posto que é uma união de abertos. Afirmamos que A ∩
D = U e provaremos isso mostrando A ∩ D ⊂ U e U ⊂ A ∩ D. De um lado, temos a inclusão
A ∩ D = ∪x∈U(B(x, rx) ∩ D) ⊂ U
por conta do fato que B(x, rx) ∩ D ⊂ U para cada x ∈ U. Por outro lado, cada x ∈ U pertence
a B(x, rx) ∩ D: isto quer dizer que todo x ∈ U pertence à união ∪x∈U(B(x, rx) ∩ D) = A ∩ D, o
que nos diz U ⊂ A ∩ D e termina a prova de que U = A ∩ D. Ou seja, dado U ⊂ D aberto,
encontramos A ⊂ X aberto de X com U = A ∩ D. Isto termina a prova da direção “⇒”.
Tratemos agora da direção “⇐”. Suponha que U = A ∩ D com A ⊂ X aberto de X. Dado
x ∈ X, devemos encontrar rx > 0 tal que BD(x, rx) = BX(x, rx)∩D ⊂ U = A∩D. Mas para isto é
evidente que basta pedir BX(x, rx) ⊂ A, o que é possı́vel (com algum rx > 0) exatamente porque
A é aberto em X. 2
Observamos o seguinte corolário dos resultados acima.
Corolário 5.3 Se D ⊂ X é aberto de X, então A ⊂ D é aberto na topologia relativa se e somente se é
aberto na topologia de X. O mesmo vale se trocamos “aberto” por “fechado”.
Prova: Faremos a prova apenas no caso de D aberto. Sabemos que, para que A ⊂ D seja aberto
de D, é necessário e suficiente que exista B ⊂ X aberto de X com A = B∩D. Em particular, se D
é aberto e tal B existe, o conjunto A é a interseção de dois abertos; portanto, ele próprio é aberto.
Por outro lado, se A é aberto de X, podemos escrever A = A∩D; ou seja, A e a interseção de
um aberto de X com D, sendo portanto um aberto da topologia relativa. 2
Exercı́cio 5.17 Dado um espaço métrico (X, dX), um subconjunto S ⊂ X é dito separado se infs′∈S\{s} dX(s, s′) >
0 para qualquer s ∈ S. Mostre que S é separado se e somente se a topologia induzida por T(X,dX) em S é a
topologia fina (aquela em que qualquer conjunto é aberto).
5.6 Mais exercı́cios
Exercı́cio 5.18 Dado (X, dX), mostre que F ⊂ X é fechado se e somente se existem um subconjunto
Γ ⊂ R que é fechado em R e uma função contı́nua f : X → R tal que F = f−1(Γ). Deduza um análogo
deste resultado para conjuntos abertos A ⊂ X.
Exercı́cio 5.19 Dado (X, dX), uma função f : X → R é semicontı́nua por baixo se
∀{xn}n∈N ⊂ X : xn → x ∈ X ⇒ lim inf
n∈N
f (xn) ≥ f (x).
Ou seja, f é semicontı́nua por baixo se não pode ter uma “salto para cima no limite”. Mostre que, para
qualquer f : X → R,
f é semicontı́nua por baixo⇔ ∀t ∈ R, f−1((−∞, t]) é fechado de X.
85
Exercı́cio 5.20 (Topologia de Zariski) Neste exercı́cio, apresentamos a “topologia de Zariski afim” so-
bre Rd. Ela é prima da “topologia de Zariski projetiva”, que é extremente importante em Geometria
Algébrica.
Dado um conjunto S de polinômios multivariados p : Rd → R, chamamos de variedade de S o
conjunto V(S) := {x ∈ Rd : ∀p ∈ S, p(x) = 0} (se S = ∅, tomamos V(S) = Rd por definição). Um
subconjunto A ⊂ Rd é (por definição) um aberto de Zariski se A = Rd\V(S) para algum S como acima.
Mostre que os abertos de Zariski formam uma topologia sobre Rd. Mostre ainda que todo aberto de Zariski
é aberto no sentido usual.
Exercı́cio 5.21 Considere um espaço-produto X = X1 × · · · × Xd com uma das métricas-produto dX
definidas no Exercı́cio 3.10 acima.
1. Para cada i = 1, . . . , d, tome um subconjunto aberto Ai ⊂ Xi. Prove que A1 × A2 × · · · × Ad é
aberto.
2. Mostre que um subconjunto A ⊂ X é aberto se e somente se ele pode ser escrito como a união de
conjuntos A1 × · · · × Ad, onde cada Ai é aberto do Xi correspondente.
Exercı́cio 5.22 Fixe um espaço métrico (X, dX). Tome alguma métrica produto sobre X × R. Dada
f : X → R, chamamos de gráfico de f o conjunto
gr( f ) := {(x, f (x)) : x ∈ X} ⊂ X×R
e de epı́grafo de f o seguinte conjunto
epi( f ) := {(x, t) : (x, t) ∈ X×R, t ≥ f (x)}.
1. Prove que, se f é contı́nua, então gr( f ) é fechado. A recı́proca vale?
2. Prove que, se f é semicontı́nua por baixo (como definimos no exercı́cio 5.19), epi( f ) é fechado. A
recı́proca vale?
Exercı́cio 5.23 Suponha que (X, dX) é completo e F ⊂ X. Mostre que F é fechado em X se e somente se
(F, dF) é completo, onde dF é a métrica induzida por (X, dX).
Exercı́cio 5.24 Dê um exemplo de espaço métrico (X, dX) onde X′ = ∅.
Exercı́cio 5.25 Considere um espaço de Banach (V, ‖ · ‖V). Como já vimos, um subespaço de V é um
subconjunto W ⊂ V contendo 0V e fechado pelas operações de espaço vetorial (isto é, para quaisquer
w, w′ ∈W e λ ∈ R, λ w + w′ ∈W).
1. Mostre que o fecho de um subespaço de V também é um subespaço de V.
2. Mostre que o interior de um subespaço W 6= V é vazio.
3. Fixo 0 ≤ ρ < 1, prove que um subespaço fechado W ⊂ V satisfaz W = V se e somente se ele tem a
seguinte propriedade: dado qualquer v ∈ V, existe um w ∈W com ‖v− w‖V ≤ ρ‖v‖V .
Exercı́cio 5.26 Considere as duas definições abaixo de separabilidade.
86
• Um espaço métrico (X, dX) é separável se possui um subconjunto enumerável denso; isto é, se existe
D ⊂ Rd enumerável tal que D = X.
• Um espaço topológico (X, TX) é separável se existe um subconjunto enumerável B ⊂ TX (chamado
de base enumerável da topologia) tal que qualquer aberto A ∈ TX pode ser escrito como uma união
de elementos de B.
Prove que o espaço métrico (X, dX) é separável (de acordo com a primeira definição) se e somente se o
espaço topológico correspondente (X, T(X,dX)) é separável (de acordo com a segunda definição). Deduza
que Rd e C(I, R) são espaços topológicos separáveis com suas topologias usuais.
Exercı́cio 5.27 Suponha que X tem pelo menos dois elementos e usamos a topologia grossa sobre ele.
Mostre que {x}′ = X\{x} não é fechado para qualquer x ∈ X. Ou seja, há exemplos simples de topologias
em que conjuntos derivados não são necessariamente fechados.
Exercı́cio 5.28 A topologia grossa é um tanto quanto patológica. Uma propriedade simples adicional que
pode se pedir de uma topologia é que ela seja T0:
Propriedade T0: dados dois pontos distintos x, x′ ∈ X, há um aberto A ⊂ X que contem
exatamente um destes pontos.
Esta propriedade é sutilmente diferente da T1 descrita acima, que é equivalente à propriedade abaixo:
Propriedade T1: dados dois pontos distintos x, x′ ∈ X, há um aberto A ⊂ X que contem x′ e não
x (e vice-versa).
Prove que esta formulação da propriedade T1 é equivalente à que vimos acima (todo conjunto unitário é
fechado).
Exercı́cio 5.29 Neste exercı́cio, apresentamos uma topologia T0 não-padrão (de acordo com a definição do
exercı́cio anterior) no espaço X = [−1, 1] para a qual {0}′ não é fechado. Definimos:
TX := {A ⊂ X : ∃t > 0, A ⊃ (−t, t)} ∪ {∅}.
1. Mostre que TX é de fato uma topologia sobre X.
2. Mostre que TX tem a propriedade T0, mas não tem a propriedade T1 (de fato, {0} não é fechado).
3. Calcule {0}′ e mostre que ele não é fechado segundo TX.
Exercı́cio 5.30 Dados um espaço de Banach (V, ‖ · ‖V) e subconjuntos A, B ⊂ V, a soma de Min-
kowski de A e B é definida por:
A + B := {a + b : (a, b) ∈ A× B}.
1. Prove que, A = BV [xA, rA] e B = BV [xB, rB] (com xA, xB ∈ V e rA, rB > 0), então A + B =
BV [xA + xB, rA + rB];
2. Mostre que, se um dentre A e B é aberto, então A + B é aberto;
3. Dê um exemplo em que V = R2, A e B são ambos fechados, mas A + B não é fechado.
87
Exercı́cio 5.31 Encontre os fechos, interiores e conjuntos de acumulação de cada um dos subconjuntos
abaixo de C = C([0, 1], R) (com a métrica usual).
D := { f ∈ C : ∃ f ′};
Mk := { f ∈ C : ∀i = 1, 2, . . . , k, f (1/i) < 1/i} (onde k ∈N\{0}).
Exercı́cio 5.32 Um espaço métrico (X, dX) é perfeito se X′ = X.
1. Prove que Rd é perfeito.
2. Prove que qualquer espaço métrico perfeito e completo não pode ser enumerável. (Em particular, um
subconjunto S 6= ∅ fechado e perfeito de um (X, dX) completo não é enumerável.)
88Capı́tulo 6
Compactos: teoria geral
Muitos problemas em Matemática Pura e Aplicada podem ser postos na forma de problemas de
minimização de funções sobre conjuntos.
Dado um conjunto S e uma função f : S → R, encontre s∗ ∈ S tal que f (s∗) ≤ f (s) para
todo s ∈ S.
São exemplos de problemas deste tipo: achar o mı́nimo de uma função f : U ⊂ Rd → R;
de achar a curva de menor comprimento ligando dois pontos em uma superfı́cie; e achar uma
superfı́cie de área mı́nima para um contorno dado. Note que nem todo problema desta forma
tem solução. Por exemplo, a função f (x) = −1/x não atinge um valor mı́nimo no domı́nio
S = (0,+∞).
Como veremos abaixo, espaços compactos têm a propriedade de que toda função contı́nua
atinge seu ı́nfimo e seu supremo. Nossa discussão deste conceito começa na Topologia Geral,
de maneira bem abstrata. Depois, veremos que, no caso métrico, essa definição tem várias
reformulações interessantes. No Teorema 6.2, veremos algumas versões equivalentes para ele.
De fato, veremos que cada uma das condições abaixo (em forma mais precisa) é equivalente a pedir
que (X, dX) seja compacto:
1. toda função contı́nua de X em R atinge seu ı́nfimo e seu supremo;
2. toda função contı́nua de X em R é limitada;
3. o espaço não tem buracos e é bem aproximado por subconjuntos finitos, a menos de um
erro e arbitrariamente pequeno;
4. toda sequência em X tem subsequência convergente.
Outros teoremas serão provados mostrando propriedades boas de compactos; por exemplo,
toda função contı́nua sobre um compacto é uniformemente contı́nua.
Um ponto interessante é que, na lista acima, condições 1 e 2 falam de funções contı́nuas e as
3 e 4 são “geométricas”. Entender a relação entre comportamento de funções e “geometria” do
espaço um problema fundamental. Como veremos, o estudo da conexidade é outro exemplo
nesta categoria.
89
6.1 Compactos do ponto de vista de Topologia Geral
A definição de um espaço compacto usando apenas Topologia é um tanto quanto abstrata.
Mesmo assim, veremos que ela serve para provar alguns resultados interessantes.
Definição 6.1 Um espaço topológico (X, T ) é dito compacto se, dada qualquer coleção de abertosA ⊂ T
com X = ∪A∈AA, então existe uma subcoleção B ⊂ A, com B finito, tal que X = ∪A∈BA. Um
subconjunto K ⊂ X é dito compacto se é compacto com a topologia induzida, isto é, dada qualquer coleção
de abertos A ⊂ T com K ⊂ ∪A∈AA, então existe uma subcoleção F ⊂ B, com B finito, tal que
X ⊂ ∪B∈BB.
É bom explicarmos brevemente o “isto é” acima. Lembre que os abertos de K são os conjuntos
da forma à = A∩K com A ⊂ X aberto. Uma coleção de abertos à de K é, portanto, uma coleção
de conjuntos com a forma Ã{A ∩ X : A ∈ A}, onde A é uma coleção de abertos de X. Usando
as regras de De Moivre, obtemos:
⋃
Ã∈Ã
à =
⋃
A∈A
(A ∩ K) =
( ⋃
A∈A
A
)
∩ K.
Portanto,
K =
⋃
Ã∈Ã
Ã⇔ K ⊂
⋃
A∈A
A.
Do mesmo modo, uma subcoleção finita B̃ ⊂ Ã de abertos de K cobre K se e somente se a
subcoleção finita B ⊂ A correspondente de abertos de X satisfaz K ⊂ ∪A∈BA.
Normalmente a definição de compacto é resumida dizendo-se o seguinte: um conjunto é
compacto se qualquer cobertura dele por abertos tem uma subcobertura finita. Será útil termos
uma forma equivalente dessa definição que envolve conjuntos fechados.
Proposição 6.1 Um espaço topológico (X, T ) é compacto se e somente se ele tem a chamada ”propriedade
da interseção fechada”, que é a seguinte: dada qualquer coleção F de fechados de X, ∩F∈F F = ∅ se e
somente se existe uma subcoleção finita G ⊂ F com ∩F∈GF = ∅.
Prova: Este é mais um daqueles argumentos em que usamos o fato de que os complementares
de fechados são abertos e o complementar de uma união é uma interseção.
Vejamos. Dada uma coleção de fechados F , temos uma coleção de abertos A feita pelos
complementares dos elementos de F . Do mesmo modo, podemos passar de uma coleção de
abertos A para uma coleção de fechados F .
Agora observe que: ⋂
F∈F
F = ∅⇔ (
⋂
F∈F
F)c =
⋃
F∈F
Fc = ∅c = X.
Ou seja, ⋂
F∈F
F = ∅⇔
⋃
A∈A
A = X;
ou ainda, dizendo de outro modo, uma coleção de fechados tem interseção vazia se e somente se
a coleção de abertos correspondente cobre X.
90
Do mesmo modo, existe um G ⊂ F finito com ∩F∈GF = ∅ se e somente se existe uma
subcoleção B ⊂ A, formada pelos complementares dos elementos de G, tal que
⋃
A∈B
A =
⋃
F∈G
Fc =
(⋂
F∈G
F
)c
= ∅c = X.
Ou seja, subfamı́lias finitas de F que têm interseção vazia correspondem exatamente às subco-
berturas finitas de X.
Com o que já fizemos, a prova da equivalência fica direta. 2
A propriedade da interseção finita nos dá um bom critério para determinarmos que um
espaço não é compacto. Eis alguns exemplos disso.
Exemplo 6.1 (R não é compacto) A reta não é compacta com sua topologia usual. Para ver isso, notem
que os intervalos da forma (−∞, t], com t ∈ R são uma coleção de fechados com interseção vazia. Ao
mesmo tempo, dados t1, . . . , tk ∈ R,
k⋂
i=1
(−∞, ti] = (−∞, min
1≤i≤k
ti] 6= ∅.
Exercı́cio 6.1 Prove que forma análoga que Rd e C([0, 1], R) não são compactos com suas topologias
usuais.
Exemplo 6.2 (Intervalos abertos e semiabertos não são compactos) Considere agora um subconjunto
S da reta da forma S = (a, b] ou S = (a, b), com a < b reais. Use em S a topologia induzida pela tradicio-
nal em R. Veja que a coleção:
F := {(a, t] : t ∈ (a, b)}
é uma coleção de fechados de S na topologia relativa ((a, t] = (−∞, t] ∩ S). Seguindo o raciocı́nio do
exercı́cios anterior, vê-se que ∩F∈F F = ∅, mas qualquer subcoleção finita tem interseção não-vazia.
Uma tarefa mais difı́cil será provar que um espaço topológico é, sim, compacto. Não tratare-
mos disso nesta seara de espaços topológicos, com a exceção do exemplo abaixo.
Exercı́cio 6.2 Considere a topologia discreta (ou ”fina”) sobre um X 6= ∅ em que todos os subconjuntos
são abertos. Mostre que X é compacto com esta topologia se e somente se ele é finito.
O principal resultado sobre conjuntos compactos nesta seção é o Teorema 6.1 abaixo, que
diz que funções reais contı́nuas sobre compactos sempre atingem seus ı́nfimos. Antes dele, no
entanto, há outras coisas interessantes para provar, que são um tanto quanto mais fáceis. Vamos
a elas.
O primeiro desses resultados mais diretos nos diz que ”fechado em compacto também é
compacto”.
Proposição 6.2 Um subconjunto fechado de um espaço topológico compacto é compacto.
Prova: De fato, seja (X, T ) compacto e considere F ⊂ X fechado.
Se F ⊂ ∪A∈AA, onde A é uma coleção de abertos de X, então à := A∪ {Fc} é uma coleção
de abertos que cobre todo X; afinal, todo ponto de X ou está em F, e é coberto por A, ou não
está em F, e é coberto por Fc.
Como (X, T ) é compacto, Ã tem uma subcobertura finita B̃. Tomando B := B̃\{Fc}, temos
uma subcoleção de A que cobre F. 2
91
O próximo resultado fala que ”a imagem de um compacto por uma função contı́nua é sempre
um compacto”.
Proposição 6.3 Considere dois espaços topológicos (X, TX) e (Z, TZ). Se (X, TX) é compacto e f : X →
Z é contı́nua, então a imagem de f , f (X) ⊂ Z, é compacta.
Prova: Suponha que X Z e f são como acima. Tome uma cobertura A qualquer de f (X) por
abertos de Z: isto é, f (X) ⊂ ∪A∈AA. Mostraremos que A tem uma subcobertura finita.
Como f é contı́nua, os conjuntos f−1(A) com A ∈ A são abertos de X; além disso, eles
cobrem X porque, para cada x ∈ X, f (x) ∈ ∪A∈AA e portanto existe um A ∈ A com f (x) ∈ A e
x ∈ f−1(A)
Por hipótese, X é compacto. Logo, existe uma subcoleção finita B ⊂ A com X = ∪A∈B f−1(A).
Mas note que f (X) ⊂ ∪A∈BA porque, dado z = f (x) ∈ f (X), existe um A ∈ B com x ∈ f−1(A)
e z = f (x) ∈ A. 2
Agora, sim, mostraremos que toda função contı́nua sobre um espaço topológico atinge seu
ı́nfimo.
Teorema 6.1 Se (X, T ) é um espaço métrico compacto, então, dada uma função contı́nua f: X → R,
existe um x? ∈ X com f (x?) = infx∈X f (x). Em particular, infx∈X f (x) > −∞.
Exercı́cio 6.3 Prove que o supremo de f também é atingido.
Prova: Na verdade, nossa prova mostra que toda função semicontı́nua por baixo atinge o ı́nfimo. Por
definição, uma f : X → R é semicontı́nua por baixo se, dado qualquer t ∈ R, o conjunto
Ft := f−1((−∞, t])
é fechado (veja o exercı́cio 5.19 acima para uma caracterização equivalente). Como (−∞, t] é
fechado de R, toda função contı́nua de X em R é semicontı́nua por baixo.
Em toda prova, faremos referência ao ı́nfimo de f : infx∈X f (x). Isso pode parecer suspeito,
pois ainda não temos como garantir que os valores de f são mesmo limitados por baixo. A
verdade é que isso não importa. Admitimos que, em princı́pio, seria possı́vel que infx∈X f (x) =
−∞. Nada do que dizemos abaixo é afetado por essa possibilidade, que será finalmente afastada
no fim da prova.
Vamos, então, fazer uma afirmação envolvendo o ı́nfimo, que diz respeito aos conjuntos Ft.
Ft 6= ∅ para qualquer t > inf
x∈X
f (x). (6.1)
Afinal, se t > infx∈X f (x), t não é cota inferior para os valores de f e há pelo menos um xt ∈ X
com f (xt) ≤ t, o que quer dizer xt ∈ f−1((−∞, t]) = Ft.
Feita essaa afirmação, vem um passo crucial: a observação de que
(?)
⋂
t>infx∈X f (x)
Ft = {x? ∈ X : f (x?) = inf
x∈X
f (x)}.
Na verdade, vale igualdade acima. Aqui dizemos que, se a interseção do lado esquerdo não for vazia, o
ı́nfimo de f é atingido.
92
Para provar a igualdade (?), observe primeiro que, se há de fato um x? atingindo o ı́nfimo,
ele está na interseção do lado esquerdo. Por outro lado, se x? está na interseção, sabemos que
f (x?) ≥ infx∈X f (x) (o ı́nfimo é cota inferior para todo mundo) e
∀t ∈ R : t > inf
x∈X
f (x)⇒ x? ∈ Ft ⇒ f (x?) ≤ t.
Isto quer dizer:
∀t ∈ R : t > inf
x∈X
f (x)⇒ inf
x∈X
f (x) ≤ f (x?) ≤ t, ou seja, f (x?) = inf
x∈X
f (x).
Note que provamos (?) sem supôr a priori que infx∈X f (x) > −∞!
Resulta de (?) que a existência de um ponto x? ∈ X atingindo o ı́nfimo de f é equivalente
a
⋂
t>infx∈X f (x) Ft 6= ∅. Para provar que a interseção não é vazia, usaremos a propriedade da
interseção finita. Em forma contrapositiva, essa propriedade nos diz que, se todas as subcoleções
finitas dos Ft com t > infx∈X f (x) não têm interseção vazia, o mesmo vale para a interseção de
toda a coleção.
Tome, então, uma coleção finita dos Ft: Ft1 , . . . , Ftk , com cada ti > infx∈X f (x). Queremos
demonstrar que a interseção destes conjuntos não é vazia. Para isso, voltamos ao Exemplo 6.1,
sabemos que
k⋂
i=1
(−∞, ti] = (−∞, min
1≤i≤k
ti]
e portanto
k⋂
i=1
Fti =
k⋂
i=1
f−1((−∞, ti])
= f−1
(
k⋂
i=1
(−∞, ti]
)
= f−1
(
(−∞, min
1≤i≤k
ti]
)
= Fmin1≤i≤k ti .
Como cada ti > infx∈X f (x), min1≤i≤k ti > infx∈X f (x) também e (6.1) implica que Fmin1≤i≤k ti 6= ∅,
como querı́amos demonstrar.
Terminamos recapitulando a prova de trás para frente. Acabamos de mostrar toda subcoleção
finita dos Ft com t > infx∈X f (x) tem interseção não-vazia. Como os Ft são fechados e X é com-
pacto, a propriedade da interseção finita implica que
⋂
t>infx∈X f (x) Ft 6= ∅. Portanto, a identidade
(?) garante que há pelo menos um ponto x? em que f atinge o ı́nfimo. 2
6.2 Espaços métricos compactos: o grande teorema de equivalência
A partir de agora, vamos nos restringir a espaços métricos, sempre usando a topologia métrica.
Nosso principal resultado será uma série de equivalências descritas no próximo teorema.
93
Teorema 6.2 Dado um espaço métrico (K, dK) com a topologia T(K,dK) dada pela métrica, as seguintes
afirmações são equivalentes.
1. (K, T(K,dK)) é compacto;
2. para qualquer função contı́nua f : K → R, existem x−, x+ ∈ K com infx∈K f (x) = f (x−) e
supx∈K f (x) = f (x+);
3. toda função contı́nua f : K → R é limitada por cima e por baixo, isto é, −∞ < infx∈K f (x) ≤
supx∈K f (x) < +∞;
4. (K, dK) é um espaço métrico completo e totalmente limitado (isto quer dizer que, dado um e > 0
qualquer, K pode ser coberto por um número finito de bolas de raio e);
5. (K, dK) é sequencialmente compacto, isto é, toda sequência {xn}n∈N ⊂ K possui uma subsequência
convergente {xnk}k∈N com limite x ∈ K;
Note que aqui supomos que nosso interesse é saber se um espaço métrico ”inteiro” é com-
pacto. Na próxima seção, especializamos esse teorema para o caso de subconjuntos K ⊂ X e
teremos de falar da topologia induzida.
A prova do Teorema 6.2 será trabalho pra várias subseções. No entanto, algumas etapas são
bastante simples e podemos apresentá-las aqui.
Proposição 6.4 Considere um espaço métrico (K, dK) que tem a propriedade 2 do Teorema 6.2. Então ele
também tem a propriedade 3 do mesmo teorema.
Prova: Suponha que K satisfaz o item 2, tome f : K → R e defina m± = f (x±) como no dito
item. Como f tem valores reais, m−, m+ ∈ R. Além disso, sabemos que m− = infx∈K f (x) e
m+ = supx∈K f (x). Portanto, f (K) ⊂ [m−, m+] e f é limitada. 2
O próximo resultado normalmente é provado (num caso particular) em cursos de Análise na
Reta.
Proposição 6.5 Considere um espaço métrico (K, dK) que tem a propriedade 5 do Teorema 6.2. Então ele
também tem a propriedade 2 do mesmo teorema.
Prova: Supondo a propriedade 5, mostraremos que vale a 2. Mais precisamente, mostraremos
que existe um ponto em que f atinge seu ı́nfimo; a prova para o supremo é análoga (ou então
você pode achar o ponto em que − f atinge o ı́nfimo, o que é o mesmo que o ponto em que f
atinge o supremo).
Tome m− := infx∈K f (x). Em princı́pio, pode ser que m− ∈ R ou m− = −∞. De um modo
ou de outro, é possı́vel achar uma sequência de números reais {mn}n∈N ⊂ R, todos estritamente
maiores que m−, mas escolhidos de modo que mn → m−.
Para cada n, temos então que mn > m− = infx∈X f (x): por esta razão, existe um xn ∈ K com
m− ≤ f (xn) ≤ mn. Usando a propriedade 5, podemos escolher uma subsequência {xnk}k∈N com
xnk → x− ∈ K. Note que também temos mnk → m− já que {mnk}k∈N é subsequência de uma
sequência que converge a m−. Como f é contı́nua, temos que f (xnk)→ f (x−); mas então
m− ≤ f (x−) = lim
k→+∞
f (xnk) ≤ limk→+∞ mnk = m−.
Concluı́mos que f (x−) = m−, isto é, x− atinge o ı́nfimo de f sobre K. 2
94
Cumpridos esses passos simples, partimos para a tarefa mais complicada que é provar todos
os demais itens do Teorema 6.2. Um roteiro para a prova é dado logo a seguir.
6.2.1 Roteiro da prova
Fixe um espaço métrico (K, dK). Acima provamos vimos acima que 1⇒ 2 (Teorema 6.1) e 2⇒ 3
(Proposição 6.4). Vimos ainda que 5⇒ 2 (Proposição 6.5).
Como próximos passos, veremos que um espaço métrico onde toda função contı́nua é li-
mitada tem de ser completo (§6.2.2) e totalmente limitado (§6.2.3). Juntas, essas duas provas
mostram 3⇒ 4 no Teorema.
Depois, mostraremos no §6.2.4 que um espaço métrico completo é sequencialmente compacto;
isto é a implicação 4⇒ 5 no Teorema.
Neste ponto da prova, já saberemos que 1⇒ 2 e que 2⇒ 3⇒ 4⇒ 5⇒ 2. Portanto, 2 a 5 são
equivalentes e uma forma de terminar a prova é mostrar que estas propriedades juntas implicam
1. É isso que será feito no §6.2.5, onde a prova será encerrada.
6.2.2 Compactos são completos
Começamos com o fato de que todo compacto é completo do ponto de vista métrico. Isto é um
pedaço da prova que 3⇒ 4 no Teorema 6.2.
Lema 6.1 Qualquer espaço métrico compacto (K, dK) tal que funções contı́nuas de K em R são limitadas
é um espaço métrico completo.
Prova: Vamos provar que se K não é completo, então há uma função contı́nua de K em R sem cota
inferior.
Suponha que K não é completo: existe {xn}n∈N ⊂ K que é Cauchy, mas não converge a
qualquer elemento em K. O Exemplo 4.3 acima mostra que
g(x) := lim
n∈N
dK(x, xn) (x ∈ K)
é contı́nua. Veja que
g(xm) = lim
n∈N
dK(xm, xn) ≤ sup
n≥m
dK(xn, xm)→ 0 quando m→ +∞
porque {xn}n é Cauchy. Logo g(xm) → 0 quando m cresce. Por outro lado, g(x) > 0 paratodo
x porque, se não, dK(x, xn) → 0 e x seria o limite de xn, que supomos não existir. Portanto
a imagem de g está contida em (0,+∞). Como a função x 7→ 1/x é contı́nua sobre (0,+∞),
deduzimos que
f (x) :=
1
limn dK(xn, x)
=
1
g(x)
é contı́nua e f (xm) → +∞ quando m → +∞, de modo que f não tem cota superior. Segue que
K não é compacto. 2
95
6.2.3 Cobertura, empacotamento e limitação total
Agora consideramos o conceito de ”totalmente limitado” que apresentamos no item 4 do Teorema
6.2. Antes disso, definimos os números de e-cobertura e empacotamento de um subconjunto de
um espaço métrico. É conveniente enunciar essas definições no caso de subconjuntos de um
espaço métrico maior.
Definição 6.2 Fixe um espaço métrico (X, dX). Dado um subconjunto K ⊂ X, dizemos que um sub-
conjunto R ⊂ K é uma e-rede para K se para qualquer x ∈ K existe um x′ ∈ R com dX(x, x′) ≤ e.
Chamamos de número de e-cobertura de K, N(K, e), o menor n ∈ N ∪ {+∞} tal que K possui uma
e-rede com n elementos. K é dito totalmente limitado se N(K, e) < +∞ para todo e > 0.
Uma maneira de pensar na definição de ”totalmente limitado” é a seguinte. Uma e-rede é
uma ”discretização”para K em que todo ponto é representado com ”precisão”e. Portanto, K é
totalmente limitado se e somente se, para qualquer precisão escolhida, ele tem uma discretização
finita com esta precisão.
Antes de seguir, notamos o seguinte fato: N(K, e) ≤ n se e somente se existem x1, . . . , xn ∈ K
com K ⊂ ∪ni=1BX[xi, e] (exercı́cio). Se K = X, então o contenimento se transforma em K =
∪ni=1BK[xi, e].
Os números de empacotamento são uma espécie de ”dual”dos números de cobertura. Isso
ficará claro quando apresentarmos a proposição a seguir.
Definição 6.3 Fixe um espaço métrico (X, dX). Dado um subconjunto K ⊂ X, dizemos que um Q ⊂ K
é um δ-empacotamento em K (com δ > 0) se quaisquer x, x′ ∈ Q com x 6= x′ satisfazem dX(x, x′) > δ.
Chamamos de número de δ-empacotamento de K, P(K, δ), o supremo sobre todos os n ∈ N tais que K
possui um δ-empacotamento com n elementos.
Proposição 6.6 Usando a notação acima, as desigualdades abaixo valem para quaisquer K ⊂ X e e > 0:
N(K, e) ≤ P(K, e) ≤ N(K, e/2).
(Em particular, K é totalmente limitado se e somente se P(K, e) < +∞ para todo e > 0.)
Prova: Vamos começar mostrando que P(K, e) ≤ N(K, e/2).. Para isso, basta supor que N(K, e/2) =
m ∈N, pois o caso N(K, e/2) = ∞ é trivial. Considere, então, uma e/2-rede x1, . . . , xm em K. Isto
quer dizer que K é coberto pelas m bolas BX[xi, e/2]. Afirmo que um e-empacotamento em K não
pode conter mais do que um elemento em cada uma dessas bolas; afinal, quaisquer dois elemen-
tos q, q′ ∈ BX[xi, e/2], então dX(q, q′) ≤ dX(q, xi) + dX(q′, xi) ≤ e. Da afirmação conclui-se que
qualquer e-empacotamento em K tem no máximo m elementos, o que demonstra P(K, e) ≤ m.
Agora provamos que N(K, e) ≤ P(K, e). Se P(K, e) = +∞, não há o que mostrar. Em
caso contrário, P(K, e) = k ∈ N e pode-se tomar um empacotamento Q ⊂ K com k elementos.
Mostraremos que Q também é uma e-rede para K, o que mostra que N(K, e) ≤ k.
Para mostrar que Q é uma e-rede, tomamos um x ∈ K arbirtrário e mostramos que existe um
q ∈ Q com dX(x, q) ≤ e. Isso é trivial se x ∈ Q, portanto suporemos x 6∈ Q.
Neste caso, o conjunto Q∪ {x} tem mais elementos que Q. A cardinalidade de Q é o tamanho
do maior e-empacotamento em K. Sendo assim, Q ∪ {x} não é e-empacotamento. Portanto, há
dois elementos distintos q1, q2 ∈ Q ∪ {x} a distância no máximo e um do outro. Como Q é
e-empacotamento, não pode ser verdade que q1, q2 ∈ Q: um dos dois tem de ser x e o outro, um
q ∈ Q. Logo, dX(x, q) ≤ e para este q, como querı́amos demonstrar. 2
96
Um último fato sobre conjuntos que não são totalmente limitados será importante a seguir.
Note que, se K não é totalmente limitado, então há δ-empacotamentos em K com tamanho finito,
mas arbitrariamente grande. Abaixo vemos que há, de fato, um empacotamento infinito em
qualquer conjunto que não é totalmente limitado.
Proposição 6.7 Com a notação acima, se K ⊂ X não é totalmente limitado, então existe um e-empacotamento
dentro de K com cardinalidade infinita, para algum e > 0.
Prova: Se K não é totalmente limitado, então N(K, e) = +∞ para algum e > 0. Portanto, qualquer
subconjunto finito de K não é uma e-rede. Com base nisso, podemos construir uma sequência de
pontos da seguinte forma.
1. Escolha x1 ∈ K arbitrariamente.
2. Dados x1, . . . , xn ∈ K, escolha xn+1 ∈ K de modo que dX(xn+1, xi) > e para todo 1 ≤ i ≤ n
(esse ponto existe porque {x1, . . . , xn} não é e-rede).
É fácil verificar que o conjunto S := {xn : n ∈N} ⊂ K é um e-empacotamento infinito. 2
Agora podemos relacionar funções contı́nuas ao fato do espaço métrico ser ou não totalmente
limitado.
Lema 6.2 Considere um espaço métrico (K, dK) tal que que funções contı́nuas de K em R são sempre
limitadas. Então (K, dK) é totalmente limitado.
Prova: Vamos mostrar que um espaço métrico (X, dX) que não é totalmente limitado tem uma
função contı́nua f : X → R com supx∈X f (x) = +∞. Para isto, usamos a Proposição 6.7:
ela garante que, para algum δ > 0, há um δ-empacotamento S ⊂ X de cardinalidade infinita:
d(s, s′) ≥ δ para quaisquer elementos distintos s, s′ ∈ S. Sem perda de generalidade, suporemos
que S é enumerável e escreveremos S = {sj : j ∈ N}. Nosso objetivo será construir uma função
contı́nua f : X → R com sup{ f (x) : x ∈ S} = +∞. Na verdade, mostraremos o seguinte
resultado.
Afirmação 6.1 Existe uma função g : X → R tal que g(x) > 0 para todo x ∈ X, ‖g‖Lip ≤ 1 e
g(sj) ≤ 1/(j + 1) para todo j ∈N.
Esta g toma valores estritamente maiores que 0 em todo ponto, mas g(sj) → 0 quando j →
+∞. Em particular, se definimos
f (x) :=
1
g(x)
(x ∈ X),
podemos observar que f é contı́nua (já que o denominador não se anula) e f (sj) ≥ j + 1 → +∞
quando j→ +∞; deste modo, f não é limitada.
Para construir g, vamos fazer uma colagem de várias funções. Para cada j ∈ N, definimos
uma função gj : X → R da seguinte forma:
gj(x) := d(x, sj) +
1
j + 1
(x ∈ X).
97
Claramente, ‖gj‖Lip ≤ 1 e gj(x) ≥ 1/(j + 1) > 0 para todo x ∈ X. Agora defina g : X → R pela
receita:
g(x) := inf
j∈N
gj(x) (x ∈ X).
Note que g(x) ∈ R está bem definida porque os valores de gj(x) são limitados por baixo por 0
para qualquer x ∈ X, e portanto o ı́nfimo na definição sempre nos dá um número real. Além
disso, ‖g‖Lip ≤ supj∈N ‖gj‖Lip ≤ 1 pelo Exercı́cio 4.16. Note ainda que:
∀k ∈N : g(sk) = inf
j∈N
gj(x) ≤ gk(sk) =
1
k + 1
.
Para terminar a prova da Afirmação, precisamos mostrar que g(x) > 0 para todo x ∈ X. Para
isso, fixamos x ∈ X e observamos duas possibilidades.
• Se d(x, sj) ≥ δ/2 para todos j ∈N, deduzimos que
gj(x) = d(x, sj) ≥ δ/2 > 0
pra todo j ∈N. Isto quer dizer que
δ
2
é cota inferior para {gj(x) : j ∈N};
como o ı́nfimo é a maior cota inferior, deduzimos que
g(x) = inf
j∈N
gj(x) ≥
δ
2
> 0.
• Agora suponha que d(x, sk) < δ/2 para algum k ∈N (o que em particular ocorre se x = sk).
Observe que, dado qualquer outro ı́ndice ` ∈ N\{k}, podemos usar o fato de que {sj}j∈N
é δ-empacotamento para deduzir que
δ < d(sk, s`) ≤ d(sk, x) + d(x, s`) <
δ
2
+ d(x, s`),
donde segue d(x, s`) > δ/2. Portanto, temos que
gk(x) ≥
1
k + 1
e g`(x) ≥ d(x, s`) ≥
δ
2
quando ` 6= k.
Deduzimos que
δ′ := min
{
δ
2
,
1
k + 1
}
é cota inferior para {gj(x) : j ∈N}
e, como antes, obtemos g(x) ≥ δ′ > 0.
2
98
6.2.4 O critério das subsequências convergentes
Nesta subseção vamos mostrar que a compacidade de um espaço métrico pode ser avaliada a
partir de subsequências. Na verdade, o que faremos será mostrar que, num espaço métrico
completo e totalmente limitado, toda sequência tem uma subsequência que converge a um limite
dentro do espaço.
Primeiro, lembremos o que são subsequências.
Definição 6.4 Dados um conjunto infinito N ⊂ N e uma sequência {xn}n∈N, a subsequência {xn}n∈Né definida da forma {x̃j}j∈N com x̃j := {xnj}, onde n1 < n2 < n3 < . . . é a única enumeração crescente
dos elementos de N. Também escrevemos {xnj}j∈N diretamente. Falamos que limn∈N xn = x se xnj → x
quando j→ +∞.
Exercı́cio 6.4 Mostre que xn → x implica xnj → x.
Agora provamos a implicação 4⇒ 5 do Teorema 6.2.
Proposição 6.8 Um espaço métrico completo e totalmente limitado é sequencialmente compacto, isto é:
toda sequência nesse espaço tem uma subsequência que converge nesse mesmo espaço.
Prova: Fixe um espaço métrico (K, dK) que é completo e totalmente limitado. Dada {xn}n∈N ⊂
K, nosso principal objetivo será provar que {xn}n∈N possui uma subsequência de Cauchy. Como
(K, dK) é completo, isto basta para provar que sempre há uma subsequência convergente.
Não é muito simples achar esta subsequência buscada. Começamos a busca por ela com um
resultado mais fraco que apenas garante o seguinte: sempre há uma subsequência “apertada”.
Afirmação 6.2 Dado qualquer r > 0 existe subsequência {xn}n∈N com dK(xm, xn) < r para todos
m, n ∈ N.
De fato, como estamos supondo que K é totalmente limitado, a Proposição 6.7 nos diz que
podemos cobrir K por um número finito de bolas de raio r/2. Como o número de bolas é finito,
uma das bolas, que chamaremos de B(z, r/2), é tal que o conjunto
N := {n ∈N : xn ∈ B(z, r/2)}
é infinito, e um argumento simples mostra que {xn}n∈N tem a propriedade desejada.
O que vem a seguir é uma espécie de “truque diagonal” que mostra como esta afirmação
pode ser usada para achar uma subsequência de Cauchy. A primeira ideia deste truque diagonal é
que, aplicando a afirmação infinitas vezes, podemos encontrar subsequências encaixadas e cada
vez mais apertadas. Mais precisamente:
1. A afirmação implica que existe N1 ⊂ N infinito tal que dK(xn, xm) < 1/2 para todos
n, m ∈ N1.
2. Suponha (recursivamente) que existem conjuntos infinitos N1 ⊃ N2 ⊃ · · · ⊃ Nk, todos
contidos em N, tais que, para qualquer 1 ≤ i ≤ k e quaisquer n, m ∈ Ni, vale a desigualdade
dK(xn, xm) < 2−i. Vamos mostrar como construir um conjunto Nk+1 de forma a estender
por mais um passo esta construção. Para isto, aplicaremos a afirmação à sequência
{xnj}j∈N onde {nj : j ∈N} = Nk.
99
com r = 2−k−1. Isto nos dá um conjunto N e podemos definir Nk+1 := {nj : j ∈ N}, de
modo a termos as propriedades desejadas.
Nossa tarefa final é extrair destas subsequências encaixadas e cada vez mais apertadas uma
subsequência de Cauchy. Uma tentativa poderia ser definir {xn}n∈Ñ com Ñ := ∩kNk, mas isto
não pode funcionar em geral: afinal,
n, m ∈ Ñ ⇒ n, m ∈ Nk para todo k⇒ ∀k ∈N, dK(xn, xm) ≤ 2−k ⇒ xn = xm.
Ou seja, para que nosso truque não falhe, é necessário que a sequência original tenha infinitos
termos iguais.
A segunda ideia do truque diagonal é uma maneira “diagonal” de selecionar um subconjunto
infinito N∗ de modo que N∗ ⊂ Nk “quase vale”, isto é, N∗\Nk tem apenas um número finito de
termos. Vamos escrever
N∗ := {n1 < n2 < n3 < . . . }
onde os nk são definidos recursivamente.
1. Em primeiro lugar, definimos n1 = min N1 (isto é válido porque N1 6= ∅ é subconjunto dos
naturais).
2. Definidos n1 < · · · < nk, observamos que, como Nk+1 é infinito,
Nk+1\[nk] 6= ∅.
Como ele também é subconjunto dos naturais, podemos definir
nk+1 := min(Nk+1\[nk])
e observamos que nk+1 6∈ [nk], de modo que nk+1 > nk.
Pela construção temos n1 < n2 < . . . . Além disto, para k, r ∈N com k < r, temos que
nk ∈ Nk, nr ∈ Nr ⊂ Nk
e como dK(xn, xm) < 2−k para n, m ∈ Nk, isto implica
∀k, r ∈N : k < r ⇒ dK(xnk , xnr) < 2−k.
Exercı́cio 6.5 Para terminar a prova, deduza disto que {xnk}k∈N é Cauchy, provando que, dado e > 0,
existe um k0 ∈N tal que dX(xnk , xn`) ≤ e para quaisquer ı́ndices k, ` ≥ k0.
2
100
6.2.5 O fim da prova da grande equivalência
Chegamos finalmente ao fim da prova do Teorema 6.2.
Prova: [do Teorema 6.2] Voltando ao roteiro descrito em §6.2.1 acima, observamos que já sabemos
que as propriedades de 2 a 5 no Teorema 6.2 são equivalentes. Além disso, sabemos que 1 implica
2. O que nos falta é provarmos que 2 a 5 juntas implicam 1.
Na verdade, não são todas as propriedades de 2 a 5 que serão usadas. Ao invés disso,
provaremos o seguinte.
Queremos: Seja (K, dK) um espaço métrico totalmente limitado (item 4 do Teorema)
com a propriedade de que toda f : X → R contı́nua atinge seu ı́nfimo (item 2 to
Teorema). Então toda cobertura de K por abertos possui uma subcobertura finita
(item 1 do Teorema).
Fixamos, então, um espaço métrico com as propriedades dos itens 2 e 4. Considere uma
coberturaA de K por abertos. Lembrando, A é uma coleção de abertos de K tais que K = ∪A∈AA.
Observe que todo x ∈ K pertence a algum aberto A ∈ A. Portanto existe um δ = δ(x) > 0
com B(x, δ) ⊂ A para algum A ∈ A. Reduzindo δ se necessário, podemos supôr que δ(x) ≤ 1.
A principal ideia desta prova é mostrar o seguinte.
Ideia: podemos escolher um valor δ > 0 que funciona para todos os x ∈ K simultaneamente.
Ou seja, existe um δ > 0 tal que, dado qualquer x ∈ K, B(x, δ) ⊂ A para algum A ∈ A. Na
verdade, esta ”ideia” suscita duas perguntas:
1. Por que achar este δ > 0 é uma boa ideia? Como K é compacto, ele é totalmente limitado e
pode ser coberto por um número finito de bolas de raio δ > 0. Mas cada bola destas pode
ser coberta por um elemento da cobertura A. Deste modo, K pode ser coberto por um
número finito de elementos de A.
2. Como sabemos que este δ existe? Vamos exprimir δ em termos do ı́nfimo de uma função
contı́nua r : K → (0, 1] que associa a cada x o seu “maior δ particular”. Como cada x tem
seu δ > 0, o ı́nfimo de r será positivo.
Para transformar esta ideia em prova, definimos r : K → (0, 1] da seguinte forma. Primeiro
observe, dado x ∈ K, o conjunto
I(x) := {δ ∈ (0, 1] : ∃A ∈ A, BK(x, δ) ⊂ A}
não é vazio. De fato ele é um intervalo: se δ ∈ I(x), então para qualquer 0 < δ′ < δ temos
∃A ∈ A : BK(x, δ′) ⊂ BK(x, δ) ⊂ A⇒ δ′ ∈ I(x).
Como I(x) também é limitado por 1, podemos definir r : K → [0, 1] como
r(x) := sup I(x) (x ∈ K).
Como I(x) contem elementos positivos, vale que r(x) > 0 para todo x ∈ K. Intuitivamente, r(x)
é basicamente o “maior” δ(x) que podemos escolher. Uma explicação para esta escolha é que, se
queremos achar um único δ que sirva para todos os x, é boa ideia partir do maior δ(x) possı́vel
para cada x.
A afirmação a seguir é chave para a prova.
101
Afirmação 6.3 r é uma função contı́nua.
Prova: [da Afirmação] Vamos mostrar que r é 1-Lipschitz, o que implica que r é
contı́nua. Para isto basta mostrar que:
Objetivo: ∀x, x′ ∈ K : r(x)− r(x′) ≤ dK(x, x′). (6.2)
De fato, se temos isto, podemos trocar os papeis de x, x′ e mostrar que também vale
r(x′)− r(x) ≤ dK(x, x′), de modo que |r(x′)− r(x)| ≤ dK(x, x′) para todos x, x′ ∈ X.
Para provar nosso objetivo, tome qualquer 0 < r < r(x) e um conjunto A ∈ A com
B(x, r) ⊂ A. Note que B(x′, r− dX(x, x′)) ⊂ BK(x, r); afinal,
∀y ∈ BK(x′, r− dK(x, x′)) : dK(y, x) ≤ dK(y, x′) + dK(x, x′) < r.
Portanto também temos BK(x′, r − dK(x, x′)) ⊂ A ∈ A e isto implica r(x′) ≥ r −
dX(x, x′). Tomando o supremo em r, vemos que r(x′) ≥ r(x) − dK(x, x′), como
querı́amos demonstrar. [Fim da prova da afirmação.] 2
Entre outras coisas, esta afirmação nos diz que infx∈K r(x) = r(x∗) para algum x ∈ K; afinal,
K é compacto! Mas note então que r(x∗) > 0, porque r é positiva em todos os pontos de K.
Deduzimos que infx∈K r(x) > 0, o que nos permite escolher um δ ∈ (0, infx∈K r(x)).
Este δ nos permite terminar a prova. Veja que, dado x ∈ K, r(x) > δ. Pela definição de r(x),
isto quer dizer que 0 < δ < sup I(x); como I(x) é intervalo, isto quer dizer que δ ∈ I(x) e existe
um A ∈ A com BK(x, δ) ⊂ A.
Lembre-se que K é totalmente limitado, portanto K = ∪ki=1BK(xi, δ) para alguma escolha de
x1, . . . , xk ∈ K. Mas então podemos escolher, para cada 1 ≤ i ≤ k, um aberto Ai ∈ A com
B(xi, δ) ⊂ Ai, e observamos que K ⊂ ∪ki=1Ai. Deste modo, B :={Ai : 1 ≤ i ≤ k} é uma
subcoleção finita de A que cobre K. 2
Observação 6.1 Um dado importante que surgiu na prova acima é que, se K é compacto, então toda
cobertura A de K por abertos possui um número de Lebesgue, isto é, um δ > 0 tal que, se x, x′ ∈ K e
dK(x, x′) < δ, então x, x′ ∈ A para algum A ∈ A. Isto é, se dK(x, x′) < δ, x, x′ pertencem ao mesmo
aberto da cobertura. Usaremos isto mais adiante.
6.3 Mais sobre compactos e funções contı́nuas
A esta altura já sabemos que o conceito de compacidade pode ser caracterizado por funções
contı́nuas. Há muitas outras relações entre estes dois conceitos: como veremos, elas se estendem
ao caso em que o contradomı́nio não é a reta.
6.3.1 Funções sobre compactos com contradomı́nio completo
Até este ponto, o principal espaço de funções contı́nuas que tratamos foi o C(I, R) com I ⊂ R
compacto. Agora, estamos em condições de estender o que sabemos para um caso bem mais
102
geral. De fato, tomaremos (K, dK) e (Z, dZ) espaços métricos, com K compacto e Z completo, e
falaremos de:
C = C(K, Z) := { f : K → Z : f continua }.
O próximo resultado mostra que é possı́vel dar uma métrica a C e que o espaço métrico
resultante é completo.
Teorema 6.3 Suponha que (Z, dZ) é completo. Dadas f , g ∈ C, defina:
dC( f , g) := sup
t∈K
dZ( f (t), g(t)).
Então dC é uma métrica sobre C e (C, dC) é um espaço métrico completo.
Prova: Esta prova deve muito à prova de que C(I, R) é espaço métrico completo (Teorema 3.2).
Faremos abaixo um esboço dos passos que são iguais e assinalaremos as principais diferenças.
Primeiro vamos provar que o supremo na definição de dC é atingido por algum t∗ ∈ K; em
particular, dC( f , g) ∈ R está bem definida. Para ver que o sup é atingido, como K é compacto,
basta ver que a função
t ∈ K 7→ dZ( f (t), g(t)) ∈ R
é contı́nua. Isto é verdade porque, sempre que tn → t em K,
|dZ( f (t), g(t))− dZ( f (tn), g(tn))| ≤ |dZ( f (t), g(t))− dZ( f (tn), g(t))|
+|dZ( f (tn), g(t))− dZ( f (tn), g(tn))|
(desig. triangular nos dois termos) ≤ dZ( f (tn), f (t)) + dZ(g(tn), g(t))
→ 0 quando n→ +∞.
Portanto dZ( f (t), g(t)) = limn dZ( f (tn), g(tn)).
Acabamos de ver que dC está bem definida. As propriedades de métrica são provadas como
no caso de C(I, R), observando que, para f , g, h ∈ C:
∀t ∈ K : dZ( f (t), g(t)) ≤ dZ( f (t), h(t)) + dZ(g(t), h(t)) ≤ dC( f , h) + dC(h, g),
e aı́ tomando o supremo em t ∈ K do lado esquerdo.
A completude também é provada como antes, nos mesmos três passos da prova do Teorema
3.2. Dada { fn}n∈N ⊂ C Cauchy, temos o seguinte.
1. Para cada t ∈ K,
0 ≤ dZ( fn(t), fm(t)) ≤ dC( fn, fm)
n,m→+∞→ 0.
Logo { fn(t)}t∈N ⊂ Z é Cauchy e, como Z é completo, existe o limite pontual f (t) =
limn fn(t) para cada t ∈ K.
2. Para cada n ∈N e t ∈ K, a existência do limite pontual diz que
dZ( fn(t), f (t)) = limm dZ( fn(t), fm(t))
≤ sup
m≥n
dZ( fn(t), fm(t))
≤ sup
m≥n
dC( fn, fm).
103
Logo
0 ≤ sup
t∈K
dZ( fn(t), f (t)) ≤ sup
m≥n
dC( fn, fm)→ 0 porque { fn}n∈N é Cauchy.
Deduzimos que fn → f uniformemente.
3. Por fim, dada uma sequência tk → t em K, para qualquer n ∈N
dZ( f (tk), f (t)) ≤ dZ( fn(tk), fn(t))
+dZ( fn(tk), f (tk)) + dZ( fn(t), f (t))
≤ dZ( fn(tk), fn(t)) + 2dC( fn, f ).
(Aqui abusamos notação e usamos dC( fn, f ) apesar de ainda não sabemos que f ∈ C!).
Como fn é contı́nua, fn(tk)→ fn(t) e
0 ≤ lim sup
k
dZ( f (tk), f (t)) ≤ 2dC( fn, f )
e mandar n → +∞ nos mostra que o lim sup é 0, logo f (tk) → f (t). Como isto vale para
qualquer sequência como acima, f ∈ C é contı́nua.
2
6.3.2 Funções sobre compactos com contradomı́nio Banach
Um caso particular do resultado acima é aquele em que Z = V é espaço de Banach (e dZ vem da
norma). O próximo resultado mostra que C(K, V) também é Banach.
Começamos observando que, assim como no caso de C(I, R), que já estudamos, este espaço
tem uma estrutura natural de espaço vetorial. Seu elemento nulo 0C é a função constante igual a
0V . Dadas funções f , g ∈ C e um escalar λ ∈ R, uma nova função λ f + g é definida via:
(λ f + g)(t) = λ f (t) + g(t) (t ∈ K).
A única diferença para o caso em que V = R é que as operações de soma e produto do lado
direito são em V e não em R.
Há muitas boas razões para se considerar essa classe de funções. Por exemplo, se V =
R3, podemos vizualizar cada elemento de C como uma trajetória no espaço tridimensional. Se
queremos modelar a evolução de posição e momento de N particulas clássicas em R3, precisamos
tomar V = R6N . Em outros contextos, pode ser interessante tomar V ainda mais geral.
O próximo resultado define uma norma em C(K, V).
Teorema 6.4 Se (K, dK) é compacto e (V, ‖ · ‖V) é Banach, a expressão abaixo define uma norma ‖ · ‖V
em C:
‖ f ‖C := sup
t∈I
‖ f (t)‖V ( f ∈ C).
Com essa norma, (C, ‖ · ‖C) é completo (Banach).
104
Prova: Primeiro devemos observar que o supremo é finito. Para isso, basta observar que a função
que associa a cada t ∈ K o valor ‖ f (t)‖V ∈ R é contı́nua, já que
∀t, s ∈ K : |‖ f (t)‖V − ‖ f (s)‖V | ≤ ‖ f (t)− f (s)‖V .
Agora vamos checar as propriedades de norma. Como ‖ f (t)‖V ≥ 0 sempre, temos que ‖ f ‖C ≥ 0.
Portanto, ‖ · ‖C : C → [0,+∞) é uma função bem-definida. Para provar que ela é uma norma,
precisamos provar que ela é positiva definida, homogênea positiva e subaditiva. Como a prova é
bem semelhante à do caso em que V = R, demonstraremos apenas a subaditividade.
De fato, dadas f , g ∈ C, podemos usar a subaditividade de ‖ · ‖V e a definição de ‖ · ‖C para
provar que:
∀t ∈ I : ‖ f (t) + g(t)‖V ≤ ‖ f (t)‖V + ‖g(t)‖V ≤ ‖ f ‖C + ‖g‖C.
Portanto, ‖ f ‖C + ‖g‖C é cota superior para os valores de ‖ f (t) + g(t)‖V , donde deduzimos que
‖ f + g‖C = sup
t∈I
‖ f (t) + g(t)‖V ≤ ‖ f ‖C + ‖g‖C
para quaisquer f , g ∈ C. Ou seja, ‖ · ‖C é mesmo subaditiva.
Falta demonstrar que (C, ‖ · ‖C) é completo, mas isto segue do Teorema 6.3. Afinal, a norma
‖ · ‖C induz uma métrica que coincide com a que estudamos naquele teorema quando V = Z.
Como V é completo, o teorema se aplica e garante a completude de C com a norma que acabamos
de construir. 2
6.3.3 Continuidade uniforme
Nosso próximo passo é falar de continuidade uniforme, uma versão mais forte do conceito de
continuidade.
Definição 6.5 Uma função f : K → Z entre espaços métricos (K, dK) e (Z, dZ) é dita uniformemente
contı́nua se seu módulo de continuidade, denotado por
m f (δ) := sup{dZ( f (x), f (x′)) : dK(x, x′) ≤ δ} (δ > 0),
converge a 0 quando δ→ 0+.
Uma função uniformemente contı́nua é contı́nua (exercı́cio!). Por outro lado, uma função
contı́nua pode não ser uniformemente contı́nua: por exemplo, “t 7→ t2”, definida na reta, tem
m f (δ) = +∞ para todo δ > 0, já que:
lim
t→+∞
[(t + δ)2 − t2] = +∞.
O resultado abaixo estende um teorema conhecido de Análise na Reta. Ele garante que
qualquer função contı́nua sobre domı́nio compacto é uniformemente contı́nua. Note que, ao
contrário da subseção anterior, aqui não precisamos supôr que o contradomı́nio Z é completo com
a métrica dZ.
Teorema 6.5 Uma função contı́nua f : K → Z entre espaços métricos (K, dK) e (Z, dZ), com (K, dK)
compacto, é necessariamente uniformemente contı́nua.
105
Prova: Apresentamos uma prova baseada na ideia de número de Lebesgue, contida na observação
6.1 acima. O Exercı́cio 6.6 apresenta um argumento mais clássico, baseado em subsequências.
Tome f : K → Z contı́nua. Dado um ε > 0, mostraremos que existe um δ0 > 0 tal que
m f (δ) ≤ ε para todo 0 < δ < δ0. Isto implica lim supδ→0+ m f (δ) ≤ ε, para qualquer ε > 0.
Note que, dado qualquer x′′ ∈ K, o conjunto
Ax′′ := {x ∈ K : dZ( f (x), f (x′′)) < ε/2}
é aberto de K, já que Ax = f−1(BY( f (x), ε/2)). Note ainda que, se x, x′ ∈ Ax′′ para um mesmo
x′′, naturalmente dZ( f (x′), f (x′′)) < ε pela desigualdade triangular:
dZ( f (x), f (x′)) ≤ dZ( f (x), f (x′′)) + dY( f (x′′), f (x′)) < ε.
Os abertos Ax′′ , com x′′ ∈ K, cobrem K; afinal, cadax′′ ∈ K pertence ao seu próprio Ax′′ .
Deduzimos que
A := {Ax′′ : x′′ ∈ K}
é uma cobertura de K por abertos. Pela Observação 6.1, existe um δ0 > 0 tal que, dados quaisquer
x, x′ ∈ K com dK(x, x′) < δ0, existe um conjunto Ax′′ com x, x′ ∈ Ax′′ , o que, como observado
acima, garante que dZ( f (x), f (x′)) < ε. Portanto,
∀x, x′ ∈ K : dK(x, x′) ≤ δ < δ0 ⇒ dY( f (x), f (x′)) < ε,
e m f (δ) ≤ ε para todo 0 < δ < δ0, como querı́amos demonstrar. 2
Antes de prosseguirmos, observamos que há outras definições equivalentes para a continui-
dade uniforme.
Proposição 6.9 Dada uma função f : K → Z entre espaços métricos (K, dK) e (Z, dZ), as seguintes
propriedades são equivalentes.
1. f é uniformemente contı́nua;
2. dado qualquer ε > 0, existe um δ > 0 tal que, se x, x′ ∈ K satisfazem dK(x, x′) ≤ δ, então
dZ( f (x), f (x′)) ≤ ε;
3. se {xn}n∈N e {x′n}n∈N são sequências em K,
dK(xn, x′n)→ 0⇒ dZ( f (xn), f (x′n))→ 0.
Prova: Uma primeira observação da prova é que a função m f (·) é monótona não-decrescente. De
fato, se 0 < δ < δ′, o conjunto de pares (x, x′) com dK(x, x′) ≤ δ está contido no conjunto de
pares com dK(x, x′) ≤ δ′; portanto, o supremo que define m f (δ) é tomado sobre um conjunto
menor do que o supremo que define m f (δ′).
Usamos a observação acima para provar que 1 e 2 são equivalentes. Sendo m f crescente,
sabemos que existe o limite de m f (δ) quando δ→ 0+ e vemos que:
lim
δ→0+
m f (δ) = 0⇔ ∀ε > 0 ∃δ > 0 : m f (δ) ≤ ε.
Do lado esquerdo da equivalência, temos a continuidade uniforme; do direito, temos a proprie-
dade 2 escrita de outra forma. Deste modo, temos a equivalência de 1 e 2.
106
Agora vejamos que 1⇒ 3. Sejam {xn}n∈N e {x′n}n∈N como no item 3. Note que, por definição
de m f ,
0 ≤ dZ( f (xn), f (x′n)) ≤ m f (dK(xn, x′n))
e que dK(xn, x′n)→ 0. Deduzimos que dY( f (xn), f (x′n))→ 0.
Concluı́mos a prova mostrando que “não 1⇒não 3”. Suponha que 1 não vale. Como observa-
mos acima, m f é monótona-não-decrescente: por esta razão, limδ→0+ m f (δ) existe, podendo ser
um número real não-negativo ou +∞. Se 1 não vale, existe um a > 0 com limδ→0+ m f (δ) > a > 0
e portanto m f (δ) > a para todo δ > 0. Em particular, tomando δ = 1/n e retornando à definição
de m f , vemos que existe um par (xn, x′n) ∈ K2 com dX(xn, x′n) ≤ 1/n e dZ( f (xn), f (x′n)) > a.
Portanto, as sequências {xn}n∈N e {x′n}n∈N, ambas contidas em K, satisfazem dX(xn, x′n) → 0 e
dZ( f (xn), f (x′n)) 6→ 0. Ou seja, se 1 não é verdadeira, a propriedade 3 não vale. 2
Exercı́cio 6.6 Escreva uma prova do Teorema 6.5 baseada no item 3 da Proposição acima. Para isso, siga
os seguintes passos: tome uma sequência {δn}n decrescendo a 0 e observe que limδ→0+ m f (δ) se e somente
se m f (δnk)→ 0 ao longo de uma subsequência {δnk}k. Para cada n, tome xn, x′n ∈ K com dK(xn, x′n) ≤ δn
e dY( f (xn), f (x′n)) ≥ m f (δn)− 1/n. Mostre agora que é possı́vel encontrar uma subsequência {nk}k tal
que xnk , x
′
nk → x ∈ K e use a continuidade de f em x para terminar a prova.
6.4 Compacidade de subconjuntos de um espaço métrico completo
No próximo capı́tulo, e também pelo restante da vida, estaremos interessados no caso em que
K ⊂ X com (X, dX) completo. Na maior parte do tempo, X será algum dos nossos espaços
usuais: métrica discreta, Rd ou C(I, R).
Primeiramente, observaremos como formular compacidade em termos da métrica e da topo-
logia de X (e não a métrica e a topologia que X induz em K).
1. A definição de compacidade via cobertutas de abertos (ou via propriedade da interseção
finita) é igual.
2. Quando (X, dX) é completo (como é o caso aqui), pedir que K seja completo com a métrica
induzida é a mesma coisa que pedir que K seja fechado de X (cf. Exercı́cio 5.23). Logo, ao
invés de pedir que K seja completo, pediremos que ele seja fechado. Portanto, se (X, dX) é
completo, um K ⊂ X é compacto se e somente se é fechado e totalmente limitado.
Convém fazer alguns comentários sobre os números de cobertura de K. Lembre-se que o
número de e-cobertura de (K, dK) é dado por:
N(K, e) := inf{k ∈N : ∃x1, . . . , xk ∈ K, K = ∪ki=1BK[xi, e]}.
Como dissemos acima, estamos interessados no caso em que K ⊂ X e dK é a distância induzida
por dX. Sabemos que, neste caso, temos BK[xi, e] = K ∩ BX[xi, e] para cada 1 ≤ i ≤ k e e > 0.
Segue disto que
N(K, e) := inf{k ∈N : ∃x1, . . . , xk ∈ K, K ⊂ ∪ki=1BX[xi, e]}. (6.3)
No entanto, é possı́vel uma outra definição:
N′(K, e) := inf{k ∈N : ∃x′1, . . . , x′k ∈ X, K ⊂ ∪ki=1BX[x′i , e]}. (6.4)
107
A diferença para (6.3) é que, neste segundo caso, os centros das bolas podem estar dentro ou fora
de K. O exercı́cio abaixo mostra que isso não faz muita diferença para o que nos interessa.
Exercı́cio 6.7 Prove que, para qualquer espaço métrico (X, dX) e qualquer K ⊂ X,
N(K, e) ≤ N′(K, e) ≤ N(K, 2e).
Deduza que K é totalmente limitado (isto é, N(K, e) < +∞ para todo e > 0) se e somente se N′(K, e) <
+∞ para todo e > 0.
Curiosamente, essa pequena diferença entre os números de e-cobertura N e N′ não tem
análogo para os números de e-empacotamento: neste caso, sempre pedimos que os elementos
do empacotamento estejam dentro de K.
6.5 Mais exercı́cios
Exercı́cio 6.8 Considere um espaço topológico compacto (X, TX) e um outro espaço topológico (Y, TY).
Suponha que f : X → Y é uma bijeção contı́nua. Mostre que a função inversa f−1 : Y → X também é
contı́nua; portanto, f é um homeomorfismo de espaços topológicos.
Exercı́cio 6.9 Considere um espaço vetorial normado (V, ‖ · ‖V) e subconjuntos não-vazios A, B ⊂ V.
Defina a soma de Minkowski A + B como no Exercı́cio 5.30:
A + B := {a + b : (a, b) ∈ A× B}.
Prove que A + B é compacto se e somente se A e B são compactos.
Exercı́cio 6.10 (Espaços pseudocompactos) Um espaço topológico compacto (X, TX) é dito pseudo-
compacto se toda função contı́nua de X em R é limitada. Procure o verbete da Wikipedia a respeito.
Exercı́cio 6.11 Determine quais dos subconjuntos de C([0, 1], R) abaixo são compactos.
1. Todas as funções Lipschitz.
2. Todas as funções L-Lipschitz, para um L > 0 fixo.
3. Todos os polinômios com grau 3.
4. Todos os polinômios com grau 3 e coeficientes no intervalo [−1, 1].
(Obs: mais adiante provaremos um critério para compacidade neste espaço, o teorema de Ascoli-
Arzelà. Estes exemplos podem ser estudados sem se utilizar este teorema.)
Exercı́cio 6.12 Considere um espaço métrico compacto (K, dK). Chame p ∈ K de ponto isolado se existe
um δ > 0 tal que BK(p, δ) = {p} (ou seja, não há qualquer ponto de K, além do próprio p, a distância
< δ do p). Prove que o conjunto de pontos isolados de K é vazio, finito ou enumerável.
Exercı́cio 6.13 Suponha que (X, dX) é um espaço métrico e que {xn}n∈N ⊂ X é Cauchy. Mostre que o
conjunto S := {xn : n ∈N} é totalmente limitado.
108
https://en.wikipedia.org/wiki/Pseudocompact_space
Exercı́cio 6.14 Recorde que um espaço métrico é separável se possui um subconjunto denso e enumerável.
Mostre que todo espaço métrico compacto é separável.
Exercı́cio 6.15 Sejam (Ti, di) espaços métricos totalmente limitados, 1 ≤ i ≤ k. Mostre que
T := T1 × T2 × · · · × Tk
é espaço métrico totalmente limitado com qualquer uma das métricas-produto consideradas no exercı́cio
3.10, em particular
d∞(x, y) := max
1≤i≤k
di(x[i], y[i]) (x, y ∈ T).
Faça isso provando uma cota explı́cita para o valor dos números de cobertura de T (com a métrica d∞):
∀e > 0 : N(T, e) ≤
k
∏
i=1
N(Ti, e).
Mais exatamente, mostre que, se Ri ⊂ Ti é e-rede para cada Ti (com a métrica di), então R := R1 × R2 ×
· · · × Rk é ε-rede para T. Conclua observando que |R| = ∏i |Ri|.
Exercı́cio 6.16 Seguindo a linha do exercı́cio acima, mostre que T é compacto se e somente se cada Ti é
compacto.
Exercı́cio 6.17 Sejam (X, dX) um espaço métrico completo e S ⊂ X um subconjunto. Mostre que S é
totalmente limitado se e somente se S é compacto.
Exercı́cio 6.18 Demonstre que a primeiradas afirmações abaixo é verdadeira e a segunda é falsa.
1. Um espaço métrico (X, dX) é compacto se e somente se toda função Lipschitz f : X → R satisfazendo
f (x) > 0 para todo x ∈ X tem ı́nfimo positivo.
2. Um espaço métrico (X, dX) é compacto se e somente se toda função Lipschitz f : X → R é limitada
inferiormente.
Exercı́cio 6.19 É verdade que um espaço métrico (X, dX) é compacto se e somente se toda função contı́nua
f : X → R é uniformemente contı́nua? Mostre que a resposta é não considerando qualquer conjunto X
infinito com a métrica discreta. (Na verdade, há exemplos de mais complicados de espaços que não são
compactos, mas são perfeitos – X′ = X – e tais que qualquer função contı́nua é uniformemente contı́nua.
Ou seja: a resposta “não” acima não tem nada a ver com métrica discreta só ter pontos isolados.)
Exercı́cio 6.20 Considere um espaço vetorial normado (V, ‖ · ‖V). Dado um S ⊂ V, S 6= ∅, uma
combinação convexa de elementos de S é um elemento v ∈ V da forma:
v =
m
∑
i=1
λisi,
onde m ∈ N\{0}, s1, . . . , sm ∈ S e os escalares λ1, . . . , λm ≥ 0 têm soma ∑mi=1 λi = 1. Chamamos de
conv(S), ou fecho convexo de S, o conjunto cujos elementos são as combinações convexas dos elementos de
S. Prove que, se S é totalmente limitado, conv(S) também é.
109
110
Capı́tulo 7
Compactos: casos particulares
Agora que já sabemos quem são os espaços compactos e que propriedades importantes eles têm,
veremos como este conceito se aplica a subconjuntos de Rd e das funções contı́nuas.
No caso do Rd, provaremos o Teorema de Heine-Borel, que diz que um conjunto K ⊂ Rd é
compacto se e somente se ele é fechado e limitado. Logo depois, usaremos este resultado para
dois fins: mostrar que todas as normas sobre Rd são equivalentes e construir uma métrica sobre
as funções contı́nuas de A ⊂ Rd aberto em R.
O próximo passo será apresentar o Teorema de Arzelà-Ascoli, que descreve subconjuntos
compactos de espaços de funções contı́nuas. As aplicações deste teorema são mais complicadas
e são deixadas para outros capı́tulos, onde discutirmos curvas de comprimento mı́nimo (a incluir)
e existência de soluções para Equações Diferenciais Ordinárias.
7.1 Compactos de Rd: o Teorema de Heine-Borel
Quem são os compactos de X = Rd com a métrica usual? O resultado a seguir é um clássico da
Análise, que responde a essa pergunta.
Teorema 7.1 (Heine Borel) Um subconjunto K ⊂ Rd é compacto se e somente se é fechado e limitado.
Prova: Apresentamos dois argumentos. No primeiro, usamos o fato de que K é compacto se e
somente se é fechado e totalmente limitado. Desta forma, para provar o teorema, basta provar
que qualquer um subconjunto K ⊂ Rd é limitado se e somente se é totalmente limitado. Mas isto
é simples:
• Se K é totalmente limitado, K ⊂ ∪mi=1BRd(xi, δ). Mas então a desigualdade triangular mostra
que dRd(0, x) ≤ max{dRd(0, xi)}1≤i≤n + δ para todo x ∈ K, ou seja, K é limitado.
• Se K ⊂ Rd é limitado, temos que K ⊂ [−n, n]d para algum n ∈N. Dividindo cada intervalo
[−n, n] em intervalos de comprimento < δ/
√
d, vemos que [−n, n]d é dividido em um
número finito de cubos tais que |x − x′| < δ para quaisquer dois elementos no mesmo
cubo. Tomando um ponto xi em cada cubo, vemos que K ⊂ [−n, n]d ⊂ ∪mi=1BRd(xi, δ) para
uma certa coleção finita de pontos. Deste modo, K é totalmente limitado.
Como segundo argumento, usaremos o critério das subsequências convergentes. Voltamos ao
§3.2.1 e lembramos que toda sequência limitada em Rd tem uma subsequência convergente. Em
111
particular, se K ⊂ Rd é fechado e limitado, toda sequência em K tem subsequência com limite
em K (que é fechado!).
Por outro lado, se K não é fechado ou não é limitado, há nele uma sequência que não tem
subsequência convergente em K (e portanto K não é compacto). Vejamos o porquê.
• Se K não é fechado, há uma sequência {xn}n∈N ⊂ K convergindo a x 6∈ K. Qualquer
subsequência de {xn}n∈N também converge a x, logo não há subsequência convergindo a
elemento de K.
• Se K não é limitado, para todo n ∈N há um xn ∈ K com |xn|2 ≥ n e é fácil ver que {xn}n∈N
não tem subsequência convergente.
2
Exercı́cio 7.1 Use o Teorema de Heine-Borel para decidir quais dentre os seguintes subconjuntos de Rd
são compactos: Rd; ∅; BRd(0, 1); BRd [0, 1];
Sd−1 := {x ∈ Rd : |x|2 ≤ 1};
∆d := {x ∈ Rd+ :
d
∑
i=1
x[i] = 1};
Od := {x ∈ Rd+ : x[1] ≤ x[2] ≤ x[3] ≤ · · · ≤ x[d]};
a “versão” do Od com “x[1] < x[2] < · · · < x[d]”(desigualdades estritas).
Exercı́cio 7.2 Para cada um dos conjuntos S ⊂ Rd que não são compactos apresentados no exercı́cio
anterior, encontre uma f : S → R com infs∈S f (s) = −∞ e uma cobertura de S por abertos que não tem
subcobertura finita. (Você já sabe que uma tal f e uma tal subcobertura existem pela teoria geral, claro.)
Exercı́cio 7.3 Considere uma função contı́nua f : Rd → R satisfazendo lim|x|2→+∞ f (x) = +∞. Dado
c ∈ R, mostre que seus conjuntos de “nı́vel c”e “subnı́vel c”
Fc := {x ∈ Rd : f (x) = c} e S≤c := {x ∈ Rd : f (x) ≤ c}
são compactos.
7.2 Aplicações do teorema de Heine-Borel
Poucos teoremas na Análise são tão usados quanto o de Heine-Borel. Nesta seção, não fazemos
mais do que apresentar duas situações em que ele é útil: para entender normas em Rd e discutir
o conceito de convergência sobre compactos para funções contı́nuas.
7.2.1 Todas as normas sobre Rd são equivalentes
Aqui provamos algo que prometemos há muito tempo: que todas as normas em Rd são equiva-
lentes. Em particular, os fatos a seguir todos seguem disso.
• Todas as normas sobre Rd definem a mesma topologia.
112
• Rd é completo com qualquer norma.
Abaixo, enunciamos “por extenso” o que significa dizer que uma norma é equivalente à
norma Euclideana. É boa ideia recordar o Teorema 3.3 antes de lê-lo.
Teorema 7.2 Considere uma norma ‖ · ‖ sobre Rd e seja | · | a norma Euclideana. Então existem C, c > 0
tais que
∀x ∈ Rd : c |x|2 ≤ ‖x‖ ≤ C |x|2. (7.1)
Em particular, a norma ‖ · ‖ e a norma Euclideana definem a mesma topologia sobre Rd.
Prova: Lembre-se de que e1, . . . , ed são os vetores da base canônica de Rd: fixo 1 ≤ i ≤ d, ei tem a
i-ésima coordenada igual a 1 e as demais coordenadas iguais a 0. Recorde ainda que
∀x ∈ Rd : x =
d
∑
i=1
x[i] ei.
Vamos provar agora a existência de C > 0 como acima. Veja que, dado x ∈ Rd qualquer
‖x‖ = ‖
d
∑
i=1
x[i]ei‖
(subaditividade) ≤
d
∑
i=1
‖x[i] ei‖
(homogeneidade positiva) =
d
∑
i=1
|x[i]| ‖ei‖
≤
d
∑
i=1
|x[i]| max
1≤j≤d
‖ej‖
= max
1≤j≤d
‖ej‖ (|x|1)
(| · |1 ≤
√
d | · |2) ≤ (
√
d max
1≤j≤d
‖ej‖) |x|2.
Logo a constante C :=
√
d max1≤j≤d ‖ej‖ satisfaz o que queremos. Note que C > 0 porque ei 6= 0
para cada i e portanto ‖ei‖ > 0 para cada i.
Provaremos agora que existe c > 0 como acima usando a primeira parte. Considere a esfera
unitária Sd−1 ⊂ Rd, dada por
Sd−1 = {x ∈ Rd : |x|2 = 1}.
Como f (x) = |x|2 = dRd(x, 0) (x ∈ Rd) é contı́nua, Sd−1 = f−1({1}) é subconjunto fechado de
Rd. Além disso, Sd−1 é limitado. Deduzimos que a esfera Sd−1 é compacta. Além disso, a função
g(x) := ‖x‖ (com x ∈ Sd−1) é C-Lipschitz, já que
∀x, x′ ∈ Sd−1 : |g(x)− g(x′)| = |‖x‖ − ‖x′‖| ≤ ‖x− x′‖ ≤ C |x− x′|2.
Portanto, g é uma função contı́nua sobre um compacto e existe um x∗ ∈ Sd−1 com c := g(x∗) =
infx∈Sd−1 ‖x‖. A fortiori, c > 0, já que x∗ ∈ Sd−1 ⇒ x∗ 6= 0 e ‖ · ‖ é uma norma.
Basta checar agora que c “funciona” para nossos propósitos. Para isto, tome x ∈ Rd qualquer.
Se x = 0, claramente ‖x‖ = 0 ≥ c|x|2 = 0. Se x 6= 0, então x/|x|2 ∈ Sd−1, logo ‖x/|x|2‖ ≥ c e
‖x‖ ≥ c |x|2 pela homogeneidade positiva da norma. 2
113
Exercı́cio 7.4 Mostre que quaisquer duas normas sobre um espaço de matrizes Rd×` são equivalentes.
7.2.2 Convergência uniforme sobre compactos
Nesta seção, A ⊂ Rd é um aberto com A 6= ∅, (V, ‖ · ‖V) é um espaço de Banach e C := C(A, V)
é o espaço de funções contı́nuas de A em V. Como de costume,este espaço tem uma estrutura
de espaço vetorial, em que as somas e produtos por escalar são definidos para cada t ∈ A.
Como podemos medir distâncias neste espaço? A definição das métricas de convergência
uniforme em espaços do tipo C(K, Z) que vimos nos §6.3.1 e 6.3.2 depende do fato que K é
compacto: só assim garantimos que os supremos naquelas definições fazem sentido. Por outro
lado, as métricas que pusemos sobre aqueles espaços pressupõem o conceito de convergência
uniforme, que não é o mais natutal sobre C(A, V).
Exemplo 7.1 Considere o caso particular em que A = V = R (com as métricas/normas usuais). A
sequência de funções “ fn : t ∈ R 7→ t2/(n + 1)” converge a 0C pontualmente, mas não converge
uniformememnte já que fn(n) → +∞. No entanto, esta é uma sequência “bem comportada” em vários
sentidos: por exemplo, para quaisquer a < b reais,
∫ b
a fn(t) dt→ 0.
A definição mais usada de convergência em C(A, V) é a de convergência uniforme sobre com-
pactos. Usaremos abaixo a seguinte notação: dados K ⊂ A compacto e não vazio, e dada f ∈ C,
‖ f ‖K,∞ := sup
t∈K
‖ f (t)‖V .
Note que este supremo é um número real porque a restrição de f a K é contı́nua e, portanto,
limitada. Além disso, pode-se verificar que ‖ · ‖K,∞ é homogênea positiva e subaditiva:
∀ f , g ∈ C∀λ ∈ R : ‖λ f ‖K,∞ = |λ| ‖ f ‖K,∞ e ‖ f + g‖K,∞ ≤ ‖ f ‖K,∞ + ‖g‖K,∞.
Note que ‖ · ‖K não é positiva-definida em geral: a função f (·) = dRd(·, K) se anula em K, de
modo que ‖ f ‖K,∞ = 0, mas f > 0 em A\K. Uma função homogênea positiva e subaditiva que
não é necessariamente positiva-definida é dita uma seminorma.
A definição de convergência uniforme em compactos é dada abaixo.
Definição 7.1 Dados elementos { fn}n∈N ∪ { f } ⊂ C, dizemos que fn converge a f uniformemente sobre
compactos se limn∈N ‖ fn− f ‖K,∞ = 0 para todo K ⊂ A compacto. Dizemos ainda que { fn}n∈N é Cauchy
uniformemente sobre compactos se limm,n∈N ‖ fn − fm‖K,∞ = 0 para todo K ⊂ A compacto.
Exercı́cio 7.5 Para esquentar, prove que a sequência de funções { fn}n∈N ⊂ C(R, R) no Exemplo 7.1
converge a 0C uniformemente sobre compactos.
O próximo teorema é o principal resultado desta subseção. Ele nos diz que a noção de con-
vergência uniforme sobre compactos corresponde a uma métrica bem-comportada sobre C(A, V)
Teorema 7.3 Existe uma métrica dC sobre C = C(A, V) com as seguintes propriedades.
1. uma sequência em C é convergente (ou Cauchy) uniformemente sobre compactos se e somente se ela
é convergente (ou Cauchy) com a métrica dC;
114
2. (C, dC) é completo.
Trocando em miúdos: a noção de convergência uniforme sobre compactos corresponde a uma
métrica sobre C(A, V) e o espaço métrico (C(A, V), dC) é completo.
Para provar este teorema, precisaremos de um resultado preliminar, que segue do teorema
de Heine-Borel.
Lema 7.1 (Exaustão de A por número enumerável de compactos) Dado A ⊂ Rd aberto e não-vazio,
existe uma sequência de compactos {Kn}n∈N de Rd com
∅ 6= K0 ⊂ K1 ⊂ K2 ⊂ · · · ⊂ A
tais que ∪n∈NKn = A e com a propriedade que qualquer K ⊂ A compacto está contido num dos Kn.
Prova: Se A = Rd, basta tomar Kn := BRd [0Rd , n] (n ∈N) e observar que cada K ⊂ Rd é limitado
e portanto está contido numa destas bolas.
Considere agora o caso em que o aberto A 6= Rd, de modo que F := Rd\A é fechado e não é
vazio. Isto quer dizer que a função:
“ψ : x ∈ Rd 7→ dRd(x, F) := infy∈F |x− y|2”
é bem definida, não-negativa, 1-Lipschitz e ψ−1(0) = F. Desta forma, A = {a ∈ Rd : ψ(a) > 0}.
Como A 6= ∅, existe um a0 ∈ A. Desta forma, vale a seguinte propriedade:
∀a ∈ Rd : a ∈ A⇔ ∃n ∈N : |a|2 ≤ n + |a0|2 e ψ(a) ≥
ψ(a0)
n + 1
. (7.2)
A partir destas propriedade, definiremos os compactos que buscamos. De fato, veremos que a
definição a seguir funciona:
Kn :=
{
a ∈ Rd : |a|2 ≤ n + |a0|2 e ψ(a) ≥
ψ(a0)
n + 1
}
(n ∈N).
Para provar que de fato funciona, checamos primeiramente que os conjuntos Kn são todos com-
pactos de Rd. Percebe-se por inspeção que:
∀n ∈N : Kn := BRd [0Rd , n + |a0|2] ∩ ψ−1
([
ψ(a0)
n + 1
,+∞
))
.
Como ψ é contı́nua, os dois conjuntos da interseção são fechados de Rd, logo Kn também é
fechado de Rd. Além disso, Kn está contido na bola de raio n + |a0|2 ao redor da origem e é,
portanto, limitado. Deduzimos do Teorema de Heine-Borel que cada Kn é compacto.
O próximo passo é mostrar que:
∅ 6= K0 ⊂ K1 ⊂ K2 ⊂ · · · ⊂ A e ∪n∈N Kn = A.
De fato, K0 não é vazio porque vê-se que a0 ∈ K0. O fato de que Kn ⊂ Kn+1 para cada n ∈ N
segue do fato que
∀a ∈ Rd : |a|2 ≤ n + |a0| e ψ(a) ≥
ψ(a0)
n + 1
⇒ |a|2 ≤ n + 1 + |a0| e ψ(a) ≥
ψ(a0)
n + 2
115
(já que ψ(a0) > 0). Por fim, ∪n∈NKn = A segue do fato de que, comparando (7.2) com a definição
de Kn, temos que um a ∈ Rd pertence a A se e somente se a ∈ Kn para algum n ∈N.
Falta apenas mostrar que todo K ⊂ A compacto está contido em algum Kn. Para isso, fixe
um tal K e observe que, como K ⊂ A, ψ(x) > 0 para todo x ∈ K. A continuidade de ψ e a
compacidade de K garantem que o ı́nfimo de ψ sobre K é atingido e portanto infx∈K ψ(x) > 0.
Além disso, sabemos que K é limitado, logo supx∈K |x|2 < +∞. Se n ∈ N é grande o suficiente,
podemos garantir que
inf
x∈K
ψ(x) ≥ ψ(a0)
n + 1
e sup
x∈K
|x|2 ≤ n + |a0|.
Deste modo, teremos:
∀a ∈ K : |a|2 ≤ sup
x∈K
|x|2 ≤ n + |a0| e ψ(a) ≥
ψ(a0)
n + 1
,
ou seja,
∀a ∈ K : a ∈ Kn.
Isto quer dizer que K ⊂ Kn se n é grande o suficiente. 2
O Lema 7.1 vai nos permitir definir a métrica que nos interessa. A ideia intuitiva seria
tomarmos uma soma das seminormas ‖ · ‖Kn,∞. No entanto, isso não é viável porque em princı́pio
seminormas podem tomar valores muito grandes. Por essa razão, a proposição abaixo será útil.
Proposição 7.1 Dado K ⊂ A compacto e não vazio, a função αK : C → [0, 1] definida por:
αK( f , g) := min{‖ f − g‖K,∞, 1} (( f , g) ∈ C2)
é simétrica, toma valores entre 0 e 1 e satisfaz a desigualdade triangular.
Prova: Omitimos a prova das duas primeiras propriedades. Resta mostrar a desigualdade trian-
gular. Queremos provar que, para f , g, h ∈ C:
Queremos : min{‖ f − g‖K,∞, 1} ≤ min{‖ f − h‖K,∞, 1}+ min{‖h− g‖K,∞, 1}.
Isso vem do fato que, se c, a, b são reais não-negativos,
c ≤ a + b⇒ min{c, 1} ≤ min{a, 1}+ min{b, 1},
que pode ser checado por inspeção. Aceitando isso, observamos que, pela subaditividade da
norma,
c := ‖ f − g‖K,∞ ≤ a + b := ‖ f − h‖K,∞ + ‖g− h‖K,∞
portanto a desigualdade acima se aplica. 2
Agora provaremos o teorema, mostrando que uma soma das “semimétricas” αKn (com pesos
adequados) nos dá a métrica que buscamos. Os exercı́cios abaixo serão necessários na prova.
Exercı́cio 7.6 Dados K ⊂ F compactos contidos em A, mostre que αK( f , g) ≤ αF( f , g) para todas as
funções f , g ∈ C.
116
Prova: [do Teorema 7.3] Fixe uma sequência {Kn}n∈N de compactos com as propriedades especifi-
cadas no Lema 7.1 e defina, para f , g ∈ C:
dC( f , g) := ∑
n∈N
αKn( f , g)
2n
,
onde as αKn vêm da Proposição 7.1. Note que, como as funções αKn tomam valores entre 0 e 1, a
série acima é cotada pela soma da progressão geométrica 1/2n. Portanto, a série é absolutamente
convergente para quaisquer f , g. Logo, dC( f , g) é bem-definida.
A próxima etapa da demonstração é mostrar o seguinte.
dC satisfaz os axiomas de uma métrica.
Em primeiro lugar, verificamos que dC é positiva-definida. De fato, dC( f , g) ≥ 0 porque cada
αKn( f , g) ≥ 0. Claramente, dC( f , g) = 0 se f = g. Por outro lado, como a série definindo dC( f , g)
é feita de termos não-negativos,
dC( f , g) = 0⇔ ∀n ∈N : αKn( f , g) = 0⇔ ∀n ∈N : ‖ f − g‖Kn,∞ = 0.
Em particular, se f (t) 6= g(t) para algum t ∈ A, o Lema 7.1 garante que t ∈ Kn para algum
n ∈ N (afinal, A = ∪nKn) e vê-se que ‖ f − g‖Kn,∞ ≥ | f (t)− g(t)| > 0. Ou seja, f 6= g implica
dC( f , g) > 0. Isto concui a prova de que dC é positiva-definida. (Repare que aqui usamos o fato
de que A = ∪n∈NKn pela primeira vez. A outra propriedade garantida pelo Lema só seráusada
mais para o final da prova abaixo.)
Ainda nos resta provar que dC é simétrica e satisfaz a desigualdade triangular. Para isso, usamos
novamente a Proposição 7.1: a simetria vem do fato de que cada αKn é simétrica e a desigualdade
triangular vem do fato que, dadas f , g, h ∈ C:
∀n ∈N : αKn( f , g) ≤ αKn( f , h) + αKn(h, g)
e podemos aplicar isso termo a termo na definição de dC (usando o fato de que séries absoluta-
mente convergentes podem ser “somadas termo a termo”). Concluı́mos assim a prova de que dC
é de fato uma métrica.
Nosso próximo passo é relacionar a convergência e a propriedade de Cauchy segundo dC aos
conceitos de convergência e Cauchy uniformes sobre compactos. Para isso, a afirmação a seguir
será fundamental: ela relaciona o comportamento de dC e das seminormas ‖ · ‖Kn,∞ (ou melhor,
com as semimétricas αKn definidas a partir destas normas).
Afirmação 7.1 Dado n0 ∈N, valem as desigualdades:
∀ f , g ∈ C :
αKn0 ( f , g)
2n0
≤ dC( f , g) ≤ 2αKn0 ( f , g) +
1
2n0
.
Prova: [da Afirmação 7.1] A cota inferior segue da definição de dC e do fato que todos os termos
da forma αKn( f , g)/2
n aparecendo naquela definição são não-negativos.
Para a cota superior, usamos as seguintes estimativas:
αKn( f , g) ≤
{
αKn0 ( f , g), se 0 ≤ n ≤ n0 (pelo Exercı́cio 7.6);
1, se n > n0 (pela Proposição 7.1).
117
Deste modo,
dC( f , g) =
+∞
∑
n=0
αKn( f , g)
2n
≤
n0
∑
n=0
αKn0 ( f , g)
2n
+ ∑
n>n0
1
2n
= (2− 2−n0) αKn0 ( f , g) +
1
2n0
≤ 2αKn0 ( f , g) +
1
2n0
.
2
De posse da afirmação, vai ser relativamente fácil terminar a prova. Começamos mostrando
o seguinte.
Dadas { f j}j∈N ∪ { f } ⊂ C, dC( f j, f )→ 0 se e somente se f j → f uniformemente sobre
compactos.
Para ver isso, suponha primeiramente que dC( f j, f )→ 0. Dado K ⊂ A compacto e não-vazio,
queremos provar que ‖ f j − f ‖K,∞ → 0, o que é o mesmo que αK( f j, f ) → 0. O Lema 7.1 garante
que K ⊂ Kn0 para algum n0 ∈ N e então o Exercı́cio 7.6 garante que αK( f j, f ) ≤ αKn( f j, f ).
Usando a Afirmação, concluı́mos que
0 ≤ αK( f j, f ) ≤ αKn0 ( f j, f ) ≤ 2
n0 dC( f j, f )→ 0,
e um raciocı́nio de sanduı́che implica αK( f j, f )→ 0.
Por outro lado, se f j → f uniformemente sobre compactos, temos que αK( f j, f ) → 0 para
todo K ⊂ A compacto. Em particular, isso vale quando K = Kn0 para qualquer n0 ∈N. Segue da
Afirmação que:
∀n0 ∈N : lim sup
j∈N
dC( f j, f ) ≤ 2 lim sup
j∈N
αKn0 ( f j, f ) +
1
2n0
=
1
2n0
.
Como isto vale para todo n0 ∈N, podemos mandar n0 → +∞ e obter:
lim sup
j∈N
dC( f j, f ) ≤ 0,
o que garante que dC( f j, f )→ 0.
Agora tratamos de propriedades tipo Cauchy.
Dada { f j}j∈N ⊂ C, dC( f j, f`)→ 0 se e somente se { f j}j∈N é uniformemente Cauchy sobre
compactos.
A prova é bastante parecida com a anterior e será apenas esboçada. Se { f j}j∈N é Cauchy
sobre compactos, então ‖ f j − f`‖Kn,∞ → 0 (e portanto αKn( f j, f`) → 0) para qualquer n ∈ N.
Fixando um n0 ∈N\{0}, a Afirmação nos dá a estimativa:
dC( f j, f`) ≤ 2αKn0 ( f j, f`) +
1
2n0
.
118
Tomando j, `→ +∞, deduzimos:
∀n0 ∈N : lim sup
j,l→+∞
dC( f j, f`) ≤
1
2n0
e podemos concluir que dC( f j, f`)→ 0 como na prova anterior.
Suponha agora que { f j}j∈N é Cauchy de acordo com a métrica dC. Fixo um compacto K ⊂ A,
precisamos mostrar que ‖ f j− f`‖K,∞ → 0 quando j, `→ +∞. De fato, é fácil ver que é equivalente
mostrar que αK( f j, f`) → 0. Para isso, seguimos o raciocı́nio anterior, tomando n0 ∈ N com
K ⊂ Kn0 e observando que
0 ≤ αK( f j, f`) ≤ 2n0dC( f j, f`)
j,`→+∞−→ 0,
donde segue o αK( f j, f`)→ 0.
Para terminar a prova, mostramos a afirmação final do teorema.
(C, dC) é completo.
Tome uma sequência { f j}j∈N que é Cauchy segundo dC. Mostramos abaixo que existe f ∈ C
com dC( f j, f )→ 0.
Em primeiro lugar, sabemos (pelos itens acima) que { f j}j∈N é uniformemente Cauchy sobre
compactos. Em particular, para cada t ∈ A, { f j(t)}j∈N ⊂ V é Cauchy (já que {t} é compacto) e
existe o limite pontual:
f (t) := lim
j→+∞
f j(t).
Além disso, podemos provar pelo raciocı́nio usual que ‖ f j − f ‖K,∞ → 0 para qualquer K ⊂ A
compacto.
Dado t ∈ A arbitrário, precisamos mostrar que f é contı́nua em t. Para isso, usamos que A é
aberto e portanto existe um δ > 0 tal que a bola fechada BRd [t, δ] ⊂ A. Como esta bola fechada
é compacta (por Heine-Borel!), f j → f uniformemente sobre a bola. Mas sabemos que o limite
uniforme de funções contı́nuas sobre um compacto é uma função contı́nua. Deduzimos que a
restrição de f à bola BRd [t, δ] é contı́nua, o que implica (exercı́cio!) a continuidade de f em t.
Agora, sabemos que f é contı́nua em cada t ∈ A, logo f ∈ C. Como vimos acima, ‖ f j −
f ‖K,∞ → 0 para qualquer K ⊂ A compacto. Já sabemos que isso é equivalente a dC( f j, f ) → 0.
Ou seja: provamos (como querı́amos) que { f j}j∈N converge em C. 2
7.3 Compactos nos espaços de funções contı́nuas
Acima mostramos que os subconjuntos compactos de Rd têm uma “cara” simples: são simples-
mente os fechados e limitados. Em particular, bolas fechadas são sempre compactas. Abaixo,
veremos que este resultado não se estende a espaços de funções contı́nuas. No entanto, conse-
guiremos uma caracterização dos compactos via um teorema chamado de Arzelà-Ascoli.
119
7.3.1 Bolas fechadas não são compactas
Considere C([0, 1], R) com a norma do sup usual. É um fato que existe uma sequência { fn}n∈N ⊂
C([0, 1], R) de funções com ‖ fn‖[0,1],∞ = 1 e ‖ fn − fm‖[0,1],∞ = 1 para todos m, n ∈ N. Por-
tanto a bola unitária fechada ao redor de 0 não é totalmente limitada: ela contem um 1/2-
empacotamento infinito.
Exercı́cio 7.7 Cheque que a sequência de ”tendas” construı́da no Exemplo 3.2 tem as propriedades reque-
ridas acima acima.
Na verdade, o que ocorre é um fenômeno muito mais geral: C([0, 1], R) não tem bolas com-
pactas porque não é um espaço vetorial de dimensão finita.
Lema 7.2 (Lema de Riesz) Considere um espaço de Banach (V, ‖ · ‖V). Então, as bolas fechadas de V
são compactas se e somente se V tem dimensão finita.
Não provaremos este resultado aqui, embora a prova não seja muito difı́cil. No entanto,
ele indica que um critério para achar quem são os compactos de C([0, 1], Rd) tem de ser mais
complicado que o teorema de Heine-Borel. Veremos o critério adequado quando estudarmos o
teorema de Arzèla-Ascoli, no capı́tulo adequado.
7.3.2 O teorema de Arzelà-Ascoli
Agora passamos ao contexto geral em que (K, dK) é compacto, (Z, dZ) é completo e C := C(K, Z)
é espaço métrico com a norma do supremo:
dC( f , g) := sup
t∈K
dZ( f (t), g(t)).
Como podemos caracterizar os compactos de C? Como C é completo, sabemos que F ⊂ C é
compacto se e somente se é fechado e totalmente limitado. O teorema a seguir – um resultado
fundamental de Análise – mostra quem são os subconjuntos uniformemente limitados de C.
Abaixo, recorde que m f (·) é o módulo de continuidade de f : K → Z, definido como no §6.3.3:
m f (δ) := sup{dZ( f (x), f (x′)) : x, x′ ∈ K, dX(x, x′) ≤ δ} ( f : K → Z, δ > 0).
Teorema 7.4 (Arzelà-Ascoli) Uma famı́lia de funções F ⊂ C(K, Z) (com (K, dK) compacto e (Z, dZ)
completo) é totalmente limitada se e somente se ela tem as duas propriedades abaixo.
1. F é pontualmente totalmente limitada: dado qualquer t ∈ K, o conjunto de valores
F (t) := { f (t) : f ∈ F}
é totalmente limitado.
2. F é equicontı́nua: limδ→0+ sup f∈F m f (δ) = 0.
Observação 7.1 Em particular, o teorema nos diz que, se F ⊂ C satisfaz 1 e 2, então toda sequência em
F tem uma subsequência convergente.
120
A prova do Teorema 7.4 está contida nos Lemas 7.3 e 7.4 abaixo. Antes de apresentar os
lemas, vamos tentar entender as duas condições no teorema. O ponto é que as duas condições
valem se F tem um número finito de funções: a propriedade 1 é trivial e a 2 vale porque cada
f ∈ C é uniformemente contı́nua e portanto limδ→0+ m f (δ) = 0 para cada f ∈ F . O que o
teorema nos diz, para famı́lias gerais de funções, é queas propriedades 1 e 2 valem se e somente
se F pode ser bem aproximada por uma famı́lia finita de funções; isto é, se F tem e-redes finitas
para qualquer e > 0.
O próximo resultado mostra uma direção do Teorema de Arzèla-Ascoli.
Lema 7.3 (Necessidade das condições no teorema) Com a notação do Teorema 7.4, vale que, se F é
totalmente limitada, então valem as condições 1 e 2.
Prova: Suponha que F é totalmente limitada e fixe um e > 0 qualquer. Iremos mostrar que:
(i) Dado t ∈ K, podemos cobrir F (t) por um número finito de bolas fechadas de raio e.
(ii) Temos que lim supδ→0+ sup f∈F m f (δ) ≤ 2e.
De fato, se (i) vale para qualquer e > 0, isto nos diz que cada conjunto F (t) pode ser coberto
por um número finito de bolas de raio e; ou seja, cada F (t) é totalmente limitado. Ao mesmo
tempo, se (ii) vale para qualquer e > 0, lim supδ→0+ sup f∈F m f (δ) ≤ 0 e (como m f (δ) ≥ 0
sempre) temos limδ→0+ sup f∈F m f (δ) = 0. Portanto, provar (i) e (ii) será suficiente para concluir
a prova deste lema.
Para demonstrar (i) e (ii), usaremos o fato de que F é totalmente limitado. Deste modo,
existe uma e-rede finita R ⊂ F , que satisfaz:
∀ f ∈ F∃g f ∈ R : dC(g f , f ) ≤ e. (7.3)
A existência desta rede finita nos permite provar a propriedade (i). De fato, veremos que
R(t) := {g(t) : g ∈ R}
é e-rede de F (t) (e é finita porque R é finito). Para mostrar isso, tome um a ∈ F (t) qualquer.
Pela definição de F (t), a = f (t) para alguma f ∈ F . Considere agora g f ∈ R como em (7.3) e
note que b := g f (t) ∈ R(t) satisfaz:
dZ(a, b) = d( f (t), g f (t)) ≤ sup
s∈K
dZ( f (s), g f (s)) = dC( f , g f ) ≤ e.
Portanto, dado a ∈ F (t), há um b ∈ R(t) com dZ(a, b) ≤ e. Ou seja, R(t) é mesmo e-rede.
Agora usaremos R para mostrar a propriedade (ii). Observe que, dados quaisquer x, x′ ∈ K
com dX(x, x′) ≤ δ e qualquer f ∈ F (com g f como em (7.3))
dZ( f (x), f (x′)) ≤ dZ(g f (x), g f (x′)) + dZ(g f (x), f (x)) + dZ(g f (x′), f (x′))
≤ sup
s,t∈K : dX(s,t)≤δ
dZ(g f (t), g f (s)) + 2 sup
t∈K
dZ(g f (x), g f (x′))
(use defs. de mg f e dC) ≤ mg f (δ) + 2dC( f , g f )
(use (7.3) e g f ∈ R) ≤ max
g∈R
mg(δ) + 2e.
121
Note que usamos maxg∈R (e não supg∈R) na última linha porque R é finito. Note ainda que
este último termo é independente de f , x, x′. Ou seja, a desigualdade
dZ( f (x), f (x′)) ≤ max
g∈R
mg(δ) + 2e
vale para toda função f ∈ F e para todos os pares de pontos x, x′ ∈ K com dX(x, x′) ≤ δ.
Tomando supremos, deduzimos que:
sup
f∈F
m f (δ) ≤ max
g∈R
mg(δ) + 2e.
Como já observamos antes da prova do teorema, o fato de que K é compacto implica que cada
g ∈ R é uniformemente contı́nua, de modo que limδ→0+ mg(δ) = 0. Usando novamente a finitude
de R, deduzimos que limδ→0+ maxg∈R mg(δ) = 0. Portanto,
lim sup
δ→0+
sup
f∈F
m f (δ) ≤ 2e,
o que prova (ii). 2
Finalmente, apresentamos o fim da prova do Teorema 7.4.
Lema 7.4 (Suficiência das condições no teorema) Com a notação do Teorema 7.4, se F satisfaz as
condições 1 e 2, então F é totalmente limitada.
Prova: Provaremos que, dado qualquer e > 0, se F satisfaz 1 e 2, então F não contem um
e-empacotamento infinito. Isso basta pela Proposição 6.7.
Como faremos isso? A prova será por contradição. Suporemos que F satisfaz as propriedades
1 e 2 e ao mesmo tempo contem um e-empacotamento infinito. Veremos que isso implicaria
a existência de um (e/2)-empacotamento infinito em F (t1) × F (t2) × . . .F (tk), para alguma
escolha de pontos t1, . . . , tk ∈ K. Veremos que isso contradiz o fato de que cada F (ti) é totalmente
limitado (a propriedade 1 no teorema).
Uma questão crucial é como escolher os pontos ti. A ideia é que estes pontos sejam tais que
cada função f ∈ F seja “bem representada” pelos valores f (ti) nos pontos t1, . . . , tk. Para isso,
usaremos a propriedade 2: sabemos controlar uniformemente sobre f ∈ F a variação de f (t)
quando t muda: deste modo, bastará tomar uma δ-rede {t1, . . . , tk} para um δ bem escolhido
para garantir que os valores de f (ti) “determinam f a menos de um erro pequeno”. A afirmação
abaixo apresenta este raciocı́nio de forma precisa.
Afirmação 7.2 Dado e > 0, e supondo que F satisfaz 1 e 2, existem um k ∈N\{0} e pontos t1, . . . , tk ∈
K tais que, se
∀ f1, f2 ∈ F : max
1≤i≤k
dZ( f1(ti), f2(ti)) ≤ dC( f1, f2) ≤ max
1≤i≤k
dZ( f1(ti), f2(ti)) +
e
2
.
Prova: [da Afirmação] Como e > 0, a propriedade 2 implica que existe um δ > 0 tal que
sup f∈F m f (δ) ≤ e/4. Como K é compacto (e portanto totalmente limitado), existe uma δ-rede
finita {t1, . . . , tk} ⊂ K. Pela definição de δ-rede, sabemos que, para cada x ∈ K, existe um ti
122
com dX(x, ti) ≤ δ, de modo que dZ( f (ti), f (x)) ≤ e/4 para qualquer f ∈ F . Mas então, dadas
quaisquer f1, f2 ∈ K e dado qualquer x ∈ K:
∃1 ≤ i ≤ k : dZ( f1(x), f2(x)) ≤ dZ( f1(ti), f2(ti)) + 2m f (δ) ≤ max
1≤i≤k
dZ( f1(ti), f2(ti)) +
e
2
.
Em particular, tomando o sup em x, deduzimos:
∀ f1, f2 ∈ F : dC( f1, f2) ≤ max
1≤i≤k
dZ( f1(ti), f2(ti)) +
e
2
.
Isso dá a cota inferior na desigualdade que consta do enunciado da Afirmação. A cota inferior
vem do fato que dZ( f1(t), f2(t)) ≤ dC( f1, f2) para quaisquer f1, f2 ∈ C e t ∈ K. [Fim da prova da
afirmação] 2
Para fazermos uso da afirmação, é conveniente criar um pouco de notação. Defina Ti :=
F (ti) ⊂ Z e di a restrição da métrica de Z a Ti. Consideraremos o espaço-produto:
T := T1 × T2 × · · · × Tk
munido da métrica-produto:
dT(x, y) := max
1≤i≤k
dTi(x[i], y[i]) (x = (x[i])
k
i=1, y = (y[i])
k
i=1 ∈ T).
A propriedade 1 no Teorema garante que cada (Ti, di) é totalmente limitado. O Exercı́cio 6.15
implica que (T, dT) também é totalmente limitado. Note que a função φ : F → T associando a
cada f ∈ F o vetor φ( f ) ∈ T com coordenadas φ( f )[i] := f (ti) (1 ≤ i ≤ k) é bem definida. A
Afirmação garanate que:
∀ f1, f2 ∈ F : dT(φ( f1), φ( f2)) ≤ dC( f1, f2) ≤ dT(φ( f1), φ( f2)) +
e
2
.
Agora usaremos a suposição (que fizemos para chegar a uma contradição) que há um e-empacotamento
infinito P ⊂ F . Num e-empacotamento, como sabemos, quaisquer dois elementos distintos estão
a distância estritamente maior do que e um do outro. Disso deduzimos que:
∀ f1, f2 ∈ P : f1 6= f2 ⇒ dT(φ( f1), φ( f2)) ≥ dC( f1, f2)−
e
2
>
e
2
.
Dito de outro modo, a função φ é injetiva sobre P e a imagem deste conjunto,
φ(P) := {φ( f ) : f ∈ P} ⊂ T,
é um (e/2)-empacotamento infinito em (T, dT). No entanto, a existência de φ(P) contradiz o fato
de que (T, dT) é totalmente limitado, que (como vimos) segue da propriedade 1 no Teorema e do
Exercı́cio 6.15. Isto quer dizer que chegamos a uma contradição. Portanto, qualquer famı́lia F
satisfazendo as propriedades 1 e 2 do Teorema tem de ser totalmente limitada. 2
Exercı́cio 7.8 Ao invés de fazermos uma prova por contradição, poderı́amos apresentar um argumento
direto mostrando que P(F , e) ≤ P(T, e/2), para o T construı́do acima. Utilize esta observação e
o Exercı́cio 6.15 para achar uma cota superior para P(F , e) (e portanto para N(F , e)) em termos de
supt∈K N(F (t), e) e N(K, δ).
123
7.4 Mais exercı́cios
Exercı́cio 7.9 Fixo d ∈ N\{0}, consideramos o conjunto Pd de todos os polinômios em uma variável
real que têm grau d ou menor. Observe que, para cada polinômio p ∈ Pd, podemos encontrar coeficientes
a0(p) . . . ad(p) tais que:
∀x ∈ R : p(x) =
d
∑
j=0
aj(p) xj.
Mostre que, dado qualquer conjunto S ⊂ R com mais de d + 1 pontos, existe uma constante Cd,S depen-
dendo apenas de d e S tal que:
∀p ∈ Pd : max
0≤i≤d
|ai(p)| ≤ Cd,S sup
x∈S
|p(x)|.
Exercı́cio 7.10 Deduza do Teorema de Heine-Borel o seguinte resultado: dados d, ` naturais positivos, um
subconjunto K ⊂ Rd×` é compacto (com a topologia dada por qualquer norma) se e somente se ele é fechado
e limitado. Use este resultado para decidir se os conjuntos abaixo são subconjuntos compactos de Rd×d.
1. O(d) := {A ∈ Rd×d : AT A = Id×d} (grupo das matrizes ortogonais d× d);
2. SL(d, R) := {A ∈ Rd×d : det(A) = 1} (grupo linear especialem d dimensões);
3. PSD1(d, R) := {A ∈ Rd×d : A = AT, ∀v ∈ Rd, v.Av ≥ 0 e tr(A) = 1}.
Exercı́cio 7.11 Tome d ∈ N\{0}. Lembre-se de Álgebra Linear que um autovalor de uma matriz A ∈
Rd×d é um número λ ∈ R tal que Ax = λx para algum x ∈ Rd\{0Rd}. Dado um conjunto S ⊂ Rd×d,
defina:
Eig(S) := {λ ∈ R : λ é autovalor de alguma A ∈ S}.
1. Prove que Eig(S) é fechado sempre que S é fechado.
2. Prove que Eig(S) é limitado sempre que S é limitado.
3. Deduza dos itens acima que Eig(S) é compacto sempre que S é compacto.
Exercı́cio 7.12 Prove que um espaço métrico (K, dK) é compacto se e somente se, dada qualquer função
contı́nua f : K → R, a imagem f (K) ⊂ R é compacta.
Exercı́cio 7.13 Considere K ⊂ Rd compacto e convexo (convexidade significa que, dados quaisquer dois
pontos x, x′ ∈ K, o segmento [x, x′] := {(1− λ)x + λx′ : 0 ≤ λ ≤ 1} está todo contido em K). Mostre
que um subconjunto F ⊂ C(K, R`) é totalmente limitado se e somente se ele é equicontı́nuo e existe um
ponto t0 ∈ K tal que F (t0) := { f (t0) : f ∈ F} é limitado.
Exercı́cio 7.14 Fixados α > 0 e espaços métricos (K, dK), (Z, dZ) como no inı́cio do §7.3.2, dizemos que
uma f : K → Z é α-Hölder com constante L > 0 se:
∀x, x′ ∈ K : dZ( f (x), f (x′)) ≤ L dK(x, x′)α.
Note que este conceito generaliza o conceito de função Lipschitz (o caso α = 1 da definição acima).
1. Mostre que toda f que é α-Hölder com alguma constante também é contı́nua.
124
2. No caso particular em que K ⊂ Rd é compacto e convexo (v. exercı́cio anterior) e dK é a métrica
induzida por | · |2, mostre que
f : K → Z α-Hölder com α > 1⇔ f constante.
3. Permita novamente que (K, dK) seja um espaço métrico compacto arbitrário e agora considere Z =
Rd com a métrica usual. Fixos L, α > 0 e um par (t0, z0) ∈ K×Rd, mostre que o conjunto a seguir
é um subconjunto compacto de (C(K, Z), dC):
HL,α,t0,z0 = { f : K → Rd : f é α-Hölder com constante L e f (t0) = z0}.
Exercı́cio 7.15 (Arzèla-Ascoli para funções contı́nuas sobre um aberto) Dado A ⊂ Rd aberto, con-
sidere o espaço C(A, V) com a métrica dC apresentada no §7.2.2. Dada uma função f ∈ C(A, V), pode-
mos definir, para cada compacto K ⊂ A, a restrição de f a K, denotada por f |K. Prove que uma famı́lia
F ⊂ C(A, V) é totalmente limitada de acordo com a métrica dC se e somente se ele tem as seguintes
propriedades:
1. F é pontualmente totalmente limitada, isto é, para todo t ∈ A,
F (t) := { f (t) : f ∈ F} é totalmente limitado;
2. F é equicontı́nua sobre compactos, isto é, para todo compacto não-vazio K ⊂ A:
lim
δ→0+
sup
f∈F
m f |K(δ) = 0.
Deduza que toda sequência { fn}n∈N ⊂ C(A, V) com as duas propriedades acima tem uma subsequência
{ fnk}k∈N com fnk → f ∈ C(A, V) uniformemente sobre compactos.
Exercı́cio 7.16 (Teorema de Dini) Considere um espaço topológico compacto (X, T ) e funções contı́nuas
{ f } ∪ { fn : n ∈ N} de X em R. Suponha que para todo x ∈ X a sequência { fn(x)}n∈N é monótona
e converge a f . Prove que fn tem de convergir uniformemente a f , isto é supx∈X | fn(x)− f (x)| → 0
quando n→ +∞.
Exercı́cio 7.17 Recorde o Exercı́cio 4.18. Naquele problema, tomamos um espaço métrico (X, dX) e uma
f : X → R dada. Dado M > 0, definimos uma nova função fM : X → R,
fM(x) := inf
y∈X
( f (y) + MdX(x, y)) (x ∈ X).
e mostramos que ‖ fM‖Lip ≤ M.
1. Mostre que, se (X, dX) é compacto e f é contı́nua, então fM → f uniformemente. Deduza que as
funções Lipschitz são densas em C(X, R) com a métrica do sup.
2. Suponha agora que X = A é aberto de Rd e dX é a métrica induzida pela norma Euclideana sobre
A. Prove que fM → f uniformemente sobre compactos; portanto, as funções Lipschitz também são
densas em C(A, R) com a métrica da convergência uniforme sobre compactos.
Exercı́cio 7.18 Considere um conjunto S ⊂ Rd não-vazio. Dizemos que uma curva (isto é, uma função
contı́nua) γ : [0, 1]→ Rd cobre S se γ([0, 1]) ⊃ S. Suponha agora que o conjunto
CS := {γ : [0, 1]→ Rd : γ cobre S e ‖γ‖Lip < +∞}
não é vazio. Mostre que existe um elemento γ? ∈ CS com
‖γ?‖Lip = inf{‖γ‖Lip : γ ∈ CS}.
125
126
Capı́tulo 8
Caminhos e conexidade
Se neste moment faz 30oC no Rio de Janeiro e −10oC em São Petesburgo, podemos garantir que
qualquer temperatura entre −10o e 30oC ocorre em algum ponto da superfı́cie do planeta? Este
é um exemplo de uma classe mais geral de perguntas.
Dada uma função real f : X → R, se ela atinge um par de valores a < b, é necessariamente
verdade que ela atinge todos os valores entre a e b? Ou seja, quando vale a implicação:
“∀a, b ∈ f (X) : a < b⇒ [a, b] ⊂ f (X)”?
Pelo Teorema do Valor Intermediário, a implicação acima vale quando X ⊂ R é um intervalo
e f é contı́nua.
O conceito de conexidade de um espaço topológico, apresentado neste capı́tulo, pode ser defi-
nido da seguinte maneira: um espaço é conexo se e somente se toda função contı́nua de X em R
tem a “Propriedade do Valor Intermediário” descrita acima. Outra definição, equivalente a esta,
é que um espaço topológico (X, T ) é conexo se toda divisão de X em duas partes não-triviais
gera uma “quebra”, ou melhor, uma “fronteira” onde as duas partes se encostam. A equivalência
dessas definições é parte do Teorema 8.1 abaixo.
Além de falarmos de conexidade, falaremos de uma outra definição relacionada: a de cone-
xidade por caminhos: um espaço é conexo por caminhos se quaisquer dois pontos são conectados
por uma curva contı́nua. Este segundo conceito é menos geral que a conexidade topológica, mas
é mais intuitivo que o primeiro e também é importante. Além disso, há alguns casos importantes
em que os dois conceitos coincidem. Começamos, então, falando de conexidade por caminhos.
8.1 Conexidade por caminhos
8.1.1 Conectando pontos por curvas
Fixe um espaço métrico (X, dX). Uma curva parametrizada é uma aplicação contı́nua γ : [0, 1]→ X.
Dizemos que γ conecta x ∈ X a x′ ∈ X se γ(0) = x e γ(1) = x′. Dizemos ainda que γ conecta x
a x′ em U ⊂ X se x, x′ ∈ U, γ conecta estes dois pontos e a imagem Im(γ) ⊂ U. Simbolizaremos
esta relação pelo sı́mbolo x U↔ x′.
Definição 8.1 Dizemos que U ⊂ X é conexo por caminhos se x U↔ x′ para todos x, x′ ∈ U.
127
Antes de compreender melhor esta definição, precisaremos de alguns fatos sobre a relação
“ U↔”. O primeiro ponto é mostrar que esta é uma relação de equivalência sobre os elementos de
U.
Lema 8.1 Dados x, x′, x′′ ∈ U, temos:
• Reflexividade: x U↔ x.
• Simetria: x U↔ x′ se e somente se x′ U↔ x.
• Transitividade: x U↔ x′ e x′ U↔ x′′ implicam x U↔ x′′.
Prova: Reflexividade segue do fato de que a curva γ(t) ≡ x, t ∈ [0, 1], conecta x a x. Simetria
vem do fato que γ conecta x a x′ se e somente se t 7→ γ(1− t) conecta x′ a x, e tanto γ quanto
t 7→ 1− t são contı́nuas.
Por fim, suponha x U↔ x′ U↔ x′′. Queremos demonstrar que x U↔ x′′, ou seja, que há uma curva
que conecta x a x′′ em U. Veja primeiramente que, por hipótese, existem curvas γ0, γ1 : [0, 1]→ U
com γ0(0) = x, γ0(1) = γ1(0) = x′ e γ1(1) = x′′. Defina agora:
γ(t) :=
{
γ0(2t), 0 ≤ t ≤ 1/2;
γ1(2t− 1), 1/2 < t ≤ 1.
A ideia é que nós “colamos” a curva γ0 com a curva γ1, o que resulta numa única curva contı́nua
porque γ0 termina onde γ1 começa. De fato, supondo por um instante que γ é contı́nua, vemos
que γ(t) ∈ U para todo t (afinal, γ(t) = γ0(s) ou γ1(s) para algum s ∈ [0, 1]) e conecta x a x′′, de
modo que x U↔ x′′.
Falta checar que γ é mesmo contı́nua. Há várias maneiras de fazer isso e aqui optamos pela
mais topológica.
Dado um conjunto F ⊂ U fechado em U, vamos mostrar que γ−1(F) ⊂ [0, 1] é fechado. Veja
que, dado um t ∈ [0, 1] qualquer,
t ∈ γ−1(F)⇔ (t ≤ 1/2 e γ0(2t) ∈ F) ou (t ≥ 1/2 e γ1(2t− 1) ∈ F).
O ponto sutil acima é que as duas cláusulas do “ou” serão verdade simultaneamente no caso em
que t = 1/2. Isto vem do simples fato que γ0(2t) = x′ = γ1(2t− 1) se t = 1/2. Aqui usamos o fato
de que γ0 termina onde γ1 começa, que é fundamental para termos a continuidade.Vamos agora terminar a prova observando o seguinte. Defina as funções contı́nuas φ0(t) :=
2t, definida para t ∈ [0, 1/2], e φ1(s) := 2s− 1, para s ∈ [1/2, 1]. A equivalência acima nos mostra
que
γ−1(F) = (γ0 ◦ φ0)−1(F) ∪ (γ1 ◦ φ1)−1(F).
Como γ0, γ1, φ0 e φ1 são contı́nuas, temos que (γ0 ◦ φ0)−1(F) ⊂ [0, 1/2] é fechado em [0, 1/2]
e (γ1 ◦ φ1)−1(F) ⊂ [1/2, 1] é fechado em [1/2, 1]. Como ambos os intervalos são fechados,
deduzimos que (γ0 ◦ φ0)−1(F) e (γ1 ◦ φ1)−1(F) são ambos fechados em [0, 1] e portanto γ−1(F),
que é a união dos outros dois, também é fechado em [0, 1], como querı́amos demonstrar. 2
128
8.1.2 Exemplos básicos
Vamos agora estudar alguns casos de conjuntos conexos por caminhos.
Exemplo 8.1 Os conjuntos conexos por caminhos em R são exatamente os intervalos.
Observe que um conjunto I ⊂ R é um intervalo se e somente se, dados x, x′ ∈ I com x < x′,
temos que qualquer ponto z ∈ (x, x′) está em I. Desta forma, sempre que I é um intervalo e
x < x′ estão em I, temos que a curva γ(t) := (1− t) x + t x′ (t ∈ [0, 1]) conecta x a x′ em I, o que
quer dizer que x I↔ x′ e vice-versa. Ou seja, se I é intervalo, então I é conexo por caminhos.
Para ter a recı́proca, suponha que I ⊂ R é conexo por caminhos. Queremos mostrar que
I é um intervalo, isto é, que, dados x, x′ ∈ I com x < x′, então qualquer ponto z ∈ (x, x′)
está também em I. Considere x < x′ como acima e tome uma curva contı́nua γ : [0, 1] → I
conectando x a x′ em I. Esta é uma aplicação contı́nua de [0, 1] em R, portanto o Teorema do
Valor Intermediário nos garante que, dado z ∈ (x, x′), há um t ∈ (0, 1) com γ(t) = z. Em
particular, como a imagem de γ está contida em I, isto quer dizer que z = γ(t) ∈ I. Como
z ∈ (x, x′) é arbitrário, isto encerra a prova.
Exemplo 8.2 Seja (V, ‖ · ‖V) um espaço vetorial normado e C ⊂ V um conjunto convexo, isto é tal que,
dados quaisquer v, v′ ∈ C e t ∈ [0, 1], (1− t) v + tv′ ∈ C. Geometricamente, isto quer dizer que, dados
dois pontos em C, todo o segmento de reta entre eles também está em C.
Veja que claramente C é conexo, dado que, dados v, v′, a curva γ(t) = (1− t) v + t v′, que é
contı́nua (por quê?), demonstra que v C↔ v′. O mais interessante é mostrar que toda bola em V é
convexa. De fato, se R > 0 e v0 ∈ V, a bola B(v0, R) é dada por:
B(v0, R) = {v ∈ V : ‖v− v0‖V < R.}
Mas então, para quaisquer v, v′ ∈ B(v0, R) e t ∈ [0, 1], temos ‖v− v0‖V < R, ‖v′ − v0‖V < R e
portanto
‖(1− t)v + tv′ − v0‖V = ‖(1− t)(v− v0) + t(v′ − v0)‖V
≤ (1− t)‖v− v0‖V + t‖v′ − v0‖V
< (1− t)R + tR = R,
ou seja, (1− t)v + tv′ ∈ B(v0, R).
Exemplo 8.3 Suponha que U, V ⊂ X são conexos por caminhos e têm um ponto em comum. Então
U ∪V é conexo por caminhos.
De fato, seja x0 ∈ U ∩ V. Então, para todo x ∈ U ∪ V, ou x ∈ U e x
U↔ x0 (já que U é
conexo por caminhos), ou x V↔ x0 (e vale o análogo para V). Em ambos os casos, x
U∪V↔ x0 e a
transitividade desta relação garante que x U∪V↔ x′′ para quaisquer x, x′′ ∈ U ∪V.
Exemplo 8.4 Seja U ⊂ X conexo por caminhos. Para qualquer função contı́nua f : U → Y, a imagem
f (U) é conexa por caminhos. Em particular, se Y = R, f (U) é um intervalo.
129
Para ver isso, observe que, dados x, x′ ∈ U e uma curva γ ligando estes dois pontos em U, a
composição f ◦ γ é contı́nua e conecta f (x) a f (x′) em f (U). Deste modo, como todos os pares
de pontos em U são conectados por curvas em U, quaisquer dois pontos y = f (x), y′ = f (x′) em
f (U) são conectados por caminhos em f (U). Ou seja, f (U) é conexo por caminhos.
Exemplo 8.5 Dado d ∈N\{0, 1}, a esfera unitária Sd−1 ⊂ Rd é conexa por caminhos.
Para provar este resultado, a ideia geométrica é a seguinte: dados x, x′ ∈ Sd−1, podemos
pensa na interseção da esfera com o plano que passa por x, x′ e a origem de Rd. Esta interseção
é um cı́rculo que passa pelos dois pontos e podemos tomar o arco do cı́rculo entre x e x′ como a
curva que conecta os dois pontos.
Formalizamos este raciocı́nio usando geometria analı́tica. Tome x, x′ ∈ Sd−1. Como ambos os
vetores estão na esfera, eles têm norma 1 e podemos achar um vetor x⊥ tal que:
x′ = (x.x′) x +
√
1− (x.x′)2 x⊥.
Como |x.x′| ≤ 1 por Cauchy Schwartz, podemos também escrever x.x′ = cos θ para algum
0 ≤ θ ≤ π; deste modo, sin θ ≥ 0 e a relação cos2 θ + sin2 θ = 1 nos diz que sin θ =
√
1− cos2 θ.
Deduzimos que:
x′ = cos θ x + sin θ x⊥.
Portanto, a curva
γ : t ∈ [0, θ] 7→ (cos t) x + (sin t) x⊥
é contı́nua, tem imagem na esfera (exercı́cio) e vai de γ(0) = x e γ(1) = x′. Como x e x′ são
arbitrários, Sd−1 é conexa por caminhos.
Exercı́cio 8.1 Determine se os conjuntos contidos em Rd (d > 1) abaixo são convexos e/ou conexos por
caminhos.
1. O simplexo
∆d :=
{
x ∈ Rd :
d
∑
j=1
x[j] = 1 e ∀i ∈ {1, . . . , d}, x[i] ≥ 0
}
.
2. A esfera unitária Sd−1 := {x ∈ Rd : |x|2 = 1.}
3. Rd\{0}.
Exercı́cio 8.2 Tome a métrica discreta sobre X e prove que este espaço é conexo por caminhos se e somente
se X tem apenas um elemento.
8.2 Conexidade topológica
O conceito de conexidade topológica é menos intuitivo que o de conexidade por curvas, mas é
mais geral e de certo modo mais robusto e mais importante.
Primeiro tentaremos entender a intuição deste conceito. Imagine que tentamos separar X em
duas partes L e R = Lc com L, R 6= ∅. Queremos dizer que, se X é conexo, qualquer divisão
130
deste tipo causará uma “quebra não-trivial”. Para definir isso, sugerimos a seguinte ideia: uma
“quebra” é um conjunto de pontos u ∈ X que “vê de perto” tanto L quanto Lc. Num espaço
métrico, é natural escrever esta condição na seguinte forma:
u está na quebra se BX(u, r) ∩ L 6= ∅ e BX(u, r) ∩ Lc 6= ∅ para todo r > 0.
É fácil ver que u satisfaz as condições acima se e somente se u ∈ ∂L = L ∩ R. Ou seja, quando
dividimos X em L e R = Lc, a quebra é o conjunto ∂L. Dizer que há quebra é, então, pedir que
∂L 6= ∅. Esta é uma maneira de motivar a seguinte definição.
Definição 8.2 Um espaço topológico (X, T ) é conexo se todo L ⊂ X com L 6= ∅, X tem ∂L 6= ∅. Um
subconjunto U ⊂ X é conexo se (U, TU) é conexo, onde TU é a topologia induzida por T em U.
Para esquentar, vale a pena tentar fazer o exercı́cio abaixo.
Exercı́cio 8.3 Suponha que X tem pelo menos dois elementos. Ele é conexo com a topologia grossa? E
com a topologia fina?
8.2.1 Formas equivalentes do conceito
O conceito de conexidade acima faz sentido, mas as consequências dele ainda não são totalmente
claras. Nosso próximo objetivo será provar o seguinte resultado.
Teorema 8.1 Dado um espaço topológico (X, T ), as seguintes propriedades são equialentes.
1. (X, T ) é conexo;
2. os únicos subconjuntos de X que são simultaneamente abertos e fechados são ∅ e X;
3. toda função contı́nua η : X → {0, 1} é constante (usamos a topologia da métrica discreta em {0, 1});
4. para toda toda função contı́nua f : X → R, f (X) := { f (x) : x ∈ X} é um intervalo.
Vejamos o que cada item diz. O primeiro é a nossa definição: X é conexo se qualquer maneira
de parti-lo em dois resulta numa “quebra”. O segundo, como veremos, tem a ver com a relação
entre “∂S = ∅” e um subconjunto ser simultaneamente aberto e fechado. O terceiro diz que não
dá para pintar os pontos de X usando duas cores (aqui representadas por 0 e 1) sem criar uma
região onde se “pula” abruptamente de uma cor pra outra (o que seria uma descontinuidade em
η). O último item nos fala que a imagem de X por f não pode ”pular”um ponto da reta; ou seja,
X é conexo se e somente se o Teorema do Valor Intermediário se aplica a X!
Faremos esta prova por partes e de uma forma que não é “econômica em implicações”.
Começamos com uma proposição que mostra “1⇔ 2”.
Proposição 8.1 Um espaço topológico (X, T ) é conexo se e somente se ∅ e X são os únicos conjuntos
simultaneamente abertos e fechados de X.
Prova: Olhando para a Definição 8.2, vemos que esta Proposição é equivalente à seguinte afirmação.
Afirmação 8.1 Em qualquer espaçotopológico (X, T ), um conjunto L ⊂ X satisfaz ∂L = ∅ se e somente
se L é ao mesmo tempo aberto e fechado.
131
Provemos, então, esta afirmação.
Começamos supondo que L ⊂ X é ao mesmo tempo aberto e fechado; nosso objetivo será
mostrar ∂L = ∅. Para isso, recorde que complementares de abertos/fechados são fechados/abertos
(respectivamente). Portanto, o complementar de L também é ao mesmo tempo aberto e fechado.
Sendo assim, L = L, Lc = Lc e
∂L = L ∩ Lc = L ∩ Lc = ∅, como querı́amos demonstrar.
Agora provamos a implicação na direção contrária. Suponha que L ⊂ X tem fronteira va-
zia; queremos provar que L é ao mesmo tempo aberto e fechado. Nossa hipótese diz que∂L =
L∩ Lc = ∅. Para quaisquer dois subconjuntos de X, A∩ B = ∅ implica A ⊂ Bc. Deste modo, de-
duzimos da igualdade acima que L ⊂ Lcc. Como a Proposição 5.2 nos diz que “o complementar
do fecho é o interior do complementar”, obtemos L ⊂ Lo. Mas também sabemos que Lo ⊂ L ⊂ L
sempre. Portanto, obtemos L = L = Lo. Como L é fechado e Lo é aberto, deduzimos que L é
fechado e aberto. Isto conclui a prova. 2
O próximo passo prova que “1⇔ 3” no Teorema 8.1.
Proposição 8.2 Um espaço topológico (X, T ) é conexo se e somente se toda função contı́nua η : X →
{0, 1} é constante (aqui tomamos a topologia discreta sobre {0, 1}, que é a mesma topologia induzida pela
métrica usual da reta real).
Prova: A prova se baseia caracterização de conexidade na Proposição 8.1 e na seguinte observação:
há uma bijeção natural entre funções contı́nuas η : X → {0, 1} e conjuntos L ⊂ X que são
simultaneamente abertos e fechados.
Para ver isso, tome η : X → {0, 1} contı́nua. Como {0}, {1} são subconjuntos simultanea-
mente abertos e fechados de {0, 1},
Lη := η−1({0}) é aberto e fechado em X.
Na direção contrária, se L ⊂ X é simultaneamente aberto e fechado, é fácil ver que a função:
ηL : x ∈ X 7→
{
0, x ∈ L;
1, x ∈ Lc;
é contı́nua. Note-se ainda que LηL = L e ηLη = η para quaisquer L, η como acima.
Provada a observação, podemos concluir a prova, notando que uma função contı́nua η : X →
{0, 1} é constante se e somente se Lη = ∅ ou Lη = X. 2
A próxima Proposição termina a prova do Teorema 8.1, mostrando que “3⇔ 4.
Proposição 8.3 Um espaço topológico (X, T ) tem a propriedade de que toda função contı́nua η : X →
{0, 1} é constante se e somente se para qualquer f : X → R contı́nua, f (X) é intervalo.
Prova: Provaremos as duas implicações na forma contrapositiva.
Se existe uma η : X → {0, 1} contı́nua e não constante, queremos mostrar que há uma
f : X → R contı́nua tal que f (X) não é intervalo. A ideia é tomarmos f = η, já que o fato de que
η não é constante implica que η(X) = {0, 1} não é intervalo. No entanto, esse argumento falha
por tecnicalidades:
132
• f deve ter contradomı́nio R, enquanto η tem contradomı́nio {0, 1}: elas não podem ser “a
mesma função”;
• mesmo que fossem a mesma função, não é completamente evidente que f seja contı́nua
(com contradomı́nio R e a topologia correspondente) só porque η é cotı́nua.
O primeiro ponto é resolvido observando que podemos definir f : X → R pela fórmula
∀x ∈ X : f (x) = η(x).
Na verdade, este truque é comum: sempre podemos “trocar o contradomı́nio” de uma função
η : S1 → S2 por um outro conjunto S3 6= S2, contanto que S3 ⊃ η(S1). Isso será feito de novo
a seguir e será chamado de “abuso de notação”. O segundo ponto acima também é um pouco
sutil. Resolvê-lo passa pelo fato que a topologia discreta sobre {0, 1} é precisamente a topologia
induzida pela métrica natural sobre a reta real. Deste modo, se S ⊂ R é dado, observe que
f−1(S) = η−1(S ∩ {0, 1}) e que S ∩ {0, 1} é sempre aberto em {0, 1}. Como η é contı́nua, isto
quer dizer que f−1(S) é aberto de X para todo S ⊂ R, o que é mais do que suficiente para garantir
que f : X → R é contı́nua.
Agora suporemos que existe uma f : X → R contı́nua tal que não é intervalo e mostraremos
que existe η : X → R contı́nua e não constante. Dizer que f (X) não é intervalo significa que
existem números reais r < r′ < r′′ na reta com r, r′′ ∈ f (X) e r′ 6∈ f (X). Observe que isso quer
dizer que f (X) ⊂ R\{r′}. Em particular, podemos “abusar notação” e dizer que o contradomı́nio
de f é R\{r′}.
Observe agora que a função ξ : R\{r′} → {0, 1} que leva t ∈ R\{r′} em 0 se t < r′ e em 1 se
t > r′, é contı́nua. Isso quer dizer que η := ξ ◦ f : X → {0, 1} também é contı́nua. Afirmamos
que η não é constante. Para ver isso, basta lembrarmos que r < r′ < r′′ com r, r′′ ∈ f (X), logo
existem x, x′′ ∈ X com f (x) = r, f (x′′) = r′′ e
η(x) = ξ(r) = 0 e η(x′′) = ξ(r′′) = 1.
Portanto, η não é constante. 2
8.2.2 Exemplos
Nossa próxima tarefa é analisar alguns exemplos em que a definição de convexidade é aplicada.
Começamos descobrindo quem são os conjuntos conexos da reta real.
Exemplo 8.6 Os subconjuntos conexos da reta R são precisamente os intervalos.
Para ver isso, tome I ⊂ R intervalo. Dada η : I → {0, 1} contı́nua, veremos que ela tem de
ser constante. Suponha (para chegar a uma contradição) que η não é constante. Como vimos na
prova da Proposição 8.3, podemos “abusar notação” e pensar em η como uma função contı́nua
de I em R. Como ela não é constante, há pontos t0, t1 ∈ I com η(t0) = 0 e η(t1) = 1. O
Teorema do Valor Intermediário implica que para cada x ∈ (0, 1) há um t ∈ I com γ(t) = x.
Mas isto contradiz o fato de que o contradomı́nio de η é {0, 1}. Portanto, se I é intervalo, toda
η : I → {0, 1} tem de ser constante.
133
Por outro lado, suponha que I não é intervalo. Mostraremos que I é desconexo usando uma
função análoga à ξ da prova da Proposição 8.3. Como I não é intervalo, existe um ponto r ∈ R\I
tal que inf I < r < sup I. A função
ξ(t) :=
{
0, t < r
1, t > r.
Esta função está definida para t ∈ R e é sabido que ela só é descontı́nua em t = x. Como x 6∈ I,
sua restrição η = η0 |I é contı́nua. Além disso, vemos que, como x > inf I, existe t0 ∈ (inf I, x)
com t0 ∈ I e portanto η(t0) = 0. Do mesmo modo, como x < sup I, existe t1 ∈ (x, sup I) com
η(t1) = 1. Portanto, o fato de que I não é um intervalo implica que existe η : I → {0, 1} contı́nua
e não constante.
Exemplo 8.7 Todo conjunto conexo por caminhos é conexo. (A recı́proca em geral é falsa.)
Um contraexemplo para a recı́proca será discutido na próxima seção. Para ver que conexidade
por caminhos implica conexidade, imagine que U é conexo por caminhos e que η : U → {0, 1} é
contı́nua. Sem perda de generalidade, supomos que U 6= ∅ e tomamos x0 ∈ U. Nossa tarefa será
mostrar que η(x) = η(x0) para todo x ∈ U. De fato, dado x ∈ U, sabemos que x
U↔ x0, portanto
existe γ : [0, 1] → U contı́nua com γ(0) = x0 e γ(1) = x. A composição η ◦ γ : [0, 1] → {0, 1} é
contı́nua; como [0, 1] é conexo, η ◦ γ é constante. Logo η(x) = η(γ(1)) = η(γ(0)) = η(x0), como
querı́amos demonstrar.
Exemplo 8.8 Se U ⊂ X é conexo, qualquer conjunto V contendo U e contido em U é conexo.
É um bom exercı́cio provar isso no caso em que a topologia de X é dada por uma métrica.
Abaixo, damos uma prova puramente topológica.
Considere η : V → {0, 1} contı́nua; nosso objetivo é provar que ela é constante. O primeiro
passo é observar que a restrição η |U também é contı́nua e, como U é conexo, η |U é constante.
Suporemos sem perda de generalidade que η(x) = 0 para todo x ∈ U. A ideia agora é provar
que η(y) = 0 para todo y ∈ V.
Para isso, é suficiente mostrar que, dado um ponto arbitrário y ∈ V, existe um x ∈ U com
η(x) = η(y). Fixe então um y ∈ V e tome b := η(y). Temos y ∈ η−1({b}). Como η é contı́nua,
η−1({b}) é aberto relativo de V, o que quer dizer que η−1({b}) = A ∩ V para algum aberto
A ⊂ X da topologia T . Então, y ∈ A com A aberto. Também sabemos que y ∈ V ⊂ U e que todo
aberto interceptando U também intercepta U; logo, existe um ponto x ∈ A ∩U. Como U ⊂ V,
x ∈ A ∩U ⊂ A ∩V = η−1({b})⇒ η(x) = b = η(y).
Ou seja, achamoso ponto x ∈ U com η(x) = η(y) de que precisávamos. Isso conclui a prova de
que V é conexo.
Exercı́cio 8.4 Utilize argumentos relacionados com os que vimos acima para mostrar o seguinte resultado:
se U ⊂ X é dado (não necessariamente conexo) e U ⊂ V ⊂ U, então V é o fecho de U na topologia relativa
de V.
Exemplo 8.9 Se U ⊂ X é conexo e f : U → Y é contı́nua, a imagem f (U) é conexa.
134
Tome U e f como acima. Considere η : f (U) → {0, 1} contı́nua. Então η ◦ f : U → {0, 1}
também é contı́nua. Como U é conexo, η ◦ f é constante. Em particular, dados quaisquer a =
f (u) ∈ f (U), a′ = f (u′) ∈ f (U),
η(a) = η( f (u)) = η( f (u′)) = η(a′).
Ou seja, η é constante sobre f (U). Como η : f (U) → {0, 1} é uma função contı́nua qualquer,
deduzimos que f (U) é conexo.
Exemplo 8.10 Se F é uma coleção de subconjuntos conexos de X e F∩ F′ 6= ∅ para quaisquer F, F′ ∈ F ,
então ∪F∈F F é conexo.
Note que provamos que uma união de dois conjuntos conexos por caminhos com ponto em
comum é conexa por caminhos. Aqui, a união é conexa mesmo que a coleção F tenha infinitos
elementos.
Para provar que vale a propriedade acima, tomemos η : ∪F∈F F → {0, 1} contı́nua e dois
pontos quaisquer x, x′ da união, para mostrar que η(x) = η(x′). Para isto, tome F, F′ ∈ F tais
que x ∈ F e x′ ∈ F′ (tais conjuntos têm de existir, porque x e x′ estão na união). Por hipótese,
podemos encontrar um elemento x0 ∈ F ∩ F′. Como F é conexo, η é contı́nua, a restrição de η a
F é constante; isto quer dizer que η(x) = η(x0) porque x0, x ∈ F. Do mesmo modo, a conexidade
de F′ implica η(x′) = η(x0). Deduzimos que η(x) = η(x′), como querı́amos demonstrar.
8.2.3 Um pouco mais sobre conexidade e topologia induzida
Consideramos agora em que (X, T ) é espaço topológico, D ⊂ X e TD é a topologia que T induz
sobre D.
Como podemos decidir se D é conexo? É mais fácil dizer quando D é desconexo: isso ocorre se
e somente se existe um subconjunto L ⊂ D, diferente tanto de D quanto de ∅, que é relativamente
aberto e fechado. Detalhemos estes pontos:
1. “L é relativamente aberto” é o mesmo que dizer que existe um aberto de X, A ⊂ X, com
A ∩ X = L.
2. “L é relativamente fechado” é o mesmo que dizer que o complementar de L em D é relati-
vamente aberto, ou seja, existe um aberto de X, B ⊂ X, com B ∩ D = D\L.
Destas observações, segue o seguinte fato.
Proposição 8.4 D é desconexo se e somente se existem abertos A, B ⊂ X de X tais que A ∩ B ∩ D = ∅
e A ∪ B ⊃ D.
Não provamos esta proposição, que fica como exercı́cio, mas observamos (para ajudar) que
as duas condições sobre A e B querem dizer que B ∩ D é o complementar de A ∩ D em D.
135
8.3 Exemplos mais interessantes das definições
Como vimos acima, as teorias de conexidade (topológica) e conexidade por caminhos são análogas.
De fato, no caso de subconjuntos da reta real R, há uma coincidência total entre as duas
definições: os intervalos são exatamente os subconjuntos conexos e também os conexos por cami-
nhos.
Nossos objetivos nesta seção são três. Em primeiro lugar, mostraremos a conexidade ou não-
conexidade do conjunto de matrizes ortogonais. Em segundo lugar, veremos que os conceitos de
conexidade e conexidade por caminhos, que são equivalentes em dimensão 1, não são equiva-
lentes já em dimensão 2. Por último, mostraremos que as duas noções de conexidade coincidem
sempre que falamos de abertos em espaços vetoriais normados.
8.3.1 Matrizes ortogonais
12/04/2021 - sendo escrita.
Nesta seção, tomamos d ∈ N\{0, 1} e consideraremos alguns subconjuntos de Rd×d. Obvia-
mente, este espaço inteiro é um espaço vetorial, logo convexo e conexo por caminhos. Precisare-
mos de algumas propriedades da função determinante:
det : Rd×d → R.
1. A matriz identitade d× d tem determinante det(Id×d) = 1.
2. Dadas A, B ∈ Rd×d, det(AB) = det(A)det(B).
3. O determinante não muda se tomamos a transposta da matriz.
4. Uma matriz A ∈ Rd×d tem determinante não-nulo se e somente se é inversı́vel.
5. Se a matriz A ∈ Rd×d tem a estrutura abaixo:
A =

0
Ã
...
0
0 . . . 0 1
 ;
isto é, se A[i, d] = A[d, i] = 0 para 1 ≤ i < d− 1, A[d, d] = a ∈ R e à ∈ R(d−1)×(d−1) tem
entradas A[i, j] para 1 ≤ i, j ≤ d− 1, então det(A) = a det(Ã).
O resultado abaixo é bastante útil para se estabelecer a conexidade por caminhos de outros
grupos de matrizes.
Teorema 8.2 Considere o conjunto de matrizes ortogonais
O(d) := {Q ∈ Rd×d : QTQ = Id×d}
e seus subconjuntos
SO(d) := {Q ∈ Rd×d : det(Q) = 1};
SO−(d) := {Q ∈ Rd×d : det(Q) = −1}.
136
Então O(d) = SO(d) ∪ SO−(d) (com união disjunta). O(d) é desconexo, mas SO(d) e SO−(d) são
conexos por caminhos.
Este resultado pode ser apreciado de duas maneiras. Uma é matemática: SO(d) e O(d) são
grupos de Lie – isto é, grupos que têm estruturas de variedade – e este resultado nos dá informação
sobre a topolgia do espaço.
Outra maneira é mais aplicada. Imagine que quero descolar um conjunto de pontos S ⊂ R3
para um outro, QS ⊂ R3 com Q ∈ SO(3). Podemos imaginar por exemplo que S é um pedaço
de chapa metálica que está deitado e queremos botar em outra posição. O fato de que SO(3)
é conexo por caminhos significa que há uma maneira contı́nua de passar de Q(0) = Id×d para
Q(1) = Q; ou seja, há como mexer S sem saltos para passar de uma posição a outra.
Esta prova dará um bocado de trabalho, mas a graça dela é termos a oportunidade de traba-
lhar com o grupo SO(d) mais de perto. Vários passos serão deixados como exercı́cios que não
são difı́ceis para quem lembra bem de Álgebra Linear.
Prova: Começamos a prova com algumas observações de Álgebra Linear, que deixamos como
exercı́cio.
Exercı́cio 8.5 O(d) e SO(d) são grupos (fechados por produtos e inversas). Além disso, uma matriz
pertence a O(d) se e somente se suas colunas são ortonormais (têm norma 1 e são ortogonais umas às
outras).
Nosso primeiro passo será mostrar o seguinte resultado.
O(d) = SO(d) ∪ SO−(d) é desconexo.
Para continuar, vamos entender porque O(d) tem duas partes. Veja que:
∀Q ∈ O(d) : det(Q)2 = det(QT)det(Q) = det(QTQ) = det(Id×d) = 1.
Como det(Q) toma valores reais, deduzimos que det(Q) ∈ {−1,+1} para qualquer matriz Q ∈
O(d), o que quer dizer que toda Q ∈ O(d) está ou em SO(d) ou em SO−(d). Além disso,
notamos que estes dois conjuntos não são vazios, já que a identidade está em SO(d) e a matriz
R =

0
Id−1
...
0
0 . . . 0 1
 ∈ SO−(d)
(em virtude da propriedade 5 do determinante). Concluı́mos que O(d) é a união disjunta de
SO(d) e SO−(d) e estes dois conjuntos não são vazios: em particular, a imagem da função
determinante sobre O(d) é det(O(d)) = {−1, 1}, que não é intervalo. Por isso, O(d) não é
conexo.
Agora que encontramos as duas “partes naturais” de O(d), mostraremos que as duas são co-
nexas por caminhos. De fato, o próximo argumento nos mostra que só precisamos nos preocupar
com uma delas.
Se SO(d) é conexo por caminhos, SO−(d) também é.
137
De fato, considere a matriz R definida acima. Usando a continuidade da multiplicação de
matrizes, vê-se facilmente (exercı́cio) que
ψ : Q ∈ SO(d) 7→ RQ ∈ SO−(d)
é uma bijeção contı́nua com inversa contı́nua. Em particular, SO−(d) = ψ(SO(d)). Completa-
mos este passo lembrando que a imagem de um espaço conexo por caminhos por uma função
contı́nua também é conexa por caminhos.
A partir daqui, usaremos indução em d ≥ 2 para provar que SO(d) é conexo por caminhos.
SO(d) é conexo por caminhos – caso base (d = 2).
Este caso é resolvido pelo seguinte exercı́cio.
Exercı́cio 8.6 Mostre que
SO(2) =
{(
cos θ − sin θ
sin θ cos θ
)
: θ ∈ R
}
e deduza que SO(2) é conexo por caminhos. (A dica é usar o fato que as colunas de Q ∈ SO(2) são
ortonormais para observar que a primeira coluna é Q1 = (cosθ, sin θ)T para algum θ. A outra coluna
é um dos dois vetores unitários ortogonais a Q1. A condição de determinante igual a 1 diz qual vetor
ortogonalescolher.)
SO(d) é conexo por caminhos – passo indutivo (d ≥ 3).
A ideia será encontrarmos dentro de SO(d) uma cópia (que na verdade é um subgrupo)
que é uma “cópia” de SO(d − 1) (e portanto é conexo por caminhos). Daı́, encerraremos a
prova mostrando que toda Q ∈ SO(d) pode ser conectada por uma curva contı́nua a alguma
Q1 ∈ H(d).
Exercı́cio 8.7 Mostre que as duas afirmações acima – H(d) conexo por caminhos e todo Q ∈ SO(d)
conectado por curva contı́nua a alguma Q1 ∈ H(d) – são suficientes para se deduzir que SO(d) é conexo
por caminhos.
Achando uma “cópia” de SO(d− 1) em SO(d). Para encontrarmosH(d), começamos definindo
uma função função Φd : R(d−1)×(d−1) → Rd×d da seguinte forma.
Φd(Q̃) :=

0
Q̃
...
0
0 . . . 0 1
 (Q̃ ∈ R(d−1)×(d−1)).
Pode-se verificar diretamente que Πd é contı́nua entrada a entrada e portanto é contı́nua.
ALém disso, ela tem as seguintes propriedades
Exercı́cio 8.8 Mostre que Πd(I(d−1)×(d−1)) = Id×d e que, para quaisquer Q̃1, Q̃2 ∈ R(d−1)×(d−1),
det(Πd(Q̃1)) = det(Q̃1), Πd(Q̃1)T = Πd(Q̃1)T e Πd(Q̃1)Πd(Q̃2) = Πd(Q̃1Q̃2).
138
Segue do exercı́cio acima que, dada uma Q̃ ∈ R(d−1)×(d−1) qualquer
Πd(Q̃) ∈ SO(d)⇔ Q̃ ∈ SO(d− 1). (8.1)
Chamamos de H(d) := Φd(SO(d − 1)) e verificamos que H(d) ⊂ SO(d). Pela hipótese de
indução, SO(d− 1) é conexo por caminhos. Como Πd é contı́nua, H(d) também é.
Conectando elementos de SO(d) a H(d). Nosso próximo passo será mostrar a seguinte afirmação.
Afirmação 8.2 Dada Q ∈ SO(d), existe uma Q1 ∈ H(d) com Q
SO(d)↔ Q1.
Para isso, precisamos primeiramente de uma informação adicional sobre H(d).
Observação 8.1 Um elemento Q ∈ SO(d) pertence a H(d) se e somente se sua d-ésima
coluna é ed.
Prova: Claramente, todo elemento de H(d) tem a última coluna igual a ed.
Por outro lado, tome Q ∈ SO(d) com a última coluna igual a ed. Queremos
mostrar que Q ∈ H(d), isto é, que existe uma Q̃ ∈ SO(d− 1) com Πd(Q̃) = Q
Note que, se a d-ésima coluna de Q é ed, todas as entradas Q[i, d] com 1 ≤ i < d são
0, enquanto Q[d, d] = 1. Além disso, as demais colunas Q1, . . . , Qd−1 de Q satisfazem
Qj[d] = Qj.ed = 0 (porque as colunas são ortonormais). Logo, vê-se que Q[j, d] = 0
para todo 1 ≤ j < d. Vê-se, então, que Q necessariamente tem a forma:
Q = Πd(Q̃) para alguma Q̃ ∈ R(d−1)×(d−1)
e a equação (8.1) garante que Q̃ ∈ SO(d− 1), como querı́amos demonstrar. 2
Agora tomamos uma Q ∈ SO(d) arbitrária e construı́mos um caminho contı́nuo γ : [0, θ] →
SO(d) (para algum θ ∈ R+) ligando Q a uma Q1 ∈ H(d). Pela observação acima, o que
devemos fazer é garantir que a última coluna de Q1 é ed, enquando a matriz γ(t) é ortogonal
com determinante 1 em cada 0 ≤ t ≤ θ.
Considere a última coluna de Q, que chamamos de Qd ∈ Rd. Seguindo os passos do Exemplo
8.5, podemos escrever ed na forma:
ed = cos θ Qd + sin θ Q⊥d com Q
⊥
d ⊥ Qd.
Se seguı́ssemos aquele Exemplo, traçarı́amos agora uma trajetória num cı́rculo na esfera unitária
para conectar Qd a ed. É isto que faremos abaixo, mas construindo um caminho γ0 no espaço de
matrizes SO(d) tal que γ0(θ)Qd = ed. Para isso, precisamos do seguinte primeiro passo.
Exercı́cio 8.9 Use o fato que d ≥ 3 para mostrar que existe uma transformação ortogonal V ∈ SO(d)
levando Qd em ed e Q⊥d em ed−1.
139
Agora considere
γ0(t) := VT Z(t)V, onde Z(t) :=

0
I(d−2)×(d−2)
...
0
0 . . . 0
cos t sin t
− sin t cos t
 (0 ≤ t ≤ θ).
Note que γ0(0) = Id×d (pois VTV = Id×d) e que γ0(t) ∈ SO(d) (porque é o produto de
V, VT, Z(t) ∈ SO(d), como se pode verificar diretamente) para cada 0 ≤ t ≤ θ. Portanto,
γ(·) := γ0(·) Q é uma curva com valores em SO(d) e γ(0) = Q. Também não é difı́cil verificar
que γ é contı́nua.
Para terminarmos a prova, veremos que γ(θ) ∈ H(d). Por tudo que já vimos até agora, isto se
resume a mostrar que a d-ésima coluna de γ(θ) = γ0(θ)Q é ed. Será útil usar o seguinte exercı́cio.
Exercı́cio 8.10 Prove que, dadas quaisquer matrizes A, B ∈ Rd×d, se Bj é a j-ésima coluna de B, ABj é a
j-ésima coluna de AB; ou seja, as colunas de AB são as colunas de B multiplicadas por A à esquerda.
Portanto:
• A última coluna de VQ é VQd = ed;
• A última coluna de Z(θ)VQ é Z(θ) ed = cos θed + sin θed−1.
• Como VT é a inversa de V, a última coluna de γ(t) = VTZ(θ)VQ é
V−1(cos θed + sin θed−1) = cos θQd + sin θ Q⊥d = ed.
Isto encerra a prova. 2
8.3.2 Um conjunto conexo que não é conexo por caminhos
Vejamos primeiro um caso em que as duas definições discordam.
Teorema 8.3 Defina Γ0 ⊂ R2 da seguinte forma:
Γ0 := {(x, sin(1/x)) : x ∈ (0, 1]}
e Γ = Γ0 ∪ {(0, 1)}. Este Γ é conexo, mas não é conexo por caminhos.
Prova: A prova terá três partes.
Passo 1 Primeiro provaremos que Γ0 é conexo por caminhos e portanto conexo.
Passo 2 Provaremos a seguir que Γ não é conexo por caminhos.
Passo 3 Veremos que Γ0 ⊂ Γ ⊂ Γ0, o que implica que Γ é conexo (pelo Exemplo 8.8).
140
Passo 1: Γ0 conexo por caminhos. A função f : (0, 1] → R2 que leva x ∈ (0, 1] em f (x) :=
(x, sin(1/x)) ∈ R2 é contı́nua coordenada a coordenada e portanto contı́nua. Como (0, 1] é
conexo por caminhos, sua imagem também é. Esta imagem é precisamente o conjunto Γ0.
Passo 2: Γ não é conexo por caminhos. Provaremos que os pontos p = (0, 1) e q = (1, sin(1)),
ambos pertencentes a Γ, não podem ser conectados por uma curva contı́nua em Γ. De fato,
suponha (para chegar a uma contradição) que existe γ : [0, 1] → Γ contı́nua com γ(0) = p
e γ(1) = q. Considere as coordenadas γ1(t), γ2(t) de γ(t). Como γ é contı́nua, γ1 e γ2 são
contı́nuas. Temos ainda que γ1(0) = 0 e γ1(1) = 1.
Como γ1 : [0, 1]→ R, o Teorema do Valor Intermediário nos garante que existe um t0 ∈ (0, 1)
com γ1(t0) = 1/(π/2). Suponha indutivamente que definimos
t0 > t1 > t2 > · · · > tn > 0
de modo que, para cada 0 ≤ m ≤ n, γ1(tm) = 1/(mπ + π/2). Veja que novamente γ1(0) <
1/((n + 1)π + π/2) < γ1(tn), logo existe um tn+1 ∈ (0, tn) com γ1(tn) = 1/((n + 1)π + π/2).
Desta forma, provamos que existe uma sequência decrescente {tn}n∈N ⊂ (0, 1) com
∀n ∈N : γ2(tn) = sin
(
1
γ1(tn)
)
= ±1,
dependendo se n é par ou ı́mpar.
Vemos que a sequência tn converge para um t ∈ [0, 1], posto que é decrescente. Isto implica
γ2(tn) → γ2(t), o que contradiz o fato que a sequência γ2(tn) alterna entre ±1, como vimos
acima. A contradição implica que não podemos conectar p e q por uma curva em Γ.
Passo 3: Γ0 ⊂ Γ ⊂ Γ0. A primeira inclusão é trivial. Para checar a segunda, basta ver que
o ponto p = (0, 1), que é o que adicionamos para formar Γ, está no fecho de Γ0. Mas para isso
basta ver que a sequência
pn =
(
1
π
2 + 2πn
, 1
)
(n ∈N)
está toda em Γ0 e converge a p. 2
Exercı́cio 8.11 Mostre que Γ0 = Γ0 ∪ ({0} × [−1, 1]).
8.3.3 Concordância para abertos de espaços vetoriais
Nesta seção mostramos um caso muito importante em que os dois conceitos de conexidade
concordam.
Teorema 8.4 Considere um espaço vetorial normado (V, ‖ · ‖V) e um subconjunto aberto A ⊂ V. Então
A é conexo se e somente se é conexo por caminhos.
Prova: Uma direção já está dada; além disso, o resultado é trivial se A = ∅. Só nos falta provar
que um A ⊂ V, A 6= ∅ que é aberto e conexo também é conexo por caminhos. O argumento que
usaremos é tı́pico de provas envolvendo conexidade.
Como A 6= ∅, podemos encontrar x0 ∈ A. Considere o subconjunto L ⊂ A de todos os
x ∈ A com x0
A↔ x. Nosso objetivo é provar que L = A; para isso, suporemos (para chegar
141
a uma contradição) que L 6= A, de modo que R = A\L 6= ∅. A contradição estará provada
quando mostrarmos que L e R são relativamente abertos em A, o que quer dizer que A é desconexo.
Vejamos, portanto, a prova destes fatos.
1. Queremos mostrar que L é relativamente aberto em A. Como A é aberto, isto é o mesmo
que mostrar que L é aberto de V. Para isto, dado x ∈ L, devemos encontrar δ > 0 tal que
B(x, δ) ⊂ L. Mas isto é simples. Como A é aberto, existe um δ > 0 com B(x, δ) ⊂ A.
A discussão logo após o Exemplo8.2 acima nos diz que B(x, δ) é convexa, logo qualquer
x′ ∈ B(x, δ) satisfaz x B(x,δ)↔ x′. Como B(x, δ) ⊂ A, isto também nos diz que x A↔ x′ para
todo x′ ∈ B(x, δ). Mas recorde que, pelo Lema 8.1, a relação “ A↔”é transitiva, logo o fato
de que x ∈ L, e portanto x A↔ x0, implica que x′
A↔ x0 para todo x′ ∈ B(x, δ). Ou seja,
B(x, δ) ⊂ L.
2. Do mesmo modo que acima, queremos provar que R ⊂ V é aberto. Para isto, dado x ∈ R,
tomamos δ > 0 com B(x, δ) ⊂ A. Novamente temos x′ A↔ x para todos x′ ∈ B(x, δ). Deste
modo, se algum x′ ∈ B(x, δ) satisfaz x′ A↔ x0, também teremos x
A↔ x0, o que contradiz o
fato que x 6∈ L. Deduzimos que x′ não está conectado em A a x0 para qualquer x′ ∈ B(x, δ),
ou seja, B(x, δ) ⊂ A\L = R.
2
8.4 Mais exercı́cios
Exercı́cio 8.12 Considere dois conjuntos abertos e conexos U, V ⊂ R2 com U ∩ V 6= ∅. É necessaria-
mente verdade que U ∩V é conexo? E o conjunto U ∪V? E se supomos que U e V são convexos?
Exercı́cio 8.13 (Componentes conexas) Tome um espaço topológico (X, T ). Dado x ∈ X, chamamos
da componente conexa de x em X o conjunto:
C(x) :=
⋃
U⊂X conexo
x∈U
U.
1. Prove que C(x) 6= ∅ é conexa para cada x ∈ X. Além disso, mostre que C(x) é fechado de X.
2. Prove que quaisquer dois pontos x, x′ ∈ X ou têm a mesma componente conexa (C(x) 6= C(x′)), ou
têm componentes disjuntas (C(x) ∩ C(x′) = ∅).
3. Deduza que existe A ⊂ X tal que X = ∪x∈AC(x) com união disjunta (ou seja, todo espaço
topológico é uma união disjunta de componentes conexas) e que qualquer U ⊂ X conexo está contido
em C(x) para algum x ∈ A.
Exercı́cio 8.14 (Componentes conexas da diferença) Tome um espaço topológico conexo (X, T ) e um
subconjunto conexo Y ⊂ X. Considere qualquer uma das componentes conexas CY\X(x) de Y\X e mostre
que Y ∪ CY\X(x) tem de ser conexo.
142
Exercı́cio 8.15 (Componentes conexas de abertos em espaços vetoriais) Consideramos agora o caso
particular da definição acima em que (V, ‖ · ‖V) é espaço vetorial, X ⊂ V é subconjunto aberto de V e T
é a topologia sobre V definida a partir da norma ‖ · ‖V . Prove que C(x) é aberto para cada x ∈ X. Mostre
ainda que:
∀x ∈ X : C(x) =
⋃
A⊂X conexo por caminhos
x∈A
A.
Exercı́cio 8.16 Considere espaços métricos (Xi, di), 1 ≤ i ≤ k, e construa o espaço-produto X com uma
das métricas-produto correspondente (cf. Exercı́cio 3.10). Dados conjuntos conexos e não vazios Ci ⊂ Xi
para i = 1, 2, . . . , k, prove que
C1 × C2 × · · · × Ck é conexo ⇔ Ci é conexo para cada i = 1, 2, 3, . . . , k.
Exercı́cio 8.17 Neste problema, seguimos a notação do Exercı́cio 5.30 e consideramos a soma de Min-
kowski A + B de dois subconjuntos não-vazios A, B ⊂ V de um espaço vetorial normado (V, ‖ · ‖V).
Prove os seguintes fatos:
1. se A e B são conexos por caminhos, A + B também é;
2. se A e B são conexos, A + B também é.
Exercı́cio 8.18 Considere um espaço vetorial normado (V, ‖ · ‖V). Dizemos que um conjunto A ⊂ V
é conexo por caminhos poligonais se, dados x0, x1 ∈ A, podemos encontrar um k ∈ N\{0} e pontos
y0 = x0, y1, . . . , yk = x1 ∈ A tais que, para cada i = 0, 1, . . . , k− 1, o s segmentos de reta [yi, yi+1] estão
contidos em A. Prove que, se A ⊂ V é aberto é conexo, então A é conexo por caminhos poligonais.
Exercı́cio 8.19 Um espaço métrico (X, dX) é localmente conexo por caminhos se para cada x ∈ X, existe
um δ0 > 0 tal que, dado qualquer δ ∈ (0, δ0), BX(x, δ) é conexa por caminhos. Mostre que, se (X, dX) é
localmente conexo por caminhos, então qualquer A ⊂ X aberto e conexo também é conexo por caminhos.
Exercı́cio 8.20 Mostre que um espaço métrico (X, dX) é conexo se a imagem de qualquer função contı́nua
f : X → R é um intervalo. Prove ainda que (X, dX) é conexo e compacto se e somente se a imagem de
qualquer função contı́nua f : X → R é um intervalo compacto.
Exercı́cio 8.21 Considere um espaço métrico (X, dX). Dizemos que uma coleção F de subconjuntos F ⊂
X é combinatorialmente conexa se dada qualquer partição F = F0 ∪F1 com F0,F1 6= ∅ e F0 ∪F1 = F ,
existem F0 ∈ F0 e F1 ∈ F1 com F0 ∩ F1 6= ∅. Prove que se F é combinatorialmente conexa e cada F ∈ F
é conexo, então a união ∪F∈F F é um subconjunto conexo de X.
143
144
Parte III
Cálculo em espaços vetoriais
145
Capı́tulo 9
Preâmbulo
Até aqui, apresentamos as definições de espaços métricos e vetoriais e estudamos Topologia com
foco nestes espaços. Aprendemos bastante, mas, para realmente fazermos Análise, precisamos ir
um passo além e aprender a diferenciar e integrar em espaços mais gerais que a reta real.
Começamos esta tarefa no capı́tulo 10 com derivadas e integrais de funções de intervalos da
reta a espaços vetoriais. Os conceitos de derivada e integral têm generalizações diretas a estes
espaços, que estudaremos em detalhes. No entanto, já aqui teremeos que lidar com o fato de
que funções em dimensão maior que 1 podem ter comportamente um tanto quanto diferente do
que na reta. O principal exemplo disso é o fato de que o Teorema do Valor Médio tem de ser
substituı́do pela Desigualdade do Valor Médio.
Considere agora o caso em que f : V → W, onde (V, ‖ · ‖V) e (W, ‖ · ‖W) são espaços
vetoriais normados. Se tentamos definir uma derivada via um quociente, como no caso V = R,
esbarramos em uma dificuldade importante: não sabemos “dividir” um elemento de W por um
elemento de V! De fato, mesmo quando V = W = R3 (por exemplo) não há uma maneira natural
de definir o quociente que levaria à derivada no caso V = R.
A saı́da para este problema é recorrer a uma outra maneira de definir derivada. No caso de
f : I → R, o valor f ′(t) da derivada em t ∈ I satisfaz o seguinte: α = f ′(t) é o único número real
com a seguinte propriedade.
lim
h→0
| f (t + h)− f (t)− α h|
|h| = 0.
Da mesma forma, podı́amos ter escrito que α = f ′(t) se, quando escrevemos:
rt(h) := f (t + h)− f (t)− α h,
temos |rt(h)|/|h| → 0 quando h→ 0.
Nesta definição alternativa dividimos não por h, mas sim por seu “tamanho”. A vantagem
é que isso faz sentido em todo espaço vetorial normado, quando medimos o tamanho de h ∈ V
por sua norma ‖h‖V .
Para chegar à definição de derivada, precisamos ainda entender quem (ou o que) faz o papel
do termo α h. A chave neste caso será pensar em f (t + h) ≈ f (t) + α h como uma aproximação
de f por uma função afim, isto é, a soma de uma função linear com uma constante. A analogia
natural para outros espaços é escrever
f (x + h) ≈ f (x) + A h
147
onde A é uma transformação linear.
Em linhas gerais, o que discutimos acima é a definição de derivada devida a Fréchet, que es-
tudaremos abaixo. Também discutiremos derivadas parciais e direcionais, mas ficará claro que a
definição de Fréchet tem propriedades melhores. Por exemplo, ela é a única destas definições que
satisfaz a regra da cadeia. Além disso, uma vez que aceitamos a derivada como transformação
linear, fica mais limpa a passagem para derivadas superiores e fica mais fácil derivar em espaços
que não são o Rd. De qualquer forma, tudo isso fará mais sentido depois da breve revisão de
Álgebra Linear que teremos a seguir.
Observação 9.1 O leitor pode se perguntar porque não tentamos definir derivadas em espaços ainda mais
gerais, por exemplo, espaços métricos. Uma resposta possı́vel é que a derivada é uma tentativa de aproximar
funções por somas de funções constantes e lineares, logo devemos trabalhar num espaço em que isso faça
sentido. Certamente há espaços métricos em que seria muito difı́cil de se falar disso. No entanto, veremos
neste curso que, ao menos em um caso particular – o das subvariedades de Rd – será possı́vel falar de
derivadas por causa de uma estrutura linear local.
148
Capı́tulo 10
Funções a um parâmetro: derivadas e
integrais
Nosso objetivo neste capı́tulo é desenvolver rudimentos de um Cálculo para funções com valores
em V Banach que dependem de um único parâmetro real. Boa parte do que vamos fazer éexatamente igual ao que se faz no caso de funções entre conjuntos da reta. Por esta razão, muitos
passos importantes serão tomados como exercı́cios.
Notação para este capı́tulo: Nos próximos resultados, I = [a, b] ⊂ R é um intervalo
fechado e limitado da reta (com a < b reais), (V, ‖ · ‖) é Banach, e f : I → V é dada.
10.1 Derivadas: definição e resultados preliminares
O primeiro passo será generalizar o conceito de derivada.
Definição 10.1 Dizemos que f é diferenciável em t ∈ I se existe o limite:
f ′(t) := lim
h→0
f (t + h)− f (t)
h
.
A definição é a mesma do caso real e podemos fazer algumas considerações gerais relacionadas.
Por exemplo, o fato abaixo decorre de que limites em Rd são sempre tomados coordenada a
coordenada.
Exercı́cio 10.1 Mostre que, se V = Rd, então f ′(t) existe se e somente se cada uma das funções coorde-
nadas f [i] é diferenciável em t. Neste caso,
f ′(t) = ( f ′[i](t))di=1.
Exercı́cio 10.2 Se f , g : I → V são ambas diferenciáveis em t ∈ I e λ ∈ R e um escalar, então:
(λ f + g)′(t) = λ f ′(t) + g′(t).
149
Exercı́cio 10.3 Fixe v ∈ V e uma função F : I → R diferenciável. Podemos definir uma nova função
f : I →W dada por:
f (t) := F(t) v (t ∈ I).
Supondo que F′(t) existe para um certo t ∈ I, mostre que f ′(t) = F′(t) v.
Exercı́cio 10.4 Fixe v ∈ V e uma função F : I → L(V, W) diferenciável. Podemos definir uma nova
função f : I →W dada por:
f (t) := F(t) v (t ∈ I).
Supondo que F′(t) existe para um certo t ∈ I, mostre que f ′(t) = F′(t) v.
Exercı́cio 10.5 Prove que toda f diferenciável em t ∈ I também é contı́nua em t.
Exercı́cio 10.6 (Regra de Leibniz geral) Suponha que V, W, Z são espaços vetoriais com respectivas
normas ‖ · ‖V , ‖ · ‖W e ‖ · ‖Z. Neste exercı́cio, supomos que B : V ×W → Z é bilinear e contı́nua. Eis
alguns exemplos abaixo.
1. V = Rd1×d2 , W = Rd2×d3 , Z = Rd1×d3 e B é o produto matricial.
2. V = W = Z = C([0, 1], R) e B é o produto de funções ou a operação de convolução.
Agora suponha que f : I → V e g : I → W são diferenciáveis em t ∈ I. Prove que B( f , g) : I → Z,
definida por:
B( f , g)(s) := B( f (s), g(s)) (s ∈ I)
tambem é diferenciável em t ∈ I e
B( f , g)′(t) = B( f ′(t), g(t)) + B( f (t), g′(t)).
10.2 A desigualdade do valor médio
Agora vamos assinalar uma diferença crucial entre a derivada na reta e casos mais gerais. Um
dos principais teoremas do caso V = R é o Teorema do Valor Médio, que diz que, dados x, y ∈ I,
se f é diferenciável no intervalo entre x e y, então existe um ponto θ nesse intervalo tal que
f (x)− f (y) = f ′(θ) (x− y).
Esse resultado não vale em geral quando V é um espaço vetorial qualquer. De fato, ele falha já
para V = R2.
Exercı́cio 10.7 Se f (t) = (t2, t3), t ∈ [0, 1], vemos que f (1)− f (0) 6= f ′(θ) para qualquer θ ∈ [0, 1].
O que podemos guardar do caso unidimensional é uma cota na magnitude de f (x)− f (y). De
fato, temos a Desigualdade do Valor Médio neste caso.
Teorema 10.1 (Desigualdade do Valor Médio) Dados t, s ∈ I e f : I → R contı́nua em I = [a, b] e
diferenciável em (a, b), suponha que
M := sup
x∈I
‖ f ′(x)‖V < +∞.
Então temos a desigualdade
∀t, s ∈ [a, b] : ‖ f (t)− f (s)‖V ≤ M |t− s|.
150
Prova: Note que basta provar a desigualdade acima para t, s ∈ (a, b). Afinal, como f é contı́nua,
o conjunto de pares (t, s) ∈ I × I com ‖ f (t) − f (s)‖V ≤ M |t − s| é fechado. Se este conjunto
contem (a, b)× (a, b), também deve conter o fecho deste conjunto, que é I × I.
Feita essa observação, suporemos (sem perda de generalidade) que t < s, sabendo que f é
diferenciável no intervalo [t, s] ⊂ (a, b).
Dado um M > M′, definimos o conjunto:
IM′ := {x ∈ [t, s] : ‖ f (x)− f (t)‖V ≤ M′ (x− t)}.
Ou seja, IM′ é o conjunto de pontos x ∈ [t, s] que satisfazem a estimativa dada pela desigualdade
do valor médio, mas com M′ substituindo M (esta “folga na constante” é uma tecnicalidade
importante na conta). Provaremos a seguir que:
Objetivo: ∀M′ > M : s ∈ IM′ , isto é, ‖ f (x)− f (t)‖V ≤ M′ (x− t).
Dado isso, a desigualdade desejada é deduzida tomando M′ → M.
Para atingir nosso objetivo, note primeiramente que IM′ não é vazio porque pelo menos t está
lá. Como além disso IM′ é limitado, sM′ := sup IM′ está bem definido. Também é verdade que
IM é fechado, por causa da continuidade de f . Logo, IM′ é compacto, e em particular sM′ ∈ IM′ .
Nosso objetivo será cumprido se provarmos que sM′ = s.
Suponha, então (para chegar a uma contradição) que sM′ < s. Como t ∈ IM′ , sabemos que
t ≤ sM′ < s e que portanto sM′ + h ∈ [t, s] para h > 0 suficientemente pequeno. Agora observe
que
lim
h→0,s+h∈I
∥∥∥∥ f (sM′ + h)− f (sM′)h
∥∥∥∥
V
= ‖ f ′(sM)‖V ≤ M < M′.
Portanto, se h > 0 é suficientemente pequeno, não só sM′ + h ∈ [t, s], como também∥∥∥∥ f (s + h)− f (s)h
∥∥∥∥
V
≤ M′,
o que quer dizer que
‖ f (sM′ + h)− f (s)‖V ≤ M′ h.
Por subaditividade, deduzimos que
‖ f (sM′ + h)− f (t)‖V ≤ ‖ f (sM′ + h)− f (sM′)‖V + ‖ f (sM′)− f (t)‖V ≤ M′ (h + sM′ − t).
Ou seja, sM′ + h ∈ IM′ e sM′ + h > sM′ = sup IM′ . Esta contradição ocorreu porque supusemos
que sM′ < s; portanto, mostramos que sM′ = s. 2
Exercı́cio 10.8 Prove que, para qualquer função diferenciável f : I → V,
‖ f ‖Lip = sup
t∈(a,b)
‖ f ′(t)‖V .
(Aqui admitimos que o supremo pode ser infinito.)
151
Exercı́cio 10.9 Suponha que γ : I → V é diferenciável e γ′ : I → V é contı́nua. Dado um subintervalo
J = [c, d] ⊂ [a, b] com a < c < d < b, e dado um h ∈ R com tal que |h| ≤ min{c− a, b− d}, definimos:
∆hγ : t ∈ J 7→
γ(t + h) + γ(t)
h
∈ V.
Mostre que
lim
ε→0+
sup
0<|h|≤ε
‖∆hγ− γ′‖J,∞ = 0.
10.3 Integração de funções sobre intervalos
Nosso próximo objetivo é estender a teoria de integração de funções contı́nuas sobre intervalos a
funções com valores em V (com V Banach). Nesta seção I := [a, b] ⊂ R com −∞ < a ≤ b < +∞.
Recorde de Análise na Reta que uma partição pontilhada P de [a, b] é um objeto do tipo:
P := {(tP0 , sP0 ), (tP1 , sP1 ), . . . , (tPnP , s
P
nP)}
com
tP0 = a ≤ sP0 ≤ tP1 ≤ sP1 ≤ tP2 ≤ · · · ≤ tPnP ≤ s
P
nP ≤ t
P
nP+1 =: b.
Note a convenção de que tPnP+1 = b sempre. Informalmente, dividimos [a, b] em intervalos
[tPi , t
P
i+1] e escolhemos um ponto s
P
i em cada intervalo. O tamanho da partição P é definido como
|P| := max0≤i≤nP(tPi+1 − tPi ).
Definição 10.2 Dada uma função f : I → V e uma partição pontilhada P como acima, definimos a soma
de Riemann para f sobre a partição pontilhada P da seguinte maneira:
s( f , P) :=
nP
∑
i=0
(tPi+1 − tPi ) f (sPi ) ∈ V.
Dizemos que f é Riemann-integrável sobre [a, b] se existe um limite para as somas de Riemann quando
|P| → 0, ou seja, quando existe um elemento Iba ( f ) ∈ V tal que, para qualquer sequência {Pj}j de
partições pontilhadas de [a, b],
|Pj| → 0⇒ s( f , P)→ Iba ( f ).
Quando f é Riemann-integrável sobre [a, b], em geral escrevemos
∫ b
a f (t) dt := I
b
a ( f )
Exercı́cio 10.10 (Linearidade da integral) Prove a partir da definição que, se f , g : I → V são Riemann-
integráveis e λ ∈ R, então λ f + g também é Riemann-integrável e∫ b
a
(λ f (t) + g(t)) dt = λ
∫ b
a
f (t) dt +
∫ b
a
g(t) dt.
Exercı́cio 10.11 Mostre que, se f ≡ c ∈ V é constante, então f é Riemann-integrável e∫ b
a
f (t) dt = c (b− a).
152
Observação 10.1 No caso de V = R, é costumeiro falar das somas de Riemann superior e inferior. Não
é possı́vel fazer o mesmo em nosso caso geral porque não há uma ordem total natural para os elementos de
V.
O restante da seção é dedicado à prova de um resultado fundamental.
Teorema 10.2 Toda f : I → V contı́nua é Riemann-integrável. Além disso, temos a estimativa:∥∥∥∥∫ ba f (t) dt
∥∥∥∥
V
≤
∫ b
a
‖ f (t)‖V dt ≤ (b− a) sup
t∈I
‖ f (t)‖V .
Esta prova será baseada num lema preliminar. Este lema nos permite comparar as somas de
Riemann de duas partições de tamanho pequeno.
Lema 10.1 Considere duas partições pontilhadas P, Q. Então:
‖s( f , P)− s( f , Q)‖V ≤ (b− a) (m f (|P|)+ m f (|Q|)).
Prova: A prova é muito similar a do caso de funções a valores reais.
Em primeiro lugar, tome um conjunto
R := {r0, r1, . . . , rk+1} ⊂ [a, b] com a = r0 ≤ r1 ≤ · · · ≤ rk+1 = b
de modo que:
• Existem ı́ndices jP0 = 0 < j
P
1 < · · · < jPnP+1 = k + 1 tais que t
P
i = rjPi para cada i =
0, 1, 2, . . . , nP;
• Existem ı́ndices jQ0 = 0 < j
Q
1 < · · · < jPnQ+1 = k + 1 tais que t
P
i = rjQi
para cada i =
0, 1, 2, . . . , nP.
Não provaremos que tal R existe porque isso é feito nos cursos de Análise na Reta.
Escreva:
S :=
k
∑
j=0
f (rj) (rj+1 − rj).
A ideia do restante da prova é mostrar que
‖s( f , P)− S‖V ≤ m f (|P|) (b− a) e ‖s( f , Q)− S‖V ≤ m f (|Q|) (b− a),
o que claramente implica nosso objetivo. Faremos a conta apenas para P porque o caso de Q é
análogo.
Com nossa notação, temos a seguinte fórmula para S:
S =
nP
∑
i=0
jPi+1−1
∑
j=jPi
f (rj) (rj+1 − rj).
De fato, tudo que fizemos foi quebrar a soma em j de acordo com o ı́ndice i tal que jPi ≤ j < jPi+1
(é fácil ver que este ı́ndice existe e é único para cada j).
153
Agora observe que, para cada ı́ndice 0 ≤ i ≤ nP,
tPi+1 − tPi = rjPi+1 − rjPi =
jPi+1−1
∑
j=jPi
(rj+1 − rj).
Além disso, para cada i e cada j = jPi , . . . , j
P
i+1 − 1, temos
rj, sPi ∈ [tPi , tPi+1]
e portanto |rj − sPi | ≤ tPi+1 − tPi ≤ |P|. Portanto
‖ f (rj)− f (sPi )‖V ≤ m f (|P|)
Deduzimos que∥∥∥∥∥∥(tPi+1 − tPi ) f (sPi )−
jPi+1−1
∑
j=jPi
(rj+1 − rj) f (rj)
∥∥∥∥∥∥
V
=
∥∥∥∥∥∥
jPi+1−1
∑
j=jPi
(rj+1 − rj)( f (sPi )− f (rj))
∥∥∥∥∥∥
V
≤ m f (|P|)(tPi+1 − tPi ).
Portanto,
‖s( f , P)− S‖V ≤
nP
∑
i=0
∥∥∥∥∥∥(tPi+1 − tPi ) f (sPi )−
jPi+1−1
∑
j=jPi
(rj+1 − rj) f (rj)
∥∥∥∥∥∥
V
≤ m f (|P|)
nP
∑
i=0
(tPi+1 − tPi ).
A soma telescópica do lado direito vale b− a. 2
Prova: [Prova do Teorema]Note que o Lema anterior mostra que, dada qualquer sequência {Pn}n∈N
como acima, com δn := |Pn| → 0,
∀m, n ∈N : ‖s( f , Pn)− s( f , Pm)‖V ≤ (m f (δn) + m f (δm)) (b− a)→ 0
quando m, n→ +∞. Deduzimos que {s( f , Pn)}n∈N é Cauchy e portanto converge.
Se {Qn}n∈N é outra sequência de partições pontilhadas com |Qn| → 0, podemos intercalá-la
numa só sequência com {Pn}n∈N para deduzir que s( f , Qn) converge ao mesmo limite. É este
limite que chamamos de
∫ b
a f (s) ds. Veja que:
‖s( f , Pn)‖V ≤
(
k
∑
i=1
(tPni − t
Pn
i−1)
)
‖ f (cPni )‖V ,
e a soma da direita é uma soma de Riemann para
∫ b
a ‖ f (s)‖V ds. Portanto, tomando limites,∥∥∥∥∫ ba f (s) ds
∥∥∥∥
V
≤
∫ b
a
‖ f (s)‖V ds.
2
Exercı́cio 10.12 Prove a partir das somas de Riemann que, se f ∈ C(I, V) e P é uma partição pontilhada,
‖s( f , P)−
∫ b
a
f (t) dt‖V ≤ (b− a)m f (|P|).
Exercı́cio 10.13 Prove a partir das somas de Riemann que, se f ∈ C(I, V) e a ≤ x ≤ y ≤ z ≤ b,∫ z
x
f (t) dt =
∫ y
x
f (t) dt +
∫ z
y
f (t) dt.
154
10.4 O teorema fundamental do Cálculo
A partir de agora, definimos
∫ y
x f (s) ds para y 6= x da forma usual se x < y e como∫ y
x
f (s) ds = −
∫ x
y
f (s) ds se x > y.
Com esta notação, é fácil provar que∥∥∥∥∫ yx f (s) ds
∥∥∥∥
V
≤ |y− x| sup
s∈[x,y]
‖ f (s)‖V .
Como também é evidente que
∀x, y ∈ I : x 6= y⇒
∫ y
x f (s) ds
y− x − f (x) =
∫ y
x ( f (s)− f (x)) ds
y− x .
Ou seja,∥∥∥∥∥
∫ y
x f (s) ds
y− x − f (x)
∥∥∥∥∥
V
≤ sup
s∈[x,y]
‖ f (s)− f (x)‖V ≤ m f (|y− x|)→ 0 quando y→ x.
Isto implica o seguinte resultado.
Teorema 10.3 (Teorema Fundamental do Cálculo) Dada f ∈ C(I, V), defina:
I( f )(t) :=
∫ t
a
f (s) ds (t ∈ I).
Então I : C(I, V)→ C(I, V) é contı́nua e além disso:
I( f )′ = f .
Exercı́cio 10.14 Dado um subintervalo J = [c, d] ⊂ [a, b] com a < c < d < b e uma f : I → V, mostre
que:
lim
ε→0+
sup
0<|h|≤ε
∥∥∥∥I( f )(·+ h)− I( f )(·)h − f
∥∥∥∥
J,∞
= 0.
10.5 Mais exercı́cios
Exercı́cio 10.15 Suponha que V = Rd. Mostre a partir da definição apresentada no texto que a integral
de f ∈ C(I, Rd) é dada por:
∫ y
x
f (t) dt =
(∫ y
x
f [i](t) dt
)d
i=1
(x, y ∈ I).
Exercı́cio 10.16 Mostre que a operação I definida implicitamente no Teorema Fundamental do Cálculo é
uma aplicação linear contı́nua de C(I, V) em C(I, V).
155
Exercı́cio 10.17 Considere espaços vetoriais (V, ‖ · ‖V) e (W, ‖ · ‖W) e T : V → W linear e contı́nua.
Mostre que, se f : [a, b]→ V é diferenciável em t ∈ [a, b], então
(T f )′(t) = T f ′(t).
Exercı́cio 10.18 (Série de Taylor) Suponha que f : I → V é k vezes diferenciável e que f (k)(t0)
existe num certo ponto t0 ∈ (a, b). Mostre que podemos escrever:
∀h ∈ R com t0 ∈ h ∈ [a, b] : f (t0 + h) = f (t0) +
k
∑
j=1
f (j)(t0)
j!
hj + rk(h),
com ‖rk(h)‖V/|h|k → 0 quando h→ 0.
Exercı́cio 10.19 (Série de Taylor com resto integral) Na mesma linha do exercı́cio acima, supo-
nha que f : I → V é k vezes diferenciável com k-ésima derivada contı́nua em todo intervalo.
Encontre uma fórmula explı́cita para rk(h) em termos de uma integral envolvendo a k-ésima
derivada.
156
Capı́tulo 11
A derivada como transformação linear
No capı́tulo anterior, fizemos a parte fácil do trabalho de diferenciar funções com valores veto-
riais. O tema deste capı́tulo é considerar funções cujas entradas e valores podem ser vetoriais.
Apresentaremos os principais conceitos da teoria e veremos muitos exemplos interessantes.
11.1 Definição de derivada de Fréchet
Fixamos dois espaços vetoriais normados (V, ‖ · ‖V) e (W, ‖ · ‖W). A definição geral de derivada
é a seguinte.
Definição 11.1 Dado um aberto U ⊂ V, dizemos que f : U → W é Fréchet-diferenciável em x ∈ U se
existe uma transformação linear contı́nua T ∈ L(V, W) tal que para h ∈ V, h→ 0V ,
f (x + h) = f (x) + T h + rx(h)
para uma “função-resto” rx com ‖rx(h)‖W/‖h‖V → 0. De forma equivalente, pedimos que rx(h) :=
f (x + h)− f (x)− T h satisfaça o seguinte:
∀ε > 0 ∃δ > 0 : ∀h ∈ BV(x, δ) ⊂ U, ‖rx(h)‖W ≤ ε ‖h‖V .
Chamamos T de derivada de Fréchet (ou simplesmente derivada) de f em x e escrevemos T = D f (x).
Um ponto fundamental da definição acima é que D f (x) deve ser uma transformação linear
contı́nua, ou limitada:
‖D f (x)‖V→W := sup
v∈V\{0V}
‖D f (x) v‖W
‖v‖V
< +∞.
Sabemos que toda transformação linear é contı́nua quando V = Rd, mas há transformações
lineares descontı́nuas em alguns outros casos. Portanto, quando V tem dimensão infinita, parte do
trabalho de provar que uma transformação linear T é a derivada de f em x é mostrar que ‖T‖V→W < +∞.
Outra observação básica é sobre notação. Frequentemente usaremos o(h) para denotar uma
função de h ∈ V (com norma pequena) que satisfaz o(h)/‖h‖V → 0 quando ‖h‖V → 0. Por isso,
a propriedade do resto na definição de derivada será escrita como:
rx(h) = f (x + h)− f (x)− T h = o(h).
157
Usaremos esta notação abaixo sem muita preocupação.
Antes de prosseguirmos, notamos uma propriedade simples de uma função diferenciável
num ponto.
Exercı́cio 11.1 Com V qualquer, note que, se f é diferenciável em x, então f também é contı́nua em x.
A dica para provar isso é mostrar que uma função o(h) tende a 0W quando h → 0V (isto é,
“nem precisa” dividir por ‖h‖V).
11.1.1 Unicidade da derivada de Fréchet e derivadas direcionais
Um outro ponto importante da definição é saber se T = D f (x) é unicamente definido. Para isso,
usamos a proposição abaixo.
Proposição 11.1 No contexto da definição acima, Suponha que S ∈ L(V, W) satisfaz:
f (x + h) = f (x) + S h + Rx(h), com
‖Rx(h)‖W
‖h‖V
→ 0,
assim como T. Então S = T. De fato, para cada v ∈ V, vale:
Sv = Tv = lim
t→+∞
f (x + tv)− f (x)
t
.
Prova: Veja que S 0V = T 0V = 0W por linearidade. Se v 6= 0V , podemos tomar h := tv, notando
que este vetor vai a 0V quando t→ 0 e ‖tv‖V = |t|‖v‖V . Deduzimos que∥∥∥∥ f (x + tv)− f (x)t − T v
∥∥∥∥
W
=
∥∥∥∥ f (x + tv)− f (x)− T (tv)t
∥∥∥∥
W
=
‖rx(tv)‖
‖t v‖V
‖v‖V → 0,
ou seja,
Tv = lim
t→0
f (x + tv)− f (x)
t
.
Repetindo a prova com S, deduzimos:
Sv = lim
t→0
f (x + tv)− f (x)
t
.
2
Esta prova pode deixar o leitor com a pulga atrás da orelha. Afinal, acabamos de mostrar
que:
D f (x) v = limh→0
f (x + h)− f (x)
h
e o limite do lado direito é bem mais palatável do que a derivada que acabamos de definir. De
fato, ele tem um nome.
Definição 11.2 O limite
∂v f (x) := lim
t→0
f (x + tv)− f (x)
t
,
quando existe, é chamado de derivada de Gâteaux (ou direcional) de f no ponto x e na direção v
158
Ao contrário da derivada de Fréchet, que às vezes é difı́cil de se calcular, a derivada de
Gâteaux se parece com as derivadas que já vimos antes. A prova da proposição 11.1 implica o
seguinte resultado:
Proposição 11.2 (Prova omitida.) Quando a derivada de Fréchet D f (x) existe para um certo x ∈ U,
então as derivadas de Gâteaux também existem neste ponto e em todas as direções. Além disso, D f (x).v =
∂v f (x) para todo v ∈ V.
A recı́proca da proposição não é verdadeira: há casos em que ∂v f (x) existe para todo v, mas f
não é nem sequer contı́nua. Isso pode ocorrer mesmo quando V = R2 e W = R, como mostra o
exemplo abaixo.
Exemplo 11.1 Considere
f (x) =
{
(x[1])3 x[2]
(x[1])6+(x[2])2 , x 6= 0R2
0, x = 0R2 .
É fácil ver que as derivadas direcionais ∂v f (0R2) existem e são todas iguais a 0. No entanto, f não é nem
sequer contı́nua em 0R2 . Por exemplo, se fazemos a(t) := (t, t3) (t > 0), vemos que a é contı́nua, mas
f ◦ a(t)→ 1/2 6= f ◦ a(0) quando t→ 0.
Uma explicação para esta discrepância é que as derivadas direcionais ∂v f (x) só ligam para o
comportamento de f ao longo de retas a partir de x. Por isso, elas não “enxergam” eventuais
descontinuidades de f sobre curvas.
Concluindo, a derivada de Fréchet é mais exigente que a de Gâteaux. Por essa razão, ela tem
propriedades melhores. Por exemplo, a existência de D f (x) implica continuidade de f em x,
e as derivadas de Fréchet satisfazem a regra da cadeia (discutida mais adiante). As derivadas
de Gâteaux são mais fracas e não garantem muita coisa sobre o comportamento de f numa
vizinhança de x. No entanto, a derivada de Gâteaux é mais simples de calcular: começar com ela
pode ser uma boa maneira de “adivinhar” quem deve ser a derivada de Fréchet. Além disso, há
situações em que sabemos de antemão que a derivada de Fréchet existe: nestes casos, sabemos
que calcular ∂v f (x) para cada v vai nos dizer quem é D f (x).
11.2 Alguns casos simples da derivada de Fréchet
11.2.1 Quando o domı́nio está na reta
Um caso simples desta definição se dá quando V = R e U ⊂ R é aberto. Neste caso, parece
natural definir a derivada como o limite usual.
f ′(x) := lim
h→0
f (x + h)− f (x)
h
.
Nesta seção mostraremos que a derivada de Fréchet coincide com esta definição por limite a
menos de um isomorfismo. A proposição a seguir esclarece o que seria este isomorfismo.
Proposição 11.3 Os espaços L(R, W) e W são isomorfos como espaços vetoriais normados. Isto é, há
uma bijeção linear entre estes dois espaços que preserva normas. De fato, esta bijeção leva T ∈ L(R, W)
em vT := T 1 ∈W.
159
Prova: Neste teorema, estamos pensando em R como espaço vetorial normado sobre o corpo
R. Por esta razão, podemos pensar num elemento x ∈ R como o produto x.1 do escalar x
com o elemento 1 deste espaço vetorial. Isto nos leva à constatação de que vT := T(1) define
inteiramente a transformação T, já que, dado qualquer x ∈ R,
T(x) = T(x.1) = (use linearidade) = x T(1) = x vT.
Agora argumentamos que a aplicação T 7→ vT nos dá uma bijeção linear de L(R, W) com W que
preserva normas. Veja em primeiro lugar que, dados T, T′ ∈ L(R, W) e λ ∈ R,
vλT+T′ = (λT + T′)(1) = λ T(1) + T′(1) = λ vT + vT′ .
Além disso, vT = 0W implica que T(x) = 0W para todo x ∈ W, ou seja, T = 0L(R,W). Isto implica
que T 7→ vT é injetiva. Temos ainda:
‖T‖R→W = sup
x∈R\{0}R
‖Tx‖W
|x| = supx∈R\{0}R
‖xvT‖W
|x| = ‖vT‖W .
Finalmente, T é sobrejetiva: dado qualquer v ∈ W, a transformação Tv que leva x ∈ R em
Tv(x) := x v tem vTv = v. Além disso, T é limitada pelo argumento acima. 2
Agora podemos enunciar o resultado que garante a coincidência entre as derivadas de Fréchet
e a “derivada como limite” a que estamos acostumados.
Lema 11.1 Dados U ⊂ R aberto, x ∈ U e f : U →W, são equivalentes:
1. f é diferenciável em x no sentido de Fréchet.
2. Existe o limite:
f ′(x) := lim
h→0
f (x + h)− f (x)
h
.
Além disso, quando f ′(x) e D f (x) estão ambas definidas, temos f ′(x) = D f (x)(1).
Prova: O ponto é que, dados T ∈ L(R, W), h ∈ R com x + h ∈ U,
f (x + h)− f (x)− T h = f (x + h)− f (x)− h vT
segundo o isomorfismo do exercı́cio anterior, com vT = T 1. Deste modo,
lim
h→0
‖ f (x + h)− f (x)− T h‖W
|h| = limh→0
∥∥∥∥ f (x + h)− f (x)h − vT
∥∥∥∥
W
.
O lema segue trivialmente desta última identidade já que um dos limites existe e é zero se e
somente se o outro também é. Isto é, vT = f ′(x) se e somente se T = D f (x). 2
160
11.2.2 Derivadas envolvendo funções lineares
Uma observação simples, mas importante para o que segue, é que, se T : V →W já é linear, então
sua derivada é DT(x) h = T h, para quaisquer x, h ∈ V. A prova deste fato fica como exercı́cio.
Um outro caso simples é descrito no exercı́cio abaixo.
Exercı́cio 11.2 Mostre que, quando f : U → W é diferenciável e T ∈ L(W, Z) para um outro espaço
vetorial normado Z. Neste caso, T ◦ f : U → Z tem derivada:
D(T ◦ f )(x) h = T D f (x) h
em todo ponto x ∈ U onde f é diferenciável.
O leitor é convidado a provar isto diretamente, mas observamos que esta é uma consequência
da regra da cadeia.
11.2.3 A derivada quando V tem dimensão finita e W = R
Nesta seção consideraremos o caso em que V tem dimensão finita e W = R. De fato, nos
contentaremos em entender bem o caso V = Rd e W = R; os mesmo resultados se estendem
aos outros espaços de dimensão finita porque todos os espaços de mesma dimensão finita são
isomorfos.
A tentação aqui é falar das derivadas parciais que já conhecemos do Cálculo. Cara derivada
parcial ∂ f /∂xi é obtida fixando um x ∈ U, variando a i-ésima coordenada de x e tomando o
limite adequado. Não é difı́cil ver que isto é a mesma coisa que a derivada direcional ∂ei f (x),
que nós chamaremos de ∂i f (x) para deixar a notação mais leve.
Nossa pergunta aqui é: que condições sobre as derivadas parciais garantem que D f (x) existe?
Além disso, o que sabemos sobre D f (x) a partir das derivadas parciais?
O Exemplo 11.1 acima nos mostra a simples existência de derivadas parciais não resolve
garante que f é Fréchet-diferenciável em x. No entanto, pode-se dizer algumas coisas sobre
como é D f (x), caso ela exista. Observe que, como W = R, se f : U → R é diferenciável, então
D f (x) ∈ L(Rd, R) é um funcional linear contı́nuo entre V = Rd e R. Em particular, dado v ∈ Rd:
D f (x) v := D f (x)
d
∑
i=1
v[i]ei =
d
∑
i=1
vi (D f (x) ei) =
d
∑
i=1
vi ∂i f (x).
Portanto, se existe D f (x), então o vetor gradiente ∇ f (x) = (∂i f (x))di=1 determina essa derivada,
no sentido que D f (x) · v = ∇ f (x) · v para cada v ∈ Rd. Esta conclusão, no entanto, não responde
nossa pergunta anterior, que é se podemos saber que D f (x) existe a partir das derivadas parciais.
O resultado a seguir nos diz que, se as derivadas parciais são contı́nuas numa vizinhança de
x, isso é suficiente para garantir que D f (x) existe.
Teorema 11.1 Suponha que U ⊂ Rd é aberto, f : U → R é dada e x ∈ U. Se as derivadas parciais
∂i f (1 ≤ i ≤ d) estão definidas em uma vizinhança aberta de x e são contı́nuas neste ponto, então D f (x)
existe (o que é o mesmo que dizer que f é diferenciável em x no sentido de Fréchet).
161
Prova: A ideia da prova é usar o Teorema do Valor Médio, que diz que, se g : I → R é di-
ferenciável num intervalo I e a, a + t ∈ I, então existe um ponto s com |s| ≤ |t|, a + s ∈ I e
g(a + t)− g(a) = g′(a + s) t.
Vamos aplicar este resultado às derivadas parciais que, no final das contas, são derivadas em
uma variável. Tome r > 0 tal que as derivadas parciais de f existem em BRd [x, r] ⊂ Rd. Veja que,
se Ii := [x[i]− r/√
d, x[i] + r/
√
d], então
Q := I1 × I2 × . . . Id ⊂ BRd [x, r].
Em particular, se x̃ ∈ Q e ti ∈ R é tal que x̃ + tiei ∈ Q, existe um si = si(x̃, ti) com |si| ≤ |ti|,
x̃ + siei ∈ Q e
f (x̃ + tiei)− f (x̃) = ti∂i f (x̃ + siei).
(Note que só podemos garantir x̃[i] + si ∈ Ii porque Q tem a estrutura de um produto cartesiano
de intervalos.) Vamos aplicar isso ao caso em que as coordenadas de h estão entre −r/
√
d e
r/
√
d, o que garante x + h ∈ Q. Recordamos que h = ∑di=1 h[i]ei. Observamos que para cada
j ∈ [d] ∪ {0} o vetor hj := ∑
j
i=1 h[i] ei ∈ Q também tem coordenadas entre −r/
√
d e r/
√
d.
Portanto, x + hj ∈ Q para cada um destes j e podemos escrever uma soma telescópica.
f (x + h)− f (x) =
d
∑
m=1
( f (x + hj)− f (x + hj−1)).
Como x + hj = x + hj−1 + h(j)ej para cada j ∈ [d], podemos encontrar um valor h̃(j) entre 0 e h(j),
tal que, se h̃j := hj−1 + h̃(j)ej,
f (x + hj)− f (x + hj−1) = h(j) ∂j f (x + h̃j).
Deduzimos que
f (x + h)− f (x) =
d
∑
m=1
h(j) ∂j f (x + h̃j).
Para terminar a prova, definimos ∇ f (x) como o vetor das derivadas parciais. Veja que:
f (x + h)− f (x)−∇ f (x) · h = rx(h) :=
d
∑
m=1
h(j) (∂j f (x + h̃j)− ∂j f (x)).
Por Cauchy-Schwartz,
|rx(h)| ≤ |h|2
√√√√ d∑
j=1
(∂j f (x + h̃j)− ∂j f (x))2.
Veja que |h̃j|2 ≤ |hj|2 ≤ |h|. Deste modo, quando h→ 0, cada h̃j converge a 0. Podemos combinar
isto com nossa hipótese de continuidade das derivadas parciais e concluir que o termo da raı́z
quadrada acima vai a 0. Portanto:
|rx(h)|
|h|2
≤
√√√√ d∑
m=1
(∂j f (x + h̃j)− ∂j f (x))2 → 0.
Ou seja, ∇ f (x) · h = D f (x) h, como querı́amos mostrar. 2
162
Um corolário importante deste resultado é o seguinte.
Exercı́cio 11.3 Dada f : U → R, as seguintes propriedades são equivalentes.
1. D f (x) está definido em todo U, e além disso D f : U → L(Rd, R) é função contı́nua;
2. ∇ f (x) está definido em todo U, e além disso ∇ f : U → Rd é função contı́nua;
3. todas as derivadas parciais de ∂i f (x) existem para qualquer x ∈ U e, além disso, as derivadas
parciais dependem continuamente de x.
No entanto, o exercı́cio abaixo mostra que a derivadada de Fréchet pode existir mesmo
quando as derivadas parciais são contı́nuas.
Exercı́cio 11.4 Considere f : R2 → R definida por:
f (x) :=
{
|x|22 sin
(
1
|x|2
)
, x 6= 0R2 ;
0, x = 0.
Prove que esta função é Fréchet diferenciável em 0R2 , mas não tem derivadas parciais contı́nuas neste
ponto.
11.2.4 O caso em que W tem dimensão finita
Também neste caso consideraremos apenas W = Rk. Neste caso, é possı́vel mostrar o seguinte
resultado.
Exercı́cio 11.5 f : U ⊂ Rk é diferenciável em x ∈ U se e somente se cada uma das funções coordenadas
é diferenciável. Isto é, se f [i] : U → R é diferenciável em x ∈ U para cada i ∈ [k], então f é diferenciável
em x e D f (x) h = (D f [i](x) h)ki=1; também vale a recı́proca.
Considere agora a restrição a V = Rd, de modo que U ⊂ Rd. Assim como o gradiente é o
candidato “natural” a derivada quando W = Rk, nossa melhor tentativa para a derivada de f é
a matriz jacobiana Jac( f )(x) ∈ Rk×d com entradas
Jac( f )(x)[i, j] = ∂j f [i](x) (1 ≤ i ≤ k, 1 ≤ j ≤ d).
De fato, os fatos abaixo seguem facilmente do que vimos no caso W = R.
Exercı́cio 11.6 Quando V = Rd, W = Rk, f é como acima, x ∈ U e D f (x) existe, então a matriz
jacobiana está bem definida e
∀v ∈ Rd : D f (x) v = Jac( f )(x) v.
Isto é, Jac( f )(x) ∈ Rk×d é a matriz que representa D f (x) ∈ L(Rd, Rk) na base canônica.
Exercı́cio 11.7 Quando V = Rd, W = Rk, f é como acima, x ∈ U, Jac( f )(·) está definida numa
vizinhança de x e é contı́nua em x, então f é Fréchet-diferenciável em x.
Exercı́cio 11.8 Dados U ⊂ Rd aberto e f : U → Rk, as seguintes propriedades são equivalentes:
163
1. D f (x) ∈ L(Rd, Rk) está definida para qualquer x ∈ U e além disso D f : U → L(Rd, Rk) é função
contı́nua;
2. A matriz jacobiana Jac( f )(x) ∈ Rk×d com entradas
Jac( f )(x)[i, j] = ∂j f [i](x) (1 ≤ i ≤ k, 1 ≤ j ≤ d)
está bem definida para qualquer x ∈ U e depende continuamente de x (o que é o mesmo que dizer
que suas entradas dependem continuamente de x).
Exercı́cio 11.9 (Coordenadas polares) Podemos escrever cada vetor x ∈ Rd\{0Rd} na forma r v, onde
r := |x|2 > 0 e v := x/|x|2 ∈ Sd−1. Note ainda que para cada v deste tipo há um único vetor
ṽ ∈ Rd−1 tal que v[i] = ṽ[i] para 1 ≤ i ≤ d− 1. Calcule a jacobiana da transformação que leva x em
(r, ṽ) ∈ R×Rd−1 ≡ Rd. Calcule ainda o determinante dessa transformação.
11.2.5 A derivada do determinante
Seção sendo escrita. Ao menos em princı́pio, as fórmulas acima nos permitem calcular as deri-
vadas de Fréchet para todas as funções entre espaços vetoriais. No entanto, há muitos casos em
que é mais fácil e mais interessante partir diretamente da definição. Veremos alguns exemplos
disso a seguir.
Exemplo 11.2 Considere a função det : Rd×d → R. Qual é a sua derivada em A ∈ Rd×d?
Note que o determinante é um polinômio multilinear nas entradas da matriz, portanto as
derivadas parciais de det existem e são contı́nuas. Concluı́mos que Ddet(A) existe para qualquer
A e é um funcional linear de Rd×d em R. Apresentamos duas maneiras de fazer isso abaixo.
Tratando Rd×d ∼= Rd2
Aqui aproveitamos a relação entre Rd×d e Rd
2
. Note que o produto interno natural entre matrizes
A, B ∈ Rd×d é dado por:
〈A, B〉 :=
d
∑
i,j=1
A[i, j]B[i, j] = tr(ABT) = tr(AB)
onde tr é o traço (soma das entradas diagonais). Adaptando a prova que vimos para Rd, sabemos
que a existência da derivada de Fréchet em todo ponto garante que:
Ddet(A) H = 〈∇det(A), H〉 = tr(∇det(A)T H),
onde ∇det(A) ∈ Rd×d tem entradas:
∇det(A)[i, j] = ∂det(A)
∂A[i, j]
(1 ≤ i, j ≤ d).
Para calcularmos as derivadas parciais, precisamos lembrar de como se escreve o determi-
nante a partir de uma linha de A e a chamada matriz de cofatores. Em primeiro lugar, defini-
mos, para cada par 1 ≤ i, j ≤ d, uma matriz Aij ∈ R(d−1)×(d−1): esta matriz é igual a A, exceto
164
que omitimos a i-ésima linha e a j-ésima coluna. A matriz de cofatores de A é definida como o
elemento C(A) ∈ Rd×d com entradas
C(A)[i, j] := (−1)i+j det(Aij) (1 ≤ i, j ≤ d).
Entre outras coisas, a matriz de cofatores é importante porque
det(A) 6= 0⇒ A−1 = C(A)
T
det(A)
. (11.1)
Além disso, sabemos que o determinante pode ser escrito a partir dos elementos da linha i
da matriz A e dos cofatores correspondentes.
det(A) =
d
∑
k=1
A[i, k]C(A)[i, k] =
d
∑
k=1
(−1)i+k A[i, k]det(Aik).
Agora tomamos a derivada parcial da fórmula acima na variável A[i, j]. Note que as matrizes Aik
não incluem a entrada A[i, j] porque a linha i for omitida de cada uma delas. Por isso, os termos
A[i, k]det(Aik) com k 6= j tem derivada parcial 0 com respeito a A[i, j]. Portanto:
∂det(A)
∂A[i, j]
=
∂
∂A[i, j]
A[i, j]C(A)[i, j] = C(A)[i, j].
Concluı́mos que:
∇det(A) = C(A)
e que
Ddet(A) H = tr(C(A)T H). (11.2)
Em particular, a equação (11.1) nos diz que:
det(A) 6= 0⇒ Ddet(A) H = det(A) tr(A−1H). (11.3)
Uma outra abordagem
Agora apresentamos um argumento para chegar rapidamente à fórmula (??). Com algum traba-
lho a mais, provaremos a fórmula mais geral (11.2).
Fixe uma A ∈ Rd×d inversı́vel. Como já sabemos que a derivada de Fréchet existe, ela tem de
coincidir com a derivada de Gâteaux.
Ddet(A) H = lim
ε→0+
det(A + ε H)− det(A)
ε
.
Usaremos agora o fato de que o determinante é multiplicativo: o determinante do produto é o
produto dos determinantes.
A + εH = A (I + εA−1H)⇒ det(A + ε H) = det(A)det(I + εA−1H).
Deduzimos que:
Ddet(A) H = det(A) lim
ε→0+
det(I + ε A−1H)− 1
ε
.
165
Para facilidar, escrevemos ∆ := A−1H. Note que o limite acima é igual a:
lim
ε→0+
det(I + ε A−1H)− 1
ε
= Ddet(I)∆.
Isto é, estamos calculando uma derivada de Fréchet (ou de Gâteaux, tanto faz) no ponto I ∈ Rd×d.
Para calcular este limite, lembramos desta vez que o determinante é uma função multili-
near das colunas da matriz ∆. Para usar isso da melhor maneira, usamos a seguintenotação:
se (v1, . . . , vd) ∈ (Rd)d são dados, det(v1, . . . , vd) é o determinante da matriz com colunas
(v1, . . . , vd). Desta forma, se chamamos de ∆j a j-ésima coluna de ∆,
det(I + ε∆) = det(e1 + ε∆1, e2 + ε∆2, . . . , ed + ε∆d).
Desenvolvendo o determinante, usando a multilinearidade, chegamos à seguinte expressão:
det(I + ε ∆) = det(I)
+ε (det(∆1, e2, . . . , ed−1, ed) + det(e1, ∆2, . . . , ed−1, ed) + · · ·+ det(e1, e2, . . . , ed−1, ∆d))
+
d
∑
k=2
εk ck,
onde os ck são certas constantes. Subtraindo det(I), dividindo por ε e mandando ε a 0, os termos
εkck desaparecem e ficamos com:
lim
ε→0+
det(I + ε A−1H)− 1
ε
= det(∆1, e2, . . . , ed−1, ed)+det(e1, ∆2, . . . , ed−1, ed)+ · · ·+det(e1, e2, . . . , ed−1, ∆d).
Cada matriz na soma do lado direito coincide com a identidade exceto na coluna j, que é igual
a ∆j. É um exercı́cio mostrar que o determinante de uma matriz deste tipo é ∆j[j] = ∆[j, j].
Portanto,
lim
ε→0+
det(I + ε A−1H)− 1
ε
= ∆[1, 1] + ∆[2, 2] + · · ·+ ∆[d, d] = tr(∆).
Lembrando que ∆ = A−1H e combinando com as igualdades anteriores, chegamos novamente
à fórmula (11.3). Para A ∈ Rd×d inversı́vel, ela implica que Ddet(A) H = tr(C(A)T H). Como
C(A) depende continuamente de A; as matrizes inversı́veis são densas em Rd×d; e sabemos que
Ddet(A) depende continuamente de A, concluı́mos que a fórmula mais geral (11.2) vale para
todas as matrizes A ∈ Rd×d e qualquer H ∈ Rd×d.
Exercı́cio 11.10 Descreva e justifique em detalhes o que aconteceu na última etapa da demonstração.
Exercı́cio 11.11 Considere Rd×d e também o subespaço Rd×dsim ⊂ Rd×d das matrizes simétricas.
Calcule a derivada de Fréchet da operação f : Rd×d → Rd×dsim que leva uma M ∈ Rd×d em MT M.
11.3 Boas propriedades da derivada de Fréchet
Nesta seção damos substância ao que já dissemos acima: a derivada de Fréchet tem boas propri-
edades teóricas. Os dois teoremas desta seção nos dizem que ela satisfaz uma regra da cadeia e
uma desigualdade assemelhada ao Teorema do Valor Médio.
166
11.3.1 A regra da cadeia
Enunciamos abaixo a versão geral da regra da cadeia. Tão importante quanto entender que ela
vale é observar que as derivadas direcionais não satisfazem a regra da cadeia; veja a Observação 11.1
abaixo.
Teorema 11.2 (Regra da cadeia) Suponha que (V, ‖ · ‖V), (W, ‖ · ‖W) e (Z, ‖ · ‖Z) são espaços vetori-
ais normados. Suponha que UV ⊂ V e UW ⊂ W são abertos, que f : UV → UW e g : UW → Z. Fixos
x ∈ UV e y = f (x) ∈ UW , suponha que as derivadas de Fréchet D f (x) e Dg(y) existem. Então a derivada
de g ◦ f em x também existe e é dada pelo produto de transformações lineares Dg ◦ f (x) = Dg(y) D f (x).
Prova: Fixe x e y = f (x) como acima. Dado h ∈ V com x + h ∈ UV , escrevemos: hy := f (x +
h)− f (x) = f (x + h)− y. Temos:
g ◦ f (x + h)− g ◦ f (x) = g(y + hy)− g(y) = Dg(y) hy + Ry(hy),
com Ry o termo de resto esperado. Do mesmo modo,
hy = D f (x) h + rx(h).
Concluı́mos que:
g ◦ f (x + h)− g ◦ f (x) = Dg(y) D f (x) h + Ry(hy) + Dg(y) rx(h).
Esta fórmula deixa clara a nossa missão: queremos provar que o termo Ry(hy) + rx(h) se com-
porta como esperamos de um resto. Ou seja, queremos que
Objetivo final:
‖Ry(hy) + Dg(y) rx(h)‖Z
‖h‖X
→ 0 quando h→ 0.
Vejamos como provar isso. O primeiro passo é quebrar a expressão em duas
‖Ry(hy) + Dg(y) rx(h)‖Z
‖h‖X
≤
‖Ry(hy)‖Z
‖h‖V
+
‖Dg(y) rx(h)‖Z
‖h‖V
e controlar o segundo termo. De fato, como Dg(y) é uma transformação linear limitada,
‖Dg(y) rx(h)‖Z
‖h‖V
≤ ‖Dg(y)‖V→W
‖rx(h)‖W
‖h‖V
h→0→ 0 porque ‖rx(h)‖W‖h‖V
h→0→ 0.
Ainda nos falta mostrar que ‖Ry(hy)‖Z/‖h‖X também converge a 0. Tome ε > 0 qualquer.
Como ‖Ry(a)‖Z/‖a‖V → 0 quando a→ 0 sabemos que existe um δ > 0 tal que,
∀a ∈W, ‖a‖W ≤ δ : y + a ∈ U e ‖Ry(a)‖Z ≤ ε ‖a‖W .
Por outro lado,
‖hy‖W
‖h‖V
=
‖ f (x + h)− f (x)‖W
‖h‖V
≤ ‖D f (x) h‖V + ‖rx(h)‖V‖h‖V
≤ ‖D f (x)‖V→W +
‖rx(h)‖V
‖h‖V
.
167
Portanto, quando h→ 0, hy → 0. Em particular, se h é pequeno o suficiente, hy ∈ BV(y, δ) e
‖Ry(a)‖Z
‖h‖V
≤ ε
(
‖D f (x)‖V→W +
‖rx(h)‖V
‖h‖V
)
.
Deduzimos que
lim sup
h→0
‖Ry(hy)‖Z
‖h‖V
≤ ε (‖D f (x)‖V→W) .
Como ε > 0 é arbitrário, o teorema segue. 2
Observação 11.1 É instrutivo ver em um exemplo de que o resultado acima falha quando usamos deriva-
das direcionais ao invés das de Fréchet. Considere a função f ◦ a do Exemplo 11.1 acima. Veja que a, além
de contı́nua, é diferenciável. Além disso, f tem derivadas direcionais ∂v f (x) para todos x, v ∈ R2. Apesar
disso, a função f ◦ a não é diferenciável em 0R2 ; de fato, ela não é sequer contı́nua. Isto tem a ver com os
comentários depois do Exemplo 11.1: as derivadas direcionais não se comportam bem quando calcularmos
f ao longo de certas curvas indo para 0R2 . Já Fréchet não sofre deste problema, o que foi importante na
prova acima porque hy é uma função não-linear de h.
11.3.2 A desigualdade do valor médio
Vimos no Teorema 10.1 acima que o Teorema do Valor Médio se generaliza na forma de desigualdade
para funções diferenciáveis γ : [0, 1] → W com W espaço vetorial. Aqui vemos uma extensão da
desigualdade para funções F entre espaços vetoriais mais gerais. Recorde que, dados dois pontos
x, y num mesmo espaço vetorial V, [x, y] denota o segmento de reta entre x e y, isto é:
[x, y] := {ty + (1− t)x : t ∈ [0, 1].}
Teorema 11.3 (Desigualdade do valor médio) Considere f : U → W com U ⊂ V aberto. Considere
x, y ∈ U e suponha que o segmento de reta [x, y] está contido em U. Defina M := supa∈[x,y] ‖D f (a)‖V→W .
Então ‖ f (x)− f (y)‖W ≤ M ‖x− y‖V .
Prova: Considere m : [−ε, 1 + ε]→ U definida por
m(t) := (1− t) x + t y (t ∈ [0, 1]).
Veja que m está bem definida para ε > 0: como [x, y] ⊂ U e U é aberto, existe um ε positivo tal
que m(t) ∈ U para todo t ∈ (−ε, 1 + ε). Além disso, m é diferenciável, com derivada:
m′(t) = (y− x).
A regra da cadeia garante que f ◦m : (−ε, 1 + ε) → W. De fato, levando em conta isomorfismos
e tudo mais, temos (exercı́cio!):
( f ◦m)′(t) = D f (m(t))m′(t) = D f (m(t)) (y− x).
Por sua vez, a desigualdade do valor médio para funções de [0, 1] em W (Teorema 10.1 acima) nos
garante que:
‖ f (y)− f (x)‖W = ‖( f ◦m)(1)− ( f ◦m)(0)‖W ≤ sup
t∈[0,1]
‖D f (m(t)) (y− x)‖W .
168
Para terminar, observamos que:
sup
t∈[0,1]
‖D f (m(t)) (y− x)‖W ≤ sup
t∈[0,1]
‖D f (m(t))‖V→W ‖y− x‖V = M ‖y− x‖V
porque o conjunto dos valores m(t) é exatamente [x, y]. 2
Antes de prosseguirmos, enunciamos aqui, para conveniência futura, um resultado de aproximação
que nos será muito útil. Grosso modo, ele diz que, se a derivada não oscila muito numa
vizinhança de x, então a aproximação de primeira ordem f (x′) ≈ g(x′) := f (x) + D f (x) (x′ − x)
ao redor de x é de alta qualidade. De fato, g aproxima f bem mesmo quando consideramos
diferenças de f entre pontos próximos de x.
Corolário 11.1 (Aproximação afim quando a derivada muda pouco) Suponha que f : U → W
como acima. Dados x ∈ U e r > 0 com BV(x, r) ⊂ U, suponha que f é diferenciável na bola BV(x, r) e
que
sup
x′∈BV(x,r)
‖D f (x′)− D f (x)‖V→W ≤ α.
Então a função g(x′) := f (x) + D f (x) (x′ − x) satisfaz Dg(x′) = D f (x) e
∀x′, x′′ ∈ BV(x, r) : ‖g(x′′)− g(x′)− ( f (x′′)− f (x′))‖W ≤ α ‖x′′ − x′‖V .
Prova: Isso segue de aplicar a desigualdade do valor médio à função f (x′) − g(x′) a cada par
x′, x′′ ∈ BV(x, r), notando que [x′, x′′] ⊂ BV(x, r) por convexidade e que
sup
x′∈BV(x,r)
‖D( f − g)(x′)‖V→W = sup
x′∈BV(x,r)
‖D f (x′)− D f (x)‖V→W ≤ α.
2
Exercı́cio 11.12 Considere U ⊂ V aberto e convexo e f : U →W diferenciável. Mostre que
‖ f ‖Lip = sup
a∈U
‖D f (a)‖V→W .
11.4 Derivadas mais complicadas de se calcular
Encerramos este primeiro capı́tulo sobre a derivada de Fréchet calculando derivadas de funções
que não são tão simples assim. O primeiro exemplo corresponde a funções de operadores lineares
e o segundo tem relação com o problema de existência e unicidade para EDOs. O que estes
exemplos têm em comum é que calcular as derivadas parciaisnão parece ser mais simples que
obter diretamente a derivada de Fréchet.
11.4.1 Exemplos no espaço de operadores lineares
Nesta seção, estaremos interessados no caso em que V = W = L(X, X) para algum espaço
vetorial normado (X, ‖ · ‖X). Escreveremos L(X) := L(X, X) e chamaremos as transformações
lineares T ∈ L(X) de operadores lineares sobre X. Tudo que faremos já é interessante no caso em
que X = Rd, ‖ · ‖X = | · |2 é a norma Euclideana e L(X) ≡ Rd×d com a norma de operador.
As operações que estamos interessados em derivar são as seguintes:
169
• Dado k ∈N, a aplicação que leva T ∈ L(X) em Tk.
• A aplicação que leva um T ∈ L(X) em T−1 ∈ L(X) (no caso de T ser uma bijeção e T−1 ser
limitado).
Mostraremos “no braço” que estas funções são diferenciáveis. Observe que isto envolve en-
contrar operadores lineares A ∈ L(L(X),L(X))! Isso pode parecer estranho, mas veremos que
não há nada muito sério quando consideramos os casos concretos.
Nossas estiamtivas usarão muito a submultiplicatividade da norma de operador:
∀T, S ∈ L(X) : ‖T S‖X→X ≤ ‖T‖X→X ‖S‖X→X.
Potências de operadores
Comecemos pela derivada de fk(T) := Tk.
Exemplo 11.3 Definimos fk(T) := Tk (T ∈ L(X)). Qual é sua derivada?
De fato, teremos interesse em calcular a derivada e estimar bem o termo de resto. A maior
dificuldade desta prova é que, ao contrário do caso em que T, H ∈ R a fórmular para (T + H)k é
bastante complicada por causa da não-comutatividade do produto de operadores. Daremos um
argumento que passará ao largo dessa dificuldade.
Considere o produto
(T + H)k := (T + H) (T + H) . . . (T + H)︸ ︷︷ ︸
k vezes
.
Para calcular o produto, devemos usar a propriedade distributiva. Ela diz que (T + H)k é a soma
de todos os 2k produtos de sequências do tipo THTTHHH . . . HTH com exatamente k termos.
Agruparemos estas sequências pelo número de vezes em que H aparece. Primeiramente, há
exatamente uma sequência em que H aparece 0 vezes: TTT . . . T = Tk.
Considere agora k sequências em que H aparece exatamente 1 vez. Elas são da forma
T . . . T︸ ︷︷ ︸
j termos
H TT . . . T︸ ︷︷ ︸
j− k− 1 termos
com 0 ≤ j ≤ k− 1. Sua contribuição conjunta é
Ak(T) H :=
k−1
∑
j=0
T j H Tk−1−j.
Note que, para cada T ∈ L(X), Ak(T) : L(X) → L(X) é um operador linear. Ele é limi-
tado,porque, pela submultiplicatividade da norma de operador,
‖Ak(T) H‖X→X ≤
k−1
∑
j=0
‖T‖jX→X ‖H‖X→X ‖T‖
k−1−j
X→X = k ‖T‖
k−1
X→X ‖H‖X→X. (11.4)
Portanto, Ak(T) ∈ L(L(X),L(X)).
170
Esta última estimativa tem algo de mágico. Tı́nhamos uma fórmula complicada paraAk(T) H.
Quando passamos a norma de operador, ela de repente ficou tão simples quanto o termo cor-
respondente do teorema binomial usual. Para terminarmos a prova, vamos usar um argumento
parecido para estimar os demais termos de (T + H)k, observando eles têm de ser o resto. E porque
sabemos disso? Ora estes termos que restam certamente não serão lineares em H, enquanto que
o termo correspondendo à derivada tem de ser linear!
Façamos então uma estimativa de
rT(H) :=
k
∑
n=2
(termos do produto com n ocorrências de H) = (T + H)k − Tk −Ak(T) H,
notando que, pela subaditividade da norma,
‖rT(H)‖X→X ≤
k
∑
n=2
‖(termos do produto com n ocorrências de H)‖X→X,
Foquemo-nos em um dos termos da soma. Há (kn) escolhas de sequências de Ts e Hs com
exatamente n termos iguais a H. Por sua vez, a norma de um produto de Ts e Hs deste tipo é
limitada pela submultiplicatividade da norma.
‖T . . . T H T . . . T H . . . ‖X→X ≤ ‖H‖nX→X ‖T‖k−nX→X.
Concluı́mos que
‖(termos do produto com n ocorrências de H)‖X→X ≤
(
k
n
)
‖H‖nX→X ‖T‖k−nX→X.
Somando estas cotas, obtemos:
‖rT(H)‖X→X ≤
k
∑
n=2
(
k
n
)
‖H‖nX→X ‖T‖k−nX→X
e a fórmula binomial nos dá uma expressão mais compacta:
‖rT(H)‖X→X ≤ (‖T‖X→X + ‖H‖X→X)k − ‖T‖kX→X − k ‖T‖k−1X→X ‖H‖X→X.
chame t := ‖T‖X→X e h := ‖H‖X→X. Observe que:
∀k ∈N\{0, 1}∀n ∈ {2, . . . , k} :
(
k
n
)
=
k(k− 1)
n(n− 1)
(
k− 2
n− 2
)
≤ k (k− 1)
2
(
k− 2
n− 2
)
,
logo
(t + h)k − tk − ktk−1 =
k
∑
n=2
k(k− 1)
n(n− 1)
(
k− 2
n− 2
)
tk−n hn ≤ k (k− 1) h
2
2
(t + h)k−2.
Portanto,
‖rT(H)‖X→X ≤
k(k− 1)
2
(t + h)k−2 h2.
Isto finalmente nos permite concluir que ‖rT(H)‖/‖H‖ → 0 quando H → 0. De fato, temos o
seguinte resultado.
171
Teorema 11.4 A aplicação fk(T) := Tk (T ∈ L(X)) é diferenciável. Sua derivada é dada pelo operador
limitado Ak(T) dado acima. O termo de resto:
rT(H) := (T + H)k − Tk −Ak(T) H
satisfaz:
‖rT(H)‖X→X ≤
k (k− 1)
2
(‖T‖X→X + ‖H‖X→X)k−2 ‖H‖2X→X.
Inversas de operadores
Temos agora um exemplo para tratar em que teremos muito mais trabalho.
Chame de U ⊂ L(X) o conjunto de todos os T que têm inversa T−1 ∈ L(X). Ou seja,
T ∈ L(X) se T é limitado, é uma bijeção de X em X e tem uma inversa satisfazendo T−1T =
TT−1 = IX que também é um operador linear limitado. Nosso objetivo será mostrar o seguinte
resultado.
Teorema 11.5 ‘U é aberto de L(X). A função Inv : U → L(X) que leva T ∈ U em T−1 é diferenciável e
DInv(T) H = −T−1HT−1.
Vamos começar com uma observação simples, que deixamos como exercı́cio.
Exercı́cio 11.13 Se A, B ∈ U são operadores inversı́veis, então BA também o é e (BA)−1 = A−1 B−1.
Nosso próximo passo é estudar Inv numa vizinhança do operador identidade I.
Lema 11.2 A bola aberta BL(X)(I, 1) está contida em U . Além disso
∀A = I + H ∈ BL(X)(I, 1) : A−1 = Inv(I + H) = ∑
n∈N
(−H)n.
Prova: Já provamos que, em um espaço vetorial normado completo V, se uma sequência de
vetores {vn}n∈N satisfaz ∑n∈N ‖vn‖V < +∞, então ∑n∈N vn converge. Aplicaremos isso a V =
L(X) com vn = Hn. No primeiro caso, observamos que
‖vn‖V = ‖(−H)n‖X→X ≤ ‖H‖nL(X) com ‖H‖X→X < 1,
portanto ∑n∈N (−H)n converge. Como a operação de tomar produtos em L(X) é contı́nua
(exercı́cio), temos
(I + H) ∑
n∈N
(−H)n = (I + H) lim
n→+∞
n
∑
j=0
(−H)j
= lim
n→+∞
n
∑
j=0
(I + H) (−H)j
= lim
n→+∞
n
∑
j=0
[(−H)j + (−1)j H j+1]
= lim
n→+∞
n
∑
j=0
[(−H)j − (−H)j+1]
(soma telescópica) = lim
n→+∞
(I − Hn+1)
(‖Hn+1‖X→X → 0) = I.
172
Do mesmo modo, (∑n∈N(−H)n) (I + H) = I. 2
Provemos agora o teorema.
Prova: Considere A ∈ U . Tome r = rA := 1/‖A−1‖X→X. Veja que, se H ∈ L(X) e ‖H‖X→X < r,
vale ‖A−1H‖X→X < 1. Portanto, o lema acima garante que
(I + A−1H)−1 = ∑
n∈N
(−A−1H)j.
Pelo exercı́cio anterior, descobrimos que
(A + H)−1 = [A (I + A−1H)]−1 = ∑
n∈N
(−A−1H)j A−1.
Em particular, provamos que, se A ∈ U , A + H ∈ U sempre que ‖H‖X→X < rA. Portanto, U é
aberto.
Para calcular a derivada, voltamos à série de potência. Observamos que a aplicação
DA : H 7→ −A−1HA−1
é linear de L(X) no próprio espaço. Além disso, ela é limitada porque:
∀H ∈ L(X) : ‖DA H‖L(X) ≤ ‖A−1‖2L(X) ‖H‖L(X).
Para provar que DA é a derivada de Inv no ponto A, veja que:
(A + H)−1 − A−1 −DA H = ∑
n≥2
(−A−1H)j A−1.
Como ‖H‖ ‖A−1‖ < 1,
‖(A + H)−1 − A−1 −DA H‖X→X ≤ ∑
n≥2
‖A−1‖j+1 ‖H‖j = ‖H‖
2 ‖A−1‖3
1− ‖H‖ ‖A−1‖ .
Com esta expressão é fácil concluir que
‖(A + H)−1 − A−1 −DA H‖X→X
‖H‖ ≤
‖H‖ ‖A−1‖3
1− ‖H‖ ‖A−1‖ → 0
quando H → 0. 2
11.4.2 Um exemplo sobre as funções contı́nuas
Dado um intervalo compacto [a, b] ⊂ R, defina o espaço usual C([a, b], Rd). A função I que
associa a cada f ∈ C sua integral indefinida é um operador linear, portanto:
DI( f ) h = I h =
∫ ·
a
h(t) dt.
Consideraremos agora um tipo de função sobre C(I, Rd) relacionado ao problema de resolver
EDOs. Dado U ⊂ Rd+1 aberto, considere o subconjunto U ⊂ C(I, Rd) de funções com f (I) ⊂ U.
173
Exercı́cio 11.14 Prove que U é aberto de C(I, Rd). (Dica: mostre primeiramente que
inf
t∈[a,b]
dRd( f (t), U
c) > 0.
Se você não conseguir, tudo bem: há uma prova deste fato implı́cita na proposição abaixo!)
Considere uma função contı́nua Ψ : I × U → Rd. Dados x0 ∈ Rd, t0 ∈ I, considere ainda a
operação TΨ : U → C(I, R) que leva f numa nova função T( f ) com
T( f )(t) := x0 +
∫ t
t0
Ψ(s, f (s)) ds.
Veja que este operador está bem definido porque Ψ(t, f (t)) é contı́nua em t sempre quef ∈ U .
Como sabemos, a importância deste operador reside no fato que os seus pontos fixos (se existem)
são precisamente as soluções de ξ ′(t) = Ψ(t, ξ(t)) com ξ(t0) = x0.
Quando estudarmos o problema de existência para EDOs, vimos que T : U → C(I, R) é
contı́nua. Veremos agora que, sob hipóteses adicionais, esta aplicação é diferenciável e calculare-
mos a sua derivada.
Proposição 11.4 Dados (t, x) ∈ I ×U, defina DxΨ(t, x) como a derivada da função em x ∈ U, com t
mantido fixo. Suponha que esta derivada existe para todo par (t, x) ∈ I ×U e que, além disso, ela depende
continuamente de (t, x). Então T é diferenciável em qualquer f ∈ U . Além disso, se v ∈ C(I, Rd),
DT( f ) ∈ L(C(I, R))
existe e é igual ao operador linear que leva v ∈ C(I, R) na função
(DT( f ) v)(t) :=
∫ t
t0
DxΨ(s, f (s)) v(s) ds (t ∈ I).
Prova: Veja que T( f ) é a soma de uma função constante igual a x0 com I ◦ F( f ), onde I ∈
L(C(I, Rd)) leva cada f em I( f )(·) =
∫ ·
t0
f (s) ds e F : U → C(I, Rd) leva f em Ψ(·, f (·)). Usando
os resultados da seção 11.2.2, descobrimos que, se provarmos que DF( f ) existe e satisfaz:
∀v ∈ C(I, Rd), ∀t ∈ I : (DF( f ) v)(t) = DxΨ(t, f (t)),
então DT = I DF. Além disso, como I é linear e limitado (logo contı́nuo), a continuidade de
DT será consequência da continuidade de DF.
Mostremos, então, que F é diferenciável com a derivada que dizemos que ela tem. Fixo um
f ∈ U , diferenciaremos F nos pontos ao redor de f , mostrando que esta derivada é contı́nua.
Em princı́pio podemos pensar num esquema simples para a prova da existência da derivada.
Nosso objetivo é provar que
(queremos provar)
‖F( f + h)− F( f )− DxΨ(·, f (·)) h(·)‖∞
‖h‖∞
→ 0.
O que sabemos, em princı́pio, é que Ψ é diferenciável em x, portanto podemos escrever:
F( f + h)(t)− F( f (t)) = Ψ(t, f (t) + h(t))−Ψ(t, f (t)) = DxΨ(t, f (t)) h(t) + r(t, f (t))(h(t)).
174
Para cada t ∈ I, poderı́amos mostrar algo na linha de
|r(t, f (t))(h(t))|2
‖h‖∞
≤
|r(t, f (t))(h(t))|2
|h(t)|2
→ 0.
No entanto, isso não resolve nosso problema, porque precisamos mostrar uma convergência
uniforme. Ou seja, a definição da derivada para funções F : U → C(I, Rd) nos obriga a mostrar
que o termo de resto satisfaz
supt∈I |r(t, f (t))(h(t))|2
‖h‖∞
→ 0
e isso é um pouco mais complicado.
Para vencermos esta dificuldade, será importante usar a continuidade uniforme de DxΨ. Para
isso, teremos de nos restringir a um compacto K ⊂ I ×U. Que compacto seria este? Ele deve
ser grande a ponto de podemos “variar” entre f e f + h lá dentro. Por esta razão, queremos
(t, f (t) + h(t)) ∈ K para cada t ∈ I e h próxima de 0. Garantiremos que isso vale tomando uma
“faixa” (se d = 1) ou “cilindro” (se d > 1) ao redor do gráfico de f . Ou seja, queremos um
conjunto da forma
K := {(t, x) : t ∈ [a, b], |x− f (t)| ≤ R}. (11.5)
A questão, então, é se podemos escolher um R > 0 de modo que K ⊂ U. Para concluirmos que
“sim, podemos”, devemos observar que f (t) ∈ U para cada t ∈ I = [a, b]. A aplicação
t ∈ I 7→ dRd( f (t), Uc)
é contı́nua (é a composição de funções contı́nuas) e positiva (Uc é fechado, logo dRd(x, U
c) = 0
se e somente se x ∈ Uc). Combinando estes fatos com a compacidade de I, deduzimos que
R0 := inf
t∈[a,b]
dRd( f (t), U
c) > 0.
Portanto, se 0 < R < R0, garantimos que o conjunto K em (11.5) realmente está contido em
U. Note que, se h ∈ C([a, b], V) e ‖h‖∞ ≤ R, então (t, f (t) + h(t)) ∈ K para cada t, portanto
f + h ∈ U .
(Note que acabamos de provar “sem querer” que há uma bola BC(I,Rd)[ f , R] ⊂ U . Notando
que podemos achar um R > 0 para cada f ∈ U , provamos que U é aberto!)
Tendo o compacto K, queremos usar a continuidade uniforme de DxΨ |K. Tome um (t, a), (t, b) ∈
K com |b− a| ≤ δ. Pelo corolário 11.1 acima (aplicado com x′ = a e x′′ = a + b),
∀(t, a), (t, a + b) ∈ K : |Ψ(t, a + b)−Ψ(t, a)− DxΨ(t, a) b|2 ≤ c(δ) |b|2.
onde
c(δ) := sup
(t,a),(t′,b)∈K : |(t′,b)−(t,a)|2≤δ
|DxΨ(t, a)− DxΨ(t, b)|.
Como DxΨ é contı́nua sobre I × U, e portanto é uniformemente contı́nua sobre o compacto K,
vemos que c(δ)→ 0 quando δ→ 0. Note que isto quer dizer que
sup
(t,a),(t,a+b)∈K : 0<|b|2≤δ
|Ψ(t, a + b)−Ψ(t, a)− DxΨ(t, a) b|2
|b|2
≤ c(δ)→ 0 quando δ→ 0.
175
De posse dessa desigualdade, não é difı́cil completar a prova. Considere f e f + h com
‖h‖∞ ≤ R, de modo que (t, f (t)) ∈ K e (t, f (t) + h(t)) ∈ K para cada t ∈ I. Como |h(t)|2 ≤ ‖h‖∞
para cada t, temos
∀t ∈ I : |Ψ(t, f (t) + h(t))−Ψ(t, f (t))− DxΨ(t, f (t)) h(t)|2 ≤ c(‖h‖∞) ‖h‖∞,
ou
‖F( f + h)− F( f )− DxΨ(·, f (·)) h(·)‖∞ ≤ c(‖h‖∞) ‖h‖∞.
Portanto,
‖F( f + h)− F( f )− DxΨ(·, f (·)) h(·)‖∞
‖h‖∞
≤ c(‖h‖∞)→ 0 quando h→ 0.
Isto demonstra que a derivada DF( f ) existe e é igual ao que dissemos que ela era.
Para terminar, observamos que esta derivada é contı́nua: se { fn}n∈N ⊂ C(I, Rd) e fn → f ,
temos (t, fn(t)) ∈ K para todo t e todo n grande, e aı́ vemos que
‖DF( fn)− DF( f )‖L(C,C) = sup
h∈C, ‖h‖∞≤1
‖(DxΨ(·, fn(·))− Dx(Ψ(·, f (·)))) h(·)‖∞
= sup
|h(t)|2≤1
t∈I
‖(DxΨ(t, fn(t))− DxΨ(t, f (t))) h(t)‖Rd
≤ sup
t∈I
‖DxΨ(t, fn(t))− DxΨ(·, f (·))‖Rd→Rd → 0
por continuidade uniforme de DxΨ em K. 2
Observação 11.2 O mesmo argumento que demos acima prova algo a mais. Considere um compacto
K ⊂ I ×U ⊂ Rd+1. Em primeiro lugar, vemos que existe uma função não-decrescente c = c(δ) ≥ 0 com
limδ→0 c(δ) = 0 tal que
∀(t, a), (t, b) ∈ K : |Ψ(t, a + δ)−Ψ(t, a)− DxΨ(t, a) (b− a)|2 ≤ c(|b− a|2) |b− a|2.
Agora chame de
K := { f ∈ C(I, Rd) : ∀t ∈ I, (t, f (t)) ∈ K}.
Neste caso, temos a estimativa:
∀t ∈ I, ∀ f , f + h ∈ K : |Ψ(t, f (t) + h(t))−Ψ(t, f (t))− DxΨ(t, f (t)) h(t)|2 ≤ c(‖h‖∞) ‖h‖∞,
o que se traduz em
∀ f , f + h ∈ K : ‖F( f + h)− F( f )− DF( f ) h|2 ≤ c(‖h‖∞) ‖h‖∞,
e
∀ f , f + h ∈ K : ‖T( f + h)− T( f )− DT( f ) h|2 ≤ (b− a) c(‖h‖∞) ‖h‖∞,
já que T = I ◦ F, DT = I ◦ DF e a norma de operador de I é ≤ (b− a).
176
11.5 Mais exercı́cios
Exercı́cio 11.15 (Mı́nimos são pontos crı́ticos) Suponha que (V, ‖ · ‖V) é espaço vetorial normado,
U ⊂ V é aberto e f : U → R dada. Mostre que, se x ∈ U, f é diferenciável em x e f (x) = infx′∈U f (x′),
então D f (x) = 0L(V,R).
Exercı́cio 11.16 (Derivadas de funções convexas) Suponha que (V, ‖ · ‖V) é espaço vetorial normado,
U ⊂ V é aberto convexo e f : U → R é diferenciável. Mostre que f é convexa (isto é, f (tx + (1− t)x′) ≤
t f (x) + (1− t) f (x′) para todos x, x′ ∈ U e 0 ≤ t ≤ 1) se e somente se:
∀x, x′ ∈ U : f (x′) ≥ f (x) + D f (x) (x′ − x).
Exercı́cio 11.17 Suponha que (V, ‖ · ‖V) é espaço vetorial normado, U ⊂ V é aberto e convexo e f : U →
V é diferenciável. Suponha ainda que f é bi-Lipschitz, isto é, ∃L−, L+ > 0 tais que
∀x, x′ ∈ U : x 6= x′ ⇒ L− ≤
‖ f (x)− f (x′)‖W
‖x− x′‖V
≤ L+.
Mostre que, neste caso, temos a seguinte desigualdade:
∀x ∈ U ∀h ∈ V : L−‖h‖V ≤ ‖D f (x) h‖W ≤ L+‖h‖V .
Exercı́cio 11.18 Seja (V, ‖ · ‖V) espaço vetorial normado. Dado k ∈ N, recorde-se que Vk também tem
estrutura de espaço normado, por exemplo com a norma:
‖v‖V :=
k
∑
i=1
‖v[i]‖V , (v = (v[i])ki=1 ∈ Vk).
Agora defina uma operação Tk : V → Vk que leva x ∈ V em (x, x, x, . . . , x) (x ∈ V). Qual é a derivada
de Fréchet desta operação Tk?
Exercı́cio 11.19 O permanente de uma matriz A ∈ Rd×d é dado por:
per(A) := ∑
σ∈Sd
d
∏
i=1
A[i, σ(i)].
Ou seja: o permanente é “quase igual” ao determinante, mas não aparecem os sinais alternados na fórmula.
(Estranhamente, isso o torna mais difı́cil de calcular, mas muito útil em certos modelos da Mecânica
Estatı́stica.) Mostre que per : Rd×d → R é Fréchet-diferenciável e calcule sua derivada.
Exercı́cio 11.20 Considere espaços vetoriais normados (V, ‖ · ‖V) e (Wi, ‖ · ‖Wi) para i = 1, 2, . . . , k.
Defina o espaço produto W := W1 ×W2 × · · · ×Wk com uma das normas-produto que já estudamos.
Dado um aberto U ⊂ V, considere funções fi : U → Wi, com i = 1, . . . , k. Construa uma nova função
f : U → W que leva x ∈ U na k-tupla f (x) = ( fi(x))ki=1 ∈ W. Mostre que f é diferenciável emum
certo x ∈ U se e somente se cada fi é diferenciável em x e calcule a derivada de Fréchet de f em termos das
derivadas D fi(x).
177
Exercı́cio 11.21 (“Regra de Leibniz” para derivada de Fréchet) Continue com a notação acima e
acrescente um novo espaço vetorial normado (Z, ‖ · ‖Z) e uma Q : W → Z k-linear e limitada. Defina
F : U → Z através da fórmula:
F(x) := Q( f1(x), . . . , fk(x)) (x ∈ U).
Mostre que, se todas as fi são diferenciáveis num certo x ∈ U, então DF(x) existe. Além disso, calcule
DF(x).
Exercı́cio 11.22 Neste problema, (X, ‖ · ‖X) é um espaço vetorial normado completo e L(X) é o espaço
dos operadores lineares limitados de X em X. Considerand uma sequência {an}n∈N, queremos encontrar
condições sob as quais a série de potência
f (T) := ∑
n∈N
an Tn
define uma função diferenciável sobre uma vizinhança de 0 em L(X). Como no caso de séries de potência
reais, definimos o raio de convergência:
R := (lim sup
n∈N
|an|1/n)−1.
1. Mostre que a série definindo f converge se ‖T‖X→X < R.
2. Lembre da definição de Ak acima e mostre que a expressão
D f (T) H := ∑
n≥1
anAn(T) H (H ∈ L(X))
define um operador linear sobre L(X), que é a derivada de Fréchet de f em T.
178
Capı́tulo 12
Derivadas de ordem superior
No capı́tulo anterior, tratamos da noção de derivada devida a Fréchet, estudamos suas propri-
edades e entendemos alguns exemplos. Nosso trabalho agora será estender este conceito para
derivadas de ordem k > 1. Isso nos permitirá escrever uma versão da fórmula de Taylor neste
contexto geral.
12.1 Já sabemos definir, mas...
Considere espaços vetoriais normados (V, ‖ · ‖V), (W, ‖ · ‖W). Vimos acima que, quando U ⊂ V
é aberto, f : U →W é dada e x ∈ U, a derivada de f em x, se existir, é o operador linear limitado
D f (x) ∈ L(V, W) tal que
lim
h→0
‖ f (x + h)− f (x)− D f (x) h‖W
‖h‖V
= 0.
Suponhamos agora que D f (x) está definida para todo x, de modo que D f : U → L(V, W).
(L(V, W), ‖ · ‖V→W) também é um espaço vetorial normado.
No cálculo em uma dimensão, a segunda derivada é tão somente a “derivada da derivada”.
Isso continua a fazer sentido aqui e podemos dizer que a segunda derivada de f em x, se existir,
tem de ser uma transformação linear limitada D2 f (x) ∈ L(V,L(V, W)) tal que:
lim
h→0
‖D f (x + h)− D f (x)− D2 f (x) h‖V→W
‖h‖V
= 0.
Do mesmo modo, se D2 f : U → L(V, W) está definida em todo U, a terceira derivada em x, se
existir, deve ser uma transformação linear limitada D3 f (x) ∈ L(VL(V,L(V, W))) tal que
lim
h→0
‖D2 f (x + h)− D2 f (x)− D3 f (x) h‖V→L(V,W)
‖h‖V
= 0.
Poderı́amos continuar com estas fórmulas ligeiramente estranhas, mas antes devemos parar e
pensar:
o que está acontecendo aqui?
Nada do que fizemos aqui está errado, mas a derivada que definimos não se presta a uma
compreensão muito intuitiva. Vamos pensar atentamente no que ela quer dizer para compreendê-
la um pouco melhor.
179
12.2 Segunda derivada, transformações bilineares e simetria
A principal mensagem desta seção é que a segunda derivada pode ser pensada como uma
transformação bilinear limitada.
Definição 12.1 (Transformação bilinear) Uma transformação B : V2 → W é dita bilinear se é linear
nos seus dois argumentos. Isto é:
1. dados v1, v2, v′ ∈ V e λ ∈ R, B(λv1 + v2, v′) = λ B(v1, v′) + B(v2, v′);
2. dados v, v′1, v
′
2 ∈ V e λ′ ∈ R, B(v, λ′v′1 + v′2) = λ′ B(v, v′1) + B(v, v′2).
Dizemos que uma transformação bilinear B : V2 →W é limitada se
‖B‖V2→W := sup
(v,v′)∈(V\{0V})2
‖B(v, v′)‖W
‖v‖V ‖v′‖V
< +∞.
Chamamos de L2(V, W) o conjunto das transformações bilineares limitadas.
Na próxima subseção, mostraremos que L(V,L(V, W)) – o espaço onde “mora” a segunda
derivada – é isomorfo ao espaço de transformações bilineares limitadas.
12.2.1 Relação de L(V,L(V, W)) com transformações bilineares
Os elementos de L(V, (L(V, W)) são transformações lineares T : V → L(V, W). Uma tal T
associa a cada v ∈ V um T(v) ∈ L(V, W) de forma linear, de modo que
∀v1, v2 ∈ V ∀λ ∈ R : T(λ v1 + v2) = λ T(v1) + T(v2).
Quando fixamos um v ∈ V, T(v), pertence a L(V, W). Portanto, T(v) : V → W associa a cada
v′ ∈ V um elemento T(v) v′ ∈W de forma linear. Dito de outro modo:
∀v ∈ V ∀v′1, v′2 ∈ V ∀λ′ ∈ R : T(v)(λ′ v′1 + v′2) = λ T(v) v′1 + T(v) v′2.
O resumo disto tudo é que a cada T ∈ L(V,L(V, W)), podemos associar uma função:
BT : V2 → W
(v, v′) 7→ T(v) v′.
O que esta função tem de especial é que ela é bilinear. De fato, o que vemos é que a cada
T : V → L(V, W) podemos associar uma transformação bilinear BT : V2 → W. De fato, o
seguinte resultado é fácil de provar.
Exercı́cio 12.1 A aplicação que leva T em BT é uma bijeção linear entre o conjunto das transformações
lineares
T : V → {transformações lineares de V em W}
e o conjunto das transformações bilineares B : V2 →W. Dica: observe que a inversa de “T 7→ BT” leva
uma transformação bilinear B : V2 →W em
TB : v ∈ V 7→ B(v, ·).
180
Há no entanto um fato que ainda não consideramos: T é uma transformação linear limitada
entre os espaços normados (V, ‖ · ‖V) e (L(V, W), ‖ · ‖V→W). Mais concretamente: recorde que,
se (Z, ‖ · ‖Z) é espaço normado, a norma ‖ · ‖V→Z a norma V → Z sobre L(V, Z) é dada por:
‖S‖V→Z = sup
v∈V\{0V}
‖Sv‖Z
‖v‖V
(S ∈ L(V, Z)).
Se seguimos este raciocı́nio, descobrimos que a norma adequada sobre L(V,L(V, W)) é:
‖T‖V→L(V,W) = sup
v∈V\{0V}
‖T(v)‖V→W
‖v‖V
= sup
v∈V\{0V}
(
sup
v′∈V\{0V}
‖T(v)v′‖W
‖v‖V ‖v′‖V
)
(T ∈ L(V,L(V, W))).
Vamos encontrar uma expressão mais simples para esta norma.
Proposição 12.1 Para qualquer transformação linear T : V → L(V, W) (não necessariamente limitada),
‖T‖V→L(V,W) = sup
(v,v′)∈(V\{0V})2
‖BT(v, v′)‖V→W
‖v‖V ‖v′‖V
;
Ou seja, na definição acima, não importa se tomamos o supremo primeiro em v ou em v′. (Nos dois casos
admitimos a hipótese de que ‖T‖V→L(V,W) pode ser infinito.)
Prova: Defina
a(v, v′) :=
‖BT(v, v′)‖V→W
‖v‖V ‖v′‖V
.
Nosso objetivo é provar que
sup
v∈V\{0V}
sup
v′∈V\{0V}
a(v, v′) = sup
v′∈V\{0V}
sup
v∈V\{0V}
a(v, v′) = sup
(v,v′)∈S×S′
a(v, v′).
De fato, o que vamos provar o seguinte resultado.
Lema 12.1 Considere conjuntos A, B e uma função h : A× B→ R+. Então:
sup
a∈A
(
sup
b∈B
h(a, b)
)
= sup
(a,b)∈A×B
h(a, b).
Prova: Chame de S o supremo do lado direito. Veja que, por definição:
∀a ∈ A ∀b ∈ B : h(a, b) ≤ S
e portanto, para cada a ∈ A fixo, S é cota superior para os valores de h(a, b), b ∈ B.
Deduzimos que
∀a ∈ A : sup
b∈B
h(a, b) ≤ S
e portanto
sup
a∈A
sup
b∈B
h(a, b) ≤ S.
181
Agora observe que para todo (a, b) ∈ A× B,
h(a, b) ≤ sup
b′∈B
h(a, b′) ≤ sup
a′∈A
sup
b′∈B
h(a′, b′).
Ou seja,
sup
a′∈A
sup
b′∈B
h(a′, b′) é cota superior para os valores de h(a, b), (a, b) ∈ A× B.
Deduzimos que
sup
a′∈A
sup
b′∈B
h(a′, b′) ≥ sup
(a,b)∈A×B
h(a, b) = S.
2
2
Podemos agora concluir esta subseção com um exercı́cio e um teorema.
Exercı́cio 12.2 Mostre que L2(V, W) é um espaço vetorial e que ‖ · ‖V2→W é uma norma sobre este espaço.
Teorema 12.1 A aplicação que associa cada T ∈ L(V,L(V, W)) a BT ∈ L2(V, W) é um isomorfismo de
espaços lineares normados. Isto é, “T 7→ BT”é uma bijeção linear e
∀T ∈ L(V,L(V, W)) : ‖T‖V 7→L(V,W) = ‖BT‖V2→W .
Prova: Este teorema basicamente já foi provado acima. Falta apenas juntar os pedaços. O último
exercı́cio mostra que (L2(V, W), ‖ · ‖V2→W) é um espaço vetorial normado. O exercı́cio 12.1 nos
diz que “T 7→ BT” é bijeção linear (e portanto tem inversa linear). Finalmente, a proposição 12.1
garante que esta transformação preserva normas. 2
12.2.2 A segunda derivada é bilinear
Recorde que estávamos considerando a segunda derivada de f : U ⊂ V → W. Tudo o que
acabamos de ver nos diz que temos duas formas completamente equivalentes de pensar na
segunda derivada.
• D(D f )(x) é uma transformação linear limitada de V em L(V, W);
• D2 f (x) é uma transformação bilinear de V2 em W.
Isto nos permite escrever que
D(Df )(x)(h1) h2 = D2 f (x) (h1, h2).
De fato, no lado esquerdo da expressão pensamos em D(D f )(x) ∈ L(V,L(V, W)). Aplica-
mos este objeto a h1 e obtemos D2 f (x)(h1) ∈ L(V, W), aı́ tomamos o resultado, que é uma
transformação linear, e o aplicamos a h1. Do lado direito, D2 f (x) é simplesmente vista como
182
transformação bilinear. Um fato que será importante a seguir é que toda forma bilinear limitada
tem uma derivada. Para isso, é bom lembrar de que, como já vimos anotes, o conjunto
V2 := {(v1, v2) : v1, v2 ∈ V}
tem uma estrutura natural de espaço vetorial (com operações coordenada a coordenada) e pode
ser dotado da norma
‖(v1, v2)‖V2 = ‖v1‖V + ‖v2‖V ((v1, v2) ∈ V2).
Proposição 12.2 Toda B ∈ L2(V, W) é diferenciável e
DB(v1, v2) (h1, h2) = B(v1, h2) + B(h1, v2) ((v1, v2) ∈ V2, (h1, h2) ∈ V2).
12.2.3 Simetria da segunda derivada (quando contı́nua)
Agora vamos mostrar que, sob condições de continuidade, a derivada segunda é simétrica em
seus argumentos.
Proposição 12.3 Suponha que
D2 f : U → L2(V, W)
é contı́nua em x ∈ U. Então D2 f (x) é simétrica, isto é:
∀v, v′ ∈ V : D2 f (x) (v, v′) = D2 f (x) (v′, v).
Prova: Como U 3 x é aberto, podemos achar um aberto A ⊂ R2 contendo 0R2 onde a função
φ : A ⊂ R2 →W abaixo está bem definida.
φ(t, s) := f (x + tv + sv′)− f (x + sv′)− f (x + tv) + f (x) ((t, s) ∈ R2).
Mostraremos que
φ(t, s)
ts
→ D2 f (x)(v′, v) quando t, s→ 0.
Isto nos bastará porque, trocando os papéis de v e v′ (ou de t e s) em φ, também obtemos
φ(t, s)
ts
→ D2 f (x)(v, v′) quando t, s→ 0
o que nos dá a simetria desejada pela unicidade do limite.
Considere então
φ(t, s)− tsD2 f (x) (v′, v) = [ f (x + θ v + sv′)− f (x + θv)− θ sD2 f (x) (v′, v)] |θ=tθ=0 .
Podemos cotar a norma deste termo usando a desigualdade do valor médio aplicada ao termo
dentro do colchete como função de θ.
É importante pararmos para fazer esta parte da conta com atenção. Pela Regra da Cadeia, a
derivada em θ é exatamente:
D f (x + θ v + sv′) v− D f (x + θv) v− sD2 f (x) (v′, v).
183
Agora veja que esta expressão pode ser reescrita como{
D f (x + θ v + sv′)− D f (x + θv)− sD(D f )(x) (v′)
}
v.
onde aqui usamos o isomorfismo
L(V,L(V, W)) ∼= L(V,L(V, W))
para passar de D2 f (x) ∈ L2(V, W) para D(D f )(x) ∈ L(V,L(V, W)). deste modo, D(D f ) f (x)(v′) ∈
L(V, W) correspondente. Esta passagem é conveniente para a conta, pois teremos que diferenciar
D f : U → L(V, W) e a derivada D(D f )(x)L(V,L(V, W)) ocorrerá naturalmente.
Voltando à conta acima, concluı́mos que:
‖{D f (x + θ v + sv′) v− D f (x + θv) v− sD(D f )(x) (v′)} v‖W
≤ ‖v‖V ‖D f (x + θ v + sv′)− D f (x + θv)− sD(D f ) f (x) (v′)‖L(V,W)
Portanto, pela desigualdade do valor médio.
‖φ(t, s)− tsD2 f (x) (v′, v)‖W
≤ |t| sup0≤θ≤t ‖D f (x + θ v + sv′) v− D f (x + θv) v− sD(D f )(x)(v′).v‖W
≤ |t|‖v‖V sup0≤θ≤t ‖D f (x + θ v + sv′)− D f (x + θv)− sD(D f )(x) (v′)‖V→W .
Observe agora que para cada θ ∈ [0, t] fixo, podemos aplicar a desigualdade do valor médio a
D f (x + θ v + sv′)− D f (x + θv)− sD(D f )(x) (v) = [D f (x + θ v + ηv′)− η D(D f )(x)] |η=sη=0
como função de s, obtendo:
‖[D f (x + θ v + ηv′)− η D(D f ) f (x)] |η=sη=0 ‖V→W
≤ |s| sup
0≤η≤s
‖D(D f )(x + θ v + ηv′)(v′)− D(D f )(x)(v′)‖L(V,W)
(norma V → L(V, W)) ≤ |s|‖v′‖ ‖D(D f )(x + θ v + ηv′)− D(D f )(x)‖V→L(V,W)
use
L2(V, W))
∼=
L(V,L(V, W))
 = |s|‖v′‖ ‖D2 f (x + θ v + ηv′)− D2 f (x)‖V2→W
≤ |s| ‖v′‖V sup
|x′−x|≤|t|‖v‖+|s|‖v′‖
‖D2 f (x′)− D2 f (x)‖V2→W
já que x′ := x + θ v + ηv′ está sempre a distância no máximo |t|‖v‖+ |s|‖v′‖ de x para os valores
de θ e η considerados acima. Deduzimos:
‖φ(t, s)− tsD2 f (x) (v′, v)‖W ≤ |ts| ‖v‖V‖v′‖V sup
|x′−x|≤|t|‖v‖+|s|‖v′‖
‖D2 f (x′)− D2 f (x)‖V2→W .
Dividindo por |ts| dos dois lados, obtemos:∥∥∥∥φ(t, s)ts − D2 f (x) (v′, v)
∥∥∥∥
W
≤ ‖v‖V‖v′‖V sup
|x′−x|≤|t|‖v‖+|s|‖v′‖
‖D2 f (x′)− D2 f (x)‖V2→W
t,s→0→ 0
porque |t|‖v‖+ |s|‖v′‖ vai a 0 e D2 f é contı́nua em x, por hipótese. 2
184
12.2.4 Derivadas parciais de ordem 2
Finalmente, colecionamos aqui algumas observações sobre a relação entre D2 f (x) e as derivadas
parciais de ordem 2 quando V = Rd e W = R (tudo pode ser estendido a W = Rk se trabalhamos
coordenada a coordenada).
Há uma bijeção entre formas bilineares B ∈ L2(Rd, R) e matrizes A ∈ Rd×d. De fato, a
cada B podemos associar a matriz A de entradas Ai,j := B(ei, ej) e aı́ a bilinearidade implica
B(v, v′) = v · Av′.
No nosso caso, queremos estudar a matriz correspondente a D2 f (x). Como esta é a derivada
do gradiente ∇ f (x), esperamos que, se D2 f (x) existe, ela corresponda às derivadas parciais
∂i∂j f (x) das coordenadas de ∇ f (x). Logo, a matriz correspondente a D2 f (x) é deve ser a matriz
Hessiana, das derivadas parciais de ordem 2.
Façamos este passo em detalhes. Suponha que D f (·) existe em todo U e que D(D f )(x)
existe num determinado ponto x. Agora fize v, v′ ∈ Rd A relação entre derivadas de Fréchet e
direcionais nos garante que:
D2 f (x) (v, v′) = (D(D f )(x) v) =
(
lim
ε→0
D f (x + εv)− D f (x)
ε
)
v′.
É um exercı́cio mostrar que podemos passar o v′ para dentro do limite. Quando fazemos isso,
temos termos D f (x + εv) v′ = ∇ f (x + εv).v′ e D f (x) v′ = ∇ f (x).v′. Logo:
D2 f (x) (v, v′) = lim
ε→0
(
∇ f (x + εv).v′ −∇ f (x).v
ε
)
.
Ou seja, a existência de D2 f (x) garante que o limite acima existe para quaisquer v, v′ ∈ Rd.
Tomando v = ei e v′ = ej, e lembrando que a j-ésima coordenada de ∇ f (x) é ∂j f (x), obtemos:
∇ f (x + εv).v′ −∇ f (x).v
ε
=
∂j f (x + εei)− ∂j f (x)
ε
e o limite da expressão acima é a derivada parcial da derivada parcial: ∂i∂j f (x). Concluı́mos:
∀1 ≤ i, j ≤ d : D2 f (x) (ei,j ) = ∂i∂j f (x);
portanto, estas derivadas parciais de ordem 2 todas existem e concluı́mos que
D2 f (x) corresponde à matriz Hessiana ∇2 f (x) = (∂i∂j f (x))di,j=1.
Provamos a fórmula acima supondo que D2 f (x) existe. Como no caso das primeiras deriva-
das, é possı́vel achar um teorema na direção contrária se supomos a continuidade das derivadas
parciais de ordem 2.
Exercı́cio 12.3 D2 f : U → L2(Rd, R) é existe e contı́nua se e somente se cada derivada parcial ∂i∂j f :
U → R existe e é contı́nua. Mostre ainda que, sob estas hipóteses, a matriz Hessiana ∇2 f (x) é simétricxa
para todo x ∈ Rd.
185
12.3 Derivadas de ordem maior que dois
Vamos agora estudar como estender a relação entre derivadas de ordem 2 e formas bilineares
para derivadas de ordem superior. Em linhas gerais, provaremos o seguinte.
• As derivadas de ordem k ≥ 2 de uma função de V em W podem ser encaradas como
transformações k-lineares de Vk em W.
• Sob hipóteses de continuidade, estas derivadas são simétricas em seus argumentos.
• Se V = Rd, W = R e as derivadas parciais de ordem ≤ k são contı́nuas, então f é k vezes
diferenciável.
Como no caso de ordem 2, o primeiro passo é compreender o espaço em que “vivem” as
derivadas de ordem k ≥ 2 dada. Mais uma vez teremos que lidar com isomorfismos e optamos
por abordar logo de cara o trabalho sujo para dar conta dessa tarefa.
12.3.1 Onde vivem as derivadas e um kit para cuidar dos isomorfismos
Como veremos, a derivada será definida por aplicação sucessiva da operação “D” seguida
com isomorfismos, para terminarmos com uma transformação s-linear limitada entre Vs e W.
Começamos definindo este espaço de transformações s-lineares limitadas.
Definição 12.2 Dado s ≥ 1, uma função Q : Vs → W é dita s-linear se vale a seguinte propriedade:
dados quaisquer (v1, . . . , vs) ∈ Vs e um ı́ndice i ∈ [s], a função Qi dada por
Qi : ṽi ∈ V 7→ Q(v1, . . . , vi−1, ṽi, vi+1, . . . , vs) ∈W
é uma transformação linear de V em W. Dizemos que Q é limitada se
‖Q‖Vs→W := sup
(v1,...,vs)∈(V\{0V})s
‖Q(v1, v2, . . . , vs)‖W
∏si=1 ‖vi‖V
< +∞.
Chamamos de Ls(V, W) o espaço de todas transformações s-lineares limitadas de Vs em W.
O resultado abaixo é um exercı́cio importante.
Exercı́cio 12.4 Prove que Ls(V, W) é um espaço vetorial e que ‖ · ‖Vs→Wé uma norma sobre Ls(V, W).
Prove ainda que, se W é Banach, então (Ls(V, W), ‖ · ‖Vs→W) também é completo.
Para realmente definirmos a derivada e analisarmos as propriedades, estaremos obriga-
dos a considerar expressões do tipo Ds1 Ds2 . . . Dsr f (x) e provar que elas são “isomorfas” a
Ds1+···+sr f (x). Para começar, temos que provar e usar o fato que:
Ls1(V,Ls2(V, . . . ,Lsr(V, W) . . . )) ∼= Ls1+s2+···+sr(V, W).
Informalmente isto é simples. No final das contas, um elemento do lado direito pega de entrada
uma s1-tupla em V; depois uma s2-tupla em V; depois . . . uma sr-tupla em V; e produz uma
saı́da em W; tudo isso de forma linear em cada variável e contı́nua no geral. Isso dá no mesmo
que pegar uma (s1 + s2 + · · ·+ sr)-tupla em V e levar em W de maneira multilinear e contı́nua.
O trabalho aparece quando queremos descrever isso de forma precisa. Considere números
r ∈ N\{0, 1} e s1, . . . , sr ∈ N\{0} com s1 + s2 + · · ·+ sr = s. Considere o espaço Ls(V, W) e o
um segundo espaço S = S1 definido da seguinte forma:
186
1. Sr := Lsr(V, W), com a norma ‖ · ‖Sr := ‖ · ‖Vsr→W ;
2. para i = r− 1, r− 2, . . . , 1, Si := Lsi(V,Si+1) com a norma ‖ · ‖Si := ‖ · ‖Vsi→Si+1 , ou seja,
Si = Lsi(V,Lsi+1(V, . . . ,Lsr(V, W) . . . ));
3. Finalmente,
S := S1 = Ls1(V,Ls2(V, . . . ,Lsr(V, W) . . . ))
com a norma definida acima.
Dado T ∈ S1, queremos definir QT ∈ Ls(V, W) correspondente. Isso quer dizer que devemos
definir, para cada v = (v1, . . . , vs) ∈ Vs, um valor
QT v = QT (v1, . . . , vs) ∈W
que corresponda de forma “natural” a T. Para isso, convém primeiro escrevermos:
Vs ∼= Vs1 ×Vs2 × · · · ×Vsr ;
isto é, a cada v = (vj)sj=1 ∈ Vs associamos:
v(1) := (vj)
s1
j=1 ∈ V
s1 , v(i) := (vj)
s1+···+si
j=s1+···+si−1 ∈ V
si (2 ≤ i ≤ r);
e notamos que a aplicação levando v ∈ Vs em (v(1), . . . , v(r)) ∈ V1× · · · ×Vr é uma bijeção. Além
disso, dado u = (uj)kj=1 ∈ Vk para algum k ∈ N\{0}, definimos mk(u) := ∏
k
j=1 ‖uj‖V e notamos
que:
∀v ∈ V : ms(v) =
r
∏
i=1
msi(v
(i)).
Agora definimos QT v da seguinte forma. Como T ∈ Ls1(V,S2), o valor T v(1) ∈ S2 está bem
definido. Como S2 = Ls2(V,S3), também podemos calcular (T v(1)) v(2) ∈ S3. Seguindo assim,
chegamos a:
QT v := (. . . ((T v(1)) v(2)) . . . ) v(r).
Portanto, definimos, para cada v ∈ Vs, um valor QT v ∈ W. Isto é, QT : Vs → W. Abaixo
relatamos algumas propriedades desta transformação.
QT é s-linear.
É um exercı́cio mostrar esta propriedade. De fato, isso segue da observação que “v(1) 7→
Tv(1)”é multilinear e que, para i = 2, . . . , r− 1,
(. . . (Tv(1)) . . . ) v(i−1) ∈ Si = Lsi(V,Si+1),
e portanto
“v(i) 7→ [(. . . (Tv(1)) . . . ) v(i−1)] v(i)” é multilinear.
O próximo passo é mostrar que QT é limitada e tem a mesma norma que T.
187
‖T‖S1 = ‖QT‖Vs→W .
Para isso, usamos repetidamente a nossa notação ms e o fato que podemos tomar o supremo
na ordem que quisermos:
‖QT‖Vs→W = sup
v∈(V\{0V})s
‖QTv‖W
ms(v)
(Vs ∼= Vs1 × · · · ×Vsr ) = sup
v(i)∈(V\{0V})
si
i=1,...,r
‖(. . . (Tv(1))v(2) . . . v(r−1))v(r)‖W
∏ri=1 msi(v(i))
.
Considere o lado direito da expressão quando tomamos o supremo em v(r). Como
(. . . (Tv(1))v(2) . . . )v(r−1) ∈ Lsr(V, W) = Sr,
temos que:
sup
v(r)∈(V\{0V})sr
‖(. . . (Tv(1))v(2) . . . v(r−1))v(r)‖W
msr(v(r))
= ‖(Tv(1))v(2) . . . v(r−1)‖Sr .
Portanto,
‖QT‖Vs→W = sup
v(i)∈(V\{0V})
si
i=1,...,r−1
‖(Tv(1))v(2) . . . v(r−1)‖Sr
∏r−1i=1 msi(v(i))
.
Podemos repetir este raciocı́nio tomando agora o supremo em v(r−1) e lembrando que
(Tv(1))v(2) . . . v(r−2) ∈ Sr−1 = Lsr−1(V,Sr).
Obtemos:
‖QT‖Vs→W = sup
v(i)∈(V\{0V})
si
i=1,...,r−2
‖(Tv(1))v(2) . . . v(r−2)‖Sr−1
∏r−2i=1 msi(v(i))
.
Repetindo este procedimento, chegamos a:
‖QT‖Vs→Q = sup
v(1)∈(V\{0})s1
‖Tv(1)‖S2
m1(v(1))
= ‖T‖S1
já que S1 = Ls1(V,S2).
A aplicação que leva T ∈ S em QT ∈ Ls(V, W) é uma bijeção linear que preserva normas.
Este também é um exercı́cio. A linearidade é bastante direta das definições e a preservação de
normas já foi provada. A propriedade de bijeção vem de construirmos, para cada Q ∈ Ls(V, W),
uma T ∈ S com QT = T.
188
12.3.2 A derivada de ordem k ≥ 3
Agora podemos definir a derivada de Fréchet de ordem k indutivamente.
Definição 12.3 Considere V, W e U como acima e um certo k ≥ 2. Suponha que f : U → W é
(k − 1)-vezes diferenciável. Se Dk−1 f é diferenciável em x0 ∈ U, chamamos de Dk f (x0) o elemento
de Lk(V, W) correspondente a D(Dk−1 f )(x0) ∈ L(V,Lk−1(V, W)) pelo isomorfismo que definimos na
subseção anterior.
Em particular, notamos que:
∀v = (vj)kj=1 ∈ Vk : Dk f (x) v = (D (Dk−1 f )(x) v1) (vj)kj=2
Portanto, a derivada de ordem k é (isomorfa a) uma derivada de uma função Dk−1 f : U →
Lk−1(V, W). Como a derivada direcional recupera a derivada de Fréchet (toda vez que esta
última existe), temos que:
D (Dk−1 f )(x) v1 = lim
ε→0
Dk−1 f (x + εv1)− Dk−1 f (x)
ε
.
Agora observe que, fixos (v2, . . . , vk), a operação que associa a Q ∈ Lk−1(V, W) a Q(v2, . . . , vk) é
contı́nua (exercı́cio). Portanto, a equação acima mostra que:
∀v = (vj)kj=2 ∈ Vk : Dk f (x) (v1, . . . , vk) = lim
ε→0
[(
Dk−1 f (x + εv1)− Dk−1 f (x)
ε
)
(vj)kj=2
]
. (12.1)
Esta identidade será usada para provar a proposição “óbvia” abaixo.
Proposição 12.4 Dada f : U → W, com U ⊂ V aberto e V, W como acima, dados inteiros k ≥ 1 e
s1, . . . , sr ≥ 1 com ∑ri=1 si = k, e dado um x ∈ U, as seguintes afirmações são equivalentes:
1. f é k− 1 vezes diferenciável em U e tem k-ésima derivada em x;
2. a derivada iterada Ds1−1Ds2 . . . Dsr f está definida em U e Ds1 Ds2 . . . Dsr f (x) existe.
Quando estas derivadas em x existem, temos ainda que
Ds1 Ds2 . . . Dsr f (x) ∼= Dk f (x),
ou melhor dizendo: o isomorfismo Is1,...,sr que construı́mos entre S = Ls1(V, . . . ,Lsr(V, W)) e Lk(V, W)
leva Ds1 Ds2 . . . Dsr f (x) em Dk f (x).
Prova: Podemos provar isso por indução em k. Quando k = 1, temos s1 = r = 1 e não há o que
provar.
Agora considere o caso em que k > 1 e suponha que o resultado que queremos provar vale
para k− 1. Provaremos que ele se estende também a k. Para isso, consideraremos s1, . . . , sr como
no enunciado, mas trataremos apenas do caso em que s1 ≥ 2 (a demonstração para s1 = 1 é mais
fácil).
Usando a hipótese de indução, já sabemos que o isomorfismo
Is1−1,s2,...,sr : Ls1−1(V,Ls2(V, . . .Lsr(V, W) . . . ))→ Lk−1(V, W)
189
leva Ds1−1Ds2 . . . Dsr f (x′) em Dk−1 f (x′) para cada x′ ∈ U. Portanto,
∀x′ ∈ U : Is1−1,s2,...,sr(Ds1−1Ds2 . . . Dsr f (x′)) = Dk−1 f (x). (12.2)
Se queremos saber o que isto significa por extenso, podemos identificar
Vk−1 ∼= Vs1−1 ×Vs2 × · · · ×Vsr
e observar que (12.2) nos diz que, se v = (v(i))i=1 ∈ Vk−1 com v(1) ∈ Vs1−1 e cada v(i) ∈ Vsi
(2 ≤ i ≤ r), temos que, para qualquer x′ ∈ U:
Dk−1 f (x) (v(i))ri=1 = (. . . (D
s1−1Ds2 . . . Dsr f (x′) v(1)) v(2) . . . ) v(r).
Para abreviar isso, chamamos de G(x′) := Ds2 . . . Dsr f (x′) e deduzimos:
Dk−1 f (x) (v(i))ri=1 = (. . . (D
s1−1G(x′) v(1)) v(2) . . . ) v(r), (12.3)
novamente para todos os x′ ∈ U.
Repare que Is1−1,s2,...,sr é contı́nua, linear e inversı́vel com inversa linear contı́nua. Por esta
razão, segue da Regra da Cadeia que o lado esquerdo de (12.2) é diferenciável em x se e somente
se o direito é.
Por fim, suponha que um dos lados é diferenciável (e portanto os dois são). Agora identifica-
remos
Vk ∼= V ×Vs1−1 ×Vs2 × · · · ×Vsr
acrescentando um v(0) ∈ V à “lista” (v(i))ri=1 definida acima. Note que, pela equação (12.1),
Dk f (x) (v(i))ri=0 = lim
ε→0
(
Dk−1 f (x + εv(0))− Dk−1 f (x)
ε
)
(v(i))ri=1.
Este limite pode ser calculado de outra maneira se recorremos a (12.3) (e usando novamente
(12.1):(
. . .
(
Ds1−1G(x + εv(0))− Ds1−1G(x)
ε
v(1)
)
v(2) . . .
)
v(r) = (. . . (Ds1 G(x) (v(0), v(1)) ) v(2) . . . ) v(r).
Portanto,
Dk f (x) (v(i))ri=0 = (. . . (D
s1 G(x) (v(0), v(1)) ) v(2) . . . ) v(r).
Como (v(i))ri=0 ∈ Vk é arbitrário, deduzimos que Ds1 G(x) = Ds1 Ds2 . . . Dsr f (x) é o “isomorfo” de
Dk f (x).2
Nosso próximo resultado significa que Dk f é simétrica sempre que é contı́nua como função
de x ∈ U.
Proposição 12.5 Suponha que f : U ⊂ V → W é k vezes diferenciável (com k ≥ 2) e que a função
Dk f : U → Lk(V, W) é contı́nua em um certo x ∈ U. Então a derivada Dk f (x) também é simétrica, ou
seja:
∀(v1, . . . , vk) ∈ Vk, Dk f (x) (v1, . . . , vk) é invariante por permutações de v1, . . . , vk.
190
Prova: Provaremos isto por indução em k ≥ 2. O caso k = 2 já foi discutido acima.
Pense agora em k > 2 e suponha que a simetria já foi provada para k− 1. Observamos que
o grupo de permutações de k elementos {v1, v2, . . . , vk} é gerado transposição de v1 e v2 e pelas
permutações de {v2, . . . , vk}. Portanto, basta provar que Dk f (x) (v1, . . . , vk) é invariante por estas
operações.
Em primeiro lugar, observamos que
∀x′ ∈ U : Dk f (x)(v1, v2, v3, . . . , vk = (D2G(x′)(v1, v2)) (v3, . . . , vk),
onde G(x′) := Dk−2 f (x′) (para x′ ∈ U). Como Dk f e D2G estão ligadas por um dos isomorfismos
que construı́mos, e além disso Dk f é contı́nua em x, temos que D2G também é contı́nua em x.
Portanto, esta segunda derivada é simétrica e temos:
(D2G(x)(v1, v2)) (v3, . . . , vk) = (D2G(x′)(v2, v1)) (v3, . . . , vk) = Dk f (x) (v2, v1, v3, . . . , vk).
Falta provar a simetria em (v2, . . . , vk). Para isso, usamos mais uma vez a equação (12.1):
Dk f (x) (v1, . . . , vk) = lim
ε→0
Dk−1 f (x + εv1) (v2, . . . , vk)− Dk−1 f (x) (v2, . . . , vk)
ε
.
Como Dk f existe em todo x′ ∈ U, a derivada Dk−1 f (x′) é função contı́nua de x′ e portanto é
simétrica em todos os pontos de U. Segue que a expressão “dentro do limite” acima é simétrica
por permutações de (v2, . . . , vk). É um exercı́cio mostrar que esta propriedade se preserva no
limite. 2
12.4 A fórmula de Taylor geral
Nesta seção enunciaremos a fórmula de Taylor na sua versão mais geral para funções k vezes
diferenciáveis.
Teorema 12.2 Tome k ∈ N\{0}. Suponha que f : U ⊂ V → W é (k − 1) vezes diferenciável no
conjunto U e que Dk f (x0) ∼= D(Dk−1 f )(x0) existe. Defina o polinômio de Taylor de f de ordem k ao
redor de x0 como:
Px0,k(h) := f (x0) +
k
∑
j=1
1
j!
Dj f (x) (h, . . . , h)︸ ︷︷ ︸
j vezes
.
Então:
f (x0 + h) = Px0,k(h) + rk(h)
onde rk(h)/‖h‖kV → 0W quando h→ 0V .
Prova: Na verdade, provaremos um resultado bem mais forte. Dados um r > 0 com BV(x0, r) ⊂
U e um h ∈ V com ‖h‖V < r, escreva
Rk(h) := Dk−1 f (x0 + h)− Dk−1 f (x0)− D(Dk−1 f )(x0) h ∈ Lk−1(V, W).
191
Note que ‖Rk(h)‖Vk−1→W/‖h‖V → 0 quando h → 0V porque Dk−1 f é diferenciável em x0. Nós
provaremos por indução em k ≥ 1 que, se h 6= 0V , então:
Objetivo:
‖rk(h)‖W
‖h‖kV
≤ sup
θ∈(0,1]
‖Rk(θ h)‖
θ‖h‖V
,
o que certamente garante rk(h)/‖h‖kV → 0 quando h→ 0V .
Base: k = 1. Este caso segue simplesmente da definição da derivada de Fréchet.
Passo indutivo. Suponha que k ≥ 2 e o teorema vale para k − 1. Se ‖h‖V é suficientemente
pequeno, de modo que x0 + th ∈ U para todo |t| ≤ 2, podemos definir
γ(t) := f (x + th)− Px0,k(th) (t ∈ (−2, 2)).
Vê-se que γ(0) = 0W porque Px0,k(0V) = f (x0). Por isso,
‖ f (x0 + h)− Px0,k(h)‖W = ‖γ(1)− γ(0)‖W ≤ sup
t∈[0,1]
‖γ′(t)‖W .
Para calcular γ′, observamos que
d
dt
f (x + th) = D f (x + th).h,
enquanto
d
dt
Px0,k(th) =
d
dt
 k∑
j=1
tj
j!
Dj f (x) (h, . . . , h)︸ ︷︷ ︸
j vezes

=
k
∑
j=1
tj−1
(j− 1)! D
j f (x) (h, . . . , h)︸ ︷︷ ︸
j vezes
(isom.) =
k
∑
j=1
tj−1
(j− 1)! [D
j−1(D f )(x) (h, . . . , h)︸ ︷︷ ︸
j−1 vezes
].h
= Qx0,k−1(th).h
onde Qx0,k−1 é o polinômio de Taylor de ordem k− 1 da função D f : U → L(V, W). Portanto, se
h 6= 0V ,
‖ f (x0+h)−Px0,k(h)‖W
‖h‖kV
≤ supt∈[0,1]
‖[D f (x0+th)−Qx0,k−1(th)].h‖W
‖h‖kV
≤ supt∈[0,1]
‖D f (x0+th)−Qx0,k−1(th)‖V→W
‖h‖k−1V
.
Note que a expressão no supremo vale 0 em t = 0, logo podemos tomar um supremo sobre
t ∈ (0, 1]. Assim, podemos trocar h por th no denominador e ter uma cota superior. Isso nos
192
traz ao caso k − 1 do resultado, com f substituı́da por D f . Aplicando a hipótese de indução,
deduzimos que:
‖D f (x0 + th)−Qx0,k−1(th)‖V→W
‖th‖k−1V
≤ sup
θ∈(0,1]
‖R′k−1(tθ h)‖
tθ‖h‖V
onde
R′k−1(h
′) := Dk−2(D f )(x0 + h)− Dk−2(D f )(x0)− D(Dk−2(D f ))(x0).h.
Usando nossos isomorfismos com algum cuidado, podemos ver que R′k−1(h
′) tem a mesma
norma que Rk(h′) e isso encerra a prova porque 0 < tθ ≤ 1 na expressão acima. 2
Exercı́cio 12.5 Como no caso da reta, há outras versões da Fórmula de Taylor. Uma delas é útil quando
Dk f existe numa vizinhança de x0 e a função x 7→ Dk f (x) é contı́nua neste ponto x0. Mostre que, neste
caso, para ‖h‖V suficientemente pequeno,
f (x0 + h) = Px0,k(h) + Rx0,k(h)
com resto
‖Rx0,k(h)‖W
‖h‖kV
≤
supa∈[x0,x0+h] ‖D
k f (a)− Dk f (x0)‖Vk→W
k!
h→0V→ 0.
12.5 Mais exercı́cios
Exercı́cio 12.6 Dada f : U ⊂ Rd → R, prove que f é Ck (Dk f (x) existe em todo x ∈ U e depende
continuamente de x) se e somente se todas as derivadas parciais de ordem k de f estão definidas sobre todo
o conjunto U e são funções contı́nuas. Mostre ainda que as derivadas parciais são simétricas (têm o mesmo
valor para qualquer ordem que se tome as derivadas).
Exercı́cio 12.7 Enuncie de forma precisa e prove o seguinte resultado: a composição de funções k vezes
diferenciáveis é k vezes diferenciável.
Exercı́cio 12.8 Volte à Proposição 11.4 e suponha agora que Dkxψ(t, x) existe e é contı́nua, para algum
k ≥ 0. Prove que as funções Tψ e Fψ definidas na prova daquela proposição são k vezes diferenciáveis e
calcule suas derivadas de ordem até k.
Exercı́cio 12.9 Considere Q ∈ Lk(V, W) (com V e W “como sempre”e k ∈ N\{0, 1}) e defina f (v) :=
Q(v, v, . . . , v) (v ∈ V). Calcule as derivadas de todas as ordens desta função. Explique como a fórmula se
simplifica quando Q é simétrica.
Exercı́cio 12.10 Dados espaços vetoriais normados (V, ‖ · ‖V), (W, ‖ · ‖W), chame de Lsimk (V, W) o con-
junto das transformações k-lineares e simétricas de Vk em W. Mostre que este conjunto é um subconjunto
fechado de Lk(V, W). Mostre ainda que podemos definir sobre Lsimk (V, W) uma norma ‖ · ‖sim que é
equivalente à restrição da norma usual de Lk(V, W) a este subespaço:
‖Q‖sim := sup
v∈V\{0V}
‖Q(v, v, . . . , v)‖W
‖v‖kV
.
193
Dica: para v ∈ V, escreva vk := (v, v, . . . , v) ∈ Vk. Mostre que existem
m ∈N\{0} e {a(i)}mi=1 ∪ {α
(i)
j }1≤i≤m,1≤j≤k ⊂ R
tais que, para quaisquer vetores v1, . . . , vk ∈ V e qualquer Q : Vk →W k-linear,
Q(v1, v2, . . . , vk) =
m
∑
i=1
a(i) Q
(
(
k
∑
j=1
α
(i)
j vj)
k
)
.
Depois explique porque a existência destes números implica que existe um Ck > 0 tal que
‖Q‖Vk→W ≤ Ck ‖Q‖sim para qualquer Q ∈ Lsimk (V, W).
Exercı́cio 12.11 (“Regra de Leibniz” para derivada de Fréchet) Dados espaços vetoriais normados
(V, ‖ · ‖V), (W, ‖ · ‖W) e (Z, ‖ · ‖Z); um aberto U ⊂ V; uma Q ∈ Lk(W, Z); e funções f1, . . . , fk : U →
W. Defina uma nova função F : U → Z via:
F(x) := Q( f1(x), . . . , fk(x)) (x ∈ U).
Mostre que, se todas as fi são diferenciáveis num certo x ∈ U, então DF(x) existe. Além disso, calcule
DF(x).
Exercı́cio 12.12 Recorde o Teorema 11.5 acima, onde consideramos (X, ‖ · ‖X) Banach, o subconjunto
aberto U ⊂ L(X) de operadores lineares inversı́veis e definimos Inv : U → U como a operação que
associa cada operador inversı́vel a sua inversa. Agora defina , para cada r ∈ N\{0, 1}, uma operação
Opr : L(X) 7→ Lr−1(L(X),L(X)) que associa a cada A ∈ L(X) a transformação (r− 1)-linear Opr(A)
definida a seguir.
Opr(A) (H1, . . . , Hr−1) := (−1)
r−1 1
(r− 1)! ∑
σ∈Sr−1
AHσ(1)AHσ(2) . . . AHσ(r−1)A ((H1, . . . , Hr−1) ∈ L(X)r−1).
1. Prove que cada Opr é diferenciável e calcule a sua derivada.
2. Demonstre via regra da cadeia e indução que DkInv = Opk+1 ◦ Inv. (Uma dica é observar que, se
esta fórmula vale para algum k, vê-se automaticamente que DkInv existe e pode-se usar derivadas
direcionais para calculá-la.)
194
Capı́tulo 13
Pontos fixos, funções inversas, funções
implı́citase EDOs
Neste capı́tulo abordaremos um teorema bem abstrato e duas consequências importantes dele
para o cálculo diferencial em espaços vetoriais. O que une estes temas é a necessidade de achar
pontos em um espaço V com uma certa propriedade desejada. Nosso meio de fazer isso será
procurar pontos fixos de certas operações.
Exemplo 13.1 (Problema de Cauchy para EDOs) No Exemplo 4.7, vimos que o problema de achar
uma solução para uma EDO é equivalente ao de achar um ponto fixo para uma certa função T : C(I, V)→
C(I, V).
Exemplo 13.2 Imagine que f : U0 ⊂ V → V com U0 ⊂ V aberto. Na prova do Teorema da Função
Inversa, que será vista abaixo, nos depararemos com o problema de provar que, sob certas condições em
f , f (U0) é um conjunto aberto. Repare que este tipo de resultado é bem forte. Dada uma f bem pouco
conhecida, um x ∈ U0 e um y = f (x) ∈ V, temos que provar que existe um raio positivo δ > 0 tal que
todo ponto y′ ∈ BV(y, δ) tem uma preimagem em U0. Mas como podemos construir estas pré-imagens?
Veremos que a maneira conveniente de fazer isso é achar um ponto fixo para uma certa operação.
A mensagem deste capı́tulo é que há uma metodologia para estes problemas que funciona
em muitos casos.
Considere um espaço métrico (X, dX). Você precisa provar que existe um ponto x∗ ∈ X com
certas propriedades. Uma estratégia é converter este problema no de achar um ponto fixo de
uma transformação H : X → X e depois mostrar que o ponto fixo existe usando o Teorema do
Ponto Fixo de Banach, provado logo a seguir.
13.1 O teorema do ponto fixo de Banach
Nesta seção daremos o enunciado e a prova deste teorema de Banach. Primeiro, algumas
definições.
Definição 13.1 Dada H : X → X, um ponto fixo de H é um x∗ ∈ X com H(x∗) = x∗.
195
Abaixo usaremos a notação
Hi := H ◦ H ◦ H ◦ · · · ◦ H︸ ︷︷ ︸
i vezes
(i ∈N\{0})
com H0 := I a função identidade sobre X.
O exercı́cio a seguir nos diz que os pontos fixos são exatamente os limites de órbitas {Hi(x)}i∈N
Exercı́cio 13.1 Supondo que H é contı́nua e (X, dX) é completo, mostre que x∗ é ponto fixo de H se e
somente se existe um x ∈ X com Hi(x)→ x∗ quando i→ +∞.
Teorema 13.1 (Ponto Fixo de Banach) Suponha que (X, dX) é um espaço métrico completo e que H :
X → X é tal que cada Hi é κi-Lipschitz (i ∈N). Suponha que
M :=
+∞
∑
i=0
κi < +∞.
Então:
(a) H tem um único ponto fixo x∗.
(b) Hi(x)→ x∗ para qualquer x ∈ X.
(c) dX(x, x∗) ≤ M d(x, H(x)) para qualquer x ∈ X.
O uso deste teorema será fundamental no restante da seção. Observamos antes da prova um
caso especial importante e dois exemplos que explicam as hipóteses do teorema.
Exercı́cio 13.2 Mostre que as hipóteses do Teorema seguem quando H é κ-Lipschitz com κ < 1, já que
neste caso podemos tomar κi = κi.
Exemplo 13.3 Note que a hipótese de que (X, dX) é completo é fundamental. Por exemplo, considere
X = R\{0} e H(x) = x/2 (x ∈ X).
Exemplo 13.4 Neste exemplo mostramos que é possı́vel se ter X completo, H : X → X tal que
∀x, x′ ∈ X : dX(H(x), H(x′)) < dX(x, x′),
mas tais que H não tem ponto fixo. Por esta razão, é importante que a constante de Lipschitz seja estrita-
mente menor do que um.
Tome X = [1,+∞) ⊂ R. Este é um conjunto fechado da reta e é, portanto, um espaço métrico completo
com a métrica induzida por R. Defina H(x) = x + x−1 (x ∈ X). Observe que:
∀x, x′ ∈ X : |H(x)− H(x′)| = |x− x′|
∣∣∣∣1− 1xx′
∣∣∣∣ < |x− x′|.
Por outro lado, se existisse um ponto fixo x ∈ X, terı́amos x = x + x−1, o que dá x−1 = 0, o que é
impossı́vel.
Antes da prova, convém enunciarmos um lema simples.
196
Lema 13.1 Se (X, dX) é completo, então uma sequência {xi}i∈N ⊂ X satisfazendo
∑
i∈N
dX(xi, xi+1) < +∞
é convergente. Além disso,
∀k ∈N : dX(xk, lim
i∈N
xi) ≤ ∑
i≥k
dX(xi, xi+1).
Prova: Fixando uma tal {xi}i∈N, mostraremos que ela necessariamente é Cauchy. Para
isso, usaremos o fato de que a cauda de uma série convergente vai a zero:
ck := ∑
i≥k
dX(xi, xi+1)
k→+∞−→ 0,
Agora estimaremos a distância entre xk e x` com k < ` naturais. Veja que podemos
aplicar a desigualdade triangular várias vezes e deduzir que:
dX(xk, x`) ≤ dX(xk, xk+1) + dX(xk+1, x`) ≤ · · · ≤
`−1
∑
i=k
dX(xi, xi+1) ≤ ck,
onde a última desigualdade segue do fato que todos os termos na série ck são não-
negativos.
A cota acima foi feita para k < `. Ela também funciona para k > ` se trocamos os
papeis dos ı́ndices e certamente vale para k = `. Concluı́mos que:
∀k, ` ∈N : 0 ≤ dX(xk, x`) ≤ cmin{k,`}.
Quando k, ` → +∞, cmin{k,`} → 0, portanto dX(xk, x`) → 0. Ou seja, a sequência
{xi}i∈N é Cauchy, como querı́amos demonstrar. Como (X, dX) é completo, existe um
limite x∗ para a sequência. Além disso, veja que, quando ` → +∞, x` → x∗; como
` ≥ k para todo ` grande, a estimativa acima nos permite deduzir:
∀k ∈N : dX(xk, x`) ≤ ck.
2
Prova: [Prova do Teorema de Ponto Fixo de Banach] Nosso primeiro passo é provar que, dado
qualquer x ∈ X, {Hi(x)}i∈N converge a um x∗ ∈ X que satisfaz a desigualdade do item (c)
acima.
De fato, como (X, dX) é completo, sabemos do Lema acima uma condição suficiente para uma
sequência {xi}i∈N ⊂ X convergir é que
∑
i∈N
dX(xi, xi+1) < +∞.
197
Mais ainda, quando vale este critério, podemos usar a desigualdade triangular para obter:
dX(x0, lim
i∈N
xi) ≤ ∑
i∈N
dX(xi, xi+1).
Aplicaremos tudo isso a xi := Hi(x), i ∈N, observando que neste caso
dX(xi−1, xi) = dX(Hi−1(x), Hi−1(H(x))) ≤ κi−1 dX(x, H(x))
porque Hi−1 é κi−1-Lipschitz. Portanto,
∑
i∈N
dX(xi, xi+1) ≤ ∑
i∈N
κi dX(x, H(x)) = M dX(x, H(x)) < +∞
e temos tanto a convergência de {Hi(x)}i∈N a um x∗ quando a cota de (c) para dX(x, x∗). Isto
conclui a primeira parte da prova.
O restante da demonstração é basicamente uma série de observações simples. Veja que o
argumento acima garante que pontos fixos existem: afinal, qualquer x∗ = limi Hi(x) é ponto fixo
pelo exercı́cio 13.1. Para provar unicidade, provaremos que quaisquer dois pontos fixos x∗, y∗ são
iguais. Primeiro notamos que, quando x∗ e y∗ são pontos fixos, então Hi(x∗) = x∗ e Hi(y∗) = y∗.
Em particular, como M < +∞ isto vale para algum i ∈N com κi < 1/2. Mas então:
0 ≤ dX(x∗, y∗) = dX(Hi(x∗), Hi(y∗)) ≤ κi−1 dX(x∗, y∗) <
dX(x∗, y∗)
2
⇒ dX(x∗, y∗) = 0⇒ x∗ = y∗.
Finalmente, juntamos os ingredientes.
• O ponto fixo existe e é único, como pede (a);
• Como cada sequência {Hi(x)}i∈N converge a um limite (pela primeira parte da prova) e
este limite é um ponto fixo (pelo exercı́cio 13.1), temos que Hi(x) converge a x∗, o único
ponto fixo de H, não importando qual seja x. Isto é a parte (b) do teorema.
• Finalmente, a estimativa (c) foi provada no primeiro passo, onde tratamos x∗ como o limite
de Hi(x) para um dado x. Como agora sabemos que este limite é o único ponto fixo, está
encerrada a prova.
2
13.2 O teorema da função inversa
Nesta seção provaremos um dos teoremas clássicos do Cálculo em várias variáveis: o teorema da
função inversa. Convém enunciar uma definição antes de começar.
Definição 13.2 Dados abertos U0, U1 ⊂ V, dizemos que f : U0 → U1 é um difeomorfismo de classe C`
(` ∈N\{0}) se f é uma bijeção entre U0 e U1 e tanto f quanto f−1 são funções com derivadas contı́nuas
até ordem `.
198
Os difeomorfismos são importantes porque são correspondências entre conjuntos que preser-
vam não só cardinalidade (como seria se fossem só bijeções) ou topologia (como seria se f e f−1
são contı́nuos), mas também qualquer “estrutura diferenciável até ordem `”que podemos botar
nos conjuntos U0 e U1. De fato, os “difeos” serão muito importantes na hora de falarmos de
variedades.
Uma observação simples é que, para que uma função f : U0 → U1 seja um difeomorfismo C1,
é necessário que derivada de f seja um operador linear inversı́vel. De fato, supondo que f seja
mesmo um difeo, podemos aplicar a regra da cadeia às expressões
∀x ∈ U0, f−1 ◦ f (x) = x e ∀y ∈ U1, f ◦ f−1(y) = y
e descobrir que, dados x ∈ U0 e y = f (x) ∈ U1,
D f−1(y)D f (x) = D f (x) D f−1(y) = IdV ,
o operador identidade de V. Desta forma,
D f−1 = Inv ◦ D f ◦ f−1.
Exercı́cio 13.3 Use a representação acima para D f−1 para provar o segunte resultado. Se f : U0 → U1 é
bijeção de classe C` e a função inversa f−1 é diferenciável, então f−1 também é de classe C` (para ` = 1,
isso segue do fato de que D f−1 é a composição de três funções contı́nuas.
Por outro lado, a simples invertibilidade da derivada não é suficiente para garantir que f é
um difeomorfismo.
Exemplo 13.5 Considere a parametrização de U0 = U1 = R2\{0R2} por coordenadas polares.
f : R2\{0} → R2\{0R2}
(r, θ) 7→ (r cos θ, r sin θ).
Podemos calcular a derivada de f na forma matricial através da matriz de derivadas parciais.
D f (r, θ) =
(
cos θ −r sin θ
sin θ r cos θ
)
.
Como o determinante desta matriz é r > 0, D f (r, θ) é sempre inversı́vel. No entanto, f não é um
difeomorfismo. De fato, ela não é nem mesmo uma bijeção, já que é periódica na segunda coordenada.
O que o Teorema da Função Inversa é que a invertibilidade da derivada num único ponto x0
do domı́nio garante que f é um difeomorfismo local, ou seja, ao redor de x0.
Teorema 13.2 (Teorema da função inversa) Considere um espaço vetorial normado completo (V, ‖ ·
‖V). Suponha que U ⊂ V é aberto de V, que f : U →W é C`, ` ∈N\{0}. Suponha ainda que, para um
certo ponto x0 ∈ U, D f (x0) é inversı́vel. Então há um aberto U0 ⊂ U com x ∈ U0 tal que:
1. U1 := f (U0) é aberto;
2. f |U0 : U0 → U1 é um difeomorfismo C`.
199
A prova será apresentada ao longo de vários lemas abaixo. Convem entender desde agora a
intuição e a dificuldade técnica da prova. A intuição é simples. Localmente, f (x) se parece muito
com a função afim y0 + T(x− x0), com y0 = f (x0) e T = D f (x0). Como T é inversı́vel, a função
afim também é e tudo indica que f deve ter as mesmas caracterı́sticas numa vizinhança de x0.
A maior dificuldade técnica da prova será provar que U1 é aberto. Para entender o desafio,
imagine que você tem em mãos um y ∈ U1 = f (U0). Tudo o que sabemos, em princı́pio, é que
y = f (x) para algum x ∈ U0. Para provar que U1 é aberto, precisamos encontrar um δ > 0 tal
que todo y′ a distância < δ de y tem uma pré-imagem x′ em U0. Como poderemos fazer isso? A
resposta curta será reformular o problema como se fosse um problema de ponto fixo.
A prova do Teorema da função inversa será dada em várias etapas. A primeira é o lema
a seguir, que formaliza a ideia que f (x) ≈ y0 + T (x − x0). (Manteremos a notação de que
T = D f (x0) em toda a prova.) De fato, se tivéssemos f (x) = y0 + T (x− x0) exatamente, valeria
T−1( f (x′)− f (x′′)) = x′ − x′′.
Lema 13.2 Existe um r > 0 com U0 := BV(x0, r) ⊂ U onde f satisfaz a seguinte estimativa.
∀x′, x′′ ∈ U0 : ‖T−1( f (x′)− f (x′′))− (x′ − x′′)‖V ≤
‖x′ − x′′‖V
2
.
Prova: Sob as nossas hipóteses, x 7→ D f (x) é contı́nua e portanto x 7→ T−1D f (x) é contı́nua.
Como T−1D f (x0) = T−1 T = IdV , existe uma vizinhança U0 = BV(x0, r) ⊂ U onde ‖T−1D f (x)−
IdV‖V→V ≤ 1/2. Agora observe que U0 é convexo e que, pela desigualdade do valor médio, vale
a seguinte desigualdade sempre que x′, x′′ ∈ U0:
‖T−1( f (x′)− f (x′′))− (x′ − x′′)‖V = ‖[T−1 f (z)− z]z=x
′
z=x′′‖V
≤
(
sup
z∈[x′,x′′]
‖T−1D f (x)− IdV‖V→V
)
‖x′ − x′′‖V
(‖T−1D f (x)− IdV‖V→V ≤ 1/2 em U0) ≤
‖x′ − x′′‖V
2
.
2
O Lema acima tem diversas consequências. A principal delas é a seguinte.
Corolário 13.1 A função f |U0 é bi-Lipschitz, isto é, existem constantes c0, c1 > 0 tais que:
∀x, x′ ∈ U0 : c0‖x− x′‖V ≤ ‖ f (x)− f (x′)‖V ≤ C0‖x− x′‖V .
Em particular, se U1 = f (U0), f é uma bijeção Lipschitz com inversa Lipschitz entre U0 e U1.
Prova: Segue do Lema anterior e da subaditividade da norma que:
∀x, x′ ∈ U0 : |‖T−1( f (x)− f (x′))‖V−‖x− x′‖V | ≤
‖x− x′‖V
2
ou
‖x− x′‖V
2
≤ ‖T−1( f (x)− f (x′))‖V ≤
3
2
‖x− x′‖V .
Portanto, dados quaisquer x, x′ ∈ U0,
‖ f (x)− f (x′)‖V = ‖T T−1( f (x)− f (x′))‖V ≤ ‖T‖V→V‖T−1( f (x)− f (x′))‖V ≤
3‖T‖V→V
2
‖x− x′‖V
200
e ao mesmo tempo
‖ f (x)− f (x′)‖V ≥
‖T−1( f (x)− f (x′))‖V
‖T−1‖V→V
≥ 1
2‖T−1‖V→V
.
Estas estimativas implicam que f |U0 é injetiva e portanto é uma bijeção entre U0 e U1 = f (U0).
É um exercı́cio deduzir destas estimativas que f (restrita a U0) e f−1 são Lipschitz. 2
O próximo lema é a parte mais difı́cil da prova. É precisamente nele que usaremos o argu-
mento de ponto fixo.
Lema 13.3 U1 := f (U0) é aberto.
Antes de provar o Lema, vejamos como ele implica o Teorema.
Prova: [Fim da prova do Teorema da Função Implı́cita supondo o Lema 13.3] A partir daqui,
suporemos que f : U0 → U1. Já vimos acima que ela é uma bijeção bi-Lipschitz e estamos
supondo que U1 é aberto. O que nos falta, então, é provar é f−1 diferenciável, mas, pelo Exercı́cio
13.3, basta mostrar que f−1 é diferenciável.
Fixe y ∈ U1 e x ∈ U0 com f (x) = y. Observe em primeiro lugar que, pela nossa escolha de
U0,
∀x ∈ U0 : ‖T−1D f (x)− IdV‖V→V ≤ 1/2 < 1,
logo T−1D f (x) é inversı́vel e D f (x) também é inversı́vel. Logo, se y = f (x) ∈ U1, a regra da
cadeia (como exposta no inı́cio da seção) nos faz pensar que D f−1(y) deve ser igual a S :=
D f (x)−1.
Provaremos abaixo que isso é verdade. Dado h tal que y + h ∈ U1, podemos definir uh com
x + uh ∈ U0 tal que f (x + uh) = y + h. Como f é bi-Lipschitz,
c0‖uh‖V ≤ ‖ f (x + uh)− f (x)‖V = ‖h‖V ≤ c1‖uh‖V
com c0, c1 > 0 constantes. Por esta razão, uh 6= 0V se h 6= 0V . Por fim, temos as identidades:
h = y + h− h = f (x + uh)− f (x) = S−1 uh + r(uh),
onde r é um termo de resto, e
f−1(y + h)− f−1(y)− S h = x + uh − x− S h = uh − Sh.
Concluı́mos que
‖ f−1(y + h)− f−1(y)− S h‖V
‖h‖V
=
‖uh − S h‖V
‖h‖V
=
‖S (S−1uh − h)‖V
‖h‖V
≤ ‖S‖V→V
‖S−1uh − h‖V
‖h‖V
= ‖S‖V→V
‖r(uh)‖V
‖h‖V
(use ‖uh‖V ≥ c−10 ‖h‖V) ≤ c0‖S‖V→V
‖r(uh)‖V
‖uh‖V
(use que h→ 0V implica uh → 0V) → 0
201
Estas equações mostram para nós que a derivada de f−1 em y é mesmo dada por:
D f−1(y) = [D f ( f−1(y))]−1 (y ∈ U1).
2
Falta, então, provar o Lema 13.3. É o que faremos a seguir.
Prova: [Prova do Lema 13.3] Tome y ∈ f (U0), y = f (x) com x ∈ U0. Precisamos mostrar que
existe um δ > 0 tal que BV(y, δ) ⊂ f (U0). Isto é o mesmo que provar que
Queremos: existe um δ > 0 tal que, sempre que y′ ∈ V e ‖y′ − y‖V < δ, existe um x′ ∈ U0
com f (x′) = y′.
Nossa ideia será reinterpretar x′ como a solução de um problema de ponto fixo. Defina:
H′y(x
′) := x′ + T−1(y′ − f (x′)) (x′ ∈ U).
Podemos reformular nosso objetivo como sendo o seguinte: Veja que o problema de achar um
ponto fixo de Hy′ é o mesmo de achar x′ com f (x′) = y. Por outro lado, uma propriedade boa
desta função é que ela é automaticamente 1/2-Lipschitz, pelo lema anterior.
∀x′, x′′ ∈ U0 : ‖H′y(x′)− Hy(x′′)‖V = ‖(x′ − x′′)− T−1( f (x′)− f (x′′))‖V ≤
‖x′ − x′′‖V
2
.
(Isso explica, aliás, porque usamos T−1 f no Lema e na definição de Hy′ .)
Tudo isto vale para qualquer y′ ∈ V. Nosso objetivo (reformulado) é mostrar:
Queremos: existe um δ > 0 tal que, sempre que y′ ∈ V e ‖y′ − y‖V < δ, a aplicação Hy′
tem um ponto fixo.
Iremos aplicar o Teorema de Ponto Fixo de Banach para resolver problema. Para aplicar o
Teorema, basta garantir duas condições:
1. Hy′ é κ-Lipschitz, com κ < 1 (esta parte já está feita).
2. Hy′ leva um certo espaço métrico completo X em si mesmo.
A questão então é como cumprir com a segunda exigência. Como y′ estará numa bola perto
de y, é razoável esperar que sua pré-imagem esteja perto de x. De fato, escolhemos o domı́nio:
X := BV [x, η], com 0 < η < r− ‖x− x0‖V .
Note que X ⊂ BV(x0, r) porque x ∈ BV(x0, r). Além disso, X é um fechado num espaço vetorial
completo, sendo, portanto, completo com a métrica induzida.
Ainda falta verificar que Hy′ : X → X é uma transformação deste X em si mesmo. É aqui que
a escolha do δ > 0, que ainda não especificamos, será importante. Mais especificamente, mostraremos
que a escolha de
δ :=
η
2‖T−1‖V→V
funciona.
202

Mais conteúdos dessa disciplina