Prévia do material em texto
Análise em espaços métricos e vetoriais Roberto Imbuzeiro Oliveira1 30 de junho de 2021 1IMPA, Rio de Janeiro, RJ, Brazil, 22430-040. 2 Conteúdo I Os objetos fundamentais 9 1 Prólogo 11 1.1 Fatos sobre R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.1.1 Intervalos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.1.2 Limites e convergência de sequências . . . . . . . . . . . . . . . . . . . . . . . 11 1.1.3 Limites superior e inferior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.1.4 Limites e convergência de séries . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.1.5 Limites de funções, continuidade, máximos e mı́nimos . . . . . . . . . . . . . 15 1.1.6 Derivadas e integrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.2 Algumas funções especiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.2.1 A função exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.2.2 A função logaritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.2.3 As funções seno e cosseno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 1.3 A desigualdade das médias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 1.4 Mais um fato útil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 2 Espaços vetoriais e normas 25 2.1 Um caso concreto: o espaço Rd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.1.1 Operações em Rd e suas propriedades . . . . . . . . . . . . . . . . . . . . . . 25 2.1.2 Produto interno e a norma euclideana em Rd . . . . . . . . . . . . . . . . . . 26 2.2 Definições gerais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.2.1 O que é um espaço vetorial? . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.2.2 Subespaços de espaços vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.2.3 Normas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.3 Mais exercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3 Espaços métricos, convergência e completude 41 3.1 Espaços métricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.1.1 A reta real como espaço métrico . . . . . . . . . . . . . . . . . . . . . . . . . . 42 3.1.2 Os números complexos como espaço métrico . . . . . . . . . . . . . . . . . . 42 3.1.3 A métrica discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 3.1.4 Espaços vetoriais: normas nos dão métricas . . . . . . . . . . . . . . . . . . . 42 3.1.5 Métricas induzidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 3.2 Sequências, limites e completude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 3.2.1 Subsequências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3 3.2.2 Convergência em Rd com as normas `p . . . . . . . . . . . . . . . . . . . . . . 46 3.2.3 Convergência sob a métrica discreta . . . . . . . . . . . . . . . . . . . . . . . . 48 3.2.4 Convergência em C(I, R) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 3.3 Equivalência de métricas e normas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 3.4 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 4 Funções e continuidade 57 4.1 Funções contı́nuas de X em R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 4.2 Funções Lipschitz e distâncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 4.3 Funções contı́nuas sobre o espaço de funções contı́nuas . . . . . . . . . . . . . . . . . 60 4.4 Funções contı́nuas de X em Rd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 4.5 Transformações e funcionais lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 4.6 Transformações multilineares e tensores . . . . . . . . . . . . . . . . . . . . . . . . . . 65 4.6.1 Tensores em dimensão finita . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 4.6.2 Alguns exemplos em dimensão infinita . . . . . . . . . . . . . . . . . . . . . . 69 4.7 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 II Topologia e geometria em espaços métricos 73 5 Abertos, fechados e topologias 75 5.1 Os abertos formam uma topologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 5.2 Outros conceitos topológicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 5.3 Caracterizações métricas dos conceitos topológicos . . . . . . . . . . . . . . . . . . . 82 5.4 Continuidade, abertos e fechados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 5.5 Topologia relativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 5.6 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 6 Compactos: teoria geral 89 6.1 Compactos do ponto de vista de Topologia Geral . . . . . . . . . . . . . . . . . . . . 90 6.2 Espaços métricos compactos: o grande teorema de equivalência . . . . . . . . . . . . 93 6.2.1 Roteiro da prova . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 6.2.2 Compactos são completos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 6.2.3 Cobertura, empacotamento e limitação total . . . . . . . . . . . . . . . . . . . 96 6.2.4 O critério das subsequências convergentes . . . . . . . . . . . . . . . . . . . . 99 6.2.5 O fim da prova da grande equivalência . . . . . . . . . . . . . . . . . . . . . . 101 6.3 Mais sobre compactos e funções contı́nuas . . . . . . . . . . . . . . . . . . . . . . . . 102 6.3.1 Funções sobre compactos com contradomı́nio completo . . . . . . . . . . . . 102 6.3.2 Funções sobre compactos com contradomı́nio Banach . . . . . . . . . . . . . 104 6.3.3 Continuidade uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 6.4 Compacidade de subconjuntos de um espaço métrico completo . . . . . . . . . . . . 107 6.5 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 4 7 Compactos: casos particulares 111 7.1 Compactos de Rd: o Teorema de Heine-Borel . . . . . . . . . . . . . . . . . . . . . . . 111 7.2 Aplicações do teorema de Heine-Borel . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 7.2.1 Todas as normas sobre Rd são equivalentes . . . . . . . . . . . . . . . . . . . 112 7.2.2 Convergência uniforme sobre compactos . . . . . . . . . . . . . . . . . . . . . 114 7.3 Compactos nos espaços de funções contı́nuas . . . . . . . . . . . . . . . . . . . . . . . 119 7.3.1 Bolas fechadas não são compactas . . . . . . . . . . . . . . . . . . . . . . . . . 120 7.3.2 O teorema de Arzelà-Ascoli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 7.4 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 8 Caminhos e conexidade 127 8.1 Conexidade por caminhos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 8.1.1 Conectando pontos por curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 8.1.2 Exemplos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 8.2 Conexidade topológica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 8.2.1 Formas equivalentes do conceito . . . . . . . . . . . . . . . . . . . . . . . . . . 131 8.2.2 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 8.2.3 Um pouco mais sobre conexidade e topologia induzida . . . . . . . . . . . . 135 8.3 Exemplos mais interessantesdas definições . . . . . . . . . . . . . . . . . . . . . . . . 136 8.3.1 Matrizes ortogonais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 8.3.2 Um conjunto conexo que não é conexo por caminhos . . . . . . . . . . . . . . 140 8.3.3 Concordância para abertos de espaços vetoriais . . . . . . . . . . . . . . . . . 141 8.4 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 III Cálculo em espaços vetoriais 145 9 Preâmbulo 147 10 Funções a um parâmetro: derivadas e integrais 149 10.1 Derivadas: definição e resultados preliminares . . . . . . . . . . . . . . . . . . . . . . 149 10.2 A desigualdade do valor médio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 10.3 Integração de funções sobre intervalos . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 10.4 O teorema fundamental do Cálculo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 10.5 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 11 A derivada como transformação linear 157 11.1 Definição de derivada de Fréchet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 11.1.1 Unicidade da derivada de Fréchet e derivadas direcionais . . . . . . . . . . . 158 11.2 Alguns casos simples da derivada de Fréchet . . . . . . . . . . . . . . . . . . . . . . . 159 11.2.1 Quando o domı́nio está na reta . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 11.2.2 Derivadas envolvendo funções lineares . . . . . . . . . . . . . . . . . . . . . . 161 11.2.3 A derivada quando V tem dimensão finita e W = R . . . . . . . . . . . . . . 161 11.2.4 O caso em que W tem dimensão finita . . . . . . . . . . . . . . . . . . . . . . 163 11.2.5 A derivada do determinante . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 11.3 Boas propriedades da derivada de Fréchet . . . . . . . . . . . . . . . . . . . . . . . . 166 5 11.3.1 A regra da cadeia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 11.3.2 A desigualdade do valor médio . . . . . . . . . . . . . . . . . . . . . . . . . . 168 11.4 Derivadas mais complicadas de se calcular . . . . . . . . . . . . . . . . . . . . . . . . 169 11.4.1 Exemplos no espaço de operadores lineares . . . . . . . . . . . . . . . . . . . 169 11.4.2 Um exemplo sobre as funções contı́nuas . . . . . . . . . . . . . . . . . . . . . 173 11.5 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 12 Derivadas de ordem superior 179 12.1 Já sabemos definir, mas... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 12.2 Segunda derivada, transformações bilineares e simetria . . . . . . . . . . . . . . . . . 180 12.2.1 Relação de L(V,L(V, W)) com transformações bilineares . . . . . . . . . . . 180 12.2.2 A segunda derivada é bilinear . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 12.2.3 Simetria da segunda derivada (quando contı́nua) . . . . . . . . . . . . . . . . 183 12.2.4 Derivadas parciais de ordem 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 12.3 Derivadas de ordem maior que dois . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186 12.3.1 Onde vivem as derivadas e um kit para cuidar dos isomorfismos . . . . . . . 186 12.3.2 A derivada de ordem k ≥ 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 12.4 A fórmula de Taylor geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 12.5 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 13 Pontos fixos, funções inversas, funções implı́citas e EDOs 195 13.1 O teorema do ponto fixo de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 13.2 O teorema da função inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198 13.3 O teorema da função implı́cita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203 13.4 Aplicações às equações diferenciais ordinárias . . . . . . . . . . . . . . . . . . . . . . 206 13.4.1 Existência, unicidade e dependência contı́nua: um teorema global . . . . . . 206 13.4.2 Suavidade da solução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 13.5 Mais exercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 14 Esboço da teoria de subvariedades de Rd 213 14.1 Os dois primeiros exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213 14.1.1 Abertos de Rd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214 14.1.2 Gráficos de funções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214 14.2 Parametrizações que viram difeomorfismos . . . . . . . . . . . . . . . . . . . . . . . . 214 14.3 O espaço tangente e a dimensão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217 14.4 Subvariedades definidas implicitamente . . . . . . . . . . . . . . . . . . . . . . . . . . 219 14.4.1 Exemplos de subvariedades definidas implicitamente . . . . . . . . . . . . . 220 14.4.2 Um resultado intermediário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221 14.4.3 Prova do Teorema 14.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 14.5 Trocas de cartas, funções diferenciáveis e estrutura intrı́nseca . . . . . . . . . . . . . 224 14.5.1 Trocas de cartas são difeomorfismos . . . . . . . . . . . . . . . . . . . . . . . . 225 6 IV EDOs: unicidade e dependência suave das condições iniciais 227 15 Existência e unicidade para certas EDOs 229 15.1 Existência e unicidade globais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229 15.2 Existência e unicidade locais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231 15.3 Diferenciabilidade local - esboço . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232 15.4 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232 V Mais sobre espaços de funções contı́nuas 235 16 Sequências e séries de funções 237 16.1 Séries de funções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237 16.1.1 Somando séries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237 16.1.2 Tomando derivadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239 16.2 Mais exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240 16.3 O método de Euler e a existência de soluções para EDOs . . . . . . . . . . . . . . . . 241 16.3.1 Localização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242 16.3.2 A aproximação de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242 16.3.3 O problema em forma integral . . . . . . . . . . . . . . . . . . . . . . . . . . . 243 16.3.4 Aproximações de Euler são pontos quase-fixos . . . . . . . . . . . . . . . . . 244 16.3.5 Fim da demonstração . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 17 Subconjuntos densos de C(K, R): o teorema de Stone-Weierstrass 247 17.1 O teorema geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248 17.1.1 Prova do teorema de Stone-Weierstrass . . . . . . . . . . . . . . . . . . . . . . 249 17.1.2 Prova do Lema Fundamental . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252 18 Restos das versões anteriores 257 18.1 Conjuntos conexos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257 18.1.1 Conexidade e funções contı́nuas . . . . . . . . . . . . . . . . . . . . . . . . . . 258 18.1.2 Os conjuntos conexos de R são os intervalos . . . . . . . . . . . . . . . . . . . 259 18.1.3 Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260 7 8Parte I Os objetos fundamentais 9 Capı́tulo 1 Prólogo Nota de 05/03/2021: este capı́tulo não foi revisto. O objetivo deste curso será começar um estudo de Análise em espaços vetoriais e (de forma mais geral) em espaços métricos. Por um lado, estes dois conceitos generalizam a reta real R. Por outro, fazer Análise nestes espaços requer contas e resultados vindos do mundo unidimensional da reta real. Portanto, há dois pré-requisitos fundamentais para nosso curso: um bom curso de Análise na Reta e um conhecimento operacional de Álgebra Linear. É possı́vel que alguns alunos sobrevivam sem um dos pré-requisitos, mas será basicamente por conta própria: não poderemos parar por muito tempo para rever estes dois assuntos. Nesta seção recordaremos alguns fatos e resultados importantes para tudo que vem a seguir. 1.1 Fatos sobre R Toda a Análise que estudaremos neste curso é baseada no que você já sabe (ou deveria saber) sobre a reta real. Nesta seção recordamos alguns fatos e resultados lá de Análise na Reta. 1.1.1 Intervalos Lembre-se que um intervalo I ⊂ R é um conjunto da forma [a, b), (a, b], (a, b) ou [a, b] com a, b ∈ R ∪ {±∞}. Por convenção, o intervalo é vazio se a > b; além disso, só permitimos a, b = ±∞ quando a extremidade correspondente do intervalo for aberta. Chamamos I de intervalo compacto se a, b 6= ±∞ e as suas duas extremidades são fechadas. Usaremos a notação R+ := [0, ∞). Usaremos muitas vezes o resultado a seguir. Exercı́cio 1.1 Um subconjunto S ⊂ R da reta é um intervalo se e somente se satisfaz a seguinte proprie- dade: ∀x, y ∈ S : (x, y) ⊂ S. 1.1.2 Limites e convergência de sequências Uma sequência de números reais {xn}n∈N ⊂ R converge a x ∈ R – ou xn → x, ou x = limn∈N xn – se, dado qualquer ε > 0, podemos encontrar um n0 ∈ N tal que, para qualquer n ∈ N com 11 n ≥ n0, temos |x− xn| < ε. Simbolicamente, podemos escrever isto da seguinte forma “x = lim n∈N xn” := “∀ε ∈ R+∃n0 ∈N∀n ∈N : n ≥ n0 ⇒ |x− xn| < ε.” É um exercı́cio conhecido mostrar que a definição não se altera quando trocamos |x− xn| < ε por |x − xn| ≤ ε acima. Um outro resultado conhecido (que não vamos provar aqui) é que R é completo. Isto é, uma sequência em R é convergente se e somente se é Cauchy, o que quer dizer: ∀ε ∈ R+∃n0 ∈N∀n, m ∈N : n, m ≥ n0 ⇒ |xm − xn| < ε. Dado um subconjunto infinito N ⊂ N, N = {n1 < n2 < n3 < n4 < . . . }, a subsequência {xn}n∈N é (por definição) igual à sequência {yk}k∈N dada por yk := xnk , k ∈ N. Podemos então falar do limite limn∈N xn := limk∈N yk. Pode-se mostrar que “x = lim n∈N xn” := “∀ε ∈ R+∃n0 ∈ N∀n ∈ N : n ≥ n0 ⇒ |x− xn| < ε.” Além disso, se uma sequência converge, toda subsequência sua converge ao mesmo limite. Nada impede, aliás, de tomarmos subsequências de subsequências, como faremos algumas vezes abaixo. Uma propriedade importante dos intervalos compactos I 6= ∅ é que toda sequência em I possui uma subsequência convergindo a um ponto de I. 1.1.3 Limites superior e inferior Podemos falar também dos limites superior e inferior de uma sequência {xn}n∈N ⊂ R. lim sup n∈N xn := inf n∈N sup m∈N,m≥n xn ∈ R∪ {+∞}. lim inf n∈N xn := sup n∈N inf m∈N,m≥n xn ∈ R∪ {−∞}. temos lim inf xn ≤ lim sup xn, com igualdade se e somente se ∃ limn xn. 1.1.4 Limites e convergência de séries Dados números a1, a2, . . . , an, · · · ∈ R, dizemos que a série ∑n an converge se existe limn→+∞ ∑nj=0 aj. Caso ∑n |an| convirja, dizemos que ∑n an é absolutamente convergente. Pode-se provar que, a con- vergência absoluta implica convergência usual. No entanto, a recı́proca não vale. As condições lim supn |an+1|/|an| < 1 e lim supn |an|1/n < 1 são suficientes para garantir que ∑n∈N an é absolutamente convergente. De fato, nos dois casos a prova da convergência absoluta se baseia em progressões geométricas, ou seja, no fato que: ∀ρ ∈ R+, ∞ ∑ n=0 ρn = { 1 1−ρ , 0 ≤ ρ < 1; +∞, ρ ≥ 1. O critério de Leibniz diz que uma série do tipo ∑ n∈N (−1)n xn, com cada xn ∈ R+, 12 converge se e somente se xn → 0. De modo geral, o fato de que ∑n an converge implica que an → 0, mas a recı́proca não vale. Se ∑n∈N an e ∑n∈N bn são absolutamente convergentes, o mesmo vale para ∑n∈N(an + bn) e além disso: ∑ n∈N (an + bn) = ∑ n∈N an + ∑ n∈N bn. Vamos utilizar algumas vezes o lema a seguir. Lema 1.1 Suponha que ∑n∈N an e ∑n∈N bn são absolutamente convergentes. Então ∑n∈N (∑ n i=0 aibn−i) também é absolutamente convergente e vale a identidade: ∑ n∈N ( n ∑ i=0 aibn−i ) = ( ∑ n∈N an ) ( ∑ n∈N bn ) . Prova: Definimos para cada k ∈N Pk := ( ∑ i≤k ai ) ( ∑ j≤k bj ) ; Hk := k ∑ n=0 ( n ∑ i=0 aibn−i ) = k ∑ s=0 ( s ∑ i=0 ai bs−i ) . Por hipótese, sabemos que limk Pk = (∑n∈N an) (∑n∈N bn). Além disso, as duas séries neste produto são convergentes. Podemos ainda observar que as duas somas se parecem, no seguinte sentido: Pk = 2k ∑ s=0 ( ∑ 0≤i,j≤k : i+j=s ai bj ) = 2k ∑ s=0 ( s ∑ i=0 ai bs−iξi,s,k ) , onde ξi,s,k = { 1 se i ≤ k e s− i ≤ k; 0 em caso contrário. Começamos a prova com um caso particular do teorema. Passo 1: se os ai e bj são não-negativos, então vale o teorema. Note que, neste caso, {Hk}k∈N é uma sequência de somas parciais de uma série com termos não-negativos. Se provarmos que ela converge a (∑n∈N an) (∑n∈N bn), garantimos automatica- mente que a série limk Hk converge absolutamente. Basta, portanto, provar que limk Hk = limk Pk. Para fazer isto, observe primeiramente que todos os termos da soma que define H2k, que é H2k = 2k ∑ s=0 ( s ∑ i=0 ai bs−i ) 13 aparecem na soma Pk multiplicados por ξi,s,k ∈ {0, 1}. Ou seja, Pk é a soma de alguns termos que aparecem em H2k. Como todos estes termos são não-negativos, concluı́mos que Pk ≤ H2k. (Se o leitor preferir, pode fazer um argumento mais algébrico: H2k − Pk = 2k ∑ s=0 ( s ∑ i=0 ai bs−i(1− ξi,s,k) ) ≥ 0 porque todas as quantidades do lado direito são não-negativas.) Por outro lado, se s ≤ k e i ≤ s, ξi,s,k = 1 sempre. Segue que a soma que define Pk contem todos os termos com ai bs−i com 0 ≤ i ≤ s ≤ k, além de alguns outros que são não-negativos. Concluı́mos que Pk ≥ k ∑ s=0 ( s ∑ i=0 ai bs−i ) = Hk e portanto Hk ≤ Pk ≤ H2k para todo k ∈N. Note agora que Pk converge a (∑n∈N an) (∑n∈N bn). Além disso, como os ai e bj são todos ≥ 0, {Hk}k∈N é crescente. Concluı́mos que Hk é limitada, portanto converge a um limite. Como {H2k}k∈N é uma subsequência de {Hk}k∈N, ela converge ao mesmo limite que a sequência inteira. Deduzimos: lim k Hk ≤ lim k Pk = ( ∑ n∈N an ) ( ∑ n∈N bn ) ≤ lim k H2k = lim k Hk, ou seja, lim k Hk = ( ∑ n∈N an ) ( ∑ n∈N bn ) . Isto conclui o Passo 1. Passo 2: estendendo a prova para ai e bj gerais. Até agora trabalhamos supondo que ai, bj ≥ 0. Vamos agora ver o que acontece no caso geral. Usando o Passo 1, vemos que ∑ n∈N ( n ∑ i=0 |ai| |bn−i| ) = ( ∑ n∈N |an| ) ( ∑ n∈N |bn| ) < +∞, (1.1) já que, por hipótese, as séries ∑n an e ∑n bn são absolutamente convergentes. Concluı́mos que também vale ∑ n∈N ∣∣∣∣∣ ( n ∑ i=0 aibn−i )∣∣∣∣∣ ≤ ∑n∈N ( n ∑ i=0 |ai||bn−i| ) = ( ∑ n∈N |an| ) ( ∑ n∈N |bn| ) < +∞. 14 Portanto, {Hk}k converge absolutamente. Por outro lado, seguindo o raciocı́nio de antes, |Pk − H2k| = ∣∣∣∣∣ 2k∑s=0 ( s ∑ i=0 ai bs−i(ξi,s,k − 1) )∣∣∣∣∣ ≤ 2k ∑ s=0 ( s ∑ i=0 |ai| |bs−i||ξi,s,k − 1| ) (|1− ξi,s,k| ≤ 1 e vale 0 se s ≤ k) ≤ 2k ∑ s=k+1 ( s ∑ i=0 |ai| |bs−i| ) ≤ ∞ ∑ s=k+1 ( s ∑ i=0 |ai| |bs−i| ) O último termo acima é a cauda da série ∑n (∑ s i=0 |ai| |bs−i|), que aparece do lado esquerdo de (1.1). Como esta série converge, sua cauda vai a 0 e concluı́mos |Pk − Hk| → 0. Portanto, lim k Hk = lim k H2k = lim k Pk = ( ∑ n an ) ( ∑ m bm ) . 2 1.1.5 Limites de funções, continuidade, máximos e mı́nimos Dado um intervalo I, uma função f : I → R e um ponto x ∈ R que é limite de pelo menos uma sequência em I, dizemos quelim y→x f (y) = a se para qualquer sequência {yn}n∈N ⊂ I\{x} com yn → x temos também f (yn) → a. Dizemos que f é contı́nua em x ∈ I se limy→x f (y) = f (x). Se I é compacto, toda função contı́nua tem duas propriedades adicionais automaticamente. A primeira é que ela atinge seus supremo e ı́nfimo: isto é, ∃xmin, xmax ∈ I ∀x ∈ I : f (xmin) ≤ f (x) ≤ f (xmax). Em particular, f é limitada. A segunda propriedade que temos sobre intervalos compactos é que f é limitada. Isto quer dizer que, se definimos o módulo de continuidade de f : m f (δ) := sup{| f (x)− f (y)| : x, y ∈ I, |x− y| ≤ δ} (δ ∈ R+), então m f (δ)→ 0 quando δ→ 0. Exercı́cio 1.2 Dê exemplos de funções contı́nuas sobre I aberto que não são limitadas ou uniformemente contı́nuas. 15 1.1.6 Derivadas e integrais Dados um intervalo I, pontos a, b ∈ I com a < b (e portanto [a, b] ⊂ I) e f : I → R, dizemos que f é diferenciável em x ∈ I se ∃ f ′(x) := lim y→x f (y)− f (x) y− x . O Teorema Fundamental do Cálculo nos diz que a derivada é a basicamente a operação inversa da Integral definida: I( f )(x) := ∫ x a f (t) dt = lim n→+∞ x− a n n−1 ∑ i=0 f ( a + i (x− a) n ) . Ou seja, I( f ′)(t) = f (x)− f (a) e I(g)′(x) = g(x). Recordamos ainda que toda função diferenciável é contı́nua. 1.2 Algumas funções especiais Neste capı́tulo recordamos alguns resultados fundamentais sobre quatro funções especiais: ex- ponencial, logaritmo, seno e cosseno. A ideia é provar algumas propriedades destas funções diretamente, sem recorrer à teoria de diferenciação de séries de potência. 1.2.1 A função exponencial Definimos a função exponencial através da série de potência usual. exp(t) := +∞ ∑ n=0 tn n! , t ∈ R. (1.2) Note que a definição acima faz sentido porque a série converge absolutamente para qualquer t ∈ R. Pode-se verificar isto a partir do teste da razão: |t|n+1/(n + 1)! |t|n/n! = |t| n + 1 → 0 quando n→ +∞. Vemos ainda que exp(0) = 1. Proposição 1.1 (Adição e produto) Dados quaisquer t, s ∈ R, exp(t + s) = exp(t) exp(s). Prova: Recorde a fórmula binomial: (t + s)n = n ∑ i=0 ( n i ) tisn−i, onde ( n i ) = n! i! (n− i)! . Aplicando a fórmula termo a termo na série de exp(t + s), descobrimos que exp(t + s) := +∞ ∑ n=0 (t + s)n n! = ∞ ∑ n=0 ( n ∑ i=0 ti i! tn−i (n− i)! ) . 16 Observe que isto tem a forma ∞ ∑ n=0 ( n ∑ i=0 ai bn−i ) , onde an = tn/n! e bn = sn/n! para cada n ∈N. Como ∑n tn/n! converge absolutamente a exp(t), e analogamente para exp(s), deduzimos do Lema 1.1 que: exp(t + s) = ( ∑ n an ) ( ∑ n bn ) = exp(t) exp(s). 2 Proposição 1.2 exp′(t) = exp(t) para cada t ∈ R. Prova: Queremos mostrar que Queremos: exp(t + h)− exp(t) h → exp(t) quando h→ 0. Usando o fato que exp(t + h) = exp(t) exp(h), observamos que o que queremos equivale a: Queremos (equivalente): (exp(h)− 1) exp(t) h → exp(t) para todo t, e para isto basta provar que Basta: exp(h)− 1 h → 1. Para tal, observe que exp(h)− 1 = ∞ ∑ n=1 hn n! = h + R(h) com R(h) = ∑ n≥2 hn n! . Como n! ≥ 1 sempre, podemos comparar a série de R(h) termo a termo com a série geométrica: ∀|h| ≤ 1/2 : |R(h)| ≤ ∑ n≥2 |h|n n! ≤ ∑ n≥2 |h|n = |h| 2 1− |h| . Em particular, isto quer dizer que ∀|h| ≤ 1/2 ∣∣∣∣exp(h)− 1h − 1 ∣∣∣∣ = |R(h)||h| ≤ |h|1− |h| . Como o lado direito desta desigualdade tende a 0 quando h → 0, deduzimos que |(exp(h) − 1)/h− 1| → 0, o que encerra a prova. 2 17 Proposição 1.3 exp(t) > 0 para todo t ∈ R. Prova: Como exp é diferenciável, ela é contı́nua em todo R, em particular ao redor de t = 0. Como exp(0) = 1, sabemos que existe um ε > 0 tal que exp(a) > 1/2 sempre que |a| < ε. Por outro lado, dado t ∈ R qualquer, podemos encontrar um n ∈ N tal que |t/n| < ε, de modo que exp(t/n) > 1/2. Desta forma, podemos aplicar a regra de “adição vira produto” para deduzir que exp(t) = exp ( n t n ) = [ exp ( t n )]n > 1 2n > 0. 2 Proposição 1.4 exp é estritamente crescente. Além disso, limt→+∞ exp(t) = +∞ e limt→+∞ exp(−t) = 0. Prova: As duas proposições anteriores implicam que exp tem derivada estritamente positiva em todo ponto da reta. Portanto, exp é estritamente crescente. Em particular, isto quer dizer que há um a > 0 com exp(a) = m > 1 = exp(0). Usando o raciocı́nio da proposição anterior, vemos que exp(na) ≥ mn → +∞ quando n→ +∞, já que m > 1. Em particular, dado M > 0 existe um t ∈ R como exp(t) > M. Como exp é crescente, isto implica que exp(t)→ +∞ quando t→ +∞. Por outro lado, a regra de que adição vira produto implica que exp(−t) = 1 exp(t) → 0 quando t→ +∞. 2 Proposição 1.5 exp(R) = R+\{0} Além disso, exp é uma bijeção entre domı́nio e imagem. Prova: Já vimos que exp(t) ∈ R+\{0} para todo t. Resta mostrar que, dado x ∈ R+\{0}, existe um único t com exp(t) = x. Veja que a unicidade segue do fato que exp é estritamente crescente. Para provar existência, observe que, pela proposição anterior, certamente existem t−, t+ com exp(t−) ≤ x ≤ exp(t+) (e necessariamente t− ≤ t+, posto que exp é estritamente crescente). Como exp é diferenciável, ela é contı́nua e o Teorema do Valor Intermediário nos diz que existe um t ∈ [t−.t+] com exp(t) = x. 2 1.2.2 A função logaritmo Como exp : R → R+\{0} é uma bijeção estritamente crescente, ela tem uma função inversa log : R+\{0} → R que também é uma bijeção estritamente crescente. Como a exponencial transforma soma em produto, esta função, chamada de logaritmo, deve fazer o contrário. Proposição 1.6 (Prova omitida) log(xy) = log x + log y para quaisquer x, y > 0. Da mesma forma, como exp(t)→ +∞ e exp(−t)→ 0 quando t cresce, podemos provar que: 18 Proposição 1.7 (Prova omitida) log(x)→ −∞ se x→ 0 e log(x)→ +∞ se x→ +∞. Agora calcularemos a derivada do logaritmo, provando, em particular, que ela existe. Proposição 1.8 log′(x) = 1/x para qualquer x > 0. Prova: Fixo x > 0, devemos provar que Queremos: lim h→0 log(x + h)− log x h = 1 x . Para isso, vamos fixar uma sequência {hn}n∈N com hn → 0 e min{hn, x + hn} > 0 para todo n. Nosso objetivo é provar que, não importando qual sequência deste tipo escolhemos, Queremos (equivalente): lim h→0 log(x + hn)− log x hn = 1 x . Tome então t com exp(t) = x e tn com exp(tn) = x + hn para cada n ∈ N. Afirmamos que, obrigatoriamente, tn → t. Note que isto quer dizer que: lim n→+∞ log(x + hn)− log x hn = lim n→+∞ tn − t exp(tn)− exp(t) = 1 exp(t) 1 x . Portanto, se provarmos a afirmação, teremos encerrado a prova. Para provar a afirmação, recorde que exp(tn) = x + hn → x = exp(t). Tome ε > 0 e defina a+ := exp(t + ε), a− := exp(t − ε). Como exp é estritamente crescente, a− < exp(t) < a+, portanto exp(tn) ∈ (a−, a+) para todo n suficientemente grande. Usando novamente o fato que exp é estritamente crescente, deduzimos que tε < tn < t + ε para todo n suficientemente grande. Como ε é arbitrário, isto implica tn → t. 2 Observação 1.1 A mesma prova acima mostra que, se f é contı́nua e estritamente crescente, então sua inversa tem as mesmas propriedades. 1.2.3 As funções seno e cosseno Definimos agora duas novas funções via séries de potência (para t ∈ R). cos(t) := +∞ ∑ n=0 (−1)n t 2n (2n)! sin(t) := +∞ ∑ n=1 (−1)n+1 t 2n+1 (2n + 1)! . Repare que os termos destas séries são termos da série da exponencial, agora multiplicados por sinais alternados. Podemos portanto usar uma comparação com a série da exponencial para provar que as duas séries convergem. Proposição 1.9 cos(t+ s) = cos(t) cos(s)− sin(t) sin(s) e sin(t+ s) = sin(t) cos(s)+ cos(t) cos(s) para todos t, s ∈ R. 19 Prova: Provaremos apenas a primeira identidade, já que a segunda é similar. Usando um argumento parecido com a fórmula da exponencial: cos(t + s) = +∞ ∑ n=0 (−1)n (t + s) 2n (2n)! = +∞ ∑ n=0 (−1)n ( 2n ∑ i=0 ti i! s2n−i (2n− i)! ) Em cada somatório interno podemos dividir os ı́ndices i entre os da forma 2j (com 0 ≤ j ≤ n) e os da forma 2k+ 1 (com 0 ≤ k ≤ n− 1). Temos, então (−1)n 2n ∑ i=0 ti i! s2n−i (2n− i)! = n ∑ j=0 (−1)j t2j (2j)! (−1)n−j s2(n−j) (2(n− j))! + n−1 ∑ k=0 (−1)k t2k+1 (2k + 1)! (−1)n−k s2(n−k)+1 (2n− 2k + 1)! . Deduzimos que cos(t + s) é igual a: +∞ ∑ n=0 ( n ∑ j=0 (−1)j t2j (2j)! (−1)n−js2(n−j) (2(n− j))! + n−1 ∑ k=0 (−1)k t2k+1 (2k + 1)! (−1)n−k s2(n−k)+1 (2n− 2k + 1)! ) . Usando o Lema 1.1, podemos reconhecer os seguintes termos acima: ∞ ∑ n=0 ( n ∑ j=0 (−1)j t2j (2j)! (−1)n−js2(n−j) (2(n− j))! ) = cos(t) cos(s) e ∞ ∑ n=0 ( n−1 ∑ k=0 (−1)k t2k+1 (2k + 1)! (−1)n−k s2(n−k)−1 (2n− 2k− 1)! ) = − sin(s) sin(s), com convergência uniforme em ambos os casos. Como a soma destas séries para cos(t) cos(s) e − sin(t) sin(s) é a série de cos(t + s), temos a identidade desejada. 2 Proposição 1.10 cos′(t) = − sin(t) e sin′(t) = cos(t). Prova: Apenas esboçaremos a prova do primeiro fato acima, já que a segunda é similar. Veja que, dado h 6= 0, podemos utilizar a identidade das somas acima para escrever cos(t + h)− cos(t) h = ( cos(h)− 1 h ) cos(t)− sin h h sin t. Seguindo a conta que fizemos para a exponencial, podemos mostrar que sin h/h → 1 (cos h− 1)/h→ 1: basta separar sin h = h + resto da ordem |h|3 e cos h = 1 + resto da ordem |h|2. 2 20 Proposição 1.11 sin2(t) + cos2(t) = 1 para todo t ∈ R. Prova: Isto vale se t = 0 por inspeção. Além disso, sin2(t) + cos2(t) é constante: (sin2(t) + cos2(t))′ = 2 sin(t) sin′(t)− 2 cos(t) cos′(t) = 0. 2 Proposição 1.12 Dados t, s ∈ R (cos t, sin t) = (cos s, sin s), implica cos(t− s) = 1, sin(t− s) = 0. Prova: Pelas fórmulas para senos e cossenos de t + s cos t = cos s⇒ cos t = cos s cos(t− s)− sin(t− s) sin s. sin t = sin s⇒ sin t = sin s cos(t− s) + sin(t− s) cos s. Escrevendo a := cos t = cos s, b := sin t = sin s, x = cos(t− s), y = sin(t− s), temos que{ a x− b y = a b x + a y = b Se a b 6= 0, o sistema acima tem como única solução x = 1, y = 0. Se a = 0, então b 6= 0 (já que a2 + b2 = 1) e chegamos à mesma conclusão que x = 1, y = 0. O mesmo vale ainda se b = 0 (e portanto a = 1). 2 Proposição 1.13 Existe um p > 0 tal que cos p = 0 e cos t > 0 para t ∈ [0, p). Temos também sin t = p e 0 < sin t < 1 para t ∈ [0, p) (No que segue, π := 2p). Prova: Por um lado, cos 0 = 1. Por outro lado, temos: cos 2 = 1− 2 2 2! + 24 4! − 2 6 6! + · · ·+ 2 4n (4n)! − 2 4n+2 (4n + 2)! + . . . . Como 1− 222! = 0 e 24n (4n)! < 24n+2 (4n+2)! para n ≥ 1, temos que cos 2 < 0. Isto é, cos 0 > 0 > cos 2. O cosseno é diferenciável e portanto contı́nuo; isto nos permite aplicar o Teorema do Valor Intermediário para provar que existe um x ∈ (0, 2) com cos x = 0. Definimos então p := inf{x ∈ (0,+∞) : cos x = 0}. Note que p ≥ 0 está bem definido porque cos x = 0 para ao menos um x e o conjunto de x considerados é limitado por baixo. Veja ainda que, como p = limn xn para alguma sequência {xn}n com cos xn = 0, temos cos p = 0 e portanto p > 0. Mais ainda, não pode ser verdade que cos t = 0 para 0 ≤ t < p e isto quer dizer que cos t não pode trocar de sinal neste intervalo. Ou seja cos t > 0 para 0 ≤ t < p. Para terminar, observe que para 0 ≤ t < p, sin t é crescente (já que sua derivada é cos t), portanto 0 < sin t < 1. Em particular, como sin é contı́nuo, sin p > 0. Como cos p = 0 e portanto sin2 p = 1, concluı́mos que sin p = 1. 2 21 Proposição 1.14 cos(t + p) = − sin(t) e sin(t + p) = cos t para todo t ∈ R. Portanto, os únicos pontos onde cos t = 0 ou sin t = 0 são os múltiplos de p. Prova: A primeira afirmação segue das fórmulas para cos(t + s) e sin(t + s) aplicadas a s := p. Para a segunda, veja que podemos escrever qualquer t ∈ R na forma t = ±p n + a com 0 ≤ a < p e n ∈ N. Usando indução em n, podemos provar a partir da primeira parte que cos(±np + a) ∈ {± cos a,± sin a} para qualquer n ∈N. Deduzimos que cos t = 0⇔ cos a = 0 ou sin a = 0⇔ a ∈ {0, p} (pois a ∈ [0, p)) . Portanto t = np ou t = (n + 1) p. O mesmo vale se sin t = 0. 2 Proposição 1.15 (cos t, sin t) = (cos s, sin s) se e somente se t− s é múltiplo inteiro de 2π. Prova: A hipótese equivale a cos(t− s) = 1, sin(t− s) = 0. Pela proposição anterior, é necessário que t− s = np seja múltiplo de p, com cos(np) = 1. No entanto, é fácil ver usando a proposição anterior que cos(0) = 1, cos(±p) = 0, cos(±2p) = −1, cos(±3p) = 0, cos(±4p) = 1, cos(±5p) = 0, cos(±6p) = −1, cos(±7p) = 0, cos(±8p) = 1, cos(±9p) = 0, cos(±10p) = −1, cos(±11p) = 0 . . . Portanto, para qualquer n ∈ Z cos(np) = 1 se e somente se n é divisı́vel por 4. 2 Proposição 1.16 A aplicação “t 7→ (cos t, sin t)” é uma bijeção entre [0, 2π) e o cı́rculo unitário: S1 := {(x, y) ∈ R2 : x2 + y2 = 1}. Prova: Como cos2 t + sin2 t = 1, todo t é levado em S1. Além disso, a aplicação é injetiva para t ∈ [0, 2π) pela proposição anterior. Para provar a sobrejetividade, fixamos (x, y) ∈ S1 para mostrar que existe um t0 ∈ [0, π/2] e um m ∈ {0, 1, 2, 3} tal que Queremos: (x, y) = (cos(t0 + mπ/2), sin(t0 + mπ/2)). Verificamos que, como cos 0 = 1, cos(π/2) = 0 e cos é contı́nuo, existe um tx ∈ [0, π/2] com cos tx = |x| e portanto sin tx = |y| (já que y2 = 1− x2 = 1− cos2 t e sin t ≥ 0 para t ∈ [0, π/2]). Do mesmo modo, há um ty ∈ [0, π/2] com cos ty = |y| e sin ty = |x|. Portanto, temos o seguinte: 1. Se x ≥ 0, y ≥ 0, (x, y) = (cos tx, sin tx). 2. Se x < 0, y ≥ 0, observamos que (x, y) = (− sin ty, cos ty) = (cos(ty + π/2), sin(ty + π/2)). 3. Se x ≤ 0, y ≤ 0, (x, y) = (cos(tx + π), sin(tx + π)). 4. Se x > 0, y ≤ 0, observamos que (x, y) = (sin ty,− cos ty) = (cos(ty + 3π/2), sin(ty + 3π/2)). Portanto, provamos o que querı́amos em todos os quatro casos. 2 22 1.3 A desigualdade das médias Encerramos este capı́tulo provando a conhecida desigualdade entre as médias aritmética e geométrica. Teorema 1.1 (Desigualdade das médias aritmética e geométrica) Sejam α1, . . . , αk números positi- vos com soma 1. Dados t1, . . . , tk ∈ R+, temos a desigualdade: k ∏ i=1 tαii ≤ k ∑ i=1 αi ti. Além disso, vale igualdade se e somente se t1 = t2 = · · · = tk. Prova: O passo fundamental neste resultado é estabelecer o resultado para k = 2 e depois gene- ralizá-lo por indução. Fixemos então k = 2. Para facilitar um pouco a notação, definimos x := tα11 , y = t α2 2 , p = 1/α1, q = 1/α2. Veja que x, y ≥ 0, p, q > 1 e (1/p) + (1/q) = 1. Desejamos provar que Queremos: ∀x, y ≥ 0 : xy ≤ x p p + yq q , com igualdade se e somente se xp = yq. Isto é trivial quando x = 0, logo vamos supôr x > 0. O que queremos, então, é equivalente a provar que: Queremos (de forma equivalente): ∀x ∈ R+\{0} : sup y∈R+ ( xy− y q q ) = xp p , atingido só quando yq = xp. Para provar esta propriedade, fixe x ∈ R+\{0} e defina φx(y) := xy− yq/q, y ∈ R+. Recordando que q > 1, x > 0, vemos que φx é diferenciável e que φ′x(y) = x− yq−1 > 0 se y < x 1 q−1 ; = 0 se y = x 1 q−1 ; < 0 se y > x 1 q−1 . Segue que y∗ := x 1 q−1 é o único máximo global da função φx. Note ainda que, como (1/p) + (1/q) = 1, temos p = q/(q− 1) = 1 + 1/(q− 1), portanto y∗ é o único ponto com yq∗ = xp. Vamos calcular agora φx(y∗). A conta abaixo usa novamente o fato que p = q/(q − 1) = 1 + 1/(q− 1): φx(y∗) = x 1+ 1q−1 − x q q−1 q = xp − x p q = xp p . O que deduzimos então é o seguinte: 1. Como y∗ é máximo global de φx, vale que, para qualquer y ∈ R+, φx(y) = xy− yq q ≤ φx(y∗) = xp p . 2. Além disso, apenas y∗, que satisfaz y q ∗ = xp, atinge este máximo global. 23 Isto era exatamente o que querı́amos provar e encerra a demonstração para k = 2. Vejamos agora a prova para k > 2. A ideia é fazer indução forte em k tomando k = 2 como base. Se k > 2, defina novos expoentes βi := αi 1− αk i = 1, 2, . . . , k− 1. Observe que k ∏ i=1 tαii = T 1−αk tαkk , (1.3) onde (por hipótese de indução) T := k−1 ∏ i=1 tβii ≤ S := k−1 ∑ i=1 βi ti = ∑k−1i=1 αi ti 1− αk , com igualdade se e somente se t1 = · ·· = tk−1 Aplicando o caso k = 2 a (1.3), temos k ∏ i=1 tαii ≤ (1− αk) T + αk tk ≤ (1− αk) S + αk tk = k ∑ i=1 αi ti. Além disso, a igualdade só vale se T = S – e portanto T = t1 = t2 = · · · = tk−1 – e além disso tk = T. Portanto, para que a igualdade valha, é necessário que t1 = · · · = tk. 2 Exercı́cio 1.3 Sejam 1 < p, q < +∞ com (1/p) + (1/q) = 1. Mostre que para quaisquer x, y ∈ R, xy ≤ |x| p p + |y|q q com igualdade se e somente valem seguintes condições: • |x|p = |y|q; • ou x = y = 0, ou x 6= 0 6= y e os sinais de x e y coincidem. Exercı́cio 1.4 Sejam 1 < p, q < +∞ com (1/p) + (1/q) = 1. Mostre que para quaisquer x, y ∈ R e λ > 0, xy ≤ |x| p p λp + λq|y|q q . Além disso, se x, y ∈ R+, existe uma escolha de λ tal que |xy| = |x| p p λp + λq |y|q q . 1.4 Mais um fato útil 24 Capı́tulo 2 Espaços vetoriais e normas O principal objetivo deste curso é estender a Análise que aprendemos na reta a espaços mais gerais: os chamados espaços métricos. Antes de defini-los, vamos começar com a classe mais restrita, mas muito importante, de espaços vetoriais normados. Aqui já veremos alguns dos desafios de levar a Análise a uma dimensão mais alta. 2.1 Um caso concreto: o espaço Rd Começamos de forma ainda mais particular pelo espaço vetorial que todo mundo conhece (ou deveria conhecer): o espaço euclideano real de d dimensões. Dado d ∈N\{0}, definimos Rd como um produto cartesiano: Rd := R×R× · · · ×R︸ ︷︷ ︸ d vezes . Os elementos x ∈ Rd são d-tuplas de números reais, x = (x[i])di=1. Os números x[1], . . . , x[d] ∈ R são chamados de coordenadas de x. Esta notação que usamos para as coordenadas é inspirada pelo MatLab! É bom especificar logo de cara d + 1 vetores especiais em Rd: • O vetor nulo 0Rd cujas coordenadas são 0Rd [i] = 0, i = 1, . . . , d. • Os vetores ej, 1 ≤ j ≤ d, da base canônica de Rd cujas coordenadas são ej[i] = { 1, i = j; 0, i 6= j; 1 ≤ i, j ≤ d. 2.1.1 Operações em Rd e suas propriedades Há duas operações fundamentais em Rd: 1. Soma (e diferença): dados x, y ∈ Rd, x± y ∈ Rd é o vetor cujas coordenadas são (x± y)[i] = x[i]± y[i], 1 ≤ i ≤ d. 2. Multiplicação por escalar: dados x ∈ Rd e λ ∈ R λ x ∈ Rd é o vetor cujas coordenadas são (λ x)[i] = λ x[i], 1 ≤ i ≤ d. 25 Não é difı́cil verificar as seguintes propriedades: • 0 é o elemento neutro da soma: para todos x, y ∈ Rd, x + y = x se e somente se y = 0. • 0 x = 0 para todo x ∈ Rd. • 1 é o elemento neutro da multiplicação por escalar: para todos x ∈ Rd, λ ∈ R, λ x = x se e somente se x = 0 e/ou λ = 1. • As operações são todas associativas. A soma é comutativa também. • A multiplicação por escalar é distributiva das duas maneiras pssı́veis: se λ, η ∈ R, x, y ∈ Rd: (λ + η) x = λ x + η x e λ (x + y) = λ x + λ y. Exercı́cio 2.1 Prove que: ∀x ∈ Rd : x = d ∑ i=1 x[i] ei. 2.1.2 Produto interno e a norma euclideana em Rd Grosso modo, uma norma em Rd é uma maneira de medir a distância desde 0 até os demais pontos de Rd. Desta forma, os axiomas a seguir são naturais. Definição 2.1 Uma norma sobre Rd é uma função ‖ · ‖ : Rd → R com as seguintes propriedades: • A norma é positiva definida, isto é, para todo x ∈ Rd, ‖x‖ ≥ 0, e ‖x‖ = 0 se e somente se x = 0. • A norma é homogênea positiva, isto é, para quaisquer λ ∈ R, x ∈ Rd, ‖λ x‖ = |λ| ‖x‖. • A norma é sub-aditiva, isto é, para quaisquer x, y ∈ Rd, ‖x + y‖ ≤ ‖x‖+ ‖y‖. Como podemos definir uma norma em Rd? Quase todos já sabemos que a norma euclideana serve: |x|2 := √√√√ d∑ i=1 (x[i])2 (x ∈ Rd). Essa é a noção de “tamanho de um vetor” que aprendemos desde cedo nos cursos de Álgebra Linear ou Geometria Analı́tica. A pergunta, no entanto, é a seguinte: como podemos provar que esta norma euclideana é mesmo uma norma? Provar que a norma é positiva definida é simples. Primeiro, observamos que |x|2 é bem definida porque |x|22 é uma soma de termos (x[i])2 não-negativos; logo, a raı́z quadrada desta quantidade é bem-definida e não-negativa. Além disso, |x|2 se anula se e somente se esta soma de termos não negativos se anula, o que só pode ocorrer se cada termo é nulo: x[i]2 = 0 para cada 1 ≤ i ≤ d, ou seja, x = 0Rd . Agora argumentamos a homogeneidade positiva: tomando x ∈ Rd e λ ∈ R, queremos de- monstrar que |λx|2 = |λ| |x|2. Para isso, para cada i = 1, 2, . . . , d, a i-ésima coordenada de λx é λx[i]. Como o quadrado de um produto é o produto dos quadrados, temos: |λx|22 = d ∑ i=1 (λx[i])2 = λ2 d ∑ i=1 x[i]2 = λ2 |x|22. 26 Lembramos agora que a raı́z quadrada de λ2 é |λ| (por definição). Como a raı́z de um produto é o produto das raı́zes, obtemos |λx|2 = |λ||x|2, como querı́amos demonstrar. Como último passo, precisamos provar que a norma euclideana é subaditiva. Em geral esta é a parte mais difı́cil de se provar que uma candidata a norma é mesmo norma. No caso que estamos analisando, faremos isso a partir das propriedades do produto interno que quase todos conhecem. Dados x, y ∈ Rd, definimos: x · y := d ∑ i=1 x[i] y[i] ∈ R. A relação entre norma euclideana e produto interno é que |x|22 = x · x. Nossa prova da subaditi- vidade da norma será baseada nas propriedades do produto interno listadas a seguir. Lema 2.1 (Propriedades básicas do produto interno) Dados x, x′ ∈ Rd: 1. Positividade: x · x ≥ 0, com igualdade se e somente se x = 0. 2. Simetria: x · x′ = x′ · x. 3. Linearidade: se λ ∈ R, a, b ∈ Rd e x = λa + b, então x′ · x = x · x′ = λ (a · x′) + (b · x′). Prova: A primeira propriedade é exatamente a mesma coisa que dizer que a norma euclideana é positiva definida, o que já provamos acima. A propriedade 2 é consequência do fato que x[i] x′[i] = x′[i] x[i] para cada coordenada i ∈ {1, . . . , d}, de modo que x · y = d ∑ i=1 x[i] x′[i] = d ∑ i=1 y[i] x[i] = x′ · x. A propriedade 3 vem do fato que, por definição das operações de Rd x = λa + b⇒ x[i] = λa[i] + b[i] de modo que, pelas distributividade e associatividade de R, x · x′ = d ∑ i=1 x[i] x′[i] = d ∑ i=1 (λ a[i] + b[i]) x′[i] = λ d ∑ i=1 a[i] x′[i] + d ∑ i=1 b[i] x′[i] = λ (a · x′) + (b · x′). 2 A subaditividade vai precisar de um passo a mais, derivado do último lema: a desigualdade de Cauchy-Schwartz. Teorema 2.1 (Desigualdade de Cauchy Schwartz) Para quaisquer x, y ∈ Rd, vale |x · y|2 ≤ |x|2 |y|2. A igualdade vale exatamente quando x = 0Rd ou y = 0Rr ou y/|y|2 = x/|x|2. 27 Prova: O teorema é trivialmente verdadeiro se x = 0Rd ou y = 0Rd . Podemos então supôr que nenhum dos dois vetores se anula. Neste caso, podemos considerar v := x/|x|2 e w := y/|y|2, notando que estes vetores têm norma 1. Pela linearidade do produto interno, x · y ≤ |x|2 |y|2 ⇔ v · w ≤ 1. Provaremos a seguir que v · w ≤ 1 com igualdade se e somente se v = w, o que claramente implica o teorema. Para provar que |v · w| ≤ 1, escrevemos: v · w = d ∑ i=1 v[i]w[i] ≤ d ∑ i=1 |v[i]w[i]| (2.1) (média geo. ≤ aritmética p/ cada termo) ≤ d ∑ i=1 |v[i]|2 + |w[i]|2 2 (2.2) (|v|2 = |w|2 = 1) = 1. Como podemos ter igualdade acima? Em primeiro lugar, (2.1) deve ser uma igualdade, o que acontece se e somente se todos os termos da soma forem maiores ou iguais a zero. Ou seja, queremos que v[i] e w[i] tenham o mesmo sinal para cada ı́ndice i. Em segundo lugar, precisamos de igualdade na aplicação da desigualdade das médias em (2.2), o que só ocorre quando |v[i]|2 = |w[i]|2 – ou seja, v[i] = ±w[i] – para cada i. Deduzimos que v · w = 1 se e somente se v = w, o que ocorre se e somente se y = |y|2x/|x|2. 2 Terminamos a seção usando Cauchy-Schwartz para provar que a norma é sub-aditiva. Teorema 2.2 Vale a identidade: ∀x ∈ Rd : |x|2 = max{x · z : z ∈ Rd, |z|2 = 1} Em particular, a norma euclideana é subaditiva (e portanto é mesmo uma norma). Prova: A igualdade vem de Cauchy-Schwartz. Temos x · z ≤ |x|2 para todo z de norma 1, com igualdade se e somente se x = 0Rd ou z = x/|x|2. Para a subaditividade, tome x e y em Rd. Dado qualquer z ∈ Rdde norma 1, z · (x + y) = z · x + z · y ≤ |x|2 + |y|2 (por Cauchy-Schwartz aplicada a z.x e z.y). Portanto, |x + y|2 = max{z · (x + y) : z ∈ Rd, |z|2 = 1} ≤ |x|2 + |y|2. 2 Observação 2.1 Um caminho ainda mais simples para provar a subaditividade é observar que, pela bili- nearidade do produto interno e Cauchy-Schwartz |x + y|22 = |x|22 + |y|22 + 2 x.y ≤ |x|22 + |y|22 + 2 |x|2|y|2 = (|x|2 + |y|2)2. Como a raı́z quadrada é uma função monótona, obtemos |x + y|2 ≤ |x|2 + |y|2. No entanto, a ideia contida no Teorema 2.2 de expressar a norma como máximo se aplica de forma ainda mais geral; veja os Exemplos 2.3 e 2.4 e o Exercı́cio 2.16. 28 2.2 Definições gerais 2.2.1 O que é um espaço vetorial? Acima vimos (ou recordamos a teoria básica do espaço Rd com sua norma mais básica e suas operações. Veremos ao longo do curso muitos outros espaços com estrutura semelhante. Definição 2.2 (Espaço vetorial) Chamamos de espaço vetorial sobre R um conjunto V 6= ∅ com operações de soma (v, w) ∈ V2 7→ v + w ∈ V e multiplicação por escalar (λ, v) ∈ R×V 7→ λ v ∈ V, além de um elemento distinguido 0 ∈ V, definidos de modo a satisfazer os axiomas a seguir: 1. Comutatividade e associatividade da soma: v + w = w + v e (v + w) + z = v + (w + z) para todos v, w, z ∈ V. 2. Associatividade do produto: para quaisquer λ, η ∈ R, v ∈ V, λ(ηv) = (λη) v. 3. Distributividade: para todos v, w ∈ V, λ, ξ ∈ R, (λ + ξ) (v + w) = λv + λw + ξv + ξw. 4. Elemento neutro: 0 + v = v para todo v ∈ V. 5. Multiplicação por 1 e 0: 1.v = v e 0.v = 0 para todo v ∈ V. O espaço Rd discutido acima é um espaço vetorial segundo esta definição. Note que d = 1 é uma escolha válida, ou seja: com as operações usuais, R é um espaço vetorial sobre R! Veremos agora mais dois exemplos. Exemplo 2.1 (Matrizes `× d) Sejam agora `, d ∈ N\{0}. Considere o conjunto R`×d de todas as matrizes com ` linhas, d colunas e entradas reais. Um elemento A deste espaço tem a seguinte “cara”. ` linhas A[1, 1] A[1, 2] . . . A[1, d] A[2, 1] A[2, 2] . . . A[2, d] . . . . . . A[`, 1] A[`, 2] . . . A[`, d] ︸ ︷︷ ︸ d colunas . Ou seja, as entradas (ou “coordenadas”) de uma matriz `× d são chamadas de A[i, j], com 1 ≤ i ≤ ` e 1 ≤ j ≤ d. Podemos definir a soma e subtração de matrizes, além do produto de uma matriz por escalar, fazendo tudo entrada a entrada. Como no caso de Rd, a estrutura resultante nos dá um espaço vetorial. Isso não chega a ser uma surpresa porque, afinal, uma matriz ` × d pode ser reescrita como um vetor de ` d números reais. No entanto, o fato que matrizes representam transformações lineares sugere maneiras diferentes de se medir os elementos de R`×d. O exemplo a seguir é um tanto quanto diferente. 29 Exemplo 2.2 (Funções contı́nuas) Dado um subconjunto I ⊂ R, I 6= ∅, considere o conjunto C(I, R) := { f : I → R : f contı́nua}. Este espaço tem uma estrutura natural de espaço vetorial. O elemento 0 é a função que se anula em todo ponto. A soma é exatamente a soma usual de funções, o que “funciona” porque a soma de funções contı́nuas é contı́nua. O produto por escalar consiste em tomar a função f e o escalar λ e definir uma nova função λ f que leva t ∈ I em λ f (t). É um exercı́cio mostrar que estas operações realmente satisfazem todos axiomas de espaço vetorial. Observação 2.2 (Vetores são funções e vice-versa) O espaço de funções tem uma certa relação de ana- logia o Rd. Numa direção, podemos conceber cada vetor x ∈ Rd como uma representação de uma função de x : {1, . . . , d} → R associando cada 1 ≤ i ≤ d um valor x[i]. Na outra direção, podemos pensar numa função f : I → R como um ”vetor” cujas coordenadas f (t) são indexadas pelos elementos t ∈ I. Isso nos mostra que pensar em C(I, R) como espaço vetorial, além de ser formalmente correto, tem um significado intuitivo também. Manter isso em mente pode ajudar a compreender várias provas abaixo. 2.2.2 Subespaços de espaços vetoriais Ocasionalmente, será importante olharmos para subespaços de espaços vetoriais. Definição 2.3 (Subespaço vetorial) Chamamos um subconjunto W ⊂ V, W 6= ∅ de subespaço veto- rial de V se ele é fechado pelas operações de soma e multiplicação por escalar. Ou seja: ∀w, w′ ∈W, ∀λ ∈ R : λ w + w′ ∈W. Por exemplo, dado qualquer a ∈ Rd, o conjunto Ha := {x ∈ Rd : a · x = 0} é um subespaço de Rd; isto segue da linearidade do produto interno. Exercı́cio 2.2 O conjunto das matrizes d× d simétricas – isto é, as A ∈ Rd×d com A[i, j] = A[j, i] para cada par 1 ≤ i, j ≤ d – é um subespaço de Rd×d Exercı́cio 2.3 Dado J ⊂ R, o conjunto C(I, J) de funções contı́nuas de I em J é um subconjunto de C(I, R). Para que escolhas de J este conjunto é um subespaço vetorial de C(I, R)? Exercı́cio 2.4 Dados t ∈ I e ξ ∈ R, o conjunto W de funções contı́nuas de I em R com f (t) = ξ é um subconjunto de C(I, R). Para que escolhas de ξ este conjunto é um subespaço vetorial de C(I, R)? 2.2.3 Normas Para fazermos Análise, vamos precisar medir distâncias em espaços vetoriais. Isto nos leva à definição de norma, que é exatamente aquela que usamos em Rd. Definição 2.4 Uma norma sobre um espaço vetorial real V é uma função ‖ · ‖ : V → R com as seguintes propriedades: 30 • A norma é positiva definida, isto é, para todo x ∈ V, ‖x‖ ≥ 0, e ‖x‖ = 0 se e somente se x = 0. • A norma é homogênea positiva, isto é, para quaisquer λ ∈ R, x ∈ V, ‖λ x‖ = |λ| ‖x‖. • A norma é sub-aditiva, isto é, para quaisquer x, y ∈ V, ‖x + y‖ ≤ ‖x‖+ ‖y‖. Em geral há alguma dificuldade de provar que uma candidata a norma é mesmo norma, especialmente porque a subaditividade pode ser difı́cil de checar. Por exemplo, foi assim no caso da norma euclideana em Rd, que abordamos acima. Veremos abaixo alguns exemplos que requerem estratégias variadas. Normas envolvendo máximos e supremos Na nossa prova de que | · |2 é norma para Rd, usamos fortemente que |x|2 é o supremo de x.z sobre vetores unitários z ∈ Rd. Outros casos de normas baseadas em supremos ou máximos são apresentados abaixo. Exemplo 2.3 Uma outra maneira de definir uma norma em Rd é tomando-se a norma do máximo, ou `∞. |x|∞ := max 1≤i≤d |x[i]| (x ∈ Rd). Vejamos que esta é mesmo uma norma. Em primeiro lugar, ela é bem definida porque o máximo de um conjunto finito sempre é bem definido. Ela é positiva-definida porque é sempre não-negativa (o módulo de cada x[i] é não-negativo) e vale 0 se e somente todas as coordenadas de x se anulam (afinal, |x[i]| ≤ |x|∞ para cada i). Também não é difı́cil ver que ela é homogênea positiva, usando que |λx[i]| = |λ| |x[i]| para cada i = 1, . . . , d. A subaditividade também não é difı́cil de se mostrar neste caso. Tome x, x′ ∈ Rd. Para cada coordenada i =, . . . , d, podemos usar a sub-aditividade do valor absoluto (sobre os reais) e a definição de | · |∞ e deduzir: |(x + x′)[i]| ≤ |x[i]|+ |x′[i]|. Como o valor absoluto de cada uma das coordenadas pode ser cotado por cima pelo máximo dos valores absolutos, chegamos à seguinte desigualdade: |x[i]|+ |x′[i]| ≤ max 1≤j≤d |x[j]|+ max 1≤j≤d |x′[j]| = |x|∞ + |x′|∞. Concluı́mos todas as coordenadas satisfazem |(x + x′)[i]| ≤ |x|∞ + |x′|∞. Tomando o máximo sobre i, deduzimos que |x + x′|∞ ≤ |x|∞ + |x′|∞, como querı́amos demonstrar. O exemplo a seguir é só um pouco diferente. Exemplo 2.4 Tome I ⊂ R compacto e escreva C := C(I, R). Para f ∈ C, definimos: ‖ f ‖I,∞ = sup t∈R | f (t)|. Às vezes, quando o I estiver subentendido, ele será omitido da notação e escreveremos ‖ f ‖∞. 31 A razão pela qual ‖ f ‖I,∞ é bem definida é que toda função contı́nua sobre um compacto é limitada, como já sabemos de Análise na Reta. Vejamos por que ‖ · ‖∞ é mesmo norma. As demonstrações de que a norma é positiva- definida e homogênia positiva ficam como exercı́cio. A prova da subaditividade não é difı́cil. Sejam f , g ∈ C dadas. Observem que, pela subaditividadedo módulo sobre a reta, ∀t ∈ I : |( f + g)(t)| = | f (t) + g(t)| ≤ | f (t)|+ |g(t)|. Sabermos ainda que | f (t)| ≤ sups∈I | f (s)| = ‖ f ‖∞ e |g(t)| ≤ sups∈I |g(s)| = ‖g‖∞, portanto | f (t) + g(t)| ≤ ‖ f ‖∞ + ‖g‖∞ para cada t ∈ I. Assim, ‖ f ‖∞ + ‖g‖∞ é cota superior para os valores de | f (t)| para t ∈ I. Como o supremo é a menor cota superior, deduzimos que: ‖ f + g‖∞ ≤ ‖ f ‖∞ + ‖g‖∞, como querı́amos demonstrar. Observação 2.3 (Vetores são funções e vice-versa) Comparando os dois últimos exemplos, vemos cla- ramente como pode ser útil a analogia feita na Observação 2.2 entre vetores de Rd e funções. As duas provas acima são essencialmente idênticas! Normas `p: um argumento via convexidade A estratégia de máximos nem sempre é fácil de se implementar, mas outros argumentos podem funcionar. Vejamos um exemplo aqui. Exemplo 2.5 Fixe um expoente 1 ≤ p < +∞. A norma `p sobre Rd é definida por: |x|p := ( d ∑ i=1 |x[i]|p ) 1 p (x ∈ Rd). Há algumas razões pelas quais pode-se querer definir esta famı́lia geral de normas. Uma delas é que normas codificam esparsidade aproximada. Isto é, um vetor de norma `p pequena tem poucas coordenadas grandes e este efeito se acentua quando p é maior (veja o exercı́cio 2.13 abaixo). Temos como missão provar que o Exemplo 2.5 de fato define uma norma. Para começar, note que a candidata a norma é bem definida e que o caso p = 2 é precisamente o da norma euclideana. A questão é se temos uma norma para um 1 ≤ p < +∞ arbitrário. Para responder isso, precisamos checar que | · |p satisfaz os três axiomas de norma. A prova de que | · |p é positiva-definida e homogênea positiva fica como um exercı́cio não muito difı́cil para o leitor. A subaditividade pode ser provada de duas maneiras. No exercı́cio 2.16 abaixo, mostramos que | · |p é um supremo de produtos internos, o que nos permite usar a estratégia do caso p = 2. Aqui apresentamos uma outra estratégia de prova, que se baseia na ideia de convexidade. A função “x 7→ xp” é crescente. Além disso, ela é convexa, isto é: ∀λ ∈ [0, 1] ∀t, s ≥ 0 : (λ t + (1− λ)s)p ≤ λ sp + (1− λ) sp. (2.3) 32 (Isto é consequência do fato que a a função é contı́nua e sua derivada segunda é positiva em todo o ponto x > 0.) Agora considere x, z ∈ Rd; queremos provar que |x+ z|p ≤ |x|p + |z|p. Se um dos dois vetores se anula, esta desigualdade vale por inspeção. Portanto, suporemos a seguir que tanto x quanto z não são nulos. Neste caso, podemos observar que, para cada coordenada i, |(x + z)[i]| |x|p + |z|p = |x[i] + z[i]| |x|p + |z|p ≤ |x[i]|+ |z[i]||x|p + |z|p = λ |x[i]| |x|p + (1− λ) |z[i]||z|p , onde λ := |x|p |x|p + |z|p ∈ [0, 1]. Usando que “x 7→ xp” é crescente e convexa, deduzimos:( |(x + z)[i]| |x|p + |z|p )p ≤ ( λ |x[i]| |x|p + (1− λ) |z[i]||z|p )p ≤ λ ( |x[i]| |x|p )p + (1− λ) ( |z[i]| |z|p )p . Isso vale para todo 1 ≤ i ≤ d. Somando sobre as coordenadas, obtemos: d ∑ i=1 ( |(x + z)[i]| |x|p + |z|p )p ≤ λ d ∑ i=1 ( |x[i]| |x|p )p + (1− λ) d ∑ i=1 ( |z[i]| |z|p )p . Ou seja: ( |x + z|p |x|p + |z|p )p ≤ λ |x|pp |x|pp + (1− λ) |z|pp |z|pp = 1. Como a função “t ≥ 0 7→ t1/p” também é crescente, deduzimos que |x + z|p |x|p + |z|p ≤ 1, como querı́amos demonstrar. Exercı́cio 2.5 (Condições de igualdade para a subaditividade) Quando p > 1, a convexidade de “x ≥ 0 7→ xp” é estrita: a derivada segunda desta função é positiva para todo x > 0. Uma consequência disso é que desigualdade (2.3) é estrita sempre que t 6= s e 0 < λ < 1. Use este fato para mostrar que: ∀1 < p < +∞ ∀x, z ∈ Rd : |x + z|p = |x|p + |z|p ⇔ x = 0Rd , z = 0Rd ou x |x|p = z |z|p . Ou seja, a norma só é aditiva quando um dos vetores se anula ou os dois têm as mesmas direção e sentido. Esta propriedade não vale para quando d > 1 e p = 1, já que (por exemplo) |e1 + e2|1 = |e1|1 + |e2|1. Normas baseadas em outras normas O último exemplo que vemos de norma é fundamental para várias aplicações de Álgebra Linear. Ela é uma norma “derivada” de outras “normas-base” e suas propriedades serão deduzidas das normas base. 33 Exemplo 2.6 (Norma de operador em R`×d) Recorde do seu curso de Álgebra Linear que há uma relação direta entre matrizes A ∈ R`×d e transformações lineares A : Rd → R` (usamos A duas ve- zes por abuso de notação). De fato, dado x ∈ Rd, Ax ∈ R` é o vetor de coordenadas: (Ax)[i] := d ∑ j=1 A[i, j] x[j], 1 ≤ i ≤ `. A chamada norma de operador p2 → p1 sobre R`×d é definida da seguinte forma. Fixe expoentes p2, p1 ∈ [1,+∞]. Definimos ‖A‖p2→p1 := sup v∈Rd\{0} |Av|p1 |v|p2 . Normas como esta são muito importantes em Álgebra Linear Numérica. Um problema im- portante é saber como diversos problemas envolvendo a matriz A se portam quando a matriz é ligeiramente perturbada. Na maioria dos casos, tanto a formulação quanto a solução deste tipo de problema tem a ver com normas de matrizes. O Exercı́cio 2.12 traz um exemplo disso. Como podemos provar que ‖A‖p2→p1 é norma? Observe em primeiro lugar que, por lineari- dade e homogeneidade positiva da norma, |Av|p1 |v|p2 = ∣∣∣∣A v|v|p2 ∣∣∣∣ p1 e v/|v|p2 tem norma 1. Portanto, podemos trocar o supremo na definição da norma de operador por ‖A‖p2→p1 = sup v∈Rd : |v|p2=1 |Av|p1 . (2.4) Isso facilita um pouco a prova das propriedades de norma, que veremos a seguir. Primeiramente, temos de mostrar que a norma é uma função bem-definida de R`×d em R. Como o supremo é sempre unicamente definido como elemento de R ∪ {+∞}, o que nos resta fazer é mostrar que o supremo na definição da (candidata a) norma é finito. Para isso, usaremos a segunda fórmula, apresentada em (2.4) e algumas estimativas bastante “cruas”, mas válidas. Veja que, em primeiro lugar, se v ∈ Rd tem norma |v|p2 = 1, todas as suas coordenadas estão limitadas por 1 em valor absoluto. Desta forma, quando calculamos Av, cada coordenada do vetor satisfaz: |(Av)[i]| = ∣∣∣∣∣ d∑j=1 A[i, j]v[j] ∣∣∣∣∣ ≤ d∑j=1 |A[i, j]| |v[j]| ≤ d ∑ j=1 |A[i, j]| ≤ d M, onde M := max1≤i≤`,1≤j≤d |A[i, j]| < +∞ (note que utilizamos a subaditividade da função módulo sobre R!). Portanto, quando |v|p2 = 1, as coordenadas de Av são uniformememente limitadas por dM, quantidade que não depende de v. Concluı́mos que: ∀v ∈ Rd : |v|p2 = 1⇒ |Av| p1 p1 ≤ d 1+p1 Mp1 < +∞, ou seja, |Av|p1 é limitada sobre os vetores de norma 1. Isto quer dizer que o supremo em (2.4) é finito, como querı́amos demonstrar. 34 O próximo passo é mostrar que ‖ · ‖p2→p1 é positiva-definida. Como a norma é um supremo de números não-negativos, ela certamente é não-negativa. Claramente a matriz 0R`×d tem norma zero. Por outro lado, se ‖A‖p2→p1 = 0, isto quer dizer que, dado qualquer v ∈ Rd, |Av|p1 ≤ 0. Como | · |p1 é positive definida, isso quer dizer que Av = 0R` para qualquer v ∈ Rd. Em particular, se tomamos v = ei para cada um dos vetores da base canônica (com 1 ≤ i ≤ `), Aei é o vetor cujas coordenadas são A[i, j]; logo, estas são a fortiori nulas. Concluı́mos: a hipótese de que ‖A‖p2→p1 = 0 implica que A é a matriz nula. A seguir, provamos que a norma é homogênea positiva. Para isso, usaremos o fato que | · |p1 tem esta propriedade e que, dados A ∈ R`×d e λ ∈ R, ∀v ∈ Rd : (λA)v = λ(Av). De fato, isto é consequência da definição das operações envolvidas e nos permite concluir: ∀v ∈ Rd : |(λA)v|p1 = |λ(Av)|p1 = |λ| |Av|p1 . Quando multiplicamos todos os elementos de um conjunto por |λ|, seu supremo é multiplicado pelo mesmo valor. Desta forma, ‖λA‖p2→p1 = sup v∈Rd, |v|p2=1 |(λA)v|p1 = sup v∈Rd, |v|p2=1 |λ| |Av|p1 = |λ| sup v∈Rd, |v|p2=1 |Av|p1 = |λ| ‖A‖p2→p1 . Por fim, provaremos que a norma sobre matrizes é subaditiva. Se tomamos A, B ∈ R`×d e v ∈ Rd, vemos que (A + B)v = Av + Bv por virtude das definições envolvidas. Portanto, para qualquer vetor v ∈ Rd de norma 1, |(A + B)v|p1 ≤ |Av|p1 + |Bv|p1 ≤ ‖A‖p2→p1 + ‖B‖p2→p1 . Como a desigualdade vale para todo v de norma 1, o supremo do lado esquerdoé cotado pelo lado direito, e obtemos: ‖A + B‖p2→p1 ≤ ‖A‖p2→p1 + ‖B‖p2→p1 . Esta é a propriedade de subaditividade que querı́amos demonstrar. 2.3 Mais exercicios Exercı́cio 2.6 Dado I ⊂ R compacto, considere o conjunto de todas as funções polinomiais de I a R. Prove que este é um subespaço vetorial de C(I, R). Exercı́cio 2.7 (Funções limitadas) Dado um conjunto qualquer I 6= ∅, chame de B(I, R) o con- junto de todas as funções limitadas de I a R. Prove que este conjunto tem uma estrutura natural de espaço vetorial e que a expressão ‖ f ‖∞ := sup t∈I | f (t)| ( f ∈ B(I, R)) 35 define uma norma sobre B(I, R). Mostre ainda que, quando I ⊂ R é compacto, o espaço C(I, R) definido acima é um subespaço de B(I, R). Exercı́cio 2.8 (Submultiplicatividade da norma ‖ · ‖∞) Seguindo com a notação do exercı́cio an- terior, mostre que o produto f g de dois elementos B(I, R) é um outro elemento de B(I, R) e que ‖ f g‖∞ ≤ ‖ f ‖∞ ‖g‖∞. Observe que o mesmo resultado vale para C(I, R). Exercı́cio 2.9 (Submultiplicatividade da norma de operador) Considere matrizes A1 ∈ Rd1×d2 e A2Rd2×d3 . Lembre-se que o produto de A1 e A2 é o elemento A1A2 ∈ Rd1×d3 com entradas (A1A2)[i, j] := d2 ∑ k=1 A1[i, k]A2[k, j] (1 ≤ i ≤ d1, 1 ≤ j ≤ d3). Este produto é definido de modo que ∀v ∈ Rd1 : (A1A2) v = A1 (A2v). Agora bote em cada Rdi uma norma `pi . Mostre que ‖A1A2‖p1→p3 ≤ ‖A1‖p2→p3 ‖A2‖p1→p2 . Exercı́cio 2.10 Dada uma matriz A ∈ R`×d, sua transposta, denotada por AT, é a matriz em Rd×` cujas entradas são definidas da seguinte forma: AT[i, j] := A[j, i] (1 ≤ i ≤ d, 1 ≤ j ≤ `). 1. Prove que y.(Ax) = (ATy).x para quaisquer A ∈ R`×d, x ∈ Rd e y ∈ R`. 2. Mostre que ‖AT‖2→2 = ‖A‖2→2 para qualquer A ∈ R`×d. Exercı́cio 2.11 Como já observado, podemos associar de modo natural o espaço de matrizes R`×d com o espaço euclideano R` d. Isto nos permite definir uma norma correspondente à norma | · |2 sobre R`×d, que às vezes é chamada de norma de Frobenius: ‖A‖F := √√√√ `∑ i=1 d ∑ j=1 |A[i, j]|2 (A ∈ R`×d). Outra norma natural é a versão da norma `∞ em R`×d: a magnitude da maior entrada. ‖A‖M := max 1≤i≤` 1≤j≤d |A[i, j]| (A ∈ R`×d). 1. Mostre que ‖ · ‖M = ‖ · ‖1→∞. 2. Prove que as duas normas acima “sanduı́cham” a norma de operador ‖ · ‖2→2. ∀A ∈ R`×d : ‖A‖M ≤ ‖A‖2→2 ≤ ‖A‖F. 36 Exercı́cio 2.12 Chamamos de Id×d a matriz idendidade d× d, que tem 1 na diagonal e zeros em todas as outras entradas. Uma matriz A ∈ Rd×d é dita inversı́vel se existe uma outra matriz A−1 ∈ Rd×d tal que A A−1 = A−1 A = Id×d. Em cursos de Álgebra Linear, aprendemos que a inversa existe e é única se e somente se o determinante de A não se anula. Fixos dois expoentes p1, p2 ∈ [1,+∞], definimos: σ−p1→p2(A) := infv∈Rd\{0 Rd} |Av|p2 /|v|p1 . 1. Mostre que, se A é inversı́vel, |A−1|p2→p1 = 1 σ−p1→p2(A) ; em particular, quando A é inversı́vel, σ−p1→p2(A) > 0. 2. Sabemos da Álgebra Linear que uma matriz quadrada é inversı́vel se e somente se o único vetor v com Av = 0Rd é o vetor v = 0Rd . Use este fato para provar que uma A ∈ Rd×d é inversı́vel se e somente se σ−p1→p2(A) > 0. 3. Prove que qualquer matriz B ∈ Rd×d com |A− B|p1→p2 < σ−p1→p2(A) é inversı́vel. Observação: a quantidade κ(A) := |A−1|2→2 |A|2→2 é chamada de número de condição da matriz A. Segue do primeiro item deste exercı́cio que ele é sempre ≥ 1. Quando o número de condição é muito grande, isto significa que o problema de se resolver um sistema “Ax = b” é instável: pequenas alterações em b ou na matriz A podem levar a grandes mudanças na solução. Por outro lado, o terceiro item acima implica que o número de condição não muda muito sob pequenas perturbações de A. Mais informações sobre o número de condição estão disponı́veis no artigo https: // en. wikipedia. org/ wiki/ Condition_ number . Exercı́cio 2.13 Definimos acima as normas `p para 1 ≤ p ≤ +∞. No entanto, a função que leva x ∈ Rd em |x|p também está bem definida quando 0 < p < 1. 1. Prove que | · |p para 0 < p < 1 não é subaditiva e portanto não é norma (dica: isso tem a ver com concavidade estrita da função “t ≥ 0 7→ tp”). 2. Prove que, para qualquer x ∈ Rd, |x|0 := limp→0+ |x| p p é o número de coordenadas diferen- tes de 0 de x. 3. Prove ainda que, dados quaisquer x ∈ Rd, t > 0 e p > 0, #{1 ≤ i ≤ d : |x[i]| ≥ t} ≤ |x|pp tp . Deste modo ter “norma `p pequena” quer dizer que poucas coordenadas são grandes. Exercı́cio 2.14 Dados a ∈ Rd\{0} e ξ ∈ R, quando é verdade que o conjunto abaixo é um subespaço de Rd? Ha,ξ := {x ∈ Rd : a · x = ξ}. 37 https://en.wikipedia.org/wiki/Condition_number Exercı́cio 2.15 Prove que, para qualquer x ∈ Rd e 1 ≤ p < +∞, |x|∞ ≤ |x|p ≤ d1/p |x|∞ ≤ d1/p |x|2. Deduza que |x|∞ = limp→+∞ |x|p para todo x ∈ Rd. Exercı́cio 2.16 Apresentamos aqui uma forma alternativa de provar que as normas `p apresentadas no Exemplo 2.5 são de fato normas. Como lá, definimos o expoente dual de p como q := p/(p− 1) quando 1 < p < +∞. Se p ∈ {1,+∞}, definimos q via um limite: portanto q = 1 se p = ∞ e q = ∞ se p = 1. 1. Nos próximos itens, mostraremos a relação de dualidade entre as normas `p e `q Dualidade: ∀x ∈ Rd ∀p ∈ [1,+∞] : |x|p = sup{v · x : v ∈ Rd, |v|q = 1}. Explique porque esta relação implica que a norma `p é de fato uma norma (ou seja, satisfaz os três axiomas da definição). 2. Prove dualidade diretamente para p ∈ {1, ∞}. 3. A partir daqui supomos p ∈ (1,+∞). Mostre que a desigualdade entre as médias aritmética e geométrica implica que ∀a, b ∈ R : ab ≤ |a| p p + |b|q q , com igualdade se e somente se a, b têm o mesmo sinal e |a|p = |b|q. 4. Deduza do primeiro item que ∀x, y ∈ Rd\{0} : x · y|x|p |y|q ≤ 1 e obtenha a Desigualdade de Hölder x.y ≤ |x|p |y|q. 5. Cheque as condições de igualdade no item anterior para terminar a prova da dualidade. Mostre ainda que, se x 6= 0Rd , o supremo na fórmula de dualidade só é atingido por um único vetor v. Exercı́cio 2.17 Retorne ao exercı́cio 2.10 e use o resultado do exercı́cio 2.16 para mostrar que ‖AT‖p2→p1 = ‖A‖p1→p2 para quaisquer 1 ≤ p1, p2 ≤ +∞. Exercı́cio 2.18 Considere o espaço C([a, b], R) com a < b reais. Dado 1 ≤ p < +∞, mostre que a expressão: ‖ f ‖p := (∫ b a | f (t)|p dt ) 1 p ( f ∈ C([a, b], R)) define uma norma sobre C([a, b], R), para qualquer 1 ≤ p < +∞ fixo. Prove ainda uma versão da desigualdade de Hölder para estas normas: ∀ f , g ∈ C([a, b], R) : ‖ f g‖1 ≤ ‖ f ‖p‖g‖q onde q é o expoente dual de p definido no Exercı́cio 2.16. (Dica: este é mais um caso em que a analogia contida na Observação 2.2 pode ser útil.) 38 Exercı́cio 2.19 Neste exercı́cio, apresentamos outras normas que “são subaditivas por motivos de conve- xidade”. Considere uma função Ψ : [0,+∞)→ [0,+∞) com as seguintes propriedades: • Ψ é crescente e convexa; • Para todo x ∈ R+, Ψ(x) ≥ 0, com igualdade se e somente se x = 0; • limx→+∞ Ψ(x) = +∞ e limx→0 Ψ(x) = 0. Por exemplo, as funções definidas por Ψ1(x) := xp, Ψ2(x) := ex p − 1 (com p ≥ 1 nos dois casos) e Ψ3(x) = x (max{log x, 0}+ 1) têm as propriedades acima. Prove que, dado d ∈N\{0}, a expressão: ‖x‖Ψ := inf { a > 0 : d ∑ i=1 Ψ ( |x[i]| a ) ≤ 1 } (x ∈ Rd) define uma norma sobre Rd. Prove ainda que esta norma coincide com a norma `p usual no caso em que Ψ1(x) = xp. 39 40 Capı́tulo 3 Espaços métricos, convergência e completude No capı́tulo anterior vimos vários espaços vetoriais V com suas respectivas normas ‖ · ‖. Isto nos permite medir tamanhos de vetores e distância entre pontos v e v′. Medir distâncias é bom porque nos permite tomar limites e fazer Análise. No entanto, é muito fácil encontrar espaços em que se deseja fazer Análise e que não possuem a estrutura linear de um espaço vetorial: ou seja, espaços em que tomar somas, diferenças ou produtos de elementos não faz sentido. Por exemplo, a esfera d-dimensional e o conjunto de Cantor não têm nada de “linear”, ainda que estejam ambos contidos em espaços vetoriais.No fim das contas, é bastante conveniente tomarmos um ponto de vista mais geral, baseado apenas na noção de distância. Por isso estudaremos a partir daqui o conceito de espaço métrico. Esta é a estrutura mı́nima que nos permite estender a Análise a que estamos acostumados, com ε e δ, limites e tudo o mais. Todo espaço vetorial normado pode ser visto como espaço métrico, mas a recı́proca não é verdadeira. A classe de espaços métricos é a principal categoria de objetos que trataremos neste curso. Ela é geral o suficiente para quase todos os nossos propósitos, mas ainda assim é tratável. Neste capı́tulo veremos como ela é definida e como ela nos permite falar de convergência em conjuntos muito gerais. 3.1 Espaços métricos O que é, afinal, um espaço métrico? Eis a definição, devida a Fréchet. Definição 3.1 Um espaço métrico é um conjunto X 6= ∅ munido de uma função d : X×X → [0,+∞), chamada de métrica sobre X, com as seguintes propriedades. 1. d é não-negativa e separa pontos distintos: para quaisquer a, b ∈ X, d(a, b) = 0 se e somente se a = b; 2. d é simétrica: para qualquer par (a, b) ∈ X× X, d(a, b) = d(b, a); 3. d satisfaz a desigualdade triangular: para quaisquer a, b, c ∈ X, d(a, b) ≤ d(a, c) + d(c, b). 41 Todas as propriedades de métrica acima têm uma interpretação intuitiva se pensamos em d como uma noção de distância. A propriedade 1 diz que a distância de um lugar a ele mesmo é nula, mas que qualquer outro lugar está a distância positiva. A segunda propriedade afirma que ir de a a b não é mais fácil ou difı́cil que ir de b a a. A terceira propriedade afirma que ir de a para c e depois para b não pode resultar em um caminho mais curto que a rota direta de a para b. Apesar da clareza do que significam estas condições, veremos abaixo que nem todo espaço métrico é fácil de se entender. Veremos abaixo os principais exemplos de espaços métricos que serão recorrentes no curso. Ocasionalmente usaremos a convenção de denotar por dX a métrica de X; isto será útil quando tratarmos muitos espaços métricos de uma única vez. 3.1.1 A reta real como espaço métrico Como primeiro exemplo, tomamos X = R com dR(a, b) := |a − b| ((a, b) ∈ R2). As duas primeiras propriedades da definição de métrica são triviais. A terceira é consequência de “|x + y| ≤ |x|+ |y|”aplicada a x = a− c e y = c− b. Em todas estas notas tomaremos esta métrica como a métrica padrão sobre R, a não ser quando o contrário for dito. 3.1.2 Os números complexos como espaço métrico O conjunto C é usualmente definido como o conjunto dos números da forma z := a + b √ −1, onde a = <(z) ∈ R é chamada de parte real de z, b = =(z) ∈ R é a parte imaginária, e √ −1 – a unidade imaginária – é um número satisfazendo ( √ −1)2 = −1. Livros especializados em Análise Complexa têm definições mais formais deste corpo. O ponto de mencioná-los aqui é que C é basicamente R2 com uma estrutura de produto. Observamos ainda que a norma |z| é multiplicativa: |zw| = |z| |w|. 3.1.3 A métrica discreta Uma métrica relativamente trivial e “boba”pode ser definida sobre qualquer conjunto X 6= ∅: a chamada métrica discreta. ddisc(x, y) := { 1, x 6= y; 0, x = y. Esta métrica é interessante por alguns (poucos) motivos. No momento só um deles nos interessa: qualquer resultado que provarmos para todos os espaços métricos deverá valer para as métricas discretas! Ou seja: se você quer entender um teorema, ou simplesmente testar se um enunciado pode ser verdadeiro para todos os espaços métricos, estudá-lo no caso da métrica discreta é um bom primeiro passo. 3.1.4 Espaços vetoriais: normas nos dão métricas A maneira canônica de se definir uma métrica sobre um espaço normado é através da norma. Proposição 3.1 Se (V, ‖ · ‖V) é um espaço normado, então a expressão dV(a, b) := ‖a− b‖V (a, b ∈ V) define uma métrica sobre V. 42 Prova: Sejam a, b, c ∈ Rd quaisquer. Nosso objetivo é provar que • ‖a− b‖V ≥ 0, com igualdade se e somente se a = b; • ‖a− b‖V = ‖b− a‖V ; • ‖a− c‖V ≤ ‖a− b‖V + ‖b− c‖V . Vamos escrever isto de outra forma. Defina x := a− b, y := b− c. Os itens acima são equivalentes a: • ‖x‖V ≥ 0, com igualdade se e somente se x = 0 (que vale porque a norma é positiva definida). • ‖x‖V = ‖ − x‖V (que segue da homogeneidade positiva da norma); • ‖x + y‖V ≤ ‖x‖V + ‖y‖V (que vem da sub-aditividade). 2 Portanto, as normas que pusemos em Rd, C(I, R), etc todas induzem métricas. Como veremos na seção seguinte, elas também induzem métricas sobre subconjuntos destes espaços que não são necessariamente espaços vetoriais. Por exemplo, a norma euclidiana em Rd induz uma métrica na esfera unitária: Sd−1 := {x ∈ Rd : |x|2 = 1.} 3.1.5 Métricas induzidas Se temos um espaço métrico (X, dX), qualquer subconjunto Y ⊂ X, Y 6= ∅ herda a métrica: dY(y, y′) := dX(y, y′) ((y, y′) ∈ Y2). Ou seja, dY = dX |Y×Y é obtida restringindo a função dX : X × X → [0,+∞) ao conjunto Y × Y. Chamamos esta métrica de induzida. Por exemplo, a esfera unitária Sd−1 ⊂ Rd e o conjunto Qd ⊂ Rd dos vetores com coordenadas racionais têm métricas induzidas pelas métricas naturais sobre os espaços ambientes. 3.2 Sequências, limites e completude O leitor deve lembrar que uma sequência de elementos em X, escrita {xn}n∈N ⊂ X, é tão somente uma maneira de escrever uma função f : N→ X, de modo que xn = f (n) para cada n ∈N. Tomamos como dado que o leitor já sabe o que é convergência de uma sequência em R, mas lembramos a definição mesmo assim. Dados {xn}n∈N ⊂ R e x ∈ R, dizemos que xn → x, ou limn∈N xn = x, ou ainda que xn converge a x, se ∀ε > 0 ∃n0(ε) ∈N ∀n ∈N : n ≥ n0(ε)⇒ |xn − x| < ε. A noção de convergência em um espaço métrico é derivada desta. 43 Definição 3.2 Fixo um espaço métrico (X, dX), dizemos que uma sequência {xn}n∈N ⊂ X converge a x ∈ X (segundo a métrica dX) se a sequência {dX(xn, x)}n∈N ⊂ R converge a 0, no sentido do parágrafo anterior. Dito de outro modo: xn → x se ∀ε > 0 ∃ n0(ε) ∈N ∀n ∈N : n ≥ n0(ε)⇒ |dX(xn, x)− 0| = dX(xn, x) < ε. Esta segunda forma de definir as coisas mostra que as duas noções de convergência coincidem no caso de X = R com a métrica usual. Podemos mostrar facilmente que, como no caso de números, trocar < ε por ≤ ε na segunda definição não muda nada. Além disso: Proposição 3.2 (Unicidade do limite) Dados x, x′ ∈ X e uma sequência {xn}n∈N ⊂ X, se xn → x e xn → x′, então x = x′. Prova: Pelos axiomas de métrica, para provarmos que x = x′, basta mostrarmos que dX(x, x′) = 0. Pela desigualdade triangular, temos a seguinte desigualdade para cada n ∈N: 0 ≤ dX(x, x′) ≤ dX(x, xn) + dX(xn, x′). Por hipótese, dX(x, xn)→ 0 e dX(x′, xn)→ 0 no sentido usual de R. Como “o limite da soma é a soma dos limites”, temos: lim n∈N (dX(x, xn) + dX(xn, x′)) = lim n∈N dX(x, xn) + lim n∈N dX(xn, x′) = 0. Portanto, a distância dX(x, x′) está “sanduichada” entre a sequência constante 0 e uma outra sequência que vai a 0. Deduzimos que dX(x, x′) = 0, como querı́amos demonstrar. 2 Um ponto importante é que, como veremos abaixo, a convergência ou não de uma sequência depende da métrica escolhida. Ainda assim, na maior parte dos casos nós falaremos de con- vergência sem mencionar a métrica. Exercı́cio 3.1 Considere um espaço vetorial normado (V, ‖ · ‖V) com a métrica induzida pela norma. Se {vn}n∈N ⊂ V e v ∈ V são dados, mostre que vn → v⇔ vn − v→ 0V . Vamos agora definir o que é uma sequência de Cauchy em um espaço métrico e o que é um espaço métrico completo. Definição 3.3 Fixo um espaço métrico (X, dX), dizemos que uma sequência {xn}n∈N ⊂ X é de Cauchy se lim m,n→+∞ dX(xn, xm) = 0, isto é, ∀ε > 0 ∃ n0(ε) ∈N ∀m, n ∈N : m, n ≥ n0(ε)⇒ dX(xn, xm) < ε. (X, dX) é dito completo se toda sequência de Cauchy {xn}n∈N ⊂ X converge a algum x ∈ X. A mesma prova conhecida de R de que toda sequência convergente é Cauchy vale paraespaços métricos gerais. Observe, no entanto, que nem todo espaço métrico é de Cauchy. Por exemplo, (R, dR) é completo, mas Q com a métrica induzida não é completo. Veremos a seguir vários exemplos naturais de espaços métricos que são completos e (com menos destaque) alguns outros que não são. Antes, uma definição fundamental. Definição 3.4 Um espaço vetorial normado (V, ‖ · ‖V) que é completo com a distância induzida pela norma ‖ · ‖V é dito espaço de Banach. 44 3.2.1 Subsequências Em vários momentos do texto, seremos forçados a falar de subsequências, definidas abaixo. Definição 3.5 Considere um subconjunto infinito N ⊂ N. Dada uma sequência {xn}n∈N num espaço métrico (X, dX), chamamos de subsequência {xn}n∈N (com ı́ndices em N) a sequência {yj}j∈N definida da seguinte maneira: se n1 < n2 < . . . é a única enumeração crescente dos elementos de N, então yj := xnj para cada j ∈ N. Normalmente escreveremos xnj ao invés de yj. Chamamos de limn∈N xn ou limj∈N xnj o limite de yj (caso exista). Ainda não teremos muito motivo para olhar subsequências nesta altura do texto, mas em breve isto ocorrerá. Em geral a motivação para se definir uma subsequência é a seguinte. Preci- samos de uma sequência com propriedades ”boas”. Isso pode ser difı́cil de se obte diretamente. Talvez consigamos apenas uma sequência preliminar, que é ”parcialmente boa”, ou ”quase boa”. Quando isso ocorre, é às vezes possı́vel obter a sequência desejada passando a uma subsequência da sequência preliminar. De fato, veremos o primeiro exemplo disso já na próxima subseção. Exercı́cio 3.2 Mostre que uma subsequência {xn}n∈N como a definida acima converge a x ∈ X se e somente se: ∀ε > 0 ∃n0(ε) ∈ N ∀n ∈ N : n ≥ n0(ε)⇒ dX(xn, x) ≤ ε. É conveniente enunciarmos de uma vez duas proposições muito úteis. A primeira diz que, ao passarmos para uma subsequência, não ”estragamos”uma eventual convergência da sequência original. Proposição 3.3 Considere uma sequência {xn}n∈N num espaço métrico (X, dX). Se xn converge a um limite x ∈ X, então qualquer subsequência converge ao mesmo x. Prova: Tome {xn}n∈N e x ∈ X como acima. O fato que xn → x quer dizer que: (?) ∀ε > 0 ∃n0(ε) ∈N ∀n ∈N : n ≥ n0(ε)⇒ dX(xn, x) ≤ ε. Agora considere N ⊂N infinito. Queremos mostrar que limn∈N xn = x. Considerando xnj como na definição de subsequência, precisamos provar que, dado um ε > 0, queremos : ∃j0(ε) ∈N ∀j ∈N : j ≥ j0(ε)⇒ dX(xnj , x) ≤ ε. Mas isso é simples. Como N := {n1 < n2 < n3 < . . . } é conjunto infinito, podemos escolher j0(ε) com nj0(ε) ≥ n0(ε) (ver (?)). Deste modo, garantimos que nj ≥ n0(ε) para todo j ≥ j0(ε), de modo a garantir dX(xnj , x) ≤ ε. 2 No próximo problema, veremos como podemos usar subsequências para garantir a con- vergência de uma sequência inteira. Proposição 3.4 Considere uma sequência de Cauchy {xn}n∈N num espaço métrico (X, dX) que tem uma subsequência convergente. Então {xn}n∈N converge ao mesmo limite da sequência inteira. 45 Prova: Sejam x ∈ X o limite da subsequência e N ⊂ N o seu conjunto (infinito) de ı́ndices. Como {xn}n∈N é Cauchy, dado ε > 0, podemos encontrar n0(ε) ∈ N tal que dX(xn, xm) ≤ ε para n, m ≥ n0(ε). Ao mesmo tempo, como N é infinito, sabemos que existem infinitos ı́ndices k ∈≥ n0(ε) com k ∈ N. Tomando um destes ı́ndices, vemos que: ∀n ≥ n0(ε) : dX(xn, x) ≤ dX(xn, xk) + dX(xk, x) ≤ ε + dX(xk, x). Se agora mandamos k→ +∞ com k ∈ N, temos dX(xk, x)→ 0 e portanto: ∀n ≥ n0(ε) : dX(xn, x) ≤ ε. Ou seja, o mesmo n0(ε) que vem da ”Cauchyaniedade” da sequência {xn}n se adequa à definição de limite. 2 3.2.2 Convergência em Rd com as normas `p Recorde o Exercı́cio 2.15 acima, onde apresentamos as normas `p, 1 ≤ p ≤ ∞, sobre Rd. Observe que, para qualquer uma destas normas, ∀p ∈ [1,+∞), ∀x ∈ Rd : |x|∞ ≤ |x|p ≤ d1/p |x|∞. Usamos este fato a seguir para obter o seguinte resultado. Teorema 3.1 Dada uma sequência arbitrária {xn}n∈N ⊂ Rd: 1. se x ∈ Rd, xn → x de acordo com uma das normas `p acima se e somente se xn[i]→ x[i] para cada uma das coordenadas i = 1, 2, . . . , d; 2. {xn}n∈N é Cauchy de acordo com uma das normas `p acima se e somente se cada uma das sequências de coordenadas {xn[i]}n∈N ⊂ R, com i = 1, 2 . . . , d, é Cauchy. Segue que (Rd, | · |p) é Banach: toda sequência em Rd que é Cauchy de acordo com a norma `p converge a um limite em Rd. Prova: Começamos com o primeiro item. Tome uma sequência {xn}n∈N ⊂ Rd e um x ∈ Rd. Lembre-se do Exercı́cio 3.1 e veja que xn →`p x se e somente se xn − x →`p 0Rd . Pela observação antes da prova relacionando as normas `p, deduzimos que: xn →`p x ⇔ |x− xn|p → 0⇔ |x− xn|∞ → 0⇔ max1≤i≤d |x[i]− xn[i]| = 0, onde a última implicação é a definição da norma | · |∞. Agora observe que, para cada j ∈ {1, . . . , d}, {|x[j]− xn[j]|}n∈N é uma sequência de números reais maiores ou iguais a 0. Portanto, 0 ≤ |x[j]− xn[j]| ≤ max 1≤i≤d |x[i]− xn[i]|. Por um argumento de sanduı́che, vemos que, se max1≤i≤d |x[i]− xn[i]| → 0, então |x[j]− xn[j]| → 0, e portanto xn[j] → x[j], para cada j ∈ {1, . . . , d}. Por outro lado, se cada uma das sequências 46 {xn[j]}n∈N converge a x[j], temos que {|x[j]− xn[j]|}n∈N converge a 0 para cada j e o máximo dessas sequências converge a 0 (um resultado de Análise na Reta!). Concluı́mos: max 1≤i≤d |x[i]− xn[i]| = 0⇔ ∀j ∈ {1, 2, . . . , d} : xn[j]→ x[j]. Combinando isso com as implicações anteiores, cumprimos com o item 1. Para o segundo item, seguimos raciocı́nio parecido por isso, vamos mais rápido. Novamente Vemos que: |xn − xm|p n,m→+∞−→ 0⇔ |xn − xm|∞ n,m→+∞−→ 0⇔ max 1≤j≤d |xn[j]− xm[j]| n,m→+∞−→ 0. Do mesmo modo que acima, observamos que o máximo max1≤j≤d |xn[j]− xm[j]| converge a 0 se e somente se |xn[j]− xm[j]| converge a 0 para cada coordenada j ∈ {1, 2, . . . , d}: max 1≤j≤d |xn[j]− xm[j]| n,m→+∞−→ 0⇔ ∀ 1 ≤ j ≤ d : |xn[j]− xm[j]| n,m→+∞−→ 0. Assim, |xn − xm|p n,m→+∞−→ 0⇔ ∀ 1 ≤ j ≤ d : |xn[j]− xm[j]| n,m→+∞−→ 0, o que é a tradução em sı́mbolos matemáticos do item 2 do teorema. Para terminar, provaremos que (Rd, | · |p) é completo. Para isso, tomamos uma sequência de Cauchy {xn}n∈N ⊂ Rd arbitrária. Pelo item 2, cada sequência das coordenadas {xn[i]}n∈N ⊂ R é Cauchy. Como R é completo, isto quer dizer que: ∀i ∈ {1, . . . , d} : ∃ lim n→+∞ xn[i]. Agora defina x ∈ Rd como o vetor de coordenadas x[i] := limn→+∞ xn[i] (1 ≤ i ≤ d). Com esta definição, garantimos que as coordenadas de xn convergem para as coordenadas de x e portanto xn →`p x. Desta forma, provamos que a sequência de Cauchy {xn}n∈N ⊂ Rd (uma sequência de Cauchy arbitrária em Rd) tem limite x ∈ Rd. 2 Fazemos uma pausa aqui para mostrar um fato importante, que será usado muitas vezes no texto. Ele é um prelúdio para o assunto de compacidade, que será discutido mais adiante no texto. Proposição 3.5 (Sequências limitadas têm subsequências convergentes) Suponha que {xn}n∈N ⊂ Rd é uma sequência limitada, isto é, que supn∈N |xn|2 < +∞. Então existe uma subsequência {xnj}j∈N convergente. Prova: Vamos provar isso por indução na dimensão d ∈ N\{0}. O caso base é d = 1 é um teorema conhecido de Análise na Reta. Para o passo indutivo, suponha que o teorema é verdade para dimensão d− 1. Tome agora {xn}n∈N ⊂ Rd limitada e chame de yn as projeções dos xn a Rd−1. yn ∈ Rd−1 é o vetor com yn[i] = xn[i] para i ∈ [d− 1] (n ∈N). 47 Para cada n ∈ N, podemos usar o fato de que xn[d]2 ≥ 0 e √ · é função crescente para observar que: |yn|2 = √√√√d−1∑ i=1 |yn[i]|2 = √√√√d−1∑ i=1 |xn[i]|2 ≤ √√√√ d∑ i=1 |xn[i]|2 = |xn|2. Por esta razão, a sequência {yn}n∈N é limitada: supn∈N |yn|2 ≤ supn∈N |xn|2 < +∞. Por hipótese de indução, podemos encontrar um subconjunto infinito Nd−1 ⊂ N tal que limn∈Nd−1 yn = y ∈ Rd−1. Como visto acima, isto quer dizer que ∀i ∈ [d− 1] : lim n∈Nd−1 xn[i] = lim n∈Nd−1 yn[i] = y[i]. Agora considere {xn[d]}n∈Nd−1 ⊂ R. Esta é uma sequência limitada de númerosreais, pois afinal: sup n |xn[d]| ≤ sup n |xn|2 < +∞. Por Análise na Reta, sabemos que existe um Nd ⊂ Nd−1 infinito tal que: ∃ lim n∈Nd xn[d] = z ∈ R. Pela Proposição 3.3, sabemos que essa passagem a uma subsequência não estraga a convergência das outras coordenadas, que havia sido garantida antes. Isto é, agora sabemos que: ∀i ∈ [d] : ∃ lim n∈Nd−1 xn[i], o que, como visto acima, é a mesma coisa que dizer que {xn}n∈N converge. 2 3.2.3 Convergência sob a métrica discreta Vamos deixar este caso como um exercı́cio. Exercı́cio 3.3 Considere um espaço (X, dX) com a métrica discreta. Dada {xn}n∈N ⊂ X, mostre que xn → x ∈ X se e somente se existe um n0 ∈ N tal que xn = x para todo n ≥ n0. Prove ainda que {xn}n∈N é Cauchy se e somente se existe um n0 ∈N tal que xn = xn0 para todo n ≥ n0. 3.2.4 Convergência em C(I, R) Aqui I = [a, b] ⊂ R é um intervalo, C(I, R) é o espaço de funções contı́nuas de I em R e a norma usada é a norma ∞: ‖ f ‖I,∞ := sup t∈I | f (t)|. Vamos primeiro tentar entender do que estamos falando aqui. Vamos considerar em primeiro lugar o que quer dizer fn → f nesta métrica. Como ‖ fn − f ‖I,∞ é um supremo, e além disso este supremo é atingido, temos que ‖ fn − f ‖I,∞ → 0⇔ ∀ε > 0 ∃n0 = n0(ε) ∈N ∀n ≥ n0 ∀t ∈ T : | fn(t)− f (t)| < ε. 48 Esta é a chamada convergência uniforme em t ∈ I, ou simplesmente uniforme. Esta convergência implica a chamada convergência pontual, que ocorre quando fn(x) → f (x) para cada x ∈ I. Isto equivale a pedir que: ∀ε > 0 ∀t ∈ I ∃n0 = n0(ε, t) ∀n ≥ n0 : | fn(t)− f (t)| < ε. Veja que, neste caso, o ı́ndice n0 a partir do qual a distância fica menor que ε depende tanto de ε quanto do ponto t. Por outro lado, a convergência uniforme pede que seja achado, para cada ε > 0, um n0 tal que | fn(t)− f (t)| < ε para qualquer t ∈ I, sempre que n ≥ n0. Ou seja, a escolha de n0 deve ser uniforme em t. Os exemplos abaixo nos mostram duas coisas. A primeira é que o limite pontual de funções contı́nuas pode não ser uma função contı́nua. Exemplo 3.1 Considere I = [0, 1] e fn(x) = xn, x ∈ I. O limite pontual das fn é f com f (1) = 1 e f (x) = 0 para 0 ≤ x < 1. No próximo exemplo, veremos que a convergência pontual a um limite contı́nuo não implica convergência uniforme. Exemplo 3.2 Considere C([0, 1], R) com a norma do sup. Existe uma sequência { fn}n∈N ⊂ C([0, 1], R) de funções com ‖ fn‖[0,1],∞ = 1, mas fn(x)→ 0 para todo x ∈ [0, 1].. A sequência { fn}n∈N para n > 0 é feita de ”tendas”. A fn é uma ”tenda”de altura 1 plantada no intervalo (1/(n + 1), 1/n). Mais precisamente, fn será igual a 0 fora do intervalo (1/(n + 1), 1/n) e será um ”V invertido”dentro do intervalo. Apresentamos agora a fórmula. Considere a função contı́nua Ψ : R→ R dada por: Ψ(t) := 0, t ≤ 0; 2t, 0 ≤ t ≤ 12 ; 1− 2 ( t− 12 ) , 12 ≤ t ≤ 1; 0, t ≥ 1. (t ∈ R). É um exercı́cio provar que Ψ é de fato contı́nua, que 0 ≤ Ψ ≤ 1 e que Ψ(1/2) = 1. Agora defina f0 ≡ 0 e, para n > 0: fn(t) := Ψ ( 1 an ( t− 1 n + 1 )) (t ∈ [0, 1]), onde an := 1 n − 1 n + 1 = 1 n(n + 1) é o comprimento do intervalo (1/(n + 1), 1/n). Exercı́cio 3.4 Prove que cada fn com n > 0 vale 0 fora do intervalo (1/(n + 1), 1/n) e vale 1 no ponto médio deste intervalo. Deduza disso as propriedades enunciadas acima. Por outro lado, nosso principal teorema nesta seção pode ser resumido dizendo-se que o limite uniforme de funções contı́nuas é uma função contı́nua. 49 Teorema 3.2 C(I, R) é completo com a métrica induzida pela norma ‖ · ‖I,∞. Ou seja, uma sequência de funções contı́nuas sobre I = [a, b] que converge uniformemente tem como limite uma função contı́nua. Prova: Tomemos { fn}n∈N ⊂ C(I, R) que é de Cauchy, ou seja, tal que ‖ fn − fm‖I,∞ → 0 quando n, m → +∞. Desejamos mostrar que existe uma função f ∈ C(I, R) tal que ‖ fn − f ‖I,∞ → 0. Antes de entrar na prova, fazemos alguns comentários que serão úteis para entender o que veremos a seguir. Ideias gerais da prova A dificuldade desta prova é que não sabemos de antemão como encontrar uma f candidata a limite uniforme da sequência. Se tivéssemos essa f , só terı́amos que checar que esta f é mesmo o limite. Como não temos, vamos primeiro construir a função f e depois provar que ela é o limite que buscamos. Para isso, uma etapa fundamental será mostrar que as { fn}n∈N convergem pontualmente a uma certa função f (passo 1). Para isso, mostraremos que, dado qualquer ∀t ∈ I, { fn(t)}n∈N é uma sequência de Cauchy em R. Como convergência uniforme implica convergência pontual, sabemos que, se as fn conver- gem, o limite tem mesmo de ser f . Por isso, a etapa seguinte da prova será mostrar que fn e f estão uniformemente próximas para f grande (passo 2). A dificuldade aqui é que temos um ”limite duplo” que tem de ser tomado com cuidado. Como último passo, mostraremos que f ∈ C(I, R), ou seja, o limite uniforme de funções contı́nuas é função contı́nua (passo 3). Assim concluiremos a prova. Passo 1: existe uma f : I → R tal que fn(x)→ f (x) para cada x ∈ I. Este é o passo da prova em que mostramos que as as fn convergem pontualmente a uma certa f , que será a nossa candidata a limite uniforme da sequência fn. Para provar a convergência pontual, usaremos o fato de que R é completo, ou seja, sequências de Cauchy em R convergem. Por conta disto, temos ∀x ∈ I : | fn(x)− fm(x)| ≤ sup t∈I | fn(t)− fm(t)| = ‖ fn − fm‖I,∞ (n,m→+∞)→ 0. (3.1) Ou seja, ∀x ∈ I : | fn(x)− fm(x)| → 0 quando n, m→ +∞, o que quer dizer que { fn(x)}n ⊂ R é Cauchy, como querı́amos demonstrar. Isto quer dizer que ∃ f (x) := limn fn(x) para cada x ∈ I, o que define uma função f : I → R. Passo 2: Proximidade entre fn e f . O raciocı́nio por detrás de (3.1) nos diz que, para todo x ∈ I | fn(x)− f (x)| = lim m→+∞ | fn(x)− fm(x)| ≤ lim sup m ‖ fn − fm‖I,∞ ≤ sup m≥n ‖ fn − fm‖I,∞. 50 Observe que o lado direito desta cadeia de desigualdades não depende de x e é uma cota superior para todo x. Tomando o supremo, descobrimos que ‖ fn − f ‖I,∞ = sup x∈I | fn(x)− f (x)| ≤ sup m≥n ‖ fn − fm‖I,∞. Recordamos mais uma vez que { fn}n∈N ⊂ C(I, R) é Cauchy. Isto quer dizer que, dado ε > 0, podemos encontrar n0(ε) tal que, se n, m ≥ n0(ε), então ‖ fn − fm‖I,∞ < ε. Tomando o sup em m, vemos que ∃n0(ε) ∈N, ∀n ≥ n0(ε) : 0 ≤ ‖ fn − f ‖I,∞ = sup x∈I | fn(x)− f (x)| ≤ ε. Como isto vale para todo ε, deduzimos que ‖ fn − f ‖I,∞ → 0, como querı́amos demonstrar. Passo 3: f é contı́nua e o fim da prova. Falta apenas um detalhe, que é provar que f ∈ C(I, R), ou seja, que f é contı́nua (ou: o limite uniforme de funções contı́nuas é uma função contı́nua). Isto vale se e somente se para toda sequência convergente {xj}j∈N ⊂ I e todo x ∈ I, xj → x ⇒ f (xj) → f (x). Para fazer isto, basta provar que: (Basta provar) ∀ε > 0 : lim sup j | f (xj)− f (x)| ≤ 0. Para prova esta última desigualdade, observe que, pela desigualdade triangular: | f (xj)− f (x)| = | f (xj)− fn(xj) + fn(xj)− fn(x) + fn(x)− f (x)| ≤ | f (xj)− fn(xj)|+ | fn(xj)− fn(x)|+ | fn(x)− f (x)| O primeiro e o terceiro termo nesta última expressão são da forma | f (t) − fn(t)| com t ∈ I, sendo, portanto cotados pelo supremo de | f (t)− fn(t)| sobre t ∈ I, que por sua vez é exatamente ‖ f − fn‖I,∞. Ou seja, | f (xj)− f (x)| ≤ | fn(xj)− fn(x)|+ 2 ‖ fn − f ‖I,∞. Esta desigualdade vale para cada j e n. Em particular, podemos tomar j → +∞: a continuidade de fn nos garante que | fn(xj)− fn(x)| → 0 e portanto, ∀n ∈N : lim sup j∈N | f (xj)− f (x)| ≤ 2‖ fn − f ‖I,∞. Por fim, mandando n → +∞, vemos que ‖ fn − f ‖I,∞ → 0 enquanto o lado esquerdo não muda. Deduzimos: lim sup j∈N | f (xj)− f (x)| ≤ 0, o que significa | f (xj)− f (x)| → 0, como querı́amos demonstrar. Feito isso, apenas verificamos que temos todos os ingredientes em nossas mãos. Partindo de { fn}n∈N ⊂ C(I, R) Cauchy, construı́mos uma f ∈ C(I, R) tal que fn → f segundo a norma que escolhemos para C(I, R). 2 51 3.3 Equivalência de métricase normas Na seção anterior nós vimos como descrever a convergência em alguns espaços onde isso não é completamente óbvio à primeira vista. Um ponto importante de se enfatizar é que em vários casos mostramos que definições diferentes de métrica ou norma conduziram a uma única noção de convergência. Isto é um ponto importante, que merece uma definição. Definição 3.6 Considere um conjunto X 6= ∅ e duas métricas d1, d2 definidas sobre ele. Dizemos que as duas métricas são equivalentes se ∀{xn}n∈N ⊂ X, ∀x ∈ X : d1(xn, x)→ 0⇔ d2(xn, x)→ 0. Quando X é um espaço vetorial e as duas distâncias são induzidas por normas ‖ · ‖1, ‖ · ‖2, dizemos que as duas normas são equivalentes quando as métricas induzidas são equivalentes de acordo com a definição acima. Por exemplo, a Seção 3.2.2 mostra que as métricas induzidas pelas normas `p sobre Rd são todas equivalentes. Agora apresentamos um caso de não-equivalência de normas (e métricas). Exemplo 3.3 Vamos mostrar que duas normas que vimos acima sobre C([0, 1], R) não são equivalentes. A primeira é a nossa “norma preferencial”: ‖ f ‖∞ := sup t∈[0,1] | f (t)| e a segunda também é natural (e foi definida no Exercı́cio 2.18): ‖ f ‖1 := ∫ 1 0 | f (t)| dt. Como | f (t)| ≤ ‖ f ‖∞ para cada t ∈ [0, 1], vemos facilmente que ‖ f ‖1 ≤ ‖ f ‖∞ para toda f ∈ C([0, 1], R). Disto podemos facilmente deduzir que ‖ fn − f ‖∞ → 0⇒ ‖ fn − f ‖1 → 0. A recı́proca, no entanto, não é verdadeira. Considere por exemplo a sequência de funções { fn}n∈N definidas da seguinte forma: fn(t) := { 0, t ≤ 1− 1n nt− n + 1, 1− 1n < t ≤ 1. O leitor pode checar que fn ∈ C([0, 1], R) é não negativa e que ‖ fn‖1 = ∫ 1 0 fn(t) dt = 1 2n . Portanto ‖ fn − 0‖1 → 0. No entanto, para todo n ‖ fn‖∞ = fn(1) = 1 6→ 0, o que nos diz que fn 6→ 0 de acordo com a norma ‖ · ‖∞. 52 Exercı́cio 3.5 Estenda as considerações acima às demais normas ‖ · ‖p (com 1 ≤ p < +∞) apresentadas no Exercı́cio 2.18. Em resumo, as normas ‖ · ‖1 e ‖ · ‖∞ sobre C não são equivalentes porque há vetores com norma ‖ · ‖∞ “grande” (igual a 1) e norma ‖ · ‖1 “arbitrariamente pequena” (próxima de 0). O teorema a seguir e a sua prova mostram que isto é geral: duas normas são equivalentes se a razão delas (quando definida) nunca está nem muito perto de zero, nem de infinito. Teorema 3.3 Duas normas ‖ · ‖1 e ‖ · ‖2 sobre o mesmo espaço vetorial V são equivalentes se e somente se existem constantes C, c > 0 tais que ∀v ∈ V : c ‖v‖1 ≤ ‖v‖2 ≤ C ‖v‖1. Prova: Deixamos como exercı́cio provar que, se tais constantes existem, as métricas são equiva- lentes. Vejamos agora que, se as normas são equivalentes, então existem constantes C, c > 0 com as propriedades desejadas. Recorde que a equivalência das normas é a mesma coisa que a equivalência das métricas induzidas pelas normas. Portanto, nossa hipótese é que Hip: ∀{vn}n∈N ⊂ V ∀v ∈ V : ‖vn − v‖1 → 0⇔ ‖vn − v‖2 → 0. Em particular, vale o que escrevemos acima quando v = 0. Hip’: ∀{vn}n∈N ⊂ V : ‖vn‖1 → 0⇔ ‖vn‖2 → 0. Agora suporemos para chegar a uma contradição que não existe a constante C apontada acima. Ou seja (?) ∀C > 0 ∃vC ∈ V : ‖vC‖2 > C ‖vC‖1. Em particular, podemos encontrar um vetor vn ∈ V com ‖vn‖2 > (n+ 1) ‖vn‖1, para cada n ∈N. Note que tal vetor não pode ser 0 porque neste caso terı́amos ‖vn‖2 = (n + 1) ‖vn‖1. Portanto, podemos (se necessário) substituir cada vetor vn por vn/(n + 1)‖vn‖1 e deduzir que (?) ⇒ ∃{vn}n∈N ⊂ V ∀n ∈N : ‖vn‖1 = 1 n + 1 e ‖vn‖2 > (n + 1) ‖vn‖1 = 1. No entanto, isto contradiz Hip’: afinal, ‖vn‖1 → 0 e ‖vn‖2 6→ 0. Isto quer dizer que (?) nos levou a uma contradição, o que implica que existe, sim, a constante C que querı́amos encontrar. Uma prova semelhante mostra que a c > 0 desejada também existe. 2 3.4 Mais exercı́cios Exercı́cio 3.6 Seja (X, dX) um espaço métrico. Considere: d′X(x, x ′) := min{dX(x, x′), 1}. Prove que esta é outra métrica sobre X e que ela é equivalente à métrica original. Exercı́cio 3.7 Defina φ(t) := t 1 + |t| (t ∈ R). 53 1. Prove que φ é uma bijeção estritamente crescente e contı́nua entre R e (−1, 1). Obs: por um resultado de Análise na Reta, que você pode usar abaixo, o item 1 implica que φ−1 : (−1, 1) → R também é uma bijeção estritamente crescente e contı́nua. 2. Defina: d(t, s) := |φ(t)− φ(s)| ((t, s) ∈ R2). Mostre que d é uma métrica sobre R e que esta métrica é equivalente à usual. 3. Prove que a sequência {n}n∈N é Cauchy segundo d, mas não converge. Portanto, (R, d) não é completo (isso mostra que duas métricas podem ser equivalentes e ainda assim “dis- cordar” no que diz respeito a completude). Exercı́cio 3.8 (Métricas em grafos) Um grafo é um par G = (V,∼) onde V 6= ∅ é um conjunto de elementos chamados vértices e “∼” é uma relação simétrica sobre pares de elementos de V: dados x, y ∈ V, x ∼ y se e somente se y ∼ x (pares xy com x ∼ y são chamados de arestas do grafo). Dado um grafo G como acima, definimos novas relações “↔k” entre vértices para cada k ∈N, da seguinte forma: • Para k = 0, y↔0 x se e somente se y = x; • Dado k > 0, y↔k x se existe um vértice z ∈ V com y ∼ z e z↔ x. Suponha agora que G é conexo: isto é, dados x, y ∈ V, existe um k ∈ N com x ↔k y. Prove que a expressão abaixo define uma métrica sobre V: dG(x, y) := min{k ∈N : x ↔k y} (x, y,∈ V). Exercı́cio 3.9 Considere Ψ : [0,+∞)→ [0,+∞). Seja (X, dX) um espaço métrico e defina dX,ψ(x, x′) := Ψ(dX(x, x′)). Dê condições suficientes sobre Ψ para que dX,ψ seja uma nova métrica sobre X, para qualquer (X, dX). Exercı́cio 3.10 (Métricas produto) Suponha que (Xi, dXi), i = 1, . . . , d, são espaços métricos. Escreve- remos os elementos de X := X1 × X2 × · · · × Xd como x = (x[1], . . . , x[d]), com cada coordenada x[i] ∈ Xi. Mostre que, para qualquer p ∈ [1,+∞), a expressão dp(x, y) := p √√√√ d∑ i=1 dXi(x[i], y[i])p (x, y ∈ X) define uma métrica sobre X. Mostre ainda que d∞(x, y) := max 1≤i≤k dXi(x[i], y[i]) p (x, y ∈ X) também define uma métrica sobre X. Prove ainda que uma sequência {xn}n∈N ⊂ X converge a um x ∈ X e acordo com a métrica dp (com 1 ≤ p ≤ +∞) se e somente se {xn[i]}n∈N ⊂ Xi converge x[i] ∈ X para cada coordenada 1 ≤ i ≤ d. Prove um resultado semelhante para a propriedade de Cauchy e deduza que (X, dp) é completo se e somente se cada espaço (Xi, dp) é completo. Mostre ainda que as métricas definidas acima são todas equivalentes umas às outras. 54 Exercı́cio 3.11 Considere um espaço vetorial V. Já vimos que uma norma sobre V induz naturalmente uma métrica sobre V. No entanto, nem toda métrica sobre V vem de uma norma. Dê condições necessárias e suficientes que uma métrica dV deve satisfazer para que exista uma norma ‖ · ‖V tal que ∀v, w ∈ V : ‖v− w‖V = dV(v, w). Exercı́cio 3.12 Mostre que a métrica discreta e a métrica induzida por R são equivalentes sobre N ou Z, mas não sobre Q. Exercı́cio 3.13 Suponha que (V, ‖ · ‖V) é um espaço vetorial completo e ‖ · ‖′V é uma outra norma sobre V. Se as duas normas são equivalentes, é necessariamente verdade que (V, ‖ · ‖′V) é completo? Exercı́cio 3.14 Considere uma famı́lia enumerável de espaços métricos (Xi, di), i ∈ N\{0}. Chamamos de X o produto cartesiano infinito X := X1 × X2 × X3 × X4 × . . . e denotamos os elementos x ∈ X com x = (x[i])+∞i=1 , com cada x[i] ∈ Xi. Mostre que a expressão dX(x, y) := +∞ ∑ i=1 2−i min{di(x[i], y[i]), 1} (x, y ∈ X) define uma métrica sobre X e que ∀{xn}n∈N ⊂ X, ∀x ∈ X : dX(xn, x)→ 0⇔ ∀i ∈N\{0}, di(xn[i], x[i])→ 0. Prove ainda que (X, dX) é completo se e somente se cada (Xi, di) é completo. Exercı́cio 3.15 Dado um espaço métrico (X, dX), dizemos que D ⊂ X é denso em X se e somente se todo elemento de X é o limite de alguma sequência de elementos de D. Dizemos que (X, dX) é separável se X tem um subconjunto denso e enumerável. Prove que Rd e C([0, 1], R) são separáveis com suas métricas usuais. Exercı́cio 3.16 Defina `∞(N)como sendo o conjunto de todas as sequências limitadas {an}n∈N ⊂ R. Defina uma função sobre este espaço da seguinte forma: ‖{an}n∈N‖∞ := sup n∈N |an| ({an}n∈N ∈ `∞(N)). Prove que podemos dar a `∞(N) uma estrutura de espaço vetorial segundo a qual (`∞(N), ‖ · ‖∞) é um espaço vetorial normado completo. Este espaço é separável? Exercı́cio 3.17 (Um teorema de Fréchet) A tese de doutorado de Maurice Fréchet introduziu os concei- tos gerais de espaço métrico e compacidade. Ele também demonstrou o seguinte resultado. Teorema: todo espaço métrico (X, dX) separável e de diâmetro finito pode ser “posto dentro de `∞(N)” no seguinte sentido: se ‖ · ‖∞ é a norma do problema anterior, então: (?) ∃φ : X → `∞(N) ∀x, x′ ∈ X : ‖φ(x)− φ(x′)‖∞ = dX(x, x′). 55 Ou seja, há uma bijeção que preserva distâncias entre X (com a métrica dX) e um subconjunto S = φ(X) ⊂ `∞(N) (com a métrica induzida por `∞(N)). Note que o diâmetro de (X, dX) é definido por diam(X, dX) := supx,x′∈X dX(x, x ′). Para definir esta função φ, seja {xn}n∈N uma enumeração de um subconjunto denso de X. Dado x ∈ X, definimos: φ(x) := {an(x)}n∈N, onde an(x) := dX(x, xn) (n ∈N) Ou seja, φ(x) “lista” a distância de x a cada um dos pontos da sequência {xn}n∈N. Prove que esta função satisfaz (?). 56 Capı́tulo 4 Funções e continuidade O capı́tulo anterior nos ensinou o que é convergência em espaços métricos. Isto nos permite definir continuidade de maneira fácil. Definição 4.1 Considere dois espaços métricos (X, dX) e (Y, dY) e D ⊂ X Dizemos que f : D → Y é contı́nua em x ∈ D se ∀{xn}n∈N ⊂ D : xn → x ∈ D ⇒ f (xn)→ f (x). Dito de outro modo, queremos que: ∀{xn}n∈N ⊂ D, ∀x ∈ D : dX(xn, x)→ 0⇒ dY( f (xn), f (x))→ 0. Dizemos que f é (simplesmente) contı́nua se ela é contı́nua em todos os pontos do domı́nio D. Esta definição é das mais importantes do curso e vamos gastar bastante tempo analisando- a e testando-a em exemplos. Uma primeira observação (praticamente trivial) está contida no exercı́cio a seguir. Exercı́cio 4.1 Formalize e prove a seguinte afirmação: a composição de funções contı́nuas é uma função contı́nua. Outra observação às vezes útil é que: Exercı́cio 4.2 A noção de continuidade não é modificada se as métricas do domı́nio e do contradomı́nio são trocadas por outras métricas equivalentes. Veremos a seguir alguns exemplos de funções contı́nuas. 4.1 Funções contı́nuas de X em R Aqui o melhor é proceder a partir de exemplos. Em primeiro lugar, conhecemos as funções contı́nuas f : D → R com D ⊂ R. Tome agora uma nova função: fi : x ∈ Di := {z ∈ Rd : z[i] ∈ D} 7→ f (x[i]) ∈ R. 57 Por exemplo, se f (t) = log t, com domı́nio D = R+, fi(x) := log x[i], com domı́nio Di := {z ∈ Rd : z[i] ∈ R+}. Dizemos que este tipo de função só depende da i-ésima coordenada. Afirmamos que esta função é contı́nua sempre que a f original é contı́nua. Para isto, pre- cisamos provar que, se {xn}n∈N ⊂ Di é uma sequência arbitrária com xn → x ∈ Di, então fi(xn)→ fi(x). Para demonstrar isso, recorde que nosso critério de convergência para sequências em Rd nos diz que xn[i]→ x[i] em R. Além disso, a definição de Di garante que {xn[i]}n∈N ⊂ D, x ∈ D. Concluı́mos que f (xn[i])→ f (x[i]) porque f é contı́nua sobre D. Ou seja, fi(xn)→ fi(x), como querı́amos demonstrar. Vejamos agora alguns exemplos mais interessantes. Exercı́cio 4.3 Sabemos que o limite de um produto ou soma de sequências convergentes é o produto (ou soma) dos limites. Deduza disto que, se D ⊂ X e f , g : D → R são contı́nuas, o mesmo vale para λ f + g e f g (com λ ∈ R fixo). Com a hipótese adicional de que g não se anula, prove que f /g também é contı́nua. Exercı́cio 4.4 Chame uma função f : Rd → R de polinômio multivariado se existem um k ∈ N e coeficientes reais α(p1,...pd) com (p1, . . . , pd) ∈ [k] d com f (x) = ∑ (p1,...,pd)∈[k]d α(p1,...pd) (x[1]) p1 (x[2])p2 . . . (x[d])pd (x ∈ Rd). Prove que todo polinômio multivariado é função contı́nua. Exercı́cio 4.5 Mostre que as normas ‖ · ‖p, 1 ≤ p ≤ +∞, são funções contı́nuas de Rd em R. 4.2 Funções Lipschitz e distâncias Continuando na linha anterior, vamos definir e analisar a continuidade de algumas funções baseadas em distâncias. Para isso vai ser útil introduzir o conceito de função Lipschitz. Definição 4.2 Considere dois espaços métricos (X, dX) e (Y, dY) e D ⊂ X Dada uma constante L > 0, dizemos que f : D → Y é L-Lipschitz se ∀x, x′ ∈ D : dY( f (x), f (x′)) ≤ L dX(x, x′). Já é sabido de Análise na Reta que funções L-Lipschitz são contı́nuas. Verifiquemos isto para espaços métricos arbitrários. Suponha f : D → Y é L-Lipschitz, {xn}n∈N ∪ {x} ⊂ D e xn → x, isto é, dX(xn, x)→ 0. Veja que 0 ≤ dY( f (xn), f (x)) ≤ L dX(xn, x)→ 0, logo dY( f (xn), f (x)) está entre duas sequências que vão a 0. Deduzimos que dY( f (xn), f (x))→ 0, ou seja f (xn) → f (x). Como isto vale para todos {xn}n∈N ∪ {x} e f como acima, podemos deduzir que funções Lipschitz são sempre contı́nuas. Observação 4.1 Uma notação útil para a constante de Lipschitz de uma f : D → Y é a seguinte: ‖ f ‖Lip := sup x,x′∈D, x 6=x′ dY( f (x), f (x′)) dX( f (x), f (x′) . Este é um supremo de números não-negativos e, portanto, pertence a R ∪ {+∞}. Como veremos num dos exercı́cios, f é L-Lipschitz para algum L > 0 se e somente se ‖ f ‖Lip < +∞. Além disso, quando ‖ f ‖Lip < +∞, então ‖ f ‖Lip < +∞ é a menor constante de Lipschitz possı́vel para f . 58 Nos próximos exemplos, observamos que algumas funções f : X → R derivadas da distância dX são 1-Lipschitz. Exemplo 4.1 Fixo x0 ∈ X, a função x ∈ X 7→ dX(x, x0) ∈ R é 1-Lipschitz. De fato, para quaisquer x, x′ ∈ X, a desigualdade triangular nos diz que dX(x, x0) ≤ dX(x′, x0) + dX(x, x′) e dX(x′, x0) ≤ dX(x, x0) + dX(x, x′), portanto dR(dX(x, x0), dX(x′, x0)) = |dX(x, x0)− dX(x′, x0)| ≤ dX(x, x′). Exemplo 4.2 Fixe agora um conjunto S ⊂ X, a função x ∈ X 7→ dX(x, S) := inf s∈S dX(x, s) ∈ R é bem definida, no sentido que os valores dX(x, s) são todos cotados inferiormente por 0 (afinal, a métrica é positiva definida). Veja que, do mesmo jeito que provamos acima, dX(x, S) = inf s∈S dX(x, s) ≤ inf s∈S (dX(x′, s) + dX(x, x′)) = dX(x′, S) + dX(x, x′). Repetindo a conta trocando os papeis de x e x′ e reusando as ideias da prova anterior, deduzimos que dR(dX(x, S), dX(x′, S)) = |dX(x, x0)− dX(x′, x0)| ≤ dX(x, x′). Exemplo 4.3 Como um último exemplo, tomamos uma sequência de Cauchy {xn}n∈N ⊂ X. Afirmamos que a expressão f (x) := lim n dX(x, xn) (x ∈ X) define uma função 1-Lipschitz f : X → R. Para provar isso, primeiro temos que mostrar que o valor de f (x) está bem definido para todo x ∈ X. Ou seja, devemos provar que o limite acima existe. Para isso, basta reusar um exemplo acima e observar que quando m, n→ +∞, |dX(x, xn)− dX(x, xm)| ≤ dX(xn, xm)→ 0. Deste modo, para cada x ∈ X fixo, a sequência de números reais {dX(x, xn)}n é Cauchy e portanto convergente. Para provar que f é 1-Lipschitz, tomamos x, x′ ∈ X arbitrários e, novamente usando as ideias anteriores, observamos o seguinte: | f (x)− f (x′)| = lim n∈N |dX(x, xn)− dX(x′, xn)| ≤ dX(x, x′). A principal “graça” deste problema é que ele resulta no exercı́cio a seguir, que será importante quando estudarmos conjuntos compactos. Exercı́cio 4.6 Prove que, se (X, dX) não é completo, então existe uma função f : X → (0, 1] com f (x) > 0 para todo x ∈ X, mas infx∈X f (x) = 0. 59 4.3 Funções contı́nuas sobre o espaço de funções contı́nuas Consideremos agora o espaço C := C(I, R), com I = [a, b] ⊂ R um intervalo fechado e limitado munido da norma ‖ · ‖C := ‖ · ‖I,∞. Os elementos de C são funções contı́nuas f : I → R. Mas também podemos definir algumas funções contı́nuas sobre este espaço. Eis alguns exemplos naturais. Exemplo 4.4 Dado t ∈ I, defina a aplicação et : C → R que leva f ∈ C em f (t). Esta é uma função de C em R. Vejaque, dadas f , g ∈ C |et( f )− et(g)| = | f (t)− g(t)| ≤ sup s∈I | f (s)− g(s)| = ‖ f − g‖I,∞. Portanto, et é uma aplicação 1-Lipschitz de C em R. Em particular, ela é uma aplicação contı́nua. Exemplo 4.5 Dados a ≤ x, y ≤ b, defina a aplicação Ix,y : C → R que leva f ∈ C na integral definida Ix,y( f ) := ∫ y x f (t) dt ∈ R. Esta também é uma função de C em R. Dadas f , g ∈ C, as propriedades usuais da integral definida nos dizem que: |Ix,y( f )− Ix,y(g)| = ∣∣∣∣∫ yx ( f (t)− g(t)) dt ∣∣∣∣ ≤ |x− y| sup t∈[x,y] | f (t)− g(t)| ≤ |y− x| sup t∈I | f (t)− g(t)| ≤ |y− x| ‖ f − g‖I,∞. Ou seja, Ix,y é uma função L-Lipschitz de C em R, com L := |y− x|. Exemplo 4.6 Vamos agora considerar uma função de I : C → C que associa a cada f ∈ C uma nova função I( f ) ∈ C. Para definir esta função I( f ) precisamos definir para cada t ∈ I um valor I( f )(t). Faremos isso dizendo que I( f )(t) := ∫ t a f (s) ds (t ∈ I). Ou seja, I( f ) é a única função com as seguintes duas propriedades: a derivada de I( f ) é f e I( f )(a) = 0. Obviamente I( f ) ∈ C, pois toda função diferenciável é contı́nua. Provemos agora que I : C → C é (b− a)-Lipschitz. O que queremos é mostrar que, dadas f , g ∈ C: ‖I( f )− I(g)‖I,∞ = sup t∈I ∣∣∣∣∫ ta ( f (s)− g(s)) ds ∣∣∣∣ ≤ (b− a) ‖ f − g‖I,∞. Mas isto segue do fato que | ∫ t a ( f (s)− g(s)) ds| ≤ (t− a) sups∈[a,t] | f (s)− g(s)| para cada t ∈ I. Exercı́cio 4.7 Mostre que Ix,y = ey ◦ I − ex ◦ I . 60 Exemplo 4.7 (EDOs e pontos fixos) Dados (t0, x0) ∈ R×R e Ψ : R → R contı́nua, definimos uma nova aplicação TΨ,t0,x0 : C → C da seguinte forma: dada f ∈ C, TΨ,t0,x0( f ) ∈ C é a função cujos valores em cada ponto t ∈ I são dados por TΨ,t0,x0( f )(t) := x0 + ∫ t t0 Ψ( f (s)) ds. Novamente é fácil ver que TΨ,t0,x0 é uma função dem-definida de C em C. A importância dela tem a ver com a teoria de equações diferenciais ordinárias (ou EDOs). De fato, é um exercı́cio mostrar que uma função f : I → R resolve o problema de Cauchy autônomo no tempo{ f ′(t) = Ψ( f (t)) (t ∈ I) f (t0) = x0 se e somente se f é um ponto fixo de TΨ,t0,x0 , ou seja, f = TΨ,t0,x0( f ). Mais adiante desenvolveremos ferramentas para provar que certas funções contı́nuas têm um único ponto fixo, provando assim que o problema de Cauchy acima tem uma única solução. Queremos agora provar que T = TΨ,t0,x0 é contı́nua. Ou seja, dadas { fn}n∈N ∪ { f } ⊂ C, precisamos mostrar que: ‖ fn − f ‖∞ → 0⇒ ‖T ( fn)− T ( f )‖∞ → 0. Vamos proceder por partes. Note que ‖T ( fn)− T ( f )‖∞ = ‖I(Ψ ◦ fn)− I(Ψ ◦ f )‖∞ ≤ (b− a) ‖Ψ ◦ fn −Ψ ◦ f ‖∞. Portanto, o que precisamos é provar que Ψ ◦ fn converge a Ψ ◦ f uniformemente sobre I. Ou seja, queremos mostrar que: ∀ε > 0 ∃n0 ∈N ∀n ≥ n0 : ‖Ψ ◦ fn −Ψ ◦ f ‖∞ ≤ ε. Antes de partir para prova, faremos algumas observações. A convergência pontual está asse- gurada porque Ψ é contı́nua e fn → f pontualmente, de modo que: ∀t ∈ I : fn(t)→ f (t) e portanto Ψ ◦ fn(t) = Ψ( fn(t))→ Ψ( f (t)) = Ψ ◦ f (t). A convergência uniforme é um pouco mais sutil. O fato de que fn(t) converge uniformemente a f (t) não implica diretamente que Ψ ◦ fn(t) → Ψ ◦ f (t) de forma uniforme. Para isso, teremos de usar o fato que Ψ é uniformemente contı́nua sobre intervalos compactos. Ou seja, precisamos nos recordar que: ∀M > 0 ∀η > 0 ∃δ = δ(M, η) > 0 : ∀x, y ∈ [−M, M], |x− y| ≤ δ⇒ |Ψ(x)−Ψ(y)| ≤ ε. Note que, em nossa prova, queremos estudar os valores de |Ψ(x)− Ψ(y)| quando x = fn(t) e y = f (t). Por isso, tomaremos M de modo que os valores de fn(t) e f (t) estejam em [−M, M] para todo n. De fato, veja que 0 ≤ |‖ fn‖∞ − ‖ f ‖∞| ≤ ‖ fn − f ‖∞ → 0⇒ ‖ fn‖∞ → ‖ f ‖∞ ⇒ M := sup n∈N ‖ fn‖∞ < +∞. 61 Com essa escolha de M, temos que ∀n ∈N, ∀t ∈ I : | fn(t)| ≤ ‖ fn‖∞ ≤ M, ou seja, fn(t) ∈ [−M, M] e o mesmo vale para os valores de f (t). Fixo este M, e dado um ε > 0, podemos tomar δ = δ(M, ε). Sabemos que existe um n0 = n0(ε) tal que: ∀n ≥ n0, ∀t ∈ I : fn(t), f (t) ∈ [−M, M] e | fn(t)− f (t)| ≤ ‖ fn − f ‖∞ ≤ δ. Portanto, pela nossa escolha de δ, ∀n ≥ n0 ∀t ∈ I : |Ψ( fn(t))−Ψ( f (t))| ≤ ε. Ou seja: ∀n ≥ n0 : ‖Ψ ◦ fn −Ψ ◦ f ‖∞ ≤ ε. Trocando em miúdos, dado ε > 0, fomos capazes de encontrar n0 tal que para todo n ≥ n0 vale que ‖Ψ ◦ fn −Ψ ◦ f ‖∞ ≤ ε. Nosso último exemplo é de uma função que não é contı́nua. Exemplo 4.8 Suponha I = [0, 1] e seja D ⊂ C(I, R) o conjunto de todas as funções diferenciáveis em t = 1/2. Defina D : D → R como D( f ) := f ′(1/2), f ∈ D. Argumentamos que D não é contı́nua. De fato, basta observar que existem funções próximas de 0 na norma do sup que têm derivada arbitrariamente grande em t = 1/2. Por exemplo, tomando fk(x) := 1 k sin(k2(x− 1/2)), (x ∈ [0, 1]) temos que ‖ fk‖I,∞ = 1/k→ 0, mas D( fk) = f ′k(1/2) = k→ +∞. A observação inocente de que a derivada não é contı́nua tem consequências importantes. Um problema que abordaremos mais tarde é o de diferenciar uma função f = limk fk. Gostarı́amos de dizer que f ′(t) = limk→+∞ f ′k(t), mas, como vimos acima, isto nem sempre é verdade. Deste modo, o problema de diferenciar um limite de funções não é trivial. Em geral só conseguiremos tratar este problema trocando a derivada, que é mal comportada, por um problema equivalente envolvendo integrais. Por exemplo, é por esta razão que formulamos o problema de Cauchy em termos de integrais e não de derivadas. 4.4 Funções contı́nuas de X em Rd Aqui só temos uma observação a fazer. Se f : D ⊂ X → Rd e x ∈ D são dados, podemos escrever o vetor f (x) ∈ Rd em coordenadas f (x) = ( f [1](x), f [2](x), . . . , f [d](x)). Isto induz funções f [i] : X → R. Como a convergência de elementos de Rd é equivalente à convergência de todas as coordenadas, vemos que f (xn) → f (x) se e somente se f [i](xn) → f [i](x) para cada 1 ≤ i ≤ d. Usando isto, não é difı́cil provar o resultado a seguir. Exercı́cio 4.8 Prove que f : D ⊂ X → Rd é contı́nua em x ∈ D se e somente se cada uma das funções- coordenada f [i] : D → X definidas acima é contı́nua. 62 4.5 Transformações e funcionais lineares Uma classe especial de funções (possivelmente) contı́nuas merece uma consideração especial. Definição 4.3 Se V, W são espaços vetoriais reais, uma função T : V → W é dita uma transformação linear se: ∀v, v′ ∈ V, ∀λ ∈ R : T(λ v + v′) = λT(v) + T(v′). Se W = R, dizemos que T é um funcional linear. Se V = Rd e W = R`, sabemos de Álgebra Linear que há uma correspondência entre transformações lineares e matrizes. Isso será útil para o exemplo a seguir. Exemplo 4.9 Qualquer transformação linear T : Rd → R` é Lipschitz (e portanto contı́nua), quando botamos a norma `p1 em Rd e a norma `p2 em R`. De fato, sabemos que existe um elemento AT ∈ R`×d que representa T, no sentido que ATv = T(v) para todo v ∈ Rd. Recordando a definição da norma de operador no Exemplo 2.6, deduzimos que: ‖T‖Lip := sup v,v′∈Rd, v 6=v′ |T(v)− T(v′)|p2 |v− v′|p1 (linearidade de T) = sup v,v′∈Rd, v 6=v′ |T(v− v′)|p2 |v− v′|p1 (tome h = v− v′) = sup h∈Rd, h 6=0 Rd |T(h)|p2 |h|p1 (AT representa T + def. da norma de op.) = sup h∈Rd, h 6=0 Rd |ATh|p2 |h|p1 = ‖AT‖p1→p2 < +∞. Em geral, transformações lineares no espaço das funções contı́nuas (ou em subespaços dele) podem não ser contı́nuas. No entanto, vimos acima dois exemplos importantes de transformações que são, sim, contı́nuas; de fato, ambas são Lipschitz. Exemplo 4.10 Usando a notação da Seção 4.3, as funções et, Ix,y : C → R são funcionais lineares contı́nuos (posto que Lipschitz), I : C → C também é Lipschitz (logo contı́nua) e TΨ,t0,x0 em geral não é linear. O operador D é um funcional linear descontı́nuo sobre o subconjunto D ⊂ C das funções diferenciáveis em t = 1/2, que também é um espaço vetorial real. O teorema abaixo nos diz que uma transformação linear é contı́nua se e somente se é Lips- chitz. Teorema 4.1 Considere dois espaços vetoriais reais normados (V, ‖ · ‖V), (W, ‖ · ‖W). Dada umatransformação linear T : V →W, são equivalentes: 1. T é limitada, ou seja: ‖T‖V→W := sup v∈V,‖v‖V=1 ‖T(v)‖W < +∞. 63 2. T é L-Lipschitz para algum L > 0. 3. T é contı́nua no ponto 0V . Prova: 1⇒2. Chame de L := ‖T‖V→W . Afirmamos que para quaisquer v, v′ ∈ V vale a desi- gualdade ‖T(v) − T(v′)‖W ≤ L ‖v − v′‖V . De fato, esta desigualdade é trivialmente satisfeita se v = v′. Caso contrário, podemos olhar para o vetor z := (v− v′)/‖v− v′‖V ; ele tem norma ‖z‖V = 1 e portanto ‖T(z)‖W ≤ ‖T‖V→W = L. Deduzimos por linearidade que T(z) = T(v)− T(v′) ‖v− v′‖V , portanto ‖T(v)− T(v′)‖W ‖v− v′‖V = ‖T(z)‖W ≤ L, como querı́amos demonstrar. 2⇒3 é direto. 3⇒1. A ideia da prova é muito semelhante à que usamos na prova do Teorema 3.3. Supondo (para chegar a uma contradição) que T não é limitado, podemos encontrar, para cada n ∈ N, um vetor vn ∈ V com ‖vn‖V = 1 e ‖T(vn)‖W ≥ n + 1. Isto quer dizer que, por um lado, vn/(n + 1)→ 0V , mas, por outro lado (usando linearidade),∥∥∥∥T( vnn + 1 )∥∥∥∥ W = ‖T(vn)‖W n + 1 = 1 6→ 0. Isto quer dizer que T não é contı́nuo, o que contradiz a hipótese 3. Deduzimos que T é, sim, limitado, como querı́amos demonstrar. 2 Exercı́cio 4.9 Prove que, de fato, ‖T‖V→W = sup v∈V\{0}V ‖Tv‖W ‖v‖V = ‖T‖Lip e que, portanto, ‖Tv‖W ≤ ‖T‖V→W ‖v‖V para todo v ∈ V. Exercı́cio 4.10 Chame de L(V, W) o espaço das transformações lineares limitadas entre V e W (como no teorema acima), com a estrutura ”natural” de soma e produto por escalar. Mostre que (L(V, W), ‖ · ‖V→W) é espaço vetorial normado. Prove ainda que este espaço é Banach sempre que (W, ‖ · ‖W) é Banach. [Dica: a ideia para provar que é espaço normado é mostrar logo de cara que ‖ · ‖V→W é subaditiva. Para provar que é Banach, mostre que, se {Tn}n∈N ⊂ L(V, W) é uma sequência de Cauchy, então {Tnv}b∈N é Cauchy para qualquer v ∈ V; deduza que há convergência pontual e pode-se definir um limite Tv = limn Tnv. Não é difı́cil provar que T é linear pela convergência pontual. Como provar que T ∈ L(V, W) e ‖Tn − T‖V→W → 0?] 64 4.6 Transformações multilineares e tensores Uma extensão importante das espaços vetoriais é a de transformações multilineares. Definição 4.4 Considere espaços vetoriais reais V1, V2, . . . , Vk, W com suas respectivas normas. Uma função: Q : V1 ×V2 × · · · ×Vk →W é dita transformação k-linear se é linear em cada argumento, isto é, se, dados um ı́ndice i ∈ [k] e vetores vj ∈ Vj, j ∈ [k]\{i}, a função Qi : ṽi ∈ Vi 7→ Q(v1, . . . , vi−1, ṽi, vi+1, . . . , vk) ∈W é uma transformação linear de Vi em W. Dizemos que Q é limitada se ‖Q‖V1×...Vk→W := sup (v1,...,vk)∈(V1\{0V1})×···×(Vk\{0Vk}) ‖Q(v1, v2, . . . , vk)‖W ∏ki=1 ‖vi‖Vi < +∞. Ou seja, Q é multilinear se é “linear em cada coordenada”. Veremos mais adiante no curso que as funções k-lineares aparecem como as derivadas de ordem k de funções entre espaços vetoriais. Logo de cara, provamos um teorema parecido com o Teorema 4.1 relacionando continuidade e limitação. Teorema 4.2 No contexto da definição acima, dote o espaço produto V := V1 ×V2 × · · · ×Vk da norma: ‖(v1, . . . , vk)‖V := k ∑ i=1 ‖vi‖Vi ((v1, . . . , vk) ∈ V). Então Q : V →W é contı́nua se e somente se é limitada. Veja que, neste caso, não garantimos que Q é Lipschitz. De fato, funções bilienares em geral não são Lipschitz. O exemplo mais simples é o da função produto Q : R×R→ R que leva (x, y) em xy. Prova: Vamos começar provando que “limitada⇒contı́nua”. Suponha que L := ‖Q‖V1×...Vk→W < +∞. Imagine que temos uma sequência {vn}n∈N ⊂ V e um ponto v ∈ V com vn → v. Nosso objetivo será mostrar que Q(vn)→ Q(v). Escrevemos vn = (vn,1, vn,2, . . . , vn,k) ∈ V1 ×V2 × · · · ×Vk e v = (v1, v2, . . . , vk) ∈ V1 ×V2 × · · · ×Vk. A ideia principal da prova é a seguinte. A convergência vn → v implica que vn,i → vi, como veremos a seguir. Deste modo, esperamos que vn,i esteja próximo de vi para n grande. Nossa ideia será usar essa proximidade “coordenada a coordenada” para comparar Q(vn) e Q(v). Para isso, vamos tentar escrever Q(v)− Q(vn) passando de v a vn de uma forma que só muda uma coordenada de cada vez, porque aı́ poderemos usar a linearidade. 65 Para ilustrar isso, vamos considerar o caso em que k = 2 e Q é bilinear. Dados v = (v1, v2), u = (u1, u2) ∈ V podemos escrever: Q(v1, v2)−Q(u1, u2) = Q(v1, v2)−Q(u1, v2)+Q(u1, v2)−Q(u1, u2) = Q(v1−u1, v2)+Q(u1, v2−u2). Portanto, ‖Q(v1, v2)−Q(u1, u2)‖ ≤ ‖Q‖V→W‖v1 − u1‖V1 ‖v2‖V2 + ‖Q‖V→W ‖u1‖V1‖v2 − u2‖V2 . Disso podemos deduzir que, se u1 → v1 e u2 → v2, então Q(u1, u2) → Q(v1, v2). Daremos mais detalhes abaixo na prova para Q geral. Comecemos com a parte de convergência. Nossa hipótese diz que ‖v− vn‖V = k ∑ i=1 ‖vi − vn,i‖Vi → 0. Como os termos da soma acima são não-negativos, temos que 0 ≤ min 1≤i≤k ‖vi − vn,i‖Vi ≤ max1≤i≤k ‖vi − vn,i‖Vi → 0. Portanto, ∀1 ≤ i ≤ k : ‖vi − vn,i‖Vi → 0. Em particular, cada sequência ‖vi − vn,i‖Vi é limitada, de modo que existe um C > 0 com ∀1 ≤ i ≤ k, ∀n ∈N : ‖vi − vn,i‖Vi ≤ C. Consideramos agora termos “intermediários”w(j)n entre vn e v, com j = 0, . . . , k, que definimos da seguinte forma. w(j)n = (w (j) n,1, w (j) n,2, . . . , w (j) n,k) ∈ V1 ×V2 × · · · ×Vk onde w(j)n,i = { vn,i, i ≤ j; vi, i > j. (i ∈ [k]) Deste modo, w(0)n = v, w (k) n = vn e cada w (j) n difere de w (j−1) n apenas na j-ésima coordenada. Usando uma soma telescópica, podemos escrever: Q(v)−Q(vn) = k ∑ j=1 Q(w(j)n )−Q(w (j−1) n ). Portanto, ‖Q(v)−Q(vn)‖W ≤ k ∑ j=1 ‖Q(w(j)n )−Q(w (j−1) n )‖W . Recorde agora que cada w(j)n difere de w (j−1) n apenas na j-ésima coordenada. Esse é o tipo de situação em que a multilinearidade de Q se aplica. Mais exatamente, vemos que Q(w(j)n )−Q(w (j−1) n ) = Q(x (j) n,1, . . . , x (j) n,k) onde x (j) n,k = vn,i, i < j; vn,j − vj, i = j; vi, i > j. (i ∈ [k]). 66 Portanto, ‖Q(w(j)n )−Q(w (j−1) n )‖W ≤ ‖Q‖V1×···×Vk→W k ∏ j=1 ‖x(j)n,k‖Vj ≤ L C k−1 ‖vn,j − vj‖Vj . Deduzimos que ‖Q(v)−Q(vn)‖W ≤ L Ck−1 k ∑ j=1 ‖vn,j − vj‖W → 0, como querı́amos demonstrar. Resta provar que “contı́nua⇒limitada”. De fato, usaremos a forma contrapositiva “não- limitada⇒não-contı́nua”. Se Q não é limitada, então para qualquer n ∈ N existem vn,1 ∈ V1\{0V1}, . . . , vn,k ∈ Vk\{0Vk} com ‖Q(vn,1, vn,2, . . . , vn,k)‖W ∏ki=1 ‖vn,i‖Vi ≥ n. Se definimos un,i = vn,i/ ln n‖vn,i‖Vi e un = (un,1, . . . , un,k) ∈ V, vemos que Q(un,1, un,2, . . . , un,k) = Q(vn,1, vn,2, . . . , vn,k) ∏ki=1 (ln n ‖vn,i‖Vi) e portanto ‖Q(un,1, un,2, . . . , un,k)‖W ≥ n/(ln n)k → +∞. Por outro lado, ‖(un,1, un,2, . . . , un,k)‖V = k ∑ i=1 ‖un,i‖Vi = k ln n → 0. Portanto, achamos uma sequência {un}n∈N ⊂ V que converge a 0V , sem que Q(un) converja a Q(0V). 2 Exercı́cio 4.11 Por que escolhemos a função ln n na hora de “renormalizar os vn,i” na prova acima? Mostre que, de fato, poderı́amos ter tomado a função n1/k−a acima, com qualquer 0 < a < 1/k, e a mesma estratégia ainda funcionaria. Exercı́cio 4.12 Chame de Lk(V1 × · · · × Vk, W) o espaço das transformações k-lineares limitadas entre V1, . . . , Vk e W (como no teorema acima), com a estrutura ”natural” de soma e produto por escalar. Mostre que (Lk(V1 × · · · ×Vk, W), ‖ · ‖V1×···×Vk→W) é espaço vetorial normado. Prove ainda que este espaço é Banach sempre que (W, ‖ · ‖W)é Banach. 67 4.6.1 Tensores em dimensão finita Como são as funções multilineares Q : Rd1 ×Rd2 × . . . Rdk → R com k ≥ 2? Vamos chamar de {e(dj)i } dj i=1 a base canônica de R dj . Como todo xj ∈ Rdj é da forma xj = dj ∑ i=1 xj[i] e (dj) i temos que Q(x1, . . . , xk) = d1 ∑ i1=1 · · · dk ∑ ik=1 A[i1, . . . , ik] k ∏ j=1 xj[ij] (x1 ∈ Rd1 , . . . , xk ∈ Rdk). (4.1) onde A[i1, . . . , ik] := Q(e (d1) i1 , . . . , e(dk)ik ) ∈ R. Do mesmo modo, se chamados de tensor qualquer elemento do espaço Rd1×d2×···×dk := {A = (A[i1, . . . , ik])i1∈[d1]....,ik∈[dk ] : cada A[i1, . . . , ik] ∈ R}, vemos que cada tensor defineuma transformação multilinear de Rd1 × . . . Rdk em R. Portanto, há uma correspondência biunı́voca entre tensores e tais transformações. Em particular, no caso k = 2, os tensores são matrizes as funções bilineares correspondentes são formas quadráticas. Q(x, y) = x · Ay para alguma matriz A. A extensão para o caso em que o contradomı́nio é (W, ‖ · ‖W) é imediata. Um ponto importante é que, no contexto em que estamos trabalhando, toda Q multilinear é contı́nua. Proposição 4.1 Toda transformação multilinear Q : Rd1 ×Rd2 × . . . Rdk → R é contı́nua. Prova: Como sabemos, basta provar que Q é limitada. Considere o tensor A correspondente e chame de L := max (i1,...,ik)∈[d1]×···×[dk ] |A[i1, . . . , ik]|. Veja que, dado (x1, . . . , xk) no domı́nio do tensor: |Q(x1, . . . , xk)| = ∣∣∣∣∣ d1∑i1=1 · · · dk ∑ ik=1 A[i1, . . . , ik] x1[i1] x2[i2] . . . xk[ik] ∣∣∣∣∣ ≤ d1 ∑ i1=1 · · · dk ∑ ik=1 |A[i1, . . . , ik]| |x1[i1]| |x2[i2]| . . . |xk[ik]| ≤ L d1 ∑ i1=1 · · · dk ∑ ik=1 |x1[i1]| |x2[i2]| . . . |xk[ik]| = L k ∏ i=1 ‖xi‖1 ≤ L d k2 k ∏ i=1 ‖xi‖2. Deduzimos que a norma de Q é no máximo L dk/2. 2 68 4.6.2 Alguns exemplos em dimensão infinita Agora tomamos C = C(I, R) com I = [a, b], a < b reais. Veremos dois exemplos de transformação bilinear de C× C em C. Exemplo 4.11 (Produto) Defina Prod : C× C → C via a fórmula Prod( f , g) := f g. Ou seja, a função Prod toma como entrada duas funções contı́nuas e retorna seu produto f g. Como o produto de funções contı́nuas é uma função contı́nua, esta é uma aplicação bem definida de C× C em C. A bilinearidade de Prod fica como exercı́cio. Para mostrar que esta aplicação é limitada, e portanto contı́nua, basta observar que: ‖Prod( f , g)‖∞ ≤ ‖ f ‖∞ ‖g‖∞ e portanto ‖Prod‖C×C→C ≤ 1. Exemplo 4.12 (Convolução) Suponha para simplificar que [a, b] = [0, 1]. Defina Conv : C × C → C via a fórmula Conv( f , g)(t) = f ∗ g(t) := ∫ t 0 f (s) g(t− s) ds (t ∈ I). Para fixar, a expressão acima quer dizer o seguinte: dadas as funções f , g : I → R, formamos uma nova função Conv( f , g) = f ∗ g. Essa função estará definida do momento em que espe- cificamos o valor de f ∗ g(t) para cada ponto t ∈ I. Nossa especificação é dada pela integral acima. Queremos provar que esta é uma operação bilinear limitada (contı́nua) Conv : C× C → C. A bilinearidade é evidente e a limitação vem do fato de que ∀t ∈ [0, 1] : ∣∣∣∣∫ t0 f (s) g(t− s) ds ∣∣∣∣ ≤ sup t,s∈I | f (s)| |g(t− s)| ≤ ‖ f ‖∞ ‖g‖∞. Portanto, ∀ f , g ∈ C : ‖Conv( f , g)‖∞ ≤ ‖ f ‖∞ ‖g‖∞. A parte mais difı́cil do argumento é mostrar que f ∗ g é uma função contı́nua para quaisquer f , g ∈ C. Para fazer isso, fixamos primeiramente um t′ ∈ I e estimamos a diferença: f ∗ g(t)− f ∗ g(t′) no caso em que |t− t′| = δ. Para facilitar, supomos que t′ ≤ t, pois o outro caso é análogo. Veja que f ∗ g(t)− f ∗ g(t′) = ∫ t 0 f (s) g(t− s) ds− ∫ t′ 0 f (s) g(t′ − s) ds = ∫ t′ 0 f (s) (g(t− s)− g(t′ − s)) ds + ∫ t t′ f (s) g(t− s) ds =: (I) + (I I). 69 O termo (I I) acima é no máximo: |(I I)| = ∣∣∣∣∫ tt′ f (s) g(t− s) ds ∣∣∣∣ ≤ |t− t′| sup t,s∈I | f (s)| |g(t− s)| ≤ δ ‖ f ‖∞ ‖g‖∞. Já o primeiro termo (I) é limitado por: |(I)| = ∣∣∣∣∫ t′0 f (s) (g(t− s)− g(t′ − s)) ds ∣∣∣∣ ≤ sup t,t′,s∈I : |t−t′|≤δ | f (s)||g(t− s)− g(t′ − s)| ≤ ‖ f ‖∞ sup a,b∈I, |a−b|≤δ |g(a)− g(b)|. Portanto, |t− t′| = δ⇒ 0 ≤ | f ∗ g(t)− f ∗ g(t′)| ≤ δ ‖ f ‖∞ ‖g‖∞ + ‖ f ‖∞ sup a,b∈I, |a−b|≤δ |g(a)− g(b)|. Agora imagine que t′ → t, de modo que δ → 0. Veja que o primeiro termo do lado direito vai a 0. O segundo também, porque g : I → R é contı́nua e portanto uniformemente contı́nua. Deduzimos que: 0 ≤ lim t′→t | f ∗ g(t)− f ∗ g(t′)| ≤ lim sup δ→0 (δ ‖ f ‖∞ ‖g‖∞ + ‖ f ‖∞ sup a,b∈I, |a−b|≤δ |g(a)− g(b)|) = 0. Ou seja, f ∗ g é contı́nua em t, para qualquer t ∈ I. 4.7 Mais exercı́cios Exercı́cio 4.13 Tome a norma 2→ 2 nos espaços de matrizes Rd1×d2 e Rd2×d3 . Prove que a aplicação Mult : Rd1×d2 ×Rd2×d3 → Rd1×d3 que leva (A1, A2) ∈ Rd1×d2 ×Rd2×d3 em A1A2 é bilinear e limitada, com norma ‖Mult‖ Rd1×d2×Rd2×d3→Rd1×d3 = 1. Enuncie e esboce a prova de uma versão do resultado acima para o produto de k > 2 matrizes. Exercı́cio 4.14 Dado um espaço métrico (X, dX), chamamos de BC = BC(X, Rd) o espaço de funções contı́nuas e limitadas de X a Rd. Isto é, uma f : X → Rd pertence a BC se é contı́nua e ‖ f ‖∞ := supx∈X | f (x)|2 < +∞. Prove que (BC(X, Rd), ‖ · ‖∞) é espaço de Banach (a estrutura de espaço vetorial em BC(X, Rd) é definida da maneira “natural”). Exercı́cio 4.15 Veremos neste exercı́cio e nos próximos algumas propriedades da notação ‖ f ‖Lip introdu- zida na observação 4.1 acima. Como lá, supomos que f : D → Y com D ⊂ X e (X, dX), (Y, dY) espaços métricos. Prove que: ∀L ∈ R+ : f é L-Lipschitz ⇔ L ≥ ‖ f ‖Lip. Deduza que f é Lipschitz (com alguma constante) se e somente se ‖ f ‖Lip < +∞. 70 Exercı́cio 4.16 Seguimos com a notação do exercı́cio anterior, mas agora no caso especı́fico em que Y = R com a métrica usual. 1. Mostre que ‖ · ‖Lip é subaditiva e positiva-homogênea, mas ‖ f ‖Lip = 0 não implica f = 0. 2. Dadas f , g : D → R, mostre que ‖min{ f , g}‖Lip, ‖max{ f , g}‖Lip ≤ max{‖ f ‖Lip, ‖g‖Lip}; em particular, o mı́nimo e o máximo de funções Lipschitz também é Lipschitz. 3. Suponha que F é uma famı́lia de funções Lipschitz de D em R tal que ∀x ∈ D, inf f∈F f (x) ∈ R. Mostre que a funcão f∗ : D → R que associa a cada x ∈ D o valor f∗(x) = inf f∈F f (x) satisfaz: ‖ f∗‖Lip ≤ sup f∈F ‖ f ‖Lip. 4. Suponha agora que F é uma famı́lia de funções Lipschitz de D em R tal que ∀x ∈ D, sup f∈F f (x) ∈ R. Mostre que a funcão f ∗ : D → R que associa a cada x ∈ D o valor f ∗(x) = sup f∈F f (x) satisfaz: ‖ f ∗‖Lip ≤ sup f∈F ‖ f ‖Lip. (Juntos, este item e o anterior mostram que o ı́nfimo e supremo de funções Lipschitz com constantes uniformemente limitadas também é Lipschitz.) 5. Finalmente, suponha que fn : D → R (n ∈N) converge pontualmente a f : D → R. Prove que ‖ f ‖Lip ≤ lim inf n∈N ‖ fn‖Lip. Exercı́cio 4.17 Complementando o exercı́cio anterior, considere o espaço BL(X, R) de todas as funções f : X → R satisfazendo ‖ f ‖∞ := supx∈R | f (x)| < +∞ e ‖ f ‖Lip < +∞ (este é o espaço das funções “bounded Lipschitz”, ou seja, Lipschitz e limitadas). Prove as seguintes propriedades. 1. BL(X, R) é espaço vetorial com as operações naturais de soma e multiplicação por escalar. Além disso, ‖ f ‖BL := ‖ f ‖∞ + ‖ f ‖Lip ( f ∈ BL(X, R)) é norma sobre este espaço. 2. (BL(X, R), ‖ · ‖BL) é Banach. 3. Dadas f , g ∈ BL(X, R), temos que f .g, min{ f , g} e max{ f , g} também pertencem a BL(X, R). 71 Exercı́cio 4.18 Este exercı́cio mostra que toda função contı́nua e limitada de um espaço métrico em R é o limite pontual de uma sequência crescente de funções Lipschitz. Nos últimos itens, discutiremos se esta convergência pode ser tomada uniforme. Tome um espaço métrico (X, dX) e uma função limitada f : X → R. Dado M > 0, chame de fM a seguinte aproximação de f , chamada de ı́nfimo-convolução: fM(x) := inf y∈X ( f (y) + M dX(x, y)). 1. Mostre que fM(x) ≤ f (x) para todo x ∈ X. 2. Prove que fM é M-Lipschitz e que fM = f se ‖ f ‖Lip ≤ M. 3. Demonstre que se x ∈ X e M < M′ são dados, fM(x) ≤ fM′(x). 4. Prove que, quando M ↗ +∞, fM(x) ↗ f (x) para todo ponto x ∈ X onde f é contı́nua. [Dica: observe que o inf na definição de fM pode ser tomado no conjunto de pontos y ∈ X com d(x, y) ≤ 2‖ f ‖∞/M.] 5. A convergência no item anterior pode ser sempre tomada uniforme em x ∈ X? Explique. 6. Recorde que f é uniformemente contı́nua ∀ε > 0 ∃δ > 0 ∀x, y ∈ X : d(x, y) ≤ δ⇒ | f (x)− f (y)| ≤ ε. Mostre que, se f é uniformemente contı́nua, então ‖ fM − f ‖∞ → 0. Mais adiante você poderá provar que ‖ fM − f ‖∞ → 0 quando X é compacto. Exercı́cio 4.19 Recorde a definição de convolução de f , g : [0, 1]→ R nas notas de aula. 1. Suponha que f , g :[0, 1] → R são dadas, que g ∈ C([0, 1], R) e que f é contı́nua por partes: isto é, existem a0 = 0 < a1 < · · · < ak = 1 e funções contı́nuas fi : [ai−1, ai] → R tais que f |(ai−1,ai)= fi |(ai−1,ai). Suponha ainda que f é limitada. Prove que f ∗ g é bem definida e contı́nua. 2. Suponha agora que f ∈ C([0, 1], R) e g ∈ C([0, 1], R) é diferenciável com g′ ∈ C([0, 1], R). Mostre que f ∗ g é diferenciável com derivada contı́nua. Exercı́cio 4.20 Mostre que o operador de convolução iterada f1 ∗ f2 ∗ · · · ∗ fk é um operador k-linear e limitado sobre (C([0, 1], R))k. 72 Parte II Topologia e geometria em espaços métricos 73 Capı́tulo 5 Abertos, fechados e topologias Neste capı́tulo, começaremos a discutir conceitos topológicos. Veremos o que são conjuntos aber- tos e fechados em um espaço métrico; discutiremos porque os abertos formam o que se chama de topologia; relacionaremos continuidade a estes dois conceitos; e ainda, trataremos da topologia re- lativa que um conjunto pode herdar de outro maior. A linguagem e os resultados desenvolvidos aqui serão importantes para tudo o que vem a seguir. Ao longo deste capı́tulo, (X, dX) será um espaço métrico dado. Dados x ∈ X e r ≥ 0, denotamos por B(X,dX)(x, r) BX(x, r) ou apenas B(x, r) a chamada bola aberta de raio r ao redor de x: B(x, r) := {y ∈ X : d(x, y) < r}. Também definimos a bola fechada B(X,dX)[x, r], BX[x, r] ou B[x, r] como B[x, r] := {y ∈ X : d(x, y) ≤ r}. Exercı́cio 5.1 Mostre que, dados 0 ≤ r′ < r, B(x, 0) = ∅ ⊂ B[x, 0] = {x} ⊂ B[x, r′] ⊂ B(x, r) ⊂ B[x, r]. Mostre ainda que B[x, 0] = B[x, 1/2] = B(x, 1) = {x} se a métrica é discreta. Agora podemos apresentar as principais definições de topologia de espaços métricos. Definição 5.1 A ⊂ X é dito aberto (segundo a métrica dX) se para todo x ∈ X existe um δ > 0 tal que BX(x, δ) ⊂ A. F ⊂ X é dito fechado (também segundo a métrica dX) se X\F é aberto. Frequentemente falaremos de abertos da seguinte maneira: um conjunto é aberto se todo x ∈ A tem uma ”bolha protetora”(BX(x, δ) com δ > 0) que o ”protege do mundo exterior” por estar toda contida em A. Vejamos como se comportam os conceitos de ”aberto” e ”fechado” sob a métrica discreta. Exemplo 5.1 Todos os subconjuntos são abertos e fechados se a métrica é discreta. Isto porque, como visto acima, todo dado A ⊂ X, temos ∀x ∈ A : {x} = BX(x, 1) ⊂ A. Do mesmo modo, Ac também é aberto. 75 Também observamos que toda bola aberta é aberta. A prova é simples, mas será apresentada inteira para que possamos praticar o conceito. Exemplo 5.2 Toda bola aberta é um conjunto aberto. Para ver isso, tome uma bola B(x, r) com r > 0 e um elemento y ∈ B(x, r). Nosso objetivo é mostrar que existe um raio positivo δ > 0 tal que B(y, δ) ⊂ B(x, r). Para isso, é necessário provar que δ > 0 tem a seguinte propriedade: todo z ∈ B(y, δ) também está em B(x, r). Usando as definições das bolas, isto significa que devemos mostrar o seguinte: Queremos: ∃δ > 0 ∀z ∈ X : d(z, y) < δ⇒ d(z, x) < r. O que nos permite achar este δ é a desigualdade triangular. Afinal, sabemos que ∀δ > 0 ∀z ∈ X : d(z, y) < δ⇒ d(x, z) ≤ d(z, y) + d(y, x) < δ + d(y, x). Logo, precisamos escolher δ tal que δ + d(y, x) < r e δ > 0. Como d(x, y) < r (já que y ∈ B(x, r)), podemos escolher δ := r− d(x, y) > 0 e terminar assim a prova. Exemplo 5.3 De forma semelhante, toda bola fechada B[x, r] é um subconjunto fechado de X, onde agora r ≥ 0. De fato, isto equivale a mostrar que X\B[x, r] é aberto, ou seja, que para todo todo y ∈ X\B[x, r] existe um δ > 0 tal que B(y, δ) ⊂ X\B[x, r]. A condição necessária sobre δ desta vez é que Queremos: ∃δ > 0 ∀z ∈ X : d(z, y) < δ⇒ d(z, x) > r. Novamente é a desigualdade triangular que usaremos para achar este δ. Afinal d(z, y) < δ⇒ d(x, z) ≥ −d(z, y) + d(y, x) > d(y, x)− δ. Como y 6∈ B[x, r], d(x, y) > r, podemos tomar δ = r− d(x, y) e garantir que d(z, y) < δ implica d(z, x) > r. Exercı́cio 5.2 Prove que ∅ e X são ambos abertos e fechados. Exercı́cio 5.3 Prove que os intervalos abertos e fechados de R são mesmo abertos e fechados, segundo a definição acima. (De fato, todo intervalo aberto ou fechado de comprimento finito é uma bola aberta.) Exercı́cio 5.4 Dados (X, dX), x ∈ X e r1, r2 > 0, prove que BX(x, r1)∪ BX(x, r2) = BX(x, max{r1, r2}) e BX(x, r1) ∩ BX(x, r2) = BX(x, min{r1, r2}). Prove um resultado semelhante para bolas fechadas. Nas definições acima definimos fechado em função de aberto. O próximo resultado nos permite definir o que é um conjunto fechado em termos de limites de sequências. Teorema 5.1 F ⊂ X é fechado se e somente se limn xn ∈ F para toda sequência convergente {xn}n∈N ⊂ F. 76 Prova: [do Teorema 5.1] Fixe um conjunto F ⊂ X. Como a definição de fechado é em função da de aberto, temos de recorrer a A := X\F. O que a proposição diz é: A é aberto ⇔ toda seq. convergente {xn}n ⊂ X\A tem limite em X\A. Vamos provar primeiro a direção “⇒”. Supondo que A é aberto, seja {xn}n qualquer sequência convergente contida em X\A e seja x = limn xn. Suponha (para chegar a uma contradição) que x 6∈ X\A, ou seja, x ∈ A. Como A é aberto, existe um r > 0 tal que B(y, r) ⊂ A. Por outro lado, como xn 6∈ A para todo n, temos: ∀n ∈N : xn 6∈ B(x, r), isto é, d(xn, x) ≥ r. Segue que d(xn, x) não converge a 0, ou seja, x não é o limite da sequência. Como isto é uma contradição, deduzimos que x ∈ X\A. Agora mostraremos a direção “⇐” da equivalência via a afirmação contrapositiva. Isto é, mostraremos que: se A não é aberto, então ∃{xn} ⊂ X\A com limn xn ∈ A. Vejamos: se A não é aberto, então existe um ponto x ∈ A tal que B(x, r) 6⊂ A para qualquer r > 0. Em particular, dado n ∈ N, podemos sempre encontrar um elemento xn ∈ B(x, 1/(n + 1)) ∩ (X\A). Isto quer dizer que: xn ∈ B(x, 1/(n + 1)) ∩ (X\A) (intersecção)⇒ { xn ∈ B(x, 1/(n + 1)) ⇒ dX(x, xn) < 1/(n + 1); e xn ∈ X\A. Deste modo, vemos que x ∈ A, dX(xn, x) → 0(ou seja, xn → x) e {xn}n∈N ⊂ X\A. Ou seja, supondo que A não é aberto, provamos que há uma sequência contida em X\A com limite em A. 2 Exercı́cio 5.5 Demonstre o seguinte escólio da demonstração acima: um ponto x ∈ X é o limite de uma sequência de pontos em S ⊂ X se e somente se B(x, r) ∩ S 6= ∅ para todo r > 0. 5.1 Os abertos formam uma topologia Nesta seção provaremos que os abertos de um espaço métrico formam uma topologia. Primeiro temos de definir esta palavra. Definição 5.2 Uma topologia sobre um conjunto X 6= ∅ é uma coleção T de subconjuntos de X, chama- dos de abertos da topologia T , ou ainda abertos de X segundo T , com as seguintes propriedades. Axioma 1: ∅, X ∈ T (o vazio e o espaço inteiro são abertos). Axioma 2: Dada A ⊂ T , temos ∪A∈A A ∈ T (uniões de abertos são sempre abertas). Axioma 3: Dados A, A′ ∈ T , temos A ∩ A′ ∈ T (interseções de pares de abertos são abertas). Os conjuntos F ⊂ X com X\F ∈ T são chamados de fechados de T . 77 Exercı́cio 5.6 Todo X possui duas topologias extremas: Tgrossa = {∅, X} e T f ina = {todos os subconjun- tos de X}. Mostre que estas topologias são mesmo topologias. Exercı́cio 5.7 Mostre que a interseção de um número finito de conjuntos abertos é sempre um conjunto aberto. O principal resultado desta seção é que os abertos de um espaço métrico formam uma topo- logia. Teorema 5.2 Considere um espaço métrico (X, dX). Seja T(X,dX) a coleção de todos os subconjuntos de X que são abertos na noção dada pela métrica dX. Então T(X,dX) é uma topologia sobre X. Como veremos na prova, o conteúdo deste teorema é basicamente o seguinte. Corolário 5.1 Qualquer união de abertos em (X, dX) é também um conjunto aberto. Qualquer interseção de dois conjuntos abertos em X é aberta (do mesmo modo, qualquer interseção finita é aberta). Note que interseções infinitas podem não ser abertas. Por exemplo, em R (com a métrica usual), a coleção de conjuntos A := {(−t, t) : t > 0} tem interseção {0},que não é aberto. Prova: [Teorema 5.2] Veja que ∅, X são abertos de X: nenhum elemento está contido em ∅ (logo ele é aberto por vacuidade) e todas as bolas estão contidas em X (que é aberto, portanto). Concluı́mos que ambos pertencem a TdX , so seja, vale o primeiro axioma de uma topologia. Provaremos agora que vale o segundo axioma. Dada uma coleção qualquer de abertos A ⊂ TdX , queremos provar que ∪A∈AA ∈ TdX . Recorde o que isto quer dizer: se tomarmos um elemento qualquer x ∈ ∪A∈AA, deve existir um raio positivo r com BX(x, r) ⊂ ∪A∈AA. Para achar o raio, lembramos que um dado x só pode pertencer à união se pertence a pelo menos um dos conjuntos Ax ∈ A. Como todos os elementos de A são abertos, sabemos que Ax é aberto e x ∈ Ax. Logo, existe um r > 0 tal que BX(x, r) ⊂ Ax. Também sabemos que Ax ⊂ ∪A∈AA, pois a união dos conjuntos A ∈ A contem todos os conjuntos A ∈ A. Como a relação “⊂” é transitiva, deduzimos que BX(x, r) ⊂ ∪A∈AA. Dito de outro modo: como x está num conjunto da união, ele tem uma “bolha” ao seu redor dentro deste conjunto e, portanto, tem uma bolha na união. Consideremos agora o terceiro axioma, que fala da interseção de dois abertos A, A′ ⊂ X. Para provar que A ∩ A′ é aberto, devemos mostrar que, dado um x ∈ A ∩ A′, temos B(x, r) ⊂ A ∩ A para algum r > 0. Para isto, partimos do fato de que A e A′ são ambos abertos e que x pertence aos dois; afinal, só assim x pode estar na interseção. Deduzimos: x ∈ A ∩ A′ (intersecção)⇒ { x ∈ A ⇒ ∃R > 0 : B(x, R) ⊂ A (porque A é aberto) x ∈ A′ ⇒ ∃R′ > 0 : B(x, R′) ⊂ A (porque A′ é aberto) Tomemos então r = min{R, R′}. Como R, R′ > 0, r > 0 também. Além disso, B(x, r) ⊂ B(x, R) ⊂ A e B(x, r) ⊂ B(x, R′) ⊂ A′, de modo que B(x, r) ⊂ A ∩ A′. Ou seja, mostramos que a “menor das bolhas” que x tem dentro de A e A′ está inteiramente contida na interseção. 2 78 Exercı́cio 5.8 De modo geral, chamamos uma topologia T sobre X de metrizável se ela provem de uma métrica, ou seja, se existe uma métrica sobre X tal que T = TdX . Mostre que existem topologias não metrizáveis; por exemplo, a topologia grossa definida acima não é metrizável. O estudo de espaços topológicos gerais é chamado de Topologia Geral. Esta área tem relações profundas com a Lógica e a Teoria de Conjuntos. De fato, muitas propriedades que já estudamos e ainda estudaremos são demonstradas com apelos simples às leis de DeMorgan para operações com conjuntos. Por exemplo: 1. O complementar do complementar é o próprio conjunto. Fixo X, o complementar de S ⊂ X é Sc := {x ∈ X : x 6∈ S} = X\S. A operação complementar é idempotente: ou seja, (Sc)c = S. 2. O complementar da união é a interseção dos complementares. Com X como acima, se A é uma coleção de subconjuntos de X, ( ⋃ A∈A A)c = ⋂ A∈A Ac. Estas leis são uma ótima maneira de passarmos de propriedades de abertos para as de fecha- dos. Por exemplo, o exercı́cio abaixo segue diretamente desse tipo de observação. Exercı́cio 5.9 Mostre que, em qualquer espaço topológico, qualquer interseção de conjuntos fechados é fechada. Prove ainda que a união de um número finito de conjuntos fechados resulta em outro conjunto fechado. (Estes dois fatos seguem das leis sobre complementares de uniões e interseções aplicadas às propri- edades dos abertos.) 5.2 Outros conceitos topológicos Vamos definir aqui algumas outras noções topológicas e fazer alguns comentários sobre elas. Começamos supondo apenas que (X, T ) é um espaço topológico e abertos e fechados são defi- nidos a partir de T . Definição 5.3 (Interior, fecho e fronteira) O interior de S ⊂ X, denotado por So, é definido por: So := ⋃ A⊂S : A aberto A. O fecho de S é: S := ⋂ F⊃S : F fechado F. A fronteira de S é ∂S := S ∩ Sc, onde Sc é definido como na seção anterior. A primeira coisa para observar sobre estes conceitos é um resultado simples. Proposição 5.1 Com as definições acima, So é aberto, enquanto S e ∂S são sempre fechados. Prova: So é união de abertos, logo aberto. S é interseção de fechados, logo fechado. Por fim, ∂S é a interseção de fechados, logo fechado. 2 79 Proposição 5.2 O complementar do fecho de S ⊂ X é o interior do complementar de S: (S)c = (Sc)o. Prova: A principal observação na prova é que um conjunto F ⊂ X é um fechado com F ⊃ S se e somente se A = Fc é um aberto com A = Fc ⊂ Sc. Isto decorre do fato que a operação de tomar o complementar troca a ordem de inclusões (o que vale em geral para conjuntos) e também troca fechados por abertos (o que sempre vale em espaços topológicos). Dada a afirmação acima, e a regra para interseções e uniões de complementares, deduzimos: (S)c = ( ⋂ F⊃S fechado F )c = ⋃ F⊃S fechado Fc = ⋃ A⊂Sc aberto A = (Sc)o. 2 Agora vamos tentar pensar no que os conceitos significam, partindo do princı́pio que um conjunto aberto “protege” seus elementos do mundo exterior (como falamos das bolhas acima). Segue das regras da união que um ponto x ∈ X é elemento de So se e somente se existe um aberto A ⊂ X com x ∈ A; isto é, x ∈ So se está “protegido do complementar de S”. Por esta razão, o resultado abaixo é natural. Proposição 5.3 S é aberto se e somente se S = So. Prova: Se S = So, S é aberto porque So é aberto. Por outro lado, se S é aberto, o próprio S é um daqueles conjuntos A ⊂ S abertos na definição do interior. Deduzimos: S ⊂ ⋃ A⊂S aberto A = So ⊂ S⇒ So = S. 2 Para o fecho, temos um resultado análogo ao acima. Exercı́cio 5.10 S é fechado se e somente se S = S. Veremos agora que um ponto x ∈ X está em S se “não há como protegê-lo de S”. Proposição 5.4 Dado x ∈ X, x ∈ S⇔ “∀A ⊂ X aberto , x ∈ A⇒ A ∩ S 6= ∅.” Prova: Provaremos a direção “⇐” em forma contrapositiva. Suponha que x ∈ X é dado e existe um aberto A ⊂ X com x ∈ A e S ∩ A = ∅, ou melhor Sc ⊃ A. Note que F := X\A = Ac é um fechado e S ⊂ F (pois tomar complementares inverte a relação de inclusão). Portanto, F é um daqueles fechados que aparecem na interseção que define o fecho de S. Concluı́mos que S ⊂ F e, como x ∈ A = Fc, temos x 6∈ S. Ou seja, um ponto x ∈ X “protegido” de S por um aberto A 3 x com A ∩ S = ∅ não está no fecho de S. Agora, provemos “⇒”. Suponha que x ∈ X é tal que, para todo aberto A ⊂ X com x ∈ A, temos A ∩ S 6= ∅. Para mostrar que x ∈ S, é necessário e suficiente que x ∈ F para qualquer fechado F ⊃ S. Tome então um tal F. Note que A = Fc = X\F é aberto e não intersecta S. Por hipótese, todo aberto contendo x intersecta S: portanto, x 6∈ A. Como A e F são complementares, deduzimos que x ∈ F, como querı́amos demonstrar. 2 80 Exercı́cio 5.11 Mostre que ∂S = {x ∈ X : ∀A ⊂ X aberto com x ∈ A, A ∩ S 6= ∅ e A ∩ Sc 6= ∅}. Por fim, apresentamos mais uma definição topológica relacionada à de fecho. Como acaba- mos de ver, x ∈ S se e somente se não está protegido de S. Isso pode acontecer simplesmente porque x ∈ S, mas essa é a forma “boba” de estar desprotegido. O mais interessante é quando um ponto não está protegido de S\{x}. Definição 5.4 Dado x ∈ X e S ⊂ X, dizemos que x é ponto de acumulação de S se e somente se qualquer aberto A ⊂ X com x ∈ A satisfaz A∩ (S\{x}) 6= ∅ (dá no mesmo pedir que A∩ S 6= ∅ e A∩ S 6= {x}). Chamamos de S′ o conjunto de pontos de acumulação de S, também chamado de conjunto derivado de S. Claramente, S = S ∪ S′ sempre. Um fato interessante é que o conjunto derivado é fechado sempre que a topologia em questão satisfaz uma propriedade simples. Proposição 5.5 Suponha que a topologia T é tal que todo conjunto unitário é fechado. S′ é fechado para qualquer S ⊂ X. Observação 5.1 Topologias com a propriedade de que todo conjunto unitário é fechado são chamadas de T1. Sem esta propriedade, pode ser que S′ não seja fechado (veja os exercı́cios 5.27, 5.28 e 5.29 no fim da seção). De qualquer modo, toda topologia que vem de uma métrica é T1, porque {x} = B[x, 0] é sempre fechado. Prova: Devemosmostrar que X\S′ é aberto. Para isso, vamos mostrar que X\S′ é uma união de abertos Ax que definiremos a seguir. Tome x ∈ X\S′, ou seja, um x que não é ponto de acumulação. Tal x está contido em um aberto Ax 3 x tal que Ax ∩ S = ∅ ou {x}. Veja que A = ∪x∈X\S′Ax é aberto e que A ⊃ X\S′, porque cada x no complementar de S′ está no seu Ax. Para demonstrar que S′ é fechado, é suficiente mostrar que o aberto A é igual a X\S′. Como já sabemos A ⊃ X\S′, basta mostrar que A ⊂ X\S′. Mais ainda, como A é a união dos Ax para x ∈ X\S, basta provarmos que cada um destes conjuntos Ax está contido em X\S′. Ou seja, queremos provar o seguinte: Afirmação: Dado x ∈ X\S′, todo z ∈ Ax não é ponto de acumulação de S. Se z = x isso já vale, então suporemos que z 6= x. Para provar que z não é ponto de acumulação, temos de achar um aberto Oz 3 z com Oz ∩ S = ∅ ou {z}. Vejamos que Oz := Ax\{x} = Ax ∩ {x}c funciona. Para argumentar que Oz e baerto, observamos que {x}c tem de ser aberto (o conjunto unitário é fechado por hipótese!), logo Oz é interseção de dois abertos. Além disso, z ∈ Oz porque z ∈ Ax e z ∈ {x}c (afinal, z 6= x). Por fim, sabemos que Ax ∩ S = ∅ ou Ax ∩ S = x, portanto Oz ∩ S = ∅ obrigatoriamente. Ou seja, provamos que z ∈ Oz aberto e Oz ∩ S = ∅, o que garante que z 6∈ S′. 2 Exercı́cio 5.12 Mostre que N′ = ∅ e Q′ = R (como subconjuntos de R, com a topologia dada pela métrica usual). 81 5.3 Caracterizações métricas dos conceitos topológicos A partir de agora, voltamos ao caso particular em que (X, dX) é espaço métrico e usamos sobre X a topologia T(X,dX) que vem da métrica. Sabemos que, neste caso, os conjuntos fechados podem ser identificados a partir de limites de sequências, ou seja, a partir da métrica. Agora veremos como podemos fazer isso com os outros conceitos que estudamos. Proposição 5.6 Dados S ⊂ X aberto, So é o conjunto dos x ∈ S tais que existe um δ > 0 com B(x, δ) ⊂ S. Prova: Como vimos, acima x ∈ So se e somente se x ∈ A ⊂ S para um aberto A. Por esta razão, todo ponto x ∈ S que está contido numa bola aberta B(x, δ) ⊂ S com δ > 0 satisfaz x ∈ So; afinal, bolas abertas são abertos. Por outro lado, se x ∈ A ⊂ S com A aberto, sabemos que existe um δ > 0 com B(x, δ) ⊂ A, de modo que B(x, δ) ⊂ S também. Por esta razão, x ∈ B(x, δ) ⊂ S para algum δ > 0⇔ x ∈ A ⊂ S para algum A ⊂ S aberto. Mas o lado direito desta equivalência vale se e somente se x ∈ ⋃ A⊂S aberto A = So. Portanto, qualquer x ∈ X tem uma “bolha protetora” dentro de S se e somente se x ∈ So, o que conclui a prova. 2 Exercı́cio 5.13 Prove ainda que A ⊂ X é aberto se e somente se A = ∪B∈BB, onde B é uma coleção de bolas abertas em X. Proposição 5.7 Dado S ⊂ X, S é conjunto de pontos que são limites de sequências de X. Prova: Suponha que {xn}n∈N ⊂ S é uma sequência que converge a x ∈ X. Veja que, para qualquer fechado F ⊃ S,{xn}n∈N ⊂ F e portanto x = limn xn ∈ F. Portanto: ∀F ⊃ S fechado, x ∈ F, portanto x ∈ ⋂ F⊃S fechado F = S. Por outro lado, tome x ∈ S. Pela Proposição 5.4 acima, qualquer aberto contendo x intersecta S. Em particular, para qualquer δ > 0 tem-se B(x, δ) ∩ S 6= ∅. Concluı́mos pelo exercı́cio 5.5 que x é o limite de uma sequência de pontos em S. 2 Corolário 5.2 ∂S é precisamente o conjunto dos pontos que são limites tanto de sequências em S, quanto de sequências em Sc. Exercı́cio 5.14 Mostre que S′ é o conjunto de pontos x ∈ X que são limites de sequências de pontos em S\{x}. Exercı́cio 5.15 Se S 6= ∅, S = {x ∈ X : d(x, S) = 0}. 82 5.4 Continuidade, abertos e fechados Nosso objetivo nesta seção é apresentar a ideia de continuidade de forma topológica, ao invés da forma métrica (via limites) que já mostramos acima. Na prova da equivalência a seguir, veremos ainda uma outra definição métrica de continuidade. Recorreremos a uma notação que será muito usada no que segue: dados f : X → Y e S ⊂ Y, f−1(S) := {x ∈ X : f (x) ∈ S}. Exercı́cio 5.16 Mostre que, dada uma famı́lia A de subconjuntos de Y, f−1(∪A∈AA) = ∪A∈A f−1(A) e f−1(∩A∈AA) = ∩A∈A f−1(A). Ou seja, f−1 “comuta” com uniões e interseções de conjuntos. Prove ainda que f−1(Y\A) = X\ f−1(A). Teorema 5.3 Sejam (X, dX) e (Y, dY) espaços métricos. Dada f : X → Y, as seguintes afirmações são equivalentes. 1. f é contı́nua, isto é, se {xn}n ∪ {x} ⊂ X e xn → x (segundo a métrica dX), então f (xn) → f (x) (segundo a métrica dY). 2. Para qualquer F ⊂ Y fechado em Y, f−1(F) ⊂ X é fechado em X. 3. Para qualquer A ⊂ Y aberto, f−1(A) ⊂ X é aberto. 4. Para todos x ∈ X e ε > 0, existe δ > 0 tal que: ∀x′ ∈ X : “dX(x, x′) < δ”⇒ “dY( f (x), f (x′)) < ε”. Prova: Passo 1 ⇒ 2. Tome f contı́nua e F ⊂ Y fechado. Dada uma sequência convergente {xn}n∈N ⊂ f−1(F) com limite x ∈ X, devemos provar que x ∈ f−1(F), ou seja, que f (x) ∈ F. Mas isto é simples, já que f (xn)→ f (x) (por continuidade), { f (xn)}n∈N ⊂ F (já que xn ∈ f−1(F) para cada n) e F é fechado (de modo que o limite de qualquer sequência convergente em F também está em F). Passo 2 ⇒ 3. Vem do exercı́cio anterior à prova juntamente com o fato de que A é aberto se e somente se X\A é fechado. Passo 3 ⇒ 4. Fixos ε > 0 e x ∈ X, vamos encontrar o δ desejado. Para fazer isto observe que a bola BY( f (x), ε) ⊂ Y é um aberto de Y, de modo que (pelo item 3) f−1(BY( f (x), ε)) é aberto. Como f (x) ∈ BY( f (x), ε), x é um elemento do aberto f−1(BY( f (x), ε)); pela definição de aberto, isto implica que ∃δ > 0 tal que BX(x, δ) ∈ f−1(BY( f (y), ε)). Isto quer dizer que, para todo x′ ∈ B(x, δ) – ou seja, todo x′ ∈ X com dX(x, x′) < δ – temos f (x′) ∈ BY( f (x), ε) – ou seja, dY( f (x), f (x′)) < ε. Em outras palavras, o δ que apresentamos é precisamente o que tı́nhamos de encontrar. 83 Passo 4 ⇒ 1. Suponha que xn → x em X; nosso objetivo é provar que limn f (xn) = f (x), ou seja, que dado ε > 0 existe um n0 ∈ N tal que dY( f (xn), f (x)) < ε se n ≥ n0. Fixemos então um ε > 0. Pelo item 4 podemos encontrar δ > 0 tal que dX(x′, x) < δ implica dY( f (x′), f (x)) < ε. Como xn → x, existe n0 ∈ N tal que dX(xn, x) < δ sempre que n ≥ n0. Mas então temos dY( f (xn), f (x)) < ε sempre que n ≥ n0. Ou seja, este n0 assegura a propriedade desejada. 2 Observação 5.2 No restante das notas, às vezes falaremos de funções contı́nuas entre espaços topológicos. Neste caso, usaremos a definição dada pelos itens 2 e 3 acima, que são sempre equivalentes. 5.5 Topologia relativa O resultado acima sobre continuidade só serve para o caso em que o domı́nio D da função f é todo o espaço X. Mas e se D ⊂ X é um subconjunto próprio e f : D → Y? Não é difı́cil ver o que acontece: se usamos sobre D a métrica induzida por X, então continuidade é equivalente à seguinte condição: ∀A ⊂ Y aberto, f−1(A) ⊂ D é aberto na métrica induzida. Isso suscita a pergunta: como sabemos se um dado subconjunto U ⊂ D é aberto na métrica induzida? Isto também não é difı́cil de deduzir. Veja que U ⊂ D é aberto ⇔ ∀x ∈ U ∃r > 0 BD(x, r) ⊂ U, e ainda BD(x, r) = {y ∈ D : dD(x, y) < r} = {y ∈ X : y ∈ D e dX(x, y) < r} = BX(x, r) ∩ D. Ou seja U ⊂ D é aberto ⇔ ∀x ∈ U ∃r > 0 BX(x, r) ∩ D ⊂ U. Isto nos leva naturalmente à definição de topologia induzida. Note que ela não tem nada a ver com a de métrica, em princı́pio. Definição 5.5 Considere um conjunto X 6= ∅ munido de uma topologia TX. Dado D ⊂ X, a topologia TD induzida por TX é definida como: TD := {A ∩ D : A ∈ TX}. Ou seja, U ∈ TD se existe um aberto A de X com U = A ∩ D. Não é difı́cil provar que TD é mesmo uma topologia: a ideia é só mostrar que a união e a interseção de conjuntos da forma A ∩ D é ela própria desta forma. Teorema 5.4 Considere (X, dX). Dote D ⊂ X da métrica dD induzida por X. Considere as topologias TdX e TdD induzidas pelas métricas de X e D, respectivamente. Então TdD é a topologia induzida por TdX sobre D. 84 Prova: O que temos que provar é que: U ⊂ D é aberto de D ⇔ ∃A ⊂ X abertode X com U = A ∩ D. Começamos a prova pela direção “⇒”. Como observamos acima, U é aberto de D quando para cada x ∈ U existe um raio rx > 0 tal que B(x, rx) ∩ D ⊂ U. Se definimos A := ∪x∈U B(x, rx), vemos imediatamente que A é aberto, posto que é uma união de abertos. Afirmamos que A ∩ D = U e provaremos isso mostrando A ∩ D ⊂ U e U ⊂ A ∩ D. De um lado, temos a inclusão A ∩ D = ∪x∈U(B(x, rx) ∩ D) ⊂ U por conta do fato que B(x, rx) ∩ D ⊂ U para cada x ∈ U. Por outro lado, cada x ∈ U pertence a B(x, rx) ∩ D: isto quer dizer que todo x ∈ U pertence à união ∪x∈U(B(x, rx) ∩ D) = A ∩ D, o que nos diz U ⊂ A ∩ D e termina a prova de que U = A ∩ D. Ou seja, dado U ⊂ D aberto, encontramos A ⊂ X aberto de X com U = A ∩ D. Isto termina a prova da direção “⇒”. Tratemos agora da direção “⇐”. Suponha que U = A ∩ D com A ⊂ X aberto de X. Dado x ∈ X, devemos encontrar rx > 0 tal que BD(x, rx) = BX(x, rx)∩D ⊂ U = A∩D. Mas para isto é evidente que basta pedir BX(x, rx) ⊂ A, o que é possı́vel (com algum rx > 0) exatamente porque A é aberto em X. 2 Observamos o seguinte corolário dos resultados acima. Corolário 5.3 Se D ⊂ X é aberto de X, então A ⊂ D é aberto na topologia relativa se e somente se é aberto na topologia de X. O mesmo vale se trocamos “aberto” por “fechado”. Prova: Faremos a prova apenas no caso de D aberto. Sabemos que, para que A ⊂ D seja aberto de D, é necessário e suficiente que exista B ⊂ X aberto de X com A = B∩D. Em particular, se D é aberto e tal B existe, o conjunto A é a interseção de dois abertos; portanto, ele próprio é aberto. Por outro lado, se A é aberto de X, podemos escrever A = A∩D; ou seja, A e a interseção de um aberto de X com D, sendo portanto um aberto da topologia relativa. 2 Exercı́cio 5.17 Dado um espaço métrico (X, dX), um subconjunto S ⊂ X é dito separado se infs′∈S\{s} dX(s, s′) > 0 para qualquer s ∈ S. Mostre que S é separado se e somente se a topologia induzida por T(X,dX) em S é a topologia fina (aquela em que qualquer conjunto é aberto). 5.6 Mais exercı́cios Exercı́cio 5.18 Dado (X, dX), mostre que F ⊂ X é fechado se e somente se existem um subconjunto Γ ⊂ R que é fechado em R e uma função contı́nua f : X → R tal que F = f−1(Γ). Deduza um análogo deste resultado para conjuntos abertos A ⊂ X. Exercı́cio 5.19 Dado (X, dX), uma função f : X → R é semicontı́nua por baixo se ∀{xn}n∈N ⊂ X : xn → x ∈ X ⇒ lim inf n∈N f (xn) ≥ f (x). Ou seja, f é semicontı́nua por baixo se não pode ter uma “salto para cima no limite”. Mostre que, para qualquer f : X → R, f é semicontı́nua por baixo⇔ ∀t ∈ R, f−1((−∞, t]) é fechado de X. 85 Exercı́cio 5.20 (Topologia de Zariski) Neste exercı́cio, apresentamos a “topologia de Zariski afim” so- bre Rd. Ela é prima da “topologia de Zariski projetiva”, que é extremente importante em Geometria Algébrica. Dado um conjunto S de polinômios multivariados p : Rd → R, chamamos de variedade de S o conjunto V(S) := {x ∈ Rd : ∀p ∈ S, p(x) = 0} (se S = ∅, tomamos V(S) = Rd por definição). Um subconjunto A ⊂ Rd é (por definição) um aberto de Zariski se A = Rd\V(S) para algum S como acima. Mostre que os abertos de Zariski formam uma topologia sobre Rd. Mostre ainda que todo aberto de Zariski é aberto no sentido usual. Exercı́cio 5.21 Considere um espaço-produto X = X1 × · · · × Xd com uma das métricas-produto dX definidas no Exercı́cio 3.10 acima. 1. Para cada i = 1, . . . , d, tome um subconjunto aberto Ai ⊂ Xi. Prove que A1 × A2 × · · · × Ad é aberto. 2. Mostre que um subconjunto A ⊂ X é aberto se e somente se ele pode ser escrito como a união de conjuntos A1 × · · · × Ad, onde cada Ai é aberto do Xi correspondente. Exercı́cio 5.22 Fixe um espaço métrico (X, dX). Tome alguma métrica produto sobre X × R. Dada f : X → R, chamamos de gráfico de f o conjunto gr( f ) := {(x, f (x)) : x ∈ X} ⊂ X×R e de epı́grafo de f o seguinte conjunto epi( f ) := {(x, t) : (x, t) ∈ X×R, t ≥ f (x)}. 1. Prove que, se f é contı́nua, então gr( f ) é fechado. A recı́proca vale? 2. Prove que, se f é semicontı́nua por baixo (como definimos no exercı́cio 5.19), epi( f ) é fechado. A recı́proca vale? Exercı́cio 5.23 Suponha que (X, dX) é completo e F ⊂ X. Mostre que F é fechado em X se e somente se (F, dF) é completo, onde dF é a métrica induzida por (X, dX). Exercı́cio 5.24 Dê um exemplo de espaço métrico (X, dX) onde X′ = ∅. Exercı́cio 5.25 Considere um espaço de Banach (V, ‖ · ‖V). Como já vimos, um subespaço de V é um subconjunto W ⊂ V contendo 0V e fechado pelas operações de espaço vetorial (isto é, para quaisquer w, w′ ∈W e λ ∈ R, λ w + w′ ∈W). 1. Mostre que o fecho de um subespaço de V também é um subespaço de V. 2. Mostre que o interior de um subespaço W 6= V é vazio. 3. Fixo 0 ≤ ρ < 1, prove que um subespaço fechado W ⊂ V satisfaz W = V se e somente se ele tem a seguinte propriedade: dado qualquer v ∈ V, existe um w ∈W com ‖v− w‖V ≤ ρ‖v‖V . Exercı́cio 5.26 Considere as duas definições abaixo de separabilidade. 86 • Um espaço métrico (X, dX) é separável se possui um subconjunto enumerável denso; isto é, se existe D ⊂ Rd enumerável tal que D = X. • Um espaço topológico (X, TX) é separável se existe um subconjunto enumerável B ⊂ TX (chamado de base enumerável da topologia) tal que qualquer aberto A ∈ TX pode ser escrito como uma união de elementos de B. Prove que o espaço métrico (X, dX) é separável (de acordo com a primeira definição) se e somente se o espaço topológico correspondente (X, T(X,dX)) é separável (de acordo com a segunda definição). Deduza que Rd e C(I, R) são espaços topológicos separáveis com suas topologias usuais. Exercı́cio 5.27 Suponha que X tem pelo menos dois elementos e usamos a topologia grossa sobre ele. Mostre que {x}′ = X\{x} não é fechado para qualquer x ∈ X. Ou seja, há exemplos simples de topologias em que conjuntos derivados não são necessariamente fechados. Exercı́cio 5.28 A topologia grossa é um tanto quanto patológica. Uma propriedade simples adicional que pode se pedir de uma topologia é que ela seja T0: Propriedade T0: dados dois pontos distintos x, x′ ∈ X, há um aberto A ⊂ X que contem exatamente um destes pontos. Esta propriedade é sutilmente diferente da T1 descrita acima, que é equivalente à propriedade abaixo: Propriedade T1: dados dois pontos distintos x, x′ ∈ X, há um aberto A ⊂ X que contem x′ e não x (e vice-versa). Prove que esta formulação da propriedade T1 é equivalente à que vimos acima (todo conjunto unitário é fechado). Exercı́cio 5.29 Neste exercı́cio, apresentamos uma topologia T0 não-padrão (de acordo com a definição do exercı́cio anterior) no espaço X = [−1, 1] para a qual {0}′ não é fechado. Definimos: TX := {A ⊂ X : ∃t > 0, A ⊃ (−t, t)} ∪ {∅}. 1. Mostre que TX é de fato uma topologia sobre X. 2. Mostre que TX tem a propriedade T0, mas não tem a propriedade T1 (de fato, {0} não é fechado). 3. Calcule {0}′ e mostre que ele não é fechado segundo TX. Exercı́cio 5.30 Dados um espaço de Banach (V, ‖ · ‖V) e subconjuntos A, B ⊂ V, a soma de Min- kowski de A e B é definida por: A + B := {a + b : (a, b) ∈ A× B}. 1. Prove que, A = BV [xA, rA] e B = BV [xB, rB] (com xA, xB ∈ V e rA, rB > 0), então A + B = BV [xA + xB, rA + rB]; 2. Mostre que, se um dentre A e B é aberto, então A + B é aberto; 3. Dê um exemplo em que V = R2, A e B são ambos fechados, mas A + B não é fechado. 87 Exercı́cio 5.31 Encontre os fechos, interiores e conjuntos de acumulação de cada um dos subconjuntos abaixo de C = C([0, 1], R) (com a métrica usual). D := { f ∈ C : ∃ f ′}; Mk := { f ∈ C : ∀i = 1, 2, . . . , k, f (1/i) < 1/i} (onde k ∈N\{0}). Exercı́cio 5.32 Um espaço métrico (X, dX) é perfeito se X′ = X. 1. Prove que Rd é perfeito. 2. Prove que qualquer espaço métrico perfeito e completo não pode ser enumerável. (Em particular, um subconjunto S 6= ∅ fechado e perfeito de um (X, dX) completo não é enumerável.) 88Capı́tulo 6 Compactos: teoria geral Muitos problemas em Matemática Pura e Aplicada podem ser postos na forma de problemas de minimização de funções sobre conjuntos. Dado um conjunto S e uma função f : S → R, encontre s∗ ∈ S tal que f (s∗) ≤ f (s) para todo s ∈ S. São exemplos de problemas deste tipo: achar o mı́nimo de uma função f : U ⊂ Rd → R; de achar a curva de menor comprimento ligando dois pontos em uma superfı́cie; e achar uma superfı́cie de área mı́nima para um contorno dado. Note que nem todo problema desta forma tem solução. Por exemplo, a função f (x) = −1/x não atinge um valor mı́nimo no domı́nio S = (0,+∞). Como veremos abaixo, espaços compactos têm a propriedade de que toda função contı́nua atinge seu ı́nfimo e seu supremo. Nossa discussão deste conceito começa na Topologia Geral, de maneira bem abstrata. Depois, veremos que, no caso métrico, essa definição tem várias reformulações interessantes. No Teorema 6.2, veremos algumas versões equivalentes para ele. De fato, veremos que cada uma das condições abaixo (em forma mais precisa) é equivalente a pedir que (X, dX) seja compacto: 1. toda função contı́nua de X em R atinge seu ı́nfimo e seu supremo; 2. toda função contı́nua de X em R é limitada; 3. o espaço não tem buracos e é bem aproximado por subconjuntos finitos, a menos de um erro e arbitrariamente pequeno; 4. toda sequência em X tem subsequência convergente. Outros teoremas serão provados mostrando propriedades boas de compactos; por exemplo, toda função contı́nua sobre um compacto é uniformemente contı́nua. Um ponto interessante é que, na lista acima, condições 1 e 2 falam de funções contı́nuas e as 3 e 4 são “geométricas”. Entender a relação entre comportamento de funções e “geometria” do espaço um problema fundamental. Como veremos, o estudo da conexidade é outro exemplo nesta categoria. 89 6.1 Compactos do ponto de vista de Topologia Geral A definição de um espaço compacto usando apenas Topologia é um tanto quanto abstrata. Mesmo assim, veremos que ela serve para provar alguns resultados interessantes. Definição 6.1 Um espaço topológico (X, T ) é dito compacto se, dada qualquer coleção de abertosA ⊂ T com X = ∪A∈AA, então existe uma subcoleção B ⊂ A, com B finito, tal que X = ∪A∈BA. Um subconjunto K ⊂ X é dito compacto se é compacto com a topologia induzida, isto é, dada qualquer coleção de abertos A ⊂ T com K ⊂ ∪A∈AA, então existe uma subcoleção F ⊂ B, com B finito, tal que X ⊂ ∪B∈BB. É bom explicarmos brevemente o “isto é” acima. Lembre que os abertos de K são os conjuntos da forma à = A∩K com A ⊂ X aberto. Uma coleção de abertos à de K é, portanto, uma coleção de conjuntos com a forma Ã{A ∩ X : A ∈ A}, onde A é uma coleção de abertos de X. Usando as regras de De Moivre, obtemos: ⋃ Ã∈à à = ⋃ A∈A (A ∩ K) = ( ⋃ A∈A A ) ∩ K. Portanto, K = ⋃ Ã∈à Ã⇔ K ⊂ ⋃ A∈A A. Do mesmo modo, uma subcoleção finita B̃ ⊂ à de abertos de K cobre K se e somente se a subcoleção finita B ⊂ A correspondente de abertos de X satisfaz K ⊂ ∪A∈BA. Normalmente a definição de compacto é resumida dizendo-se o seguinte: um conjunto é compacto se qualquer cobertura dele por abertos tem uma subcobertura finita. Será útil termos uma forma equivalente dessa definição que envolve conjuntos fechados. Proposição 6.1 Um espaço topológico (X, T ) é compacto se e somente se ele tem a chamada ”propriedade da interseção fechada”, que é a seguinte: dada qualquer coleção F de fechados de X, ∩F∈F F = ∅ se e somente se existe uma subcoleção finita G ⊂ F com ∩F∈GF = ∅. Prova: Este é mais um daqueles argumentos em que usamos o fato de que os complementares de fechados são abertos e o complementar de uma união é uma interseção. Vejamos. Dada uma coleção de fechados F , temos uma coleção de abertos A feita pelos complementares dos elementos de F . Do mesmo modo, podemos passar de uma coleção de abertos A para uma coleção de fechados F . Agora observe que: ⋂ F∈F F = ∅⇔ ( ⋂ F∈F F)c = ⋃ F∈F Fc = ∅c = X. Ou seja, ⋂ F∈F F = ∅⇔ ⋃ A∈A A = X; ou ainda, dizendo de outro modo, uma coleção de fechados tem interseção vazia se e somente se a coleção de abertos correspondente cobre X. 90 Do mesmo modo, existe um G ⊂ F finito com ∩F∈GF = ∅ se e somente se existe uma subcoleção B ⊂ A, formada pelos complementares dos elementos de G, tal que ⋃ A∈B A = ⋃ F∈G Fc = (⋂ F∈G F )c = ∅c = X. Ou seja, subfamı́lias finitas de F que têm interseção vazia correspondem exatamente às subco- berturas finitas de X. Com o que já fizemos, a prova da equivalência fica direta. 2 A propriedade da interseção finita nos dá um bom critério para determinarmos que um espaço não é compacto. Eis alguns exemplos disso. Exemplo 6.1 (R não é compacto) A reta não é compacta com sua topologia usual. Para ver isso, notem que os intervalos da forma (−∞, t], com t ∈ R são uma coleção de fechados com interseção vazia. Ao mesmo tempo, dados t1, . . . , tk ∈ R, k⋂ i=1 (−∞, ti] = (−∞, min 1≤i≤k ti] 6= ∅. Exercı́cio 6.1 Prove que forma análoga que Rd e C([0, 1], R) não são compactos com suas topologias usuais. Exemplo 6.2 (Intervalos abertos e semiabertos não são compactos) Considere agora um subconjunto S da reta da forma S = (a, b] ou S = (a, b), com a < b reais. Use em S a topologia induzida pela tradicio- nal em R. Veja que a coleção: F := {(a, t] : t ∈ (a, b)} é uma coleção de fechados de S na topologia relativa ((a, t] = (−∞, t] ∩ S). Seguindo o raciocı́nio do exercı́cios anterior, vê-se que ∩F∈F F = ∅, mas qualquer subcoleção finita tem interseção não-vazia. Uma tarefa mais difı́cil será provar que um espaço topológico é, sim, compacto. Não tratare- mos disso nesta seara de espaços topológicos, com a exceção do exemplo abaixo. Exercı́cio 6.2 Considere a topologia discreta (ou ”fina”) sobre um X 6= ∅ em que todos os subconjuntos são abertos. Mostre que X é compacto com esta topologia se e somente se ele é finito. O principal resultado sobre conjuntos compactos nesta seção é o Teorema 6.1 abaixo, que diz que funções reais contı́nuas sobre compactos sempre atingem seus ı́nfimos. Antes dele, no entanto, há outras coisas interessantes para provar, que são um tanto quanto mais fáceis. Vamos a elas. O primeiro desses resultados mais diretos nos diz que ”fechado em compacto também é compacto”. Proposição 6.2 Um subconjunto fechado de um espaço topológico compacto é compacto. Prova: De fato, seja (X, T ) compacto e considere F ⊂ X fechado. Se F ⊂ ∪A∈AA, onde A é uma coleção de abertos de X, então à := A∪ {Fc} é uma coleção de abertos que cobre todo X; afinal, todo ponto de X ou está em F, e é coberto por A, ou não está em F, e é coberto por Fc. Como (X, T ) é compacto, à tem uma subcobertura finita B̃. Tomando B := B̃\{Fc}, temos uma subcoleção de A que cobre F. 2 91 O próximo resultado fala que ”a imagem de um compacto por uma função contı́nua é sempre um compacto”. Proposição 6.3 Considere dois espaços topológicos (X, TX) e (Z, TZ). Se (X, TX) é compacto e f : X → Z é contı́nua, então a imagem de f , f (X) ⊂ Z, é compacta. Prova: Suponha que X Z e f são como acima. Tome uma cobertura A qualquer de f (X) por abertos de Z: isto é, f (X) ⊂ ∪A∈AA. Mostraremos que A tem uma subcobertura finita. Como f é contı́nua, os conjuntos f−1(A) com A ∈ A são abertos de X; além disso, eles cobrem X porque, para cada x ∈ X, f (x) ∈ ∪A∈AA e portanto existe um A ∈ A com f (x) ∈ A e x ∈ f−1(A) Por hipótese, X é compacto. Logo, existe uma subcoleção finita B ⊂ A com X = ∪A∈B f−1(A). Mas note que f (X) ⊂ ∪A∈BA porque, dado z = f (x) ∈ f (X), existe um A ∈ B com x ∈ f−1(A) e z = f (x) ∈ A. 2 Agora, sim, mostraremos que toda função contı́nua sobre um espaço topológico atinge seu ı́nfimo. Teorema 6.1 Se (X, T ) é um espaço métrico compacto, então, dada uma função contı́nua f: X → R, existe um x? ∈ X com f (x?) = infx∈X f (x). Em particular, infx∈X f (x) > −∞. Exercı́cio 6.3 Prove que o supremo de f também é atingido. Prova: Na verdade, nossa prova mostra que toda função semicontı́nua por baixo atinge o ı́nfimo. Por definição, uma f : X → R é semicontı́nua por baixo se, dado qualquer t ∈ R, o conjunto Ft := f−1((−∞, t]) é fechado (veja o exercı́cio 5.19 acima para uma caracterização equivalente). Como (−∞, t] é fechado de R, toda função contı́nua de X em R é semicontı́nua por baixo. Em toda prova, faremos referência ao ı́nfimo de f : infx∈X f (x). Isso pode parecer suspeito, pois ainda não temos como garantir que os valores de f são mesmo limitados por baixo. A verdade é que isso não importa. Admitimos que, em princı́pio, seria possı́vel que infx∈X f (x) = −∞. Nada do que dizemos abaixo é afetado por essa possibilidade, que será finalmente afastada no fim da prova. Vamos, então, fazer uma afirmação envolvendo o ı́nfimo, que diz respeito aos conjuntos Ft. Ft 6= ∅ para qualquer t > inf x∈X f (x). (6.1) Afinal, se t > infx∈X f (x), t não é cota inferior para os valores de f e há pelo menos um xt ∈ X com f (xt) ≤ t, o que quer dizer xt ∈ f−1((−∞, t]) = Ft. Feita essaa afirmação, vem um passo crucial: a observação de que (?) ⋂ t>infx∈X f (x) Ft = {x? ∈ X : f (x?) = inf x∈X f (x)}. Na verdade, vale igualdade acima. Aqui dizemos que, se a interseção do lado esquerdo não for vazia, o ı́nfimo de f é atingido. 92 Para provar a igualdade (?), observe primeiro que, se há de fato um x? atingindo o ı́nfimo, ele está na interseção do lado esquerdo. Por outro lado, se x? está na interseção, sabemos que f (x?) ≥ infx∈X f (x) (o ı́nfimo é cota inferior para todo mundo) e ∀t ∈ R : t > inf x∈X f (x)⇒ x? ∈ Ft ⇒ f (x?) ≤ t. Isto quer dizer: ∀t ∈ R : t > inf x∈X f (x)⇒ inf x∈X f (x) ≤ f (x?) ≤ t, ou seja, f (x?) = inf x∈X f (x). Note que provamos (?) sem supôr a priori que infx∈X f (x) > −∞! Resulta de (?) que a existência de um ponto x? ∈ X atingindo o ı́nfimo de f é equivalente a ⋂ t>infx∈X f (x) Ft 6= ∅. Para provar que a interseção não é vazia, usaremos a propriedade da interseção finita. Em forma contrapositiva, essa propriedade nos diz que, se todas as subcoleções finitas dos Ft com t > infx∈X f (x) não têm interseção vazia, o mesmo vale para a interseção de toda a coleção. Tome, então, uma coleção finita dos Ft: Ft1 , . . . , Ftk , com cada ti > infx∈X f (x). Queremos demonstrar que a interseção destes conjuntos não é vazia. Para isso, voltamos ao Exemplo 6.1, sabemos que k⋂ i=1 (−∞, ti] = (−∞, min 1≤i≤k ti] e portanto k⋂ i=1 Fti = k⋂ i=1 f−1((−∞, ti]) = f−1 ( k⋂ i=1 (−∞, ti] ) = f−1 ( (−∞, min 1≤i≤k ti] ) = Fmin1≤i≤k ti . Como cada ti > infx∈X f (x), min1≤i≤k ti > infx∈X f (x) também e (6.1) implica que Fmin1≤i≤k ti 6= ∅, como querı́amos demonstrar. Terminamos recapitulando a prova de trás para frente. Acabamos de mostrar toda subcoleção finita dos Ft com t > infx∈X f (x) tem interseção não-vazia. Como os Ft são fechados e X é com- pacto, a propriedade da interseção finita implica que ⋂ t>infx∈X f (x) Ft 6= ∅. Portanto, a identidade (?) garante que há pelo menos um ponto x? em que f atinge o ı́nfimo. 2 6.2 Espaços métricos compactos: o grande teorema de equivalência A partir de agora, vamos nos restringir a espaços métricos, sempre usando a topologia métrica. Nosso principal resultado será uma série de equivalências descritas no próximo teorema. 93 Teorema 6.2 Dado um espaço métrico (K, dK) com a topologia T(K,dK) dada pela métrica, as seguintes afirmações são equivalentes. 1. (K, T(K,dK)) é compacto; 2. para qualquer função contı́nua f : K → R, existem x−, x+ ∈ K com infx∈K f (x) = f (x−) e supx∈K f (x) = f (x+); 3. toda função contı́nua f : K → R é limitada por cima e por baixo, isto é, −∞ < infx∈K f (x) ≤ supx∈K f (x) < +∞; 4. (K, dK) é um espaço métrico completo e totalmente limitado (isto quer dizer que, dado um e > 0 qualquer, K pode ser coberto por um número finito de bolas de raio e); 5. (K, dK) é sequencialmente compacto, isto é, toda sequência {xn}n∈N ⊂ K possui uma subsequência convergente {xnk}k∈N com limite x ∈ K; Note que aqui supomos que nosso interesse é saber se um espaço métrico ”inteiro” é com- pacto. Na próxima seção, especializamos esse teorema para o caso de subconjuntos K ⊂ X e teremos de falar da topologia induzida. A prova do Teorema 6.2 será trabalho pra várias subseções. No entanto, algumas etapas são bastante simples e podemos apresentá-las aqui. Proposição 6.4 Considere um espaço métrico (K, dK) que tem a propriedade 2 do Teorema 6.2. Então ele também tem a propriedade 3 do mesmo teorema. Prova: Suponha que K satisfaz o item 2, tome f : K → R e defina m± = f (x±) como no dito item. Como f tem valores reais, m−, m+ ∈ R. Além disso, sabemos que m− = infx∈K f (x) e m+ = supx∈K f (x). Portanto, f (K) ⊂ [m−, m+] e f é limitada. 2 O próximo resultado normalmente é provado (num caso particular) em cursos de Análise na Reta. Proposição 6.5 Considere um espaço métrico (K, dK) que tem a propriedade 5 do Teorema 6.2. Então ele também tem a propriedade 2 do mesmo teorema. Prova: Supondo a propriedade 5, mostraremos que vale a 2. Mais precisamente, mostraremos que existe um ponto em que f atinge seu ı́nfimo; a prova para o supremo é análoga (ou então você pode achar o ponto em que − f atinge o ı́nfimo, o que é o mesmo que o ponto em que f atinge o supremo). Tome m− := infx∈K f (x). Em princı́pio, pode ser que m− ∈ R ou m− = −∞. De um modo ou de outro, é possı́vel achar uma sequência de números reais {mn}n∈N ⊂ R, todos estritamente maiores que m−, mas escolhidos de modo que mn → m−. Para cada n, temos então que mn > m− = infx∈X f (x): por esta razão, existe um xn ∈ K com m− ≤ f (xn) ≤ mn. Usando a propriedade 5, podemos escolher uma subsequência {xnk}k∈N com xnk → x− ∈ K. Note que também temos mnk → m− já que {mnk}k∈N é subsequência de uma sequência que converge a m−. Como f é contı́nua, temos que f (xnk)→ f (x−); mas então m− ≤ f (x−) = lim k→+∞ f (xnk) ≤ limk→+∞ mnk = m−. Concluı́mos que f (x−) = m−, isto é, x− atinge o ı́nfimo de f sobre K. 2 94 Cumpridos esses passos simples, partimos para a tarefa mais complicada que é provar todos os demais itens do Teorema 6.2. Um roteiro para a prova é dado logo a seguir. 6.2.1 Roteiro da prova Fixe um espaço métrico (K, dK). Acima provamos vimos acima que 1⇒ 2 (Teorema 6.1) e 2⇒ 3 (Proposição 6.4). Vimos ainda que 5⇒ 2 (Proposição 6.5). Como próximos passos, veremos que um espaço métrico onde toda função contı́nua é li- mitada tem de ser completo (§6.2.2) e totalmente limitado (§6.2.3). Juntas, essas duas provas mostram 3⇒ 4 no Teorema. Depois, mostraremos no §6.2.4 que um espaço métrico completo é sequencialmente compacto; isto é a implicação 4⇒ 5 no Teorema. Neste ponto da prova, já saberemos que 1⇒ 2 e que 2⇒ 3⇒ 4⇒ 5⇒ 2. Portanto, 2 a 5 são equivalentes e uma forma de terminar a prova é mostrar que estas propriedades juntas implicam 1. É isso que será feito no §6.2.5, onde a prova será encerrada. 6.2.2 Compactos são completos Começamos com o fato de que todo compacto é completo do ponto de vista métrico. Isto é um pedaço da prova que 3⇒ 4 no Teorema 6.2. Lema 6.1 Qualquer espaço métrico compacto (K, dK) tal que funções contı́nuas de K em R são limitadas é um espaço métrico completo. Prova: Vamos provar que se K não é completo, então há uma função contı́nua de K em R sem cota inferior. Suponha que K não é completo: existe {xn}n∈N ⊂ K que é Cauchy, mas não converge a qualquer elemento em K. O Exemplo 4.3 acima mostra que g(x) := lim n∈N dK(x, xn) (x ∈ K) é contı́nua. Veja que g(xm) = lim n∈N dK(xm, xn) ≤ sup n≥m dK(xn, xm)→ 0 quando m→ +∞ porque {xn}n é Cauchy. Logo g(xm) → 0 quando m cresce. Por outro lado, g(x) > 0 paratodo x porque, se não, dK(x, xn) → 0 e x seria o limite de xn, que supomos não existir. Portanto a imagem de g está contida em (0,+∞). Como a função x 7→ 1/x é contı́nua sobre (0,+∞), deduzimos que f (x) := 1 limn dK(xn, x) = 1 g(x) é contı́nua e f (xm) → +∞ quando m → +∞, de modo que f não tem cota superior. Segue que K não é compacto. 2 95 6.2.3 Cobertura, empacotamento e limitação total Agora consideramos o conceito de ”totalmente limitado” que apresentamos no item 4 do Teorema 6.2. Antes disso, definimos os números de e-cobertura e empacotamento de um subconjunto de um espaço métrico. É conveniente enunciar essas definições no caso de subconjuntos de um espaço métrico maior. Definição 6.2 Fixe um espaço métrico (X, dX). Dado um subconjunto K ⊂ X, dizemos que um sub- conjunto R ⊂ K é uma e-rede para K se para qualquer x ∈ K existe um x′ ∈ R com dX(x, x′) ≤ e. Chamamos de número de e-cobertura de K, N(K, e), o menor n ∈ N ∪ {+∞} tal que K possui uma e-rede com n elementos. K é dito totalmente limitado se N(K, e) < +∞ para todo e > 0. Uma maneira de pensar na definição de ”totalmente limitado” é a seguinte. Uma e-rede é uma ”discretização”para K em que todo ponto é representado com ”precisão”e. Portanto, K é totalmente limitado se e somente se, para qualquer precisão escolhida, ele tem uma discretização finita com esta precisão. Antes de seguir, notamos o seguinte fato: N(K, e) ≤ n se e somente se existem x1, . . . , xn ∈ K com K ⊂ ∪ni=1BX[xi, e] (exercı́cio). Se K = X, então o contenimento se transforma em K = ∪ni=1BK[xi, e]. Os números de empacotamento são uma espécie de ”dual”dos números de cobertura. Isso ficará claro quando apresentarmos a proposição a seguir. Definição 6.3 Fixe um espaço métrico (X, dX). Dado um subconjunto K ⊂ X, dizemos que um Q ⊂ K é um δ-empacotamento em K (com δ > 0) se quaisquer x, x′ ∈ Q com x 6= x′ satisfazem dX(x, x′) > δ. Chamamos de número de δ-empacotamento de K, P(K, δ), o supremo sobre todos os n ∈ N tais que K possui um δ-empacotamento com n elementos. Proposição 6.6 Usando a notação acima, as desigualdades abaixo valem para quaisquer K ⊂ X e e > 0: N(K, e) ≤ P(K, e) ≤ N(K, e/2). (Em particular, K é totalmente limitado se e somente se P(K, e) < +∞ para todo e > 0.) Prova: Vamos começar mostrando que P(K, e) ≤ N(K, e/2).. Para isso, basta supor que N(K, e/2) = m ∈N, pois o caso N(K, e/2) = ∞ é trivial. Considere, então, uma e/2-rede x1, . . . , xm em K. Isto quer dizer que K é coberto pelas m bolas BX[xi, e/2]. Afirmo que um e-empacotamento em K não pode conter mais do que um elemento em cada uma dessas bolas; afinal, quaisquer dois elemen- tos q, q′ ∈ BX[xi, e/2], então dX(q, q′) ≤ dX(q, xi) + dX(q′, xi) ≤ e. Da afirmação conclui-se que qualquer e-empacotamento em K tem no máximo m elementos, o que demonstra P(K, e) ≤ m. Agora provamos que N(K, e) ≤ P(K, e). Se P(K, e) = +∞, não há o que mostrar. Em caso contrário, P(K, e) = k ∈ N e pode-se tomar um empacotamento Q ⊂ K com k elementos. Mostraremos que Q também é uma e-rede para K, o que mostra que N(K, e) ≤ k. Para mostrar que Q é uma e-rede, tomamos um x ∈ K arbirtrário e mostramos que existe um q ∈ Q com dX(x, q) ≤ e. Isso é trivial se x ∈ Q, portanto suporemos x 6∈ Q. Neste caso, o conjunto Q∪ {x} tem mais elementos que Q. A cardinalidade de Q é o tamanho do maior e-empacotamento em K. Sendo assim, Q ∪ {x} não é e-empacotamento. Portanto, há dois elementos distintos q1, q2 ∈ Q ∪ {x} a distância no máximo e um do outro. Como Q é e-empacotamento, não pode ser verdade que q1, q2 ∈ Q: um dos dois tem de ser x e o outro, um q ∈ Q. Logo, dX(x, q) ≤ e para este q, como querı́amos demonstrar. 2 96 Um último fato sobre conjuntos que não são totalmente limitados será importante a seguir. Note que, se K não é totalmente limitado, então há δ-empacotamentos em K com tamanho finito, mas arbitrariamente grande. Abaixo vemos que há, de fato, um empacotamento infinito em qualquer conjunto que não é totalmente limitado. Proposição 6.7 Com a notação acima, se K ⊂ X não é totalmente limitado, então existe um e-empacotamento dentro de K com cardinalidade infinita, para algum e > 0. Prova: Se K não é totalmente limitado, então N(K, e) = +∞ para algum e > 0. Portanto, qualquer subconjunto finito de K não é uma e-rede. Com base nisso, podemos construir uma sequência de pontos da seguinte forma. 1. Escolha x1 ∈ K arbitrariamente. 2. Dados x1, . . . , xn ∈ K, escolha xn+1 ∈ K de modo que dX(xn+1, xi) > e para todo 1 ≤ i ≤ n (esse ponto existe porque {x1, . . . , xn} não é e-rede). É fácil verificar que o conjunto S := {xn : n ∈N} ⊂ K é um e-empacotamento infinito. 2 Agora podemos relacionar funções contı́nuas ao fato do espaço métrico ser ou não totalmente limitado. Lema 6.2 Considere um espaço métrico (K, dK) tal que que funções contı́nuas de K em R são sempre limitadas. Então (K, dK) é totalmente limitado. Prova: Vamos mostrar que um espaço métrico (X, dX) que não é totalmente limitado tem uma função contı́nua f : X → R com supx∈X f (x) = +∞. Para isto, usamos a Proposição 6.7: ela garante que, para algum δ > 0, há um δ-empacotamento S ⊂ X de cardinalidade infinita: d(s, s′) ≥ δ para quaisquer elementos distintos s, s′ ∈ S. Sem perda de generalidade, suporemos que S é enumerável e escreveremos S = {sj : j ∈ N}. Nosso objetivo será construir uma função contı́nua f : X → R com sup{ f (x) : x ∈ S} = +∞. Na verdade, mostraremos o seguinte resultado. Afirmação 6.1 Existe uma função g : X → R tal que g(x) > 0 para todo x ∈ X, ‖g‖Lip ≤ 1 e g(sj) ≤ 1/(j + 1) para todo j ∈N. Esta g toma valores estritamente maiores que 0 em todo ponto, mas g(sj) → 0 quando j → +∞. Em particular, se definimos f (x) := 1 g(x) (x ∈ X), podemos observar que f é contı́nua (já que o denominador não se anula) e f (sj) ≥ j + 1 → +∞ quando j→ +∞; deste modo, f não é limitada. Para construir g, vamos fazer uma colagem de várias funções. Para cada j ∈ N, definimos uma função gj : X → R da seguinte forma: gj(x) := d(x, sj) + 1 j + 1 (x ∈ X). 97 Claramente, ‖gj‖Lip ≤ 1 e gj(x) ≥ 1/(j + 1) > 0 para todo x ∈ X. Agora defina g : X → R pela receita: g(x) := inf j∈N gj(x) (x ∈ X). Note que g(x) ∈ R está bem definida porque os valores de gj(x) são limitados por baixo por 0 para qualquer x ∈ X, e portanto o ı́nfimo na definição sempre nos dá um número real. Além disso, ‖g‖Lip ≤ supj∈N ‖gj‖Lip ≤ 1 pelo Exercı́cio 4.16. Note ainda que: ∀k ∈N : g(sk) = inf j∈N gj(x) ≤ gk(sk) = 1 k + 1 . Para terminar a prova da Afirmação, precisamos mostrar que g(x) > 0 para todo x ∈ X. Para isso, fixamos x ∈ X e observamos duas possibilidades. • Se d(x, sj) ≥ δ/2 para todos j ∈N, deduzimos que gj(x) = d(x, sj) ≥ δ/2 > 0 pra todo j ∈N. Isto quer dizer que δ 2 é cota inferior para {gj(x) : j ∈N}; como o ı́nfimo é a maior cota inferior, deduzimos que g(x) = inf j∈N gj(x) ≥ δ 2 > 0. • Agora suponha que d(x, sk) < δ/2 para algum k ∈N (o que em particular ocorre se x = sk). Observe que, dado qualquer outro ı́ndice ` ∈ N\{k}, podemos usar o fato de que {sj}j∈N é δ-empacotamento para deduzir que δ < d(sk, s`) ≤ d(sk, x) + d(x, s`) < δ 2 + d(x, s`), donde segue d(x, s`) > δ/2. Portanto, temos que gk(x) ≥ 1 k + 1 e g`(x) ≥ d(x, s`) ≥ δ 2 quando ` 6= k. Deduzimos que δ′ := min { δ 2 , 1 k + 1 } é cota inferior para {gj(x) : j ∈N} e, como antes, obtemos g(x) ≥ δ′ > 0. 2 98 6.2.4 O critério das subsequências convergentes Nesta subseção vamos mostrar que a compacidade de um espaço métrico pode ser avaliada a partir de subsequências. Na verdade, o que faremos será mostrar que, num espaço métrico completo e totalmente limitado, toda sequência tem uma subsequência que converge a um limite dentro do espaço. Primeiro, lembremos o que são subsequências. Definição 6.4 Dados um conjunto infinito N ⊂ N e uma sequência {xn}n∈N, a subsequência {xn}n∈Né definida da forma {x̃j}j∈N com x̃j := {xnj}, onde n1 < n2 < n3 < . . . é a única enumeração crescente dos elementos de N. Também escrevemos {xnj}j∈N diretamente. Falamos que limn∈N xn = x se xnj → x quando j→ +∞. Exercı́cio 6.4 Mostre que xn → x implica xnj → x. Agora provamos a implicação 4⇒ 5 do Teorema 6.2. Proposição 6.8 Um espaço métrico completo e totalmente limitado é sequencialmente compacto, isto é: toda sequência nesse espaço tem uma subsequência que converge nesse mesmo espaço. Prova: Fixe um espaço métrico (K, dK) que é completo e totalmente limitado. Dada {xn}n∈N ⊂ K, nosso principal objetivo será provar que {xn}n∈N possui uma subsequência de Cauchy. Como (K, dK) é completo, isto basta para provar que sempre há uma subsequência convergente. Não é muito simples achar esta subsequência buscada. Começamos a busca por ela com um resultado mais fraco que apenas garante o seguinte: sempre há uma subsequência “apertada”. Afirmação 6.2 Dado qualquer r > 0 existe subsequência {xn}n∈N com dK(xm, xn) < r para todos m, n ∈ N. De fato, como estamos supondo que K é totalmente limitado, a Proposição 6.7 nos diz que podemos cobrir K por um número finito de bolas de raio r/2. Como o número de bolas é finito, uma das bolas, que chamaremos de B(z, r/2), é tal que o conjunto N := {n ∈N : xn ∈ B(z, r/2)} é infinito, e um argumento simples mostra que {xn}n∈N tem a propriedade desejada. O que vem a seguir é uma espécie de “truque diagonal” que mostra como esta afirmação pode ser usada para achar uma subsequência de Cauchy. A primeira ideia deste truque diagonal é que, aplicando a afirmação infinitas vezes, podemos encontrar subsequências encaixadas e cada vez mais apertadas. Mais precisamente: 1. A afirmação implica que existe N1 ⊂ N infinito tal que dK(xn, xm) < 1/2 para todos n, m ∈ N1. 2. Suponha (recursivamente) que existem conjuntos infinitos N1 ⊃ N2 ⊃ · · · ⊃ Nk, todos contidos em N, tais que, para qualquer 1 ≤ i ≤ k e quaisquer n, m ∈ Ni, vale a desigualdade dK(xn, xm) < 2−i. Vamos mostrar como construir um conjunto Nk+1 de forma a estender por mais um passo esta construção. Para isto, aplicaremos a afirmação à sequência {xnj}j∈N onde {nj : j ∈N} = Nk. 99 com r = 2−k−1. Isto nos dá um conjunto N e podemos definir Nk+1 := {nj : j ∈ N}, de modo a termos as propriedades desejadas. Nossa tarefa final é extrair destas subsequências encaixadas e cada vez mais apertadas uma subsequência de Cauchy. Uma tentativa poderia ser definir {xn}n∈Ñ com Ñ := ∩kNk, mas isto não pode funcionar em geral: afinal, n, m ∈ Ñ ⇒ n, m ∈ Nk para todo k⇒ ∀k ∈N, dK(xn, xm) ≤ 2−k ⇒ xn = xm. Ou seja, para que nosso truque não falhe, é necessário que a sequência original tenha infinitos termos iguais. A segunda ideia do truque diagonal é uma maneira “diagonal” de selecionar um subconjunto infinito N∗ de modo que N∗ ⊂ Nk “quase vale”, isto é, N∗\Nk tem apenas um número finito de termos. Vamos escrever N∗ := {n1 < n2 < n3 < . . . } onde os nk são definidos recursivamente. 1. Em primeiro lugar, definimos n1 = min N1 (isto é válido porque N1 6= ∅ é subconjunto dos naturais). 2. Definidos n1 < · · · < nk, observamos que, como Nk+1 é infinito, Nk+1\[nk] 6= ∅. Como ele também é subconjunto dos naturais, podemos definir nk+1 := min(Nk+1\[nk]) e observamos que nk+1 6∈ [nk], de modo que nk+1 > nk. Pela construção temos n1 < n2 < . . . . Além disto, para k, r ∈N com k < r, temos que nk ∈ Nk, nr ∈ Nr ⊂ Nk e como dK(xn, xm) < 2−k para n, m ∈ Nk, isto implica ∀k, r ∈N : k < r ⇒ dK(xnk , xnr) < 2−k. Exercı́cio 6.5 Para terminar a prova, deduza disto que {xnk}k∈N é Cauchy, provando que, dado e > 0, existe um k0 ∈N tal que dX(xnk , xn`) ≤ e para quaisquer ı́ndices k, ` ≥ k0. 2 100 6.2.5 O fim da prova da grande equivalência Chegamos finalmente ao fim da prova do Teorema 6.2. Prova: [do Teorema 6.2] Voltando ao roteiro descrito em §6.2.1 acima, observamos que já sabemos que as propriedades de 2 a 5 no Teorema 6.2 são equivalentes. Além disso, sabemos que 1 implica 2. O que nos falta é provarmos que 2 a 5 juntas implicam 1. Na verdade, não são todas as propriedades de 2 a 5 que serão usadas. Ao invés disso, provaremos o seguinte. Queremos: Seja (K, dK) um espaço métrico totalmente limitado (item 4 do Teorema) com a propriedade de que toda f : X → R contı́nua atinge seu ı́nfimo (item 2 to Teorema). Então toda cobertura de K por abertos possui uma subcobertura finita (item 1 do Teorema). Fixamos, então, um espaço métrico com as propriedades dos itens 2 e 4. Considere uma coberturaA de K por abertos. Lembrando, A é uma coleção de abertos de K tais que K = ∪A∈AA. Observe que todo x ∈ K pertence a algum aberto A ∈ A. Portanto existe um δ = δ(x) > 0 com B(x, δ) ⊂ A para algum A ∈ A. Reduzindo δ se necessário, podemos supôr que δ(x) ≤ 1. A principal ideia desta prova é mostrar o seguinte. Ideia: podemos escolher um valor δ > 0 que funciona para todos os x ∈ K simultaneamente. Ou seja, existe um δ > 0 tal que, dado qualquer x ∈ K, B(x, δ) ⊂ A para algum A ∈ A. Na verdade, esta ”ideia” suscita duas perguntas: 1. Por que achar este δ > 0 é uma boa ideia? Como K é compacto, ele é totalmente limitado e pode ser coberto por um número finito de bolas de raio δ > 0. Mas cada bola destas pode ser coberta por um elemento da cobertura A. Deste modo, K pode ser coberto por um número finito de elementos de A. 2. Como sabemos que este δ existe? Vamos exprimir δ em termos do ı́nfimo de uma função contı́nua r : K → (0, 1] que associa a cada x o seu “maior δ particular”. Como cada x tem seu δ > 0, o ı́nfimo de r será positivo. Para transformar esta ideia em prova, definimos r : K → (0, 1] da seguinte forma. Primeiro observe, dado x ∈ K, o conjunto I(x) := {δ ∈ (0, 1] : ∃A ∈ A, BK(x, δ) ⊂ A} não é vazio. De fato ele é um intervalo: se δ ∈ I(x), então para qualquer 0 < δ′ < δ temos ∃A ∈ A : BK(x, δ′) ⊂ BK(x, δ) ⊂ A⇒ δ′ ∈ I(x). Como I(x) também é limitado por 1, podemos definir r : K → [0, 1] como r(x) := sup I(x) (x ∈ K). Como I(x) contem elementos positivos, vale que r(x) > 0 para todo x ∈ K. Intuitivamente, r(x) é basicamente o “maior” δ(x) que podemos escolher. Uma explicação para esta escolha é que, se queremos achar um único δ que sirva para todos os x, é boa ideia partir do maior δ(x) possı́vel para cada x. A afirmação a seguir é chave para a prova. 101 Afirmação 6.3 r é uma função contı́nua. Prova: [da Afirmação] Vamos mostrar que r é 1-Lipschitz, o que implica que r é contı́nua. Para isto basta mostrar que: Objetivo: ∀x, x′ ∈ K : r(x)− r(x′) ≤ dK(x, x′). (6.2) De fato, se temos isto, podemos trocar os papeis de x, x′ e mostrar que também vale r(x′)− r(x) ≤ dK(x, x′), de modo que |r(x′)− r(x)| ≤ dK(x, x′) para todos x, x′ ∈ X. Para provar nosso objetivo, tome qualquer 0 < r < r(x) e um conjunto A ∈ A com B(x, r) ⊂ A. Note que B(x′, r− dX(x, x′)) ⊂ BK(x, r); afinal, ∀y ∈ BK(x′, r− dK(x, x′)) : dK(y, x) ≤ dK(y, x′) + dK(x, x′) < r. Portanto também temos BK(x′, r − dK(x, x′)) ⊂ A ∈ A e isto implica r(x′) ≥ r − dX(x, x′). Tomando o supremo em r, vemos que r(x′) ≥ r(x) − dK(x, x′), como querı́amos demonstrar. [Fim da prova da afirmação.] 2 Entre outras coisas, esta afirmação nos diz que infx∈K r(x) = r(x∗) para algum x ∈ K; afinal, K é compacto! Mas note então que r(x∗) > 0, porque r é positiva em todos os pontos de K. Deduzimos que infx∈K r(x) > 0, o que nos permite escolher um δ ∈ (0, infx∈K r(x)). Este δ nos permite terminar a prova. Veja que, dado x ∈ K, r(x) > δ. Pela definição de r(x), isto quer dizer que 0 < δ < sup I(x); como I(x) é intervalo, isto quer dizer que δ ∈ I(x) e existe um A ∈ A com BK(x, δ) ⊂ A. Lembre-se que K é totalmente limitado, portanto K = ∪ki=1BK(xi, δ) para alguma escolha de x1, . . . , xk ∈ K. Mas então podemos escolher, para cada 1 ≤ i ≤ k, um aberto Ai ∈ A com B(xi, δ) ⊂ Ai, e observamos que K ⊂ ∪ki=1Ai. Deste modo, B :={Ai : 1 ≤ i ≤ k} é uma subcoleção finita de A que cobre K. 2 Observação 6.1 Um dado importante que surgiu na prova acima é que, se K é compacto, então toda cobertura A de K por abertos possui um número de Lebesgue, isto é, um δ > 0 tal que, se x, x′ ∈ K e dK(x, x′) < δ, então x, x′ ∈ A para algum A ∈ A. Isto é, se dK(x, x′) < δ, x, x′ pertencem ao mesmo aberto da cobertura. Usaremos isto mais adiante. 6.3 Mais sobre compactos e funções contı́nuas A esta altura já sabemos que o conceito de compacidade pode ser caracterizado por funções contı́nuas. Há muitas outras relações entre estes dois conceitos: como veremos, elas se estendem ao caso em que o contradomı́nio não é a reta. 6.3.1 Funções sobre compactos com contradomı́nio completo Até este ponto, o principal espaço de funções contı́nuas que tratamos foi o C(I, R) com I ⊂ R compacto. Agora, estamos em condições de estender o que sabemos para um caso bem mais 102 geral. De fato, tomaremos (K, dK) e (Z, dZ) espaços métricos, com K compacto e Z completo, e falaremos de: C = C(K, Z) := { f : K → Z : f continua }. O próximo resultado mostra que é possı́vel dar uma métrica a C e que o espaço métrico resultante é completo. Teorema 6.3 Suponha que (Z, dZ) é completo. Dadas f , g ∈ C, defina: dC( f , g) := sup t∈K dZ( f (t), g(t)). Então dC é uma métrica sobre C e (C, dC) é um espaço métrico completo. Prova: Esta prova deve muito à prova de que C(I, R) é espaço métrico completo (Teorema 3.2). Faremos abaixo um esboço dos passos que são iguais e assinalaremos as principais diferenças. Primeiro vamos provar que o supremo na definição de dC é atingido por algum t∗ ∈ K; em particular, dC( f , g) ∈ R está bem definida. Para ver que o sup é atingido, como K é compacto, basta ver que a função t ∈ K 7→ dZ( f (t), g(t)) ∈ R é contı́nua. Isto é verdade porque, sempre que tn → t em K, |dZ( f (t), g(t))− dZ( f (tn), g(tn))| ≤ |dZ( f (t), g(t))− dZ( f (tn), g(t))| +|dZ( f (tn), g(t))− dZ( f (tn), g(tn))| (desig. triangular nos dois termos) ≤ dZ( f (tn), f (t)) + dZ(g(tn), g(t)) → 0 quando n→ +∞. Portanto dZ( f (t), g(t)) = limn dZ( f (tn), g(tn)). Acabamos de ver que dC está bem definida. As propriedades de métrica são provadas como no caso de C(I, R), observando que, para f , g, h ∈ C: ∀t ∈ K : dZ( f (t), g(t)) ≤ dZ( f (t), h(t)) + dZ(g(t), h(t)) ≤ dC( f , h) + dC(h, g), e aı́ tomando o supremo em t ∈ K do lado esquerdo. A completude também é provada como antes, nos mesmos três passos da prova do Teorema 3.2. Dada { fn}n∈N ⊂ C Cauchy, temos o seguinte. 1. Para cada t ∈ K, 0 ≤ dZ( fn(t), fm(t)) ≤ dC( fn, fm) n,m→+∞→ 0. Logo { fn(t)}t∈N ⊂ Z é Cauchy e, como Z é completo, existe o limite pontual f (t) = limn fn(t) para cada t ∈ K. 2. Para cada n ∈N e t ∈ K, a existência do limite pontual diz que dZ( fn(t), f (t)) = limm dZ( fn(t), fm(t)) ≤ sup m≥n dZ( fn(t), fm(t)) ≤ sup m≥n dC( fn, fm). 103 Logo 0 ≤ sup t∈K dZ( fn(t), f (t)) ≤ sup m≥n dC( fn, fm)→ 0 porque { fn}n∈N é Cauchy. Deduzimos que fn → f uniformemente. 3. Por fim, dada uma sequência tk → t em K, para qualquer n ∈N dZ( f (tk), f (t)) ≤ dZ( fn(tk), fn(t)) +dZ( fn(tk), f (tk)) + dZ( fn(t), f (t)) ≤ dZ( fn(tk), fn(t)) + 2dC( fn, f ). (Aqui abusamos notação e usamos dC( fn, f ) apesar de ainda não sabemos que f ∈ C!). Como fn é contı́nua, fn(tk)→ fn(t) e 0 ≤ lim sup k dZ( f (tk), f (t)) ≤ 2dC( fn, f ) e mandar n → +∞ nos mostra que o lim sup é 0, logo f (tk) → f (t). Como isto vale para qualquer sequência como acima, f ∈ C é contı́nua. 2 6.3.2 Funções sobre compactos com contradomı́nio Banach Um caso particular do resultado acima é aquele em que Z = V é espaço de Banach (e dZ vem da norma). O próximo resultado mostra que C(K, V) também é Banach. Começamos observando que, assim como no caso de C(I, R), que já estudamos, este espaço tem uma estrutura natural de espaço vetorial. Seu elemento nulo 0C é a função constante igual a 0V . Dadas funções f , g ∈ C e um escalar λ ∈ R, uma nova função λ f + g é definida via: (λ f + g)(t) = λ f (t) + g(t) (t ∈ K). A única diferença para o caso em que V = R é que as operações de soma e produto do lado direito são em V e não em R. Há muitas boas razões para se considerar essa classe de funções. Por exemplo, se V = R3, podemos vizualizar cada elemento de C como uma trajetória no espaço tridimensional. Se queremos modelar a evolução de posição e momento de N particulas clássicas em R3, precisamos tomar V = R6N . Em outros contextos, pode ser interessante tomar V ainda mais geral. O próximo resultado define uma norma em C(K, V). Teorema 6.4 Se (K, dK) é compacto e (V, ‖ · ‖V) é Banach, a expressão abaixo define uma norma ‖ · ‖V em C: ‖ f ‖C := sup t∈I ‖ f (t)‖V ( f ∈ C). Com essa norma, (C, ‖ · ‖C) é completo (Banach). 104 Prova: Primeiro devemos observar que o supremo é finito. Para isso, basta observar que a função que associa a cada t ∈ K o valor ‖ f (t)‖V ∈ R é contı́nua, já que ∀t, s ∈ K : |‖ f (t)‖V − ‖ f (s)‖V | ≤ ‖ f (t)− f (s)‖V . Agora vamos checar as propriedades de norma. Como ‖ f (t)‖V ≥ 0 sempre, temos que ‖ f ‖C ≥ 0. Portanto, ‖ · ‖C : C → [0,+∞) é uma função bem-definida. Para provar que ela é uma norma, precisamos provar que ela é positiva definida, homogênea positiva e subaditiva. Como a prova é bem semelhante à do caso em que V = R, demonstraremos apenas a subaditividade. De fato, dadas f , g ∈ C, podemos usar a subaditividade de ‖ · ‖V e a definição de ‖ · ‖C para provar que: ∀t ∈ I : ‖ f (t) + g(t)‖V ≤ ‖ f (t)‖V + ‖g(t)‖V ≤ ‖ f ‖C + ‖g‖C. Portanto, ‖ f ‖C + ‖g‖C é cota superior para os valores de ‖ f (t) + g(t)‖V , donde deduzimos que ‖ f + g‖C = sup t∈I ‖ f (t) + g(t)‖V ≤ ‖ f ‖C + ‖g‖C para quaisquer f , g ∈ C. Ou seja, ‖ · ‖C é mesmo subaditiva. Falta demonstrar que (C, ‖ · ‖C) é completo, mas isto segue do Teorema 6.3. Afinal, a norma ‖ · ‖C induz uma métrica que coincide com a que estudamos naquele teorema quando V = Z. Como V é completo, o teorema se aplica e garante a completude de C com a norma que acabamos de construir. 2 6.3.3 Continuidade uniforme Nosso próximo passo é falar de continuidade uniforme, uma versão mais forte do conceito de continuidade. Definição 6.5 Uma função f : K → Z entre espaços métricos (K, dK) e (Z, dZ) é dita uniformemente contı́nua se seu módulo de continuidade, denotado por m f (δ) := sup{dZ( f (x), f (x′)) : dK(x, x′) ≤ δ} (δ > 0), converge a 0 quando δ→ 0+. Uma função uniformemente contı́nua é contı́nua (exercı́cio!). Por outro lado, uma função contı́nua pode não ser uniformemente contı́nua: por exemplo, “t 7→ t2”, definida na reta, tem m f (δ) = +∞ para todo δ > 0, já que: lim t→+∞ [(t + δ)2 − t2] = +∞. O resultado abaixo estende um teorema conhecido de Análise na Reta. Ele garante que qualquer função contı́nua sobre domı́nio compacto é uniformemente contı́nua. Note que, ao contrário da subseção anterior, aqui não precisamos supôr que o contradomı́nio Z é completo com a métrica dZ. Teorema 6.5 Uma função contı́nua f : K → Z entre espaços métricos (K, dK) e (Z, dZ), com (K, dK) compacto, é necessariamente uniformemente contı́nua. 105 Prova: Apresentamos uma prova baseada na ideia de número de Lebesgue, contida na observação 6.1 acima. O Exercı́cio 6.6 apresenta um argumento mais clássico, baseado em subsequências. Tome f : K → Z contı́nua. Dado um ε > 0, mostraremos que existe um δ0 > 0 tal que m f (δ) ≤ ε para todo 0 < δ < δ0. Isto implica lim supδ→0+ m f (δ) ≤ ε, para qualquer ε > 0. Note que, dado qualquer x′′ ∈ K, o conjunto Ax′′ := {x ∈ K : dZ( f (x), f (x′′)) < ε/2} é aberto de K, já que Ax = f−1(BY( f (x), ε/2)). Note ainda que, se x, x′ ∈ Ax′′ para um mesmo x′′, naturalmente dZ( f (x′), f (x′′)) < ε pela desigualdade triangular: dZ( f (x), f (x′)) ≤ dZ( f (x), f (x′′)) + dY( f (x′′), f (x′)) < ε. Os abertos Ax′′ , com x′′ ∈ K, cobrem K; afinal, cadax′′ ∈ K pertence ao seu próprio Ax′′ . Deduzimos que A := {Ax′′ : x′′ ∈ K} é uma cobertura de K por abertos. Pela Observação 6.1, existe um δ0 > 0 tal que, dados quaisquer x, x′ ∈ K com dK(x, x′) < δ0, existe um conjunto Ax′′ com x, x′ ∈ Ax′′ , o que, como observado acima, garante que dZ( f (x), f (x′)) < ε. Portanto, ∀x, x′ ∈ K : dK(x, x′) ≤ δ < δ0 ⇒ dY( f (x), f (x′)) < ε, e m f (δ) ≤ ε para todo 0 < δ < δ0, como querı́amos demonstrar. 2 Antes de prosseguirmos, observamos que há outras definições equivalentes para a continui- dade uniforme. Proposição 6.9 Dada uma função f : K → Z entre espaços métricos (K, dK) e (Z, dZ), as seguintes propriedades são equivalentes. 1. f é uniformemente contı́nua; 2. dado qualquer ε > 0, existe um δ > 0 tal que, se x, x′ ∈ K satisfazem dK(x, x′) ≤ δ, então dZ( f (x), f (x′)) ≤ ε; 3. se {xn}n∈N e {x′n}n∈N são sequências em K, dK(xn, x′n)→ 0⇒ dZ( f (xn), f (x′n))→ 0. Prova: Uma primeira observação da prova é que a função m f (·) é monótona não-decrescente. De fato, se 0 < δ < δ′, o conjunto de pares (x, x′) com dK(x, x′) ≤ δ está contido no conjunto de pares com dK(x, x′) ≤ δ′; portanto, o supremo que define m f (δ) é tomado sobre um conjunto menor do que o supremo que define m f (δ′). Usamos a observação acima para provar que 1 e 2 são equivalentes. Sendo m f crescente, sabemos que existe o limite de m f (δ) quando δ→ 0+ e vemos que: lim δ→0+ m f (δ) = 0⇔ ∀ε > 0 ∃δ > 0 : m f (δ) ≤ ε. Do lado esquerdo da equivalência, temos a continuidade uniforme; do direito, temos a proprie- dade 2 escrita de outra forma. Deste modo, temos a equivalência de 1 e 2. 106 Agora vejamos que 1⇒ 3. Sejam {xn}n∈N e {x′n}n∈N como no item 3. Note que, por definição de m f , 0 ≤ dZ( f (xn), f (x′n)) ≤ m f (dK(xn, x′n)) e que dK(xn, x′n)→ 0. Deduzimos que dY( f (xn), f (x′n))→ 0. Concluı́mos a prova mostrando que “não 1⇒não 3”. Suponha que 1 não vale. Como observa- mos acima, m f é monótona-não-decrescente: por esta razão, limδ→0+ m f (δ) existe, podendo ser um número real não-negativo ou +∞. Se 1 não vale, existe um a > 0 com limδ→0+ m f (δ) > a > 0 e portanto m f (δ) > a para todo δ > 0. Em particular, tomando δ = 1/n e retornando à definição de m f , vemos que existe um par (xn, x′n) ∈ K2 com dX(xn, x′n) ≤ 1/n e dZ( f (xn), f (x′n)) > a. Portanto, as sequências {xn}n∈N e {x′n}n∈N, ambas contidas em K, satisfazem dX(xn, x′n) → 0 e dZ( f (xn), f (x′n)) 6→ 0. Ou seja, se 1 não é verdadeira, a propriedade 3 não vale. 2 Exercı́cio 6.6 Escreva uma prova do Teorema 6.5 baseada no item 3 da Proposição acima. Para isso, siga os seguintes passos: tome uma sequência {δn}n decrescendo a 0 e observe que limδ→0+ m f (δ) se e somente se m f (δnk)→ 0 ao longo de uma subsequência {δnk}k. Para cada n, tome xn, x′n ∈ K com dK(xn, x′n) ≤ δn e dY( f (xn), f (x′n)) ≥ m f (δn)− 1/n. Mostre agora que é possı́vel encontrar uma subsequência {nk}k tal que xnk , x ′ nk → x ∈ K e use a continuidade de f em x para terminar a prova. 6.4 Compacidade de subconjuntos de um espaço métrico completo No próximo capı́tulo, e também pelo restante da vida, estaremos interessados no caso em que K ⊂ X com (X, dX) completo. Na maior parte do tempo, X será algum dos nossos espaços usuais: métrica discreta, Rd ou C(I, R). Primeiramente, observaremos como formular compacidade em termos da métrica e da topo- logia de X (e não a métrica e a topologia que X induz em K). 1. A definição de compacidade via cobertutas de abertos (ou via propriedade da interseção finita) é igual. 2. Quando (X, dX) é completo (como é o caso aqui), pedir que K seja completo com a métrica induzida é a mesma coisa que pedir que K seja fechado de X (cf. Exercı́cio 5.23). Logo, ao invés de pedir que K seja completo, pediremos que ele seja fechado. Portanto, se (X, dX) é completo, um K ⊂ X é compacto se e somente se é fechado e totalmente limitado. Convém fazer alguns comentários sobre os números de cobertura de K. Lembre-se que o número de e-cobertura de (K, dK) é dado por: N(K, e) := inf{k ∈N : ∃x1, . . . , xk ∈ K, K = ∪ki=1BK[xi, e]}. Como dissemos acima, estamos interessados no caso em que K ⊂ X e dK é a distância induzida por dX. Sabemos que, neste caso, temos BK[xi, e] = K ∩ BX[xi, e] para cada 1 ≤ i ≤ k e e > 0. Segue disto que N(K, e) := inf{k ∈N : ∃x1, . . . , xk ∈ K, K ⊂ ∪ki=1BX[xi, e]}. (6.3) No entanto, é possı́vel uma outra definição: N′(K, e) := inf{k ∈N : ∃x′1, . . . , x′k ∈ X, K ⊂ ∪ki=1BX[x′i , e]}. (6.4) 107 A diferença para (6.3) é que, neste segundo caso, os centros das bolas podem estar dentro ou fora de K. O exercı́cio abaixo mostra que isso não faz muita diferença para o que nos interessa. Exercı́cio 6.7 Prove que, para qualquer espaço métrico (X, dX) e qualquer K ⊂ X, N(K, e) ≤ N′(K, e) ≤ N(K, 2e). Deduza que K é totalmente limitado (isto é, N(K, e) < +∞ para todo e > 0) se e somente se N′(K, e) < +∞ para todo e > 0. Curiosamente, essa pequena diferença entre os números de e-cobertura N e N′ não tem análogo para os números de e-empacotamento: neste caso, sempre pedimos que os elementos do empacotamento estejam dentro de K. 6.5 Mais exercı́cios Exercı́cio 6.8 Considere um espaço topológico compacto (X, TX) e um outro espaço topológico (Y, TY). Suponha que f : X → Y é uma bijeção contı́nua. Mostre que a função inversa f−1 : Y → X também é contı́nua; portanto, f é um homeomorfismo de espaços topológicos. Exercı́cio 6.9 Considere um espaço vetorial normado (V, ‖ · ‖V) e subconjuntos não-vazios A, B ⊂ V. Defina a soma de Minkowski A + B como no Exercı́cio 5.30: A + B := {a + b : (a, b) ∈ A× B}. Prove que A + B é compacto se e somente se A e B são compactos. Exercı́cio 6.10 (Espaços pseudocompactos) Um espaço topológico compacto (X, TX) é dito pseudo- compacto se toda função contı́nua de X em R é limitada. Procure o verbete da Wikipedia a respeito. Exercı́cio 6.11 Determine quais dos subconjuntos de C([0, 1], R) abaixo são compactos. 1. Todas as funções Lipschitz. 2. Todas as funções L-Lipschitz, para um L > 0 fixo. 3. Todos os polinômios com grau 3. 4. Todos os polinômios com grau 3 e coeficientes no intervalo [−1, 1]. (Obs: mais adiante provaremos um critério para compacidade neste espaço, o teorema de Ascoli- Arzelà. Estes exemplos podem ser estudados sem se utilizar este teorema.) Exercı́cio 6.12 Considere um espaço métrico compacto (K, dK). Chame p ∈ K de ponto isolado se existe um δ > 0 tal que BK(p, δ) = {p} (ou seja, não há qualquer ponto de K, além do próprio p, a distância < δ do p). Prove que o conjunto de pontos isolados de K é vazio, finito ou enumerável. Exercı́cio 6.13 Suponha que (X, dX) é um espaço métrico e que {xn}n∈N ⊂ X é Cauchy. Mostre que o conjunto S := {xn : n ∈N} é totalmente limitado. 108 https://en.wikipedia.org/wiki/Pseudocompact_space Exercı́cio 6.14 Recorde que um espaço métrico é separável se possui um subconjunto denso e enumerável. Mostre que todo espaço métrico compacto é separável. Exercı́cio 6.15 Sejam (Ti, di) espaços métricos totalmente limitados, 1 ≤ i ≤ k. Mostre que T := T1 × T2 × · · · × Tk é espaço métrico totalmente limitado com qualquer uma das métricas-produto consideradas no exercı́cio 3.10, em particular d∞(x, y) := max 1≤i≤k di(x[i], y[i]) (x, y ∈ T). Faça isso provando uma cota explı́cita para o valor dos números de cobertura de T (com a métrica d∞): ∀e > 0 : N(T, e) ≤ k ∏ i=1 N(Ti, e). Mais exatamente, mostre que, se Ri ⊂ Ti é e-rede para cada Ti (com a métrica di), então R := R1 × R2 × · · · × Rk é ε-rede para T. Conclua observando que |R| = ∏i |Ri|. Exercı́cio 6.16 Seguindo a linha do exercı́cio acima, mostre que T é compacto se e somente se cada Ti é compacto. Exercı́cio 6.17 Sejam (X, dX) um espaço métrico completo e S ⊂ X um subconjunto. Mostre que S é totalmente limitado se e somente se S é compacto. Exercı́cio 6.18 Demonstre que a primeiradas afirmações abaixo é verdadeira e a segunda é falsa. 1. Um espaço métrico (X, dX) é compacto se e somente se toda função Lipschitz f : X → R satisfazendo f (x) > 0 para todo x ∈ X tem ı́nfimo positivo. 2. Um espaço métrico (X, dX) é compacto se e somente se toda função Lipschitz f : X → R é limitada inferiormente. Exercı́cio 6.19 É verdade que um espaço métrico (X, dX) é compacto se e somente se toda função contı́nua f : X → R é uniformemente contı́nua? Mostre que a resposta é não considerando qualquer conjunto X infinito com a métrica discreta. (Na verdade, há exemplos de mais complicados de espaços que não são compactos, mas são perfeitos – X′ = X – e tais que qualquer função contı́nua é uniformemente contı́nua. Ou seja: a resposta “não” acima não tem nada a ver com métrica discreta só ter pontos isolados.) Exercı́cio 6.20 Considere um espaço vetorial normado (V, ‖ · ‖V). Dado um S ⊂ V, S 6= ∅, uma combinação convexa de elementos de S é um elemento v ∈ V da forma: v = m ∑ i=1 λisi, onde m ∈ N\{0}, s1, . . . , sm ∈ S e os escalares λ1, . . . , λm ≥ 0 têm soma ∑mi=1 λi = 1. Chamamos de conv(S), ou fecho convexo de S, o conjunto cujos elementos são as combinações convexas dos elementos de S. Prove que, se S é totalmente limitado, conv(S) também é. 109 110 Capı́tulo 7 Compactos: casos particulares Agora que já sabemos quem são os espaços compactos e que propriedades importantes eles têm, veremos como este conceito se aplica a subconjuntos de Rd e das funções contı́nuas. No caso do Rd, provaremos o Teorema de Heine-Borel, que diz que um conjunto K ⊂ Rd é compacto se e somente se ele é fechado e limitado. Logo depois, usaremos este resultado para dois fins: mostrar que todas as normas sobre Rd são equivalentes e construir uma métrica sobre as funções contı́nuas de A ⊂ Rd aberto em R. O próximo passo será apresentar o Teorema de Arzelà-Ascoli, que descreve subconjuntos compactos de espaços de funções contı́nuas. As aplicações deste teorema são mais complicadas e são deixadas para outros capı́tulos, onde discutirmos curvas de comprimento mı́nimo (a incluir) e existência de soluções para Equações Diferenciais Ordinárias. 7.1 Compactos de Rd: o Teorema de Heine-Borel Quem são os compactos de X = Rd com a métrica usual? O resultado a seguir é um clássico da Análise, que responde a essa pergunta. Teorema 7.1 (Heine Borel) Um subconjunto K ⊂ Rd é compacto se e somente se é fechado e limitado. Prova: Apresentamos dois argumentos. No primeiro, usamos o fato de que K é compacto se e somente se é fechado e totalmente limitado. Desta forma, para provar o teorema, basta provar que qualquer um subconjunto K ⊂ Rd é limitado se e somente se é totalmente limitado. Mas isto é simples: • Se K é totalmente limitado, K ⊂ ∪mi=1BRd(xi, δ). Mas então a desigualdade triangular mostra que dRd(0, x) ≤ max{dRd(0, xi)}1≤i≤n + δ para todo x ∈ K, ou seja, K é limitado. • Se K ⊂ Rd é limitado, temos que K ⊂ [−n, n]d para algum n ∈N. Dividindo cada intervalo [−n, n] em intervalos de comprimento < δ/ √ d, vemos que [−n, n]d é dividido em um número finito de cubos tais que |x − x′| < δ para quaisquer dois elementos no mesmo cubo. Tomando um ponto xi em cada cubo, vemos que K ⊂ [−n, n]d ⊂ ∪mi=1BRd(xi, δ) para uma certa coleção finita de pontos. Deste modo, K é totalmente limitado. Como segundo argumento, usaremos o critério das subsequências convergentes. Voltamos ao §3.2.1 e lembramos que toda sequência limitada em Rd tem uma subsequência convergente. Em 111 particular, se K ⊂ Rd é fechado e limitado, toda sequência em K tem subsequência com limite em K (que é fechado!). Por outro lado, se K não é fechado ou não é limitado, há nele uma sequência que não tem subsequência convergente em K (e portanto K não é compacto). Vejamos o porquê. • Se K não é fechado, há uma sequência {xn}n∈N ⊂ K convergindo a x 6∈ K. Qualquer subsequência de {xn}n∈N também converge a x, logo não há subsequência convergindo a elemento de K. • Se K não é limitado, para todo n ∈N há um xn ∈ K com |xn|2 ≥ n e é fácil ver que {xn}n∈N não tem subsequência convergente. 2 Exercı́cio 7.1 Use o Teorema de Heine-Borel para decidir quais dentre os seguintes subconjuntos de Rd são compactos: Rd; ∅; BRd(0, 1); BRd [0, 1]; Sd−1 := {x ∈ Rd : |x|2 ≤ 1}; ∆d := {x ∈ Rd+ : d ∑ i=1 x[i] = 1}; Od := {x ∈ Rd+ : x[1] ≤ x[2] ≤ x[3] ≤ · · · ≤ x[d]}; a “versão” do Od com “x[1] < x[2] < · · · < x[d]”(desigualdades estritas). Exercı́cio 7.2 Para cada um dos conjuntos S ⊂ Rd que não são compactos apresentados no exercı́cio anterior, encontre uma f : S → R com infs∈S f (s) = −∞ e uma cobertura de S por abertos que não tem subcobertura finita. (Você já sabe que uma tal f e uma tal subcobertura existem pela teoria geral, claro.) Exercı́cio 7.3 Considere uma função contı́nua f : Rd → R satisfazendo lim|x|2→+∞ f (x) = +∞. Dado c ∈ R, mostre que seus conjuntos de “nı́vel c”e “subnı́vel c” Fc := {x ∈ Rd : f (x) = c} e S≤c := {x ∈ Rd : f (x) ≤ c} são compactos. 7.2 Aplicações do teorema de Heine-Borel Poucos teoremas na Análise são tão usados quanto o de Heine-Borel. Nesta seção, não fazemos mais do que apresentar duas situações em que ele é útil: para entender normas em Rd e discutir o conceito de convergência sobre compactos para funções contı́nuas. 7.2.1 Todas as normas sobre Rd são equivalentes Aqui provamos algo que prometemos há muito tempo: que todas as normas em Rd são equiva- lentes. Em particular, os fatos a seguir todos seguem disso. • Todas as normas sobre Rd definem a mesma topologia. 112 • Rd é completo com qualquer norma. Abaixo, enunciamos “por extenso” o que significa dizer que uma norma é equivalente à norma Euclideana. É boa ideia recordar o Teorema 3.3 antes de lê-lo. Teorema 7.2 Considere uma norma ‖ · ‖ sobre Rd e seja | · | a norma Euclideana. Então existem C, c > 0 tais que ∀x ∈ Rd : c |x|2 ≤ ‖x‖ ≤ C |x|2. (7.1) Em particular, a norma ‖ · ‖ e a norma Euclideana definem a mesma topologia sobre Rd. Prova: Lembre-se de que e1, . . . , ed são os vetores da base canônica de Rd: fixo 1 ≤ i ≤ d, ei tem a i-ésima coordenada igual a 1 e as demais coordenadas iguais a 0. Recorde ainda que ∀x ∈ Rd : x = d ∑ i=1 x[i] ei. Vamos provar agora a existência de C > 0 como acima. Veja que, dado x ∈ Rd qualquer ‖x‖ = ‖ d ∑ i=1 x[i]ei‖ (subaditividade) ≤ d ∑ i=1 ‖x[i] ei‖ (homogeneidade positiva) = d ∑ i=1 |x[i]| ‖ei‖ ≤ d ∑ i=1 |x[i]| max 1≤j≤d ‖ej‖ = max 1≤j≤d ‖ej‖ (|x|1) (| · |1 ≤ √ d | · |2) ≤ ( √ d max 1≤j≤d ‖ej‖) |x|2. Logo a constante C := √ d max1≤j≤d ‖ej‖ satisfaz o que queremos. Note que C > 0 porque ei 6= 0 para cada i e portanto ‖ei‖ > 0 para cada i. Provaremos agora que existe c > 0 como acima usando a primeira parte. Considere a esfera unitária Sd−1 ⊂ Rd, dada por Sd−1 = {x ∈ Rd : |x|2 = 1}. Como f (x) = |x|2 = dRd(x, 0) (x ∈ Rd) é contı́nua, Sd−1 = f−1({1}) é subconjunto fechado de Rd. Além disso, Sd−1 é limitado. Deduzimos que a esfera Sd−1 é compacta. Além disso, a função g(x) := ‖x‖ (com x ∈ Sd−1) é C-Lipschitz, já que ∀x, x′ ∈ Sd−1 : |g(x)− g(x′)| = |‖x‖ − ‖x′‖| ≤ ‖x− x′‖ ≤ C |x− x′|2. Portanto, g é uma função contı́nua sobre um compacto e existe um x∗ ∈ Sd−1 com c := g(x∗) = infx∈Sd−1 ‖x‖. A fortiori, c > 0, já que x∗ ∈ Sd−1 ⇒ x∗ 6= 0 e ‖ · ‖ é uma norma. Basta checar agora que c “funciona” para nossos propósitos. Para isto, tome x ∈ Rd qualquer. Se x = 0, claramente ‖x‖ = 0 ≥ c|x|2 = 0. Se x 6= 0, então x/|x|2 ∈ Sd−1, logo ‖x/|x|2‖ ≥ c e ‖x‖ ≥ c |x|2 pela homogeneidade positiva da norma. 2 113 Exercı́cio 7.4 Mostre que quaisquer duas normas sobre um espaço de matrizes Rd×` são equivalentes. 7.2.2 Convergência uniforme sobre compactos Nesta seção, A ⊂ Rd é um aberto com A 6= ∅, (V, ‖ · ‖V) é um espaço de Banach e C := C(A, V) é o espaço de funções contı́nuas de A em V. Como de costume,este espaço tem uma estrutura de espaço vetorial, em que as somas e produtos por escalar são definidos para cada t ∈ A. Como podemos medir distâncias neste espaço? A definição das métricas de convergência uniforme em espaços do tipo C(K, Z) que vimos nos §6.3.1 e 6.3.2 depende do fato que K é compacto: só assim garantimos que os supremos naquelas definições fazem sentido. Por outro lado, as métricas que pusemos sobre aqueles espaços pressupõem o conceito de convergência uniforme, que não é o mais natutal sobre C(A, V). Exemplo 7.1 Considere o caso particular em que A = V = R (com as métricas/normas usuais). A sequência de funções “ fn : t ∈ R 7→ t2/(n + 1)” converge a 0C pontualmente, mas não converge uniformememnte já que fn(n) → +∞. No entanto, esta é uma sequência “bem comportada” em vários sentidos: por exemplo, para quaisquer a < b reais, ∫ b a fn(t) dt→ 0. A definição mais usada de convergência em C(A, V) é a de convergência uniforme sobre com- pactos. Usaremos abaixo a seguinte notação: dados K ⊂ A compacto e não vazio, e dada f ∈ C, ‖ f ‖K,∞ := sup t∈K ‖ f (t)‖V . Note que este supremo é um número real porque a restrição de f a K é contı́nua e, portanto, limitada. Além disso, pode-se verificar que ‖ · ‖K,∞ é homogênea positiva e subaditiva: ∀ f , g ∈ C∀λ ∈ R : ‖λ f ‖K,∞ = |λ| ‖ f ‖K,∞ e ‖ f + g‖K,∞ ≤ ‖ f ‖K,∞ + ‖g‖K,∞. Note que ‖ · ‖K não é positiva-definida em geral: a função f (·) = dRd(·, K) se anula em K, de modo que ‖ f ‖K,∞ = 0, mas f > 0 em A\K. Uma função homogênea positiva e subaditiva que não é necessariamente positiva-definida é dita uma seminorma. A definição de convergência uniforme em compactos é dada abaixo. Definição 7.1 Dados elementos { fn}n∈N ∪ { f } ⊂ C, dizemos que fn converge a f uniformemente sobre compactos se limn∈N ‖ fn− f ‖K,∞ = 0 para todo K ⊂ A compacto. Dizemos ainda que { fn}n∈N é Cauchy uniformemente sobre compactos se limm,n∈N ‖ fn − fm‖K,∞ = 0 para todo K ⊂ A compacto. Exercı́cio 7.5 Para esquentar, prove que a sequência de funções { fn}n∈N ⊂ C(R, R) no Exemplo 7.1 converge a 0C uniformemente sobre compactos. O próximo teorema é o principal resultado desta subseção. Ele nos diz que a noção de con- vergência uniforme sobre compactos corresponde a uma métrica bem-comportada sobre C(A, V) Teorema 7.3 Existe uma métrica dC sobre C = C(A, V) com as seguintes propriedades. 1. uma sequência em C é convergente (ou Cauchy) uniformemente sobre compactos se e somente se ela é convergente (ou Cauchy) com a métrica dC; 114 2. (C, dC) é completo. Trocando em miúdos: a noção de convergência uniforme sobre compactos corresponde a uma métrica sobre C(A, V) e o espaço métrico (C(A, V), dC) é completo. Para provar este teorema, precisaremos de um resultado preliminar, que segue do teorema de Heine-Borel. Lema 7.1 (Exaustão de A por número enumerável de compactos) Dado A ⊂ Rd aberto e não-vazio, existe uma sequência de compactos {Kn}n∈N de Rd com ∅ 6= K0 ⊂ K1 ⊂ K2 ⊂ · · · ⊂ A tais que ∪n∈NKn = A e com a propriedade que qualquer K ⊂ A compacto está contido num dos Kn. Prova: Se A = Rd, basta tomar Kn := BRd [0Rd , n] (n ∈N) e observar que cada K ⊂ Rd é limitado e portanto está contido numa destas bolas. Considere agora o caso em que o aberto A 6= Rd, de modo que F := Rd\A é fechado e não é vazio. Isto quer dizer que a função: “ψ : x ∈ Rd 7→ dRd(x, F) := infy∈F |x− y|2” é bem definida, não-negativa, 1-Lipschitz e ψ−1(0) = F. Desta forma, A = {a ∈ Rd : ψ(a) > 0}. Como A 6= ∅, existe um a0 ∈ A. Desta forma, vale a seguinte propriedade: ∀a ∈ Rd : a ∈ A⇔ ∃n ∈N : |a|2 ≤ n + |a0|2 e ψ(a) ≥ ψ(a0) n + 1 . (7.2) A partir destas propriedade, definiremos os compactos que buscamos. De fato, veremos que a definição a seguir funciona: Kn := { a ∈ Rd : |a|2 ≤ n + |a0|2 e ψ(a) ≥ ψ(a0) n + 1 } (n ∈N). Para provar que de fato funciona, checamos primeiramente que os conjuntos Kn são todos com- pactos de Rd. Percebe-se por inspeção que: ∀n ∈N : Kn := BRd [0Rd , n + |a0|2] ∩ ψ−1 ([ ψ(a0) n + 1 ,+∞ )) . Como ψ é contı́nua, os dois conjuntos da interseção são fechados de Rd, logo Kn também é fechado de Rd. Além disso, Kn está contido na bola de raio n + |a0|2 ao redor da origem e é, portanto, limitado. Deduzimos do Teorema de Heine-Borel que cada Kn é compacto. O próximo passo é mostrar que: ∅ 6= K0 ⊂ K1 ⊂ K2 ⊂ · · · ⊂ A e ∪n∈N Kn = A. De fato, K0 não é vazio porque vê-se que a0 ∈ K0. O fato de que Kn ⊂ Kn+1 para cada n ∈ N segue do fato que ∀a ∈ Rd : |a|2 ≤ n + |a0| e ψ(a) ≥ ψ(a0) n + 1 ⇒ |a|2 ≤ n + 1 + |a0| e ψ(a) ≥ ψ(a0) n + 2 115 (já que ψ(a0) > 0). Por fim, ∪n∈NKn = A segue do fato de que, comparando (7.2) com a definição de Kn, temos que um a ∈ Rd pertence a A se e somente se a ∈ Kn para algum n ∈N. Falta apenas mostrar que todo K ⊂ A compacto está contido em algum Kn. Para isso, fixe um tal K e observe que, como K ⊂ A, ψ(x) > 0 para todo x ∈ K. A continuidade de ψ e a compacidade de K garantem que o ı́nfimo de ψ sobre K é atingido e portanto infx∈K ψ(x) > 0. Além disso, sabemos que K é limitado, logo supx∈K |x|2 < +∞. Se n ∈ N é grande o suficiente, podemos garantir que inf x∈K ψ(x) ≥ ψ(a0) n + 1 e sup x∈K |x|2 ≤ n + |a0|. Deste modo, teremos: ∀a ∈ K : |a|2 ≤ sup x∈K |x|2 ≤ n + |a0| e ψ(a) ≥ ψ(a0) n + 1 , ou seja, ∀a ∈ K : a ∈ Kn. Isto quer dizer que K ⊂ Kn se n é grande o suficiente. 2 O Lema 7.1 vai nos permitir definir a métrica que nos interessa. A ideia intuitiva seria tomarmos uma soma das seminormas ‖ · ‖Kn,∞. No entanto, isso não é viável porque em princı́pio seminormas podem tomar valores muito grandes. Por essa razão, a proposição abaixo será útil. Proposição 7.1 Dado K ⊂ A compacto e não vazio, a função αK : C → [0, 1] definida por: αK( f , g) := min{‖ f − g‖K,∞, 1} (( f , g) ∈ C2) é simétrica, toma valores entre 0 e 1 e satisfaz a desigualdade triangular. Prova: Omitimos a prova das duas primeiras propriedades. Resta mostrar a desigualdade trian- gular. Queremos provar que, para f , g, h ∈ C: Queremos : min{‖ f − g‖K,∞, 1} ≤ min{‖ f − h‖K,∞, 1}+ min{‖h− g‖K,∞, 1}. Isso vem do fato que, se c, a, b são reais não-negativos, c ≤ a + b⇒ min{c, 1} ≤ min{a, 1}+ min{b, 1}, que pode ser checado por inspeção. Aceitando isso, observamos que, pela subaditividade da norma, c := ‖ f − g‖K,∞ ≤ a + b := ‖ f − h‖K,∞ + ‖g− h‖K,∞ portanto a desigualdade acima se aplica. 2 Agora provaremos o teorema, mostrando que uma soma das “semimétricas” αKn (com pesos adequados) nos dá a métrica que buscamos. Os exercı́cios abaixo serão necessários na prova. Exercı́cio 7.6 Dados K ⊂ F compactos contidos em A, mostre que αK( f , g) ≤ αF( f , g) para todas as funções f , g ∈ C. 116 Prova: [do Teorema 7.3] Fixe uma sequência {Kn}n∈N de compactos com as propriedades especifi- cadas no Lema 7.1 e defina, para f , g ∈ C: dC( f , g) := ∑ n∈N αKn( f , g) 2n , onde as αKn vêm da Proposição 7.1. Note que, como as funções αKn tomam valores entre 0 e 1, a série acima é cotada pela soma da progressão geométrica 1/2n. Portanto, a série é absolutamente convergente para quaisquer f , g. Logo, dC( f , g) é bem-definida. A próxima etapa da demonstração é mostrar o seguinte. dC satisfaz os axiomas de uma métrica. Em primeiro lugar, verificamos que dC é positiva-definida. De fato, dC( f , g) ≥ 0 porque cada αKn( f , g) ≥ 0. Claramente, dC( f , g) = 0 se f = g. Por outro lado, como a série definindo dC( f , g) é feita de termos não-negativos, dC( f , g) = 0⇔ ∀n ∈N : αKn( f , g) = 0⇔ ∀n ∈N : ‖ f − g‖Kn,∞ = 0. Em particular, se f (t) 6= g(t) para algum t ∈ A, o Lema 7.1 garante que t ∈ Kn para algum n ∈ N (afinal, A = ∪nKn) e vê-se que ‖ f − g‖Kn,∞ ≥ | f (t)− g(t)| > 0. Ou seja, f 6= g implica dC( f , g) > 0. Isto concui a prova de que dC é positiva-definida. (Repare que aqui usamos o fato de que A = ∪n∈NKn pela primeira vez. A outra propriedade garantida pelo Lema só seráusada mais para o final da prova abaixo.) Ainda nos resta provar que dC é simétrica e satisfaz a desigualdade triangular. Para isso, usamos novamente a Proposição 7.1: a simetria vem do fato de que cada αKn é simétrica e a desigualdade triangular vem do fato que, dadas f , g, h ∈ C: ∀n ∈N : αKn( f , g) ≤ αKn( f , h) + αKn(h, g) e podemos aplicar isso termo a termo na definição de dC (usando o fato de que séries absoluta- mente convergentes podem ser “somadas termo a termo”). Concluı́mos assim a prova de que dC é de fato uma métrica. Nosso próximo passo é relacionar a convergência e a propriedade de Cauchy segundo dC aos conceitos de convergência e Cauchy uniformes sobre compactos. Para isso, a afirmação a seguir será fundamental: ela relaciona o comportamento de dC e das seminormas ‖ · ‖Kn,∞ (ou melhor, com as semimétricas αKn definidas a partir destas normas). Afirmação 7.1 Dado n0 ∈N, valem as desigualdades: ∀ f , g ∈ C : αKn0 ( f , g) 2n0 ≤ dC( f , g) ≤ 2αKn0 ( f , g) + 1 2n0 . Prova: [da Afirmação 7.1] A cota inferior segue da definição de dC e do fato que todos os termos da forma αKn( f , g)/2 n aparecendo naquela definição são não-negativos. Para a cota superior, usamos as seguintes estimativas: αKn( f , g) ≤ { αKn0 ( f , g), se 0 ≤ n ≤ n0 (pelo Exercı́cio 7.6); 1, se n > n0 (pela Proposição 7.1). 117 Deste modo, dC( f , g) = +∞ ∑ n=0 αKn( f , g) 2n ≤ n0 ∑ n=0 αKn0 ( f , g) 2n + ∑ n>n0 1 2n = (2− 2−n0) αKn0 ( f , g) + 1 2n0 ≤ 2αKn0 ( f , g) + 1 2n0 . 2 De posse da afirmação, vai ser relativamente fácil terminar a prova. Começamos mostrando o seguinte. Dadas { f j}j∈N ∪ { f } ⊂ C, dC( f j, f )→ 0 se e somente se f j → f uniformemente sobre compactos. Para ver isso, suponha primeiramente que dC( f j, f )→ 0. Dado K ⊂ A compacto e não-vazio, queremos provar que ‖ f j − f ‖K,∞ → 0, o que é o mesmo que αK( f j, f ) → 0. O Lema 7.1 garante que K ⊂ Kn0 para algum n0 ∈ N e então o Exercı́cio 7.6 garante que αK( f j, f ) ≤ αKn( f j, f ). Usando a Afirmação, concluı́mos que 0 ≤ αK( f j, f ) ≤ αKn0 ( f j, f ) ≤ 2 n0 dC( f j, f )→ 0, e um raciocı́nio de sanduı́che implica αK( f j, f )→ 0. Por outro lado, se f j → f uniformemente sobre compactos, temos que αK( f j, f ) → 0 para todo K ⊂ A compacto. Em particular, isso vale quando K = Kn0 para qualquer n0 ∈N. Segue da Afirmação que: ∀n0 ∈N : lim sup j∈N dC( f j, f ) ≤ 2 lim sup j∈N αKn0 ( f j, f ) + 1 2n0 = 1 2n0 . Como isto vale para todo n0 ∈N, podemos mandar n0 → +∞ e obter: lim sup j∈N dC( f j, f ) ≤ 0, o que garante que dC( f j, f )→ 0. Agora tratamos de propriedades tipo Cauchy. Dada { f j}j∈N ⊂ C, dC( f j, f`)→ 0 se e somente se { f j}j∈N é uniformemente Cauchy sobre compactos. A prova é bastante parecida com a anterior e será apenas esboçada. Se { f j}j∈N é Cauchy sobre compactos, então ‖ f j − f`‖Kn,∞ → 0 (e portanto αKn( f j, f`) → 0) para qualquer n ∈ N. Fixando um n0 ∈N\{0}, a Afirmação nos dá a estimativa: dC( f j, f`) ≤ 2αKn0 ( f j, f`) + 1 2n0 . 118 Tomando j, `→ +∞, deduzimos: ∀n0 ∈N : lim sup j,l→+∞ dC( f j, f`) ≤ 1 2n0 e podemos concluir que dC( f j, f`)→ 0 como na prova anterior. Suponha agora que { f j}j∈N é Cauchy de acordo com a métrica dC. Fixo um compacto K ⊂ A, precisamos mostrar que ‖ f j− f`‖K,∞ → 0 quando j, `→ +∞. De fato, é fácil ver que é equivalente mostrar que αK( f j, f`) → 0. Para isso, seguimos o raciocı́nio anterior, tomando n0 ∈ N com K ⊂ Kn0 e observando que 0 ≤ αK( f j, f`) ≤ 2n0dC( f j, f`) j,`→+∞−→ 0, donde segue o αK( f j, f`)→ 0. Para terminar a prova, mostramos a afirmação final do teorema. (C, dC) é completo. Tome uma sequência { f j}j∈N que é Cauchy segundo dC. Mostramos abaixo que existe f ∈ C com dC( f j, f )→ 0. Em primeiro lugar, sabemos (pelos itens acima) que { f j}j∈N é uniformemente Cauchy sobre compactos. Em particular, para cada t ∈ A, { f j(t)}j∈N ⊂ V é Cauchy (já que {t} é compacto) e existe o limite pontual: f (t) := lim j→+∞ f j(t). Além disso, podemos provar pelo raciocı́nio usual que ‖ f j − f ‖K,∞ → 0 para qualquer K ⊂ A compacto. Dado t ∈ A arbitrário, precisamos mostrar que f é contı́nua em t. Para isso, usamos que A é aberto e portanto existe um δ > 0 tal que a bola fechada BRd [t, δ] ⊂ A. Como esta bola fechada é compacta (por Heine-Borel!), f j → f uniformemente sobre a bola. Mas sabemos que o limite uniforme de funções contı́nuas sobre um compacto é uma função contı́nua. Deduzimos que a restrição de f à bola BRd [t, δ] é contı́nua, o que implica (exercı́cio!) a continuidade de f em t. Agora, sabemos que f é contı́nua em cada t ∈ A, logo f ∈ C. Como vimos acima, ‖ f j − f ‖K,∞ → 0 para qualquer K ⊂ A compacto. Já sabemos que isso é equivalente a dC( f j, f ) → 0. Ou seja: provamos (como querı́amos) que { f j}j∈N converge em C. 2 7.3 Compactos nos espaços de funções contı́nuas Acima mostramos que os subconjuntos compactos de Rd têm uma “cara” simples: são simples- mente os fechados e limitados. Em particular, bolas fechadas são sempre compactas. Abaixo, veremos que este resultado não se estende a espaços de funções contı́nuas. No entanto, conse- guiremos uma caracterização dos compactos via um teorema chamado de Arzelà-Ascoli. 119 7.3.1 Bolas fechadas não são compactas Considere C([0, 1], R) com a norma do sup usual. É um fato que existe uma sequência { fn}n∈N ⊂ C([0, 1], R) de funções com ‖ fn‖[0,1],∞ = 1 e ‖ fn − fm‖[0,1],∞ = 1 para todos m, n ∈ N. Por- tanto a bola unitária fechada ao redor de 0 não é totalmente limitada: ela contem um 1/2- empacotamento infinito. Exercı́cio 7.7 Cheque que a sequência de ”tendas” construı́da no Exemplo 3.2 tem as propriedades reque- ridas acima acima. Na verdade, o que ocorre é um fenômeno muito mais geral: C([0, 1], R) não tem bolas com- pactas porque não é um espaço vetorial de dimensão finita. Lema 7.2 (Lema de Riesz) Considere um espaço de Banach (V, ‖ · ‖V). Então, as bolas fechadas de V são compactas se e somente se V tem dimensão finita. Não provaremos este resultado aqui, embora a prova não seja muito difı́cil. No entanto, ele indica que um critério para achar quem são os compactos de C([0, 1], Rd) tem de ser mais complicado que o teorema de Heine-Borel. Veremos o critério adequado quando estudarmos o teorema de Arzèla-Ascoli, no capı́tulo adequado. 7.3.2 O teorema de Arzelà-Ascoli Agora passamos ao contexto geral em que (K, dK) é compacto, (Z, dZ) é completo e C := C(K, Z) é espaço métrico com a norma do supremo: dC( f , g) := sup t∈K dZ( f (t), g(t)). Como podemos caracterizar os compactos de C? Como C é completo, sabemos que F ⊂ C é compacto se e somente se é fechado e totalmente limitado. O teorema a seguir – um resultado fundamental de Análise – mostra quem são os subconjuntos uniformemente limitados de C. Abaixo, recorde que m f (·) é o módulo de continuidade de f : K → Z, definido como no §6.3.3: m f (δ) := sup{dZ( f (x), f (x′)) : x, x′ ∈ K, dX(x, x′) ≤ δ} ( f : K → Z, δ > 0). Teorema 7.4 (Arzelà-Ascoli) Uma famı́lia de funções F ⊂ C(K, Z) (com (K, dK) compacto e (Z, dZ) completo) é totalmente limitada se e somente se ela tem as duas propriedades abaixo. 1. F é pontualmente totalmente limitada: dado qualquer t ∈ K, o conjunto de valores F (t) := { f (t) : f ∈ F} é totalmente limitado. 2. F é equicontı́nua: limδ→0+ sup f∈F m f (δ) = 0. Observação 7.1 Em particular, o teorema nos diz que, se F ⊂ C satisfaz 1 e 2, então toda sequência em F tem uma subsequência convergente. 120 A prova do Teorema 7.4 está contida nos Lemas 7.3 e 7.4 abaixo. Antes de apresentar os lemas, vamos tentar entender as duas condições no teorema. O ponto é que as duas condições valem se F tem um número finito de funções: a propriedade 1 é trivial e a 2 vale porque cada f ∈ C é uniformemente contı́nua e portanto limδ→0+ m f (δ) = 0 para cada f ∈ F . O que o teorema nos diz, para famı́lias gerais de funções, é queas propriedades 1 e 2 valem se e somente se F pode ser bem aproximada por uma famı́lia finita de funções; isto é, se F tem e-redes finitas para qualquer e > 0. O próximo resultado mostra uma direção do Teorema de Arzèla-Ascoli. Lema 7.3 (Necessidade das condições no teorema) Com a notação do Teorema 7.4, vale que, se F é totalmente limitada, então valem as condições 1 e 2. Prova: Suponha que F é totalmente limitada e fixe um e > 0 qualquer. Iremos mostrar que: (i) Dado t ∈ K, podemos cobrir F (t) por um número finito de bolas fechadas de raio e. (ii) Temos que lim supδ→0+ sup f∈F m f (δ) ≤ 2e. De fato, se (i) vale para qualquer e > 0, isto nos diz que cada conjunto F (t) pode ser coberto por um número finito de bolas de raio e; ou seja, cada F (t) é totalmente limitado. Ao mesmo tempo, se (ii) vale para qualquer e > 0, lim supδ→0+ sup f∈F m f (δ) ≤ 0 e (como m f (δ) ≥ 0 sempre) temos limδ→0+ sup f∈F m f (δ) = 0. Portanto, provar (i) e (ii) será suficiente para concluir a prova deste lema. Para demonstrar (i) e (ii), usaremos o fato de que F é totalmente limitado. Deste modo, existe uma e-rede finita R ⊂ F , que satisfaz: ∀ f ∈ F∃g f ∈ R : dC(g f , f ) ≤ e. (7.3) A existência desta rede finita nos permite provar a propriedade (i). De fato, veremos que R(t) := {g(t) : g ∈ R} é e-rede de F (t) (e é finita porque R é finito). Para mostrar isso, tome um a ∈ F (t) qualquer. Pela definição de F (t), a = f (t) para alguma f ∈ F . Considere agora g f ∈ R como em (7.3) e note que b := g f (t) ∈ R(t) satisfaz: dZ(a, b) = d( f (t), g f (t)) ≤ sup s∈K dZ( f (s), g f (s)) = dC( f , g f ) ≤ e. Portanto, dado a ∈ F (t), há um b ∈ R(t) com dZ(a, b) ≤ e. Ou seja, R(t) é mesmo e-rede. Agora usaremos R para mostrar a propriedade (ii). Observe que, dados quaisquer x, x′ ∈ K com dX(x, x′) ≤ δ e qualquer f ∈ F (com g f como em (7.3)) dZ( f (x), f (x′)) ≤ dZ(g f (x), g f (x′)) + dZ(g f (x), f (x)) + dZ(g f (x′), f (x′)) ≤ sup s,t∈K : dX(s,t)≤δ dZ(g f (t), g f (s)) + 2 sup t∈K dZ(g f (x), g f (x′)) (use defs. de mg f e dC) ≤ mg f (δ) + 2dC( f , g f ) (use (7.3) e g f ∈ R) ≤ max g∈R mg(δ) + 2e. 121 Note que usamos maxg∈R (e não supg∈R) na última linha porque R é finito. Note ainda que este último termo é independente de f , x, x′. Ou seja, a desigualdade dZ( f (x), f (x′)) ≤ max g∈R mg(δ) + 2e vale para toda função f ∈ F e para todos os pares de pontos x, x′ ∈ K com dX(x, x′) ≤ δ. Tomando supremos, deduzimos que: sup f∈F m f (δ) ≤ max g∈R mg(δ) + 2e. Como já observamos antes da prova do teorema, o fato de que K é compacto implica que cada g ∈ R é uniformemente contı́nua, de modo que limδ→0+ mg(δ) = 0. Usando novamente a finitude de R, deduzimos que limδ→0+ maxg∈R mg(δ) = 0. Portanto, lim sup δ→0+ sup f∈F m f (δ) ≤ 2e, o que prova (ii). 2 Finalmente, apresentamos o fim da prova do Teorema 7.4. Lema 7.4 (Suficiência das condições no teorema) Com a notação do Teorema 7.4, se F satisfaz as condições 1 e 2, então F é totalmente limitada. Prova: Provaremos que, dado qualquer e > 0, se F satisfaz 1 e 2, então F não contem um e-empacotamento infinito. Isso basta pela Proposição 6.7. Como faremos isso? A prova será por contradição. Suporemos que F satisfaz as propriedades 1 e 2 e ao mesmo tempo contem um e-empacotamento infinito. Veremos que isso implicaria a existência de um (e/2)-empacotamento infinito em F (t1) × F (t2) × . . .F (tk), para alguma escolha de pontos t1, . . . , tk ∈ K. Veremos que isso contradiz o fato de que cada F (ti) é totalmente limitado (a propriedade 1 no teorema). Uma questão crucial é como escolher os pontos ti. A ideia é que estes pontos sejam tais que cada função f ∈ F seja “bem representada” pelos valores f (ti) nos pontos t1, . . . , tk. Para isso, usaremos a propriedade 2: sabemos controlar uniformemente sobre f ∈ F a variação de f (t) quando t muda: deste modo, bastará tomar uma δ-rede {t1, . . . , tk} para um δ bem escolhido para garantir que os valores de f (ti) “determinam f a menos de um erro pequeno”. A afirmação abaixo apresenta este raciocı́nio de forma precisa. Afirmação 7.2 Dado e > 0, e supondo que F satisfaz 1 e 2, existem um k ∈N\{0} e pontos t1, . . . , tk ∈ K tais que, se ∀ f1, f2 ∈ F : max 1≤i≤k dZ( f1(ti), f2(ti)) ≤ dC( f1, f2) ≤ max 1≤i≤k dZ( f1(ti), f2(ti)) + e 2 . Prova: [da Afirmação] Como e > 0, a propriedade 2 implica que existe um δ > 0 tal que sup f∈F m f (δ) ≤ e/4. Como K é compacto (e portanto totalmente limitado), existe uma δ-rede finita {t1, . . . , tk} ⊂ K. Pela definição de δ-rede, sabemos que, para cada x ∈ K, existe um ti 122 com dX(x, ti) ≤ δ, de modo que dZ( f (ti), f (x)) ≤ e/4 para qualquer f ∈ F . Mas então, dadas quaisquer f1, f2 ∈ K e dado qualquer x ∈ K: ∃1 ≤ i ≤ k : dZ( f1(x), f2(x)) ≤ dZ( f1(ti), f2(ti)) + 2m f (δ) ≤ max 1≤i≤k dZ( f1(ti), f2(ti)) + e 2 . Em particular, tomando o sup em x, deduzimos: ∀ f1, f2 ∈ F : dC( f1, f2) ≤ max 1≤i≤k dZ( f1(ti), f2(ti)) + e 2 . Isso dá a cota inferior na desigualdade que consta do enunciado da Afirmação. A cota inferior vem do fato que dZ( f1(t), f2(t)) ≤ dC( f1, f2) para quaisquer f1, f2 ∈ C e t ∈ K. [Fim da prova da afirmação] 2 Para fazermos uso da afirmação, é conveniente criar um pouco de notação. Defina Ti := F (ti) ⊂ Z e di a restrição da métrica de Z a Ti. Consideraremos o espaço-produto: T := T1 × T2 × · · · × Tk munido da métrica-produto: dT(x, y) := max 1≤i≤k dTi(x[i], y[i]) (x = (x[i]) k i=1, y = (y[i]) k i=1 ∈ T). A propriedade 1 no Teorema garante que cada (Ti, di) é totalmente limitado. O Exercı́cio 6.15 implica que (T, dT) também é totalmente limitado. Note que a função φ : F → T associando a cada f ∈ F o vetor φ( f ) ∈ T com coordenadas φ( f )[i] := f (ti) (1 ≤ i ≤ k) é bem definida. A Afirmação garanate que: ∀ f1, f2 ∈ F : dT(φ( f1), φ( f2)) ≤ dC( f1, f2) ≤ dT(φ( f1), φ( f2)) + e 2 . Agora usaremos a suposição (que fizemos para chegar a uma contradição) que há um e-empacotamento infinito P ⊂ F . Num e-empacotamento, como sabemos, quaisquer dois elementos distintos estão a distância estritamente maior do que e um do outro. Disso deduzimos que: ∀ f1, f2 ∈ P : f1 6= f2 ⇒ dT(φ( f1), φ( f2)) ≥ dC( f1, f2)− e 2 > e 2 . Dito de outro modo, a função φ é injetiva sobre P e a imagem deste conjunto, φ(P) := {φ( f ) : f ∈ P} ⊂ T, é um (e/2)-empacotamento infinito em (T, dT). No entanto, a existência de φ(P) contradiz o fato de que (T, dT) é totalmente limitado, que (como vimos) segue da propriedade 1 no Teorema e do Exercı́cio 6.15. Isto quer dizer que chegamos a uma contradição. Portanto, qualquer famı́lia F satisfazendo as propriedades 1 e 2 do Teorema tem de ser totalmente limitada. 2 Exercı́cio 7.8 Ao invés de fazermos uma prova por contradição, poderı́amos apresentar um argumento direto mostrando que P(F , e) ≤ P(T, e/2), para o T construı́do acima. Utilize esta observação e o Exercı́cio 6.15 para achar uma cota superior para P(F , e) (e portanto para N(F , e)) em termos de supt∈K N(F (t), e) e N(K, δ). 123 7.4 Mais exercı́cios Exercı́cio 7.9 Fixo d ∈ N\{0}, consideramos o conjunto Pd de todos os polinômios em uma variável real que têm grau d ou menor. Observe que, para cada polinômio p ∈ Pd, podemos encontrar coeficientes a0(p) . . . ad(p) tais que: ∀x ∈ R : p(x) = d ∑ j=0 aj(p) xj. Mostre que, dado qualquer conjunto S ⊂ R com mais de d + 1 pontos, existe uma constante Cd,S depen- dendo apenas de d e S tal que: ∀p ∈ Pd : max 0≤i≤d |ai(p)| ≤ Cd,S sup x∈S |p(x)|. Exercı́cio 7.10 Deduza do Teorema de Heine-Borel o seguinte resultado: dados d, ` naturais positivos, um subconjunto K ⊂ Rd×` é compacto (com a topologia dada por qualquer norma) se e somente se ele é fechado e limitado. Use este resultado para decidir se os conjuntos abaixo são subconjuntos compactos de Rd×d. 1. O(d) := {A ∈ Rd×d : AT A = Id×d} (grupo das matrizes ortogonais d× d); 2. SL(d, R) := {A ∈ Rd×d : det(A) = 1} (grupo linear especialem d dimensões); 3. PSD1(d, R) := {A ∈ Rd×d : A = AT, ∀v ∈ Rd, v.Av ≥ 0 e tr(A) = 1}. Exercı́cio 7.11 Tome d ∈ N\{0}. Lembre-se de Álgebra Linear que um autovalor de uma matriz A ∈ Rd×d é um número λ ∈ R tal que Ax = λx para algum x ∈ Rd\{0Rd}. Dado um conjunto S ⊂ Rd×d, defina: Eig(S) := {λ ∈ R : λ é autovalor de alguma A ∈ S}. 1. Prove que Eig(S) é fechado sempre que S é fechado. 2. Prove que Eig(S) é limitado sempre que S é limitado. 3. Deduza dos itens acima que Eig(S) é compacto sempre que S é compacto. Exercı́cio 7.12 Prove que um espaço métrico (K, dK) é compacto se e somente se, dada qualquer função contı́nua f : K → R, a imagem f (K) ⊂ R é compacta. Exercı́cio 7.13 Considere K ⊂ Rd compacto e convexo (convexidade significa que, dados quaisquer dois pontos x, x′ ∈ K, o segmento [x, x′] := {(1− λ)x + λx′ : 0 ≤ λ ≤ 1} está todo contido em K). Mostre que um subconjunto F ⊂ C(K, R`) é totalmente limitado se e somente se ele é equicontı́nuo e existe um ponto t0 ∈ K tal que F (t0) := { f (t0) : f ∈ F} é limitado. Exercı́cio 7.14 Fixados α > 0 e espaços métricos (K, dK), (Z, dZ) como no inı́cio do §7.3.2, dizemos que uma f : K → Z é α-Hölder com constante L > 0 se: ∀x, x′ ∈ K : dZ( f (x), f (x′)) ≤ L dK(x, x′)α. Note que este conceito generaliza o conceito de função Lipschitz (o caso α = 1 da definição acima). 1. Mostre que toda f que é α-Hölder com alguma constante também é contı́nua. 124 2. No caso particular em que K ⊂ Rd é compacto e convexo (v. exercı́cio anterior) e dK é a métrica induzida por | · |2, mostre que f : K → Z α-Hölder com α > 1⇔ f constante. 3. Permita novamente que (K, dK) seja um espaço métrico compacto arbitrário e agora considere Z = Rd com a métrica usual. Fixos L, α > 0 e um par (t0, z0) ∈ K×Rd, mostre que o conjunto a seguir é um subconjunto compacto de (C(K, Z), dC): HL,α,t0,z0 = { f : K → Rd : f é α-Hölder com constante L e f (t0) = z0}. Exercı́cio 7.15 (Arzèla-Ascoli para funções contı́nuas sobre um aberto) Dado A ⊂ Rd aberto, con- sidere o espaço C(A, V) com a métrica dC apresentada no §7.2.2. Dada uma função f ∈ C(A, V), pode- mos definir, para cada compacto K ⊂ A, a restrição de f a K, denotada por f |K. Prove que uma famı́lia F ⊂ C(A, V) é totalmente limitada de acordo com a métrica dC se e somente se ele tem as seguintes propriedades: 1. F é pontualmente totalmente limitada, isto é, para todo t ∈ A, F (t) := { f (t) : f ∈ F} é totalmente limitado; 2. F é equicontı́nua sobre compactos, isto é, para todo compacto não-vazio K ⊂ A: lim δ→0+ sup f∈F m f |K(δ) = 0. Deduza que toda sequência { fn}n∈N ⊂ C(A, V) com as duas propriedades acima tem uma subsequência { fnk}k∈N com fnk → f ∈ C(A, V) uniformemente sobre compactos. Exercı́cio 7.16 (Teorema de Dini) Considere um espaço topológico compacto (X, T ) e funções contı́nuas { f } ∪ { fn : n ∈ N} de X em R. Suponha que para todo x ∈ X a sequência { fn(x)}n∈N é monótona e converge a f . Prove que fn tem de convergir uniformemente a f , isto é supx∈X | fn(x)− f (x)| → 0 quando n→ +∞. Exercı́cio 7.17 Recorde o Exercı́cio 4.18. Naquele problema, tomamos um espaço métrico (X, dX) e uma f : X → R dada. Dado M > 0, definimos uma nova função fM : X → R, fM(x) := inf y∈X ( f (y) + MdX(x, y)) (x ∈ X). e mostramos que ‖ fM‖Lip ≤ M. 1. Mostre que, se (X, dX) é compacto e f é contı́nua, então fM → f uniformemente. Deduza que as funções Lipschitz são densas em C(X, R) com a métrica do sup. 2. Suponha agora que X = A é aberto de Rd e dX é a métrica induzida pela norma Euclideana sobre A. Prove que fM → f uniformemente sobre compactos; portanto, as funções Lipschitz também são densas em C(A, R) com a métrica da convergência uniforme sobre compactos. Exercı́cio 7.18 Considere um conjunto S ⊂ Rd não-vazio. Dizemos que uma curva (isto é, uma função contı́nua) γ : [0, 1]→ Rd cobre S se γ([0, 1]) ⊃ S. Suponha agora que o conjunto CS := {γ : [0, 1]→ Rd : γ cobre S e ‖γ‖Lip < +∞} não é vazio. Mostre que existe um elemento γ? ∈ CS com ‖γ?‖Lip = inf{‖γ‖Lip : γ ∈ CS}. 125 126 Capı́tulo 8 Caminhos e conexidade Se neste moment faz 30oC no Rio de Janeiro e −10oC em São Petesburgo, podemos garantir que qualquer temperatura entre −10o e 30oC ocorre em algum ponto da superfı́cie do planeta? Este é um exemplo de uma classe mais geral de perguntas. Dada uma função real f : X → R, se ela atinge um par de valores a < b, é necessariamente verdade que ela atinge todos os valores entre a e b? Ou seja, quando vale a implicação: “∀a, b ∈ f (X) : a < b⇒ [a, b] ⊂ f (X)”? Pelo Teorema do Valor Intermediário, a implicação acima vale quando X ⊂ R é um intervalo e f é contı́nua. O conceito de conexidade de um espaço topológico, apresentado neste capı́tulo, pode ser defi- nido da seguinte maneira: um espaço é conexo se e somente se toda função contı́nua de X em R tem a “Propriedade do Valor Intermediário” descrita acima. Outra definição, equivalente a esta, é que um espaço topológico (X, T ) é conexo se toda divisão de X em duas partes não-triviais gera uma “quebra”, ou melhor, uma “fronteira” onde as duas partes se encostam. A equivalência dessas definições é parte do Teorema 8.1 abaixo. Além de falarmos de conexidade, falaremos de uma outra definição relacionada: a de cone- xidade por caminhos: um espaço é conexo por caminhos se quaisquer dois pontos são conectados por uma curva contı́nua. Este segundo conceito é menos geral que a conexidade topológica, mas é mais intuitivo que o primeiro e também é importante. Além disso, há alguns casos importantes em que os dois conceitos coincidem. Começamos, então, falando de conexidade por caminhos. 8.1 Conexidade por caminhos 8.1.1 Conectando pontos por curvas Fixe um espaço métrico (X, dX). Uma curva parametrizada é uma aplicação contı́nua γ : [0, 1]→ X. Dizemos que γ conecta x ∈ X a x′ ∈ X se γ(0) = x e γ(1) = x′. Dizemos ainda que γ conecta x a x′ em U ⊂ X se x, x′ ∈ U, γ conecta estes dois pontos e a imagem Im(γ) ⊂ U. Simbolizaremos esta relação pelo sı́mbolo x U↔ x′. Definição 8.1 Dizemos que U ⊂ X é conexo por caminhos se x U↔ x′ para todos x, x′ ∈ U. 127 Antes de compreender melhor esta definição, precisaremos de alguns fatos sobre a relação “ U↔”. O primeiro ponto é mostrar que esta é uma relação de equivalência sobre os elementos de U. Lema 8.1 Dados x, x′, x′′ ∈ U, temos: • Reflexividade: x U↔ x. • Simetria: x U↔ x′ se e somente se x′ U↔ x. • Transitividade: x U↔ x′ e x′ U↔ x′′ implicam x U↔ x′′. Prova: Reflexividade segue do fato de que a curva γ(t) ≡ x, t ∈ [0, 1], conecta x a x. Simetria vem do fato que γ conecta x a x′ se e somente se t 7→ γ(1− t) conecta x′ a x, e tanto γ quanto t 7→ 1− t são contı́nuas. Por fim, suponha x U↔ x′ U↔ x′′. Queremos demonstrar que x U↔ x′′, ou seja, que há uma curva que conecta x a x′′ em U. Veja primeiramente que, por hipótese, existem curvas γ0, γ1 : [0, 1]→ U com γ0(0) = x, γ0(1) = γ1(0) = x′ e γ1(1) = x′′. Defina agora: γ(t) := { γ0(2t), 0 ≤ t ≤ 1/2; γ1(2t− 1), 1/2 < t ≤ 1. A ideia é que nós “colamos” a curva γ0 com a curva γ1, o que resulta numa única curva contı́nua porque γ0 termina onde γ1 começa. De fato, supondo por um instante que γ é contı́nua, vemos que γ(t) ∈ U para todo t (afinal, γ(t) = γ0(s) ou γ1(s) para algum s ∈ [0, 1]) e conecta x a x′′, de modo que x U↔ x′′. Falta checar que γ é mesmo contı́nua. Há várias maneiras de fazer isso e aqui optamos pela mais topológica. Dado um conjunto F ⊂ U fechado em U, vamos mostrar que γ−1(F) ⊂ [0, 1] é fechado. Veja que, dado um t ∈ [0, 1] qualquer, t ∈ γ−1(F)⇔ (t ≤ 1/2 e γ0(2t) ∈ F) ou (t ≥ 1/2 e γ1(2t− 1) ∈ F). O ponto sutil acima é que as duas cláusulas do “ou” serão verdade simultaneamente no caso em que t = 1/2. Isto vem do simples fato que γ0(2t) = x′ = γ1(2t− 1) se t = 1/2. Aqui usamos o fato de que γ0 termina onde γ1 começa, que é fundamental para termos a continuidade.Vamos agora terminar a prova observando o seguinte. Defina as funções contı́nuas φ0(t) := 2t, definida para t ∈ [0, 1/2], e φ1(s) := 2s− 1, para s ∈ [1/2, 1]. A equivalência acima nos mostra que γ−1(F) = (γ0 ◦ φ0)−1(F) ∪ (γ1 ◦ φ1)−1(F). Como γ0, γ1, φ0 e φ1 são contı́nuas, temos que (γ0 ◦ φ0)−1(F) ⊂ [0, 1/2] é fechado em [0, 1/2] e (γ1 ◦ φ1)−1(F) ⊂ [1/2, 1] é fechado em [1/2, 1]. Como ambos os intervalos são fechados, deduzimos que (γ0 ◦ φ0)−1(F) e (γ1 ◦ φ1)−1(F) são ambos fechados em [0, 1] e portanto γ−1(F), que é a união dos outros dois, também é fechado em [0, 1], como querı́amos demonstrar. 2 128 8.1.2 Exemplos básicos Vamos agora estudar alguns casos de conjuntos conexos por caminhos. Exemplo 8.1 Os conjuntos conexos por caminhos em R são exatamente os intervalos. Observe que um conjunto I ⊂ R é um intervalo se e somente se, dados x, x′ ∈ I com x < x′, temos que qualquer ponto z ∈ (x, x′) está em I. Desta forma, sempre que I é um intervalo e x < x′ estão em I, temos que a curva γ(t) := (1− t) x + t x′ (t ∈ [0, 1]) conecta x a x′ em I, o que quer dizer que x I↔ x′ e vice-versa. Ou seja, se I é intervalo, então I é conexo por caminhos. Para ter a recı́proca, suponha que I ⊂ R é conexo por caminhos. Queremos mostrar que I é um intervalo, isto é, que, dados x, x′ ∈ I com x < x′, então qualquer ponto z ∈ (x, x′) está também em I. Considere x < x′ como acima e tome uma curva contı́nua γ : [0, 1] → I conectando x a x′ em I. Esta é uma aplicação contı́nua de [0, 1] em R, portanto o Teorema do Valor Intermediário nos garante que, dado z ∈ (x, x′), há um t ∈ (0, 1) com γ(t) = z. Em particular, como a imagem de γ está contida em I, isto quer dizer que z = γ(t) ∈ I. Como z ∈ (x, x′) é arbitrário, isto encerra a prova. Exemplo 8.2 Seja (V, ‖ · ‖V) um espaço vetorial normado e C ⊂ V um conjunto convexo, isto é tal que, dados quaisquer v, v′ ∈ C e t ∈ [0, 1], (1− t) v + tv′ ∈ C. Geometricamente, isto quer dizer que, dados dois pontos em C, todo o segmento de reta entre eles também está em C. Veja que claramente C é conexo, dado que, dados v, v′, a curva γ(t) = (1− t) v + t v′, que é contı́nua (por quê?), demonstra que v C↔ v′. O mais interessante é mostrar que toda bola em V é convexa. De fato, se R > 0 e v0 ∈ V, a bola B(v0, R) é dada por: B(v0, R) = {v ∈ V : ‖v− v0‖V < R.} Mas então, para quaisquer v, v′ ∈ B(v0, R) e t ∈ [0, 1], temos ‖v− v0‖V < R, ‖v′ − v0‖V < R e portanto ‖(1− t)v + tv′ − v0‖V = ‖(1− t)(v− v0) + t(v′ − v0)‖V ≤ (1− t)‖v− v0‖V + t‖v′ − v0‖V < (1− t)R + tR = R, ou seja, (1− t)v + tv′ ∈ B(v0, R). Exemplo 8.3 Suponha que U, V ⊂ X são conexos por caminhos e têm um ponto em comum. Então U ∪V é conexo por caminhos. De fato, seja x0 ∈ U ∩ V. Então, para todo x ∈ U ∪ V, ou x ∈ U e x U↔ x0 (já que U é conexo por caminhos), ou x V↔ x0 (e vale o análogo para V). Em ambos os casos, x U∪V↔ x0 e a transitividade desta relação garante que x U∪V↔ x′′ para quaisquer x, x′′ ∈ U ∪V. Exemplo 8.4 Seja U ⊂ X conexo por caminhos. Para qualquer função contı́nua f : U → Y, a imagem f (U) é conexa por caminhos. Em particular, se Y = R, f (U) é um intervalo. 129 Para ver isso, observe que, dados x, x′ ∈ U e uma curva γ ligando estes dois pontos em U, a composição f ◦ γ é contı́nua e conecta f (x) a f (x′) em f (U). Deste modo, como todos os pares de pontos em U são conectados por curvas em U, quaisquer dois pontos y = f (x), y′ = f (x′) em f (U) são conectados por caminhos em f (U). Ou seja, f (U) é conexo por caminhos. Exemplo 8.5 Dado d ∈N\{0, 1}, a esfera unitária Sd−1 ⊂ Rd é conexa por caminhos. Para provar este resultado, a ideia geométrica é a seguinte: dados x, x′ ∈ Sd−1, podemos pensa na interseção da esfera com o plano que passa por x, x′ e a origem de Rd. Esta interseção é um cı́rculo que passa pelos dois pontos e podemos tomar o arco do cı́rculo entre x e x′ como a curva que conecta os dois pontos. Formalizamos este raciocı́nio usando geometria analı́tica. Tome x, x′ ∈ Sd−1. Como ambos os vetores estão na esfera, eles têm norma 1 e podemos achar um vetor x⊥ tal que: x′ = (x.x′) x + √ 1− (x.x′)2 x⊥. Como |x.x′| ≤ 1 por Cauchy Schwartz, podemos também escrever x.x′ = cos θ para algum 0 ≤ θ ≤ π; deste modo, sin θ ≥ 0 e a relação cos2 θ + sin2 θ = 1 nos diz que sin θ = √ 1− cos2 θ. Deduzimos que: x′ = cos θ x + sin θ x⊥. Portanto, a curva γ : t ∈ [0, θ] 7→ (cos t) x + (sin t) x⊥ é contı́nua, tem imagem na esfera (exercı́cio) e vai de γ(0) = x e γ(1) = x′. Como x e x′ são arbitrários, Sd−1 é conexa por caminhos. Exercı́cio 8.1 Determine se os conjuntos contidos em Rd (d > 1) abaixo são convexos e/ou conexos por caminhos. 1. O simplexo ∆d := { x ∈ Rd : d ∑ j=1 x[j] = 1 e ∀i ∈ {1, . . . , d}, x[i] ≥ 0 } . 2. A esfera unitária Sd−1 := {x ∈ Rd : |x|2 = 1.} 3. Rd\{0}. Exercı́cio 8.2 Tome a métrica discreta sobre X e prove que este espaço é conexo por caminhos se e somente se X tem apenas um elemento. 8.2 Conexidade topológica O conceito de conexidade topológica é menos intuitivo que o de conexidade por curvas, mas é mais geral e de certo modo mais robusto e mais importante. Primeiro tentaremos entender a intuição deste conceito. Imagine que tentamos separar X em duas partes L e R = Lc com L, R 6= ∅. Queremos dizer que, se X é conexo, qualquer divisão 130 deste tipo causará uma “quebra não-trivial”. Para definir isso, sugerimos a seguinte ideia: uma “quebra” é um conjunto de pontos u ∈ X que “vê de perto” tanto L quanto Lc. Num espaço métrico, é natural escrever esta condição na seguinte forma: u está na quebra se BX(u, r) ∩ L 6= ∅ e BX(u, r) ∩ Lc 6= ∅ para todo r > 0. É fácil ver que u satisfaz as condições acima se e somente se u ∈ ∂L = L ∩ R. Ou seja, quando dividimos X em L e R = Lc, a quebra é o conjunto ∂L. Dizer que há quebra é, então, pedir que ∂L 6= ∅. Esta é uma maneira de motivar a seguinte definição. Definição 8.2 Um espaço topológico (X, T ) é conexo se todo L ⊂ X com L 6= ∅, X tem ∂L 6= ∅. Um subconjunto U ⊂ X é conexo se (U, TU) é conexo, onde TU é a topologia induzida por T em U. Para esquentar, vale a pena tentar fazer o exercı́cio abaixo. Exercı́cio 8.3 Suponha que X tem pelo menos dois elementos. Ele é conexo com a topologia grossa? E com a topologia fina? 8.2.1 Formas equivalentes do conceito O conceito de conexidade acima faz sentido, mas as consequências dele ainda não são totalmente claras. Nosso próximo objetivo será provar o seguinte resultado. Teorema 8.1 Dado um espaço topológico (X, T ), as seguintes propriedades são equialentes. 1. (X, T ) é conexo; 2. os únicos subconjuntos de X que são simultaneamente abertos e fechados são ∅ e X; 3. toda função contı́nua η : X → {0, 1} é constante (usamos a topologia da métrica discreta em {0, 1}); 4. para toda toda função contı́nua f : X → R, f (X) := { f (x) : x ∈ X} é um intervalo. Vejamos o que cada item diz. O primeiro é a nossa definição: X é conexo se qualquer maneira de parti-lo em dois resulta numa “quebra”. O segundo, como veremos, tem a ver com a relação entre “∂S = ∅” e um subconjunto ser simultaneamente aberto e fechado. O terceiro diz que não dá para pintar os pontos de X usando duas cores (aqui representadas por 0 e 1) sem criar uma região onde se “pula” abruptamente de uma cor pra outra (o que seria uma descontinuidade em η). O último item nos fala que a imagem de X por f não pode ”pular”um ponto da reta; ou seja, X é conexo se e somente se o Teorema do Valor Intermediário se aplica a X! Faremos esta prova por partes e de uma forma que não é “econômica em implicações”. Começamos com uma proposição que mostra “1⇔ 2”. Proposição 8.1 Um espaço topológico (X, T ) é conexo se e somente se ∅ e X são os únicos conjuntos simultaneamente abertos e fechados de X. Prova: Olhando para a Definição 8.2, vemos que esta Proposição é equivalente à seguinte afirmação. Afirmação 8.1 Em qualquer espaçotopológico (X, T ), um conjunto L ⊂ X satisfaz ∂L = ∅ se e somente se L é ao mesmo tempo aberto e fechado. 131 Provemos, então, esta afirmação. Começamos supondo que L ⊂ X é ao mesmo tempo aberto e fechado; nosso objetivo será mostrar ∂L = ∅. Para isso, recorde que complementares de abertos/fechados são fechados/abertos (respectivamente). Portanto, o complementar de L também é ao mesmo tempo aberto e fechado. Sendo assim, L = L, Lc = Lc e ∂L = L ∩ Lc = L ∩ Lc = ∅, como querı́amos demonstrar. Agora provamos a implicação na direção contrária. Suponha que L ⊂ X tem fronteira va- zia; queremos provar que L é ao mesmo tempo aberto e fechado. Nossa hipótese diz que∂L = L∩ Lc = ∅. Para quaisquer dois subconjuntos de X, A∩ B = ∅ implica A ⊂ Bc. Deste modo, de- duzimos da igualdade acima que L ⊂ Lcc. Como a Proposição 5.2 nos diz que “o complementar do fecho é o interior do complementar”, obtemos L ⊂ Lo. Mas também sabemos que Lo ⊂ L ⊂ L sempre. Portanto, obtemos L = L = Lo. Como L é fechado e Lo é aberto, deduzimos que L é fechado e aberto. Isto conclui a prova. 2 O próximo passo prova que “1⇔ 3” no Teorema 8.1. Proposição 8.2 Um espaço topológico (X, T ) é conexo se e somente se toda função contı́nua η : X → {0, 1} é constante (aqui tomamos a topologia discreta sobre {0, 1}, que é a mesma topologia induzida pela métrica usual da reta real). Prova: A prova se baseia caracterização de conexidade na Proposição 8.1 e na seguinte observação: há uma bijeção natural entre funções contı́nuas η : X → {0, 1} e conjuntos L ⊂ X que são simultaneamente abertos e fechados. Para ver isso, tome η : X → {0, 1} contı́nua. Como {0}, {1} são subconjuntos simultanea- mente abertos e fechados de {0, 1}, Lη := η−1({0}) é aberto e fechado em X. Na direção contrária, se L ⊂ X é simultaneamente aberto e fechado, é fácil ver que a função: ηL : x ∈ X 7→ { 0, x ∈ L; 1, x ∈ Lc; é contı́nua. Note-se ainda que LηL = L e ηLη = η para quaisquer L, η como acima. Provada a observação, podemos concluir a prova, notando que uma função contı́nua η : X → {0, 1} é constante se e somente se Lη = ∅ ou Lη = X. 2 A próxima Proposição termina a prova do Teorema 8.1, mostrando que “3⇔ 4. Proposição 8.3 Um espaço topológico (X, T ) tem a propriedade de que toda função contı́nua η : X → {0, 1} é constante se e somente se para qualquer f : X → R contı́nua, f (X) é intervalo. Prova: Provaremos as duas implicações na forma contrapositiva. Se existe uma η : X → {0, 1} contı́nua e não constante, queremos mostrar que há uma f : X → R contı́nua tal que f (X) não é intervalo. A ideia é tomarmos f = η, já que o fato de que η não é constante implica que η(X) = {0, 1} não é intervalo. No entanto, esse argumento falha por tecnicalidades: 132 • f deve ter contradomı́nio R, enquanto η tem contradomı́nio {0, 1}: elas não podem ser “a mesma função”; • mesmo que fossem a mesma função, não é completamente evidente que f seja contı́nua (com contradomı́nio R e a topologia correspondente) só porque η é cotı́nua. O primeiro ponto é resolvido observando que podemos definir f : X → R pela fórmula ∀x ∈ X : f (x) = η(x). Na verdade, este truque é comum: sempre podemos “trocar o contradomı́nio” de uma função η : S1 → S2 por um outro conjunto S3 6= S2, contanto que S3 ⊃ η(S1). Isso será feito de novo a seguir e será chamado de “abuso de notação”. O segundo ponto acima também é um pouco sutil. Resolvê-lo passa pelo fato que a topologia discreta sobre {0, 1} é precisamente a topologia induzida pela métrica natural sobre a reta real. Deste modo, se S ⊂ R é dado, observe que f−1(S) = η−1(S ∩ {0, 1}) e que S ∩ {0, 1} é sempre aberto em {0, 1}. Como η é contı́nua, isto quer dizer que f−1(S) é aberto de X para todo S ⊂ R, o que é mais do que suficiente para garantir que f : X → R é contı́nua. Agora suporemos que existe uma f : X → R contı́nua tal que não é intervalo e mostraremos que existe η : X → R contı́nua e não constante. Dizer que f (X) não é intervalo significa que existem números reais r < r′ < r′′ na reta com r, r′′ ∈ f (X) e r′ 6∈ f (X). Observe que isso quer dizer que f (X) ⊂ R\{r′}. Em particular, podemos “abusar notação” e dizer que o contradomı́nio de f é R\{r′}. Observe agora que a função ξ : R\{r′} → {0, 1} que leva t ∈ R\{r′} em 0 se t < r′ e em 1 se t > r′, é contı́nua. Isso quer dizer que η := ξ ◦ f : X → {0, 1} também é contı́nua. Afirmamos que η não é constante. Para ver isso, basta lembrarmos que r < r′ < r′′ com r, r′′ ∈ f (X), logo existem x, x′′ ∈ X com f (x) = r, f (x′′) = r′′ e η(x) = ξ(r) = 0 e η(x′′) = ξ(r′′) = 1. Portanto, η não é constante. 2 8.2.2 Exemplos Nossa próxima tarefa é analisar alguns exemplos em que a definição de convexidade é aplicada. Começamos descobrindo quem são os conjuntos conexos da reta real. Exemplo 8.6 Os subconjuntos conexos da reta R são precisamente os intervalos. Para ver isso, tome I ⊂ R intervalo. Dada η : I → {0, 1} contı́nua, veremos que ela tem de ser constante. Suponha (para chegar a uma contradição) que η não é constante. Como vimos na prova da Proposição 8.3, podemos “abusar notação” e pensar em η como uma função contı́nua de I em R. Como ela não é constante, há pontos t0, t1 ∈ I com η(t0) = 0 e η(t1) = 1. O Teorema do Valor Intermediário implica que para cada x ∈ (0, 1) há um t ∈ I com γ(t) = x. Mas isto contradiz o fato de que o contradomı́nio de η é {0, 1}. Portanto, se I é intervalo, toda η : I → {0, 1} tem de ser constante. 133 Por outro lado, suponha que I não é intervalo. Mostraremos que I é desconexo usando uma função análoga à ξ da prova da Proposição 8.3. Como I não é intervalo, existe um ponto r ∈ R\I tal que inf I < r < sup I. A função ξ(t) := { 0, t < r 1, t > r. Esta função está definida para t ∈ R e é sabido que ela só é descontı́nua em t = x. Como x 6∈ I, sua restrição η = η0 |I é contı́nua. Além disso, vemos que, como x > inf I, existe t0 ∈ (inf I, x) com t0 ∈ I e portanto η(t0) = 0. Do mesmo modo, como x < sup I, existe t1 ∈ (x, sup I) com η(t1) = 1. Portanto, o fato de que I não é um intervalo implica que existe η : I → {0, 1} contı́nua e não constante. Exemplo 8.7 Todo conjunto conexo por caminhos é conexo. (A recı́proca em geral é falsa.) Um contraexemplo para a recı́proca será discutido na próxima seção. Para ver que conexidade por caminhos implica conexidade, imagine que U é conexo por caminhos e que η : U → {0, 1} é contı́nua. Sem perda de generalidade, supomos que U 6= ∅ e tomamos x0 ∈ U. Nossa tarefa será mostrar que η(x) = η(x0) para todo x ∈ U. De fato, dado x ∈ U, sabemos que x U↔ x0, portanto existe γ : [0, 1] → U contı́nua com γ(0) = x0 e γ(1) = x. A composição η ◦ γ : [0, 1] → {0, 1} é contı́nua; como [0, 1] é conexo, η ◦ γ é constante. Logo η(x) = η(γ(1)) = η(γ(0)) = η(x0), como querı́amos demonstrar. Exemplo 8.8 Se U ⊂ X é conexo, qualquer conjunto V contendo U e contido em U é conexo. É um bom exercı́cio provar isso no caso em que a topologia de X é dada por uma métrica. Abaixo, damos uma prova puramente topológica. Considere η : V → {0, 1} contı́nua; nosso objetivo é provar que ela é constante. O primeiro passo é observar que a restrição η |U também é contı́nua e, como U é conexo, η |U é constante. Suporemos sem perda de generalidade que η(x) = 0 para todo x ∈ U. A ideia agora é provar que η(y) = 0 para todo y ∈ V. Para isso, é suficiente mostrar que, dado um ponto arbitrário y ∈ V, existe um x ∈ U com η(x) = η(y). Fixe então um y ∈ V e tome b := η(y). Temos y ∈ η−1({b}). Como η é contı́nua, η−1({b}) é aberto relativo de V, o que quer dizer que η−1({b}) = A ∩ V para algum aberto A ⊂ X da topologia T . Então, y ∈ A com A aberto. Também sabemos que y ∈ V ⊂ U e que todo aberto interceptando U também intercepta U; logo, existe um ponto x ∈ A ∩U. Como U ⊂ V, x ∈ A ∩U ⊂ A ∩V = η−1({b})⇒ η(x) = b = η(y). Ou seja, achamoso ponto x ∈ U com η(x) = η(y) de que precisávamos. Isso conclui a prova de que V é conexo. Exercı́cio 8.4 Utilize argumentos relacionados com os que vimos acima para mostrar o seguinte resultado: se U ⊂ X é dado (não necessariamente conexo) e U ⊂ V ⊂ U, então V é o fecho de U na topologia relativa de V. Exemplo 8.9 Se U ⊂ X é conexo e f : U → Y é contı́nua, a imagem f (U) é conexa. 134 Tome U e f como acima. Considere η : f (U) → {0, 1} contı́nua. Então η ◦ f : U → {0, 1} também é contı́nua. Como U é conexo, η ◦ f é constante. Em particular, dados quaisquer a = f (u) ∈ f (U), a′ = f (u′) ∈ f (U), η(a) = η( f (u)) = η( f (u′)) = η(a′). Ou seja, η é constante sobre f (U). Como η : f (U) → {0, 1} é uma função contı́nua qualquer, deduzimos que f (U) é conexo. Exemplo 8.10 Se F é uma coleção de subconjuntos conexos de X e F∩ F′ 6= ∅ para quaisquer F, F′ ∈ F , então ∪F∈F F é conexo. Note que provamos que uma união de dois conjuntos conexos por caminhos com ponto em comum é conexa por caminhos. Aqui, a união é conexa mesmo que a coleção F tenha infinitos elementos. Para provar que vale a propriedade acima, tomemos η : ∪F∈F F → {0, 1} contı́nua e dois pontos quaisquer x, x′ da união, para mostrar que η(x) = η(x′). Para isto, tome F, F′ ∈ F tais que x ∈ F e x′ ∈ F′ (tais conjuntos têm de existir, porque x e x′ estão na união). Por hipótese, podemos encontrar um elemento x0 ∈ F ∩ F′. Como F é conexo, η é contı́nua, a restrição de η a F é constante; isto quer dizer que η(x) = η(x0) porque x0, x ∈ F. Do mesmo modo, a conexidade de F′ implica η(x′) = η(x0). Deduzimos que η(x) = η(x′), como querı́amos demonstrar. 8.2.3 Um pouco mais sobre conexidade e topologia induzida Consideramos agora em que (X, T ) é espaço topológico, D ⊂ X e TD é a topologia que T induz sobre D. Como podemos decidir se D é conexo? É mais fácil dizer quando D é desconexo: isso ocorre se e somente se existe um subconjunto L ⊂ D, diferente tanto de D quanto de ∅, que é relativamente aberto e fechado. Detalhemos estes pontos: 1. “L é relativamente aberto” é o mesmo que dizer que existe um aberto de X, A ⊂ X, com A ∩ X = L. 2. “L é relativamente fechado” é o mesmo que dizer que o complementar de L em D é relati- vamente aberto, ou seja, existe um aberto de X, B ⊂ X, com B ∩ D = D\L. Destas observações, segue o seguinte fato. Proposição 8.4 D é desconexo se e somente se existem abertos A, B ⊂ X de X tais que A ∩ B ∩ D = ∅ e A ∪ B ⊃ D. Não provamos esta proposição, que fica como exercı́cio, mas observamos (para ajudar) que as duas condições sobre A e B querem dizer que B ∩ D é o complementar de A ∩ D em D. 135 8.3 Exemplos mais interessantes das definições Como vimos acima, as teorias de conexidade (topológica) e conexidade por caminhos são análogas. De fato, no caso de subconjuntos da reta real R, há uma coincidência total entre as duas definições: os intervalos são exatamente os subconjuntos conexos e também os conexos por cami- nhos. Nossos objetivos nesta seção são três. Em primeiro lugar, mostraremos a conexidade ou não- conexidade do conjunto de matrizes ortogonais. Em segundo lugar, veremos que os conceitos de conexidade e conexidade por caminhos, que são equivalentes em dimensão 1, não são equiva- lentes já em dimensão 2. Por último, mostraremos que as duas noções de conexidade coincidem sempre que falamos de abertos em espaços vetoriais normados. 8.3.1 Matrizes ortogonais 12/04/2021 - sendo escrita. Nesta seção, tomamos d ∈ N\{0, 1} e consideraremos alguns subconjuntos de Rd×d. Obvia- mente, este espaço inteiro é um espaço vetorial, logo convexo e conexo por caminhos. Precisare- mos de algumas propriedades da função determinante: det : Rd×d → R. 1. A matriz identitade d× d tem determinante det(Id×d) = 1. 2. Dadas A, B ∈ Rd×d, det(AB) = det(A)det(B). 3. O determinante não muda se tomamos a transposta da matriz. 4. Uma matriz A ∈ Rd×d tem determinante não-nulo se e somente se é inversı́vel. 5. Se a matriz A ∈ Rd×d tem a estrutura abaixo: A = 0 à ... 0 0 . . . 0 1 ; isto é, se A[i, d] = A[d, i] = 0 para 1 ≤ i < d− 1, A[d, d] = a ∈ R e à ∈ R(d−1)×(d−1) tem entradas A[i, j] para 1 ≤ i, j ≤ d− 1, então det(A) = a det(Ã). O resultado abaixo é bastante útil para se estabelecer a conexidade por caminhos de outros grupos de matrizes. Teorema 8.2 Considere o conjunto de matrizes ortogonais O(d) := {Q ∈ Rd×d : QTQ = Id×d} e seus subconjuntos SO(d) := {Q ∈ Rd×d : det(Q) = 1}; SO−(d) := {Q ∈ Rd×d : det(Q) = −1}. 136 Então O(d) = SO(d) ∪ SO−(d) (com união disjunta). O(d) é desconexo, mas SO(d) e SO−(d) são conexos por caminhos. Este resultado pode ser apreciado de duas maneiras. Uma é matemática: SO(d) e O(d) são grupos de Lie – isto é, grupos que têm estruturas de variedade – e este resultado nos dá informação sobre a topolgia do espaço. Outra maneira é mais aplicada. Imagine que quero descolar um conjunto de pontos S ⊂ R3 para um outro, QS ⊂ R3 com Q ∈ SO(3). Podemos imaginar por exemplo que S é um pedaço de chapa metálica que está deitado e queremos botar em outra posição. O fato de que SO(3) é conexo por caminhos significa que há uma maneira contı́nua de passar de Q(0) = Id×d para Q(1) = Q; ou seja, há como mexer S sem saltos para passar de uma posição a outra. Esta prova dará um bocado de trabalho, mas a graça dela é termos a oportunidade de traba- lhar com o grupo SO(d) mais de perto. Vários passos serão deixados como exercı́cios que não são difı́ceis para quem lembra bem de Álgebra Linear. Prova: Começamos a prova com algumas observações de Álgebra Linear, que deixamos como exercı́cio. Exercı́cio 8.5 O(d) e SO(d) são grupos (fechados por produtos e inversas). Além disso, uma matriz pertence a O(d) se e somente se suas colunas são ortonormais (têm norma 1 e são ortogonais umas às outras). Nosso primeiro passo será mostrar o seguinte resultado. O(d) = SO(d) ∪ SO−(d) é desconexo. Para continuar, vamos entender porque O(d) tem duas partes. Veja que: ∀Q ∈ O(d) : det(Q)2 = det(QT)det(Q) = det(QTQ) = det(Id×d) = 1. Como det(Q) toma valores reais, deduzimos que det(Q) ∈ {−1,+1} para qualquer matriz Q ∈ O(d), o que quer dizer que toda Q ∈ O(d) está ou em SO(d) ou em SO−(d). Além disso, notamos que estes dois conjuntos não são vazios, já que a identidade está em SO(d) e a matriz R = 0 Id−1 ... 0 0 . . . 0 1 ∈ SO−(d) (em virtude da propriedade 5 do determinante). Concluı́mos que O(d) é a união disjunta de SO(d) e SO−(d) e estes dois conjuntos não são vazios: em particular, a imagem da função determinante sobre O(d) é det(O(d)) = {−1, 1}, que não é intervalo. Por isso, O(d) não é conexo. Agora que encontramos as duas “partes naturais” de O(d), mostraremos que as duas são co- nexas por caminhos. De fato, o próximo argumento nos mostra que só precisamos nos preocupar com uma delas. Se SO(d) é conexo por caminhos, SO−(d) também é. 137 De fato, considere a matriz R definida acima. Usando a continuidade da multiplicação de matrizes, vê-se facilmente (exercı́cio) que ψ : Q ∈ SO(d) 7→ RQ ∈ SO−(d) é uma bijeção contı́nua com inversa contı́nua. Em particular, SO−(d) = ψ(SO(d)). Completa- mos este passo lembrando que a imagem de um espaço conexo por caminhos por uma função contı́nua também é conexa por caminhos. A partir daqui, usaremos indução em d ≥ 2 para provar que SO(d) é conexo por caminhos. SO(d) é conexo por caminhos – caso base (d = 2). Este caso é resolvido pelo seguinte exercı́cio. Exercı́cio 8.6 Mostre que SO(2) = {( cos θ − sin θ sin θ cos θ ) : θ ∈ R } e deduza que SO(2) é conexo por caminhos. (A dica é usar o fato que as colunas de Q ∈ SO(2) são ortonormais para observar que a primeira coluna é Q1 = (cosθ, sin θ)T para algum θ. A outra coluna é um dos dois vetores unitários ortogonais a Q1. A condição de determinante igual a 1 diz qual vetor ortogonalescolher.) SO(d) é conexo por caminhos – passo indutivo (d ≥ 3). A ideia será encontrarmos dentro de SO(d) uma cópia (que na verdade é um subgrupo) que é uma “cópia” de SO(d − 1) (e portanto é conexo por caminhos). Daı́, encerraremos a prova mostrando que toda Q ∈ SO(d) pode ser conectada por uma curva contı́nua a alguma Q1 ∈ H(d). Exercı́cio 8.7 Mostre que as duas afirmações acima – H(d) conexo por caminhos e todo Q ∈ SO(d) conectado por curva contı́nua a alguma Q1 ∈ H(d) – são suficientes para se deduzir que SO(d) é conexo por caminhos. Achando uma “cópia” de SO(d− 1) em SO(d). Para encontrarmosH(d), começamos definindo uma função função Φd : R(d−1)×(d−1) → Rd×d da seguinte forma. Φd(Q̃) := 0 Q̃ ... 0 0 . . . 0 1 (Q̃ ∈ R(d−1)×(d−1)). Pode-se verificar diretamente que Πd é contı́nua entrada a entrada e portanto é contı́nua. ALém disso, ela tem as seguintes propriedades Exercı́cio 8.8 Mostre que Πd(I(d−1)×(d−1)) = Id×d e que, para quaisquer Q̃1, Q̃2 ∈ R(d−1)×(d−1), det(Πd(Q̃1)) = det(Q̃1), Πd(Q̃1)T = Πd(Q̃1)T e Πd(Q̃1)Πd(Q̃2) = Πd(Q̃1Q̃2). 138 Segue do exercı́cio acima que, dada uma Q̃ ∈ R(d−1)×(d−1) qualquer Πd(Q̃) ∈ SO(d)⇔ Q̃ ∈ SO(d− 1). (8.1) Chamamos de H(d) := Φd(SO(d − 1)) e verificamos que H(d) ⊂ SO(d). Pela hipótese de indução, SO(d− 1) é conexo por caminhos. Como Πd é contı́nua, H(d) também é. Conectando elementos de SO(d) a H(d). Nosso próximo passo será mostrar a seguinte afirmação. Afirmação 8.2 Dada Q ∈ SO(d), existe uma Q1 ∈ H(d) com Q SO(d)↔ Q1. Para isso, precisamos primeiramente de uma informação adicional sobre H(d). Observação 8.1 Um elemento Q ∈ SO(d) pertence a H(d) se e somente se sua d-ésima coluna é ed. Prova: Claramente, todo elemento de H(d) tem a última coluna igual a ed. Por outro lado, tome Q ∈ SO(d) com a última coluna igual a ed. Queremos mostrar que Q ∈ H(d), isto é, que existe uma Q̃ ∈ SO(d− 1) com Πd(Q̃) = Q Note que, se a d-ésima coluna de Q é ed, todas as entradas Q[i, d] com 1 ≤ i < d são 0, enquanto Q[d, d] = 1. Além disso, as demais colunas Q1, . . . , Qd−1 de Q satisfazem Qj[d] = Qj.ed = 0 (porque as colunas são ortonormais). Logo, vê-se que Q[j, d] = 0 para todo 1 ≤ j < d. Vê-se, então, que Q necessariamente tem a forma: Q = Πd(Q̃) para alguma Q̃ ∈ R(d−1)×(d−1) e a equação (8.1) garante que Q̃ ∈ SO(d− 1), como querı́amos demonstrar. 2 Agora tomamos uma Q ∈ SO(d) arbitrária e construı́mos um caminho contı́nuo γ : [0, θ] → SO(d) (para algum θ ∈ R+) ligando Q a uma Q1 ∈ H(d). Pela observação acima, o que devemos fazer é garantir que a última coluna de Q1 é ed, enquando a matriz γ(t) é ortogonal com determinante 1 em cada 0 ≤ t ≤ θ. Considere a última coluna de Q, que chamamos de Qd ∈ Rd. Seguindo os passos do Exemplo 8.5, podemos escrever ed na forma: ed = cos θ Qd + sin θ Q⊥d com Q ⊥ d ⊥ Qd. Se seguı́ssemos aquele Exemplo, traçarı́amos agora uma trajetória num cı́rculo na esfera unitária para conectar Qd a ed. É isto que faremos abaixo, mas construindo um caminho γ0 no espaço de matrizes SO(d) tal que γ0(θ)Qd = ed. Para isso, precisamos do seguinte primeiro passo. Exercı́cio 8.9 Use o fato que d ≥ 3 para mostrar que existe uma transformação ortogonal V ∈ SO(d) levando Qd em ed e Q⊥d em ed−1. 139 Agora considere γ0(t) := VT Z(t)V, onde Z(t) := 0 I(d−2)×(d−2) ... 0 0 . . . 0 cos t sin t − sin t cos t (0 ≤ t ≤ θ). Note que γ0(0) = Id×d (pois VTV = Id×d) e que γ0(t) ∈ SO(d) (porque é o produto de V, VT, Z(t) ∈ SO(d), como se pode verificar diretamente) para cada 0 ≤ t ≤ θ. Portanto, γ(·) := γ0(·) Q é uma curva com valores em SO(d) e γ(0) = Q. Também não é difı́cil verificar que γ é contı́nua. Para terminarmos a prova, veremos que γ(θ) ∈ H(d). Por tudo que já vimos até agora, isto se resume a mostrar que a d-ésima coluna de γ(θ) = γ0(θ)Q é ed. Será útil usar o seguinte exercı́cio. Exercı́cio 8.10 Prove que, dadas quaisquer matrizes A, B ∈ Rd×d, se Bj é a j-ésima coluna de B, ABj é a j-ésima coluna de AB; ou seja, as colunas de AB são as colunas de B multiplicadas por A à esquerda. Portanto: • A última coluna de VQ é VQd = ed; • A última coluna de Z(θ)VQ é Z(θ) ed = cos θed + sin θed−1. • Como VT é a inversa de V, a última coluna de γ(t) = VTZ(θ)VQ é V−1(cos θed + sin θed−1) = cos θQd + sin θ Q⊥d = ed. Isto encerra a prova. 2 8.3.2 Um conjunto conexo que não é conexo por caminhos Vejamos primeiro um caso em que as duas definições discordam. Teorema 8.3 Defina Γ0 ⊂ R2 da seguinte forma: Γ0 := {(x, sin(1/x)) : x ∈ (0, 1]} e Γ = Γ0 ∪ {(0, 1)}. Este Γ é conexo, mas não é conexo por caminhos. Prova: A prova terá três partes. Passo 1 Primeiro provaremos que Γ0 é conexo por caminhos e portanto conexo. Passo 2 Provaremos a seguir que Γ não é conexo por caminhos. Passo 3 Veremos que Γ0 ⊂ Γ ⊂ Γ0, o que implica que Γ é conexo (pelo Exemplo 8.8). 140 Passo 1: Γ0 conexo por caminhos. A função f : (0, 1] → R2 que leva x ∈ (0, 1] em f (x) := (x, sin(1/x)) ∈ R2 é contı́nua coordenada a coordenada e portanto contı́nua. Como (0, 1] é conexo por caminhos, sua imagem também é. Esta imagem é precisamente o conjunto Γ0. Passo 2: Γ não é conexo por caminhos. Provaremos que os pontos p = (0, 1) e q = (1, sin(1)), ambos pertencentes a Γ, não podem ser conectados por uma curva contı́nua em Γ. De fato, suponha (para chegar a uma contradição) que existe γ : [0, 1] → Γ contı́nua com γ(0) = p e γ(1) = q. Considere as coordenadas γ1(t), γ2(t) de γ(t). Como γ é contı́nua, γ1 e γ2 são contı́nuas. Temos ainda que γ1(0) = 0 e γ1(1) = 1. Como γ1 : [0, 1]→ R, o Teorema do Valor Intermediário nos garante que existe um t0 ∈ (0, 1) com γ1(t0) = 1/(π/2). Suponha indutivamente que definimos t0 > t1 > t2 > · · · > tn > 0 de modo que, para cada 0 ≤ m ≤ n, γ1(tm) = 1/(mπ + π/2). Veja que novamente γ1(0) < 1/((n + 1)π + π/2) < γ1(tn), logo existe um tn+1 ∈ (0, tn) com γ1(tn) = 1/((n + 1)π + π/2). Desta forma, provamos que existe uma sequência decrescente {tn}n∈N ⊂ (0, 1) com ∀n ∈N : γ2(tn) = sin ( 1 γ1(tn) ) = ±1, dependendo se n é par ou ı́mpar. Vemos que a sequência tn converge para um t ∈ [0, 1], posto que é decrescente. Isto implica γ2(tn) → γ2(t), o que contradiz o fato que a sequência γ2(tn) alterna entre ±1, como vimos acima. A contradição implica que não podemos conectar p e q por uma curva em Γ. Passo 3: Γ0 ⊂ Γ ⊂ Γ0. A primeira inclusão é trivial. Para checar a segunda, basta ver que o ponto p = (0, 1), que é o que adicionamos para formar Γ, está no fecho de Γ0. Mas para isso basta ver que a sequência pn = ( 1 π 2 + 2πn , 1 ) (n ∈N) está toda em Γ0 e converge a p. 2 Exercı́cio 8.11 Mostre que Γ0 = Γ0 ∪ ({0} × [−1, 1]). 8.3.3 Concordância para abertos de espaços vetoriais Nesta seção mostramos um caso muito importante em que os dois conceitos de conexidade concordam. Teorema 8.4 Considere um espaço vetorial normado (V, ‖ · ‖V) e um subconjunto aberto A ⊂ V. Então A é conexo se e somente se é conexo por caminhos. Prova: Uma direção já está dada; além disso, o resultado é trivial se A = ∅. Só nos falta provar que um A ⊂ V, A 6= ∅ que é aberto e conexo também é conexo por caminhos. O argumento que usaremos é tı́pico de provas envolvendo conexidade. Como A 6= ∅, podemos encontrar x0 ∈ A. Considere o subconjunto L ⊂ A de todos os x ∈ A com x0 A↔ x. Nosso objetivo é provar que L = A; para isso, suporemos (para chegar 141 a uma contradição) que L 6= A, de modo que R = A\L 6= ∅. A contradição estará provada quando mostrarmos que L e R são relativamente abertos em A, o que quer dizer que A é desconexo. Vejamos, portanto, a prova destes fatos. 1. Queremos mostrar que L é relativamente aberto em A. Como A é aberto, isto é o mesmo que mostrar que L é aberto de V. Para isto, dado x ∈ L, devemos encontrar δ > 0 tal que B(x, δ) ⊂ L. Mas isto é simples. Como A é aberto, existe um δ > 0 com B(x, δ) ⊂ A. A discussão logo após o Exemplo8.2 acima nos diz que B(x, δ) é convexa, logo qualquer x′ ∈ B(x, δ) satisfaz x B(x,δ)↔ x′. Como B(x, δ) ⊂ A, isto também nos diz que x A↔ x′ para todo x′ ∈ B(x, δ). Mas recorde que, pelo Lema 8.1, a relação “ A↔”é transitiva, logo o fato de que x ∈ L, e portanto x A↔ x0, implica que x′ A↔ x0 para todo x′ ∈ B(x, δ). Ou seja, B(x, δ) ⊂ L. 2. Do mesmo modo que acima, queremos provar que R ⊂ V é aberto. Para isto, dado x ∈ R, tomamos δ > 0 com B(x, δ) ⊂ A. Novamente temos x′ A↔ x para todos x′ ∈ B(x, δ). Deste modo, se algum x′ ∈ B(x, δ) satisfaz x′ A↔ x0, também teremos x A↔ x0, o que contradiz o fato que x 6∈ L. Deduzimos que x′ não está conectado em A a x0 para qualquer x′ ∈ B(x, δ), ou seja, B(x, δ) ⊂ A\L = R. 2 8.4 Mais exercı́cios Exercı́cio 8.12 Considere dois conjuntos abertos e conexos U, V ⊂ R2 com U ∩ V 6= ∅. É necessaria- mente verdade que U ∩V é conexo? E o conjunto U ∪V? E se supomos que U e V são convexos? Exercı́cio 8.13 (Componentes conexas) Tome um espaço topológico (X, T ). Dado x ∈ X, chamamos da componente conexa de x em X o conjunto: C(x) := ⋃ U⊂X conexo x∈U U. 1. Prove que C(x) 6= ∅ é conexa para cada x ∈ X. Além disso, mostre que C(x) é fechado de X. 2. Prove que quaisquer dois pontos x, x′ ∈ X ou têm a mesma componente conexa (C(x) 6= C(x′)), ou têm componentes disjuntas (C(x) ∩ C(x′) = ∅). 3. Deduza que existe A ⊂ X tal que X = ∪x∈AC(x) com união disjunta (ou seja, todo espaço topológico é uma união disjunta de componentes conexas) e que qualquer U ⊂ X conexo está contido em C(x) para algum x ∈ A. Exercı́cio 8.14 (Componentes conexas da diferença) Tome um espaço topológico conexo (X, T ) e um subconjunto conexo Y ⊂ X. Considere qualquer uma das componentes conexas CY\X(x) de Y\X e mostre que Y ∪ CY\X(x) tem de ser conexo. 142 Exercı́cio 8.15 (Componentes conexas de abertos em espaços vetoriais) Consideramos agora o caso particular da definição acima em que (V, ‖ · ‖V) é espaço vetorial, X ⊂ V é subconjunto aberto de V e T é a topologia sobre V definida a partir da norma ‖ · ‖V . Prove que C(x) é aberto para cada x ∈ X. Mostre ainda que: ∀x ∈ X : C(x) = ⋃ A⊂X conexo por caminhos x∈A A. Exercı́cio 8.16 Considere espaços métricos (Xi, di), 1 ≤ i ≤ k, e construa o espaço-produto X com uma das métricas-produto correspondente (cf. Exercı́cio 3.10). Dados conjuntos conexos e não vazios Ci ⊂ Xi para i = 1, 2, . . . , k, prove que C1 × C2 × · · · × Ck é conexo ⇔ Ci é conexo para cada i = 1, 2, 3, . . . , k. Exercı́cio 8.17 Neste problema, seguimos a notação do Exercı́cio 5.30 e consideramos a soma de Min- kowski A + B de dois subconjuntos não-vazios A, B ⊂ V de um espaço vetorial normado (V, ‖ · ‖V). Prove os seguintes fatos: 1. se A e B são conexos por caminhos, A + B também é; 2. se A e B são conexos, A + B também é. Exercı́cio 8.18 Considere um espaço vetorial normado (V, ‖ · ‖V). Dizemos que um conjunto A ⊂ V é conexo por caminhos poligonais se, dados x0, x1 ∈ A, podemos encontrar um k ∈ N\{0} e pontos y0 = x0, y1, . . . , yk = x1 ∈ A tais que, para cada i = 0, 1, . . . , k− 1, o s segmentos de reta [yi, yi+1] estão contidos em A. Prove que, se A ⊂ V é aberto é conexo, então A é conexo por caminhos poligonais. Exercı́cio 8.19 Um espaço métrico (X, dX) é localmente conexo por caminhos se para cada x ∈ X, existe um δ0 > 0 tal que, dado qualquer δ ∈ (0, δ0), BX(x, δ) é conexa por caminhos. Mostre que, se (X, dX) é localmente conexo por caminhos, então qualquer A ⊂ X aberto e conexo também é conexo por caminhos. Exercı́cio 8.20 Mostre que um espaço métrico (X, dX) é conexo se a imagem de qualquer função contı́nua f : X → R é um intervalo. Prove ainda que (X, dX) é conexo e compacto se e somente se a imagem de qualquer função contı́nua f : X → R é um intervalo compacto. Exercı́cio 8.21 Considere um espaço métrico (X, dX). Dizemos que uma coleção F de subconjuntos F ⊂ X é combinatorialmente conexa se dada qualquer partição F = F0 ∪F1 com F0,F1 6= ∅ e F0 ∪F1 = F , existem F0 ∈ F0 e F1 ∈ F1 com F0 ∩ F1 6= ∅. Prove que se F é combinatorialmente conexa e cada F ∈ F é conexo, então a união ∪F∈F F é um subconjunto conexo de X. 143 144 Parte III Cálculo em espaços vetoriais 145 Capı́tulo 9 Preâmbulo Até aqui, apresentamos as definições de espaços métricos e vetoriais e estudamos Topologia com foco nestes espaços. Aprendemos bastante, mas, para realmente fazermos Análise, precisamos ir um passo além e aprender a diferenciar e integrar em espaços mais gerais que a reta real. Começamos esta tarefa no capı́tulo 10 com derivadas e integrais de funções de intervalos da reta a espaços vetoriais. Os conceitos de derivada e integral têm generalizações diretas a estes espaços, que estudaremos em detalhes. No entanto, já aqui teremeos que lidar com o fato de que funções em dimensão maior que 1 podem ter comportamente um tanto quanto diferente do que na reta. O principal exemplo disso é o fato de que o Teorema do Valor Médio tem de ser substituı́do pela Desigualdade do Valor Médio. Considere agora o caso em que f : V → W, onde (V, ‖ · ‖V) e (W, ‖ · ‖W) são espaços vetoriais normados. Se tentamos definir uma derivada via um quociente, como no caso V = R, esbarramos em uma dificuldade importante: não sabemos “dividir” um elemento de W por um elemento de V! De fato, mesmo quando V = W = R3 (por exemplo) não há uma maneira natural de definir o quociente que levaria à derivada no caso V = R. A saı́da para este problema é recorrer a uma outra maneira de definir derivada. No caso de f : I → R, o valor f ′(t) da derivada em t ∈ I satisfaz o seguinte: α = f ′(t) é o único número real com a seguinte propriedade. lim h→0 | f (t + h)− f (t)− α h| |h| = 0. Da mesma forma, podı́amos ter escrito que α = f ′(t) se, quando escrevemos: rt(h) := f (t + h)− f (t)− α h, temos |rt(h)|/|h| → 0 quando h→ 0. Nesta definição alternativa dividimos não por h, mas sim por seu “tamanho”. A vantagem é que isso faz sentido em todo espaço vetorial normado, quando medimos o tamanho de h ∈ V por sua norma ‖h‖V . Para chegar à definição de derivada, precisamos ainda entender quem (ou o que) faz o papel do termo α h. A chave neste caso será pensar em f (t + h) ≈ f (t) + α h como uma aproximação de f por uma função afim, isto é, a soma de uma função linear com uma constante. A analogia natural para outros espaços é escrever f (x + h) ≈ f (x) + A h 147 onde A é uma transformação linear. Em linhas gerais, o que discutimos acima é a definição de derivada devida a Fréchet, que es- tudaremos abaixo. Também discutiremos derivadas parciais e direcionais, mas ficará claro que a definição de Fréchet tem propriedades melhores. Por exemplo, ela é a única destas definições que satisfaz a regra da cadeia. Além disso, uma vez que aceitamos a derivada como transformação linear, fica mais limpa a passagem para derivadas superiores e fica mais fácil derivar em espaços que não são o Rd. De qualquer forma, tudo isso fará mais sentido depois da breve revisão de Álgebra Linear que teremos a seguir. Observação 9.1 O leitor pode se perguntar porque não tentamos definir derivadas em espaços ainda mais gerais, por exemplo, espaços métricos. Uma resposta possı́vel é que a derivada é uma tentativa de aproximar funções por somas de funções constantes e lineares, logo devemos trabalhar num espaço em que isso faça sentido. Certamente há espaços métricos em que seria muito difı́cil de se falar disso. No entanto, veremos neste curso que, ao menos em um caso particular – o das subvariedades de Rd – será possı́vel falar de derivadas por causa de uma estrutura linear local. 148 Capı́tulo 10 Funções a um parâmetro: derivadas e integrais Nosso objetivo neste capı́tulo é desenvolver rudimentos de um Cálculo para funções com valores em V Banach que dependem de um único parâmetro real. Boa parte do que vamos fazer éexatamente igual ao que se faz no caso de funções entre conjuntos da reta. Por esta razão, muitos passos importantes serão tomados como exercı́cios. Notação para este capı́tulo: Nos próximos resultados, I = [a, b] ⊂ R é um intervalo fechado e limitado da reta (com a < b reais), (V, ‖ · ‖) é Banach, e f : I → V é dada. 10.1 Derivadas: definição e resultados preliminares O primeiro passo será generalizar o conceito de derivada. Definição 10.1 Dizemos que f é diferenciável em t ∈ I se existe o limite: f ′(t) := lim h→0 f (t + h)− f (t) h . A definição é a mesma do caso real e podemos fazer algumas considerações gerais relacionadas. Por exemplo, o fato abaixo decorre de que limites em Rd são sempre tomados coordenada a coordenada. Exercı́cio 10.1 Mostre que, se V = Rd, então f ′(t) existe se e somente se cada uma das funções coorde- nadas f [i] é diferenciável em t. Neste caso, f ′(t) = ( f ′[i](t))di=1. Exercı́cio 10.2 Se f , g : I → V são ambas diferenciáveis em t ∈ I e λ ∈ R e um escalar, então: (λ f + g)′(t) = λ f ′(t) + g′(t). 149 Exercı́cio 10.3 Fixe v ∈ V e uma função F : I → R diferenciável. Podemos definir uma nova função f : I →W dada por: f (t) := F(t) v (t ∈ I). Supondo que F′(t) existe para um certo t ∈ I, mostre que f ′(t) = F′(t) v. Exercı́cio 10.4 Fixe v ∈ V e uma função F : I → L(V, W) diferenciável. Podemos definir uma nova função f : I →W dada por: f (t) := F(t) v (t ∈ I). Supondo que F′(t) existe para um certo t ∈ I, mostre que f ′(t) = F′(t) v. Exercı́cio 10.5 Prove que toda f diferenciável em t ∈ I também é contı́nua em t. Exercı́cio 10.6 (Regra de Leibniz geral) Suponha que V, W, Z são espaços vetoriais com respectivas normas ‖ · ‖V , ‖ · ‖W e ‖ · ‖Z. Neste exercı́cio, supomos que B : V ×W → Z é bilinear e contı́nua. Eis alguns exemplos abaixo. 1. V = Rd1×d2 , W = Rd2×d3 , Z = Rd1×d3 e B é o produto matricial. 2. V = W = Z = C([0, 1], R) e B é o produto de funções ou a operação de convolução. Agora suponha que f : I → V e g : I → W são diferenciáveis em t ∈ I. Prove que B( f , g) : I → Z, definida por: B( f , g)(s) := B( f (s), g(s)) (s ∈ I) tambem é diferenciável em t ∈ I e B( f , g)′(t) = B( f ′(t), g(t)) + B( f (t), g′(t)). 10.2 A desigualdade do valor médio Agora vamos assinalar uma diferença crucial entre a derivada na reta e casos mais gerais. Um dos principais teoremas do caso V = R é o Teorema do Valor Médio, que diz que, dados x, y ∈ I, se f é diferenciável no intervalo entre x e y, então existe um ponto θ nesse intervalo tal que f (x)− f (y) = f ′(θ) (x− y). Esse resultado não vale em geral quando V é um espaço vetorial qualquer. De fato, ele falha já para V = R2. Exercı́cio 10.7 Se f (t) = (t2, t3), t ∈ [0, 1], vemos que f (1)− f (0) 6= f ′(θ) para qualquer θ ∈ [0, 1]. O que podemos guardar do caso unidimensional é uma cota na magnitude de f (x)− f (y). De fato, temos a Desigualdade do Valor Médio neste caso. Teorema 10.1 (Desigualdade do Valor Médio) Dados t, s ∈ I e f : I → R contı́nua em I = [a, b] e diferenciável em (a, b), suponha que M := sup x∈I ‖ f ′(x)‖V < +∞. Então temos a desigualdade ∀t, s ∈ [a, b] : ‖ f (t)− f (s)‖V ≤ M |t− s|. 150 Prova: Note que basta provar a desigualdade acima para t, s ∈ (a, b). Afinal, como f é contı́nua, o conjunto de pares (t, s) ∈ I × I com ‖ f (t) − f (s)‖V ≤ M |t − s| é fechado. Se este conjunto contem (a, b)× (a, b), também deve conter o fecho deste conjunto, que é I × I. Feita essa observação, suporemos (sem perda de generalidade) que t < s, sabendo que f é diferenciável no intervalo [t, s] ⊂ (a, b). Dado um M > M′, definimos o conjunto: IM′ := {x ∈ [t, s] : ‖ f (x)− f (t)‖V ≤ M′ (x− t)}. Ou seja, IM′ é o conjunto de pontos x ∈ [t, s] que satisfazem a estimativa dada pela desigualdade do valor médio, mas com M′ substituindo M (esta “folga na constante” é uma tecnicalidade importante na conta). Provaremos a seguir que: Objetivo: ∀M′ > M : s ∈ IM′ , isto é, ‖ f (x)− f (t)‖V ≤ M′ (x− t). Dado isso, a desigualdade desejada é deduzida tomando M′ → M. Para atingir nosso objetivo, note primeiramente que IM′ não é vazio porque pelo menos t está lá. Como além disso IM′ é limitado, sM′ := sup IM′ está bem definido. Também é verdade que IM é fechado, por causa da continuidade de f . Logo, IM′ é compacto, e em particular sM′ ∈ IM′ . Nosso objetivo será cumprido se provarmos que sM′ = s. Suponha, então (para chegar a uma contradição) que sM′ < s. Como t ∈ IM′ , sabemos que t ≤ sM′ < s e que portanto sM′ + h ∈ [t, s] para h > 0 suficientemente pequeno. Agora observe que lim h→0,s+h∈I ∥∥∥∥ f (sM′ + h)− f (sM′)h ∥∥∥∥ V = ‖ f ′(sM)‖V ≤ M < M′. Portanto, se h > 0 é suficientemente pequeno, não só sM′ + h ∈ [t, s], como também∥∥∥∥ f (s + h)− f (s)h ∥∥∥∥ V ≤ M′, o que quer dizer que ‖ f (sM′ + h)− f (s)‖V ≤ M′ h. Por subaditividade, deduzimos que ‖ f (sM′ + h)− f (t)‖V ≤ ‖ f (sM′ + h)− f (sM′)‖V + ‖ f (sM′)− f (t)‖V ≤ M′ (h + sM′ − t). Ou seja, sM′ + h ∈ IM′ e sM′ + h > sM′ = sup IM′ . Esta contradição ocorreu porque supusemos que sM′ < s; portanto, mostramos que sM′ = s. 2 Exercı́cio 10.8 Prove que, para qualquer função diferenciável f : I → V, ‖ f ‖Lip = sup t∈(a,b) ‖ f ′(t)‖V . (Aqui admitimos que o supremo pode ser infinito.) 151 Exercı́cio 10.9 Suponha que γ : I → V é diferenciável e γ′ : I → V é contı́nua. Dado um subintervalo J = [c, d] ⊂ [a, b] com a < c < d < b, e dado um h ∈ R com tal que |h| ≤ min{c− a, b− d}, definimos: ∆hγ : t ∈ J 7→ γ(t + h) + γ(t) h ∈ V. Mostre que lim ε→0+ sup 0<|h|≤ε ‖∆hγ− γ′‖J,∞ = 0. 10.3 Integração de funções sobre intervalos Nosso próximo objetivo é estender a teoria de integração de funções contı́nuas sobre intervalos a funções com valores em V (com V Banach). Nesta seção I := [a, b] ⊂ R com −∞ < a ≤ b < +∞. Recorde de Análise na Reta que uma partição pontilhada P de [a, b] é um objeto do tipo: P := {(tP0 , sP0 ), (tP1 , sP1 ), . . . , (tPnP , s P nP)} com tP0 = a ≤ sP0 ≤ tP1 ≤ sP1 ≤ tP2 ≤ · · · ≤ tPnP ≤ s P nP ≤ t P nP+1 =: b. Note a convenção de que tPnP+1 = b sempre. Informalmente, dividimos [a, b] em intervalos [tPi , t P i+1] e escolhemos um ponto s P i em cada intervalo. O tamanho da partição P é definido como |P| := max0≤i≤nP(tPi+1 − tPi ). Definição 10.2 Dada uma função f : I → V e uma partição pontilhada P como acima, definimos a soma de Riemann para f sobre a partição pontilhada P da seguinte maneira: s( f , P) := nP ∑ i=0 (tPi+1 − tPi ) f (sPi ) ∈ V. Dizemos que f é Riemann-integrável sobre [a, b] se existe um limite para as somas de Riemann quando |P| → 0, ou seja, quando existe um elemento Iba ( f ) ∈ V tal que, para qualquer sequência {Pj}j de partições pontilhadas de [a, b], |Pj| → 0⇒ s( f , P)→ Iba ( f ). Quando f é Riemann-integrável sobre [a, b], em geral escrevemos ∫ b a f (t) dt := I b a ( f ) Exercı́cio 10.10 (Linearidade da integral) Prove a partir da definição que, se f , g : I → V são Riemann- integráveis e λ ∈ R, então λ f + g também é Riemann-integrável e∫ b a (λ f (t) + g(t)) dt = λ ∫ b a f (t) dt + ∫ b a g(t) dt. Exercı́cio 10.11 Mostre que, se f ≡ c ∈ V é constante, então f é Riemann-integrável e∫ b a f (t) dt = c (b− a). 152 Observação 10.1 No caso de V = R, é costumeiro falar das somas de Riemann superior e inferior. Não é possı́vel fazer o mesmo em nosso caso geral porque não há uma ordem total natural para os elementos de V. O restante da seção é dedicado à prova de um resultado fundamental. Teorema 10.2 Toda f : I → V contı́nua é Riemann-integrável. Além disso, temos a estimativa:∥∥∥∥∫ ba f (t) dt ∥∥∥∥ V ≤ ∫ b a ‖ f (t)‖V dt ≤ (b− a) sup t∈I ‖ f (t)‖V . Esta prova será baseada num lema preliminar. Este lema nos permite comparar as somas de Riemann de duas partições de tamanho pequeno. Lema 10.1 Considere duas partições pontilhadas P, Q. Então: ‖s( f , P)− s( f , Q)‖V ≤ (b− a) (m f (|P|)+ m f (|Q|)). Prova: A prova é muito similar a do caso de funções a valores reais. Em primeiro lugar, tome um conjunto R := {r0, r1, . . . , rk+1} ⊂ [a, b] com a = r0 ≤ r1 ≤ · · · ≤ rk+1 = b de modo que: • Existem ı́ndices jP0 = 0 < j P 1 < · · · < jPnP+1 = k + 1 tais que t P i = rjPi para cada i = 0, 1, 2, . . . , nP; • Existem ı́ndices jQ0 = 0 < j Q 1 < · · · < jPnQ+1 = k + 1 tais que t P i = rjQi para cada i = 0, 1, 2, . . . , nP. Não provaremos que tal R existe porque isso é feito nos cursos de Análise na Reta. Escreva: S := k ∑ j=0 f (rj) (rj+1 − rj). A ideia do restante da prova é mostrar que ‖s( f , P)− S‖V ≤ m f (|P|) (b− a) e ‖s( f , Q)− S‖V ≤ m f (|Q|) (b− a), o que claramente implica nosso objetivo. Faremos a conta apenas para P porque o caso de Q é análogo. Com nossa notação, temos a seguinte fórmula para S: S = nP ∑ i=0 jPi+1−1 ∑ j=jPi f (rj) (rj+1 − rj). De fato, tudo que fizemos foi quebrar a soma em j de acordo com o ı́ndice i tal que jPi ≤ j < jPi+1 (é fácil ver que este ı́ndice existe e é único para cada j). 153 Agora observe que, para cada ı́ndice 0 ≤ i ≤ nP, tPi+1 − tPi = rjPi+1 − rjPi = jPi+1−1 ∑ j=jPi (rj+1 − rj). Além disso, para cada i e cada j = jPi , . . . , j P i+1 − 1, temos rj, sPi ∈ [tPi , tPi+1] e portanto |rj − sPi | ≤ tPi+1 − tPi ≤ |P|. Portanto ‖ f (rj)− f (sPi )‖V ≤ m f (|P|) Deduzimos que∥∥∥∥∥∥(tPi+1 − tPi ) f (sPi )− jPi+1−1 ∑ j=jPi (rj+1 − rj) f (rj) ∥∥∥∥∥∥ V = ∥∥∥∥∥∥ jPi+1−1 ∑ j=jPi (rj+1 − rj)( f (sPi )− f (rj)) ∥∥∥∥∥∥ V ≤ m f (|P|)(tPi+1 − tPi ). Portanto, ‖s( f , P)− S‖V ≤ nP ∑ i=0 ∥∥∥∥∥∥(tPi+1 − tPi ) f (sPi )− jPi+1−1 ∑ j=jPi (rj+1 − rj) f (rj) ∥∥∥∥∥∥ V ≤ m f (|P|) nP ∑ i=0 (tPi+1 − tPi ). A soma telescópica do lado direito vale b− a. 2 Prova: [Prova do Teorema]Note que o Lema anterior mostra que, dada qualquer sequência {Pn}n∈N como acima, com δn := |Pn| → 0, ∀m, n ∈N : ‖s( f , Pn)− s( f , Pm)‖V ≤ (m f (δn) + m f (δm)) (b− a)→ 0 quando m, n→ +∞. Deduzimos que {s( f , Pn)}n∈N é Cauchy e portanto converge. Se {Qn}n∈N é outra sequência de partições pontilhadas com |Qn| → 0, podemos intercalá-la numa só sequência com {Pn}n∈N para deduzir que s( f , Qn) converge ao mesmo limite. É este limite que chamamos de ∫ b a f (s) ds. Veja que: ‖s( f , Pn)‖V ≤ ( k ∑ i=1 (tPni − t Pn i−1) ) ‖ f (cPni )‖V , e a soma da direita é uma soma de Riemann para ∫ b a ‖ f (s)‖V ds. Portanto, tomando limites,∥∥∥∥∫ ba f (s) ds ∥∥∥∥ V ≤ ∫ b a ‖ f (s)‖V ds. 2 Exercı́cio 10.12 Prove a partir das somas de Riemann que, se f ∈ C(I, V) e P é uma partição pontilhada, ‖s( f , P)− ∫ b a f (t) dt‖V ≤ (b− a)m f (|P|). Exercı́cio 10.13 Prove a partir das somas de Riemann que, se f ∈ C(I, V) e a ≤ x ≤ y ≤ z ≤ b,∫ z x f (t) dt = ∫ y x f (t) dt + ∫ z y f (t) dt. 154 10.4 O teorema fundamental do Cálculo A partir de agora, definimos ∫ y x f (s) ds para y 6= x da forma usual se x < y e como∫ y x f (s) ds = − ∫ x y f (s) ds se x > y. Com esta notação, é fácil provar que∥∥∥∥∫ yx f (s) ds ∥∥∥∥ V ≤ |y− x| sup s∈[x,y] ‖ f (s)‖V . Como também é evidente que ∀x, y ∈ I : x 6= y⇒ ∫ y x f (s) ds y− x − f (x) = ∫ y x ( f (s)− f (x)) ds y− x . Ou seja,∥∥∥∥∥ ∫ y x f (s) ds y− x − f (x) ∥∥∥∥∥ V ≤ sup s∈[x,y] ‖ f (s)− f (x)‖V ≤ m f (|y− x|)→ 0 quando y→ x. Isto implica o seguinte resultado. Teorema 10.3 (Teorema Fundamental do Cálculo) Dada f ∈ C(I, V), defina: I( f )(t) := ∫ t a f (s) ds (t ∈ I). Então I : C(I, V)→ C(I, V) é contı́nua e além disso: I( f )′ = f . Exercı́cio 10.14 Dado um subintervalo J = [c, d] ⊂ [a, b] com a < c < d < b e uma f : I → V, mostre que: lim ε→0+ sup 0<|h|≤ε ∥∥∥∥I( f )(·+ h)− I( f )(·)h − f ∥∥∥∥ J,∞ = 0. 10.5 Mais exercı́cios Exercı́cio 10.15 Suponha que V = Rd. Mostre a partir da definição apresentada no texto que a integral de f ∈ C(I, Rd) é dada por: ∫ y x f (t) dt = (∫ y x f [i](t) dt )d i=1 (x, y ∈ I). Exercı́cio 10.16 Mostre que a operação I definida implicitamente no Teorema Fundamental do Cálculo é uma aplicação linear contı́nua de C(I, V) em C(I, V). 155 Exercı́cio 10.17 Considere espaços vetoriais (V, ‖ · ‖V) e (W, ‖ · ‖W) e T : V → W linear e contı́nua. Mostre que, se f : [a, b]→ V é diferenciável em t ∈ [a, b], então (T f )′(t) = T f ′(t). Exercı́cio 10.18 (Série de Taylor) Suponha que f : I → V é k vezes diferenciável e que f (k)(t0) existe num certo ponto t0 ∈ (a, b). Mostre que podemos escrever: ∀h ∈ R com t0 ∈ h ∈ [a, b] : f (t0 + h) = f (t0) + k ∑ j=1 f (j)(t0) j! hj + rk(h), com ‖rk(h)‖V/|h|k → 0 quando h→ 0. Exercı́cio 10.19 (Série de Taylor com resto integral) Na mesma linha do exercı́cio acima, supo- nha que f : I → V é k vezes diferenciável com k-ésima derivada contı́nua em todo intervalo. Encontre uma fórmula explı́cita para rk(h) em termos de uma integral envolvendo a k-ésima derivada. 156 Capı́tulo 11 A derivada como transformação linear No capı́tulo anterior, fizemos a parte fácil do trabalho de diferenciar funções com valores veto- riais. O tema deste capı́tulo é considerar funções cujas entradas e valores podem ser vetoriais. Apresentaremos os principais conceitos da teoria e veremos muitos exemplos interessantes. 11.1 Definição de derivada de Fréchet Fixamos dois espaços vetoriais normados (V, ‖ · ‖V) e (W, ‖ · ‖W). A definição geral de derivada é a seguinte. Definição 11.1 Dado um aberto U ⊂ V, dizemos que f : U → W é Fréchet-diferenciável em x ∈ U se existe uma transformação linear contı́nua T ∈ L(V, W) tal que para h ∈ V, h→ 0V , f (x + h) = f (x) + T h + rx(h) para uma “função-resto” rx com ‖rx(h)‖W/‖h‖V → 0. De forma equivalente, pedimos que rx(h) := f (x + h)− f (x)− T h satisfaça o seguinte: ∀ε > 0 ∃δ > 0 : ∀h ∈ BV(x, δ) ⊂ U, ‖rx(h)‖W ≤ ε ‖h‖V . Chamamos T de derivada de Fréchet (ou simplesmente derivada) de f em x e escrevemos T = D f (x). Um ponto fundamental da definição acima é que D f (x) deve ser uma transformação linear contı́nua, ou limitada: ‖D f (x)‖V→W := sup v∈V\{0V} ‖D f (x) v‖W ‖v‖V < +∞. Sabemos que toda transformação linear é contı́nua quando V = Rd, mas há transformações lineares descontı́nuas em alguns outros casos. Portanto, quando V tem dimensão infinita, parte do trabalho de provar que uma transformação linear T é a derivada de f em x é mostrar que ‖T‖V→W < +∞. Outra observação básica é sobre notação. Frequentemente usaremos o(h) para denotar uma função de h ∈ V (com norma pequena) que satisfaz o(h)/‖h‖V → 0 quando ‖h‖V → 0. Por isso, a propriedade do resto na definição de derivada será escrita como: rx(h) = f (x + h)− f (x)− T h = o(h). 157 Usaremos esta notação abaixo sem muita preocupação. Antes de prosseguirmos, notamos uma propriedade simples de uma função diferenciável num ponto. Exercı́cio 11.1 Com V qualquer, note que, se f é diferenciável em x, então f também é contı́nua em x. A dica para provar isso é mostrar que uma função o(h) tende a 0W quando h → 0V (isto é, “nem precisa” dividir por ‖h‖V). 11.1.1 Unicidade da derivada de Fréchet e derivadas direcionais Um outro ponto importante da definição é saber se T = D f (x) é unicamente definido. Para isso, usamos a proposição abaixo. Proposição 11.1 No contexto da definição acima, Suponha que S ∈ L(V, W) satisfaz: f (x + h) = f (x) + S h + Rx(h), com ‖Rx(h)‖W ‖h‖V → 0, assim como T. Então S = T. De fato, para cada v ∈ V, vale: Sv = Tv = lim t→+∞ f (x + tv)− f (x) t . Prova: Veja que S 0V = T 0V = 0W por linearidade. Se v 6= 0V , podemos tomar h := tv, notando que este vetor vai a 0V quando t→ 0 e ‖tv‖V = |t|‖v‖V . Deduzimos que∥∥∥∥ f (x + tv)− f (x)t − T v ∥∥∥∥ W = ∥∥∥∥ f (x + tv)− f (x)− T (tv)t ∥∥∥∥ W = ‖rx(tv)‖ ‖t v‖V ‖v‖V → 0, ou seja, Tv = lim t→0 f (x + tv)− f (x) t . Repetindo a prova com S, deduzimos: Sv = lim t→0 f (x + tv)− f (x) t . 2 Esta prova pode deixar o leitor com a pulga atrás da orelha. Afinal, acabamos de mostrar que: D f (x) v = limh→0 f (x + h)− f (x) h e o limite do lado direito é bem mais palatável do que a derivada que acabamos de definir. De fato, ele tem um nome. Definição 11.2 O limite ∂v f (x) := lim t→0 f (x + tv)− f (x) t , quando existe, é chamado de derivada de Gâteaux (ou direcional) de f no ponto x e na direção v 158 Ao contrário da derivada de Fréchet, que às vezes é difı́cil de se calcular, a derivada de Gâteaux se parece com as derivadas que já vimos antes. A prova da proposição 11.1 implica o seguinte resultado: Proposição 11.2 (Prova omitida.) Quando a derivada de Fréchet D f (x) existe para um certo x ∈ U, então as derivadas de Gâteaux também existem neste ponto e em todas as direções. Além disso, D f (x).v = ∂v f (x) para todo v ∈ V. A recı́proca da proposição não é verdadeira: há casos em que ∂v f (x) existe para todo v, mas f não é nem sequer contı́nua. Isso pode ocorrer mesmo quando V = R2 e W = R, como mostra o exemplo abaixo. Exemplo 11.1 Considere f (x) = { (x[1])3 x[2] (x[1])6+(x[2])2 , x 6= 0R2 0, x = 0R2 . É fácil ver que as derivadas direcionais ∂v f (0R2) existem e são todas iguais a 0. No entanto, f não é nem sequer contı́nua em 0R2 . Por exemplo, se fazemos a(t) := (t, t3) (t > 0), vemos que a é contı́nua, mas f ◦ a(t)→ 1/2 6= f ◦ a(0) quando t→ 0. Uma explicação para esta discrepância é que as derivadas direcionais ∂v f (x) só ligam para o comportamento de f ao longo de retas a partir de x. Por isso, elas não “enxergam” eventuais descontinuidades de f sobre curvas. Concluindo, a derivada de Fréchet é mais exigente que a de Gâteaux. Por essa razão, ela tem propriedades melhores. Por exemplo, a existência de D f (x) implica continuidade de f em x, e as derivadas de Fréchet satisfazem a regra da cadeia (discutida mais adiante). As derivadas de Gâteaux são mais fracas e não garantem muita coisa sobre o comportamento de f numa vizinhança de x. No entanto, a derivada de Gâteaux é mais simples de calcular: começar com ela pode ser uma boa maneira de “adivinhar” quem deve ser a derivada de Fréchet. Além disso, há situações em que sabemos de antemão que a derivada de Fréchet existe: nestes casos, sabemos que calcular ∂v f (x) para cada v vai nos dizer quem é D f (x). 11.2 Alguns casos simples da derivada de Fréchet 11.2.1 Quando o domı́nio está na reta Um caso simples desta definição se dá quando V = R e U ⊂ R é aberto. Neste caso, parece natural definir a derivada como o limite usual. f ′(x) := lim h→0 f (x + h)− f (x) h . Nesta seção mostraremos que a derivada de Fréchet coincide com esta definição por limite a menos de um isomorfismo. A proposição a seguir esclarece o que seria este isomorfismo. Proposição 11.3 Os espaços L(R, W) e W são isomorfos como espaços vetoriais normados. Isto é, há uma bijeção linear entre estes dois espaços que preserva normas. De fato, esta bijeção leva T ∈ L(R, W) em vT := T 1 ∈W. 159 Prova: Neste teorema, estamos pensando em R como espaço vetorial normado sobre o corpo R. Por esta razão, podemos pensar num elemento x ∈ R como o produto x.1 do escalar x com o elemento 1 deste espaço vetorial. Isto nos leva à constatação de que vT := T(1) define inteiramente a transformação T, já que, dado qualquer x ∈ R, T(x) = T(x.1) = (use linearidade) = x T(1) = x vT. Agora argumentamos que a aplicação T 7→ vT nos dá uma bijeção linear de L(R, W) com W que preserva normas. Veja em primeiro lugar que, dados T, T′ ∈ L(R, W) e λ ∈ R, vλT+T′ = (λT + T′)(1) = λ T(1) + T′(1) = λ vT + vT′ . Além disso, vT = 0W implica que T(x) = 0W para todo x ∈ W, ou seja, T = 0L(R,W). Isto implica que T 7→ vT é injetiva. Temos ainda: ‖T‖R→W = sup x∈R\{0}R ‖Tx‖W |x| = supx∈R\{0}R ‖xvT‖W |x| = ‖vT‖W . Finalmente, T é sobrejetiva: dado qualquer v ∈ W, a transformação Tv que leva x ∈ R em Tv(x) := x v tem vTv = v. Além disso, T é limitada pelo argumento acima. 2 Agora podemos enunciar o resultado que garante a coincidência entre as derivadas de Fréchet e a “derivada como limite” a que estamos acostumados. Lema 11.1 Dados U ⊂ R aberto, x ∈ U e f : U →W, são equivalentes: 1. f é diferenciável em x no sentido de Fréchet. 2. Existe o limite: f ′(x) := lim h→0 f (x + h)− f (x) h . Além disso, quando f ′(x) e D f (x) estão ambas definidas, temos f ′(x) = D f (x)(1). Prova: O ponto é que, dados T ∈ L(R, W), h ∈ R com x + h ∈ U, f (x + h)− f (x)− T h = f (x + h)− f (x)− h vT segundo o isomorfismo do exercı́cio anterior, com vT = T 1. Deste modo, lim h→0 ‖ f (x + h)− f (x)− T h‖W |h| = limh→0 ∥∥∥∥ f (x + h)− f (x)h − vT ∥∥∥∥ W . O lema segue trivialmente desta última identidade já que um dos limites existe e é zero se e somente se o outro também é. Isto é, vT = f ′(x) se e somente se T = D f (x). 2 160 11.2.2 Derivadas envolvendo funções lineares Uma observação simples, mas importante para o que segue, é que, se T : V →W já é linear, então sua derivada é DT(x) h = T h, para quaisquer x, h ∈ V. A prova deste fato fica como exercı́cio. Um outro caso simples é descrito no exercı́cio abaixo. Exercı́cio 11.2 Mostre que, quando f : U → W é diferenciável e T ∈ L(W, Z) para um outro espaço vetorial normado Z. Neste caso, T ◦ f : U → Z tem derivada: D(T ◦ f )(x) h = T D f (x) h em todo ponto x ∈ U onde f é diferenciável. O leitor é convidado a provar isto diretamente, mas observamos que esta é uma consequência da regra da cadeia. 11.2.3 A derivada quando V tem dimensão finita e W = R Nesta seção consideraremos o caso em que V tem dimensão finita e W = R. De fato, nos contentaremos em entender bem o caso V = Rd e W = R; os mesmo resultados se estendem aos outros espaços de dimensão finita porque todos os espaços de mesma dimensão finita são isomorfos. A tentação aqui é falar das derivadas parciais que já conhecemos do Cálculo. Cara derivada parcial ∂ f /∂xi é obtida fixando um x ∈ U, variando a i-ésima coordenada de x e tomando o limite adequado. Não é difı́cil ver que isto é a mesma coisa que a derivada direcional ∂ei f (x), que nós chamaremos de ∂i f (x) para deixar a notação mais leve. Nossa pergunta aqui é: que condições sobre as derivadas parciais garantem que D f (x) existe? Além disso, o que sabemos sobre D f (x) a partir das derivadas parciais? O Exemplo 11.1 acima nos mostra a simples existência de derivadas parciais não resolve garante que f é Fréchet-diferenciável em x. No entanto, pode-se dizer algumas coisas sobre como é D f (x), caso ela exista. Observe que, como W = R, se f : U → R é diferenciável, então D f (x) ∈ L(Rd, R) é um funcional linear contı́nuo entre V = Rd e R. Em particular, dado v ∈ Rd: D f (x) v := D f (x) d ∑ i=1 v[i]ei = d ∑ i=1 vi (D f (x) ei) = d ∑ i=1 vi ∂i f (x). Portanto, se existe D f (x), então o vetor gradiente ∇ f (x) = (∂i f (x))di=1 determina essa derivada, no sentido que D f (x) · v = ∇ f (x) · v para cada v ∈ Rd. Esta conclusão, no entanto, não responde nossa pergunta anterior, que é se podemos saber que D f (x) existe a partir das derivadas parciais. O resultado a seguir nos diz que, se as derivadas parciais são contı́nuas numa vizinhança de x, isso é suficiente para garantir que D f (x) existe. Teorema 11.1 Suponha que U ⊂ Rd é aberto, f : U → R é dada e x ∈ U. Se as derivadas parciais ∂i f (1 ≤ i ≤ d) estão definidas em uma vizinhança aberta de x e são contı́nuas neste ponto, então D f (x) existe (o que é o mesmo que dizer que f é diferenciável em x no sentido de Fréchet). 161 Prova: A ideia da prova é usar o Teorema do Valor Médio, que diz que, se g : I → R é di- ferenciável num intervalo I e a, a + t ∈ I, então existe um ponto s com |s| ≤ |t|, a + s ∈ I e g(a + t)− g(a) = g′(a + s) t. Vamos aplicar este resultado às derivadas parciais que, no final das contas, são derivadas em uma variável. Tome r > 0 tal que as derivadas parciais de f existem em BRd [x, r] ⊂ Rd. Veja que, se Ii := [x[i]− r/√ d, x[i] + r/ √ d], então Q := I1 × I2 × . . . Id ⊂ BRd [x, r]. Em particular, se x̃ ∈ Q e ti ∈ R é tal que x̃ + tiei ∈ Q, existe um si = si(x̃, ti) com |si| ≤ |ti|, x̃ + siei ∈ Q e f (x̃ + tiei)− f (x̃) = ti∂i f (x̃ + siei). (Note que só podemos garantir x̃[i] + si ∈ Ii porque Q tem a estrutura de um produto cartesiano de intervalos.) Vamos aplicar isso ao caso em que as coordenadas de h estão entre −r/ √ d e r/ √ d, o que garante x + h ∈ Q. Recordamos que h = ∑di=1 h[i]ei. Observamos que para cada j ∈ [d] ∪ {0} o vetor hj := ∑ j i=1 h[i] ei ∈ Q também tem coordenadas entre −r/ √ d e r/ √ d. Portanto, x + hj ∈ Q para cada um destes j e podemos escrever uma soma telescópica. f (x + h)− f (x) = d ∑ m=1 ( f (x + hj)− f (x + hj−1)). Como x + hj = x + hj−1 + h(j)ej para cada j ∈ [d], podemos encontrar um valor h̃(j) entre 0 e h(j), tal que, se h̃j := hj−1 + h̃(j)ej, f (x + hj)− f (x + hj−1) = h(j) ∂j f (x + h̃j). Deduzimos que f (x + h)− f (x) = d ∑ m=1 h(j) ∂j f (x + h̃j). Para terminar a prova, definimos ∇ f (x) como o vetor das derivadas parciais. Veja que: f (x + h)− f (x)−∇ f (x) · h = rx(h) := d ∑ m=1 h(j) (∂j f (x + h̃j)− ∂j f (x)). Por Cauchy-Schwartz, |rx(h)| ≤ |h|2 √√√√ d∑ j=1 (∂j f (x + h̃j)− ∂j f (x))2. Veja que |h̃j|2 ≤ |hj|2 ≤ |h|. Deste modo, quando h→ 0, cada h̃j converge a 0. Podemos combinar isto com nossa hipótese de continuidade das derivadas parciais e concluir que o termo da raı́z quadrada acima vai a 0. Portanto: |rx(h)| |h|2 ≤ √√√√ d∑ m=1 (∂j f (x + h̃j)− ∂j f (x))2 → 0. Ou seja, ∇ f (x) · h = D f (x) h, como querı́amos mostrar. 2 162 Um corolário importante deste resultado é o seguinte. Exercı́cio 11.3 Dada f : U → R, as seguintes propriedades são equivalentes. 1. D f (x) está definido em todo U, e além disso D f : U → L(Rd, R) é função contı́nua; 2. ∇ f (x) está definido em todo U, e além disso ∇ f : U → Rd é função contı́nua; 3. todas as derivadas parciais de ∂i f (x) existem para qualquer x ∈ U e, além disso, as derivadas parciais dependem continuamente de x. No entanto, o exercı́cio abaixo mostra que a derivadada de Fréchet pode existir mesmo quando as derivadas parciais são contı́nuas. Exercı́cio 11.4 Considere f : R2 → R definida por: f (x) := { |x|22 sin ( 1 |x|2 ) , x 6= 0R2 ; 0, x = 0. Prove que esta função é Fréchet diferenciável em 0R2 , mas não tem derivadas parciais contı́nuas neste ponto. 11.2.4 O caso em que W tem dimensão finita Também neste caso consideraremos apenas W = Rk. Neste caso, é possı́vel mostrar o seguinte resultado. Exercı́cio 11.5 f : U ⊂ Rk é diferenciável em x ∈ U se e somente se cada uma das funções coordenadas é diferenciável. Isto é, se f [i] : U → R é diferenciável em x ∈ U para cada i ∈ [k], então f é diferenciável em x e D f (x) h = (D f [i](x) h)ki=1; também vale a recı́proca. Considere agora a restrição a V = Rd, de modo que U ⊂ Rd. Assim como o gradiente é o candidato “natural” a derivada quando W = Rk, nossa melhor tentativa para a derivada de f é a matriz jacobiana Jac( f )(x) ∈ Rk×d com entradas Jac( f )(x)[i, j] = ∂j f [i](x) (1 ≤ i ≤ k, 1 ≤ j ≤ d). De fato, os fatos abaixo seguem facilmente do que vimos no caso W = R. Exercı́cio 11.6 Quando V = Rd, W = Rk, f é como acima, x ∈ U e D f (x) existe, então a matriz jacobiana está bem definida e ∀v ∈ Rd : D f (x) v = Jac( f )(x) v. Isto é, Jac( f )(x) ∈ Rk×d é a matriz que representa D f (x) ∈ L(Rd, Rk) na base canônica. Exercı́cio 11.7 Quando V = Rd, W = Rk, f é como acima, x ∈ U, Jac( f )(·) está definida numa vizinhança de x e é contı́nua em x, então f é Fréchet-diferenciável em x. Exercı́cio 11.8 Dados U ⊂ Rd aberto e f : U → Rk, as seguintes propriedades são equivalentes: 163 1. D f (x) ∈ L(Rd, Rk) está definida para qualquer x ∈ U e além disso D f : U → L(Rd, Rk) é função contı́nua; 2. A matriz jacobiana Jac( f )(x) ∈ Rk×d com entradas Jac( f )(x)[i, j] = ∂j f [i](x) (1 ≤ i ≤ k, 1 ≤ j ≤ d) está bem definida para qualquer x ∈ U e depende continuamente de x (o que é o mesmo que dizer que suas entradas dependem continuamente de x). Exercı́cio 11.9 (Coordenadas polares) Podemos escrever cada vetor x ∈ Rd\{0Rd} na forma r v, onde r := |x|2 > 0 e v := x/|x|2 ∈ Sd−1. Note ainda que para cada v deste tipo há um único vetor ṽ ∈ Rd−1 tal que v[i] = ṽ[i] para 1 ≤ i ≤ d− 1. Calcule a jacobiana da transformação que leva x em (r, ṽ) ∈ R×Rd−1 ≡ Rd. Calcule ainda o determinante dessa transformação. 11.2.5 A derivada do determinante Seção sendo escrita. Ao menos em princı́pio, as fórmulas acima nos permitem calcular as deri- vadas de Fréchet para todas as funções entre espaços vetoriais. No entanto, há muitos casos em que é mais fácil e mais interessante partir diretamente da definição. Veremos alguns exemplos disso a seguir. Exemplo 11.2 Considere a função det : Rd×d → R. Qual é a sua derivada em A ∈ Rd×d? Note que o determinante é um polinômio multilinear nas entradas da matriz, portanto as derivadas parciais de det existem e são contı́nuas. Concluı́mos que Ddet(A) existe para qualquer A e é um funcional linear de Rd×d em R. Apresentamos duas maneiras de fazer isso abaixo. Tratando Rd×d ∼= Rd2 Aqui aproveitamos a relação entre Rd×d e Rd 2 . Note que o produto interno natural entre matrizes A, B ∈ Rd×d é dado por: 〈A, B〉 := d ∑ i,j=1 A[i, j]B[i, j] = tr(ABT) = tr(AB) onde tr é o traço (soma das entradas diagonais). Adaptando a prova que vimos para Rd, sabemos que a existência da derivada de Fréchet em todo ponto garante que: Ddet(A) H = 〈∇det(A), H〉 = tr(∇det(A)T H), onde ∇det(A) ∈ Rd×d tem entradas: ∇det(A)[i, j] = ∂det(A) ∂A[i, j] (1 ≤ i, j ≤ d). Para calcularmos as derivadas parciais, precisamos lembrar de como se escreve o determi- nante a partir de uma linha de A e a chamada matriz de cofatores. Em primeiro lugar, defini- mos, para cada par 1 ≤ i, j ≤ d, uma matriz Aij ∈ R(d−1)×(d−1): esta matriz é igual a A, exceto 164 que omitimos a i-ésima linha e a j-ésima coluna. A matriz de cofatores de A é definida como o elemento C(A) ∈ Rd×d com entradas C(A)[i, j] := (−1)i+j det(Aij) (1 ≤ i, j ≤ d). Entre outras coisas, a matriz de cofatores é importante porque det(A) 6= 0⇒ A−1 = C(A) T det(A) . (11.1) Além disso, sabemos que o determinante pode ser escrito a partir dos elementos da linha i da matriz A e dos cofatores correspondentes. det(A) = d ∑ k=1 A[i, k]C(A)[i, k] = d ∑ k=1 (−1)i+k A[i, k]det(Aik). Agora tomamos a derivada parcial da fórmula acima na variável A[i, j]. Note que as matrizes Aik não incluem a entrada A[i, j] porque a linha i for omitida de cada uma delas. Por isso, os termos A[i, k]det(Aik) com k 6= j tem derivada parcial 0 com respeito a A[i, j]. Portanto: ∂det(A) ∂A[i, j] = ∂ ∂A[i, j] A[i, j]C(A)[i, j] = C(A)[i, j]. Concluı́mos que: ∇det(A) = C(A) e que Ddet(A) H = tr(C(A)T H). (11.2) Em particular, a equação (11.1) nos diz que: det(A) 6= 0⇒ Ddet(A) H = det(A) tr(A−1H). (11.3) Uma outra abordagem Agora apresentamos um argumento para chegar rapidamente à fórmula (??). Com algum traba- lho a mais, provaremos a fórmula mais geral (11.2). Fixe uma A ∈ Rd×d inversı́vel. Como já sabemos que a derivada de Fréchet existe, ela tem de coincidir com a derivada de Gâteaux. Ddet(A) H = lim ε→0+ det(A + ε H)− det(A) ε . Usaremos agora o fato de que o determinante é multiplicativo: o determinante do produto é o produto dos determinantes. A + εH = A (I + εA−1H)⇒ det(A + ε H) = det(A)det(I + εA−1H). Deduzimos que: Ddet(A) H = det(A) lim ε→0+ det(I + ε A−1H)− 1 ε . 165 Para facilidar, escrevemos ∆ := A−1H. Note que o limite acima é igual a: lim ε→0+ det(I + ε A−1H)− 1 ε = Ddet(I)∆. Isto é, estamos calculando uma derivada de Fréchet (ou de Gâteaux, tanto faz) no ponto I ∈ Rd×d. Para calcular este limite, lembramos desta vez que o determinante é uma função multili- near das colunas da matriz ∆. Para usar isso da melhor maneira, usamos a seguintenotação: se (v1, . . . , vd) ∈ (Rd)d são dados, det(v1, . . . , vd) é o determinante da matriz com colunas (v1, . . . , vd). Desta forma, se chamamos de ∆j a j-ésima coluna de ∆, det(I + ε∆) = det(e1 + ε∆1, e2 + ε∆2, . . . , ed + ε∆d). Desenvolvendo o determinante, usando a multilinearidade, chegamos à seguinte expressão: det(I + ε ∆) = det(I) +ε (det(∆1, e2, . . . , ed−1, ed) + det(e1, ∆2, . . . , ed−1, ed) + · · ·+ det(e1, e2, . . . , ed−1, ∆d)) + d ∑ k=2 εk ck, onde os ck são certas constantes. Subtraindo det(I), dividindo por ε e mandando ε a 0, os termos εkck desaparecem e ficamos com: lim ε→0+ det(I + ε A−1H)− 1 ε = det(∆1, e2, . . . , ed−1, ed)+det(e1, ∆2, . . . , ed−1, ed)+ · · ·+det(e1, e2, . . . , ed−1, ∆d). Cada matriz na soma do lado direito coincide com a identidade exceto na coluna j, que é igual a ∆j. É um exercı́cio mostrar que o determinante de uma matriz deste tipo é ∆j[j] = ∆[j, j]. Portanto, lim ε→0+ det(I + ε A−1H)− 1 ε = ∆[1, 1] + ∆[2, 2] + · · ·+ ∆[d, d] = tr(∆). Lembrando que ∆ = A−1H e combinando com as igualdades anteriores, chegamos novamente à fórmula (11.3). Para A ∈ Rd×d inversı́vel, ela implica que Ddet(A) H = tr(C(A)T H). Como C(A) depende continuamente de A; as matrizes inversı́veis são densas em Rd×d; e sabemos que Ddet(A) depende continuamente de A, concluı́mos que a fórmula mais geral (11.2) vale para todas as matrizes A ∈ Rd×d e qualquer H ∈ Rd×d. Exercı́cio 11.10 Descreva e justifique em detalhes o que aconteceu na última etapa da demonstração. Exercı́cio 11.11 Considere Rd×d e também o subespaço Rd×dsim ⊂ Rd×d das matrizes simétricas. Calcule a derivada de Fréchet da operação f : Rd×d → Rd×dsim que leva uma M ∈ Rd×d em MT M. 11.3 Boas propriedades da derivada de Fréchet Nesta seção damos substância ao que já dissemos acima: a derivada de Fréchet tem boas propri- edades teóricas. Os dois teoremas desta seção nos dizem que ela satisfaz uma regra da cadeia e uma desigualdade assemelhada ao Teorema do Valor Médio. 166 11.3.1 A regra da cadeia Enunciamos abaixo a versão geral da regra da cadeia. Tão importante quanto entender que ela vale é observar que as derivadas direcionais não satisfazem a regra da cadeia; veja a Observação 11.1 abaixo. Teorema 11.2 (Regra da cadeia) Suponha que (V, ‖ · ‖V), (W, ‖ · ‖W) e (Z, ‖ · ‖Z) são espaços vetori- ais normados. Suponha que UV ⊂ V e UW ⊂ W são abertos, que f : UV → UW e g : UW → Z. Fixos x ∈ UV e y = f (x) ∈ UW , suponha que as derivadas de Fréchet D f (x) e Dg(y) existem. Então a derivada de g ◦ f em x também existe e é dada pelo produto de transformações lineares Dg ◦ f (x) = Dg(y) D f (x). Prova: Fixe x e y = f (x) como acima. Dado h ∈ V com x + h ∈ UV , escrevemos: hy := f (x + h)− f (x) = f (x + h)− y. Temos: g ◦ f (x + h)− g ◦ f (x) = g(y + hy)− g(y) = Dg(y) hy + Ry(hy), com Ry o termo de resto esperado. Do mesmo modo, hy = D f (x) h + rx(h). Concluı́mos que: g ◦ f (x + h)− g ◦ f (x) = Dg(y) D f (x) h + Ry(hy) + Dg(y) rx(h). Esta fórmula deixa clara a nossa missão: queremos provar que o termo Ry(hy) + rx(h) se com- porta como esperamos de um resto. Ou seja, queremos que Objetivo final: ‖Ry(hy) + Dg(y) rx(h)‖Z ‖h‖X → 0 quando h→ 0. Vejamos como provar isso. O primeiro passo é quebrar a expressão em duas ‖Ry(hy) + Dg(y) rx(h)‖Z ‖h‖X ≤ ‖Ry(hy)‖Z ‖h‖V + ‖Dg(y) rx(h)‖Z ‖h‖V e controlar o segundo termo. De fato, como Dg(y) é uma transformação linear limitada, ‖Dg(y) rx(h)‖Z ‖h‖V ≤ ‖Dg(y)‖V→W ‖rx(h)‖W ‖h‖V h→0→ 0 porque ‖rx(h)‖W‖h‖V h→0→ 0. Ainda nos falta mostrar que ‖Ry(hy)‖Z/‖h‖X também converge a 0. Tome ε > 0 qualquer. Como ‖Ry(a)‖Z/‖a‖V → 0 quando a→ 0 sabemos que existe um δ > 0 tal que, ∀a ∈W, ‖a‖W ≤ δ : y + a ∈ U e ‖Ry(a)‖Z ≤ ε ‖a‖W . Por outro lado, ‖hy‖W ‖h‖V = ‖ f (x + h)− f (x)‖W ‖h‖V ≤ ‖D f (x) h‖V + ‖rx(h)‖V‖h‖V ≤ ‖D f (x)‖V→W + ‖rx(h)‖V ‖h‖V . 167 Portanto, quando h→ 0, hy → 0. Em particular, se h é pequeno o suficiente, hy ∈ BV(y, δ) e ‖Ry(a)‖Z ‖h‖V ≤ ε ( ‖D f (x)‖V→W + ‖rx(h)‖V ‖h‖V ) . Deduzimos que lim sup h→0 ‖Ry(hy)‖Z ‖h‖V ≤ ε (‖D f (x)‖V→W) . Como ε > 0 é arbitrário, o teorema segue. 2 Observação 11.1 É instrutivo ver em um exemplo de que o resultado acima falha quando usamos deriva- das direcionais ao invés das de Fréchet. Considere a função f ◦ a do Exemplo 11.1 acima. Veja que a, além de contı́nua, é diferenciável. Além disso, f tem derivadas direcionais ∂v f (x) para todos x, v ∈ R2. Apesar disso, a função f ◦ a não é diferenciável em 0R2 ; de fato, ela não é sequer contı́nua. Isto tem a ver com os comentários depois do Exemplo 11.1: as derivadas direcionais não se comportam bem quando calcularmos f ao longo de certas curvas indo para 0R2 . Já Fréchet não sofre deste problema, o que foi importante na prova acima porque hy é uma função não-linear de h. 11.3.2 A desigualdade do valor médio Vimos no Teorema 10.1 acima que o Teorema do Valor Médio se generaliza na forma de desigualdade para funções diferenciáveis γ : [0, 1] → W com W espaço vetorial. Aqui vemos uma extensão da desigualdade para funções F entre espaços vetoriais mais gerais. Recorde que, dados dois pontos x, y num mesmo espaço vetorial V, [x, y] denota o segmento de reta entre x e y, isto é: [x, y] := {ty + (1− t)x : t ∈ [0, 1].} Teorema 11.3 (Desigualdade do valor médio) Considere f : U → W com U ⊂ V aberto. Considere x, y ∈ U e suponha que o segmento de reta [x, y] está contido em U. Defina M := supa∈[x,y] ‖D f (a)‖V→W . Então ‖ f (x)− f (y)‖W ≤ M ‖x− y‖V . Prova: Considere m : [−ε, 1 + ε]→ U definida por m(t) := (1− t) x + t y (t ∈ [0, 1]). Veja que m está bem definida para ε > 0: como [x, y] ⊂ U e U é aberto, existe um ε positivo tal que m(t) ∈ U para todo t ∈ (−ε, 1 + ε). Além disso, m é diferenciável, com derivada: m′(t) = (y− x). A regra da cadeia garante que f ◦m : (−ε, 1 + ε) → W. De fato, levando em conta isomorfismos e tudo mais, temos (exercı́cio!): ( f ◦m)′(t) = D f (m(t))m′(t) = D f (m(t)) (y− x). Por sua vez, a desigualdade do valor médio para funções de [0, 1] em W (Teorema 10.1 acima) nos garante que: ‖ f (y)− f (x)‖W = ‖( f ◦m)(1)− ( f ◦m)(0)‖W ≤ sup t∈[0,1] ‖D f (m(t)) (y− x)‖W . 168 Para terminar, observamos que: sup t∈[0,1] ‖D f (m(t)) (y− x)‖W ≤ sup t∈[0,1] ‖D f (m(t))‖V→W ‖y− x‖V = M ‖y− x‖V porque o conjunto dos valores m(t) é exatamente [x, y]. 2 Antes de prosseguirmos, enunciamos aqui, para conveniência futura, um resultado de aproximação que nos será muito útil. Grosso modo, ele diz que, se a derivada não oscila muito numa vizinhança de x, então a aproximação de primeira ordem f (x′) ≈ g(x′) := f (x) + D f (x) (x′ − x) ao redor de x é de alta qualidade. De fato, g aproxima f bem mesmo quando consideramos diferenças de f entre pontos próximos de x. Corolário 11.1 (Aproximação afim quando a derivada muda pouco) Suponha que f : U → W como acima. Dados x ∈ U e r > 0 com BV(x, r) ⊂ U, suponha que f é diferenciável na bola BV(x, r) e que sup x′∈BV(x,r) ‖D f (x′)− D f (x)‖V→W ≤ α. Então a função g(x′) := f (x) + D f (x) (x′ − x) satisfaz Dg(x′) = D f (x) e ∀x′, x′′ ∈ BV(x, r) : ‖g(x′′)− g(x′)− ( f (x′′)− f (x′))‖W ≤ α ‖x′′ − x′‖V . Prova: Isso segue de aplicar a desigualdade do valor médio à função f (x′) − g(x′) a cada par x′, x′′ ∈ BV(x, r), notando que [x′, x′′] ⊂ BV(x, r) por convexidade e que sup x′∈BV(x,r) ‖D( f − g)(x′)‖V→W = sup x′∈BV(x,r) ‖D f (x′)− D f (x)‖V→W ≤ α. 2 Exercı́cio 11.12 Considere U ⊂ V aberto e convexo e f : U →W diferenciável. Mostre que ‖ f ‖Lip = sup a∈U ‖D f (a)‖V→W . 11.4 Derivadas mais complicadas de se calcular Encerramos este primeiro capı́tulo sobre a derivada de Fréchet calculando derivadas de funções que não são tão simples assim. O primeiro exemplo corresponde a funções de operadores lineares e o segundo tem relação com o problema de existência e unicidade para EDOs. O que estes exemplos têm em comum é que calcular as derivadas parciaisnão parece ser mais simples que obter diretamente a derivada de Fréchet. 11.4.1 Exemplos no espaço de operadores lineares Nesta seção, estaremos interessados no caso em que V = W = L(X, X) para algum espaço vetorial normado (X, ‖ · ‖X). Escreveremos L(X) := L(X, X) e chamaremos as transformações lineares T ∈ L(X) de operadores lineares sobre X. Tudo que faremos já é interessante no caso em que X = Rd, ‖ · ‖X = | · |2 é a norma Euclideana e L(X) ≡ Rd×d com a norma de operador. As operações que estamos interessados em derivar são as seguintes: 169 • Dado k ∈N, a aplicação que leva T ∈ L(X) em Tk. • A aplicação que leva um T ∈ L(X) em T−1 ∈ L(X) (no caso de T ser uma bijeção e T−1 ser limitado). Mostraremos “no braço” que estas funções são diferenciáveis. Observe que isto envolve en- contrar operadores lineares A ∈ L(L(X),L(X))! Isso pode parecer estranho, mas veremos que não há nada muito sério quando consideramos os casos concretos. Nossas estiamtivas usarão muito a submultiplicatividade da norma de operador: ∀T, S ∈ L(X) : ‖T S‖X→X ≤ ‖T‖X→X ‖S‖X→X. Potências de operadores Comecemos pela derivada de fk(T) := Tk. Exemplo 11.3 Definimos fk(T) := Tk (T ∈ L(X)). Qual é sua derivada? De fato, teremos interesse em calcular a derivada e estimar bem o termo de resto. A maior dificuldade desta prova é que, ao contrário do caso em que T, H ∈ R a fórmular para (T + H)k é bastante complicada por causa da não-comutatividade do produto de operadores. Daremos um argumento que passará ao largo dessa dificuldade. Considere o produto (T + H)k := (T + H) (T + H) . . . (T + H)︸ ︷︷ ︸ k vezes . Para calcular o produto, devemos usar a propriedade distributiva. Ela diz que (T + H)k é a soma de todos os 2k produtos de sequências do tipo THTTHHH . . . HTH com exatamente k termos. Agruparemos estas sequências pelo número de vezes em que H aparece. Primeiramente, há exatamente uma sequência em que H aparece 0 vezes: TTT . . . T = Tk. Considere agora k sequências em que H aparece exatamente 1 vez. Elas são da forma T . . . T︸ ︷︷ ︸ j termos H TT . . . T︸ ︷︷ ︸ j− k− 1 termos com 0 ≤ j ≤ k− 1. Sua contribuição conjunta é Ak(T) H := k−1 ∑ j=0 T j H Tk−1−j. Note que, para cada T ∈ L(X), Ak(T) : L(X) → L(X) é um operador linear. Ele é limi- tado,porque, pela submultiplicatividade da norma de operador, ‖Ak(T) H‖X→X ≤ k−1 ∑ j=0 ‖T‖jX→X ‖H‖X→X ‖T‖ k−1−j X→X = k ‖T‖ k−1 X→X ‖H‖X→X. (11.4) Portanto, Ak(T) ∈ L(L(X),L(X)). 170 Esta última estimativa tem algo de mágico. Tı́nhamos uma fórmula complicada paraAk(T) H. Quando passamos a norma de operador, ela de repente ficou tão simples quanto o termo cor- respondente do teorema binomial usual. Para terminarmos a prova, vamos usar um argumento parecido para estimar os demais termos de (T + H)k, observando eles têm de ser o resto. E porque sabemos disso? Ora estes termos que restam certamente não serão lineares em H, enquanto que o termo correspondendo à derivada tem de ser linear! Façamos então uma estimativa de rT(H) := k ∑ n=2 (termos do produto com n ocorrências de H) = (T + H)k − Tk −Ak(T) H, notando que, pela subaditividade da norma, ‖rT(H)‖X→X ≤ k ∑ n=2 ‖(termos do produto com n ocorrências de H)‖X→X, Foquemo-nos em um dos termos da soma. Há (kn) escolhas de sequências de Ts e Hs com exatamente n termos iguais a H. Por sua vez, a norma de um produto de Ts e Hs deste tipo é limitada pela submultiplicatividade da norma. ‖T . . . T H T . . . T H . . . ‖X→X ≤ ‖H‖nX→X ‖T‖k−nX→X. Concluı́mos que ‖(termos do produto com n ocorrências de H)‖X→X ≤ ( k n ) ‖H‖nX→X ‖T‖k−nX→X. Somando estas cotas, obtemos: ‖rT(H)‖X→X ≤ k ∑ n=2 ( k n ) ‖H‖nX→X ‖T‖k−nX→X e a fórmula binomial nos dá uma expressão mais compacta: ‖rT(H)‖X→X ≤ (‖T‖X→X + ‖H‖X→X)k − ‖T‖kX→X − k ‖T‖k−1X→X ‖H‖X→X. chame t := ‖T‖X→X e h := ‖H‖X→X. Observe que: ∀k ∈N\{0, 1}∀n ∈ {2, . . . , k} : ( k n ) = k(k− 1) n(n− 1) ( k− 2 n− 2 ) ≤ k (k− 1) 2 ( k− 2 n− 2 ) , logo (t + h)k − tk − ktk−1 = k ∑ n=2 k(k− 1) n(n− 1) ( k− 2 n− 2 ) tk−n hn ≤ k (k− 1) h 2 2 (t + h)k−2. Portanto, ‖rT(H)‖X→X ≤ k(k− 1) 2 (t + h)k−2 h2. Isto finalmente nos permite concluir que ‖rT(H)‖/‖H‖ → 0 quando H → 0. De fato, temos o seguinte resultado. 171 Teorema 11.4 A aplicação fk(T) := Tk (T ∈ L(X)) é diferenciável. Sua derivada é dada pelo operador limitado Ak(T) dado acima. O termo de resto: rT(H) := (T + H)k − Tk −Ak(T) H satisfaz: ‖rT(H)‖X→X ≤ k (k− 1) 2 (‖T‖X→X + ‖H‖X→X)k−2 ‖H‖2X→X. Inversas de operadores Temos agora um exemplo para tratar em que teremos muito mais trabalho. Chame de U ⊂ L(X) o conjunto de todos os T que têm inversa T−1 ∈ L(X). Ou seja, T ∈ L(X) se T é limitado, é uma bijeção de X em X e tem uma inversa satisfazendo T−1T = TT−1 = IX que também é um operador linear limitado. Nosso objetivo será mostrar o seguinte resultado. Teorema 11.5 ‘U é aberto de L(X). A função Inv : U → L(X) que leva T ∈ U em T−1 é diferenciável e DInv(T) H = −T−1HT−1. Vamos começar com uma observação simples, que deixamos como exercı́cio. Exercı́cio 11.13 Se A, B ∈ U são operadores inversı́veis, então BA também o é e (BA)−1 = A−1 B−1. Nosso próximo passo é estudar Inv numa vizinhança do operador identidade I. Lema 11.2 A bola aberta BL(X)(I, 1) está contida em U . Além disso ∀A = I + H ∈ BL(X)(I, 1) : A−1 = Inv(I + H) = ∑ n∈N (−H)n. Prova: Já provamos que, em um espaço vetorial normado completo V, se uma sequência de vetores {vn}n∈N satisfaz ∑n∈N ‖vn‖V < +∞, então ∑n∈N vn converge. Aplicaremos isso a V = L(X) com vn = Hn. No primeiro caso, observamos que ‖vn‖V = ‖(−H)n‖X→X ≤ ‖H‖nL(X) com ‖H‖X→X < 1, portanto ∑n∈N (−H)n converge. Como a operação de tomar produtos em L(X) é contı́nua (exercı́cio), temos (I + H) ∑ n∈N (−H)n = (I + H) lim n→+∞ n ∑ j=0 (−H)j = lim n→+∞ n ∑ j=0 (I + H) (−H)j = lim n→+∞ n ∑ j=0 [(−H)j + (−1)j H j+1] = lim n→+∞ n ∑ j=0 [(−H)j − (−H)j+1] (soma telescópica) = lim n→+∞ (I − Hn+1) (‖Hn+1‖X→X → 0) = I. 172 Do mesmo modo, (∑n∈N(−H)n) (I + H) = I. 2 Provemos agora o teorema. Prova: Considere A ∈ U . Tome r = rA := 1/‖A−1‖X→X. Veja que, se H ∈ L(X) e ‖H‖X→X < r, vale ‖A−1H‖X→X < 1. Portanto, o lema acima garante que (I + A−1H)−1 = ∑ n∈N (−A−1H)j. Pelo exercı́cio anterior, descobrimos que (A + H)−1 = [A (I + A−1H)]−1 = ∑ n∈N (−A−1H)j A−1. Em particular, provamos que, se A ∈ U , A + H ∈ U sempre que ‖H‖X→X < rA. Portanto, U é aberto. Para calcular a derivada, voltamos à série de potência. Observamos que a aplicação DA : H 7→ −A−1HA−1 é linear de L(X) no próprio espaço. Além disso, ela é limitada porque: ∀H ∈ L(X) : ‖DA H‖L(X) ≤ ‖A−1‖2L(X) ‖H‖L(X). Para provar que DA é a derivada de Inv no ponto A, veja que: (A + H)−1 − A−1 −DA H = ∑ n≥2 (−A−1H)j A−1. Como ‖H‖ ‖A−1‖ < 1, ‖(A + H)−1 − A−1 −DA H‖X→X ≤ ∑ n≥2 ‖A−1‖j+1 ‖H‖j = ‖H‖ 2 ‖A−1‖3 1− ‖H‖ ‖A−1‖ . Com esta expressão é fácil concluir que ‖(A + H)−1 − A−1 −DA H‖X→X ‖H‖ ≤ ‖H‖ ‖A−1‖3 1− ‖H‖ ‖A−1‖ → 0 quando H → 0. 2 11.4.2 Um exemplo sobre as funções contı́nuas Dado um intervalo compacto [a, b] ⊂ R, defina o espaço usual C([a, b], Rd). A função I que associa a cada f ∈ C sua integral indefinida é um operador linear, portanto: DI( f ) h = I h = ∫ · a h(t) dt. Consideraremos agora um tipo de função sobre C(I, Rd) relacionado ao problema de resolver EDOs. Dado U ⊂ Rd+1 aberto, considere o subconjunto U ⊂ C(I, Rd) de funções com f (I) ⊂ U. 173 Exercı́cio 11.14 Prove que U é aberto de C(I, Rd). (Dica: mostre primeiramente que inf t∈[a,b] dRd( f (t), U c) > 0. Se você não conseguir, tudo bem: há uma prova deste fato implı́cita na proposição abaixo!) Considere uma função contı́nua Ψ : I × U → Rd. Dados x0 ∈ Rd, t0 ∈ I, considere ainda a operação TΨ : U → C(I, R) que leva f numa nova função T( f ) com T( f )(t) := x0 + ∫ t t0 Ψ(s, f (s)) ds. Veja que este operador está bem definido porque Ψ(t, f (t)) é contı́nua em t sempre quef ∈ U . Como sabemos, a importância deste operador reside no fato que os seus pontos fixos (se existem) são precisamente as soluções de ξ ′(t) = Ψ(t, ξ(t)) com ξ(t0) = x0. Quando estudarmos o problema de existência para EDOs, vimos que T : U → C(I, R) é contı́nua. Veremos agora que, sob hipóteses adicionais, esta aplicação é diferenciável e calculare- mos a sua derivada. Proposição 11.4 Dados (t, x) ∈ I ×U, defina DxΨ(t, x) como a derivada da função em x ∈ U, com t mantido fixo. Suponha que esta derivada existe para todo par (t, x) ∈ I ×U e que, além disso, ela depende continuamente de (t, x). Então T é diferenciável em qualquer f ∈ U . Além disso, se v ∈ C(I, Rd), DT( f ) ∈ L(C(I, R)) existe e é igual ao operador linear que leva v ∈ C(I, R) na função (DT( f ) v)(t) := ∫ t t0 DxΨ(s, f (s)) v(s) ds (t ∈ I). Prova: Veja que T( f ) é a soma de uma função constante igual a x0 com I ◦ F( f ), onde I ∈ L(C(I, Rd)) leva cada f em I( f )(·) = ∫ · t0 f (s) ds e F : U → C(I, Rd) leva f em Ψ(·, f (·)). Usando os resultados da seção 11.2.2, descobrimos que, se provarmos que DF( f ) existe e satisfaz: ∀v ∈ C(I, Rd), ∀t ∈ I : (DF( f ) v)(t) = DxΨ(t, f (t)), então DT = I DF. Além disso, como I é linear e limitado (logo contı́nuo), a continuidade de DT será consequência da continuidade de DF. Mostremos, então, que F é diferenciável com a derivada que dizemos que ela tem. Fixo um f ∈ U , diferenciaremos F nos pontos ao redor de f , mostrando que esta derivada é contı́nua. Em princı́pio podemos pensar num esquema simples para a prova da existência da derivada. Nosso objetivo é provar que (queremos provar) ‖F( f + h)− F( f )− DxΨ(·, f (·)) h(·)‖∞ ‖h‖∞ → 0. O que sabemos, em princı́pio, é que Ψ é diferenciável em x, portanto podemos escrever: F( f + h)(t)− F( f (t)) = Ψ(t, f (t) + h(t))−Ψ(t, f (t)) = DxΨ(t, f (t)) h(t) + r(t, f (t))(h(t)). 174 Para cada t ∈ I, poderı́amos mostrar algo na linha de |r(t, f (t))(h(t))|2 ‖h‖∞ ≤ |r(t, f (t))(h(t))|2 |h(t)|2 → 0. No entanto, isso não resolve nosso problema, porque precisamos mostrar uma convergência uniforme. Ou seja, a definição da derivada para funções F : U → C(I, Rd) nos obriga a mostrar que o termo de resto satisfaz supt∈I |r(t, f (t))(h(t))|2 ‖h‖∞ → 0 e isso é um pouco mais complicado. Para vencermos esta dificuldade, será importante usar a continuidade uniforme de DxΨ. Para isso, teremos de nos restringir a um compacto K ⊂ I ×U. Que compacto seria este? Ele deve ser grande a ponto de podemos “variar” entre f e f + h lá dentro. Por esta razão, queremos (t, f (t) + h(t)) ∈ K para cada t ∈ I e h próxima de 0. Garantiremos que isso vale tomando uma “faixa” (se d = 1) ou “cilindro” (se d > 1) ao redor do gráfico de f . Ou seja, queremos um conjunto da forma K := {(t, x) : t ∈ [a, b], |x− f (t)| ≤ R}. (11.5) A questão, então, é se podemos escolher um R > 0 de modo que K ⊂ U. Para concluirmos que “sim, podemos”, devemos observar que f (t) ∈ U para cada t ∈ I = [a, b]. A aplicação t ∈ I 7→ dRd( f (t), Uc) é contı́nua (é a composição de funções contı́nuas) e positiva (Uc é fechado, logo dRd(x, U c) = 0 se e somente se x ∈ Uc). Combinando estes fatos com a compacidade de I, deduzimos que R0 := inf t∈[a,b] dRd( f (t), U c) > 0. Portanto, se 0 < R < R0, garantimos que o conjunto K em (11.5) realmente está contido em U. Note que, se h ∈ C([a, b], V) e ‖h‖∞ ≤ R, então (t, f (t) + h(t)) ∈ K para cada t, portanto f + h ∈ U . (Note que acabamos de provar “sem querer” que há uma bola BC(I,Rd)[ f , R] ⊂ U . Notando que podemos achar um R > 0 para cada f ∈ U , provamos que U é aberto!) Tendo o compacto K, queremos usar a continuidade uniforme de DxΨ |K. Tome um (t, a), (t, b) ∈ K com |b− a| ≤ δ. Pelo corolário 11.1 acima (aplicado com x′ = a e x′′ = a + b), ∀(t, a), (t, a + b) ∈ K : |Ψ(t, a + b)−Ψ(t, a)− DxΨ(t, a) b|2 ≤ c(δ) |b|2. onde c(δ) := sup (t,a),(t′,b)∈K : |(t′,b)−(t,a)|2≤δ |DxΨ(t, a)− DxΨ(t, b)|. Como DxΨ é contı́nua sobre I × U, e portanto é uniformemente contı́nua sobre o compacto K, vemos que c(δ)→ 0 quando δ→ 0. Note que isto quer dizer que sup (t,a),(t,a+b)∈K : 0<|b|2≤δ |Ψ(t, a + b)−Ψ(t, a)− DxΨ(t, a) b|2 |b|2 ≤ c(δ)→ 0 quando δ→ 0. 175 De posse dessa desigualdade, não é difı́cil completar a prova. Considere f e f + h com ‖h‖∞ ≤ R, de modo que (t, f (t)) ∈ K e (t, f (t) + h(t)) ∈ K para cada t ∈ I. Como |h(t)|2 ≤ ‖h‖∞ para cada t, temos ∀t ∈ I : |Ψ(t, f (t) + h(t))−Ψ(t, f (t))− DxΨ(t, f (t)) h(t)|2 ≤ c(‖h‖∞) ‖h‖∞, ou ‖F( f + h)− F( f )− DxΨ(·, f (·)) h(·)‖∞ ≤ c(‖h‖∞) ‖h‖∞. Portanto, ‖F( f + h)− F( f )− DxΨ(·, f (·)) h(·)‖∞ ‖h‖∞ ≤ c(‖h‖∞)→ 0 quando h→ 0. Isto demonstra que a derivada DF( f ) existe e é igual ao que dissemos que ela era. Para terminar, observamos que esta derivada é contı́nua: se { fn}n∈N ⊂ C(I, Rd) e fn → f , temos (t, fn(t)) ∈ K para todo t e todo n grande, e aı́ vemos que ‖DF( fn)− DF( f )‖L(C,C) = sup h∈C, ‖h‖∞≤1 ‖(DxΨ(·, fn(·))− Dx(Ψ(·, f (·)))) h(·)‖∞ = sup |h(t)|2≤1 t∈I ‖(DxΨ(t, fn(t))− DxΨ(t, f (t))) h(t)‖Rd ≤ sup t∈I ‖DxΨ(t, fn(t))− DxΨ(·, f (·))‖Rd→Rd → 0 por continuidade uniforme de DxΨ em K. 2 Observação 11.2 O mesmo argumento que demos acima prova algo a mais. Considere um compacto K ⊂ I ×U ⊂ Rd+1. Em primeiro lugar, vemos que existe uma função não-decrescente c = c(δ) ≥ 0 com limδ→0 c(δ) = 0 tal que ∀(t, a), (t, b) ∈ K : |Ψ(t, a + δ)−Ψ(t, a)− DxΨ(t, a) (b− a)|2 ≤ c(|b− a|2) |b− a|2. Agora chame de K := { f ∈ C(I, Rd) : ∀t ∈ I, (t, f (t)) ∈ K}. Neste caso, temos a estimativa: ∀t ∈ I, ∀ f , f + h ∈ K : |Ψ(t, f (t) + h(t))−Ψ(t, f (t))− DxΨ(t, f (t)) h(t)|2 ≤ c(‖h‖∞) ‖h‖∞, o que se traduz em ∀ f , f + h ∈ K : ‖F( f + h)− F( f )− DF( f ) h|2 ≤ c(‖h‖∞) ‖h‖∞, e ∀ f , f + h ∈ K : ‖T( f + h)− T( f )− DT( f ) h|2 ≤ (b− a) c(‖h‖∞) ‖h‖∞, já que T = I ◦ F, DT = I ◦ DF e a norma de operador de I é ≤ (b− a). 176 11.5 Mais exercı́cios Exercı́cio 11.15 (Mı́nimos são pontos crı́ticos) Suponha que (V, ‖ · ‖V) é espaço vetorial normado, U ⊂ V é aberto e f : U → R dada. Mostre que, se x ∈ U, f é diferenciável em x e f (x) = infx′∈U f (x′), então D f (x) = 0L(V,R). Exercı́cio 11.16 (Derivadas de funções convexas) Suponha que (V, ‖ · ‖V) é espaço vetorial normado, U ⊂ V é aberto convexo e f : U → R é diferenciável. Mostre que f é convexa (isto é, f (tx + (1− t)x′) ≤ t f (x) + (1− t) f (x′) para todos x, x′ ∈ U e 0 ≤ t ≤ 1) se e somente se: ∀x, x′ ∈ U : f (x′) ≥ f (x) + D f (x) (x′ − x). Exercı́cio 11.17 Suponha que (V, ‖ · ‖V) é espaço vetorial normado, U ⊂ V é aberto e convexo e f : U → V é diferenciável. Suponha ainda que f é bi-Lipschitz, isto é, ∃L−, L+ > 0 tais que ∀x, x′ ∈ U : x 6= x′ ⇒ L− ≤ ‖ f (x)− f (x′)‖W ‖x− x′‖V ≤ L+. Mostre que, neste caso, temos a seguinte desigualdade: ∀x ∈ U ∀h ∈ V : L−‖h‖V ≤ ‖D f (x) h‖W ≤ L+‖h‖V . Exercı́cio 11.18 Seja (V, ‖ · ‖V) espaço vetorial normado. Dado k ∈ N, recorde-se que Vk também tem estrutura de espaço normado, por exemplo com a norma: ‖v‖V := k ∑ i=1 ‖v[i]‖V , (v = (v[i])ki=1 ∈ Vk). Agora defina uma operação Tk : V → Vk que leva x ∈ V em (x, x, x, . . . , x) (x ∈ V). Qual é a derivada de Fréchet desta operação Tk? Exercı́cio 11.19 O permanente de uma matriz A ∈ Rd×d é dado por: per(A) := ∑ σ∈Sd d ∏ i=1 A[i, σ(i)]. Ou seja: o permanente é “quase igual” ao determinante, mas não aparecem os sinais alternados na fórmula. (Estranhamente, isso o torna mais difı́cil de calcular, mas muito útil em certos modelos da Mecânica Estatı́stica.) Mostre que per : Rd×d → R é Fréchet-diferenciável e calcule sua derivada. Exercı́cio 11.20 Considere espaços vetoriais normados (V, ‖ · ‖V) e (Wi, ‖ · ‖Wi) para i = 1, 2, . . . , k. Defina o espaço produto W := W1 ×W2 × · · · ×Wk com uma das normas-produto que já estudamos. Dado um aberto U ⊂ V, considere funções fi : U → Wi, com i = 1, . . . , k. Construa uma nova função f : U → W que leva x ∈ U na k-tupla f (x) = ( fi(x))ki=1 ∈ W. Mostre que f é diferenciável emum certo x ∈ U se e somente se cada fi é diferenciável em x e calcule a derivada de Fréchet de f em termos das derivadas D fi(x). 177 Exercı́cio 11.21 (“Regra de Leibniz” para derivada de Fréchet) Continue com a notação acima e acrescente um novo espaço vetorial normado (Z, ‖ · ‖Z) e uma Q : W → Z k-linear e limitada. Defina F : U → Z através da fórmula: F(x) := Q( f1(x), . . . , fk(x)) (x ∈ U). Mostre que, se todas as fi são diferenciáveis num certo x ∈ U, então DF(x) existe. Além disso, calcule DF(x). Exercı́cio 11.22 Neste problema, (X, ‖ · ‖X) é um espaço vetorial normado completo e L(X) é o espaço dos operadores lineares limitados de X em X. Considerand uma sequência {an}n∈N, queremos encontrar condições sob as quais a série de potência f (T) := ∑ n∈N an Tn define uma função diferenciável sobre uma vizinhança de 0 em L(X). Como no caso de séries de potência reais, definimos o raio de convergência: R := (lim sup n∈N |an|1/n)−1. 1. Mostre que a série definindo f converge se ‖T‖X→X < R. 2. Lembre da definição de Ak acima e mostre que a expressão D f (T) H := ∑ n≥1 anAn(T) H (H ∈ L(X)) define um operador linear sobre L(X), que é a derivada de Fréchet de f em T. 178 Capı́tulo 12 Derivadas de ordem superior No capı́tulo anterior, tratamos da noção de derivada devida a Fréchet, estudamos suas propri- edades e entendemos alguns exemplos. Nosso trabalho agora será estender este conceito para derivadas de ordem k > 1. Isso nos permitirá escrever uma versão da fórmula de Taylor neste contexto geral. 12.1 Já sabemos definir, mas... Considere espaços vetoriais normados (V, ‖ · ‖V), (W, ‖ · ‖W). Vimos acima que, quando U ⊂ V é aberto, f : U →W é dada e x ∈ U, a derivada de f em x, se existir, é o operador linear limitado D f (x) ∈ L(V, W) tal que lim h→0 ‖ f (x + h)− f (x)− D f (x) h‖W ‖h‖V = 0. Suponhamos agora que D f (x) está definida para todo x, de modo que D f : U → L(V, W). (L(V, W), ‖ · ‖V→W) também é um espaço vetorial normado. No cálculo em uma dimensão, a segunda derivada é tão somente a “derivada da derivada”. Isso continua a fazer sentido aqui e podemos dizer que a segunda derivada de f em x, se existir, tem de ser uma transformação linear limitada D2 f (x) ∈ L(V,L(V, W)) tal que: lim h→0 ‖D f (x + h)− D f (x)− D2 f (x) h‖V→W ‖h‖V = 0. Do mesmo modo, se D2 f : U → L(V, W) está definida em todo U, a terceira derivada em x, se existir, deve ser uma transformação linear limitada D3 f (x) ∈ L(VL(V,L(V, W))) tal que lim h→0 ‖D2 f (x + h)− D2 f (x)− D3 f (x) h‖V→L(V,W) ‖h‖V = 0. Poderı́amos continuar com estas fórmulas ligeiramente estranhas, mas antes devemos parar e pensar: o que está acontecendo aqui? Nada do que fizemos aqui está errado, mas a derivada que definimos não se presta a uma compreensão muito intuitiva. Vamos pensar atentamente no que ela quer dizer para compreendê- la um pouco melhor. 179 12.2 Segunda derivada, transformações bilineares e simetria A principal mensagem desta seção é que a segunda derivada pode ser pensada como uma transformação bilinear limitada. Definição 12.1 (Transformação bilinear) Uma transformação B : V2 → W é dita bilinear se é linear nos seus dois argumentos. Isto é: 1. dados v1, v2, v′ ∈ V e λ ∈ R, B(λv1 + v2, v′) = λ B(v1, v′) + B(v2, v′); 2. dados v, v′1, v ′ 2 ∈ V e λ′ ∈ R, B(v, λ′v′1 + v′2) = λ′ B(v, v′1) + B(v, v′2). Dizemos que uma transformação bilinear B : V2 →W é limitada se ‖B‖V2→W := sup (v,v′)∈(V\{0V})2 ‖B(v, v′)‖W ‖v‖V ‖v′‖V < +∞. Chamamos de L2(V, W) o conjunto das transformações bilineares limitadas. Na próxima subseção, mostraremos que L(V,L(V, W)) – o espaço onde “mora” a segunda derivada – é isomorfo ao espaço de transformações bilineares limitadas. 12.2.1 Relação de L(V,L(V, W)) com transformações bilineares Os elementos de L(V, (L(V, W)) são transformações lineares T : V → L(V, W). Uma tal T associa a cada v ∈ V um T(v) ∈ L(V, W) de forma linear, de modo que ∀v1, v2 ∈ V ∀λ ∈ R : T(λ v1 + v2) = λ T(v1) + T(v2). Quando fixamos um v ∈ V, T(v), pertence a L(V, W). Portanto, T(v) : V → W associa a cada v′ ∈ V um elemento T(v) v′ ∈W de forma linear. Dito de outro modo: ∀v ∈ V ∀v′1, v′2 ∈ V ∀λ′ ∈ R : T(v)(λ′ v′1 + v′2) = λ T(v) v′1 + T(v) v′2. O resumo disto tudo é que a cada T ∈ L(V,L(V, W)), podemos associar uma função: BT : V2 → W (v, v′) 7→ T(v) v′. O que esta função tem de especial é que ela é bilinear. De fato, o que vemos é que a cada T : V → L(V, W) podemos associar uma transformação bilinear BT : V2 → W. De fato, o seguinte resultado é fácil de provar. Exercı́cio 12.1 A aplicação que leva T em BT é uma bijeção linear entre o conjunto das transformações lineares T : V → {transformações lineares de V em W} e o conjunto das transformações bilineares B : V2 →W. Dica: observe que a inversa de “T 7→ BT” leva uma transformação bilinear B : V2 →W em TB : v ∈ V 7→ B(v, ·). 180 Há no entanto um fato que ainda não consideramos: T é uma transformação linear limitada entre os espaços normados (V, ‖ · ‖V) e (L(V, W), ‖ · ‖V→W). Mais concretamente: recorde que, se (Z, ‖ · ‖Z) é espaço normado, a norma ‖ · ‖V→Z a norma V → Z sobre L(V, Z) é dada por: ‖S‖V→Z = sup v∈V\{0V} ‖Sv‖Z ‖v‖V (S ∈ L(V, Z)). Se seguimos este raciocı́nio, descobrimos que a norma adequada sobre L(V,L(V, W)) é: ‖T‖V→L(V,W) = sup v∈V\{0V} ‖T(v)‖V→W ‖v‖V = sup v∈V\{0V} ( sup v′∈V\{0V} ‖T(v)v′‖W ‖v‖V ‖v′‖V ) (T ∈ L(V,L(V, W))). Vamos encontrar uma expressão mais simples para esta norma. Proposição 12.1 Para qualquer transformação linear T : V → L(V, W) (não necessariamente limitada), ‖T‖V→L(V,W) = sup (v,v′)∈(V\{0V})2 ‖BT(v, v′)‖V→W ‖v‖V ‖v′‖V ; Ou seja, na definição acima, não importa se tomamos o supremo primeiro em v ou em v′. (Nos dois casos admitimos a hipótese de que ‖T‖V→L(V,W) pode ser infinito.) Prova: Defina a(v, v′) := ‖BT(v, v′)‖V→W ‖v‖V ‖v′‖V . Nosso objetivo é provar que sup v∈V\{0V} sup v′∈V\{0V} a(v, v′) = sup v′∈V\{0V} sup v∈V\{0V} a(v, v′) = sup (v,v′)∈S×S′ a(v, v′). De fato, o que vamos provar o seguinte resultado. Lema 12.1 Considere conjuntos A, B e uma função h : A× B→ R+. Então: sup a∈A ( sup b∈B h(a, b) ) = sup (a,b)∈A×B h(a, b). Prova: Chame de S o supremo do lado direito. Veja que, por definição: ∀a ∈ A ∀b ∈ B : h(a, b) ≤ S e portanto, para cada a ∈ A fixo, S é cota superior para os valores de h(a, b), b ∈ B. Deduzimos que ∀a ∈ A : sup b∈B h(a, b) ≤ S e portanto sup a∈A sup b∈B h(a, b) ≤ S. 181 Agora observe que para todo (a, b) ∈ A× B, h(a, b) ≤ sup b′∈B h(a, b′) ≤ sup a′∈A sup b′∈B h(a′, b′). Ou seja, sup a′∈A sup b′∈B h(a′, b′) é cota superior para os valores de h(a, b), (a, b) ∈ A× B. Deduzimos que sup a′∈A sup b′∈B h(a′, b′) ≥ sup (a,b)∈A×B h(a, b) = S. 2 2 Podemos agora concluir esta subseção com um exercı́cio e um teorema. Exercı́cio 12.2 Mostre que L2(V, W) é um espaço vetorial e que ‖ · ‖V2→W é uma norma sobre este espaço. Teorema 12.1 A aplicação que associa cada T ∈ L(V,L(V, W)) a BT ∈ L2(V, W) é um isomorfismo de espaços lineares normados. Isto é, “T 7→ BT”é uma bijeção linear e ∀T ∈ L(V,L(V, W)) : ‖T‖V 7→L(V,W) = ‖BT‖V2→W . Prova: Este teorema basicamente já foi provado acima. Falta apenas juntar os pedaços. O último exercı́cio mostra que (L2(V, W), ‖ · ‖V2→W) é um espaço vetorial normado. O exercı́cio 12.1 nos diz que “T 7→ BT” é bijeção linear (e portanto tem inversa linear). Finalmente, a proposição 12.1 garante que esta transformação preserva normas. 2 12.2.2 A segunda derivada é bilinear Recorde que estávamos considerando a segunda derivada de f : U ⊂ V → W. Tudo o que acabamos de ver nos diz que temos duas formas completamente equivalentes de pensar na segunda derivada. • D(D f )(x) é uma transformação linear limitada de V em L(V, W); • D2 f (x) é uma transformação bilinear de V2 em W. Isto nos permite escrever que D(Df )(x)(h1) h2 = D2 f (x) (h1, h2). De fato, no lado esquerdo da expressão pensamos em D(D f )(x) ∈ L(V,L(V, W)). Aplica- mos este objeto a h1 e obtemos D2 f (x)(h1) ∈ L(V, W), aı́ tomamos o resultado, que é uma transformação linear, e o aplicamos a h1. Do lado direito, D2 f (x) é simplesmente vista como 182 transformação bilinear. Um fato que será importante a seguir é que toda forma bilinear limitada tem uma derivada. Para isso, é bom lembrar de que, como já vimos anotes, o conjunto V2 := {(v1, v2) : v1, v2 ∈ V} tem uma estrutura natural de espaço vetorial (com operações coordenada a coordenada) e pode ser dotado da norma ‖(v1, v2)‖V2 = ‖v1‖V + ‖v2‖V ((v1, v2) ∈ V2). Proposição 12.2 Toda B ∈ L2(V, W) é diferenciável e DB(v1, v2) (h1, h2) = B(v1, h2) + B(h1, v2) ((v1, v2) ∈ V2, (h1, h2) ∈ V2). 12.2.3 Simetria da segunda derivada (quando contı́nua) Agora vamos mostrar que, sob condições de continuidade, a derivada segunda é simétrica em seus argumentos. Proposição 12.3 Suponha que D2 f : U → L2(V, W) é contı́nua em x ∈ U. Então D2 f (x) é simétrica, isto é: ∀v, v′ ∈ V : D2 f (x) (v, v′) = D2 f (x) (v′, v). Prova: Como U 3 x é aberto, podemos achar um aberto A ⊂ R2 contendo 0R2 onde a função φ : A ⊂ R2 →W abaixo está bem definida. φ(t, s) := f (x + tv + sv′)− f (x + sv′)− f (x + tv) + f (x) ((t, s) ∈ R2). Mostraremos que φ(t, s) ts → D2 f (x)(v′, v) quando t, s→ 0. Isto nos bastará porque, trocando os papéis de v e v′ (ou de t e s) em φ, também obtemos φ(t, s) ts → D2 f (x)(v, v′) quando t, s→ 0 o que nos dá a simetria desejada pela unicidade do limite. Considere então φ(t, s)− tsD2 f (x) (v′, v) = [ f (x + θ v + sv′)− f (x + θv)− θ sD2 f (x) (v′, v)] |θ=tθ=0 . Podemos cotar a norma deste termo usando a desigualdade do valor médio aplicada ao termo dentro do colchete como função de θ. É importante pararmos para fazer esta parte da conta com atenção. Pela Regra da Cadeia, a derivada em θ é exatamente: D f (x + θ v + sv′) v− D f (x + θv) v− sD2 f (x) (v′, v). 183 Agora veja que esta expressão pode ser reescrita como{ D f (x + θ v + sv′)− D f (x + θv)− sD(D f )(x) (v′) } v. onde aqui usamos o isomorfismo L(V,L(V, W)) ∼= L(V,L(V, W)) para passar de D2 f (x) ∈ L2(V, W) para D(D f )(x) ∈ L(V,L(V, W)). deste modo, D(D f ) f (x)(v′) ∈ L(V, W) correspondente. Esta passagem é conveniente para a conta, pois teremos que diferenciar D f : U → L(V, W) e a derivada D(D f )(x)L(V,L(V, W)) ocorrerá naturalmente. Voltando à conta acima, concluı́mos que: ‖{D f (x + θ v + sv′) v− D f (x + θv) v− sD(D f )(x) (v′)} v‖W ≤ ‖v‖V ‖D f (x + θ v + sv′)− D f (x + θv)− sD(D f ) f (x) (v′)‖L(V,W) Portanto, pela desigualdade do valor médio. ‖φ(t, s)− tsD2 f (x) (v′, v)‖W ≤ |t| sup0≤θ≤t ‖D f (x + θ v + sv′) v− D f (x + θv) v− sD(D f )(x)(v′).v‖W ≤ |t|‖v‖V sup0≤θ≤t ‖D f (x + θ v + sv′)− D f (x + θv)− sD(D f )(x) (v′)‖V→W . Observe agora que para cada θ ∈ [0, t] fixo, podemos aplicar a desigualdade do valor médio a D f (x + θ v + sv′)− D f (x + θv)− sD(D f )(x) (v) = [D f (x + θ v + ηv′)− η D(D f )(x)] |η=sη=0 como função de s, obtendo: ‖[D f (x + θ v + ηv′)− η D(D f ) f (x)] |η=sη=0 ‖V→W ≤ |s| sup 0≤η≤s ‖D(D f )(x + θ v + ηv′)(v′)− D(D f )(x)(v′)‖L(V,W) (norma V → L(V, W)) ≤ |s|‖v′‖ ‖D(D f )(x + θ v + ηv′)− D(D f )(x)‖V→L(V,W) use L2(V, W)) ∼= L(V,L(V, W)) = |s|‖v′‖ ‖D2 f (x + θ v + ηv′)− D2 f (x)‖V2→W ≤ |s| ‖v′‖V sup |x′−x|≤|t|‖v‖+|s|‖v′‖ ‖D2 f (x′)− D2 f (x)‖V2→W já que x′ := x + θ v + ηv′ está sempre a distância no máximo |t|‖v‖+ |s|‖v′‖ de x para os valores de θ e η considerados acima. Deduzimos: ‖φ(t, s)− tsD2 f (x) (v′, v)‖W ≤ |ts| ‖v‖V‖v′‖V sup |x′−x|≤|t|‖v‖+|s|‖v′‖ ‖D2 f (x′)− D2 f (x)‖V2→W . Dividindo por |ts| dos dois lados, obtemos:∥∥∥∥φ(t, s)ts − D2 f (x) (v′, v) ∥∥∥∥ W ≤ ‖v‖V‖v′‖V sup |x′−x|≤|t|‖v‖+|s|‖v′‖ ‖D2 f (x′)− D2 f (x)‖V2→W t,s→0→ 0 porque |t|‖v‖+ |s|‖v′‖ vai a 0 e D2 f é contı́nua em x, por hipótese. 2 184 12.2.4 Derivadas parciais de ordem 2 Finalmente, colecionamos aqui algumas observações sobre a relação entre D2 f (x) e as derivadas parciais de ordem 2 quando V = Rd e W = R (tudo pode ser estendido a W = Rk se trabalhamos coordenada a coordenada). Há uma bijeção entre formas bilineares B ∈ L2(Rd, R) e matrizes A ∈ Rd×d. De fato, a cada B podemos associar a matriz A de entradas Ai,j := B(ei, ej) e aı́ a bilinearidade implica B(v, v′) = v · Av′. No nosso caso, queremos estudar a matriz correspondente a D2 f (x). Como esta é a derivada do gradiente ∇ f (x), esperamos que, se D2 f (x) existe, ela corresponda às derivadas parciais ∂i∂j f (x) das coordenadas de ∇ f (x). Logo, a matriz correspondente a D2 f (x) é deve ser a matriz Hessiana, das derivadas parciais de ordem 2. Façamos este passo em detalhes. Suponha que D f (·) existe em todo U e que D(D f )(x) existe num determinado ponto x. Agora fize v, v′ ∈ Rd A relação entre derivadas de Fréchet e direcionais nos garante que: D2 f (x) (v, v′) = (D(D f )(x) v) = ( lim ε→0 D f (x + εv)− D f (x) ε ) v′. É um exercı́cio mostrar que podemos passar o v′ para dentro do limite. Quando fazemos isso, temos termos D f (x + εv) v′ = ∇ f (x + εv).v′ e D f (x) v′ = ∇ f (x).v′. Logo: D2 f (x) (v, v′) = lim ε→0 ( ∇ f (x + εv).v′ −∇ f (x).v ε ) . Ou seja, a existência de D2 f (x) garante que o limite acima existe para quaisquer v, v′ ∈ Rd. Tomando v = ei e v′ = ej, e lembrando que a j-ésima coordenada de ∇ f (x) é ∂j f (x), obtemos: ∇ f (x + εv).v′ −∇ f (x).v ε = ∂j f (x + εei)− ∂j f (x) ε e o limite da expressão acima é a derivada parcial da derivada parcial: ∂i∂j f (x). Concluı́mos: ∀1 ≤ i, j ≤ d : D2 f (x) (ei,j ) = ∂i∂j f (x); portanto, estas derivadas parciais de ordem 2 todas existem e concluı́mos que D2 f (x) corresponde à matriz Hessiana ∇2 f (x) = (∂i∂j f (x))di,j=1. Provamos a fórmula acima supondo que D2 f (x) existe. Como no caso das primeiras deriva- das, é possı́vel achar um teorema na direção contrária se supomos a continuidade das derivadas parciais de ordem 2. Exercı́cio 12.3 D2 f : U → L2(Rd, R) é existe e contı́nua se e somente se cada derivada parcial ∂i∂j f : U → R existe e é contı́nua. Mostre ainda que, sob estas hipóteses, a matriz Hessiana ∇2 f (x) é simétricxa para todo x ∈ Rd. 185 12.3 Derivadas de ordem maior que dois Vamos agora estudar como estender a relação entre derivadas de ordem 2 e formas bilineares para derivadas de ordem superior. Em linhas gerais, provaremos o seguinte. • As derivadas de ordem k ≥ 2 de uma função de V em W podem ser encaradas como transformações k-lineares de Vk em W. • Sob hipóteses de continuidade, estas derivadas são simétricas em seus argumentos. • Se V = Rd, W = R e as derivadas parciais de ordem ≤ k são contı́nuas, então f é k vezes diferenciável. Como no caso de ordem 2, o primeiro passo é compreender o espaço em que “vivem” as derivadas de ordem k ≥ 2 dada. Mais uma vez teremos que lidar com isomorfismos e optamos por abordar logo de cara o trabalho sujo para dar conta dessa tarefa. 12.3.1 Onde vivem as derivadas e um kit para cuidar dos isomorfismos Como veremos, a derivada será definida por aplicação sucessiva da operação “D” seguida com isomorfismos, para terminarmos com uma transformação s-linear limitada entre Vs e W. Começamos definindo este espaço de transformações s-lineares limitadas. Definição 12.2 Dado s ≥ 1, uma função Q : Vs → W é dita s-linear se vale a seguinte propriedade: dados quaisquer (v1, . . . , vs) ∈ Vs e um ı́ndice i ∈ [s], a função Qi dada por Qi : ṽi ∈ V 7→ Q(v1, . . . , vi−1, ṽi, vi+1, . . . , vs) ∈W é uma transformação linear de V em W. Dizemos que Q é limitada se ‖Q‖Vs→W := sup (v1,...,vs)∈(V\{0V})s ‖Q(v1, v2, . . . , vs)‖W ∏si=1 ‖vi‖V < +∞. Chamamos de Ls(V, W) o espaço de todas transformações s-lineares limitadas de Vs em W. O resultado abaixo é um exercı́cio importante. Exercı́cio 12.4 Prove que Ls(V, W) é um espaço vetorial e que ‖ · ‖Vs→Wé uma norma sobre Ls(V, W). Prove ainda que, se W é Banach, então (Ls(V, W), ‖ · ‖Vs→W) também é completo. Para realmente definirmos a derivada e analisarmos as propriedades, estaremos obriga- dos a considerar expressões do tipo Ds1 Ds2 . . . Dsr f (x) e provar que elas são “isomorfas” a Ds1+···+sr f (x). Para começar, temos que provar e usar o fato que: Ls1(V,Ls2(V, . . . ,Lsr(V, W) . . . )) ∼= Ls1+s2+···+sr(V, W). Informalmente isto é simples. No final das contas, um elemento do lado direito pega de entrada uma s1-tupla em V; depois uma s2-tupla em V; depois . . . uma sr-tupla em V; e produz uma saı́da em W; tudo isso de forma linear em cada variável e contı́nua no geral. Isso dá no mesmo que pegar uma (s1 + s2 + · · ·+ sr)-tupla em V e levar em W de maneira multilinear e contı́nua. O trabalho aparece quando queremos descrever isso de forma precisa. Considere números r ∈ N\{0, 1} e s1, . . . , sr ∈ N\{0} com s1 + s2 + · · ·+ sr = s. Considere o espaço Ls(V, W) e o um segundo espaço S = S1 definido da seguinte forma: 186 1. Sr := Lsr(V, W), com a norma ‖ · ‖Sr := ‖ · ‖Vsr→W ; 2. para i = r− 1, r− 2, . . . , 1, Si := Lsi(V,Si+1) com a norma ‖ · ‖Si := ‖ · ‖Vsi→Si+1 , ou seja, Si = Lsi(V,Lsi+1(V, . . . ,Lsr(V, W) . . . )); 3. Finalmente, S := S1 = Ls1(V,Ls2(V, . . . ,Lsr(V, W) . . . )) com a norma definida acima. Dado T ∈ S1, queremos definir QT ∈ Ls(V, W) correspondente. Isso quer dizer que devemos definir, para cada v = (v1, . . . , vs) ∈ Vs, um valor QT v = QT (v1, . . . , vs) ∈W que corresponda de forma “natural” a T. Para isso, convém primeiro escrevermos: Vs ∼= Vs1 ×Vs2 × · · · ×Vsr ; isto é, a cada v = (vj)sj=1 ∈ Vs associamos: v(1) := (vj) s1 j=1 ∈ V s1 , v(i) := (vj) s1+···+si j=s1+···+si−1 ∈ V si (2 ≤ i ≤ r); e notamos que a aplicação levando v ∈ Vs em (v(1), . . . , v(r)) ∈ V1× · · · ×Vr é uma bijeção. Além disso, dado u = (uj)kj=1 ∈ Vk para algum k ∈ N\{0}, definimos mk(u) := ∏ k j=1 ‖uj‖V e notamos que: ∀v ∈ V : ms(v) = r ∏ i=1 msi(v (i)). Agora definimos QT v da seguinte forma. Como T ∈ Ls1(V,S2), o valor T v(1) ∈ S2 está bem definido. Como S2 = Ls2(V,S3), também podemos calcular (T v(1)) v(2) ∈ S3. Seguindo assim, chegamos a: QT v := (. . . ((T v(1)) v(2)) . . . ) v(r). Portanto, definimos, para cada v ∈ Vs, um valor QT v ∈ W. Isto é, QT : Vs → W. Abaixo relatamos algumas propriedades desta transformação. QT é s-linear. É um exercı́cio mostrar esta propriedade. De fato, isso segue da observação que “v(1) 7→ Tv(1)”é multilinear e que, para i = 2, . . . , r− 1, (. . . (Tv(1)) . . . ) v(i−1) ∈ Si = Lsi(V,Si+1), e portanto “v(i) 7→ [(. . . (Tv(1)) . . . ) v(i−1)] v(i)” é multilinear. O próximo passo é mostrar que QT é limitada e tem a mesma norma que T. 187 ‖T‖S1 = ‖QT‖Vs→W . Para isso, usamos repetidamente a nossa notação ms e o fato que podemos tomar o supremo na ordem que quisermos: ‖QT‖Vs→W = sup v∈(V\{0V})s ‖QTv‖W ms(v) (Vs ∼= Vs1 × · · · ×Vsr ) = sup v(i)∈(V\{0V}) si i=1,...,r ‖(. . . (Tv(1))v(2) . . . v(r−1))v(r)‖W ∏ri=1 msi(v(i)) . Considere o lado direito da expressão quando tomamos o supremo em v(r). Como (. . . (Tv(1))v(2) . . . )v(r−1) ∈ Lsr(V, W) = Sr, temos que: sup v(r)∈(V\{0V})sr ‖(. . . (Tv(1))v(2) . . . v(r−1))v(r)‖W msr(v(r)) = ‖(Tv(1))v(2) . . . v(r−1)‖Sr . Portanto, ‖QT‖Vs→W = sup v(i)∈(V\{0V}) si i=1,...,r−1 ‖(Tv(1))v(2) . . . v(r−1)‖Sr ∏r−1i=1 msi(v(i)) . Podemos repetir este raciocı́nio tomando agora o supremo em v(r−1) e lembrando que (Tv(1))v(2) . . . v(r−2) ∈ Sr−1 = Lsr−1(V,Sr). Obtemos: ‖QT‖Vs→W = sup v(i)∈(V\{0V}) si i=1,...,r−2 ‖(Tv(1))v(2) . . . v(r−2)‖Sr−1 ∏r−2i=1 msi(v(i)) . Repetindo este procedimento, chegamos a: ‖QT‖Vs→Q = sup v(1)∈(V\{0})s1 ‖Tv(1)‖S2 m1(v(1)) = ‖T‖S1 já que S1 = Ls1(V,S2). A aplicação que leva T ∈ S em QT ∈ Ls(V, W) é uma bijeção linear que preserva normas. Este também é um exercı́cio. A linearidade é bastante direta das definições e a preservação de normas já foi provada. A propriedade de bijeção vem de construirmos, para cada Q ∈ Ls(V, W), uma T ∈ S com QT = T. 188 12.3.2 A derivada de ordem k ≥ 3 Agora podemos definir a derivada de Fréchet de ordem k indutivamente. Definição 12.3 Considere V, W e U como acima e um certo k ≥ 2. Suponha que f : U → W é (k − 1)-vezes diferenciável. Se Dk−1 f é diferenciável em x0 ∈ U, chamamos de Dk f (x0) o elemento de Lk(V, W) correspondente a D(Dk−1 f )(x0) ∈ L(V,Lk−1(V, W)) pelo isomorfismo que definimos na subseção anterior. Em particular, notamos que: ∀v = (vj)kj=1 ∈ Vk : Dk f (x) v = (D (Dk−1 f )(x) v1) (vj)kj=2 Portanto, a derivada de ordem k é (isomorfa a) uma derivada de uma função Dk−1 f : U → Lk−1(V, W). Como a derivada direcional recupera a derivada de Fréchet (toda vez que esta última existe), temos que: D (Dk−1 f )(x) v1 = lim ε→0 Dk−1 f (x + εv1)− Dk−1 f (x) ε . Agora observe que, fixos (v2, . . . , vk), a operação que associa a Q ∈ Lk−1(V, W) a Q(v2, . . . , vk) é contı́nua (exercı́cio). Portanto, a equação acima mostra que: ∀v = (vj)kj=2 ∈ Vk : Dk f (x) (v1, . . . , vk) = lim ε→0 [( Dk−1 f (x + εv1)− Dk−1 f (x) ε ) (vj)kj=2 ] . (12.1) Esta identidade será usada para provar a proposição “óbvia” abaixo. Proposição 12.4 Dada f : U → W, com U ⊂ V aberto e V, W como acima, dados inteiros k ≥ 1 e s1, . . . , sr ≥ 1 com ∑ri=1 si = k, e dado um x ∈ U, as seguintes afirmações são equivalentes: 1. f é k− 1 vezes diferenciável em U e tem k-ésima derivada em x; 2. a derivada iterada Ds1−1Ds2 . . . Dsr f está definida em U e Ds1 Ds2 . . . Dsr f (x) existe. Quando estas derivadas em x existem, temos ainda que Ds1 Ds2 . . . Dsr f (x) ∼= Dk f (x), ou melhor dizendo: o isomorfismo Is1,...,sr que construı́mos entre S = Ls1(V, . . . ,Lsr(V, W)) e Lk(V, W) leva Ds1 Ds2 . . . Dsr f (x) em Dk f (x). Prova: Podemos provar isso por indução em k. Quando k = 1, temos s1 = r = 1 e não há o que provar. Agora considere o caso em que k > 1 e suponha que o resultado que queremos provar vale para k− 1. Provaremos que ele se estende também a k. Para isso, consideraremos s1, . . . , sr como no enunciado, mas trataremos apenas do caso em que s1 ≥ 2 (a demonstração para s1 = 1 é mais fácil). Usando a hipótese de indução, já sabemos que o isomorfismo Is1−1,s2,...,sr : Ls1−1(V,Ls2(V, . . .Lsr(V, W) . . . ))→ Lk−1(V, W) 189 leva Ds1−1Ds2 . . . Dsr f (x′) em Dk−1 f (x′) para cada x′ ∈ U. Portanto, ∀x′ ∈ U : Is1−1,s2,...,sr(Ds1−1Ds2 . . . Dsr f (x′)) = Dk−1 f (x). (12.2) Se queremos saber o que isto significa por extenso, podemos identificar Vk−1 ∼= Vs1−1 ×Vs2 × · · · ×Vsr e observar que (12.2) nos diz que, se v = (v(i))i=1 ∈ Vk−1 com v(1) ∈ Vs1−1 e cada v(i) ∈ Vsi (2 ≤ i ≤ r), temos que, para qualquer x′ ∈ U: Dk−1 f (x) (v(i))ri=1 = (. . . (D s1−1Ds2 . . . Dsr f (x′) v(1)) v(2) . . . ) v(r). Para abreviar isso, chamamos de G(x′) := Ds2 . . . Dsr f (x′) e deduzimos: Dk−1 f (x) (v(i))ri=1 = (. . . (D s1−1G(x′) v(1)) v(2) . . . ) v(r), (12.3) novamente para todos os x′ ∈ U. Repare que Is1−1,s2,...,sr é contı́nua, linear e inversı́vel com inversa linear contı́nua. Por esta razão, segue da Regra da Cadeia que o lado esquerdo de (12.2) é diferenciável em x se e somente se o direito é. Por fim, suponha que um dos lados é diferenciável (e portanto os dois são). Agora identifica- remos Vk ∼= V ×Vs1−1 ×Vs2 × · · · ×Vsr acrescentando um v(0) ∈ V à “lista” (v(i))ri=1 definida acima. Note que, pela equação (12.1), Dk f (x) (v(i))ri=0 = lim ε→0 ( Dk−1 f (x + εv(0))− Dk−1 f (x) ε ) (v(i))ri=1. Este limite pode ser calculado de outra maneira se recorremos a (12.3) (e usando novamente (12.1):( . . . ( Ds1−1G(x + εv(0))− Ds1−1G(x) ε v(1) ) v(2) . . . ) v(r) = (. . . (Ds1 G(x) (v(0), v(1)) ) v(2) . . . ) v(r). Portanto, Dk f (x) (v(i))ri=0 = (. . . (D s1 G(x) (v(0), v(1)) ) v(2) . . . ) v(r). Como (v(i))ri=0 ∈ Vk é arbitrário, deduzimos que Ds1 G(x) = Ds1 Ds2 . . . Dsr f (x) é o “isomorfo” de Dk f (x).2 Nosso próximo resultado significa que Dk f é simétrica sempre que é contı́nua como função de x ∈ U. Proposição 12.5 Suponha que f : U ⊂ V → W é k vezes diferenciável (com k ≥ 2) e que a função Dk f : U → Lk(V, W) é contı́nua em um certo x ∈ U. Então a derivada Dk f (x) também é simétrica, ou seja: ∀(v1, . . . , vk) ∈ Vk, Dk f (x) (v1, . . . , vk) é invariante por permutações de v1, . . . , vk. 190 Prova: Provaremos isto por indução em k ≥ 2. O caso k = 2 já foi discutido acima. Pense agora em k > 2 e suponha que a simetria já foi provada para k− 1. Observamos que o grupo de permutações de k elementos {v1, v2, . . . , vk} é gerado transposição de v1 e v2 e pelas permutações de {v2, . . . , vk}. Portanto, basta provar que Dk f (x) (v1, . . . , vk) é invariante por estas operações. Em primeiro lugar, observamos que ∀x′ ∈ U : Dk f (x)(v1, v2, v3, . . . , vk = (D2G(x′)(v1, v2)) (v3, . . . , vk), onde G(x′) := Dk−2 f (x′) (para x′ ∈ U). Como Dk f e D2G estão ligadas por um dos isomorfismos que construı́mos, e além disso Dk f é contı́nua em x, temos que D2G também é contı́nua em x. Portanto, esta segunda derivada é simétrica e temos: (D2G(x)(v1, v2)) (v3, . . . , vk) = (D2G(x′)(v2, v1)) (v3, . . . , vk) = Dk f (x) (v2, v1, v3, . . . , vk). Falta provar a simetria em (v2, . . . , vk). Para isso, usamos mais uma vez a equação (12.1): Dk f (x) (v1, . . . , vk) = lim ε→0 Dk−1 f (x + εv1) (v2, . . . , vk)− Dk−1 f (x) (v2, . . . , vk) ε . Como Dk f existe em todo x′ ∈ U, a derivada Dk−1 f (x′) é função contı́nua de x′ e portanto é simétrica em todos os pontos de U. Segue que a expressão “dentro do limite” acima é simétrica por permutações de (v2, . . . , vk). É um exercı́cio mostrar que esta propriedade se preserva no limite. 2 12.4 A fórmula de Taylor geral Nesta seção enunciaremos a fórmula de Taylor na sua versão mais geral para funções k vezes diferenciáveis. Teorema 12.2 Tome k ∈ N\{0}. Suponha que f : U ⊂ V → W é (k − 1) vezes diferenciável no conjunto U e que Dk f (x0) ∼= D(Dk−1 f )(x0) existe. Defina o polinômio de Taylor de f de ordem k ao redor de x0 como: Px0,k(h) := f (x0) + k ∑ j=1 1 j! Dj f (x) (h, . . . , h)︸ ︷︷ ︸ j vezes . Então: f (x0 + h) = Px0,k(h) + rk(h) onde rk(h)/‖h‖kV → 0W quando h→ 0V . Prova: Na verdade, provaremos um resultado bem mais forte. Dados um r > 0 com BV(x0, r) ⊂ U e um h ∈ V com ‖h‖V < r, escreva Rk(h) := Dk−1 f (x0 + h)− Dk−1 f (x0)− D(Dk−1 f )(x0) h ∈ Lk−1(V, W). 191 Note que ‖Rk(h)‖Vk−1→W/‖h‖V → 0 quando h → 0V porque Dk−1 f é diferenciável em x0. Nós provaremos por indução em k ≥ 1 que, se h 6= 0V , então: Objetivo: ‖rk(h)‖W ‖h‖kV ≤ sup θ∈(0,1] ‖Rk(θ h)‖ θ‖h‖V , o que certamente garante rk(h)/‖h‖kV → 0 quando h→ 0V . Base: k = 1. Este caso segue simplesmente da definição da derivada de Fréchet. Passo indutivo. Suponha que k ≥ 2 e o teorema vale para k − 1. Se ‖h‖V é suficientemente pequeno, de modo que x0 + th ∈ U para todo |t| ≤ 2, podemos definir γ(t) := f (x + th)− Px0,k(th) (t ∈ (−2, 2)). Vê-se que γ(0) = 0W porque Px0,k(0V) = f (x0). Por isso, ‖ f (x0 + h)− Px0,k(h)‖W = ‖γ(1)− γ(0)‖W ≤ sup t∈[0,1] ‖γ′(t)‖W . Para calcular γ′, observamos que d dt f (x + th) = D f (x + th).h, enquanto d dt Px0,k(th) = d dt k∑ j=1 tj j! Dj f (x) (h, . . . , h)︸ ︷︷ ︸ j vezes = k ∑ j=1 tj−1 (j− 1)! D j f (x) (h, . . . , h)︸ ︷︷ ︸ j vezes (isom.) = k ∑ j=1 tj−1 (j− 1)! [D j−1(D f )(x) (h, . . . , h)︸ ︷︷ ︸ j−1 vezes ].h = Qx0,k−1(th).h onde Qx0,k−1 é o polinômio de Taylor de ordem k− 1 da função D f : U → L(V, W). Portanto, se h 6= 0V , ‖ f (x0+h)−Px0,k(h)‖W ‖h‖kV ≤ supt∈[0,1] ‖[D f (x0+th)−Qx0,k−1(th)].h‖W ‖h‖kV ≤ supt∈[0,1] ‖D f (x0+th)−Qx0,k−1(th)‖V→W ‖h‖k−1V . Note que a expressão no supremo vale 0 em t = 0, logo podemos tomar um supremo sobre t ∈ (0, 1]. Assim, podemos trocar h por th no denominador e ter uma cota superior. Isso nos 192 traz ao caso k − 1 do resultado, com f substituı́da por D f . Aplicando a hipótese de indução, deduzimos que: ‖D f (x0 + th)−Qx0,k−1(th)‖V→W ‖th‖k−1V ≤ sup θ∈(0,1] ‖R′k−1(tθ h)‖ tθ‖h‖V onde R′k−1(h ′) := Dk−2(D f )(x0 + h)− Dk−2(D f )(x0)− D(Dk−2(D f ))(x0).h. Usando nossos isomorfismos com algum cuidado, podemos ver que R′k−1(h ′) tem a mesma norma que Rk(h′) e isso encerra a prova porque 0 < tθ ≤ 1 na expressão acima. 2 Exercı́cio 12.5 Como no caso da reta, há outras versões da Fórmula de Taylor. Uma delas é útil quando Dk f existe numa vizinhança de x0 e a função x 7→ Dk f (x) é contı́nua neste ponto x0. Mostre que, neste caso, para ‖h‖V suficientemente pequeno, f (x0 + h) = Px0,k(h) + Rx0,k(h) com resto ‖Rx0,k(h)‖W ‖h‖kV ≤ supa∈[x0,x0+h] ‖D k f (a)− Dk f (x0)‖Vk→W k! h→0V→ 0. 12.5 Mais exercı́cios Exercı́cio 12.6 Dada f : U ⊂ Rd → R, prove que f é Ck (Dk f (x) existe em todo x ∈ U e depende continuamente de x) se e somente se todas as derivadas parciais de ordem k de f estão definidas sobre todo o conjunto U e são funções contı́nuas. Mostre ainda que as derivadas parciais são simétricas (têm o mesmo valor para qualquer ordem que se tome as derivadas). Exercı́cio 12.7 Enuncie de forma precisa e prove o seguinte resultado: a composição de funções k vezes diferenciáveis é k vezes diferenciável. Exercı́cio 12.8 Volte à Proposição 11.4 e suponha agora que Dkxψ(t, x) existe e é contı́nua, para algum k ≥ 0. Prove que as funções Tψ e Fψ definidas na prova daquela proposição são k vezes diferenciáveis e calcule suas derivadas de ordem até k. Exercı́cio 12.9 Considere Q ∈ Lk(V, W) (com V e W “como sempre”e k ∈ N\{0, 1}) e defina f (v) := Q(v, v, . . . , v) (v ∈ V). Calcule as derivadas de todas as ordens desta função. Explique como a fórmula se simplifica quando Q é simétrica. Exercı́cio 12.10 Dados espaços vetoriais normados (V, ‖ · ‖V), (W, ‖ · ‖W), chame de Lsimk (V, W) o con- junto das transformações k-lineares e simétricas de Vk em W. Mostre que este conjunto é um subconjunto fechado de Lk(V, W). Mostre ainda que podemos definir sobre Lsimk (V, W) uma norma ‖ · ‖sim que é equivalente à restrição da norma usual de Lk(V, W) a este subespaço: ‖Q‖sim := sup v∈V\{0V} ‖Q(v, v, . . . , v)‖W ‖v‖kV . 193 Dica: para v ∈ V, escreva vk := (v, v, . . . , v) ∈ Vk. Mostre que existem m ∈N\{0} e {a(i)}mi=1 ∪ {α (i) j }1≤i≤m,1≤j≤k ⊂ R tais que, para quaisquer vetores v1, . . . , vk ∈ V e qualquer Q : Vk →W k-linear, Q(v1, v2, . . . , vk) = m ∑ i=1 a(i) Q ( ( k ∑ j=1 α (i) j vj) k ) . Depois explique porque a existência destes números implica que existe um Ck > 0 tal que ‖Q‖Vk→W ≤ Ck ‖Q‖sim para qualquer Q ∈ Lsimk (V, W). Exercı́cio 12.11 (“Regra de Leibniz” para derivada de Fréchet) Dados espaços vetoriais normados (V, ‖ · ‖V), (W, ‖ · ‖W) e (Z, ‖ · ‖Z); um aberto U ⊂ V; uma Q ∈ Lk(W, Z); e funções f1, . . . , fk : U → W. Defina uma nova função F : U → Z via: F(x) := Q( f1(x), . . . , fk(x)) (x ∈ U). Mostre que, se todas as fi são diferenciáveis num certo x ∈ U, então DF(x) existe. Além disso, calcule DF(x). Exercı́cio 12.12 Recorde o Teorema 11.5 acima, onde consideramos (X, ‖ · ‖X) Banach, o subconjunto aberto U ⊂ L(X) de operadores lineares inversı́veis e definimos Inv : U → U como a operação que associa cada operador inversı́vel a sua inversa. Agora defina , para cada r ∈ N\{0, 1}, uma operação Opr : L(X) 7→ Lr−1(L(X),L(X)) que associa a cada A ∈ L(X) a transformação (r− 1)-linear Opr(A) definida a seguir. Opr(A) (H1, . . . , Hr−1) := (−1) r−1 1 (r− 1)! ∑ σ∈Sr−1 AHσ(1)AHσ(2) . . . AHσ(r−1)A ((H1, . . . , Hr−1) ∈ L(X)r−1). 1. Prove que cada Opr é diferenciável e calcule a sua derivada. 2. Demonstre via regra da cadeia e indução que DkInv = Opk+1 ◦ Inv. (Uma dica é observar que, se esta fórmula vale para algum k, vê-se automaticamente que DkInv existe e pode-se usar derivadas direcionais para calculá-la.) 194 Capı́tulo 13 Pontos fixos, funções inversas, funções implı́citase EDOs Neste capı́tulo abordaremos um teorema bem abstrato e duas consequências importantes dele para o cálculo diferencial em espaços vetoriais. O que une estes temas é a necessidade de achar pontos em um espaço V com uma certa propriedade desejada. Nosso meio de fazer isso será procurar pontos fixos de certas operações. Exemplo 13.1 (Problema de Cauchy para EDOs) No Exemplo 4.7, vimos que o problema de achar uma solução para uma EDO é equivalente ao de achar um ponto fixo para uma certa função T : C(I, V)→ C(I, V). Exemplo 13.2 Imagine que f : U0 ⊂ V → V com U0 ⊂ V aberto. Na prova do Teorema da Função Inversa, que será vista abaixo, nos depararemos com o problema de provar que, sob certas condições em f , f (U0) é um conjunto aberto. Repare que este tipo de resultado é bem forte. Dada uma f bem pouco conhecida, um x ∈ U0 e um y = f (x) ∈ V, temos que provar que existe um raio positivo δ > 0 tal que todo ponto y′ ∈ BV(y, δ) tem uma preimagem em U0. Mas como podemos construir estas pré-imagens? Veremos que a maneira conveniente de fazer isso é achar um ponto fixo para uma certa operação. A mensagem deste capı́tulo é que há uma metodologia para estes problemas que funciona em muitos casos. Considere um espaço métrico (X, dX). Você precisa provar que existe um ponto x∗ ∈ X com certas propriedades. Uma estratégia é converter este problema no de achar um ponto fixo de uma transformação H : X → X e depois mostrar que o ponto fixo existe usando o Teorema do Ponto Fixo de Banach, provado logo a seguir. 13.1 O teorema do ponto fixo de Banach Nesta seção daremos o enunciado e a prova deste teorema de Banach. Primeiro, algumas definições. Definição 13.1 Dada H : X → X, um ponto fixo de H é um x∗ ∈ X com H(x∗) = x∗. 195 Abaixo usaremos a notação Hi := H ◦ H ◦ H ◦ · · · ◦ H︸ ︷︷ ︸ i vezes (i ∈N\{0}) com H0 := I a função identidade sobre X. O exercı́cio a seguir nos diz que os pontos fixos são exatamente os limites de órbitas {Hi(x)}i∈N Exercı́cio 13.1 Supondo que H é contı́nua e (X, dX) é completo, mostre que x∗ é ponto fixo de H se e somente se existe um x ∈ X com Hi(x)→ x∗ quando i→ +∞. Teorema 13.1 (Ponto Fixo de Banach) Suponha que (X, dX) é um espaço métrico completo e que H : X → X é tal que cada Hi é κi-Lipschitz (i ∈N). Suponha que M := +∞ ∑ i=0 κi < +∞. Então: (a) H tem um único ponto fixo x∗. (b) Hi(x)→ x∗ para qualquer x ∈ X. (c) dX(x, x∗) ≤ M d(x, H(x)) para qualquer x ∈ X. O uso deste teorema será fundamental no restante da seção. Observamos antes da prova um caso especial importante e dois exemplos que explicam as hipóteses do teorema. Exercı́cio 13.2 Mostre que as hipóteses do Teorema seguem quando H é κ-Lipschitz com κ < 1, já que neste caso podemos tomar κi = κi. Exemplo 13.3 Note que a hipótese de que (X, dX) é completo é fundamental. Por exemplo, considere X = R\{0} e H(x) = x/2 (x ∈ X). Exemplo 13.4 Neste exemplo mostramos que é possı́vel se ter X completo, H : X → X tal que ∀x, x′ ∈ X : dX(H(x), H(x′)) < dX(x, x′), mas tais que H não tem ponto fixo. Por esta razão, é importante que a constante de Lipschitz seja estrita- mente menor do que um. Tome X = [1,+∞) ⊂ R. Este é um conjunto fechado da reta e é, portanto, um espaço métrico completo com a métrica induzida por R. Defina H(x) = x + x−1 (x ∈ X). Observe que: ∀x, x′ ∈ X : |H(x)− H(x′)| = |x− x′| ∣∣∣∣1− 1xx′ ∣∣∣∣ < |x− x′|. Por outro lado, se existisse um ponto fixo x ∈ X, terı́amos x = x + x−1, o que dá x−1 = 0, o que é impossı́vel. Antes da prova, convém enunciarmos um lema simples. 196 Lema 13.1 Se (X, dX) é completo, então uma sequência {xi}i∈N ⊂ X satisfazendo ∑ i∈N dX(xi, xi+1) < +∞ é convergente. Além disso, ∀k ∈N : dX(xk, lim i∈N xi) ≤ ∑ i≥k dX(xi, xi+1). Prova: Fixando uma tal {xi}i∈N, mostraremos que ela necessariamente é Cauchy. Para isso, usaremos o fato de que a cauda de uma série convergente vai a zero: ck := ∑ i≥k dX(xi, xi+1) k→+∞−→ 0, Agora estimaremos a distância entre xk e x` com k < ` naturais. Veja que podemos aplicar a desigualdade triangular várias vezes e deduzir que: dX(xk, x`) ≤ dX(xk, xk+1) + dX(xk+1, x`) ≤ · · · ≤ `−1 ∑ i=k dX(xi, xi+1) ≤ ck, onde a última desigualdade segue do fato que todos os termos na série ck são não- negativos. A cota acima foi feita para k < `. Ela também funciona para k > ` se trocamos os papeis dos ı́ndices e certamente vale para k = `. Concluı́mos que: ∀k, ` ∈N : 0 ≤ dX(xk, x`) ≤ cmin{k,`}. Quando k, ` → +∞, cmin{k,`} → 0, portanto dX(xk, x`) → 0. Ou seja, a sequência {xi}i∈N é Cauchy, como querı́amos demonstrar. Como (X, dX) é completo, existe um limite x∗ para a sequência. Além disso, veja que, quando ` → +∞, x` → x∗; como ` ≥ k para todo ` grande, a estimativa acima nos permite deduzir: ∀k ∈N : dX(xk, x`) ≤ ck. 2 Prova: [Prova do Teorema de Ponto Fixo de Banach] Nosso primeiro passo é provar que, dado qualquer x ∈ X, {Hi(x)}i∈N converge a um x∗ ∈ X que satisfaz a desigualdade do item (c) acima. De fato, como (X, dX) é completo, sabemos do Lema acima uma condição suficiente para uma sequência {xi}i∈N ⊂ X convergir é que ∑ i∈N dX(xi, xi+1) < +∞. 197 Mais ainda, quando vale este critério, podemos usar a desigualdade triangular para obter: dX(x0, lim i∈N xi) ≤ ∑ i∈N dX(xi, xi+1). Aplicaremos tudo isso a xi := Hi(x), i ∈N, observando que neste caso dX(xi−1, xi) = dX(Hi−1(x), Hi−1(H(x))) ≤ κi−1 dX(x, H(x)) porque Hi−1 é κi−1-Lipschitz. Portanto, ∑ i∈N dX(xi, xi+1) ≤ ∑ i∈N κi dX(x, H(x)) = M dX(x, H(x)) < +∞ e temos tanto a convergência de {Hi(x)}i∈N a um x∗ quando a cota de (c) para dX(x, x∗). Isto conclui a primeira parte da prova. O restante da demonstração é basicamente uma série de observações simples. Veja que o argumento acima garante que pontos fixos existem: afinal, qualquer x∗ = limi Hi(x) é ponto fixo pelo exercı́cio 13.1. Para provar unicidade, provaremos que quaisquer dois pontos fixos x∗, y∗ são iguais. Primeiro notamos que, quando x∗ e y∗ são pontos fixos, então Hi(x∗) = x∗ e Hi(y∗) = y∗. Em particular, como M < +∞ isto vale para algum i ∈N com κi < 1/2. Mas então: 0 ≤ dX(x∗, y∗) = dX(Hi(x∗), Hi(y∗)) ≤ κi−1 dX(x∗, y∗) < dX(x∗, y∗) 2 ⇒ dX(x∗, y∗) = 0⇒ x∗ = y∗. Finalmente, juntamos os ingredientes. • O ponto fixo existe e é único, como pede (a); • Como cada sequência {Hi(x)}i∈N converge a um limite (pela primeira parte da prova) e este limite é um ponto fixo (pelo exercı́cio 13.1), temos que Hi(x) converge a x∗, o único ponto fixo de H, não importando qual seja x. Isto é a parte (b) do teorema. • Finalmente, a estimativa (c) foi provada no primeiro passo, onde tratamos x∗ como o limite de Hi(x) para um dado x. Como agora sabemos que este limite é o único ponto fixo, está encerrada a prova. 2 13.2 O teorema da função inversa Nesta seção provaremos um dos teoremas clássicos do Cálculo em várias variáveis: o teorema da função inversa. Convém enunciar uma definição antes de começar. Definição 13.2 Dados abertos U0, U1 ⊂ V, dizemos que f : U0 → U1 é um difeomorfismo de classe C` (` ∈N\{0}) se f é uma bijeção entre U0 e U1 e tanto f quanto f−1 são funções com derivadas contı́nuas até ordem `. 198 Os difeomorfismos são importantes porque são correspondências entre conjuntos que preser- vam não só cardinalidade (como seria se fossem só bijeções) ou topologia (como seria se f e f−1 são contı́nuos), mas também qualquer “estrutura diferenciável até ordem `”que podemos botar nos conjuntos U0 e U1. De fato, os “difeos” serão muito importantes na hora de falarmos de variedades. Uma observação simples é que, para que uma função f : U0 → U1 seja um difeomorfismo C1, é necessário que derivada de f seja um operador linear inversı́vel. De fato, supondo que f seja mesmo um difeo, podemos aplicar a regra da cadeia às expressões ∀x ∈ U0, f−1 ◦ f (x) = x e ∀y ∈ U1, f ◦ f−1(y) = y e descobrir que, dados x ∈ U0 e y = f (x) ∈ U1, D f−1(y)D f (x) = D f (x) D f−1(y) = IdV , o operador identidade de V. Desta forma, D f−1 = Inv ◦ D f ◦ f−1. Exercı́cio 13.3 Use a representação acima para D f−1 para provar o segunte resultado. Se f : U0 → U1 é bijeção de classe C` e a função inversa f−1 é diferenciável, então f−1 também é de classe C` (para ` = 1, isso segue do fato de que D f−1 é a composição de três funções contı́nuas. Por outro lado, a simples invertibilidade da derivada não é suficiente para garantir que f é um difeomorfismo. Exemplo 13.5 Considere a parametrização de U0 = U1 = R2\{0R2} por coordenadas polares. f : R2\{0} → R2\{0R2} (r, θ) 7→ (r cos θ, r sin θ). Podemos calcular a derivada de f na forma matricial através da matriz de derivadas parciais. D f (r, θ) = ( cos θ −r sin θ sin θ r cos θ ) . Como o determinante desta matriz é r > 0, D f (r, θ) é sempre inversı́vel. No entanto, f não é um difeomorfismo. De fato, ela não é nem mesmo uma bijeção, já que é periódica na segunda coordenada. O que o Teorema da Função Inversa é que a invertibilidade da derivada num único ponto x0 do domı́nio garante que f é um difeomorfismo local, ou seja, ao redor de x0. Teorema 13.2 (Teorema da função inversa) Considere um espaço vetorial normado completo (V, ‖ · ‖V). Suponha que U ⊂ V é aberto de V, que f : U →W é C`, ` ∈N\{0}. Suponha ainda que, para um certo ponto x0 ∈ U, D f (x0) é inversı́vel. Então há um aberto U0 ⊂ U com x ∈ U0 tal que: 1. U1 := f (U0) é aberto; 2. f |U0 : U0 → U1 é um difeomorfismo C`. 199 A prova será apresentada ao longo de vários lemas abaixo. Convem entender desde agora a intuição e a dificuldade técnica da prova. A intuição é simples. Localmente, f (x) se parece muito com a função afim y0 + T(x− x0), com y0 = f (x0) e T = D f (x0). Como T é inversı́vel, a função afim também é e tudo indica que f deve ter as mesmas caracterı́sticas numa vizinhança de x0. A maior dificuldade técnica da prova será provar que U1 é aberto. Para entender o desafio, imagine que você tem em mãos um y ∈ U1 = f (U0). Tudo o que sabemos, em princı́pio, é que y = f (x) para algum x ∈ U0. Para provar que U1 é aberto, precisamos encontrar um δ > 0 tal que todo y′ a distância < δ de y tem uma pré-imagem x′ em U0. Como poderemos fazer isso? A resposta curta será reformular o problema como se fosse um problema de ponto fixo. A prova do Teorema da função inversa será dada em várias etapas. A primeira é o lema a seguir, que formaliza a ideia que f (x) ≈ y0 + T (x − x0). (Manteremos a notação de que T = D f (x0) em toda a prova.) De fato, se tivéssemos f (x) = y0 + T (x− x0) exatamente, valeria T−1( f (x′)− f (x′′)) = x′ − x′′. Lema 13.2 Existe um r > 0 com U0 := BV(x0, r) ⊂ U onde f satisfaz a seguinte estimativa. ∀x′, x′′ ∈ U0 : ‖T−1( f (x′)− f (x′′))− (x′ − x′′)‖V ≤ ‖x′ − x′′‖V 2 . Prova: Sob as nossas hipóteses, x 7→ D f (x) é contı́nua e portanto x 7→ T−1D f (x) é contı́nua. Como T−1D f (x0) = T−1 T = IdV , existe uma vizinhança U0 = BV(x0, r) ⊂ U onde ‖T−1D f (x)− IdV‖V→V ≤ 1/2. Agora observe que U0 é convexo e que, pela desigualdade do valor médio, vale a seguinte desigualdade sempre que x′, x′′ ∈ U0: ‖T−1( f (x′)− f (x′′))− (x′ − x′′)‖V = ‖[T−1 f (z)− z]z=x ′ z=x′′‖V ≤ ( sup z∈[x′,x′′] ‖T−1D f (x)− IdV‖V→V ) ‖x′ − x′′‖V (‖T−1D f (x)− IdV‖V→V ≤ 1/2 em U0) ≤ ‖x′ − x′′‖V 2 . 2 O Lema acima tem diversas consequências. A principal delas é a seguinte. Corolário 13.1 A função f |U0 é bi-Lipschitz, isto é, existem constantes c0, c1 > 0 tais que: ∀x, x′ ∈ U0 : c0‖x− x′‖V ≤ ‖ f (x)− f (x′)‖V ≤ C0‖x− x′‖V . Em particular, se U1 = f (U0), f é uma bijeção Lipschitz com inversa Lipschitz entre U0 e U1. Prova: Segue do Lema anterior e da subaditividade da norma que: ∀x, x′ ∈ U0 : |‖T−1( f (x)− f (x′))‖V−‖x− x′‖V | ≤ ‖x− x′‖V 2 ou ‖x− x′‖V 2 ≤ ‖T−1( f (x)− f (x′))‖V ≤ 3 2 ‖x− x′‖V . Portanto, dados quaisquer x, x′ ∈ U0, ‖ f (x)− f (x′)‖V = ‖T T−1( f (x)− f (x′))‖V ≤ ‖T‖V→V‖T−1( f (x)− f (x′))‖V ≤ 3‖T‖V→V 2 ‖x− x′‖V 200 e ao mesmo tempo ‖ f (x)− f (x′)‖V ≥ ‖T−1( f (x)− f (x′))‖V ‖T−1‖V→V ≥ 1 2‖T−1‖V→V . Estas estimativas implicam que f |U0 é injetiva e portanto é uma bijeção entre U0 e U1 = f (U0). É um exercı́cio deduzir destas estimativas que f (restrita a U0) e f−1 são Lipschitz. 2 O próximo lema é a parte mais difı́cil da prova. É precisamente nele que usaremos o argu- mento de ponto fixo. Lema 13.3 U1 := f (U0) é aberto. Antes de provar o Lema, vejamos como ele implica o Teorema. Prova: [Fim da prova do Teorema da Função Implı́cita supondo o Lema 13.3] A partir daqui, suporemos que f : U0 → U1. Já vimos acima que ela é uma bijeção bi-Lipschitz e estamos supondo que U1 é aberto. O que nos falta, então, é provar é f−1 diferenciável, mas, pelo Exercı́cio 13.3, basta mostrar que f−1 é diferenciável. Fixe y ∈ U1 e x ∈ U0 com f (x) = y. Observe em primeiro lugar que, pela nossa escolha de U0, ∀x ∈ U0 : ‖T−1D f (x)− IdV‖V→V ≤ 1/2 < 1, logo T−1D f (x) é inversı́vel e D f (x) também é inversı́vel. Logo, se y = f (x) ∈ U1, a regra da cadeia (como exposta no inı́cio da seção) nos faz pensar que D f−1(y) deve ser igual a S := D f (x)−1. Provaremos abaixo que isso é verdade. Dado h tal que y + h ∈ U1, podemos definir uh com x + uh ∈ U0 tal que f (x + uh) = y + h. Como f é bi-Lipschitz, c0‖uh‖V ≤ ‖ f (x + uh)− f (x)‖V = ‖h‖V ≤ c1‖uh‖V com c0, c1 > 0 constantes. Por esta razão, uh 6= 0V se h 6= 0V . Por fim, temos as identidades: h = y + h− h = f (x + uh)− f (x) = S−1 uh + r(uh), onde r é um termo de resto, e f−1(y + h)− f−1(y)− S h = x + uh − x− S h = uh − Sh. Concluı́mos que ‖ f−1(y + h)− f−1(y)− S h‖V ‖h‖V = ‖uh − S h‖V ‖h‖V = ‖S (S−1uh − h)‖V ‖h‖V ≤ ‖S‖V→V ‖S−1uh − h‖V ‖h‖V = ‖S‖V→V ‖r(uh)‖V ‖h‖V (use ‖uh‖V ≥ c−10 ‖h‖V) ≤ c0‖S‖V→V ‖r(uh)‖V ‖uh‖V (use que h→ 0V implica uh → 0V) → 0 201 Estas equações mostram para nós que a derivada de f−1 em y é mesmo dada por: D f−1(y) = [D f ( f−1(y))]−1 (y ∈ U1). 2 Falta, então, provar o Lema 13.3. É o que faremos a seguir. Prova: [Prova do Lema 13.3] Tome y ∈ f (U0), y = f (x) com x ∈ U0. Precisamos mostrar que existe um δ > 0 tal que BV(y, δ) ⊂ f (U0). Isto é o mesmo que provar que Queremos: existe um δ > 0 tal que, sempre que y′ ∈ V e ‖y′ − y‖V < δ, existe um x′ ∈ U0 com f (x′) = y′. Nossa ideia será reinterpretar x′ como a solução de um problema de ponto fixo. Defina: H′y(x ′) := x′ + T−1(y′ − f (x′)) (x′ ∈ U). Podemos reformular nosso objetivo como sendo o seguinte: Veja que o problema de achar um ponto fixo de Hy′ é o mesmo de achar x′ com f (x′) = y. Por outro lado, uma propriedade boa desta função é que ela é automaticamente 1/2-Lipschitz, pelo lema anterior. ∀x′, x′′ ∈ U0 : ‖H′y(x′)− Hy(x′′)‖V = ‖(x′ − x′′)− T−1( f (x′)− f (x′′))‖V ≤ ‖x′ − x′′‖V 2 . (Isso explica, aliás, porque usamos T−1 f no Lema e na definição de Hy′ .) Tudo isto vale para qualquer y′ ∈ V. Nosso objetivo (reformulado) é mostrar: Queremos: existe um δ > 0 tal que, sempre que y′ ∈ V e ‖y′ − y‖V < δ, a aplicação Hy′ tem um ponto fixo. Iremos aplicar o Teorema de Ponto Fixo de Banach para resolver problema. Para aplicar o Teorema, basta garantir duas condições: 1. Hy′ é κ-Lipschitz, com κ < 1 (esta parte já está feita). 2. Hy′ leva um certo espaço métrico completo X em si mesmo. A questão então é como cumprir com a segunda exigência. Como y′ estará numa bola perto de y, é razoável esperar que sua pré-imagem esteja perto de x. De fato, escolhemos o domı́nio: X := BV [x, η], com 0 < η < r− ‖x− x0‖V . Note que X ⊂ BV(x0, r) porque x ∈ BV(x0, r). Além disso, X é um fechado num espaço vetorial completo, sendo, portanto, completo com a métrica induzida. Ainda falta verificar que Hy′ : X → X é uma transformação deste X em si mesmo. É aqui que a escolha do δ > 0, que ainda não especificamos, será importante. Mais especificamente, mostraremos que a escolha de δ := η 2‖T−1‖V→V funciona. 202