Baixe o app para aproveitar ainda mais
Prévia do material em texto
ISSN 0104-8910 CURSO DE MATEMÁTICA PARA ECONOMISTAS, CAPÍTULOS I E lI: FUNÇÕES, ÁLGEBRA LINEAR E APLICAÇÕES Rubens Penha Cysne Humberto lIe Athayde Moreira Junho de 1996 Curso de Matemática para Economistas Capítulos I e ÍI Funções, Álgebra Linear e Aplicações Rubens Penha Cysne Humberto de Athayde Moreira Junho de 1996 Endereço para Contato: Escola de Pós Graduação em Economia da Fundação Getulio Vargas Praia de Botafogo 190, 110. andar, Sala 1124 Rio de Janeiro - RJ - Brasil Telefone: 55-21-552-5099 Fax: 55-21-536-9409 e-mail: rubens@sede.fgvtj.br PREFÁCIO Rubens Penha Cysne Humberto Moreira Junho de 1996 Os autores objetivam, com este trabalho preliminar, bem como com aqueles que lhe darão continuidade, na seqüência de composição de um livro de matemática para economistas, registrar as suas experiências ao longo dos últimos anos ministrando cadeiras de matemática nos cursos de pós-graduação em economia da Fundação Getulio Vargas, da UFF (Universidade Federal Fluminense) e da PUC-RJ. Reveste-se de constante repetição em tais cursos a discussão sobre que pontos abordar, bem como com qual grau de profundidade, e em que ordem. É neste sentido que os autores esperam, com a seqüência didática que aqui se inicia, trazer alguma contribuição para o assunto. CAPÍTULO I CONCEITOS BÁSICOS, CONJUNTOS E FUNÇÕES Neste livro, salvo menção em contrário, utilizaremos as primeiras letras do alfabeto a, b, c, ... para designar números reais e as últimas x, y, w, z para designar vetores do mn . Em alguns casos x, y, z ... designarão também componentes de vetores, o que ficará claro no contexto utilizado. o símbolo 91 denota os números reais e mn as n-uplas de números reais; 91+ equivale a números reais não negativos (onde se inclui o zero) e 91++ a números reais positivos (onde não se inclui o zero). Esta simbologia estende-se às n-uplas: 91: denota uma n-upla de números reais todos não negativos, e 91:+ uma n-upla de números reais todos pOSItIVOS. Assim, ao denotarmos as n-uplas por x = (x\,x2 , ••• ,x n ), sendo cada Xi um número real (utilizaremos esta simbologia para nos referirmos às coordenadas de x), a afirmativa x E 91:+ equivale a afirmar-se que Xi > O para todo i = 1,2, ... , n. Valor absoluto e norma no mn Dado o número real a, utiliza-se a simbologia lal para denominar o maior dos valores entre a e - a. Lê-se lal = módulo de a. A regra de correspondência assim definida representa uma função definida no corpo dos reais e com valores no mesmo. Evidentemente, tem-se (1.2) lal = max {a, - a} ~a lal = max {a, - a} ~ -a Multiplicando-se (1.2) por -1 e utilizando-se (1.1) segue que as duas igualdades valendo se, e somente se a = o. De forma alternativa, r-a lal = ~ O l a sea <O sea =0 sea >0 (1.1) (1.3) Proposição 1.1: As seguintes propriedades são equivalentes: dados a, b E 91 e E > O 2 a) la- bl <E b)b-E<a<b+E Demonstração: 1 2 la- bl < E~E> a- b e E> -(a- b) ~E> a- b e 3 4 -E<a-b~E+b>a e b-E<a~b-E<a<b+E Explicações para as passagem no sentido ( ..... ): • A passagem 1 utiliza a definição de la - bl como o maxuno entre a - b e - ( a - b). Assim, se E é maior do que o máximo entre a - b e - ( a - b) então E deve ser simultaneamente maior do que ambos. Na passagem 2 multiplica-se a segunda parte da sentença anterior por -1, tomando-se o cuidado de inverter o sentido de desigualdade. A passagem 3 obtém-se somando-se b a ambos os membros das duas desigualdades Finalmente a passagem 4 se dá por um simples reordenamento da sentença anterior. As explicações para as passagens no sentido inverso (+-) devem ficar claras para o leitor. É claro também que a proposição 1.1 vale também para a desigualdade não estrita :5: . Proposição 1.1': Dados a E 9{ e E > O, as seguintes proposições são equivalentes: a) lal <E b) -E <a<E Demonstração: Faça b = O na proposição 1.1. • Interpretação Gráfica da Proposição 1.11: Dado a E 9{, o sentido de lal é a distância de a à origem. Assim, lal = la - ~ mede a distância de a ao ponto O (origem). Da mesma forma, para bEm, b * O, la - bl mede a distância de a ao ponto b. Assim, dado E > O a sentença la - bl < E equivale a dizer que a distância de a ao ponto b é inferior a E. Graficamente, se fixarmos b, isto significa que a pode representar qualquer ponto entre b - E e b+E. E E ,-A-,,-A-, I I I I b-E a. b (fixo) b + E 3 (figura 1.1) Proposição 1.2: Dados a, bem, vale que la + bl:5; lal +Ibl Demonstracão: Segue da definição apresentada da função módulo que -Ial :5; a :5; lal -Ibl :5; b :5; Ibl Somando-se estas desigualdades membro a membro, tem-se -(Ial + Ib!) :5; a + b :5; la! + Ibl ~ la + bl :5; lal + Ibl . Observe que, da mesma fonna, la - bl :5; lal + Ibl Norma Euclidiana Da fonna mais abstrata possível, uma nonna (11 x 11 lê-se nonna de x) é uma função real definida num espaço vetorial V real ou complexo, satisfazendo às seguintes propriedades : 1) IIÂ.xll = I~ Ilxll para qualquer escalar  e qualquer x E V . 2) Se x 7: 0, Ilxll > O. 3) Ilx + yll :5; Ilxll + IIYII para quaisquer x e y E v. Usualmente trabalhamos no espaço mD com a mesma nonna euclidiana, dada por: Deixamos ao leitor o encargo de verificar que tal definição de nonna (chamada nonna euclidiana) satisfaz às três propriedades listadas acima. Observações: 1) Quando n = 1, Ilxll = & = Ixl 2) Tal como no caso da função valor absoluto, a idéia da função nonna definida no mn e com valores em m+ é de distância de um ponto à origem. Exemplo: Seja x = (3,4). Então II xii = (32 +42 )112 = 5. 4 X 1---...... 4 3 (figura 1.2) Observe-se que IIx II é o comprimento da hipotenusa do triângulo retângulo aqui desenhado , que equivale à distância do ponto (vetor) x à origem. Duas normas em m", 11.11,11.11' são ditas equivalentes se existem a> O, b > O tais que a Ilxll ~ Ilxl!' e b Ilxl!' ~ Ilxll , \;Ix E mn • Exemplo: Define-se no m" duas outras normas importantes: a) norma do máximo I!.IIM : IlxllM = max{lxil; i = 1, ... ,n}, x = (xp ... ,X") Em". " b)normadasomalll :IIxlls= L Ixil,x =(x\, ... ,X")Em". i=\ Não é dificil mostrar que a norma do máximo e a norma da soma são equivalentes. Basta observar que II xii. ~ n IlxllM e IlxllM ~ II xii. ' \;Ix E mn Não há de fato nenhuma particularidade nestas normas devido ao ponto seguinte: Proposição 1.3: Quaisquer duas normas no m" são equivalentes. Esta proposição é muito importante, pois para questões de limite e topologia não importará com que norma nós vamos trabalhar. Utilizaremos a que for mais conveniente em cada momento. Lógica O homem geralmente se expressa através da linguagem. Assim, o estabelecimento sistemático das disciplinas dedutivas está muito ligado ao problema da linguagem. A linguagem corrente, por ser vaga e ambígua, não é adequada ao tratamento científico. Por isso necessitamos, para o tratamento da matemática, de uma linguagem mais adequada chamada linguagem simbólica. Nesta linguagem destaca-se o uso do termo (expressão que nomeia ou descreve algum objeto) e do enunciado (expressão que correlaciona objetos, descreve propriedades de objetos, etc ... ) 5 Exemplo: r x I x+y Tennos: ~ cI> l{3,5,7} r x+2=4 la>b enunciado: ~ 7 l <x x2 -5x+6=O , Chamaremos de enunciado aberto qualquer expressão que contém variáveis. Entendemos por variável ou indeterminada um elemento que pode assumir qualquer valor dentro de um conjunto de escolhas. Caso contrário, chamaremos de enunciado fechado ou sentença ou proposição. Assim como na linguagem corrente, são necessárias regras que permitam agrupar as expressões que formam termos e enunciados nalinguagem matemática. Algumas partículas fundamentais ou átomos da linguagem são destacadas abaixo: Funtores: Formam termos a partir de termos ex.: +, x, -, U, n. Juntores: Fonnam enunciados a partir de enunciados. ex.: não; e; ou; se ... então; se, e somente se. Predicados: Fonnam enunciados a partir de termos. ex.: E, =, :),C,<,>. Operadores: • Quantificadores: Formam enunciados a partir de enunciados. Sua principal propriedade é transformar enunciados abertos em enunciados fechados. Exemplo: Qualquer que seja (\7'), existe (3) Vejamos agora o uso de cada juntor: o juntor não (simbolicamente -): dado um enunciado p, pode-se formar o enunciado - p, dito a negação de p. A tabela de valores lógico é dada a seguir: p -p V F F V o juntor ~: dados dois enunciados quaisquer p e q pode-se formar o enunciado "p e q" dito conjunção de p e q. A conjunção só é verdadeira se os componentes são verdadeiros. A seguir é dada a tabela de valores lógicos para a conjunção: 6 v v V F F V F F o juntor ou: dados dois enunciados quaiquer p e q pode-se fonnar o enunciado "p ou q" chamado disjunção desses enunciados. Sabemos que na linguagem corrente existem, pelo menos, dois usos distintos do juntor ou : o uso no sentido exclusivo e o uso no sentido não exclusivo. Vejamos exemplos: 1) Antônio irá de carro ou de ônibus. 2) Antônio passou no exame porque estudou ou porque estava calmo. Em (1) caracteriza-se o uso exclusivo do ou. Já em (2) temos o uso não exclusivo do ou. O sentido do ou que usaremos no contexto da lógica matemática será o sentido não exclusivo. A tabela de valores lógicos da disjunção é: V V F F V F V F V V V F O juntor se ... então (simbolicamente ~): dados p e q enunciados, p ~ q é dito ser a subjunção de p e q. Para melhor entendemos este juntor analisaremos o exemplo a segulr: Exemplo: Se fizer sol então Antônio irá à praia 1) Fez sol e Antônio foi à praia: podemos concluir que a afirmação acima não foi falseada pelo experimento em questão. 2) Fez sol e Antônio não foi à praia: pode-se concluir que o enunciado acima é falso. 3) Não fez sol: neste caso não importa se Antônio foi ou não à praia, concluimos que o enunciado acima é verdadeiro. 7 Assim, a tabela de valores lógicos da subjunção: p v V F F q V F V F V F V V Na sub junção p => q , o enunciado p é chamado de condição suficiente para q e q é chamado de condição necessária para p. o juntor se. e somente se (simbolicamente: <=»: dados p e q enunciados, p <=> q é chamado de bijunção de p e q. Será considerado como verdadeiro quando os constituintes tiverem o mesmo valor lógico. A seguir a tabela de valores lógicos para a bijunção. p q V V V F F V F F Um enunciado atômico é uma sentença declarativa contendo uma idéia que é falsa ou é verdadeira, mas não ambas. Um enunciado é chamado composto se é obtido a partir de enunciados atômicos, através do uso de juntores. Um enunciado composto é dito ser uma tautologia se é verdadeiro ao considerarmos todas as possíveis valorações dos seus componentes atômicos. Exemplo: p => p~ p ou - p~- p <=> p~ (p e q) <=> - ( - p ou - q) ~ p ou q <=> - ( - p e - q) ~ (p => q) <=> ( - q =>- p) Se um enunciado é uma tautologia, podemos substituir todas as ocorrências de um componente por outro enunciado e o enunciado resultante é ainda uma tautologia. Se p é uma tautologia, diz-se que - p é uma contradição. Dizemos que o enunciado p é logicamente equivalente ao enunciado q quando o enunciado p <=> q é uma tautologia. Assim, por exemplo (i) -(p e q) é equivalente a - p ou -q (ü) -(p ou q) é equivalente a - p e - q (ili) p => q é equivalente a - q => - p 8 Quantificadores: Como já definimos, os quantificadores transformam enunciados abertos em enunciados fechados. Vamos apresentar primeiro os quantificadores de forma intuitiva. Para isso, seja o conjunto X = {1,3,5, 7} e os enunciados abertos: p{x} ~ x é número ímpar q{x} ~ x é múltiplo de 3 r{x} ~ x ~ 10 Pode-se observar facilmente que: • Todo elemento de X satisfaz p. • Existe elemento de X que satisfaz q. • Não existe elemento de X que satisfaz r. Estas afirmações podem ser escritas simbolicamente como • 'dx(x E X ~ p{x}) .:3x(xEXeq{x}) • - :3x(x E X e r{x}) Observação: O quantificador ('d) é dito quantificador universal e os quantificadores :3 ( existe ) ,:3! ( existe apenas um ), são chamados de quantificadores existenciais. Os enunciados onde aparecem quantificadores são ditos enunciados quantificados. Vejamos agora as principais equivalências de enunciados quantificados. Para isto usaremos exemplos da linguagem corrente. Pode-se facilmente ver que: Todo brasileiro é feliz equivale a Não existe brasileiro que não seja feliz. simbolicamente (B coleção dos brasileiros e F a coleção das pessoas felizes): 'd x{ x E B ~ X E F) equivale a - :3 x( X E B e x ~ F) De forma geral valem as seguintes tautologias para uma preposição p : 'dx p<=>-:3x -p :3x p<=>-'dx -p e em seqüência são tautologias -:3xp<=>'dx-p -'dxp<=>:3x-p 9 Observação: Em todo enunciado quantificado devemos esclarecer qual é o conjunto onde as variáveis podem assumir valores. Este conjunto será chamado de conjunto uruverso. Conjuntos e Funções Formalmente conjuntos e elementos são conceitos prurutlVOS, isto é, sem definição. Empiricamente, um conjunto é constituído de objetos, chamados de elementos do conjunto. A relação entre elementos e conjuntos é a relação de pertinência. Assim quando x é um dos elementos que compõem o conjunto A, dizemos que x pertence a A e denotamos por x E A . Caso contrário, dizemos que x não pertence a A e denotamos por x !é A . Exemplos de Conjuntos: 1) ~ = {I, 2, 3, ... } conjunto dos números naturais 2) Z = { ... ,-2, -1, O, 1,2, ... } conjunto dos números inteiros 3) Q = {pI q~ p, q E Z, q :t:. O} conjunto dos números racionais 4) 91 = conjunto dos números reais Podemos descrever um conjunto enumerando seus elementos (por exemplo o conjunto dos naturais) ou caracterizando seus elementos por alguma propriedade exclusiva destes, i.e., {x~ x satisfaz p} onde P é uma propriedade. Por exemplo, o conjunto dos racionais entre O e 1 pode ser expresso como x E Q~ O ~ x ~ 1. O conjunto que não possui algum elemento será chamado vazio e denotado por cj>. A relação entre conjuntos é a relação de inclusão, isto é, dados A e B conjuntos, A está incluído ou contido em B (A c B) se x E A implicar x E B. Neste caso, dizemos que A é subconjunto de B. Caso contrário, A não está contido em B (A ct. B). Simbolicamente A c B <=> V x (x E A => X E B) e A ct. B <=> 3x(x E A e x!é B) (ou seja, A ct. B <=>- (A c B») 1) NcZ e ZcQ Exemplo: 2) Ao A l .. A 'I' C , qua quer que seja o conjunto De fato, se cj> ex. A então 3 XE cj> tal que x E A, o que não ocorre, pois cj> vazio não possui elementos. A relação de inclusão tem as seguintes propriedades: i) (Reflexiva): A c A, para todo conjunto A ü) (Transitiva): A c B e B c C c A c C iü) (Anti-simétrica): A c B e B c A => A = B (A = B, significa que A e B tem exatamente os mesmos elementos) 10 Dado um conjunto A podemos pensar no conjunto de todos os subconjuntos de A:P(A) = {B; B cAl chamado de conjunto das partes de A. É fácil ver que 4>, A EP(A). Vamos definir agora operações de conjuntos: - 1) Reunião: dados A e B conjuntos podemos definir o conjunto formado pelos elementos de A mais os elementos de B: AuB = {x; x E A ou X E B} chamado de reunião (ou união) de A e B. 2) Interseção: dados A e B conjuntos a interseção de A e B é o conjunto formado pelos elementos comuns a A e B: AIlB= {x,x E A e x E B} Quando A li B = 4>, dizemosque A e B são disjuntos. 3) Diferença: dados A e B conjuntos, a diferença entre A e B é o conjunto formado pelos elementos de A que não pertencem a B: A/B = {x; X E A e x ~ B} . Quando B c A, A/B chama-se o complementar de B em relação a A e denota-se por A-B=CAB. 4) Complementar: quando nos restringimos a considerar elementos pertencentes a um conjunto básico U, então o complementar de um conjunto A em relação a U será chamado simplesmente de complementar e denotado por A c . Abaixo listamos algumas propriedades da reunião interseção, reunião, diferença e complementar (cuja as demonstrações ficam a cargo do leitor): i) Aucj>=A ü)AuA=A üi)AuB=A<:>BcA iv) Au(BIlC) = (AuB)Il(AuC) A~=4> (Ac )" =A AIlA=A AcB<=:>Bc cAC AIlB=A<=:>AcB (AuB)" =Ac IlBc AIl(BuC) = (AIlB)u(AIlC) (AIlB)" = AC uBc Sejam a e b elementos. O par ordenado (a, b) é um conceito primitivo fomado pela ordenação dos objetos a e b. Alguns autores identificam (a, b) por {{ a}, {a, b}} e neste caso é claro que (a, b) não pode ser confundido com o conjunto {a, b}. Assim ( a, b) = ( c, d) <:> a = c e b = d . Dados A e B conjuntos, o produto cartesiano de A e B é o conjunto A x B formado pelos pares ordenados (a, b) tal que a E A e b E B, isto é, A x B = {( a, b); a E A e b E B} 11 Função Uma função é uma tema de objetos (f, A, B) onde A é um conjunto chamado de domínio da função, B um conjunto de contradomínio da função e f é a regra que associa a cada elemento de A um único elemento de B. Assim uma função é uma I - 'U - f: A ~ B '. I f A B d re açao uruvoca. sa-se a notaçao x ~ f(x)' ou sunp esmente: ~ ,on e para cada x EA, f(x) E B é o único elemento de B associado a x por f É conveniente referirmo-nos a f e não à tema (f, A, B), por comodidade, quando estão subentendidos os conjuntos A e B. Duas funções (f, A e B) e (f, A', B') são Igu8.1S quando A = A',B = B' ef(x) = f'(x), V x EA. o gráfico de uma função f: A ~ B é o conjunto G( f) = {( x, y) E A x B; Y = f( x)}. Segue-se que duas funções são iguais se, e somente se seus gráficos coincidem e ambas têm o mesmo contradomínio. Dadas f: A ~ B uma função, A'cAeB'cB,f(A')={f(x);XEA'} é a imagem do conjunto A' por f e f-I(B') = {x E A; f(x) E B'} é a imagem inversa do conjunto B' por f; f(A) é chamado simplesmente de imagem de f. Tipos de Funções Injetiva: f: A ~ B é uma função IDJetlva quando Vx, y E A, J(x) = J(y) =>x = y, i.e., x :t; y em A implica f (x) :t; f(y) em B. Sobrejetiva : f: A ~ B é uma função sobrejetiva quando Vy E B, :3 x E A tal que f(x) = y, i.e., f(A) = B. Bijetiva: f: A ~ B é uma função bijetiva quando é sobrejetiva e injetiva. Composição de Funções Dadas f: A ~ B e g:B ~ C funções, podemos definir a função composta gof:A ~ C tal que (gofXx) = g(f(x)), Vx E A. Observe que a composição de funções é associativa, mas em geral não é comutativa ( mesmo que o domínio seja igual ao contradomínio ); a composta de funções injetivas é também injetiva, o mesmo valendo para funções sobrejetivas. 12 A restrição de uma função f: A ~ B a um subconjunto A' c A é a função ~A':A' -> B definida por ~A'(x) = f(x}, \Ix EA'. Dado X:::> A, g:X -> B é a extensão de f quando g A = f. Dados f: A ~ B e g:B ~ A funções, g é uma inversa à esquerda para f quando gof = id A' onde idA: A ~ A é a função identidade, i.e., idA x = x, \/x E A. Analogamente, pode-se definir inversa à direita de f como h:B ~ A tal que foh=id B · Temos os seguintes resultados ( cuja a demostração ficará a cargo do leitor): "Uma função f: A ~ B possui inversa à esquerda ( respectivamente à direita) se, e somente se f é injetiva ( respectivamente sobrejetiva )". Uma função f: A ~ B é inversível quando existe g: B ~ A função tal que gof = id A e fog = id B • Neste caso, g chama-se a inversa de f Usaremos a notação f-I para a inversa g. Observe que as inversas à esquerda e à direita não são únicas, enquanto a inversa é única ( verifique esta afirmação ). Família Dado um conjunto A, uma família de elementos de A com índices em um conjunto I é simplesmente uma função x: I ~ A. O valor de x em um elemento à E I será denotado por xÀ. Assim a família pode ser denotada por (xJ ÀEI ou de forma mais simples por (xÀ) quando o conjunto I é subentendido. Exemplos 1) I = {I, ... , n} : uma família em A neste caso é denominada uma n-upla em A, ou seja, um elemento do cartesiano: A x. .. x A. '-'" n-~ 2) I=~ uma família em A neste caso é denominada uma seqüência em A. 3) Podemos considerar uma família de conjuntos: (AJ ÀE1 ' onde AÀ é um subconjunto de um mesmo conjunto universo U, para cada à E I . Define-se neste caso a reunião desta família como u A À = {x;::I à E I com x E A À} e a interseção desta família como ÀEI nAÀ={X;XEAÀ, \/ ÃEI}. ÀEI 13 Exercícios Resolvidos 1) Dados a, b e x reais e E > O prove que a) la-bl <E~lal-E<lbl <lal+E Solução: Segue da proposição 1.2 que lal = la - b + bl $; la - bl + Ibl ~ lal-Ibl $; la - bl Ibl = Ib - a + ai $; Ib - ai + lal ~ Ibl-Ial $; la - bl (1) (2) De (1) e (2), Ilbl-lall $; la - bl. De la - bl < E segue que Ilbl-lall < E e que - E < Ibl-Ial < E. Somando-se lal a ambas as equações obtém-se a desigualdade procurada. Ache os valores reais de x para os quais: b) f (x) = Ix-Si +lx-31 ~ 2 Solução 1: Segue da proposição 1.2 que Ix - Si + Ix - 31 ~ Ix - s - x + 31 = 2. Logo, a preposição vale \;Ix E 9t Solução 2:Se x>S então f(x»2 pois Ix-31>2 e o termo Ix-si é sempre positivo. Da mesma forma, se x < 3, f (x) > 2, pois Ix - Si > 2 e Ix - 31 > o. Por último, para 3 $; x $; S teremos Ix - si = S-x elx - 31 = x - 3 (pela definição da função módulo). Somando-se os termos obtém-se f (x) = S - x + x - 3 = 2. Assim, em qualquer caso, f(x) ~ 2. 2) Encontre x E m (se existir) que satisfaça: a) 12x-21=14x+31 Solução 1: Elevando ao quadrado, e lembrando que Ixl2 = x2, (2x-2)2 =(4x+3)2 ~ 12x2 + 32x + S = O . Daí obtêm-se as raízes solução XI = - ~,X2 = - %. . Solução 2: Caso 1: 2x-2 ~ O ~ x ~ 1 4x+3 > O 12x-21 = 2x-2, 14x+31 =4x+3 2x-2=4x+3 ~ x=-S/2 Solução do caso 1: {-SI 2}n[I,+oo} = 0 Caso 2: 2x - 2 < O ~ x < 1 4x + 3 ~ O ~ x ~ - 3 I 4 12x -21 = -2x +2 14x +31 = 4x +3 -2x +2=4x +3 ~ x =-1/6 Solução do caso 2: {-I I 6} n[-3 I 4, 1) = {-I I 6} 14 Caso 3: 2x - 2 < O ~ x < 1 4x + 3 < O ~ x < - 3 I 4 14x +31 = -4x -3,12x -21 = -2x +2 -4x -3=-2x +2 ~ x =-S/2 Solução do caso 3: {-SI 2}1I(-00,-31 4)11(-00,1) = (-SI 2} Solução do Problema: {-I I 6,-S I 2} IS Exercícios propostos 1) Prove que, dados c E 9t, dE 9t e e E 9t, tem - se: a) Ic + di :s; lei + Idl (proposiç ã> 1.2) b) Icdl = Ielldl c) Se d ;:t; 0, Ic / di = lei / Idl d) Ic - eI :s; Ic - di + Id - eI e) -Ic - di :s; leI-ldl :s; Ic - di Sugestões: a) Escreva as desigualdades 1.3 para c, para d, e em seguida some as desigualdades membro a membro (o que é permitido). Em seguida observe que, pela proposição LI', escrever-se -( lei + Idl ) :s; c + d :s; ( lei + Idl ) é equivalente a escrever-se Ic + di :s; lei + Idl· b) Observe que ICdl2 = (cd)2e que tanto Icdl quanto Icl.ldl são não negativos c) Repita b. d) Ic - el = Ic - d + d - el e) lei = Ic-d +dl 2) Denomina-se "Princípio da Indução" uma regra de demonstração de propriedades relativas aos números naturais. Este Princípio enuncia-se da seguinte forma: "Dada uma propriedade qualquer relativa aos números naturais verifique a) se ela é válida para o número natural 1; b) se, a partir da hipótese (chamada hipótese de indução) de que ela é válida para o número natural n pode-se provar que ela também é válida para o número natural n + 1. Caso (a) e (b) se confirmem, então esta propriedade é válida para todos os números naturais". Demonstre, usando o princípio da indução,que dado x)' x2 , ... , xn números reais (n E ~). a) Ix) +X2+···+Xnl:s;IX)I+IX21+.··+lxnl b) Ix) X2 ···Xnl = IX)IIX21···IXnl 3) Seja Sn a soma dos n primeiros números naturais. Demonstre por indução que S = n(n+I) n 2 4) Demonstre por indução a desigualdade de Beumoulli: Se x E 9t, n E~ e x ~ -1, (l+xt ~ I+nx 5) Verifique (caso existam) quais os valores de x E9t que satisfazem a: a) Ix-31<2 b) Ix-31+lx-21<I c) Ix-31+lx-21=I d) Ix-31 < IX-41 e) Ilx-II I < 3 f) IX-Illx-21 > 5 x-2 16 6) Define-se a distância entre dois vetores do 9tn x e y como d(x,y) = Ilx - yll. Calcule a distância entre os vetores: a) (1,2,3) e (5,6,7) b) (0,0,0) e (1,2,3) Faz sentido falar na distância entre x = (0,0,1) e y = (l,O)? 7) Sabendo-se que p e q são enunciados verdadeiros, verifique o valor lógico dos enunciados abaixo: i) ( (p e q) => r) => (p => (q => r)) ii) p => - q e r iii) ((p ou r) => q) => (r => p) iv) (p e q) => (p => - q) 8) Sabendo-se que p => q é um enunciado falso, qual valor deve-se atribuir a r para que o enunciado abaixo seja falso? (p ou q => r) => p e q 9) Usando a tabela dos valores lógicos, examinar a validade das conclusões: i) Se Antônio precisar de dinheiro reduzirá os gastos ou fará empréstimos. Sei que Antônio não fará empréstimos. Logo se Antônio não reduzir os gastos é porque não precisa de dinheiro. ü) Sabe-se que quando o déficit público sobe, a inflação sobe. Logo se o déficit público não subir então a inflação também não subirá. 10) Verifique quais dos enunciados abaixo são equivalentes ao enunciado: - (p ou q) => (q => r) i) - (q => p) =>- q ou r ii) (-pouq)=>-(qou-r) iii) - (- q ou r) => (q => p) iv) q => (p ou r) 17 11) Identifique os enunciados verdadeiros e os falsos. a) 3xp~(Vx(p~q)) b) 3x(pouq)~3x(peq) c) Vxp~3xp d) 3x(pouq)~3xpou3xq e) 3 x (p ~ p ou q) f) 3xq ~ Vx(p ~ q) 12) Dê o valor lógico dos enunciados abaixo, considerando o conjunto universo especificado em cada caso. a) V x (x < x + 1) b) Vx(2x2 +3x+ 1 = o) c) 3x{x = O) d) 3x 3y(x = 2y) e) Vx 3y(x+y=0) f) Vx 3y(y > x) g) 3x 3y(x < y) u=9t U=N U = {O, I} U = {0,I,2} U=Z U= {0,I,2} U=Z 13) Demonstre ou dê um contra-exemplo i) Sejam A,B conjuntos a) AuB=A~BcA b) AnB=A~AcB c) Au(BnC) = (AuB)n(AuC) d) An(BuC) = (AnB)u(AnC) ~~-~u~-~=~u~-~n~ f) AcB~Bc cAc g) (AnBY = AC uBc h) (AnBY = A C uBC i) AcB~AnBC =0 18 li) Sejam f:A~B função, X, YcA, Z,WcB conjuntos a) f(XuY) = f(X)uf(Y) b) f(Xí'I Y) c f(X)í'lf(Y) c) f(X)í'lf(Y) c f(Xí'I Y) d) X c Y <:) f(X) c f(Y) e) Z cW <:) f-l(y) C f-l(Z) t) r-1(CZ) = Cf-1(Z) g) f-l(ZUW) = f-1(Z)uf-1(W) h) f-I (Zí'lW) = f-1(Z)í'lr-1(W) 14) Dados A e B conjuntos, seja X um conjunto com as seguintes propriedades: i) X~A e X~B li) se Y ~ A e Y ~ B então Y ~ X Prove que X = AuB 15) Prove as seguintes afirmações: a) (AuB)xC=(AxC)u(BxC); b) (Aí'lB) x C = (Ax C)í'I(Bx C); c) (A-B)xC=(AxC)-(BxC); d) AcA',BcB':::::>AxBcA'xB' 19 , CAPITULO II , -ALGEBRA LINEAR E APLICAÇOES 1) Espaços Vetoriais, Ortogonalidade, Autovalores e Autovetores Em tennos infonnais, um espaço vetorial é um sistema algébrico abstrato cuja construção se deve a sua utilidade na solução de certos problemas. Particulannente, tal utilidade se dá quando se deseja considerar um conjunto de elementos que serão objetos de combinações lineares. Tal sistema algébrico constitui-se de a) um corpo de escalares que no nosso caso serão os reais ou os complexos; b) um conjunto V de objetos, chamados vetores; c) uma regra de soma destes vetores satisfazendo às propriedades (para quaisquer x, y, e z pertencentes a V): c 1) comutativa: x+y = ytx c2) associativa: x+(y+z) = (x+y)+z c3) existência do elemento neutro O: x+O = x para qualquer x em V c4) existência de simétrico aditivo: dado x E V, :J um elemento de V (que chamamos de -x), tal que x +( -x) = O d) uma regra de multiplicação de um vetor por um escalar, satisfazendo às propriedades (para a e b escalares quaisquer e x e y vetores quaisquer de V) : dI) 1.x = x d2) Associatividade: (ab)x = a(bx) d3) Distributividade em relação aos vetores: a(x+y) = art-ay d4) Distributividade em relação aos escalares: (a+b)x = art-bx Se o conjunto de escalares considerado for o corpo dos reais, o espaço vetorial considerado é dito um espaço vetorial sobre o corpo dos reais. De fonna genérica, se os escalares correspondem ao corpo K (veja a definição da estrutura algébrica "corpo" em algum livro de análise matemática ou álgebra), o espaço vetorial é dito um espaço "sobre o corpo K". Os exemplos mais usuais de corpo são os reais (9t)e os complexos (C). Um espaço vetorial importante é o espaço euclidiano n-dimensional, constituído de n-uplas de elementos de um corpo neste espaço; os vetores são somados somando-se coordenada a coordenada, o mesmo ocorrendo com respeito à multiplicação de um vetor por um escalar. flJND,\ÇAO GETULIO VAR(;AS .tBUOl ECA MARIO HF...~RlQUE SIMO~Sg. 20 Dado x = (Xt>X2, ... ,Xn) E 91n (O que significa dizer que x 1,x2 , ••• ,x" são números reais), y = (y I'Y 2' ···,Y ") E 91" , e a E 91, tem-se: x+ Y = (xl + Yt. x2 + Y2,···,xn + Yn) e ax= (axt.ax2, ... ,ax,,) o leitor pode verificar que estas operações satisfazem aos reqUlsltos c1- c4 e d1- d4 de um espaço vetorial. Diz-se que x e Y são vetores do espaço vetorial 91n , onde o elemento neutro da adição é o vetor 0= (0,0, ... ,0) e o simétrico aditivo de x = (xJ,x2, ... ,xn)é dado por (-xJ,-x2' ... '-xn). Outro exemplo de espaço vetorial, onde os elementos do conjunto (vetores) são funções, é o conjunto de todas as funções de um certo conjunto não vazio S sobre um dado corpo K. Se f e g são funções de S em K definem-se soma de dois vetores e a multiplicação de um escalar por um vetor neste espaço fazendo-se: (f + g)(x) = f(x) + g(x) (af)(x) = af(x), onde x ES e a EK (1) e (2) Sejam V um espaço vetorial sobre um corpo K e S c V não vazio. Dizemos que S é um subespaço vetorial de V se ele mesmo é um espaço vetorial com as operações induzidas do espaço vetorial. Ou equivalentemente, quando x, y E S e a, J3 E K implicar J3x + ay E S. Produto Interno, Ortogonalidade e Projeção Ortogonal Define-se produto interno no espaço euclidiano 91n como uma função que a cada dois elementos x e Y de 91n associa um número real (x ,y ). Tal função deve satisfazer às seguintes propriedades (para quaisquer vetores x, Y e z de 91n e qualquer real a): 1) (x,y+z) = (x,y)+(x,z) 2)(ax,y) = a(x,y) 3)(x,y) = (y,x) 4) Se x;to 0, (x,x) > ° Desigualdade de Cauchy - Schwarz: Seja V um espaço vetorial real com produto interno . Então: 21 I( x, y)1 ~ Ilxllllyll onde Ilxll = ~(x,x) Demonstração: Sejam A = Ilx112, B = I(x, y ~ e C = Ily112. Para todo real r, temos que ° ~ < x-ry, x- ry > = < x,x > -2r< x,y -> + r 2 < y,y >. A - 2 Br + Cr2 ~ 0, \I r E 9t Se C = 0, A ~ 2 Br, \Ir E 9t, logo B = ° Portanto, pOIS caso contrário teríamos um absurdo fazendo r suficientemente grande (por exemplo r > A/2B). Se C > 0, tome r = B/C na expressão acima obtendo então B2 ~ AC. Resumindo, B2 ~ AC se C = ° (pois neste caso B = O) e B2 ~ AC se C > O. Em qualquer caso, obtém-se a desigualdade de Cauchy-Schwarz. A definição mais usual de produto interno (chamado de produto interno euclidiano) consiste em se fazer, para x = (x 1 ,x 2'··· ,x n) e Y = (y 1 ,y 2'··· ,y n), (x ,y) = X 1Yl +X~2+···+X nY n Dois vetores x e y num espaço vetorial com produto interno são ditos ortogonais entre si se o seu produto interno é igual a zero. Assim, os vetores x = (0,1) e y = (1,0) são ortogonais pois (x ,y) = 1.0 + 0.1 = O. Define-se projeção ortogonal de um vetor y sobre um vetor x:;é{} como o pontocolinear ao vetor x de mínima distância do vetor y. O desenho abaixo ilustra este ponto: ) x Na figura, ExY é o ponto colinear ao vetor x à mínima distância do vetor y. Fica evidente na figura o porquê da denominação de ExY como projeção ortogonal de y sobre x. Um teorema que demonstraremos neste capítulo nos garante que, para que ExY seja o ponto colinear a x de mínima distância de y, é necessário e suficiente que Y - ExY seja ortogonal a x. Daí o nome projeção ortogonal. Em particular, já sabemos que ExY = ax , pois ExY é colinear a x .A questão que se coloca é: como calcular o valor de a ? Basta usar o teorema enunciado e a definição de ortogonalidade. Devemos ter 22 (y -ExY,x)=(y -ar,x)=O Das propriedades enunciadas de produto interno segue que ( ) () (y,x) y, x = ax, x => a = -( -) . X,x Passemos a um exemplo numérico: Seja x = (1,0) e y = (3,3) y(3,3) x (3,0) Intuitivamente, não é dificil perceber que ExY deve corresponder ao vetor (3,0). Usando a fórmula acima, ExY = a (1,0), onde a=(3.1 +3.0)/ 1.1 =3 Projecões Ortogonais Sobre Subespacos Gerados Seja W um subconjunto não vazio de um espaço vetorial V definido sobre um corpo K. Dados x), ... , x p vetores em V, uma combinação linear destes é qualquer vetor da forma a)x) +a2 x 2 + ... +apxp , ondea), ... ,ap EK. PeloquevimosantesWé um subespaço quando dados quaisquer x e Y em W e a, b escalares em K, ar + by pertencer a W. Desta definição, é imediato que todo subespaço deve conter a origem, pois em particular podemos tomar a = b = o. Dado um subconjunto finito C de um espaço vetorial V sobre o corpo K, define-se o subespaço gerado por C (W (C)) como o conjunto de todas as combinações lineares finitas de elementos de C. Diz-se que um conjunto de vetores C é linearmente independente (L. I. ) quando v), ... ,vn EC e a)v) +llzv 2 + ... +anv n =0 implica a) =a2 = ... =an =0. Caso contrário, diz-se que tal conjunto de vetores é linearmente dependente (L.D.). Um conjunto de 23 vetores é gerador do espaço vetorial V quando qualquer vetor de V pode ser escrito como uma combinação linear de um subconjunto (finito) de vetores deste conjunto. Por definição, uma base do espaço vetorial V é um conjunto gerador de V que seja linearmente independente. Uma base ordenada é uma base cuja ordem de seus elementos é bem definida, por exemplo, BI =; {(O, I), (I,O)} e B2 = {(1,0),(0,1)} representam duas bases ordenadas distintas de 9{2. Um espaço vetorial diz-se de dimensão finita quando admite um gerador finito. Caso contrário, diz-se que o espaço vetorial é de dimensão infinita. Nos espaços vetoriais de dimensão finita, a dimensão do espaço é dada pelo número de vetores de qualquer uma de suas bases. Tal definição é sempre precisa, pois o número de vetores de qualquer uma das bases de um espaço vetorial de dimensão finita é sempre o mesmo. Se (vl>"" v p) é a base ordenada de um espaço vetorial V sobre um corpo K, não é dificil mostrar que para cada vetor yEV existem únicos al>'" ap E K tais que y = aI v 1+' .. +ap v p; (aI"'" a p ) serão chamados de coordenadas do vetor y na base (v I , ... , v p) . Um problema que ocorre frequentemente em economia é o de encontrar um ponto num subespaço gerado por um conjunto de vetores do 9{n à mínima distância de um dado vetor y. Define-se este ponto à mínima distância de y no subespaço gerado como projeção ortogonal de y sobre o subespaço. É claro que se y pertencer ao subespaço gerado pelo conjunto de vetores, a solução é o próprio ponto y. Também não oferece qualquer dificuldade adicional o caso em que o conjunto de vetores geradores do subespaço é composto de um só vetor. De fato, este é exatamente o problema que resolvemos anteriormente ao achar o escalar a tal que ExY = ax. Vejamos agora como estender o problema ao caso em que o conjunto gerador do subespaço projetivo é formado por p (p > I) vetores. Para isto, utilizaremos o teorema I. I (cujo resultado já utilizamos explicitamente na solução do exercício anterior) e o teorema 1.2 abaixo: Teorema 1.1. Sejam W subespaço vetorial do 9{n e Xo E 9{n. y = Ewxo é o ponto a menor distância de Xo em W se, e somente se Xo - Y é ortogonal a W, i.e. (xo -y,x) = O, \Ix EW. Demonstração: Um ponto y EW será a projeção ortogonal de Xo em W, ou seja, o ponto em W à mínima distância de Xo se, e somente se lixo - yll ::;; lixo - xii, \Ix E W , ou ainda, se, e somente se lixo - yl12 ::;; lixo - (1- a)y + tn'~12, \Ix EW, \Ia E (0,1), visto que W é subespaço vetorial. Desenvolvendo esta desigualdade vem que 24 (Xo -y, Xo - y) ~ (Xo - y+a.(y- x), Xo - y+a.(y- x)) ~ 2a.(Xo -y,y-X)+a.2(y-x,y-X) ~ 0, 'Vx e W, 'Va. e (0,1). Dividindo por a. e depois fazendo a. tender a ° temos que (Xo - y,y-x)~O, 'Vx eW. Dado weW temos que y -we W (pois y eW e W é subespaço vetorial), logo tomando x = y - w e W devemos ter (xo - y, w) ~ 0, 'Vw e W. Novamente, por ser W um subespaço vetorial podemos substituir w por -w na desigualdade acima e obter (xo -y,-w) ~ 0, 'Vw eW, ou seja, (xo -y, w) ~ 0, 'VweW. Destas desigualdades segue-se que (xo -y, w) = 0, 'Vw eW, como queríamos demonstrar .• Teorema 1.2. Seja y um vetor do espaço vetorial 9ln , onde se define a função produto interno euclidiano. Seja W o subespaço gerado pelos vetores supostos linearmente independentes xI, X2 , ... , X P também pertencentes ao 9ln . Então, as coordenadas a},a2, ... ap do ponto em W à mínima distância de y (denominada projeção ortogonal de y sobre W) são determinadas pela equação matricial a=(ap a2, ... ,ap)'=(X'Xrl X'y ,onde a é o vetor de coordenadas com respeito à base {x I , X 2 , ... , x p } . Nesta equação, X é a matriz cujas colunas são os vetores XI' x2 , ... xp. Trata-se, portanto, de uma matriz n x p ; X' (p x n) é a transposta de X; X'X é uma matriz p x p e obviamente também a sua inversa, (X' X) -I. O símbolo ' sobre o vetor a indica que a é um vetor coluna p x 1. Demonstração: Denotando-se por EwYo ponto de W à mínima distância de y, temos, de acordo com o enunciado do teorema, EwY = alxl +a2x2+ ... +apxp. Pelo teorema 1.1, sabe-se que para que o vetor EwY seja o ponto de W à mínima distância de y é necessário e suficiente que y-EwY seja ortogonal a todo vetor de W. Isto ocorrerá, se, e somente se y-EwY for ortogonal a cada um dos vetores geradores do subespaço W. Assim, devemos ter, para i = 1,2, ... , p, (y - EwY,x j) = ° ~ (y -alxl - a2x2-···-apxp,xj)= ° (y,x j ) = aI (XI ,x j)+ a2 (x2,xj )+ ... +ap (xp,x j) 25 A validade desta última equação para i = 1,2, ... , P é equivalente ao sistema: f(XpX I) (X2,XI) ... (xp,xl) l- I (.X,.:~~.}(X'.:~~}:(~:'~:) I I I l (xl,xp) (x2,xp) ... (xp,xp) J f(XI,y) l I (x 2 ,y) I I········· I I········· I I········· I l (xp,y)J ou ainda, em notação matricial, e usando a simetria do produto interno euclidiano (xj,Xj) = (xj'X j), "i/ I,j = 1,2, ... ,p. (X'X) a = X'y Como os vetores XI' X2 , ... , xp são supostos linearmente independentes, as coordenadas da projeção de y sobre o subespaço W ficam unicamente determinadas (veja exercício resolvido desta seção). Neste caso, pode-se garantir que a matriz X'X acima (chamada matriz de Gram) é inversível, obtendo-se então a unicidade da determinação do vetor a : a = (X' X )-1 X' Y . Pelo que vimos, EwY = Xa, onde a = (X'XrIX'y. Temos então EwY = X(X'XrIX'y . • A matriz Z = X (X ' X rI X' acima é a matriz pela qual se deve pré-multiplicar o vetor y de forma a obter-se o seu ponto à mínima distância (projeção ortogonal) no subespaço W. Trata-se, por definição, da matriz, na base natural do 9ln , da projeção ortogonal sobre o subespaço W. Esta matriz Z deve ser idempotente pois, como Zy já é um ponto de W, a sua projeção ortogonal sobre W deve ser o próprio Zy (em outra palavras, o ponto em W à mínima distânciade um ponto que já está em W é o próprio ponto). Assim, devemos ter Z2y = Z(Zy) = Zy. De fato, Z2 = X(X' Xr l X' X(X' Xr l X' = X(X' Xr l X' =Z. Transformações Lineares, Autovalores e Autovetores Dados ~ e V2 espaços vetoriais definidos sobre um corpo K, uma transformação linear T de VI em V2 é uma função de VI em V2 satisfazendo T (ax- + y) = a T(x) + T(y) para quaisquer vetores x e y em V, e qualquer escalar (elemento do corpo) a. 26 Se T é uma transformação linear do espaço vetorial em si mesmo diz-se que T é um operador linear. No caso em que T leva vetores do espaço a elementos do corpo no qual o espaço está definido diz-se que T é um funcional linear. Seja V um espaço vetorial de dimensão finita e vI> v2 , ••. , VII uma base de V. Fixada esta base ordenada, existe uma e apenas uma matriz representativa de qualquer transformação linear T definida em V. A transformação linear T fica perfeitamente determinada pelos valores que assume numa base qualquer de V (exercício resolvido número 11). A matriz representativa (A) da transformação T na base (v I , V 2' ... , V n ) fica univocamente determinada pela regra: n TVj = a lj VI +a2j v2+···+anj Vn = Laij Vi i=1 (j = 1,2, ... , n) A matriz A é a matriz cuja j-ésima coluna representa as coordenadas, na base (vI> v2, ... , v n)' da aplicação de T sobre v j . Seja T um operador linear definido em um espaço vetorial V sobre o corpo K. Um valor característico (ou autovalor) de T é um escalar c em K definido de forma que Tx = ex para algum x -:t: 0, X E V. Se c é um valor característico de T e Tx = ex para x -:t: 0, diz-se que x é um autovetor associado ao autovalor c. Observe-se que Tx = cx para x -:t: ° implica que (T - cI)x = ° seja satisfeito para x -:t: 0, o que significa dizer que o operador T - cI é singular (não inversível). A correspondência biunívoca existente entre operadores definidos em espaços de dimensão finita e matrizes quadradas nos sugere a extensão do conceito de autovalores e autovetores também para matrizes quadradas. Se B = (XI' X2 , ... , xn ) é uma base ordenada de V e a matriz A é a matriz de T na base B (escreve-se A = [T] B ) então T - cI é inversível se, e somente se A - cI é inversível. Daí, se A é uma matriz n x n definida sobre um corpo K, diz-se que c é um autovalor de A quando para algum x -:t: 0, X E 9tn , Ax = cx. O vetor x neste caso é denominado autovetor associado ao autovalor c. É claro que c é valor característico de A se, e somente se det (cI-A) = ° (i.e., se a matriz quadrada cI - A é singular). Definindo-se ftc) = det (cI-A) como o polinômio característico de A (de ordem n), os autovalores podem ser encarados como raízes do polinômio característico de A. Devido a este fato os autovalores recebem também a denominação de valores característicos. Dado um operador T num espaço vetorial de dimensão finita V, como definir o seu polinômio característico? A resposta imediata seria: tome-se uma base ordenada de 27 V, acha-se a matriz representativa A de T nesta base e defina-se o polinômio característico de T como f(c) = det (cl - A). Só resta um problema: será que f(c) assim definido independe da escolha da base ordenada B tomada em V (e, consequentemente, da matriz representativa de T)? A resposta é positiva, o que nos permite adotar este procedimento. Vejamos um exemplo dos pontos aqui discutidos. Para isto seja T um operador linear em m2 cuja representação, na base canônica ordenada (ep e2 ) do m2 , seja dada pela matriz: rI ° l A=lo -d o polinômio característico associado a T(ou aA) é dado por c-I ° f(c) = det (cl - A) = ° c+l Tem-se quej(c) = ° para c = 1 e c = -1 sendo, portanto, 1 e -los dois auto- valores de T (ou A). Tomemos agoa c = 1 e façamos para x E m2 ,Ax = 1. x. Daí, (A - I) x = O. Temos então: onde (1,0) é um vetor solução para o sistema diferente de (0,0). Logo, (1,0) é um autovetor associado ao auto-valor 1. Se procedermos de forma semelhante, com c = -1 , concluiremos que (0,1) é um autovetor associado ao autovalor -1. o leitor obviamente perguntará se (r,O) e (O,r), onde r Em, não constituiria uma família de autovetores. A resposta é positiva. Observe aí que os autovetores obtidos são ortorgonais. Isto decorre do fato de A ser uma matriz simétrica. Se V é um espaço vetorial de dimensão finita sobre um corpo K, T:V~V é um operador linear e Â. é um autovalor de T pode-se mostrar sem dificuldade que SI = {x EV~ Tx = Â.x} é um subespaço de V chamado de autoespaço associado ao autovalor Â.. Mais ainda, se definirmos para cada k E~ Sk = {x E V~ (T - Â.I)k (x) = O} temos que Sk é um subespaço de V e S k c Sk+1. Como V tem dimensão finita deve existir ko E~ tal que Sk = Sko, Vk ~ ko. Neste caso, chamaremos Sko de autoespaço generalizado associado ao autovalor Â.. Pode-se provar que a união das bases dos autoespaços generalizados é uma base de V. 28 Diagonalização de Formas Quadráticas Dada uma matriz A * nx n, define-se no 9ln a função que a cada x E 9ln associa o valor x' A *x em 9l. Como exemplo, para Observe-se que o coeficiente de Xi x j na forma quadrática é dado por a~ + a ;i , sendo a~ e a;i elementos de A * . Se a~ ~ a;i pode-se sempre definir aij = a ji = (a~ + a;J / 2 e operar-se com a matriz simétrica A = (ai}) tendo-se ainda, neste caso, x' Ax = x~ *x. Ou seja, esta redefinição dos coeficientes não altera o valor da forma quadrática. Dada uma matriz A * = (~ ~) podemos substituí-la por A = G ~) e obter o mesmo valor para x'Ax ou x'A 'x, sendo a nova matriz A uma matriz simétrica. A passagem de uma matriz não simétrica A * a uma matriz simétrica A no manuseio algébrico de formas quadráticas mostrar-se-á muito adequada devido às úteis particularidades das matrizes simétricas no que diz respeito aos seus autovalores, autovetores, e diagonalização. No capítulo 3 deste livro utilizaremos o fato de algumas formas quadráticas definidas por uma matriz simétrica A n x n apresentarem sempre valores positivos (ou negativos ) para x~x, independentemente do vetor x E 9ln , x ~ O. A estas formas quadráticas (ou, equivalentemente, às matrizes simétricas que lhes dão origem), daremos o nome de positiva (ou negativa) definida. Esta caracterização será muito importante, por exemplo, no estudo de máximos e mínimos de funções de várias variáveis. Como caracterizar uma matriz simétrica como positiva definida (Xl Ax > 0, 'v'x ~ O), negativa definida (Xl Ax < 0, 'v'x ~ O) ou indefinida (quando x~x >0 para algum x E 9l ne y , Ay < ° para algum y E 9ln ) utilizando somente os seus autovalores, eis o problema ao qual nos dedicaremos no restante desta seção. 29 Para simplificar a análise, seja dada uma forma quadrática xj4x com x E 912 . Temos então, x'Ax. = ~)X)2 +(~2 +~))X)X2 +~xi. Tomemos três configurações rI Il r-I ol numéricas para a matriz A. Na primeira, A = II 2J' na segunda A = l O _de na terceira A = rI Il II -d· No '. . pnmetro caso, xj4x = xi +2x; +2x)x2 =(x) +X2)2 +x; >0 para todo x:;tO. No segundo caso, x' Ax = -x; - xi < O para todo x:;t O. E, no terceiro caso, xj4x = xi - x; + 2x) x2 , podendo ser negativa para, por exemplo, x = (xl, x2) = (1, -1) e positiva para x = (x) , x2 ) = (-1, -1). Pelo que vimos anteriormente, A é positiva definida no primeiro caso, negativa definida no segundo e indefinida no terceiro. Embora não possamos, sem recorrer a outros teoremas, classificar a matriz A apenas pela observação de seus elementos, uma coisa fica evidente. No caso em que A é uma matriz diagonal (ou seja, na qual todos os elementos fora da diagonal principal são iguais a zero), os termos cruzados x)x2 não mais aparecerão, restando apenas os termos em x~ e x;. Neste caso, poder-se-ia rI ol r-I ol afirmar de imediato que, por exemplo, A = lo d é positiva definida, A = lo -d rI Ol é negativa definida e A = lo _ d é indefinida (porquê? Obtenha a expressão para xj4x). Este será o caminho que trilharemos. Como x é um elemento qualquer do 91n , se trocarmos x por y = Qx, sendo Q uma matriz não singular, o contradomínio de xj4x será, evidentemente, o mesmo de yj4y. A afirmação se x' Ax > O, para \/x E91" ,x:;t O, equivale, neste caso à afirmação se y:;t O,y' Ay > O, \/y E91n . De fato, como Q é inversível x:;t O <=> y :;t O, e tanto x quando y podem representar qualquer vetor de 91D - {O}. Em outras palavras, uma forma quadrática definida positiva (ou definida negativa) permanece definida positiva (ou definida negativa) quando é expressa em relação a um novo conjunto de variáveis, desde que esta transformação de variáveis seja não singular (dê um exemplo que mostre que, se a transformação for singular, isto não mais ocorre). Uma solução para o problema de visualizar rapidamente a classificação de uma forma quadrática, consequentemente, consiste em obter uma transformação de variáveis y = Qx, Q não singular, tal que a nova matriz da forma quadrática, B = Q'AQ, seja uma matriz diagonal. Das técnicas de diagonalização de matrizes simétricas, decorre de imediato que a matriz Q que atende a este objetivo é a matriz cujas colunas são formadas por auto- vetores ortonormais da matriz A (prova-se em um dos exercícios resolvidos desta 30 seção, para uma matriz A simétrica e real nxn, que sempre é possível obter-se um conjunto de autovetores ortonormais de A que seja uma base do espaço 9tn ; prova-se também que os autovalores de A são todos reais). Neste caso a matriz B = Q'AQ é uma matriz diagonal em que os elementos da diagonal são os autovalores (todos reais) D de A. Neste caso, y By = L bjY~ , aparecendo somente os quadrados das variáveis, e j=i não mais os produtos cruzados YiYj (i:;; j). Decorre de tudo o que vimos que, através do conhecimento dos autovalores de uma matriz A, podemos imediatamente determinar se ela é definida positiva, definida negativa ou indefinida. (1) x'Ax será positiva definida se, e somente se todos os seus autovalores forem positivos. (2) x'Ax será negativa definida se, e somente se todos os seus autovalores forem negativos. (3) x'Ax será indefinida se, e somente se apresentar autovalores positivos e negativos. Exercício: Diz-se que x'Ax é positiva (negativa) semi-definida se x'Ax ~ O (~ O) para todo x E 9tn . Conclua da análise acima que x' Ax será positiva (negativa) semi- definida se, todos os autovalores de A forem não negativos (não positivos). 31 Exercícios resolvidos: Seção 1 1) Seja V o conjunto de todas as funções reais definidas em um conjunto não vazio X, isto é, V = {f; f: X ~ m}. Dadas f, g e V, k em, definimos f + g e lif em V tais que (f + g) (x) = f{x) + g(x) e (kf) (x) = kf (x) , \:Ix e X. Verifique que V com estas operações é um espaço vetorial real. Solução: Vamos verificar os axiomas que definem espaço vetorial. Observe que, nestas verificações, utilizaremos sempre as propriedades de um corpo, do qual os números reais são um caso particular ( ao se fazer f{x) +g(x)=g(x)+f{x) em (cl), por exemplo). cl) Sejam f, geV, então f+g, g+feV, e (f+g) (x) = f{x) + g(x) = g(x) + f{x) = (g + f) (x), \:Ix eX, ou seja, f+ g = g + f c2) Sejam f, g, h e V, tem-se que (f + g) + h e f + (g + h) são elementos de V por definição, além disso, para todo x e X, «f + g) + h) (x) = (f + g) (x) + h(x) = (f{x) + g (x» + h(x) = f{x) + (g(x) + h(x» = f{x) + (g + h) (x) = (f + (g + h) ) (x). Assim (f+g)+h = f+(g+h). c3) Seja O e V tal que O (x) = O, \:Ix e X. Para toda f e V temos (f + O) (x) = f (x) + O (x) = f (x), \:Ix e X. Assim f + O = f c4) Dado f e V, seja -f e V tal que (-f) (x) = -f (x), \:Ix e X. Segue-se que (f+ (-f) (x) = f (x) + (-f (x) ) = O = O (x), \:Ix eX, ou seja, f+ (-f) = o. dI) Para todo f eV, (1.f) (x) = 1. f(x) = f (x), \:Ix e X, logo 1.f= f d2) Dados a, b em,f eV, temos que «ab) f) (x) = (ab) f (x) = a (bf(x» = a.(bf) (x) = (a (bf) (x), \:Ix e X, donde (ab) f= a (bf). d3) Dados a em, f,g eV, temos que (a (f+ g» (x) = a.(f+ g) (x) = a (f (x) + g (x» = af(x)+ag(x) = (af) (x) + (ag) (x) = (af+ag) (x), \:Ix eX, ou seja, a (f+g) = af+ ag. d4) Dados a,h em, f eV, temos que «a +b) f) (x) = (a + b) f (x) = af(x) + bf(x) = (af)(x) + (bf) (x) = (af+ bf) (x), ou seja, (a + b) f= af+ bf 2) Determine se os seguintes vetores formam uma base do espaço m3 ( i) (1, O, 1), (1,3, O) (ii) (1, 1, 1), (O, O, 1) (1, O, 1) Solução: (i) Dado (O, 0,1) em3, suponha que existam a,h em tais que (O, 0,1) = a (1, O, 1) + b (1,3, O). Tem-se que 32 r a+ b = o ~ 3b=0 l a=1 ou seja, este sistema é imcompatível, pois não se pode ter ao mesmo tempo a = O e a = 1. Logo, não é possível escrever-se o vetor (O, O, 1) como combinação linear dos vetores (1, O, 1) e (1, 3, O), donde se conclui que (1, O, 1) , (1, 3, O) não é gerador (e, consequentemente, não é uma base) de ~3. O leitor mais familiarizado com Álgebra Linear terá imediatamente recordado que para se formar um gerador de ~ 3 são necessários no mínimo três vetores. (ii) Dado (x, y, z) E~3, tomemos a, b, c E~3 tais que (x, y, z) = a (1, 1, 1) + b (O, O, 1) + c(1, O, 1). Tem-se que x=a+c y=a z=a+b+c logo a=y b =z-x c =x-y Assim (x, y, z) = Y (1, 1, 1) + (z - x) (O, O, 1) + (x - y) (1, O, 1), 't(x,y,z) E~3, ou seja, {(1,1,1), (0,0,1), (l,0,1)} é gerador de ~3. Observe que se x = y = z = O, então a = b = c = O, implicando que estes vetores são também linearmente independentes e, consequentemente, formam uma base de ~ 3 . 3) No .exercício 1, faça X = ~ e diga se os seguintes vetores são linearmente independentes, onde: (i) I(t) = t 2 , g(t) = cost, h(t) = t (ii) f(t) = cos2 t, g(t) = sen2 t, h(t) = 4 (iii) f(t) = et , g(t) = sen t, h(t) = e2t Solução: (i) Sejam a, b, c tais que af + bg + ch = O, isto é, ae + b cost + ct = O, 'tt E ~. Em particular, 1) se t =0 então a . 02 + b . cos O + c . O = O ~ b = O { a+c=o 2) como b = O e fazendo-se t = 1 e t = -1 teremos O a-c= ~a=c=O Portanto, {f,g,h} é LI. 33 (ü) Como cos2 t + sen2 t = 1, \ft e 91 tem-se que 4 cos2 t+4 sen2 t-1.4 = O, \ft e 91, ou seja, 4f+ 4g - 4h = O. Isto implica que {f,g,h} éLD. (iü) Sejam a,b,c e9t tais que af + bg+ ch = O, ou seja a e t + b sen t + c e2t = O, \ft e 91. Sejam os seguintes "alores para t: 1) se t = O então a + c = O 2) se t = 7t então a ell + c e211 = O 11 3) se t = ~ então a e2 + b.1 + c ell = O a = -c ~ c - ce lr = O ~ c(l- elr ) = O ~ c = O ~ a = O Ir a e 2 + b + c elr = O ~ b = O Portanto, {e \ sen t, e2t } é LI. 4) Seja E um operador linear em V, V espaço vetorial, tal que E 2 = E. Neste caso E é chamado idempotente. Dada uma transformação linear T de um espaço vetorial V em outro espaço vetorial, define-se a imagem de T como o conjunto T (V) = {T(x);x e V}e o núcleo de T como N(T) = {x eV;T(x) = O}. Mostre que: i ) T (V), N (T) são subespaços vetoriais. ü)E(u)=u, 't/u eE(V) iii) Se E ~ I então E é singular (i.e., E é não inversível) Solução: i) Seja T:V ~ W uma transformação linear, onde Ve W são espaços vetoriais sobre um corpo K. Dados a eK, w), w2 e T (V) existem v)' v2 e V tais que T(v)=wp e T(v2 )=W2 , assim T(av) +v2 )=a T(v)+T(v2 )=aw) +w2, logo a w) +w2 e T(V). Portanto T(V) é subespaço de W. Por outro lado, dados aeK,v),v2 eN(T), tem-se que T(a v)+v2 )= aT(v)+T(v2 )=aO+0=0, isto é, aVI +v2 e N(T). PortantoN(1) é supespaço de V.I ü) Seja u eE(V), então existe v e V tal que E (v) = u. Logo E(u) = E(E(v» = E2(V) = E(v) = u. iü) Como E ~ I, existe v eVtal que E (v) ~ v. Assim, E (E (v» = E (v), ou seja, E não é injetiva, e portanto não é inversível. I Observe O e N(T) e O e T(V) , e portanto N(T) ~ 0 e T(V) ~ 0. 34 5) Seja T: V ~ V um operador linear de umespaço vetorial V sobre o corpo K. Suponha que c E K é um autovalor de T. O autoespaço associado ao autovalor c é por definição L (c) = {x EV;(T-cl)x=O}, isto é, L (c) = N (T - cl). Logo L (c) é subespaço de V (ver exercício anterior). Cada matriz abaixo está associada a um operador do espaço euclidiano na base canônica. Encontre todos os autovalores c E 9t e uma base para L( c) em cada caso abaixo: rIO ° l lo 1 01 lo 1 lJ (i) A= (ii) B = Solução: (i) Seja c E9t autovalor de A, então r c-100 l det I lo c-I ° JI = ° => (c _1)3 = ° ° -1 c-I => c= 1 Isto é, 1 é autovalor de A com multiplicidade 3. Com isto queremos dizer que o polinômio característico é divisível por (x _1)3 e não é divisível por (x _1)4. r(c-l)x=O Seja (x,y,Z) E L(I) ~ ~ (c-I) y = ° l-y+(C-l) z=o ~y=O (poisc=l) Assim L (1) = {(x,y,z) E 9t3; Y = O}, ou seja, L (1) é o plano xz. Neste caso {(l,O,O), (0,0,1)} éumabasedeL(I). (ü) Seja c E 9t autovalor de B. Então rC-2 -2l det l-I c _ 3 J = ° => c2 - 5c + 4 = ° => c = 1 ou c = 4 Primeiro seja (x,y) E L(I). Tem-se que -x - 2y = ° o que implica x = -2y, e, portanto, L (1) = { (x,y) E9t 2 ; X = - 2y }. É fácil ver que {(- 2,1)} é uma base de L (1). Seja agora (x,y) E L(4). Então 2x - 2y = 0, ou seja x = y, donde L (4) = {(x,y) E 9t2 ; X = y} e {(1,1)} é uma base de L (4). 6) Seja Q uma matriz real quadrada de ordem n. Diz-se que Q é simétrica quando Q = Q' (isto é, se Q = (qij) então qij = qji' Se para todo x E9tn - {O},x'Q x > 0, diz- se que Q é positiva definida. Dada Q matriz real de ordem n simétrica positiva definida, prove que (x,y)Q = x'Q y define um produto interno em 9tn . Prova: Vamos provar que (,) Q verifica as propriedades de produto interno: 1)(x,y +z)Q = x'Q(y +z) = x'Qy +x'Qz = (x,y)Q + (x,z)Q' Vx,y,z E9tn • 2) (ax,y)Q = (ax) 'Qy =ax'Qy = a(x,y)Q' Va E9t, Vx,y E9tn . 3) (x,y)Q = x'Qy = (x'Qy)' = y'Q'x"= y'Qx = (y,x)Q' Vx,y E9tn . (estamos usando propriedades da transposta e a simetria de Q) 35 4) Se x Eut" - {O}, (X,X)Q = X'Q X>o (pois Q é definida positiva). Portanto, (')Q é produto interno em utD • 7) Encontre a projeção ortogonal do vetor (l,O,I) E ut3 sobre o subespaço W = {(XI>X2 ,X3 ) Eut3 ; XI +x2 +x3 = O}. Solução: Inicialmente econtraremos uma base para W. Para isto, seja (X1,X2,X3) EW. Então (XI' x 2 , x 3 ) = (XI' x 2 ,-XI - x2 ) = XI (1,0,-1) +x2 (O, 1, -1), donde conclui-se que {(I,O,-I),(O,I,-I)} é gerador de We, por tratar-se de um conjunto de vetores LI, é também uma base de W. r 1 , Tomemos X = l ° -1 ol IJ e y' = (1,0,1). Sabemos que a projeção dey sobre W é -1 r 2 X(X'XrIX' = ~ 'l-I -1 1 EwY = 3" (1,-2,1) 8) Calcular o ponto à mínima distância do ponto (1,- 2, -3, -4) ao subespaço gerado pelos vetores: a) {(I,I,2,I), (1,4,2,3), (3,9,6,7)} b) {{l,0,0,0), (O,I,O,O)} Solução: a) Sejam VI' = (1,1,2,1), v2 '= (1,4,2,3), v3 '= (3,9,6,7) e y' = (l, -2, -3, -4), W = L (vI> v2 ' v 3), ou seja, W é o subespaço gerado por vI> v2 e v3 . Observe que v3 = VI + 2v2 . Assim, W = L (vI> v2 ) com {VI' v2 } LI. 1 1 1 4 SejaX = 2 2 1 3 X' X=[:2 12 ] 30 (X'Xr l =_1 66 [30 -12] -12 7 36 [-11] Xy= -25 1 (XXr l Xy=-66 [-30] -43 73 i 202 Finalmente, EwY = X(X' Xr l X'y = - 66 146 159 b) Como os vetores (1,0,0,0), (0,1,0,0,0) geram o plano das primeiras duas coordenadas tem-se que a projeção de (1,- 2,- 3,- 4) neste subespaço é (1,- 2,0,0). 9) Dada a forma quadrática S(x) = x; + x~ + 3XI X2 , i) ache a matriz simétrica A tal que S(x) = x'Ax; ü)ache os autovetores de A e uma base do 91 2 formada por auto-vetores ortonormais de A; li) sendo Q a matriz cujas colunas são dadas por estes autovetores ortonormais, obtenha a matriz B = Q'AQ; iv) obtenha a forma quadrática x'Bx = x'Q'A Qx, cujo contradomínio é o mesmo de x'Ax e classifique-a nos termos discutidos no texto. Solução: rI i) A= l3/2 ü)IA-cIl= Il-c 3/21 = c2 -2c-5/4, onde IMI éodetenninantedeurnamatrizquadradaM 3/2 l-c IA - cIl = ° para cI = 512 e c2 = - I 12 Trabalhando inicialmente com c = CI , temos, fazendo (A - c/)x = 0, r -3/2 3/2l r xll _ (01 l3/2 - 3/2J lx2J - O) Dai obtem-se XI = x2 e o autovetor ( ..fi 1 2, ..fi 1 2 ) de norma igual à unidade. Para (A - c2I)x = 0, temos r 3 1 2 3 1 2l r XI l _ (OJ b/2 3/2J lx2J - ° obtendo-se XI = - x2 e o autovetor (..fi 1 2, - ..fi 1 2) de norma igual à unidade e ortogonal ao autovetor (..fi 1 2, ..fi 1 2 ) . Estes dois autovetores formam uma base do 91 2 (vetores ortonormais são sempre linearmente independentes). r..fi12 J2/2l iii)Q= lJ2/2 -J2/2J=Q' Q' A = rl..fi 1 2 ..fi 1 2 lJ rI 3 1 2l = rl5..fi 1 4 5..fi 1 4 lJ ..fi 1 2 -..fi 1 2 l3 1 2 1 J -..fi 1 4 ..fi 1 4 B = Q' A Q = rl5..fi 1 4 5..fi 1 4 lJ rl..fi 1 2 ..fi 1 2 lJ = r 5 1 2 ° l -..fi 1 4 ..fi 1 4 ..fi 1 2 -..fi 1 2 l ° -1/ 2J 37 Como era de se esperar, B é uma matriz diagonal cujos elementos da diagonal são os autovalores da matriz A. iv) x'Bx = 5/ 2x; - 1/ 2xi que, obviamente é uma forma quadrática indefinida. De fato, x'Bx> ° para (1,0) e x'Bx < ° para (0,1). Segue do que vimos no texto que a forma quadrática x; + xi + 3X1X 2 é também indefinida (pois o contradomínio de x'Ax quando x E9l2 é o mesmo de x'Bx). 10) Seja V um espaço vetorial sobre K. Prove que a representação de um vetor yEV numa base ordenada de V é única. Utilize este fato para justificar a inversibilidade da matriz de Gram. Solução: Seja (v l' ... , V n) uma base ordenada de V. Suponha que a)v) +an vn = y = b)v) + ... +bn vn onde ai' bi EK,i = 1, ... ,n. Então (a)-bJv)+ ... +(an-bn)vn=O. Como (v), ... ,vn) é base segue-se que é LI, logo ai -bi = O,i = 1, ... ,n, como queríamos demonstrar. Observe que a matriz de Gram do teorema 1.2 deve ser inversível visto que fazendo y = O neste teorema teremos que a=O é a única solução do sistema: (X'X)a = X' O = O pois a é a representação de EwY na base (x) , ... ,xp ) de W. 11) Prove que uma transformação linear em espaços de dimensão finita fica unicamente determinanda pelos valores que assumem em uma base ordenada qualquer do espaço. Solução: Sejam V; , V2 espaços vetonalS sobre o corpo K, {v I, ... , V n} base de VI e T: VI -+ V2 uma transformação linear. Então dado x E VI existem (únicos) aI , ... , an, tais que x = aI v I + ... +an v n e portanto Tx=aITvl+ ... +anTvn. Assim basta conhecermos Tv1' ... ,Tvn para determinarmos a transformação linear T. 12) Prove o teorema espectral em dimensão finita. Seja A:9l ft -+ 9l ft um operador linear simétrico, i.e., (Ax ,y) = (x, Ay) para todo X, y,e 9l ft (isto é o mesmo que dizer que a matriz (aiiri=1 que representa o operador A na base canônica é tal que aij = aji , Vi, j E {I, ... , n}) onde (.,.) é o produto interno euclidiano do 9l ft . Então i) todos os autovalores de A são reais. ü) existe uma base ortonormal (ou seja, com vetores ortogonais e de norma igual a um) do 9l ft constituída de autovetores. Demonstração: Vamos estender o operador A:9lft -+ 9l ft para n Ã: Cn -+ Cn tal que se x = Laiei é um vetor arbitrário de i=1 Cn , onde ai E C, i = 1, ... , n, e {e1' ... , en} é base canônica de 9ln então n Ãx = LaiAei . Podemos também definir o produto interno hermitiano em C" da i=1 38 n então (x,y\ = La Ji i=) (observe que se x, y E mn então (x, y \ = (x, y)). Neste caso é fácil ver que: a) (X,y)b = (y,X}b' 'ix,y ECn b) (X+y,Z)b = (X,Z)b +(y,Z)b' 'ix,y,z ECn c) (ax,y) = a(x,y), 'ix ECn , 'ia EC Temos também que vale (Ãx,y\ = (x, ÃY)b ' 'ix,y E cn • Seja agora I.. EC uma raiz do polinômio característico de à que é o mesmo de A, visto que na base {ep ... ,eJ de mn sobre m ou de Cn sobre C os operadores A e à tem a mesma matriz de representação. Tomemos também x E cn - {O} tal que Ãx = ÂX. Logo Se x={ap... ,aJ entID (x,x\ = tlail2 e como x:;t O temos que ai :;tO para algum i=) i=I, .... ,n, ou seja, laJ >0, logo (x,x):;tO. Portanto Â=Â,ouseja,ÂEm. E isso demonstra (i). Suponhamos agora que  E m é autovalor de A e x E mn é tal que (A - 1..1)2 (x) = O. Temos que A2x-2ÂAx + Â2x = O, logo O = (A2x -2ÂAx+ Â2x,x)= (A2X-2ÂAx,x)+ Â2(X,X) = (Ax-2À.x,Ax)+ 1..2 (x, x) = IAxl2 -2À.(X,Ax)+ À.21xt = IAx-À.xI2 ,ou seja, Ax- À.x = O => Ax = À.x. Concluí-se que o núcleo de (A - 1..1) 2 é igual ao núcleo de (A - 1..1). Em outras palavras o auto-espaço generalizado de I.. é igual ao auto-espaço de Â. Segue-se do que foi dito nesta seção que m n tem uma base de autovetores de A, porque as bases dos autoespaços generalizadas formam uma base de mn . Resta agora mostrar que podemos escolher uma base de autovetores que seja ortonormal. Em primeiro lugar observe que se 1..), 1..2 E m são autovalores de A então dados Xi autovetor associado ao autovalor Âi, i = 1,2, 1..) (xp x2) = (Axp x2) = (xp Ax2) = (Xp Â2X2) = Â2(Xp X2). Como 1..) :;t 1..2 devemos ter (x)' X2)b = o. Assim, vetores pertencentes a autoespaços distintos são ortogonais. Para mostrar o que propomos basta escolher uma base ortonormal para cada autoespaço e tomar a base do mn como a união destas bases (será base pois mn é a soma direta dos autoespaços generalizados). 39 Exercícios Propostos - Seção 1 1) Mostre que os conjuntos abaixo são espaços vetoriais sobre m com as operações USU81S: ( i ) M m r n (m) conjunto de matrizes reais m x n ( ü ) Pn (m) conjunto dos polinômios com coeficientes reais de grau menor ou igual a n. ( li ) C = {a + bi; a, bEm} 2) Qual dos seguintes conjuntos de m3 são realmente subespaços? (a) o plano de vetores (x, y, z) com x = O (b) o plano dos vetores (x, y, z) com x = 1 (c) os vetores (x, y, z) que satisfazem z - y + 3x = O (d) os vetores (x, y, z) com xy = O 3) Mostre que as seguintes transformações T não são lineares: ( i ) T: m2 ~ m definida por T (x,y) = (x + l).y ( ii ) T: m2 ~ m3 definida por T (x, y) = (x + 3, 5y, 2x + y) (li) T: m3 ~ m3 definida por T (x, y, z) = (lxl,lyl,o) 4) Diga se cada afirmação abaixo é verdadeira ou falsa, provando-a , se verdadeira, ou dando um contra-exemplo, se falsa: ( i ) Se x, y e z são vetores LI, x + Y + Z e z + x também são vetores LI. ( ü ) Se x, y e z são vetores LD então z é a combinação linear de x e y. 5) Calcule a projeção ortogonal do vetor (1, O, l)e m3 sobre os seguintes subespaços: a)O próprio m3 b) W = {x E m3;x] +x2 +x3 = O} c)W = {x E m3;x] +x2 +x3 = O e 2x] +x2 +x3 = O} e d) W = {x E m3;x] +x2 +x3 = O, 2x] +x2 +x3 = O e x] +x2 +2x3 = O} 6) No exercício anterior calcule os vetores x - Ewx para cada uma das projeções efetuadas. Definindo-se a norma de um vetor y E m n por (y~ + yi + ... + y;) 1/2, o que você pode afirmar sobre cada uma das normas do vetor x - EwX nos quatro itens anteriores? 7) Verifique que a norma euclidiana satisfaz as três propriedades listadas abaixo. Utilize em sua demonstração a desigualdade de Cauchy-Schwarz I( x, y)1 ::; Ilxll·lly 11· 40 a) Se x *- O, então Ilxll > O b) para qualquer a E 91, Ilaxll = lal Ilxll c) para qualquer vetores x e y, Ilx + yll ~ Ilxll + Ilyll 8) Resolva o sistema AX=Yutilizando a matriz aum~ntada A' ( 1 -2 1 Y\ J A'= 2 1 1 Y2 O 5 -1 Y3 Qual a condição necessária para que o sistema tenha uma solução? A que condição o vetor Y = (y \ , Y 2 , Y 3) deve satisfazer para pertencer ao subespaço gerado pelos vetores (1,2,0), (-2,1,5) e (1,1,-1)? E para pertencer à interseção de todos os subespaços que contém estes três vetores? Estas três perguntas são equivalentes? 9) Encontre a dimensão e uma base do espaço das soluções W do sistema de equações lineares: x+2y-4z-s= O x+2y-2z+2r+ s= O 2x+4y-2z+3r+4s= O 10) Sejam U e W os seguintes subespaços do 914 : U={(a,b,c,d); b+c+d=O}, W={(a,b,c,d); a+b=O e c=2d}. Encontre a dimensão e uma base de U, W, U n W. 11) Comente a seguinte proposição: "se x,y e z são vetores linearmente independentes, x+y, y+z e z+x também são linearmente independentes". 41 2) Equações de Diferenças Finitas e Equações Diferenciais Lineares com Coeficientes Constantes 2.1) Equações de Diferenças Finitas Lineares homogêneas. Trataremos aqui de encontrar seqüências de números reais (XO,Xp x2 ,.,,) que satisfaçam a equações do tipo: (2.1) onde ao, aI , ... , ao são números reais. Tal equação denomina-se uma equação de diferenças finitas linear homogênea de ordem n com coeficientes constantes. A sua solução se dá através dos seguintes passos: a) Constrói-se o polinômio característico P(r) = aoro +alrO-I+ ... +ao e encontram-se as suas n raízes, que podem ser reais ou complexas. b) A cada raiz simples ri (ou seja, que não se repete), associa-se a solução kjrjt , kj E C c) A cada raiz rj de multiplicidade m ( ou seja, que se repete m vezes ) 2 associa-se a solução (kjl + kj2t+. .. +kjmtm-l)rj" kj E C. d) A solução geral no campo dos complexos obtém-se somando-se as soluções associadas às raízes do polinômio característico. A solução no campo dos reais x = (xO,XI,X2, ... ,xo, ... ), onde cada Xi é um número real, que desejamos obter, obtém-se tomando-se a parte real da solução complexa. Passemos agora ao estudo específico das equações que mais usualmente aparecem em problemas econômicos, quais sejam, as equações de primeiro e segundo grau. 1) Equação de ordem 1 axt+1 + bX t = O ab :t. O. Dividindo-se por a, Xt+1 + (b / a) x t = O. O polinômio característico associado será dado por P(r) = r + b / a, com raíz rI = -b / a. A solução geral será então a seqüência de números reais dada por x, = ko (-b / a)' . Fazendo t = O nesta solução obtém-se Xo = ko, ou seja, conclui-se que a seqüência solução (xo,xo(-b/a)l,xo(-b/a)2,xo(-b/a)3, ... ) apresenta como termo geral x, =xo(-b/a)'. 2 Diz-se que uma raiz rj de P(r) = aor2 + aI ro-I +. .. +ao = O apresenta multiplicidade m quando P(r) é divisível por (r - r)m mas não é divisível por (r - r)m+l. 42 2) Equação de Grau 2 ac:;t:O o polinômio característico associado é P( r) = ar2 + br + c, cujas raízes podem ser reais e diferentes, reais e iguais ou complexas conjugadas (como supusemos que os coeficientes de (2.1), ao,ap ... an são todos números reais, pode-se mostrar que se um complexo a + J3i é raiz de P(r), o seu conjugado a - J3i também o será). Analisemos separadamente cada um dos casos. Para isto seja L\ = b2 - 4ac o discriminante de P(r). Caso 1: Raízes reais e diferentes (L\ > O) A solução será dada por X t = k1r1 t + k2r;. Caso 2: Raízes Iguais (L\ = O) Pelo que vimos antes, sendo r a raiz de multiplicidade dois, X t = (k l + k 2 t)r t Caso 3: Raízes Complexas (L\ > O) Como a, b e c por hipótese são números reais, as raízes são os complexos conjugados a + J3i e a- J3i. Temos então: Este terceiro caso nos remete ao problema de, uma vez tendo-se achado a solução de (2.1) no campo dos complexos,obtê-Ia no campo dos reais. Tal passagem se dá: a) Escrevendo-se os números complexos (a+ J3i) e (a- J3i) na forma polar p (cos e + i sen e) e p (cos e - i sen e), onde p = (a 2 + 132 ) 1/2 e e = arc cos (a / (a2 + (32)1/2) Im Diagrama de Argand Gauss - Representação de a + J3i na forma polar ~ cose + i sen e) b) Utilizando a fórmula de De Moivre Temos então: (a± J3ir = (p (cose±i sen e)r = pt(cose t±i sen et) xt = k l pt(coset+i senet)+k2 pt(coset-i senet) xt = pt«k l + k2)coset +(k l - k2)i sen et) 43 Nesta solução p\ cos e t e sen e t são números reais, enquanto que k l + k2 e (kl - k2 )i são complexos. Tomando-se a parte real, obtém-se a solução de xt no campo dos reais, Xt = pt(A I coset+A 2 senet), (2.2) onde AI = Re (kl + k2 ) e A 2 = Re «kl - k2)i) Vejamos um exemplo numérico desteúltimo caso. Para isto, seja a equação de diferenças finitas Xt+2 - Xt+1 + xt = O com as condições iniciais dadas xo=l e x}=1/2 cujo polinômio característico associado: P( r) = r2 - r + 1 tem raízes ri = 1/2+(/3 /2)i e r2 = 1/2-(.J3 /2)i. Temos p = (1/4 + 3 / 4)\12 = 1 e e = x / 3 rad. Dai obtém-se a solução, de acordo com (2.2), xt = A I cos (x / 3)t + A 2 sen (x / 3)t, onde as constantes A I e A 2 obtém-se a partir das condições iniciais Xo e XI' Fazendo-se Xo = 1 e XI = 1/2 1- A - I 1/2 = AI.{l/2) + A2 .(/3 /2) donde se obtém A I = 1 e A 2 = O. Neste caso, a solução se dá por x t = cos (x / 3) 1. Os possíveis erros na solução de equação de diferenças finitas podem ser evitados checando-se as soluções obtidas. Vejamos como proceder utilizando o exemplo anterior. A equação a ser resolvida nos diz que: Dada a nossa solução x t = cos (n-l 3)1 Xt+1 = cos «7i / 3) 1+ 7i / 3) = COS (7i / 3)1 COS (7i / 3) - sen (7i /3)1 sen (7i / 3) x t+2 = cos «7i / 3) I + 27i / 3) = COS (7i /3)1 COS (27i / 3) - sen (27i /3). sen (7i / 3)1 ou ainda, tendo em vista que : cos 7i / 3 = 1/ 2, cos 2 7i / 3 = - 1 / 2, sen 7i / 3 = sen 2 7i / 3 = /3 / 2 , Xt = cos (x / 3)t Xt+1 = (1/2) cos (x / 3)t - (.J3 / 2) sen (x /3)t Xt+2 = (-1/ 2)cos (x/ 3)t- (/3 / 2). sen (2x /3)t Observa-se claramente que a solução satisfaz a xt+2 - xt+1 + x t = O bem como às condições iniciais Xo = 1 e XI = 1 /2. 44 2.2) Equações de Diferenças Finitas Lineares Nilo HomogênetlS Uma equação de diferenças finitas linear de ordem n é dita não homogênea quando se tem: (2.3) sendo j{t) uma função de t não identicamente nula. A sua solução geral obtém-se somando-se à solução geral da equação homogênea correspondente (2.1 ) (que se obtém fazendo-se j{t) = O em (2.3» uma sua solução particular. Isto decorre de dois fatos facilmente verificáveis; a) se {y!} e {y;} são soluções de (2.3) , {y!.:... y;} I é solução de (2.1) e b) se {Yr} I é uma solução qualquer de (2.3) e {y I} é uma solução da equação homogênea correspondente, então {Y 1+ yr} I é uma solução de (2.3). Tomemos inicialmente a equação homogênea anteriormente apresentada a xI+1 + b XI = O e a sua correspondente versão não homogênea: a xI+1 + b XI = f(t) Analisemos alguns casos: a)f(t)=k:toO Neste caso devemos tentar inicialmente a solução particular constante S. Substituindo y 1+1 = Y I = S na equação acima, aS + bS = k ~ S = k / (a + b) para a + b :to o. Se a + b = O devemos tentar a solução particular St ao invés de S. Neste caso Y 1+ 1 = S( t + 1) = St + S, Y I = St o que nos leva a aSt + aS + bSt = k obtendo-se daí (como a + b = O) S = kla b)f(t) = ko + kt Tentando-se inicialmente a solução particular Y I = So + St obtém-se Y 1+1 = So + St + S e aYI+I + bYI = aSo + aSt+ aS + bSo + bSt = ko + kt, ou ainda, «a + b) So + aS - ko) +«a+ b)S- k) t = o. Como as funções y(t) = 1 e y(t) = t são, pelo que vimos na seção anterior, linearmente independentes, a igualdade acima exige, quando (a + b) :to O: S=k/(a+b) e So =(1/(a+b»(ko-k/(a+b» o leitor deve verificar por conta própria que quando a + b = O a solução particular a ser tentada é do tipo (So + St)t. 45 Como vimos acima, cada exemplo exigiu o estudo de dois casos; um no qual a + b = O e outro no qual a + b * O. De fonna geral, esse processo pode ser abreviado observando-se o seguinte teorema, muito útil no cálculo de soluções particulares: Teorema 2.1. Se, na equação (2.3) ao Yt+n +a) Yt+n-) + ... +anYt = f(t),f(t) é da fonna (ko + k) t + k2 e + ... + kp t P )ct então existe uma solução particular da fonna: a) (So + S) t + S2 e + ... + Sp t P )ct, se c não é raiz do polinômio característico P(r), ou b) (So + S) t + S2 e + ... + Sp t P )tmct, se c é raiz de multiplicidade m de P(r). Observe que no caso (a) em que analisamos tínhamos sempre c = 1, pois k = k.lt e ko + kt = (ko + kt) l t . Assim a solução no caso (a) foi uma constante no caso em que 1 não é raiz do polinômio ar + b = O (o que ocorre se, e somente se, a + b * O). Como no caso analisado a multiplicidade máxima possível de uma raiz é igual a 1 Gá que P(r) é um polinômio do primeiro grau), no caso em que 1 era a raiz de P(r) (ou seja, quando a+ b = O) bastou tentar-se a solução So. t l .1t = So t. O mesmo procedimento foi usado no exemplo b. c) f(t) = k cose t Como regra geral, neste caso, devemos utilizar a solução particular Y t = So cos e t + S) sen e t. Obtém-se: Y t+) = So cos (e t +e) + SI sen (et +e), ou ainda, Y t+1 = So (cos e cos e t - sen et sen e) + SI (cos e sen e t + sen e cos e t) Fazendo-se aYt+) + bYt = k coset, obtém-se (a(So cose+s) sene)+bSo-k)coset+ (a(-So sene+S) cose) + bS))senet = O' Decorre desta expressão e da independência linear de cos e t e sen e t o sistema: (So cose+s) sene)a+Sob = k (-So sen e+ S) cose)a+S) b = O de onde se obtém as soluções para a e b, quando A = (So cose+s l sene) S) - So(-So sene+s) cose) * O a = kSI / A e b = -k(-So sene+S) cose)/ A Procedimento semelhante adota-se para f(t) = ksenet ou f(t) = k) coset+k2 senet. O método acima apresentado para as diferentes fonnas da função !tt) utiliza-se da mesma fonna quando se passa às equações de diferenças finitas de ordem mais 46 elevada, como por exemplo à equação a Y H2 + b Y HI + C Y t = f( t). Se f{ t) é constante, a solução particular será uma constante se o número 1 não for raiz de P( r) = ar2 + br + c, uma constante vezes t se 1 faz raiz de multiplicidade 1 de P(r) e uma constante vezes e se 1 for raiz dupla de P(t). Da mesma forma, se f(t) = ko + k l t as soluções possíveis, nos três casos analisados, são So + SI t, (So + SI t)t e (So + SI t) e. Se f(t) é do tipo (ko + k l t) c\ sendo c um número real, as so1uções possíveis são (So + SI t) ct se c não for raiz de P(r), (So + SI t) tct se c for raiz de multiplicidade 1 de P(r) e (So +SI t)ect se c for raiz dupla de P(r). Deixamos para o leitor a formulação e resolução de exercícios numéricos a este respeito. Cálculo da(s) Constante(s) A última etapa na obtenção da solução de uma equação de diferenças finitas é sempre o cálculo da(s) constante(s). Deve-se tomar cuidado, no cálculo das equações não homogêneas, de só se calcular o valor das constantes uma vez obtida a solução geral da equação não homogênea, e não utilizando-se a solução da homogênea associada. Vejamos um exemplo numérico. Para isto, tomemos a versão não homogênea da equação YH2 -Yt+1 +Yt anteriormente apresentada3 , com as mesmas condições iniciais, Yo = 1 e Y I = 1 / 2. Seja então a equação de diferenças: cuja solução da homogênea associada, como já vimos, é dada por Yt = AI cos(~)t+ A 2 sen ~)t. Como k pode ser escrito sob a forma klt e 1 não é raiz de P( r) = r2 - r + 1, a utilização do teorema nos permite concluir que há uma solução particular da forma Y t = Y t+1 = Y H2 = So· Por substituição, temos então So = k. Segue daí a solução particular k e a solução geral da não homogênea Estamos agora prontos para o cálculo de A I e A 2. Fazendo-se Yo = 1 e Y I = 1 / 2, Yo=I=AI+k Y I = 11 2 = (1 / 2) A I + (.fi / 2) A 2 + k de onde se conclui que: 3 Evidentemente, é irrelevante se utilizamos x ou y para caracterizar a equação de diferenças. 47 2.3) Estabilidade de Equações de Diferenças Finitas Linetll'es Uma equação de diferenças finitas não homogênea é dita estável quando a equação homogênea associada for estável. Uma equação homogênea, por sua vez, é dita estável se, e somente se, toda sua solução {Y t} for tal que lim Y t = O t t-..o Em outras palavras, uma solução {Ytt de úma equação de diferenças finitas linear será dita estável quando a solução da homogênea associada converge para zero ao se fazer t tender a mais infinito. Analisemos separadamente as equações de primeira ordem. No caso da
Compartilhar