Prévia do material em texto
Autor: Café com leite Pseudo-inversa 𝐴+ = (𝐴∗𝐴)−1𝐴∗ 𝐴+ = 𝐴∗(𝐴𝐴∗)−1 𝐴+ = (𝐴)−1 Primeiramente, quem é a transformada? Se você tem um sistema de equações, monte- o primeiro em forma de matriz, da forma que fica [A][x] = [b], uma matriz pra A, uma para x e outra para b. Exemplo, uma transformada A: R3 R2, A (x,y,z): (2x-y+z, -x+2y+z) Isso é uma transformada que leva vetores do R3, ou seja (x,y,z), para dois, tipo um (a,b) que nesse caso é (2x-y+z, -x+2y+z). Vamos escrever essa transformada em forma de matriz. Teremos: 2 −1 1 −1 2 1 𝑥 𝑦 𝑧 = b , b é o vetor resposta Agora já sabemos qual a matriz da nossa transformada [A], que usaremos mais tarde. Para definir a pseudo-inversa dessa transformada, de acordo com as fórmulas dadas acima temos que verificar se ela é injetiva ou sobrejetiva, pois para cada um destes há uma maneira de resolver. Começaremos a avaliar se ela é injetiva. Injetiva Para uma transformada ser injetiva seu núcleo deve ser formado APENAS, SÓ, SOMENTE, pelo vetor nulo. E como ver isso? Pega-se a transformada, [A][x] = [b] e é preciso descobrir quais vetores levam a matriz de [A] à uma matriz nula (só copiei do caderno pra ficar bonito, hihi). Traduzindo, vai pegar o [A][x] e igualar a zero, simplesmente [A][x] = [0] e descobrir para quais [x]’s isso existe. Vou te explicar como acho mais fácil que é por matriz. 2 −1 1 −1 2 1 𝑥 𝑦 𝑧 = 0 0 Se a transformada for injetiva Se a transformada for sobrejetiva A x = b 0 Se a transformada for injetiva e sobrejetiva (invertível). É apenas a inversa Autor: Café com leite Porque a matriz de [b] ficou apenas com 2 zeros se tenho 3 icognitas? Por que a transformada está no R2 e como saber disso? O problema define no começo da questão A: R3 R2 (que 3 “valores” virarão 2 valores) 2 −1 1 −1 2 1 0 0 = 𝑥 𝑦 𝑧 2 −1 1 0 3 3 0 0 = 𝑥 𝑦 𝑧 Na linha 2 teremos: 0x +3y +3z = 0 então y=-z. Na linha 1 teremos: 2x –y +z = 0, como y=-z 2x + 2z = 0, então x= -z Isso tudo pra falar que o núcleo é formado pelo conjunto de pontos que obedecem a relação x=y=-z. Se x= a, daí o vetor nulo seria a = a = -a. Essa forma de escrever em forma de “a” é só bonitinha. Formalmente falamos assim N(A) = {(a, a, -a), a ∈ R} Como o núcleo ficou escrito em função de uma variável só, então a dimensão dele é 1, dim N(A) =1. Se você tivesse achado que x = y= z = 0, isso significa que a dim N(A) = 0. E pra que achar a dimensão da imagem? Uma transformada SÓ é INJETIVA, se dim N(A) = 0, SOMENTE! Nesse caso ela é diferente de 1, então ela é o que? Nada que tenha nome, só nos interessa até esse ponto saber se ela é injetiva ou não. Como ela não é injetiva, para calcular a pseudo-inversa temos que saber se ela é sobrejetiva. Sobrejetiva Para ser sobrejetiva a dim Im = dim F, só é sobrejetiva se isso ocorrer. Só, somente! Primeiramente, quem é F, é o espaço para onde a transformada está indo. E como eu vejo a dimensão dele? Por essa definição inicial A: R3 R2, o espaço que ele está indo é o R2 , e a dimensão dele é o coeficiente, logo a dim F= 2, o espaço de onde ele está vindo é E, a dimensão de dim E = 3 (apenas por curiosidade nesse momento). Voltando ao que interessa, a dim F = 2, agora temos que saber a dim da Imagem para verificar se a transformada é sobrejetiva. Dimensão da Imagem: Temos duas formas de ver a dimensão da imagem, ou podemos fazer as duas para comprovar que dão a mesma coisa, ou provar que é verdadeira e tal. Método 1: Se já sabemos a dimensão do núcleo podemos aplicar o “Teorema do Núcleo e Imagem” que nos diz: dim N(A) + dim Im(A) = dim E L2=(2*L2) – L1 Autor: Café com leite A dimensão do núcleo definimos lá em cima, que era dim N(A) =1, e a dimensão de E comentamos no parágrafo acima que é dim E = 3. dim N(A) 1 + dim Im(A) = dim E 3, então dim Im(A) = 2 A condição para TL ser sobrejetiva que definimos é: dim Im = dim F, a dim F achamos no primeiro parágrafo desse tópico que é 2, e acabamos de achar que a dim Im(A) =2, logo essa condição de dim Im = dim F está satisfeita. Então a TL é sobrejetiva. Método 2: Definimos base canônicas de E, aplicamos a transformada e teremos a base da Im. A transformada irá levar de R3 R2, então definiremos 3 vetores canônicos de E, 3 pois é R³. Base: e1, e2, e3 - e1: (1,0,0) - e2: (0,1,0) - e3: (0,0,1) A matriz do conjunto dessas transformadas é [A] = [Ae1, Ae2, Ae3]. Essa matriz é a base da Im(A) [A]= 2 −1 1 −1 2 1 Recapitulando, vimos que para calcular a pseudo-inversa temos duas formas, uma caso a transformada seja injetiva e outra para sobrejetiva. Para verificar se ela é injetiva temos que achar a dimensão do núcleo, e só será injetiva caso dim N(A) = 0, como no exemplo a dim N(A) = 1, então ela não é injetiva. Agora temos que verificar se ela é sobrejetiva, para isso a dim Im = dim F, a dim F é definida no começo do problema quando sabemos de onde vem para onde vai, que é o E → F, os coeficientes em cima de cada R. E a dimensão da Im pode ser definida Aplicando a transformada em cada vetor. Faremos Ae1, Ae2, A3 A: R3 R2, A (x,y,z): (2x-y+z, -x+2y+z) Ae1= A(1,0,0) = (2-0+0, -1,0,0) = (2,-1) Ae2= A(0,1,0) = (0-1+0, -0,2,0) = (-1,2) Ae3= A(0,0,1) = (0-0+1, -0,0,1) = (1,1) Podemos observar que uma das colunas pode ser escrita como combinação das outras duas. Ex.: A coluna Ae1 = Ae3 – Ae2. Apenas conseguimos escrever uma das colunas em função das outras duas. Desta forma as duas que fazem essa combinação geram duas bases LI, no exemplo dado, Ae3 e Ae2 são LI, então a dim Im(A) = 2, o que confirma o “Teorema do núcleo e imagem”. Autor: Café com leite pelo Teorema do Núcleo e Imagem, caso saibamos a dim N(A) ou montando uma base e vendo se todos os vetores são LI. Verificamos que no exemplo é uma TL sobrejetiva. Então, para calcular a pseudo-invesa seguiremos o caminho a seguir: 𝐴+ = 𝐴∗(𝐴𝐴∗)−1 Primeiramente, 𝐴∗= [A]T, que é mudar linhas para colunas: linha 1 vira coluna 1, linha 2 vira coluna 2, ... linha n vira coluna n; Inversa: A-1: O modo que eu acho mais fácil [A][A]-1 = [I] (lendo: a matriz A, vezes a matriz inversa de A é igual a matriz identidade); Matriz identidade: Matriz toda zerada, exceto a diagonal principal que é 1 em todos as posições. A* = AT: [A] = 2 −1 1 −1 2 1 [A]T = 2 −1 −1 2 1 1 AA* = [A]x[A*] = [A]x[AT] 2 −1 1 −1 2 1 x 2 −1 −1 2 1 1 = 2𝑥2 + (−1)𝑥(−1) + 1𝑥1 2𝑥(−1) + (−1)𝑥2 + 1𝑥1 (−1)𝑥2 + 2𝑥(−1) + 1𝑥1 2𝑥(−1) + 2𝑥(−1) + 1𝑥1 = 6 −3 −3 6 (𝐀𝐀∗)−𝟏 : O modo que eu acho mais fácil [A][A]-1 = [I] (lendo: a matriz A, vezes a matriz inversa de A é igual a matriz identidade) [AA*] x [AA*]-1 = I 6 −3 −3 6 X 𝑎 𝑏 𝑐 𝑑 = 1 0 0 1 6𝑎 − 3𝑐 6𝑏 − 3𝑑 −3𝑎 + 6𝑐 −3𝑏 + 6𝑑 = 1 0 0 1 , caímos em um sistema: [AA*] x [AA*]-1 = I Como queremos achar [AA*]-1, então temos que achar os valores de a, b, c e d. Autor: Café com leite 6𝑎 − 3𝑐 = 1 6𝑏 − 3𝑑 = 0 −3𝑎 + 6𝑐 = 0 −3𝑏 + 6𝑑 = 1 Resolvendo: 𝑎 = 2/9 𝑏 = 1/9 𝑐 = 1/9 𝑑 = 2/9 𝑎𝑏 𝑐 𝑑 = [AA*]-1 = 2/9 1/9 1/9 2/9 = 2 1 1 2 1 9 Relembrando 𝐴+ = 𝐴∗(𝐴𝐴∗)−1 [A+] = 2 −1 −1 2 1 1 2 1 1 2 1 9 = 2𝑥2 + −1𝑥1 2𝑥1 + (−1)𝑥2 (−1)𝑥2 + 2𝑥2 (−1)𝑥1 + 2𝑥2 1𝑥2 + 1𝑥1 1𝑥1 + 1𝑥2 1 9 = 3 0 0 3 3 3 1 9 = 1/3 0 0 1/3 1/3 1/3 Pronto, achamos a pseudo-inversa.