Baixe o app para aproveitar ainda mais
Prévia do material em texto
3 Ana´lise das Componentes Principais (PCA) • Definic¸a˜o: PCA e´ uma combinac¸a˜o das varia´veis aleato´rias X1, X2, ..., Xn, que gera novas varia´veis aleato´rias na˜o-correlacionadas. Geometri- camente, estas combinac¸o˜es representam a selec¸a˜o de um novo sis- tema de coordenadas Y1, Y2, ..., Y n obtidos a partir da rotac¸a˜o do sistema de coordenadas original. • Objetivo: O novo sistema de coodenadas representa as direc¸o˜es de maior variabilidade dos dados, provendo uma descric¸a˜o mais simples dos dados. • Neste novo sistema de coordenadas a variaˆncia ao longo do eixo Yi e´ dada pelo autovalor λi, calculado a partir da matriz de covariaˆncia dos dados originais. • Para simplificar o problema, exige-se que os autovetores sejam or- togonais. Ale´m disso, para evitar problemas de escala, os autove- tores devem ter comprimento unita´rio. • Exemplo 4 - Seja a seguinte matriz de covariaˆncia: C = 1 −2 0 −2 5 0 0 0 2 (19) Os autovalores/autovetores de C, calculados usando a func¸a˜o eig do matlab sa˜o os seguintes: λ1 = 5.83, v1 = [0.383 − 0.924 0] T λ2 = 2.00, v2 = [0 0 1] T λ3 = 5.83, v3 = [0..924 0.383 0] T (20) Assim, as componentes principais sa˜o dadas por: Y1 = v T 1 X = 0.383X1 − 0.924X2 Y2 = v T 2 X = X3 Y3 = v T 3 X = 0.924X1 + 0.383X2 A variaˆncia devido a cada uma das componentes Yi e´ dada por: V ar(Y1) = λ1 ⇒ P1 = λ1 λ1 + λ2 + λ3 = 5.83 8 = 0.73 V ar(Y2) = λ2 ⇒ P1+2 = λ1 + λ2 λ1 + λ2 + λ3 = 5.83 + 2 8 = 0.98 V ar(Y3) = λ3 ⇒ P1+2+3 = λ1 + λ2 + λ3 λ1 + λ2 + λ3 = 5.83 + 2 + 0.17 8 = 1.0 • Conclusa˜o: Cerca de 98% da variabilidade dos dados e´ contabi- lizada usando apenas as duas primeiras componentes. Assim, para fins pra´ticos, pode-se desprezar a terceira varia´vel. 4.2 Descorrelacionando VAs Correlacionadas Problema 2: Como fazer para, a partir de um conjunto de vetores aleato´rios correlacionados X = {x1,x2, . . . ,xN}, obter uma matriz de transformac¸a˜o A que gere um novo conjunto de vetores Y = {y1,y2, . . . ,yN} que sejam descorrelacionados? ALGORITMO 2 Passo 1: Verificar se Cx e´ positiva definida. λi(i-e´simo autovalor de Cx) > 0, ∀i = 1, . . . , n Passo 2: Calcular autovetores, vi, associados aos autovalores cal- culados no passo anterior, e utiliza´-los para construir as colunas da matriz Q: Q = [ v1 ... v2 ... · · · ... vn] Passo 3: Montar a matriz de transformac¸a˜o como A = QT . Passo 4: Gerar os dados descorrelacionados fazendo yi = Axi.
Compartilhar