Buscar

Análise das Principais Componentes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 3 páginas

Prévia do material em texto

3 Ana´lise das Componentes Principais (PCA)
• Definic¸a˜o: PCA e´ uma combinac¸a˜o das varia´veis aleato´rias X1, X2, ..., Xn,
que gera novas varia´veis aleato´rias na˜o-correlacionadas. Geometri-
camente, estas combinac¸o˜es representam a selec¸a˜o de um novo sis-
tema de coordenadas Y1, Y2, ..., Y n obtidos a partir da rotac¸a˜o do
sistema de coordenadas original.
• Objetivo: O novo sistema de coodenadas representa as direc¸o˜es
de maior variabilidade dos dados, provendo uma descric¸a˜o mais
simples dos dados.
• Neste novo sistema de coordenadas a variaˆncia ao longo do eixo Yi e´
dada pelo autovalor λi, calculado a partir da matriz de covariaˆncia
dos dados originais.
• Para simplificar o problema, exige-se que os autovetores sejam or-
togonais. Ale´m disso, para evitar problemas de escala, os autove-
tores devem ter comprimento unita´rio.
• Exemplo 4 - Seja a seguinte matriz de covariaˆncia:
C =


1 −2 0
−2 5 0
0 0 2


(19)
Os autovalores/autovetores de C, calculados usando a func¸a˜o eig
do matlab sa˜o os seguintes:
λ1 = 5.83, v1 = [0.383 − 0.924 0]
T
λ2 = 2.00, v2 = [0 0 1]
T
λ3 = 5.83, v3 = [0..924 0.383 0]
T (20)
Assim, as componentes principais sa˜o dadas por:
Y1 = v
T
1 X = 0.383X1 − 0.924X2
Y2 = v
T
2 X = X3
Y3 = v
T
3 X = 0.924X1 + 0.383X2
A variaˆncia devido a cada uma das componentes Yi e´ dada por:
V ar(Y1) = λ1 ⇒ P1 =
λ1
λ1 + λ2 + λ3
=
5.83
8
= 0.73
V ar(Y2) = λ2 ⇒ P1+2 =
λ1 + λ2
λ1 + λ2 + λ3
=
5.83 + 2
8
= 0.98
V ar(Y3) = λ3 ⇒ P1+2+3 =
λ1 + λ2 + λ3
λ1 + λ2 + λ3
=
5.83 + 2 + 0.17
8
= 1.0
• Conclusa˜o: Cerca de 98% da variabilidade dos dados e´ contabi-
lizada usando apenas as duas primeiras componentes. Assim, para
fins pra´ticos, pode-se desprezar a terceira varia´vel.
4.2 Descorrelacionando VAs Correlacionadas
Problema 2: Como fazer para, a partir de um conjunto de vetores
aleato´rios correlacionados X = {x1,x2, . . . ,xN}, obter uma matriz
de transformac¸a˜o A que gere um novo conjunto de vetores Y =
{y1,y2, . . . ,yN} que sejam descorrelacionados?
ALGORITMO 2
Passo 1: Verificar se Cx e´ positiva definida.
λi(i-e´simo autovalor de Cx) > 0, ∀i = 1, . . . , n
Passo 2: Calcular autovetores, vi, associados aos autovalores cal-
culados no passo anterior, e utiliza´-los para construir as colunas
da matriz Q:
Q =
[
v1
... v2
... · · · ... vn]
Passo 3: Montar a matriz de transformac¸a˜o como A = QT .
Passo 4: Gerar os dados descorrelacionados fazendo yi = Axi.

Outros materiais