Buscar

Análise Fatorial de Variáveis

Prévia do material em texto

Análise FatorialAnálise Fatorial
1
Factor analysis
Análise FatorialAnálise Fatorial
Objetivo: Estudar a estrutura de
dependência existente em um conjunto
de variáveis através da criação de
2
fatores que, eventualmente, expressam
construtos subjacentes aos dados.
Spearman (1904) - medida de inteligência
Análise FatorialAnálise Fatorial
Situação comum: observar grande 
número de variáveis
3
• Como caracterizar a amostra
• Como descrever a inter-relação entre 
as variáveis
ConstrutosConstrutos
Definir o que e como medir
• nível de ansiedade
4
• nível de ansiedade
• satisfação
• bem-estar
• percepção
Exemplo: Escala IDATEExemplo: Escala IDATE--TT
X1 Sinto-me bem
X9 Preocupo-me demais com as coisas sem
importância
X10 Sou feliz
X11 Deixo-me afetar muito pelas coisas
5
X11 Deixo-me afetar muito pelas coisas
X13 Sinto-me seguro
X16 Estou satisfeito
X17 Às vezes idéias sem importância me
entram na cabeça e ficam me preocupando
X18 Levo os desapontamentos tão a sério que
não consigo tirá-los da cabeça
Matriz de CorrelaçãoMatriz de Correlação
X1 X10 X13 X16 X9 X11 X17 X18
X1 1.00
X10 0.58 1.00
X13 0.39 0.47 1.00
6
X13 0.39 0.47 1.00
X16 0.51 0.66 0.54 1.00
X9 -0.14 -0.16 -0.31 -0.22 1.00
X11 -0.20 -0.24 -0.38 -0.32 0.46 1.00
X17 -0.18 -0.20 -0.33 -0.25 0.53 0.46 1.00
X18 -0.32 -0.33 -0.37 -0.40 0.40 0.48 0.48 1.00
Modelo de Análise FatorialModelo de Análise Fatorial
Variáveis 
originais
X1
Fatores 
comuns
F1
AF
7
X1
X2

Xp
F1
F2

Fm
m < p
Modelo de Análise FatorialModelo de Análise Fatorial
2m2m 222121 22
1m1m 212111 11
...
F ...F F X
F ...F F X




8
pmpm 2p21p1 p F ...F F X
...
  p
F1, …, Fm: fatores comuns
1, …, p: fatores únicos ou específicos
Modelo de Análise FatorialModelo de Análise Fatorial
Modelo na forma matricial:
X -  =  F + 
X = (X1, X2, …, Xp)T, F = (F1, F2, …, Fm)T,
 = ( ,  , …,  )T e
9
 = ( 1,  2, …,  p)T e















pmp2p1
2m2221
1m1211
l






Modelo esquematizadoModelo esquematizado
X1
X2
1
2
F1
F
10
Xp
p
F2
Fm
Características impostas ao Características impostas ao 
modelomodelo
• Os fatores únicos são não correlacionados.
• Os fatores comuns e únicos são não
correlacionados entre si.
11
correlacionados entre si.
• Os fatores comuns são não
correlacionados (esta suposição pode ser
abandonada em alguns tipos de AF).
• As variâncias dos fatores comuns são
iguais a 1.
Características impostas ao Características impostas ao 
modelomodelo
• E(F) = 0 Cov(F) = E(FFT) = I
12
• E(ε) = 0 Cov(ε) = E(εεT) =  (diagonal)
• Cov(ε,F) = E(εFT) = 0
Matriz de covariâncias de XMatriz de covariâncias de X
(X-μ)(X-μ)T = (ΦF+ε)(ΦF+ε)T = (ΦF+ε)(FTΦT+εT)
= ΦFFTΦT + ΦFεT + εFTΦT + εεT
13
Σ = Cov(X) = E[(X-μ)(X-μ)T]
= Φ E(FFT)ΦT + Φ E(FεT) + E(εFT)ΦT + E(εεT)
Σ = ΦΦT + 
Análise do modeloAnálise do modelo
imim 2i21i1i F ...F F X  
   imim 2i21i1i F ...F F VarXVar  
14
  )Var( ... XVar i
2
im
2
i2
2
i1i
2
i  
i
2
i
2
i c 
Ci
2 = comunalidade ou variância comum
i = especificidade
Análise do modeloAnálise do modelo
i
2
i
2
i c 
Ci
2 = comunalidade ou variância comum:
expressa o quanto da variabiliade de Xi é
explicada pelo modelo (se Var (Xi)=1 pode
ser encarada como uma proporção)
15
ser encarada como uma proporção)
i = especificidade: expressa o quanto da
variabilidade de Xi não é explicada pelo
modelo.
Um bom modelo deve apresentar uma
comunalidade alta para todas as variáveis
Alguns métodos de Alguns métodos de 
estimaçãoestimação
• Máxima verossimilhança: supõe que os 
dados seguem uma distribuição normal 
multivariada.
16
multivariada.
• Método da componente principal:
baseia-se na análise de componentes
principais.
~
Método da componente principalMétodo da componente principal
Modelo: X =  F + 
ΨΣX  T )Var(
Decomposição espectral de :
~ ~
~ ~ ~~ ~
17
T
T
ppp
T
mmm
T
111 ......  Σ
~ ~ ~ ~ ~ ~ ~
~~
  , , , 
Método da componente principalMétodo da componente principal
T
ppp
T ... Σ
~ ~ ~ ~ ~
~
T
~
ΨΣ  ~~
18
 m m2211
~
 , , , 
 Tipi2i1
i
 ..., , ,  
~



m
j
jij
1
22
ii σψ 
Método da máxima Método da máxima 
verossimilhançaverossimilhança
Suposição: distribuição normal
Estimação dos parâmetros
19
Estimação dos parâmetros
 =  T + 
Restrição: 
T -1  : diagonal
Resultado importanteResultado importante
 =  T + 
 =  T (T ortogonal)
20
 =  T (T ortogonal)
T +  = ( T)( T)T + 
=  T TT T +  =  T +  = 
RotaçãoRotação
Há infinitas matrizes que resultam na mesma
matriz  T. Essas matrizes podem ser
obtidas através da rotação de uma solução
ΨΣX  T )Var(
21
obtidas através da rotação de uma solução
inicial (por exemplo, oriunda do método
das componentes principais).
Problema: Como escolher uma boa
solução?
Rotação Rotação -- Interpretação Interpretação 
geométricageométrica
F2 Exemplo: Solução com 
dois fatores
F1 e F2 definem um plano
22
F1
F1 e F2 definem um plano
F1
* e F2
* , obtidos através de
uma rotação ortogonal dos
eixos, definem o mesmo
plano. Logo representam
uma solução equivalente.
RotaçãoRotação
Rotação: ortogonal ou oblíqua
Algumas rotações:
Varimax (Kaiser): eixos com poucas cargas grandes e
muitas cargas próximas de zero
Quartimax: cada variável com carga alta em 1 fator e
23
Quartimax: cada variável com carga alta em 1 fator e
baixas para os demais
Equimax: compromisso entre Quartimax e Varimax
Rotações oblíquas: Oblimin, Promax, Orthoblique, Dquart,
Doblimin, Orthoblique
Quantos fatores usar?Quantos fatores usar?
• Critério de Kaiser
• Porcentagem da variância total 
explicada
24
explicada
• Atingir comunalidade fixada
• Critério scree-test
• Métodos inferenciais
2
2,5
3
3,5
4
25
0
0,5
1
1,5
0 2 4 6 8 10
Componentes
ExemploExemplo
X1 Sinto-me bem
X9 Preocupo-me demais com as coisas sem
importância
X10 Sou feliz
X11 Deixo-me afetar muito pelas coisas
X13 Sinto-me seguro
26
X13 Sinto-me seguro
X16 Estou satisfeito
X17 As vezes idéias sem importância me
entram na cabeça e ficam me preocupando
X18 Levo os desapontamentos tão a sério que
não consigo tirá-los da cabeça
AutovaloresAutovalores
Componente Autovalores 
% da 
Variância 
% 
Acumulada 
1 3,525 44,065 44,065 
2 1,504 18,796 62,862 
3 ,665 8,311 71,173 
27
3 ,665 8,311 71,173 
4 ,614 7,677 78,850 
5 ,512 6,398 85,247 
6 ,444 5,549 90,797 
7 ,425 5,314 96,111 
8 ,311 3,889 100,000 
 
Comunalidades 2 fatoresComunalidades 2 fatores
 Comunalidades 
X1 ,657 
X9 ,644 
X10 ,758 
28
X10 ,758 
X11 ,536 
X13 ,497 
X16 ,719 
X17 ,670 
X18 ,548 
 
Cargas FatoriaisCargas Fatoriais
 F1 F2 
X1 ,678 ,445 
X9 -,549 ,585 
X10 ,719 ,492 
29
X10 ,719 ,492 
X11 -,633 ,367 
X13 ,679 ,192 
X16 ,751 ,392 
X17 -,593 ,564 
X18 -,686 ,279 
 
Gráfico das Cargas FatoriaisGráfico das Cargas Fatoriais
0,2
0,4
0,6
0,8
1 F2
30
-1
-0,8
-0,6
-0,4
-0,2
0
0,2
-1 -0,5 0 0,5 1
F1
RotaçãoRotação
0,2
0,4
0,6
0,8
1 F2
31
-1
-0,8
-0,6
-0,4
-0,2
0
0,2
-1 -0,5 0 0,5 1
F1
Cargas Fatoriais RotacionadasCargas Fatoriais Rotacionadas
 F1* F2* 
X1 ,804 -,101 
X9 -,038 ,802 
X10 ,866 -,092 
32
X10 ,866 -,092 
X11 -,244 ,690 
X13 ,641 -,294 
X16 ,826 -,189 
X17 -,086 ,814 
X18 -,341 ,657 
 
Cargas Fatoriais RotacionadasCargas Fatoriais Rotacionadas
 F1* F2* 
X1 ,804 -,101 
X9 -,038 ,802 
X10 ,866 -,092 
X11 -,244 ,690 
X1 Sinto-me bem
X9 Preocupo-me demais com as coisas sem
importância
X10 Sou feliz
X11 Deixo-me afetar muito pelas coisas
X13 Sinto-me seguro
33
X11 -,244 ,690 
X13 ,641 -,294 
X16 ,826 -,189 
X17 -,086 ,814 
X18 -,341 ,657 
 
X13 Sinto-me seguro
X16 Estou satisfeito
X17 As vezes idéias sem importância me
entram na cabeça e ficam me preocupando
X18 Levo os desapontamentos tão a sérioque
não consigo tirá-los da cabeça
InterpretaçãoInterpretação
• Fator 1: Satisfação pessoal
34
• Fator 2: Dificuldade em lidar com 
problemas
0,4
0,6
0,8
1
Gráfico das Cargas Fatoriais Gráfico das Cargas Fatoriais 
RotacionadasRotacionadas
F2
35-1
-0,8
-0,6
-0,4
-0,2
0
0,2
0,4
-1 -0,5 0 0,5 1
F1
Rotação VarimaxRotação Varimax
Objetivo: facilitar a interpretação dos
fatores, buscando que cada variável esteja
mais fortemente associada com apenas
ΨΣX 
T** )Var(
36
mais fortemente associada com apenas
um fator.
Rotação ortogonal: comunalidades e
explicação conjunta dos fatores não se
altera. A explicação de cada fator
isoladamente pode ser alterada.
Rotação Rotação -- comentários comentários 
adicionaisadicionais
F2
A rotação VARIMAX mantém a
suposição inicial de fatores não
correlacionados, sendo uma
rotação do tipo ortogonal. Outras
ortogonais existem.
37
F1
ortogonais existem.
Há outros tipos de transformação
que consistem em
transformações não ortogonais
que geram fatores
correlacionados. (vide figura)
Escores FatoriaisEscores Fatoriais
• Métodos dos mínimos quadrados ponderados
xi -  =  fi + i
38
Minimizar: (xi -  -  fi)T -1 (xi -  -  fi)
EMQ(fi) = (T -1 )-1 T -1 (xi - )
Escores FatoriaisEscores Fatoriais
• Métodos da regressão
f e  : distribuição normal







 



 
N
x
,0

39
ER(fi) = T ( T + )-1 (xi - )
EMQ(f) = [ I + (T -1 )-1 ] ER(f)



















 

m
Tmp I
N
f
x
,0

Escores FatoriaisEscores Fatoriais
• Métodos da regressão
Cov(X-μ, FT) = Cov(ΦF +ε, FT) 
40
Cov(X-μ, F ) = Cov(ΦF +ε, F ) 
= Φ Cov(F, FT) = Φ E(FFT) = Φ
Correlação parcialCorrelação parcial


























2221
1211
2
1 ,
0
0
N
X
X
Considere o vetor X particionado
41
21
1
2212112.1121 )|(  XXCov
A correlação parcial entre dois elemento de X, digamos 
X11 e X12 é análoga à correlação, porém é obtida de Σ11.2
Viabilidade da AFViabilidade da AF
matriz anti-imagem
X1 X9 X10 X11 X13 X16 X17 X18
X1
X9 -0.03
X10 -0.34 -0.02
X11 0.00 -0.22 -0.02
42
X11 0.00 -0.22 -0.02
X13 -0.08 0.09 -0.14 0.14
X16 -0.15 0.00 -0.43 0.07 -0.26
X17 0.00 -0.34 0.00 -0.17 0.08 -0.02
X18 0.11 -0.11 -0.03 -0.24 0.03 0.12 -0.24
Coeficiente de correlação parcial entre os pares, excluindo-
se o efeito das demais variáveis.
Esperam-se valores baixos.
Viabilidade da AFViabilidade da AF
Coeficiente KMO: Kaiser-Meyer-Olkin





p
i
p
ji
j
ijr
KMO
1 1
2
43
aij é a correlação parcial entre Xi e Xj, 
eliminado o efeito das demais variáveis
 
 






 p
i
p
i
p
ji
j
ij
p
ji
j
ij
ji
ar
KMO
1 1 1
2
1
2
Interpretação da KMOInterpretação da KMO
Escala IDATE: 0,841
KMO Interpretação
0,90 - 1,00 Excelente
0,80 - 0,90 Ótimo
0,70 - 0,80 Bom
0,60 - 0,70 Regular
44
0,60 - 0,70 Regular
0,50 - 0,60 Ruim
0,00 - 0,50 Inadequado
0,80 - 1,00 Excelente
0,70 - 0,80 Ótimo
0,60 - 0,70 Bom
0,50 - 0,60 Regular
0,00 - 0,50 Insuficiente
Viabilidade da AFViabilidade da AF
MSA: Measure of sampling adequacy


p
j
ijr
1
2
45
aij é a correlação parcial entre Xi e Xj, 
eliminado o efeito das demais variáveis









 p
ij
j
ij
p
ij
j
ij
ij
j
i
ar
MSA
1
2
1
2
1
Interpretação da MSAInterpretação da MSA
Para o exemplo IDATE
Variável MSA
X1 0.853
X9 0.818
46
X9 0.818
X10 0.789
X11 0.865
X13 0.899
X16 0.820
X17 0.820
X18 0.878
Média 0.843
Avaliação do ajuste do Avaliação do ajuste do 
modelomodelo
 ˆˆˆˆ T  ˆ
esR
47
resumo: raiz do quadrado médio residual
2/)1(
)ˆ(
1 1
2




 
pp
RQMR
p
i
p
j
ijij 
Exemplo IDATEExemplo IDATE
RQMR = 0,106
X1 X9 X10 X11 X13 X16 X17 X18
X1
X9 -0.05
X10 -0.11 -0.05
48
X10 -0.11 -0.05
X11 0.01 -0.14 0.01
X13 -0.14 0.02 -0.10 0.03
X16 -0.15 -0.01 -0.07 0.00 -0.06
X17 -0.04 -0.12 -0.04 -0.16 0.04 0.01
X18 0.00 -0.14 0.04 -0.08 0.10 0.03 -0.09
Teste para o número de fatores Teste para o número de fatores 
(amostras grandes)(amostras grandes)
Teste da razão de verossimilhanças
H0: Σ = ΦΦT + Ψ
H : qualquer outra matriz positiva definida
49
20
0
0
lnln2  











Hsob
n 

H1: qualquer outra matriz positiva definida
ν = p(p+1)/2 ν0 = pm + p - m(m-1)/2
ν-ν0 = [(p-m)2 - (p+m)]/2
X1
X10
X13
X16
F1
1
10
13
16
X1
X10
X13
X16
F1
1
10
13
16
50
X9
X11
X17
X18
F2
9
11
17
18
X9
X11
X17
X18
F2
9
11
17
18
ComentáriosComentários
Sucesso
• Número pequeno de fatores
• fatores interpretáveis
Insucesso
• Tamanho insuficiente da amostra
51
• Tamanho insuficiente da amostra
• variáveis com fraca dependência
• estrutura não homogênea (grupos)
Teste de Esfericidade
• Hipótese de que as variáveis são não 
correlacionadas (matriz de correlações)

Continue navegando