Baixe o app para aproveitar ainda mais
Prévia do material em texto
Análise FatorialAnálise Fatorial 1 Factor analysis Análise FatorialAnálise Fatorial Objetivo: Estudar a estrutura de dependência existente em um conjunto de variáveis através da criação de 2 fatores que, eventualmente, expressam construtos subjacentes aos dados. Spearman (1904) - medida de inteligência Análise FatorialAnálise Fatorial Situação comum: observar grande número de variáveis 3 • Como caracterizar a amostra • Como descrever a inter-relação entre as variáveis ConstrutosConstrutos Definir o que e como medir • nível de ansiedade 4 • nível de ansiedade • satisfação • bem-estar • percepção Exemplo: Escala IDATEExemplo: Escala IDATE--TT X1 Sinto-me bem X9 Preocupo-me demais com as coisas sem importância X10 Sou feliz X11 Deixo-me afetar muito pelas coisas 5 X11 Deixo-me afetar muito pelas coisas X13 Sinto-me seguro X16 Estou satisfeito X17 Às vezes idéias sem importância me entram na cabeça e ficam me preocupando X18 Levo os desapontamentos tão a sério que não consigo tirá-los da cabeça Matriz de CorrelaçãoMatriz de Correlação X1 X10 X13 X16 X9 X11 X17 X18 X1 1.00 X10 0.58 1.00 X13 0.39 0.47 1.00 6 X13 0.39 0.47 1.00 X16 0.51 0.66 0.54 1.00 X9 -0.14 -0.16 -0.31 -0.22 1.00 X11 -0.20 -0.24 -0.38 -0.32 0.46 1.00 X17 -0.18 -0.20 -0.33 -0.25 0.53 0.46 1.00 X18 -0.32 -0.33 -0.37 -0.40 0.40 0.48 0.48 1.00 Modelo de Análise FatorialModelo de Análise Fatorial Variáveis originais X1 Fatores comuns F1 AF 7 X1 X2 Xp F1 F2 Fm m < p Modelo de Análise FatorialModelo de Análise Fatorial 2m2m 222121 22 1m1m 212111 11 ... F ...F F X F ...F F X 8 pmpm 2p21p1 p F ...F F X ... p F1, …, Fm: fatores comuns 1, …, p: fatores únicos ou específicos Modelo de Análise FatorialModelo de Análise Fatorial Modelo na forma matricial: X - = F + X = (X1, X2, …, Xp)T, F = (F1, F2, …, Fm)T, = ( , , …, )T e 9 = ( 1, 2, …, p)T e pmp2p1 2m2221 1m1211 l Modelo esquematizadoModelo esquematizado X1 X2 1 2 F1 F 10 Xp p F2 Fm Características impostas ao Características impostas ao modelomodelo • Os fatores únicos são não correlacionados. • Os fatores comuns e únicos são não correlacionados entre si. 11 correlacionados entre si. • Os fatores comuns são não correlacionados (esta suposição pode ser abandonada em alguns tipos de AF). • As variâncias dos fatores comuns são iguais a 1. Características impostas ao Características impostas ao modelomodelo • E(F) = 0 Cov(F) = E(FFT) = I 12 • E(ε) = 0 Cov(ε) = E(εεT) = (diagonal) • Cov(ε,F) = E(εFT) = 0 Matriz de covariâncias de XMatriz de covariâncias de X (X-μ)(X-μ)T = (ΦF+ε)(ΦF+ε)T = (ΦF+ε)(FTΦT+εT) = ΦFFTΦT + ΦFεT + εFTΦT + εεT 13 Σ = Cov(X) = E[(X-μ)(X-μ)T] = Φ E(FFT)ΦT + Φ E(FεT) + E(εFT)ΦT + E(εεT) Σ = ΦΦT + Análise do modeloAnálise do modelo imim 2i21i1i F ...F F X imim 2i21i1i F ...F F VarXVar 14 )Var( ... XVar i 2 im 2 i2 2 i1i 2 i i 2 i 2 i c Ci 2 = comunalidade ou variância comum i = especificidade Análise do modeloAnálise do modelo i 2 i 2 i c Ci 2 = comunalidade ou variância comum: expressa o quanto da variabiliade de Xi é explicada pelo modelo (se Var (Xi)=1 pode ser encarada como uma proporção) 15 ser encarada como uma proporção) i = especificidade: expressa o quanto da variabilidade de Xi não é explicada pelo modelo. Um bom modelo deve apresentar uma comunalidade alta para todas as variáveis Alguns métodos de Alguns métodos de estimaçãoestimação • Máxima verossimilhança: supõe que os dados seguem uma distribuição normal multivariada. 16 multivariada. • Método da componente principal: baseia-se na análise de componentes principais. ~ Método da componente principalMétodo da componente principal Modelo: X = F + ΨΣX T )Var( Decomposição espectral de : ~ ~ ~ ~ ~~ ~ 17 T T ppp T mmm T 111 ...... Σ ~ ~ ~ ~ ~ ~ ~ ~~ , , , Método da componente principalMétodo da componente principal T ppp T ... Σ ~ ~ ~ ~ ~ ~ T ~ ΨΣ ~~ 18 m m2211 ~ , , , Tipi2i1 i ..., , , ~ m j jij 1 22 ii σψ Método da máxima Método da máxima verossimilhançaverossimilhança Suposição: distribuição normal Estimação dos parâmetros 19 Estimação dos parâmetros = T + Restrição: T -1 : diagonal Resultado importanteResultado importante = T + = T (T ortogonal) 20 = T (T ortogonal) T + = ( T)( T)T + = T TT T + = T + = RotaçãoRotação Há infinitas matrizes que resultam na mesma matriz T. Essas matrizes podem ser obtidas através da rotação de uma solução ΨΣX T )Var( 21 obtidas através da rotação de uma solução inicial (por exemplo, oriunda do método das componentes principais). Problema: Como escolher uma boa solução? Rotação Rotação -- Interpretação Interpretação geométricageométrica F2 Exemplo: Solução com dois fatores F1 e F2 definem um plano 22 F1 F1 e F2 definem um plano F1 * e F2 * , obtidos através de uma rotação ortogonal dos eixos, definem o mesmo plano. Logo representam uma solução equivalente. RotaçãoRotação Rotação: ortogonal ou oblíqua Algumas rotações: Varimax (Kaiser): eixos com poucas cargas grandes e muitas cargas próximas de zero Quartimax: cada variável com carga alta em 1 fator e 23 Quartimax: cada variável com carga alta em 1 fator e baixas para os demais Equimax: compromisso entre Quartimax e Varimax Rotações oblíquas: Oblimin, Promax, Orthoblique, Dquart, Doblimin, Orthoblique Quantos fatores usar?Quantos fatores usar? • Critério de Kaiser • Porcentagem da variância total explicada 24 explicada • Atingir comunalidade fixada • Critério scree-test • Métodos inferenciais 2 2,5 3 3,5 4 25 0 0,5 1 1,5 0 2 4 6 8 10 Componentes ExemploExemplo X1 Sinto-me bem X9 Preocupo-me demais com as coisas sem importância X10 Sou feliz X11 Deixo-me afetar muito pelas coisas X13 Sinto-me seguro 26 X13 Sinto-me seguro X16 Estou satisfeito X17 As vezes idéias sem importância me entram na cabeça e ficam me preocupando X18 Levo os desapontamentos tão a sério que não consigo tirá-los da cabeça AutovaloresAutovalores Componente Autovalores % da Variância % Acumulada 1 3,525 44,065 44,065 2 1,504 18,796 62,862 3 ,665 8,311 71,173 27 3 ,665 8,311 71,173 4 ,614 7,677 78,850 5 ,512 6,398 85,247 6 ,444 5,549 90,797 7 ,425 5,314 96,111 8 ,311 3,889 100,000 Comunalidades 2 fatoresComunalidades 2 fatores Comunalidades X1 ,657 X9 ,644 X10 ,758 28 X10 ,758 X11 ,536 X13 ,497 X16 ,719 X17 ,670 X18 ,548 Cargas FatoriaisCargas Fatoriais F1 F2 X1 ,678 ,445 X9 -,549 ,585 X10 ,719 ,492 29 X10 ,719 ,492 X11 -,633 ,367 X13 ,679 ,192 X16 ,751 ,392 X17 -,593 ,564 X18 -,686 ,279 Gráfico das Cargas FatoriaisGráfico das Cargas Fatoriais 0,2 0,4 0,6 0,8 1 F2 30 -1 -0,8 -0,6 -0,4 -0,2 0 0,2 -1 -0,5 0 0,5 1 F1 RotaçãoRotação 0,2 0,4 0,6 0,8 1 F2 31 -1 -0,8 -0,6 -0,4 -0,2 0 0,2 -1 -0,5 0 0,5 1 F1 Cargas Fatoriais RotacionadasCargas Fatoriais Rotacionadas F1* F2* X1 ,804 -,101 X9 -,038 ,802 X10 ,866 -,092 32 X10 ,866 -,092 X11 -,244 ,690 X13 ,641 -,294 X16 ,826 -,189 X17 -,086 ,814 X18 -,341 ,657 Cargas Fatoriais RotacionadasCargas Fatoriais Rotacionadas F1* F2* X1 ,804 -,101 X9 -,038 ,802 X10 ,866 -,092 X11 -,244 ,690 X1 Sinto-me bem X9 Preocupo-me demais com as coisas sem importância X10 Sou feliz X11 Deixo-me afetar muito pelas coisas X13 Sinto-me seguro 33 X11 -,244 ,690 X13 ,641 -,294 X16 ,826 -,189 X17 -,086 ,814 X18 -,341 ,657 X13 Sinto-me seguro X16 Estou satisfeito X17 As vezes idéias sem importância me entram na cabeça e ficam me preocupando X18 Levo os desapontamentos tão a sérioque não consigo tirá-los da cabeça InterpretaçãoInterpretação • Fator 1: Satisfação pessoal 34 • Fator 2: Dificuldade em lidar com problemas 0,4 0,6 0,8 1 Gráfico das Cargas Fatoriais Gráfico das Cargas Fatoriais RotacionadasRotacionadas F2 35-1 -0,8 -0,6 -0,4 -0,2 0 0,2 0,4 -1 -0,5 0 0,5 1 F1 Rotação VarimaxRotação Varimax Objetivo: facilitar a interpretação dos fatores, buscando que cada variável esteja mais fortemente associada com apenas ΨΣX T** )Var( 36 mais fortemente associada com apenas um fator. Rotação ortogonal: comunalidades e explicação conjunta dos fatores não se altera. A explicação de cada fator isoladamente pode ser alterada. Rotação Rotação -- comentários comentários adicionaisadicionais F2 A rotação VARIMAX mantém a suposição inicial de fatores não correlacionados, sendo uma rotação do tipo ortogonal. Outras ortogonais existem. 37 F1 ortogonais existem. Há outros tipos de transformação que consistem em transformações não ortogonais que geram fatores correlacionados. (vide figura) Escores FatoriaisEscores Fatoriais • Métodos dos mínimos quadrados ponderados xi - = fi + i 38 Minimizar: (xi - - fi)T -1 (xi - - fi) EMQ(fi) = (T -1 )-1 T -1 (xi - ) Escores FatoriaisEscores Fatoriais • Métodos da regressão f e : distribuição normal N x ,0 39 ER(fi) = T ( T + )-1 (xi - ) EMQ(f) = [ I + (T -1 )-1 ] ER(f) m Tmp I N f x ,0 Escores FatoriaisEscores Fatoriais • Métodos da regressão Cov(X-μ, FT) = Cov(ΦF +ε, FT) 40 Cov(X-μ, F ) = Cov(ΦF +ε, F ) = Φ Cov(F, FT) = Φ E(FFT) = Φ Correlação parcialCorrelação parcial 2221 1211 2 1 , 0 0 N X X Considere o vetor X particionado 41 21 1 2212112.1121 )|( XXCov A correlação parcial entre dois elemento de X, digamos X11 e X12 é análoga à correlação, porém é obtida de Σ11.2 Viabilidade da AFViabilidade da AF matriz anti-imagem X1 X9 X10 X11 X13 X16 X17 X18 X1 X9 -0.03 X10 -0.34 -0.02 X11 0.00 -0.22 -0.02 42 X11 0.00 -0.22 -0.02 X13 -0.08 0.09 -0.14 0.14 X16 -0.15 0.00 -0.43 0.07 -0.26 X17 0.00 -0.34 0.00 -0.17 0.08 -0.02 X18 0.11 -0.11 -0.03 -0.24 0.03 0.12 -0.24 Coeficiente de correlação parcial entre os pares, excluindo- se o efeito das demais variáveis. Esperam-se valores baixos. Viabilidade da AFViabilidade da AF Coeficiente KMO: Kaiser-Meyer-Olkin p i p ji j ijr KMO 1 1 2 43 aij é a correlação parcial entre Xi e Xj, eliminado o efeito das demais variáveis p i p i p ji j ij p ji j ij ji ar KMO 1 1 1 2 1 2 Interpretação da KMOInterpretação da KMO Escala IDATE: 0,841 KMO Interpretação 0,90 - 1,00 Excelente 0,80 - 0,90 Ótimo 0,70 - 0,80 Bom 0,60 - 0,70 Regular 44 0,60 - 0,70 Regular 0,50 - 0,60 Ruim 0,00 - 0,50 Inadequado 0,80 - 1,00 Excelente 0,70 - 0,80 Ótimo 0,60 - 0,70 Bom 0,50 - 0,60 Regular 0,00 - 0,50 Insuficiente Viabilidade da AFViabilidade da AF MSA: Measure of sampling adequacy p j ijr 1 2 45 aij é a correlação parcial entre Xi e Xj, eliminado o efeito das demais variáveis p ij j ij p ij j ij ij j i ar MSA 1 2 1 2 1 Interpretação da MSAInterpretação da MSA Para o exemplo IDATE Variável MSA X1 0.853 X9 0.818 46 X9 0.818 X10 0.789 X11 0.865 X13 0.899 X16 0.820 X17 0.820 X18 0.878 Média 0.843 Avaliação do ajuste do Avaliação do ajuste do modelomodelo ˆˆˆˆ T ˆ esR 47 resumo: raiz do quadrado médio residual 2/)1( )ˆ( 1 1 2 pp RQMR p i p j ijij Exemplo IDATEExemplo IDATE RQMR = 0,106 X1 X9 X10 X11 X13 X16 X17 X18 X1 X9 -0.05 X10 -0.11 -0.05 48 X10 -0.11 -0.05 X11 0.01 -0.14 0.01 X13 -0.14 0.02 -0.10 0.03 X16 -0.15 -0.01 -0.07 0.00 -0.06 X17 -0.04 -0.12 -0.04 -0.16 0.04 0.01 X18 0.00 -0.14 0.04 -0.08 0.10 0.03 -0.09 Teste para o número de fatores Teste para o número de fatores (amostras grandes)(amostras grandes) Teste da razão de verossimilhanças H0: Σ = ΦΦT + Ψ H : qualquer outra matriz positiva definida 49 20 0 0 lnln2 Hsob n H1: qualquer outra matriz positiva definida ν = p(p+1)/2 ν0 = pm + p - m(m-1)/2 ν-ν0 = [(p-m)2 - (p+m)]/2 X1 X10 X13 X16 F1 1 10 13 16 X1 X10 X13 X16 F1 1 10 13 16 50 X9 X11 X17 X18 F2 9 11 17 18 X9 X11 X17 X18 F2 9 11 17 18 ComentáriosComentários Sucesso • Número pequeno de fatores • fatores interpretáveis Insucesso • Tamanho insuficiente da amostra 51 • Tamanho insuficiente da amostra • variáveis com fraca dependência • estrutura não homogênea (grupos) Teste de Esfericidade • Hipótese de que as variáveis são não correlacionadas (matriz de correlações)
Compartilhar