Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Facultad de Ciencias Económicas y Empresariales Universidad de los Andes 1 EJEMPLO - ANÁLISIS DE FACTORES COMANDOS STATA Se está interesado en conocer aspectos actitudinales y sicológicos que expliquen el comportamiento de compra de pollo en cinco países de Europa. La base de datos contiene 500 casos de cinco países europeos (UK, Italia, Alemania, Países Bajos y Francia) y 138 variables (bbdd: trust.dta). Se aplicó un análisis de factores para evaluar, si en promedio, los encuestados confiaban en fuentes que son parecidas en ciertos aspectos. La confianza a cada fuente de información se midió en una escala de 1 a 7, siendo 1 completamente no confiable, 4 ninguno y 7 completamente confiable. Se evaluaron 23 fuentes diferentes. ANÁLISIS DE FACTORES Lo primero que se debe hacer es ver si es factible realizar un análisis de factores, es decir, si se cumplen los supuestos. Para esto, se debe bajar desde la web el programa factortest y aplicarlo a los datos en Stata. Bajar programa factortest.do (extensión .do) a. Pasos i. Escribir en Stata: findit factortest ii. Luego, aparecerá lo siguiente: 1 package found (Stata Journal and STB listed first) ---------------------------------------------------- factortest from http://fmwww.bc.edu/RePEc/bocode/f 'FACTORTEST': module to perform tests for appropriateness of factor analysis / factortest performs Bartlett's test for sphericity and calculates / the Kaiser-Meyer-Olkin Measure of Sampling Adequacy. Both tests / should be used prior to a factor or a principal component / iii. Dar click en línea en azul (factortest from…) iv. Luego, dar click en “click here to install” v. Aparecerá mensaje que indica que se instaló Entonces, usar programa factortest con el set de variables a incluir en el análisis de factores para evaluar factibilidad. En pantalla comando de stata se escribe: factortest q43a q43b q43c q43d q43e q43f q43g q43h q43i q43j q43k q43l q43m q43n q43o q43p q43q q43r q43s q43t q43u q43v q43w Se obtendría lo siguiente: Facultad de Ciencias Económicas y Empresariales Universidad de los Andes 2 Determinant of the correlation matrix Det = 0.000 Bartlett test of sphericity Chi-square = 4315.522 Degrees of freedom = 253 p-value = 0.000 H0: variables are not intercorrelated Kaiser-Meyer-Olkin Measure of Sampling Adequacy KMO = 0.893 Este programa entrega el test de esfericidad de Bartlett, él que en este caso rechaza la hipótesis nula de que la matriz de correlaciones es una matriz identidad (p<0.05). Al mismo tiempo, entrega el KMO, que indica si las correlaciones parciales entre variables son bajas. En este caso, el KMO > 0,7… entonces, se concluye que las correlaciones parciales son bajas. Con estos dos indicadores, es posible asegurar que es factible realizar un análisis de factores, pues existirían correlaciones relevantes entre las variables. Si se quiere1 ver la matriz de correlaciones entre las variables, se usa comando correlate: correlate q43a q43b q43c q43d q43e q43f q43g q43h q43i q43j q43k q43l q43m q43n q43o q43p q43q q43r q43s q43t q43u q43v q43w Como son muchas variables aparecerá así: (obs=358) | q43a q43b q43c q43d q43e q43f q43g q43h q43i q43j q43k q43l -------------+------------------------------------------------------------------------------------------------------------ q43a | 1.0000 q43b | 0.6387 1.0000 q43c | 0.3388 0.3681 1.0000 q43d | 0.4100 0.4086 0.5802 1.0000 q43e | 0.3960 0.4178 0.4242 0.5394 1.0000 q43f | 0.2989 0.4421 0.1569 0.2686 0.4269 1.0000 q43g | 0.1789 0.3952 0.1989 0.2545 0.2843 0.3755 1.0000 q43h | 0.2255 0.3628 0.2580 0.1996 0.2017 0.3583 0.5990 1.0000 q43i | 0.1792 0.3553 0.2616 0.2495 0.3088 0.3569 0.6605 0.5686 1.0000 q43j | 0.1171 0.3409 0.1558 0.2577 0.2490 0.4486 0.4802 0.4080 0.6408 1.0000 q43k | 0.1489 0.3177 0.1861 0.2397 0.2692 0.5073 0.3387 0.3830 0.4656 0.7125 1.0000 q43l | 0.0475 0.1908 0.3534 0.3043 0.2556 0.2100 0.3377 0.3413 0.3745 0.3696 0.4258 1.0000 q43m | -0.0112 0.1175 0.3026 0.2126 0.1794 0.2146 0.2080 0.2675 0.2645 0.2811 0.4054 0.7253 q43n | 0.0754 0.2113 0.2522 0.2680 0.2645 0.1850 0.3825 0.3664 0.4676 0.3537 0.2647 0.4278 q43o | 0.1732 0.3023 0.1835 0.1524 0.2708 0.3861 0.4534 0.4604 0.6370 0.6016 0.4619 0.3796 q43p | 0.2041 0.3238 0.1850 0.2275 0.2373 0.2733 0.2747 0.3102 0.2977 0.3738 0.3839 0.3238 q43q | 0.1860 0.3672 0.1554 0.2036 0.2641 0.2996 0.4118 0.3615 0.3996 0.3993 0.3886 0.3547 q43r | 0.2548 0.4304 0.1450 0.2713 0.3371 0.3962 0.3109 0.3132 0.3016 0.4020 0.5021 0.3169 q43s | 0.1213 0.2238 0.1445 0.2016 0.2092 0.2869 0.2831 0.3232 0.2899 0.3670 0.4119 0.3605 q43t | 0.0628 0.2107 0.1503 0.2070 0.2209 0.3156 0.2440 0.3350 0.2873 0.3127 0.3952 0.2921 q43u | 0.1522 0.3338 0.1513 0.2390 0.2360 0.2874 0.3110 0.2940 0.2917 0.3598 0.3776 0.3596 q43v | 0.1776 0.3263 0.1687 0.3132 0.2257 0.3261 0.2055 0.2450 0.2330 0.3761 0.4044 0.3251 q43w | 0.2984 0.3905 0.1873 0.2314 0.2424 0.2761 0.2228 0.2398 0.2270 0.2415 0.2815 0.1941 | q43m q43n q43o q43p q43q q43r q43s q43t q43u q43v q43w -------------+--------------------------------------------------------------------------------------------------- q43m | 1.0000 q43n | 0.4126 1.0000 q43o | 0.3283 0.5439 1.0000 q43p | 0.3712 0.3477 0.3988 1.0000 q43q | 0.3251 0.3847 0.4040 0.6933 1.0000 q43r | 0.2910 0.1686 0.3174 0.4482 0.4899 1.0000 q43s | 0.2967 0.3159 0.4165 0.4366 0.5421 0.4312 1.0000 q43t | 0.2955 0.3006 0.3558 0.4117 0.4362 0.4047 0.5647 1.0000 q43u | 0.3537 0.3850 0.3978 0.5188 0.6395 0.4091 0.6325 0.5898 1.0000 q43v | 0.3183 0.2640 0.3134 0.5181 0.5247 0.4840 0.5993 0.5023 0.6593 1.0000 q43w | 0.0966 0.1698 0.3127 0.2718 0.3938 0.3769 0.3400 0.3083 0.3547 0.3733 1.0000 1 Esto se hace solo si el analista desea ver las correlaciones bivariadas entre variables previo a aplicar el análisis factorial. Facultad de Ciencias Económicas y Empresariales Universidad de los Andes 3 Entonces, dado que se cumplen los supuestos, se procede a hacer análisis de factores, aplicando comando factor. Stata posee 4 métodos de análisis factorial: componentes principales (pcf), factor principal (pf), factor principal iterado (ipf) y factores de máxima verosimilitud (ml). Para una mayor descripción, ver manual stata. En el ejemplo se usará ml, lo que se indica colocando una coma (,) y ml [si no se coloca nada, por defecto asume pf]: factor q43a q43b q43c q43d q43e q43f q43g q43h q43i q43j q43k q43l q43m q43n q43o q43p q43q q43r q43s q43t q43u q43v q43w, ml (obs=358) number of factors adjusted to 16 Iteration 0: log likelihood = -151.5907 . . . Iteration 14: log likelihood = -.73768389 Factor analysis/correlation Number of obs = 358 Method: maximum likelihood Retained factors = 16 Rotation: (unrotated) Number of params = 248Schwarz's BIC = 1459.85 Log likelihood = -.7376839 (Akaike's) AIC = 497.475 Beware: solution is a Heywood case (i.e., invalid or boundary values of uniqueness) Un Heywood case es un problema con los supuestos del algoritmo de máxima verosimilitud. Es factible seguir analizando, pero con precaución. Matriz con eigenvalue (raíz latente) y porcentaje de varianza explicado por cada factor más el acumulado. -------------------------------------------------------------------------- Factor | Eigenvalue Difference Proportion Cumulative -------------+------------------------------------------------------------ Factor1 | 6.82225 5.39733 0.3819 0.3819 Factor2 | 1.42492 0.46719 0.0798 0.4617 Factor3 | 0.95773 -0.41627 0.0536 0.5153 Factor4 | 1.37400 0.32268 0.0769 0.5922 Factor5 | 1.05132 -0.21963 0.0589 0.6511 Factor6 | 1.27095 0.41008 0.0712 0.7223 Factor7 | 0.86087 -0.10517 0.0482 0.7704 Factor8 | 0.96604 0.31969 0.0541 0.8245 Factor9 | 0.64635 0.03113 0.0362 0.8607 Factor10 | 0.61522 0.13375 0.0344 0.8952 Factor11 | 0.48147 0.05576 0.0270 0.9221 Factor12 | 0.42571 0.00581 0.0238 0.9459 Factor13 | 0.41990 0.19541 0.0235 0.9695 Factor14 | 0.22449 0.03997 0.0126 0.9820 Factor15 | 0.18452 0.04787 0.0103 0.9923 Factor16 | 0.13665 . 0.0077 1.0000 -------------------------------------------------------------------------- LR test: independent vs. saturated: chi2(253) = 4327.91 Prob>chi2 = 0.0000 LR test: 16 factors vs. saturated: chi2(5) = 1.40 Prob>chi2 = 0.9247 (tests formally not valid because a Heywood case was encountered) Facultad de Ciencias Económicas y Empresariales Universidad de los Andes 4 Para que análisis sea válido, esperamos rechazar en el primer test (p<0.05) y no rechazar en el segundo test. El primer test evalúa la esfericidad (independencia) y el segundo nos indica si es necesario obtener más factores, si no rechaza no es necesario más que los obtenidos. Luego, se muestra la matriz de cargas factoriales, pero a diferencia de otros softwares, en lugar de informar comunalidad informa varianza única. -------------------------------------------------------------------------------------------------------------------------------------- Variable | Factor1 Factor2 Factor3 Factor4 Factor5 Factor6 Factor7 Factor8 Factor9 Factor10 Factor11 Factor12 -------------+------------------------------------------------------------------------------------------------------------------------ q43a | 0.3183 0.0509 -0.0757 0.2640 0.0486 -0.7382 0.4463 0.0943 0.0686 -0.0431 -0.0245 0.0128 q43b | 0.5304 0.0705 -0.0499 0.2075 0.1112 -0.3827 0.2964 -0.0053 0.0540 0.1206 0.0045 -0.0523 q43c | 0.3408 0.1305 0.2107 0.9069 0.0044 0.0000 -0.0000 -0.0000 -0.0000 0.0000 -0.0000 -0.0000 q43d | 0.4187 -0.0095 0.0766 0.4661 -0.0319 -0.1386 0.1503 -0.0450 0.1509 0.0146 0.1305 0.2219 q43e | 0.4572 0.1293 -0.0914 0.2983 0.0629 -0.1671 0.0874 0.0417 0.0436 0.0066 0.2398 0.1388 q43f | 0.7434 0.1788 -0.6443 0.0176 -0.0046 0.0000 -0.0000 -0.0000 -0.0000 -0.0000 -0.0000 0.0000 q43g | 0.5546 0.3583 0.1535 -0.0769 0.1230 -0.0086 0.0333 0.0234 0.0294 0.2445 -0.2129 0.0161 q43h | 0.5319 0.2624 0.1303 0.0162 0.0736 -0.0221 0.0501 0.1674 0.0006 0.4190 -0.4008 -0.1034 q43i | 0.6989 0.5679 0.4063 -0.1502 -0.0362 -0.0000 -0.0000 -0.0000 0.0000 -0.0000 0.0000 0.0000 q43j | 0.6538 0.2092 0.1126 -0.1302 0.0075 0.3862 0.5321 -0.1644 0.0372 -0.0152 -0.0253 0.0140 q43k | 0.6243 0.0792 -0.0463 -0.0303 0.0418 0.2903 0.3344 0.0194 0.1796 0.1022 0.0894 -0.0455 q43l | 0.4383 0.0342 0.1934 0.1746 0.0998 0.2883 0.0410 0.4335 0.3634 -0.0101 -0.0199 0.0299 q43m | 0.3876 -0.0370 0.1076 0.1679 0.1078 0.3417 -0.0273 0.5613 0.4533 -0.1189 -0.0253 -0.0244 q43n | 0.4290 0.1384 0.2463 0.0391 0.1377 0.1442 0.0360 0.3431 -0.0853 -0.0515 -0.0732 0.1666 q43o | 0.5990 0.2496 0.1581 -0.0957 0.0563 0.1724 0.2733 0.4158 -0.4214 -0.0466 0.0341 -0.0558 q43p | 0.5294 -0.1928 0.1300 0.0005 0.4283 0.0366 0.1075 0.1261 0.0159 -0.0122 0.0174 -0.0544 q43q | 0.5975 -0.1326 0.1799 -0.0795 0.7660 -0.0000 -0.0000 -0.0000 -0.0000 -0.0000 -0.0000 -0.0000 q43r | 0.5523 -0.1318 -0.0164 -0.0258 0.1871 -0.0185 0.1779 0.0619 0.1760 0.3560 0.3778 -0.2578 q43s | 0.5591 -0.2650 0.1237 -0.0423 0.1923 0.0946 0.0607 0.1644 -0.0884 0.2333 0.0712 0.2293 q43t | 0.5191 -0.1731 0.0597 -0.0189 0.1186 0.1159 -0.0237 0.1635 -0.0515 0.3199 0.1200 0.2809 q43u | 0.5941 -0.3179 0.1479 -0.0463 0.2769 0.0510 0.0369 0.1647 -0.0419 0.1421 0.0301 0.3266 q43v | 0.7436 -0.6426 0.1728 -0.0409 -0.0510 -0.0000 -0.0000 -0.0000 -0.0000 -0.0000 -0.0000 -0.0000 q43w | 0.4185 -0.1070 0.0250 0.0581 0.1693 -0.1461 0.1331 0.0569 -0.1170 0.1724 0.1441 -0.0341 -------------------------------------------------------------------------------------------------------------------------------------- --------------------------------------------------------------------- Variable | Factor13 Factor14 Factor15 Factor16 | Uniqueness -------------+----------------------------------------+-------------- q43a | -0.0404 -0.0166 -0.0114 -0.0096 | 0.0557 q43b | 0.0939 0.2217 0.1625 0.0435 | 0.3150 q43c | -0.0000 0.0000 0.0000 -0.0000 | 0.0000 q43d | 0.3716 -0.1214 -0.0490 0.0678 | 0.3076 q43e | 0.2827 -0.0866 -0.0172 -0.0037 | 0.4692 q43f | -0.0000 0.0000 -0.0000 -0.0000 | 0.0000 q43g | 0.2322 0.1090 0.0268 -0.1254 | 0.3293 q43h | 0.0368 -0.0984 -0.0233 0.0549 | 0.2331 q43i | -0.0000 -0.0000 0.0000 0.0000 | 0.0000 q43j | -0.0005 0.0032 0.0037 -0.0015 | 0.0372 q43k | -0.1465 -0.0558 -0.0651 0.0569 | 0.3179 q43l | 0.0820 0.0874 -0.1563 -0.0539 | 0.2810 q43m | -0.0370 0.0036 0.0431 0.0215 | 0.1399 q43n | 0.1910 -0.0288 0.0767 0.0393 | 0.4880 q43o | 0.0320 -0.0046 -0.0022 -0.0064 | 0.0792 q43p | -0.0187 -0.1548 0.1633 0.0598 | 0.3952 q43q | 0.0000 -0.0000 -0.0000 0.0000 | 0.0000q43r | 0.0307 -0.0232 0.0517 -0.0624 | 0.2310 q43s | -0.1591 -0.0314 -0.1497 -0.1462 | 0.3335 q43t | -0.1836 -0.1001 0.0508 0.1139 | 0.3842 q43u | -0.0934 0.1190 0.1310 -0.0260 | 0.2440 q43v | 0.0000 -0.0000 -0.0000 -0.0000 | 0.0000 q43w | 0.0016 0.2646 -0.2147 0.2463 | 0.4963 --------------------------------------------------------------------- Con estos datos y utilizando criterio de >= 70% de varianza explicada, se decidiría trabajar con 6 factores. Si se baja criterio a 60%, serían 5 factores. No obstante, en el caso del método ml, Stata provee un comando que da una guía adicional (sugerencia) sobre con cuántos factores quedarse. Entonces, para ver qué pasaría con diferentes soluciones de análisis factorial, se utiliza comando estat factors. Se obtendría el siguiente resultado… Facultad de Ciencias Económicas y Empresariales Universidad de los Andes 5 Factor analysis with different numbers of factors (maximum likelihood) ---------------------------------------------------------- #factors | loglik df_m df_r AIC BIC ---------+------------------------------------------------ 1 | -936.157 23 230 1918.314 2007.566 2 | -690.7894 45 208 1471.579 1646.203 3 | -487.2469 66 187 1106.494 1362.609 4 | -338.102 86 167 848.204 1181.93 5 | -233.27 105 148 676.5401 1083.996 6 | -171.0742 123 130 588.1484 1065.454 7 | -126.6057 140 113 533.2114 1076.486 8 | -87.34792 156 97 486.6958 1092.059 9 | -59.89544 171 82 461.7909 1125.362 10 | -42.64307 185 68 455.2861 1173.185 11 | -29.01362 198 55 454.0272 1222.373 12 | -21.71353 210 43 463.4271 1278.339 13 | -11.92471 221 32 465.8494 1323.447 14 | -7.859936 231 22 477.7199 1374.123 15 | -2.281831 240 13 484.5637 1415.892 16 | -.7376838 248 5 497.4754 1459.848 ---------------------------------------------------------- En esta tabla interesan los índices AIC (akaike) y BIC (schwartz): La mejor solución será la que posea AIC y/o BIC más bajo. En caso de no cuadrar ambos índices, priorizar BIC pues exige más a al análisis. En este caso, basándonos en BIC, optaríamos por trabajar con una solución con 6 factores. Entonces, se estimará nuevamente el análisis pero sólo con 6 factores. Para eso se utilizará la opción factors(#) en que # indica cuantos factores se retendrán (se agrega al final pasado la coma). factor q43a q43b q43c q43d q43e q43f q43g q43h q43i q43j q43k q43l q43m q43n q43o q43p q43q q43r q43s q43t q43u q43v q43w, ml factors(6) (obs=358) Iteration 0: log likelihood = -218.25229 . . . Iteration 16: log likelihood = -171.07419 Factor analysis/correlation Number of obs = 358 Method: maximum likelihood Retained factors = 6 Rotation: (unrotated) Number of params = 123 Schwarz's BIC = 1065.45 Log likelihood = -171.0742 (Akaike's) AIC = 588.148 -------------------------------------------------------------------------- Factor | Eigenvalue Difference Proportion Cumulative -------------+------------------------------------------------------------ Factor1 | 7.55745 5.85632 0.5549 0.5549 Factor2 | 1.70114 0.17133 0.1249 0.6798 Factor3 | 1.52981 0.02578 0.1123 0.7921 Factor4 | 1.50403 0.76670 0.1104 0.9026 Factor5 | 0.73733 0.14763 0.0541 0.9567 Factor6 | 0.58969 . 0.0433 1.0000 -------------------------------------------------------------------------- LR test: independent vs. saturated: chi2(253) = 4327.91 Prob>chi2 = 0.0000 LR test: 6 factors vs. saturated: chi2(130) = 330.20 Prob>chi2 = 0.0000 Facultad de Ciencias Económicas y Empresariales Universidad de los Andes 6 Factor loadings (pattern matrix) and unique variances ----------------------------------------------------------------------------------------- Variable | Factor1 Factor2 Factor3 Factor4 Factor5 Factor6 | Uniqueness -------------+------------------------------------------------------------+-------------- q43a | 0.2788 0.4448 0.4305 0.0134 0.0004 0.3655 | 0.4053 q43b | 0.4991 0.4741 0.2850 0.0097 0.0172 0.4136 | 0.2735 q43c | 0.4246 0.0758 0.5125 -0.1476 0.0663 -0.0929 | 0.5165 q43d | 0.4730 0.2676 0.6402 -0.0525 -0.0637 -0.3182 | 0.1866 q43e | 0.4487 0.2792 0.3687 -0.0639 -0.0201 -0.0361 | 0.5790 q43f | 0.5158 0.2771 -0.0193 -0.0546 -0.2125 0.1585 | 0.5836 q43g | 0.5504 0.2941 -0.1404 -0.2818 0.2831 0.0235 | 0.4307 q43h | 0.5539 0.2055 -0.1310 -0.2027 0.2157 0.0904 | 0.5380 q43i | 0.6352 0.2896 -0.2402 -0.4242 0.2269 -0.0637 | 0.2195 q43j | 0.6681 0.2683 -0.3164 -0.2431 -0.2357 -0.1097 | 0.2549 q43k | 0.6982 0.1170 -0.2394 -0.0955 -0.4676 -0.0019 | 0.2137 q43l | 0.7004 -0.3429 0.0782 -0.0979 0.0448 -0.0516 | 0.3715 q43m | 0.7158 -0.6282 0.0978 -0.0433 -0.0007 0.0737 | 0.0762 q43n | 0.5652 -0.0295 -0.0427 -0.1051 0.3206 -0.1467 | 0.5425 q43o | 0.6376 0.1712 -0.2805 -0.1743 0.1508 -0.0147 | 0.4322 q43p | 0.6050 0.0755 -0.0798 0.3057 0.0817 0.0570 | 0.5186 q43q | 0.6420 0.1665 -0.1622 0.3357 0.1925 0.0499 | 0.3816 q43r | 0.5800 0.1959 -0.0302 0.2092 -0.1788 0.1408 | 0.5288 q43s | 0.5875 0.1167 -0.1824 0.4070 0.0501 -0.1412 | 0.4199 q43t | 0.5450 0.0893 -0.1465 0.3406 0.0288 -0.1396 | 0.5372 q43u | 0.6402 0.1071 -0.1248 0.4916 0.1441 -0.0783 | 0.2945 q43v | 0.6013 0.1329 -0.0374 0.4819 -0.0570 -0.0999 | 0.3739 q43w | 0.3941 0.2884 0.0315 0.2123 0.0096 0.1137 | 0.7025 ----------------------------------------------------------------------------------------- Sin embargo, al analizar la matriz de cargas factoriales se observa con que no queda tan claro que variable correlaciona con que factor. Para verlo más facilmente, se puede estimar la solución factorila nuevamente, pero agregando comando blanks(.4) al final. La primera parte es igual… iteraciones, eigenvalues y varianzas. Pero cambia matriz de cargas factoriales. ----------------------------------------------------------------------------------------- Variable | Factor1 Factor2 Factor3 Factor4 Factor5 Factor6 | Uniqueness -------------+------------------------------------------------------------+-------------- q43a | 0.4448 0.4305 | 0.4053 q43b | 0.4991 0.4741 0.4136 |0.2735 q43c | 0.4246 0.5125 | 0.5165 q43d | 0.4730 0.6402 | 0.1866 q43e | 0.4487 | 0.5790 q43f | 0.5158 | 0.5836 q43g | 0.5504 | 0.4307 q43h | 0.5539 | 0.5380 q43i | 0.6352 -0.4242 | 0.2195 q43j | 0.6681 | 0.2549 q43k | 0.6982 -0.4676 | 0.2137 q43l | 0.7004 | 0.3715 q43m | 0.7158 -0.6282 | 0.0762 q43n | 0.5652 | 0.5425 q43o | 0.6376 | 0.4322 q43p | 0.6050 | 0.5186 q43q | 0.6420 | 0.3816 q43r | 0.5800 | 0.5288 q43s | 0.5875 0.4070 | 0.4199 q43t | 0.5450 | 0.5372 q43u | 0.6402 0.4916 | 0.2945 q43v | 0.6013 0.4819 | 0.3739 q43w | | 0.7025 ----------------------------------------------------------------------------------------- (blanks represent abs(loading)<.4) Dados los resultados, hay que rotar: Para hacer una rotación ortogonal VARIMAX se utiliza comando rotate. Facultad de Ciencias Económicas y Empresariales Universidad de los Andes 7 En este caso, sería rotate, blanks(.4) para mantener visibles solo cargas factoriales sobre 0,4 ----------------------------------------------------------------------------------------- Variable | Factor1 Factor2 Factor3 Factor4 Factor5 Factor6 | Uniqueness -------------+------------------------------------------------------------+-------------- q43a | 0.6996 | 0.4053 q43b | 0.7454 | 0.2735 q43c | 0.5761 | 0.5165 q43d | 0.8517 | 0.1866 q43e | 0.4895 | 0.5790 q43f | 0.4289 | 0.5836 q43g | 0.6847 | 0.4307 q43h | 0.5705 | 0.5380 q43i | 0.8133 | 0.2195 q43j | 0.5122 0.6419 | 0.2549 q43k | 0.7650 | 0.2137 q43l | 0.6739 | 0.3715 q43m | 0.9250 | 0.0762 q43n | 0.4934 | 0.5425 q43o | 0.6100 | 0.4322 q43p | 0.5732 | 0.5186 q43q | 0.6665 | 0.3816 q43r | 0.4341 | 0.5288 q43s | 0.6996 | 0.4199 q43t | 0.6102 | 0.5372 q43u | 0.7854 | 0.2945 q43v | 0.7134 | 0.3739 q43w | | 0.7025 ----------------------------------------------------------------------------------------- (blanks represent abs(loading)<.4) Al rotar se aclara más la asociación factor/variable. Salvo el caso w en que en ambas soluciones de factores no aparece asociada a ningún factor fuertemente, como se ve posee una alta varianza única. Podría ser que algún otro investigador sugiriera hacer otra rotación ortogonal u oblicua para comparar y ver si se mejora el ajuste. A continuación, es necesario interpretar qué son los factores viendo para cada factor con qué variables se relaciona más fuertemente, y, a partir de ahí, darle un nombre a cada factor de acuerdo a esto. Esto queda como tarea para el lector. Si se desea ver el gráfico de contraste de caída se usa comando screeplot. Al usarlo en el caso de 6 factores aparece un gráfico como el siguiente: 0 2 4 6 8 Ei ge nv al ue s 0 5 10 15 20 25 Number Scree plot of eigenvalues after factor Facultad de Ciencias Económicas y Empresariales Universidad de los Andes 8 Para agregar los puntajes factoriales a los encuestados y poder utilizar estos en lugar de los valores de las variables, se usa el siguiente comando: predict f1 f2 f3 f4 f5 f6, r Esto agregara para cada encuestado (sin missing values en las variables usadas en el análisis) valores para los factores estimados. Estos valores estarán basados en la última estimación hecha en Stata (en este caso con rotación varimax) Otros comandos adicionales: Comando para ver matriz de correlaciones entre factores: estat common Correlation matrix of the varimax rotated common factors -------------------------------------------------------------------------- Factors | Factor1 Factor2 Factor3 Factor4 Factor5 Factor6 -------------+------------------------------------------------------------ Factor1 | 1 Factor2 | 0 1 Factor3 | 0 0 1 Factor4 | 0 0 0 1 Factor5 | 0 0 0 0 1 Factor6 | 0 0 0 0 0 1 -------------------------------------------------------------------------- Si se desea llevar a cabo una rotación oblicua: rotate, oblique nombre rotación Ejemplo: Rotate, oblique promax(2) blanks(.4) Se verá salida en Stata en clases.
Compartir