Baixe o app para aproveitar ainda mais
Prévia do material em texto
ENP157 – Estatística 2 – Profa.: Luciana Reis Análise Fatorial Aula 18 ENP157 – Estatística 2 – Profa.: Luciana Reis Sumário 1. Introdução; 2. Modelo de Análise Fatorial Via Matriz de Correlação; 3. Estimação do número de fatores m; 4. Métodos de estimação para as matrizes Lpxm e ψpxp; 5. Estimação dos Escores dos Fatores F para cada elemento amostral; ENP157 – Estatística 2 – Profa.: Luciana Reis Sumário 1. Introdução; 2. Modelo de Análise Fatorial Via Matriz de Correlação; 3. Estimação do número de fatores m; 4. Métodos de estimação para as matrizes Lpxm e ψpxp; 5. Estimação dos Escores dos Fatores F para cada elemento amostral. ENP157 – Estatística 2 – Profa.: Luciana Reis 4. Métodos de estimação para as matrizes Lpxm e ψpxp • Escolhido o valor de m, é possível estimar-se as matrizes Lpxm e ψpxp. • Há três métodos para estimação das matrizes: – Método dos componentes principais; – Método de fatores principais; – Método da máxima verossimilhança. ENP157 – Estatística 2 – Profa.: Luciana Reis 4.1. Método dos Componentes Principais para estimação para as matrizes Lpxm e ψpxp • É utilizado como uma análise exploratória dos dados, em termos dos fatores subjacentes; • Não exige informações ou suposições sobre a distribuição de probabilidades do vetor aleatório Z. ENP157 – Estatística 2 – Profa.: Luciana Reis 4.1. Método dos Componentes Principais para estimação para as matrizes Lpxm e ψpxp • Funcionamento: – Para cada λi, i=1,2,...,m, retido na estimação do valor de m, encontra-se o autovetor normalizado correspondentes ei, onde ei = (ei1 ei2 ei3 ... eip)’. – As matrizes Lpxm e ψpxp serão estimadas respectivamente por: onde diag(.) representa a matriz diagonal. ENP157 – Estatística 2 – Profa.: Luciana Reis 4.1. Método dos Componentes Principais para estimação para as matrizes Lpxm e ψpxp • Para um valor m fixo tem-se que: – Portanto, para estimação da matriz ψpxp, iremos considerar apenas a diagonal da matriz. ENP157 – Estatística 2 – Profa.: Luciana Reis 4.1. Método dos Componentes Principais para estimação para as matrizes Lpxm e ψpxp • Considerando-se essa forma de estimação, a matriz de correlação amostral original Rpxp estará sendo aproximada por: ENP157 – Estatística 2 – Profa.: Luciana Reis 4.1. Método dos Componentes Principais para estimação para as matrizes Lpxm e ψpxp • A matriz residual proveniente do ajuste do modelo fatorial será dada por: – A matriz residual pode servir como um critério para avaliação da qualidade de ajuste do modelo fatorial. – Idealmente, seus valores deveriam ser próximos de zero. ENP157 – Estatística 2 – Profa.: Luciana Reis 4.1. Método dos Componentes Principais para estimação para as matrizes Lpxm e ψpxp • Quando o método das componentes principais é usado para a estimação das matrizes Lpxm e ψpxp, a proporção de variância explicada pelo fator Fj dada por: – Esse valor representa o quanto cada fator consegue captar da variabilidade original das variáveis Zi. ENP157 – Estatística 2 – Profa.: Luciana Reis 4.1. Método dos Componentes Principais para estimação para as matrizes Lpxm e ψpxp • Exemplo 1: – Numa pesquisa de mercado feita para avaliar a aceitação pelo consumidor de um novo produto comestível, observou-se uma amostra de 200 consumidores, sendo 103 do sexo feminino e 97 do masculino. – Cada consumidor foi convidado a dar uma nota de 1 a 5 aos seguintes atributos do produto: sabor, aroma, cor, textura, utilidade, facilidade de encontrá-lo para compra e embalagem. ENP157 – Estatística 2 – Profa.: Luciana Reis 4.1. Método dos Componentes Principais para estimação para as matrizes Lpxm e ψpxp • Exemplo 1: – A matriz de correlação amostral é dada por: ENP157 – Estatística 2 – Profa.: Luciana Reis 4.1. Método dos Componentes Principais para estimação para as matrizes Lpxm e ψpxp • Exemplo 1: – A tabela apresenta os autovalores da matriz de correlação amostral com as respectivas porcentagens de variação total explicada. ENP157 – Estatística 2 – Profa.: Luciana Reis 4.1. Método dos Componentes Principais para estimação para as matrizes Lpxm e ψpxp • Exemplo 1: – 1º Passo: seleção dos m fatores • Critério 1: – 90% da variabilidade é obtida com m=3 fatores; – 95% da variabilidade é obtida com m=4 fatores. • Critério 2: – λ≥1: m=2 fatores; • Critério 3: – Gráfico scree-plot: m=2 fatores ENP157 – Estatística 2 – Profa.: Luciana Reis 4.1. Método dos Componentes Principais para estimação para as matrizes Lpxm e ψpxp • Exemplo 1: – 1º Passo: seleção dos m fatores ENP157 – Estatística 2 – Profa.: Luciana Reis 4.1. Método dos Componentes Principais para estimação para as matrizes Lpxm e ψpxp • Exemplo 1: – 1º Passo: seleção dos m fatores • Assim, temos a região 2; 3; 4 para m, na qual a qualidade de ajuste do modelo de análise fatorial deve ser avaliada. ENP157 – Estatística 2 – Profa.: Luciana Reis 4.1. Método dos Componentes Principais para estimação para as matrizes Lpxm e ψpxp • Exemplo 1: – Como ilustração, segue os escores de F para m=2, utilizando o método dos componentes principais para obtenção das matrizes Lpxm e ψpxp. ENP157 – Estatística 2 – Profa.: Luciana Reis 4.1. Método dos Componentes Principais para estimação para as matrizes Lpxm e ψpxp • Exemplo 1: – Estimando as matrizes Lpxm e ψpxp, temos que: ENP157 – Estatística 2 – Profa.: Luciana Reis 4.1. Método dos Componentes Principais para estimação para as matrizes Lpxm e ψpxp • Exemplo 1: – A matriz de correlação original pode ser aproximada por: ENP157 – Estatística 2 – Profa.: Luciana Reis 4.1. Método dos Componentes Principais para estimação para as matrizes Lpxm e ψpxp • Exemplo 1: – A matriz residual será dada por: • Como seus elementos estão próximos de zero, a matriz de correlação amostral original foi reproduzida satisfatoriamente pela matriz estimada (LL+ ψ). ENP157 – Estatística 2 – Profa.: Luciana Reis 4.2. Método dos fatores principais para estimação para as matrizes Lpxm e ψpxp • Através desse método para estimação de matrizes de loadings Lpxm e de variâncias específicas ψpxp, é necessário que o valor de m já tenha sido estimado por algum critério. • Funcionamento: – Refinamento das matrizes ψpxp e Lpxm, já estimadas pelo método de componentes principais, por meio de iterações. ENP157 – Estatística 2 – Profa.: Luciana Reis 4.2. Método dos fatores principais para estimação para as matrizes Lpxm e ψpxp • Consideremos que a matriz de correlação teórica P é dada por: • 1º Passo: – Têm-se que: • onde: são as comunalidades. ENP157 – Estatística 2 – Profa.: Luciana Reis 4.2. Método dos fatores principais para estimação para as matrizes Lpxm e ψpxp • 2º Passo: – Usando o método dos componentes principais, temos que: • 3º Passo: – A partir da matriz L*, têm-se novas estimativas de comunalidades, que são colocadas na diagonal principal da matriz LL’. ENP157 – Estatística 2 – Profa.: Luciana Reis 4.2. Método dos fatores principais para estimação para as matrizes Lpxm e ψpxp • Repete o 2º Passo: – O procedimento de estimação da matriz L* é repetido novamente. • Repete o 3º Passo: – O procedimento é repetido até que os valores das comunalidades em duas iterações sucessivas possam ser neglicenciados. ENP157– Estatística 2 – Profa.: Luciana Reis 4.2. Método dos fatores principais para estimação para as matrizes Lpxm e ψpxp • O método dos fatores principais exige a indicação pelo usuário das estimativas iniciais das comunalidades. ENP157 – Estatística 2 – Profa.: Luciana Reis 4.3. Método de máxima verossimilhança para estimação das matrizes Lpxm e ψpxp • Utilizado quando o vetor aleatório é conhecido. ENP157 – Estatística 2 – Profa.: Luciana Reis 5.3. Método ad-hoc • Os métodos ad-hoc são utilizados quando o objetivo do pesquisador é apenas o de classificar ou atribuir postos aos elementos amostrais. • Se o objetivo é utilizar os escores para outras análises estatísticas recomenda-se o uso dos dois métodos anteriores. ENP157 – Estatística 2 – Profa.: Luciana Reis 4.3. Método de máxima verossimilhança para estimação das matrizes Lpxm e ψpxp • Se o vetor aleatório tiver distribuição normal, o vetor padronizado Z também terá distribuição normal e, consequentemente, os fatores F1, F2, ..., Fm também. – Os fatores terão vetor de médias zero e matriz de covariâncias Imxm. – Os erros Ɛ1, Ɛ2, ..., Ɛp terão vetor de médias zero e matriz de covariâncias ψpxp. ENP157 – Estatística 2 – Profa.: Luciana Reis 4.3. Método de máxima verossimilhança para estimação das matrizes Lpxm e ψpxp • A função de verossimilhança é dada por: – Ela depende das matrizes L e ψ. ENP157 – Estatística 2 – Profa.: Luciana Reis 4.3. Método de máxima verossimilhança para estimação das matrizes Lpxm e ψpxp • O método da máxima verossimilhança é um método mais sofisticado que os demais métodos; – Contudo, baseia-se na suposição de normalidade de Z, F e Ɛ, quando apenas a normalidade de Z pode ser testada. • O método também necessita de um valor pré- especificado de m. ENP157 – Estatística 2 – Profa.: Luciana Reis 5. Estimação dos Escores dos Fatores F para cada elemento amostral • Para cada elemento amostral k; k = 1..n, o seu escore no fator Fj é dado por: – Onde Z são os valores das variáveis padronizadas e os coeficientes w são os pesos de ponderação de cada variável Zi no fator Fj. mkjmkjkjjk ZwZwZwF ...2211 ENP157 – Estatística 2 – Profa.: Luciana Reis 5. Estimação dos Escores dos Fatores F para cada elemento amostral • Os coeficientes w podem ser obtidos através de 3 métodos: 1. Método dos mínimos quadrados ponderados; 2. Método de regressão; 3. Método ad-hoc. ENP157 – Estatística 2 – Profa.: Luciana Reis 5.1. Métodos dos mínimos quadrados ponderados • Utilizando este método: – Onde Wmxp é a matriz de ponderação que gera os coeficientes wij. ENP157 – Estatística 2 – Profa.: Luciana Reis 5.1. Métodos dos mínimos quadrados ponderados • No exemplo anterior: – A matriz de ponderação é dada por: – Os escores F1 e F2 são obtidos por: ENP157 – Estatística 2 – Profa.: Luciana Reis 5.2. Método de regressão • Usado para estimação pelo método da máxima verossimilhança. • Os fatores são dados por: – Uma forma alternativa é a utilização da matriz de correlação amostral Rpxp no lugar de P. ENP157 – Estatística 2 – Profa.: Luciana Reis 5.3. Método ad-hoc • Método ad-hoc 1: – Observar a correlação de Fj com Zi; – Escolhe-se a variável Zi de maior correlação com Fj; – O escore de Fj é dado por Zi. ENP157 – Estatística 2 – Profa.: Luciana Reis 5.3. Método ad-hoc • Método ad-hoc 2: – Todas as variáveis Zi mais correlacionadas com Fj participação da obtenção do valor do escore; – Realiza-se uma média dos valores observados de Zi. ENP157 – Estatística 2 – Profa.: Luciana Reis 5. Estimação dos Escores dos Fatores F para cada elemento amostral • Em posse dos valores de w, pode-se definir os fatores e seus escores para cada elemento amostral. • Os escores podem ser utilizados na construção de gráficos e mapas de percepção como variáveis resposta ou explicativas para algum procedimento estatístico.
Compartilhar