Baixe o app para aproveitar ainda mais
Prévia do material em texto
19/04/2017 1 M ar ke ti ng Profª Drª Rosane Rivera Torres ACH4514 Análise Multivariada I M ar ke ti ng Profª Drª Rosane Rivera Torres Livros utilizados no capítulo HAIR JR., J.F. et al. Análise Multivariada de Dados. Porto Alegre: Bookman, 6ª ed 2009. – CAP 4 – PESTANA, M. H. e GAJEIRO, J. N. Análise de Dados para Ciências Sociais – a complementariedade do SPSS. Lisboa: Edições Sílabo, 5ª ed 2003. – CAP 11 – 19/04/2017 2 M ar ke ti ng Profª Drª Rosane Rivera Torres O que é? O modelo de regressão linear múltipla é uma técnica estatística, descritiva e inferencial, que permite a análise da relação entre uma variável dependente (Y) e um conjunto de variáveis independentes (Xi). Regressão Linear Múltipla M ar ke ti ng Profª Drª Rosane Rivera Torres Utilizando o Banco de Dados de avaliação de marca, encontrar um modelo de regressão múltipla que explique o valor da marca (V84) em função das variáveis independentes: V21 - Integração do curso com atividades de pesquisa V22 - Processo de comunicação entre instituição e alunos V24 - Conhecimento dos professores em relação aos temas ministrados V25 - Didática dos professores Exemplo: Regressão Linear Múltipla 19/04/2017 3 M ar ke ti ng Profª Drª Rosane Rivera Torres M ar ke ti ng Profª Drª Rosane Rivera Torres Inclui todas as variáveis 19/04/2017 4 M ar ke ti ng Profª Drª Rosane Rivera Torres M ar ke ti ng Profª Drª Rosane Rivera Torres Utilizando todas as variáveis independentes - Método Enter Regressão Linear Múltipla Observa-se que 11,5% do valor da marca é determinada pelo modelo, sendo os outros 88,5% restantes explicados por outros fatores que estão incluídos na variável aleatória iε 19/04/2017 5 M ar ke ti ng Profª Drª Rosane Rivera Torres O coeficiente de determinação R2 tende a ser influenciado pela dimensão da amostra e pela dispersão existente nos dados, sendo uma medida otimista da qualidade do ajustamento. Como alternativa usa-se o R2 ajustado, sendo no entanto mais utilizado quando os modelos têm mais de uma variável independente. Regressão Linear Múltipla M ar ke ti ng Profª Drª Rosane Rivera Torres Sugestão de alguns autores: K = 1 K ≥ 2 n ≥ 30 ≥ 15 K n (stepwise) ------ ≥ 30 K Regressão Linear Múltipla 19/04/2017 6 M ar ke ti ng Profª Drª Rosane Rivera Torres Coeficiente de correlação: por convenção, sugere-se que r menor que 0,2 indica uma associação MUITO BAIXA; entre 0,2 e 0,39 BAIXA; entre 0,4 e 0,69 MODERADA; entre 0,7 e 0,89 ALTA e, por fim, entre 0,9 e 1,0 uma associação MUITO ALTA. Pestana e Gageiro – 3ª. Ed – pág. 189. Regressão Linear Múltipla M ar ke ti ng Profª Drª Rosane Rivera Torres Ter um R² alto é importante, pois de outra maneira haveriam muitos erros associados com a expectativa do modelo. Naturalmente não há padrões absolutos para o que constitui um modelo aceitável. Quanto se trata de dados das ciências sociais, os valores típicos de R² podem variar entre 0,1 e 0,5. Valores de séries históricas mostram valores extremamente altos (0,95). E pesquisadores usando informações da Bolsa de Valores podem encontrar R² na ordem de 0,01. Lattin, Carroll & Green, 2011 – pág. 42 Regressão Linear Múltipla 19/04/2017 7 M ar ke ti ng Profª Drª Rosane Rivera Torres A significância de algumas variáveis independentes são maiores que 5%, significando que há indícios de que devam ser retiradas do modelo. Regressão Linear Múltipla M ar ke ti ng Profª Drª Rosane Rivera Torres Retirando a variável v21 19/04/2017 8 M ar ke ti ng Profª Drª Rosane Rivera Torres Sem a variável independente V21 Observa-se que 12,0% do valor da marca é determinada pelo modelo, sendo os outros 88,0% restantes explicados por outros fatores que estão incluídos na variável aleatória iε Regressão Linear Múltipla M ar ke ti ng Profª Drª Rosane Rivera Torres A significância de algumas variáveis independentes são maiores que 5%, significando que há indícios de que devam ser retiradas do modelo. Regressão Linear Múltipla 19/04/2017 9 M ar ke ti ng Profª Drª Rosane Rivera Torres Sem a variável independente V21 e V24 Observa-se que 12,0% do valor da marca é determinada pelo modelo, sendo os outros 88,0% restantes explicados por outros fatores que estão incluídos na variável aleatória iε Regressão Linear Múltipla M ar ke ti ng Profª Drª Rosane Rivera Torres A significância das variáveis independentes são todas menores que 5%, significando que há indícios de que não devemos retirar mais nenhuma variável do modelo. Regressão Linear Múltipla 19/04/2017 10 M ar ke ti ng Profª Drª Rosane Rivera Torres Análise do modelo final 1º Qualidade do Ajustamento Observa-se que 12,0% do valor da marca é determinada pelo modelo, sendo os outros 88,0% restantes explicados por outros fatores que estão incluídos na variável aleatória Embora seja o melhor modelo encontrado, observamos que o poder de explicação do valor da marca é muito baixo, assim como a correlação. iε Regressão Linear Múltipla M ar ke ti ng Profª Drª Rosane Rivera Torres 2º Teste t A significância das variáveis independentes são todas menores que 5%, significando que há indícios de que não devemos retirar mais nenhuma variável do modelo. { 0: 0: ≠=ααHaHo ≠ = 0: 0: β β Ha Ho { 0: 0: ≠=δδHaHo R e j e i t a H o Regressão Linear Múltipla 19/04/2017 11 M ar ke ti ng Profª Drª Rosane Rivera Torres M ar ke ti ng Profª Drª Rosane Rivera Torres Como podemos observar na tabela acima, a significância do teste F é 0,000, que comparado a 5% ou mesmo 1% nos leva a concluir que em ambos os caso rejeitamos H0, isto é, o valor da marca é explicado pelo modelo. { 0R²: Ha 0R²: Ho ≠= 3º Teste F Regressão Linear Múltipla 19/04/2017 12 M ar ke ti ng Profª Drª Rosane Rivera Torres • Normalidade dos resíduos • Homocedasticidade dos resíduos (variância constante) • Linearidade • Ausência de autocorrelação dos resíduos • Ausência de multicolinearidade entre as variáveis independentes Regressão Linear Múltipla Pressupostos da Regressão Múltipla: M ar ke ti ng Profª Drª Rosane Rivera Torres Testando normalidade do resíduo 19/04/2017 13 M ar ke ti ng Profª Drª Rosane Rivera Torres Testando normalidade do resíduo M ar ke ti ng Profª Drª Rosane Rivera Torres Regressão Linear Múltipla 4º Normalidade dos resíduos Hipótese do teste K-S e Shapiro-Wilk H0: a distribuição dos resíduos é normal Ha: a distribuição dos resíduos não é normal Rejeito Ho 19/04/2017 14 M ar ke ti ng Profª Drª Rosane Rivera Torres Normalidade dos Resíduos A condição de normalidade dos resíduos não é necessária para a obtenção dos estimadores pelo método dos mínimos quadrados, mas sim para a definição de intervalos de confiança e testes de significância. Possíveis causas para a falta de normalidade dos resíduos: omissão de variáveis explicativas; presença de outliers; formulação matemática incorreta (forçar relação linear). Soluções possíveis: incluir mais variáveis no modelo; retirar outliers; alterar relação funcional. M ar ke ti ng Profª Drª Rosane Rivera Torres Verificando homocedasticidade 19/04/2017 15 M ar ke ti ng Profª Drª Rosane Rivera Torres SRE ZPR M ar ke ti ng Profª Drª Rosane Rivera Torres Homocedasticidade 19/04/2017 16 M arke ti ng Profª Drª Rosane Rivera Torres A presença de variâncias não homogêneas é uma violação de um dos pressupostos da regressão, conhecida como heterocedasticidade. Possíveis causas: outliers; erro de especificação das variáveis; erro na função matemática, entre outros. Soluções possíveis: transformar variáveis ou estimação da regressão via mínimos quadrados ponderados; retirada de outliers. Regressão Linear Múltipla 5º Variância constante (homocedasticidade): M ar ke ti ng Profª Drª Rosane Rivera Torres O diagnóstico de linearidade pode ser feito pelo diagrama de dispersão, que dá uma boa idéia sobre sua linearidade em torno das observações das variáveis dependentes e independentes. Suas possíveis causas e soluções são as mesmas apresentadas para Variância Constante (pressuposto anterior). Regressão Linear Múltipla 6º Linearidade: 19/04/2017 17 M ar ke ti ng Profª Drª Rosane Rivera Torres Linearidade M ar ke ti ng Profª Drª Rosane Rivera Torres Regressão Linear Múltipla 7º Autocorrelação dos resíduos: A análise da autocorrelação dos resíduos pode ser feita através do Teste de Durbin-Watson, cujas hipóteses são: Quero que não exista autocorrelação, pois a violação leva a erro na estimação dos parâmetros. H0: não existe autocorrelação dos resíduos Ha: existe autocorrelação dos resíduos 19/04/2017 18 M ar ke ti ng Profª Drª Rosane Rivera Torres Autocorrelação dos resíduos A idéia da chamada autocorrelação serial é que os resíduos contém mais informação sobre a variável dependente do que aquilo que foi “filtrado” pelas variáveis explicativas. Em termos técnicos, o resíduo ainda pode ser sistematizado. Exemplos de autocorrelação são normalmente encontrados em trabalhos que utilizam séries de tempo como dados de análise. M ar ke ti ng Profª Drª Rosane Rivera Torres Autocorrelação dos resíduos A autocorrelação dos resíduos depende do valor do teste de Durbin-Watson, cuja interpretação é: Valores próximos de 2, não existe autocorrelação dos resíduos; Valores próximos de Zero, significa autocorrelação positiva; Valores próximos de 4, significa autocorrelação negativa. 19/04/2017 19 M ar ke ti ng Profª Drª Rosane Rivera Torres Não existe autocorrelação Autocorrelação dos resíduos M ar ke ti ng Profª Drª Rosane Rivera Torres Multicolinearidade A multicolinearidade ocorre quando duas ou mais variáveis independentes do modelo apresentam correlação alta (superiores em termos absolutos a 0,9), pois significa que contêm informações similares. As consequências são: erros-padrão maiores, menor eficiências dos estimadores, estimativas imprecisas, entre outras. 8º Multicolinearidade: 19/04/2017 20 M ar ke ti ng Profª Drª Rosane Rivera Torres Multicolinearidade A maior correlação entre as variáveis independentes é 0,492, o que significa ausência de multicolinearidade M ar ke ti ng Profª Drª Rosane Rivera Torres 9º Outlier Análise de outlier 19/04/2017 21 M ar ke ti ng Profª Drª Rosane Rivera Torres Análise de outlier 9º Outlier M ar ke ti ng Profª Drª Rosane Rivera Torres 9º Outlier Análise de outlier Em todos os gráficos apresentados notamos a presença de outliers. 19/04/2017 22 M ar ke ti ng Profª Drª Rosane Rivera Torres 10º Equação final: V84 = 5,282 + ( 0,172 x V22) + (0,199 x V25) Onde: V84 - Valor da marca V22 - Processo de comunicação entre instituição e alunos V25 - Didática dos professores Regressão Linear Múltipla M ar ke ti ng Profª Drª Rosane Rivera Torres 19/04/2017 23 M ar ke ti ng Profª Drª Rosane Rivera Torres Utilizando o modelo Stepwise M ar ke ti ng Profª Drª Rosane Rivera Torres 19/04/2017 24 M ar ke ti ng Profª Drª Rosane Rivera Torres Utilizando o modelo Stepwise Coeficientes: Regressão Linear Múltipla M ar ke ti ng Profª Drª Rosane Rivera Torres Utilizando o modelo Stepwise Teste t Regressão Linear Múltipla 19/04/2017 25 M ar ke ti ng Profª Drª Rosane Rivera Torres Regressão Linear Múltipla Utilizando o modelo Stepwise Teste F M ar ke ti ng Profª Drª Rosane Rivera Torres Rodar a regressão novamente, fazendo as correções necessárias até encontrar o melhor modelo possível. Regressão Linear Múltipla 19/04/2017 26 M ar ke ti ng Profª Drª Rosane Rivera Torres Com o banco de dados do Samouel’s, realizar uma análise de regressão múltipla da Probabilidade de retorno (X18), em função da Qualidade da comida (X1), do Sabor (X4) e da Variedade do menu (X9). Regressão Linear Múltipla Exercício:
Compartilhar