Baixe o app para aproveitar ainda mais
Prévia do material em texto
M a r k e t i n g Profª Drª Rosane Rivera Torres ACH4514 Análise Multivariada I M a r k e t i n g Profª Drª Rosane Rivera Torres Livros utilizados no capítulo BRUNI, A.L. Estatística aplicada à gestão empresarial. São Paulo: Atlas, 3ª ed 2011. – CAP 12 na Pasta 6 – PESTANA, M. H. e GAJEIRO, J. N. Análise de Dados para Ciências Sociais – a complementari-dade do SPSS. Lisboa: Edições Sílabo, 3ª ed 2003. – CAP 11 – M a r k e t i n g Profª Drª Rosane Rivera Torres Predizer o valor de uma variável (a variável dependente), dado que seja conhecido o valor de uma variável associada (a variável independente) e estimar a relação funcional entre duas variáveis. Regressão Linear Simples Objetivos: M a r k e t i n g Profª Drª Rosane Rivera Torres Regressão Linear Simples Exemplo: Uma rede de lojas de confecções coletou uma amostra da dados passados referentes aos seus gastos com publicidade ($ mil) e sua venda média ($ mil). Os dados são apresentados na tabela que segue: M a r k e t i n g Profª Drª Rosane Rivera Torres Como devemos proceder para encontrar a equação de regressão para esses dados? Exemplo: Gastos com publicidade ($ mil) Venda média ($ mil) 3 7 4 14 8 15 12 28 14 32 Regressão Linear Simples M a r k e t i n g Profª Drª Rosane Rivera Torres Premissas: a) as duas variáveis envolvidas são aleatórias e contínuas; b) as duas variáveis apresentam uma distribuição normal. Regressão Linear Simples M a r k e t i n g Profª Drª Rosane Rivera Torres Sugestão de alguns autores: Regressão Linear Simples K = 1 K ≥ 2 n ≥ 30 ≥ 15 K n (stepwise) ------ ≥ 30 K M a r k e t i n g Profª Drª Rosane Rivera Torres Verificando a normalidade M a r k e t i n g Profª Drª Rosane Rivera Torres M a r k e t i n g Profª Drª Rosane Rivera Torres Testando Normalidade Ho: os dados apresentam distribuição normal Ha: os dados não apresentam distribuição normal Não Rejeito Ho M a r k e t i n g Profª Drª Rosane Rivera Torres Regressão linear simples M a r k e t i n g Profª Drª Rosane Rivera Torres v M a r k e t i n g Profª Drª Rosane Rivera Torres Pedir os seguintes gráficos: - dos resíduos standardizados (Y = Zresid) com a variável dependente standardizada (X = Zpred); - da variável dependente standardizada (Y = Zpred) com a variável dependente não standardizada (X = Dependente); - o gráfico que relaciona os resíduos studantizados (Y = Sresid) com predição standardizada (X = Zpred). M a r k e t i n g Profª Drª Rosane Rivera Torres M a r k e t i n g Profª Drª Rosane Rivera Torres 0 5 10 15 20 25 30 35 0 2 4 6 8 10 12 14 16 V e n d a Publicidade Publicidade X Venda Métodos da Linha Reta M a r k e t i n g Profª Drª Rosane Rivera Torres Como a relação expressa pelo gráfico Publicidade X Venda é, aparentemente, uma função linear, cada Y (Venda) pode ser escrito em função de cada X (Publicidade) da seguinte forma: Sendo a equação da reta, e o termo erro. Este último termo tem de ser incluído porque o valor de Y não será dado exatamente pelo ponto da reta a ser encontrada. iii XY εβα ++= X βα + ε Regressão Linear Simples M a r k e t i n g Profª Drª Rosane Rivera Torres A razão é a imprecisão em medidas. Por mais preciso que seja um instrumento de medida, sempre haverá um limite para essa precisão. O componente erro é muito importante, e é através da análise de seu estimador (resíduos) que verificamos algumas hipóteses da regressão. Regressão Linear Simples Qual a razão de existir esse erro? M a r k e t i n g Profª Drª Rosane Rivera Torres Podemos dizer então, que o erro dá conta de todos os eventos que são difíceis de medir, mas que são (supostamente) aleatórios. Mais do que isso, se o modelo (no nosso caso uma reta) estiver corretamente especificado, podemos supor que o erro, em média, será zero. Isto é, a probabilidade do erro ser x unidades acima da reta é a mesma de ser x unidades abaixo. Esta é a primeira hipótese: O próximo passo é estimar a reta de regressão: ( ) 0i =εΕ Regressão Linear Simples M a r k e t i n g Profª Drª Rosane Rivera Torres Interpretando o “b”, podemos dizer que para cada unidade de gastos com publicidade ($ mil) adicional, o volume de venda ($ mil) aumenta, em média, 2,088. Interpretando o “a”, podemos dizer que para o gasto mínimo com publicidade ($ mil), isto é, zero em publicidade existe 2,075 de volume de venda ($ mil). Regressão Linear Simples Interpretação dos coeficientes da reta: xy 088,2075,2 += M a r k e t i n g Profª Drª Rosane Rivera Torres As medidas da qualidade do ajustamento são: R, R2 e o R2 ajustado. Quanto mais próximo de –1 ou de 1 o coeficiente de correlação de Pearson (R) estiver, ou quanto mais próximo de 1 estiverem o R2 e o R2 ajustado, melhor é a qualidade do ajustamento. Regressão Linear Simples Qualidade do ajustamento: M a r k e t i n g Profª Drª Rosane Rivera Torres O coeficiente de determinação R2 tende a ser influenciado pela dimensão da amostra e pela dispersão existente nos dados, sendo uma medida otimista da qualidade do ajustamento. Como alternativa usa-se o R2 ajustado, sendo no entanto mais utilizado quando os modelos têm mais de uma variável independente. Para o exemplo em questão, usamos o modelo para explicar 93,1% das vendas, sendo os outros 6,9% restantes explicados por outros fatores que estão incluídos na variável aleatória .iε Regressão Linear Simples M a r k e t i n g Profª Drª Rosane Rivera Torres Testa a hipótese dos parâmetros α e β serem iguais a um valor fixo. Habitualmente interessa saber se esses parâmetros são ou não iguais a zero. Desta forma precisamos formular as seguintes hipóteses: Ho: α = 0, isto é, a reta de regressão passa pela origem Há: α ≠ 0 Testar α = 0 equivale a testar que para gastos com publicidade nulos temos volume de vendas nulo (modelo sem constante). Regressão Linear Simples Teste t: M a r k e t i n g Profª Drª Rosane Rivera Torres Ho: β = 0, isto é, o coeficiente da variável metros² é zero Há: β ≠ 0 Testar β = 0 equivale a testar que os gastos com publicidade não influenciam no volume de vendas, ou seja, que X não explica Y (modelo só com constante). Regressão Linear Simples Teste t: M a r k e t i n g Profª Drª Rosane Rivera Torres Como podemos observar na tabela acima, existe 95% de confiança do parâmetro β assumir valores entre [1,042; 3,134] e do parâmetro α assumir os valores [-7, 716; 11,764]. O intervalo para β exclui o zero, enquanto o intervalo para α inclui o zero. Sendo assim, podemos dizer que β ≠ 0 e α = 0. Regressão Linear Simples M a r k e t i n g Profª Drª Rosane Rivera Torres Ou ainda, se observarmos a significância do teste para α e β podemos notar que para β é menor que 5%, enquanto que para α é maior que 5%, o que significa dizer que há indícios de que o β seja diferentes de zero e o α igual a zero para uma significância de 5%. Regressão Linear Simples M a r k e t i n g Profª Drª Rosane RiveraTorres O teste F valida o modelo em termos globais e não cada um dos parâmetros isoladamente. Testa as seguintes hipóteses: Ho: o volume de vendas não é explicado pelos gastos com publicidade, isto é, R2 = 0; ou β = 0 Ha: o volume de vendas é explicado pelos gastos com, publicidade, isto é, R2 ≠ 0; ou β ≠ 0 Regressão Linear Simples Teste F: M a r k e t i n g Profª Drª Rosane Rivera Torres Como podemos observar na tabela acima, a significância do teste F é 0,008, que comparado a 5% ou mesmo 1% nos leva a concluir que em ambos os caso rejeitamos H0, isto é, o volume de vendas é explicado pelo gasto com publicidade. Regressão Linear Simples M a r k e t i n g Profª Drª Rosane Rivera Torres Linearidade A linearidade pode ser estudada através dos gráficos: - dos resíduos standardizados (Y = Zresid) com a variável dependente standardizada (X = Zpred); - da variável dependente standardizada (Y = Zpred) com a variável dependente não standardizada (X = Dependente). Regressão Linear Simples Diagnóstico do modelo estimado: M a r k e t i n g Profª Drª Rosane Rivera Torres O gráfico mostra a existência de uma relação linear entre o volume de vendas e os gastos com publicidade, quando os resíduos se distribuem aleatoriamente à volta da linha horizontal zero. M a r k e t i n g Profª Drª Rosane Rivera Torres Editando gráfico M a r k e t i n g Profª Drª Rosane Rivera Torres O gráfico mostra a existência de uma relação linear entre o volume de vendas e os gastos com publicidade, quando os resíduos se distribuem aleatoriamente ao longo da linha reta oblíqua ascendente. M a r k e t i n g Profª Drª Rosane Rivera Torres Variância constante Para verificar a variância constante ou homocedasticidade dos resíduos, poderíamos utilizar os dois gráficos anteriores. Se os resíduos aumentassem ou diminuíssem com os valores da variável independente, constataríamos o problema. Outro processo alternativo consiste em analisar o gráfico que relaciona os resíduos studantizados (Y = Sresid) com predição standardizada (X = Zpred) Regressão Linear Simples Diagnóstico do modelo estimado: M a r k e t i n g Profª Drª Rosane Rivera Torres O gráfico não mostra tendências crescentes ou decrescentes dos resíduos, sendo assim não podemos rejeitar a hipótese da homocedasticidade (ou variância constante). M a r k e t i n g Profª Drª Rosane Rivera Torres Normalidade A normalidade dos resíduos não significa que todos os gastos com publicidade iguais correspondem a um mesmo volume de vendas, mas sim que existe uma distribuição normal de volume de venda para cada valor gasto com publicidade. A normalidade dos resíduos pode ser analisada de diversas formas: -Teste de Kolmogorov-Smirnov -Gráfico Normal Q-Q plot e Detrended Normal Q-Q plot Regressão Linear Simples Diagnóstico do modelo estimado: M a r k e t i n g Profª Drª Rosane Rivera Torres Testando normalidade do resíduo M a r k e t i n g Profª Drª Rosane Rivera Torres M a r k e t i n g Profª Drª Rosane Rivera Torres A tabela mostra o teste K-S e o Shapiro-Wilks. Este último teste é sempre melhor quando a dimensão da amostra é inferior a 50, como é o caso do exemplo. Em ambos os testes não rejeitamos a hipótese da normalidade dos resíduos, tanto para um nível de significância de 5% como para 1%. Hipótese do teste K-S e Shapiro-Wilk H0: a distribuição dos resíduos é normal Ha: a distribuição dos resíduos não é normal Não Rejeito Ho M a r k e t i n g Profª Drª Rosane Rivera Torres Outliers A identificação de outliers no modelo de regressão linear simples é feita essencialmente através dos resíduos standardizados (Zre), studantizados (Sre) e studantizados deleted (Sdr), pela verificação de pelo menos uma das condições: - resíduos standardizados terem valores absolutos superiores a 3; - resíduos studantizados terem valores absolutos superiores a 2 - resíduos studantizados deleted terem valores absolutos superiores a 2. Regressão Linear Simples Diagnóstico do modelo estimado: M a r k e t i n g Profª Drª Rosane Rivera Torres Gerando gráfico de análise de outlier M a r k e t i n g Profª Drª Rosane Rivera Torres M a r k e t i n g Profª Drª Rosane Rivera Torres Em um dos gráficos apresentados notamos a presença de outliers. M a r k e t i n g Profª Drª Rosane Rivera Torres M a r k e t i n g Profª Drª Rosane Rivera Torres Se quisermos analisar a predição da variável Y em função de um determinado valor de X, no nosso exemplo, avaliar o volume de vendas em função de um determinado valor de gasto com publicidade, devemos proceder da seguinte maneira: 1º acrescentar o novo valor de X (metros quadrados) ao banco de dados; 2º rodar novamente a regressão, salvando a predição. Regressão Linear Simples Predição: M a r k e t i n g Profª Drª Rosane Rivera Torres Analyze/Regression/Linear Fazendo predição M a r k e t i n g Profª Drª Rosane Rivera Torres M a r k e t i n g Profª Drª Rosane Rivera Torres Regressão Linear Simples Inferências: Erro padrão Teste t Intervalo M a r k e t i n g Profª Drª Rosane Rivera Torres Regressão Linear Simples Depois de analisada toda a saída da análise de regressão simples com o uso do SPSS, verificamos dois problemas que precisam ser resolvidos: 1º. O teste dos coeficientes mostrou que α = 0 2º. Encontramos um outlier no gráfico do SDResíduo. Rodar e analisar a regressão novamente, excluindo a constante do modelo. M a r k e t i n g Profª Drª Rosane Rivera Torres Regressão linear simples Sem incluir a constante
Compartilhar