Buscar

Multivariada I Aula 04 Regressão Múltipla SPSS Alunos

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

19/04/2017
1
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
ACH4514
Análise 
Multivariada I
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Livros utilizados no capítulo
HAIR JR., J.F. et al. Análise Multivariada de Dados. Porto
Alegre: Bookman, 6ª ed 2009. – CAP 4 –
PESTANA, M. H. e GAJEIRO, J. N. Análise de Dados para
Ciências Sociais – a complementariedade do SPSS. Lisboa:
Edições Sílabo, 5ª ed 2003. – CAP 11 –
19/04/2017
2
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
O que é?
O modelo de regressão linear múltipla é uma
técnica estatística, descritiva e inferencial, que
permite a análise da relação entre uma variável
dependente (Y) e um conjunto de variáveis
independentes (Xi).
Regressão Linear Múltipla
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Utilizando o Banco de Dados de avaliação de marca, encontrar um
modelo de regressão múltipla que explique o valor da marca (V84)
em função das variáveis independentes:
V21 - Integração do curso com atividades de pesquisa
V22 - Processo de comunicação entre instituição e alunos
V24 - Conhecimento dos professores em relação aos temas
ministrados
V25 - Didática dos professores
Exemplo:
Regressão Linear Múltipla
19/04/2017
3
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Inclui todas
as variáveis
19/04/2017
4
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Utilizando todas as variáveis independentes - Método Enter
Regressão Linear Múltipla
Observa-se que 11,5% do valor da marca
é determinada pelo modelo, sendo os
outros 88,5% restantes explicados por
outros fatores que estão incluídos na
variável aleatória iε
19/04/2017
5
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
O coeficiente de determinação R2 tende a ser influenciado pela
dimensão da amostra e pela dispersão existente nos dados,
sendo uma medida otimista da qualidade do ajustamento.
Como alternativa usa-se o R2 ajustado, sendo no entanto mais
utilizado quando os modelos têm mais de uma variável
independente.
Regressão Linear Múltipla
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Sugestão de alguns autores:
K = 1 K ≥ 2
n ≥ 30 ≥ 15 K
n (stepwise) ------ ≥ 30 K
Regressão Linear Múltipla
19/04/2017
6
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Coeficiente de correlação: por convenção, sugere-se que r
menor que 0,2 indica uma associação MUITO BAIXA; entre 0,2 e
0,39 BAIXA; entre 0,4 e 0,69 MODERADA; entre 0,7 e 0,89 ALTA
e, por fim, entre 0,9 e 1,0 uma associação MUITO ALTA.
Pestana e Gageiro – 3ª. Ed – pág. 189.
Regressão Linear Múltipla
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Ter um R² alto é importante, pois de outra maneira haveriam
muitos erros associados com a expectativa do modelo.
Naturalmente não há padrões absolutos para o que constitui um
modelo aceitável. Quanto se trata de dados das ciências sociais,
os valores típicos de R² podem variar entre 0,1 e 0,5. Valores de
séries históricas mostram valores extremamente altos (0,95). E
pesquisadores usando informações da Bolsa de Valores podem
encontrar R² na ordem de 0,01.
Lattin, Carroll & Green, 2011 – pág. 42 
Regressão Linear Múltipla
19/04/2017
7
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
A significância de algumas variáveis
independentes são maiores que 5%, significando
que há indícios de que devam ser retiradas do
modelo.
Regressão Linear Múltipla
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Retirando a variável v21
19/04/2017
8
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Sem a variável independente V21
Observa-se que 12,0% do valor da marca
é determinada pelo modelo, sendo os
outros 88,0% restantes explicados por
outros fatores que estão incluídos na
variável aleatória iε
Regressão Linear Múltipla
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
A significância de algumas variáveis
independentes são maiores que 5%, significando
que há indícios de que devam ser retiradas do
modelo.
Regressão Linear Múltipla
19/04/2017
9
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Sem a variável independente V21 e V24
Observa-se que 12,0% do valor da marca
é determinada pelo modelo, sendo os
outros 88,0% restantes explicados por
outros fatores que estão incluídos na
variável aleatória iε
Regressão Linear Múltipla
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
A significância das variáveis independentes são
todas menores que 5%, significando que há
indícios de que não devemos retirar mais
nenhuma variável do modelo.
Regressão Linear Múltipla
19/04/2017
10
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Análise do modelo final
1º Qualidade do Ajustamento
Observa-se que 12,0% do valor da marca é determinada pelo modelo,
sendo os outros 88,0% restantes explicados por outros fatores que
estão incluídos na variável aleatória
Embora seja o melhor modelo encontrado, observamos que o poder de
explicação do valor da marca é muito baixo, assim como a correlação.
iε
Regressão Linear Múltipla
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
2º Teste t
A significância das variáveis
independentes são todas menores que 5%,
significando que há indícios de que não
devemos retirar mais nenhuma variável do
modelo.
{ 0: 0: ≠=ααHaHo



≠
=
0:
0:
β
β
Ha
Ho
{ 0: 0: ≠=δδHaHo
R
e
j
e
i
t
a
H
o
Regressão Linear Múltipla
19/04/2017
11
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Como podemos observar na tabela acima, a significância do teste F é
0,000, que comparado a 5% ou mesmo 1% nos leva a concluir que em
ambos os caso rejeitamos H0, isto é, o valor da marca é explicado pelo
modelo.
{ 0R²: Ha 0R²: Ho ≠=
3º Teste F
Regressão Linear Múltipla
19/04/2017
12
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
• Normalidade dos resíduos
• Homocedasticidade dos resíduos (variância
constante)
• Linearidade
• Ausência de autocorrelação dos resíduos
• Ausência de multicolinearidade entre as variáveis
independentes
Regressão Linear Múltipla
Pressupostos da Regressão Múltipla:
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Testando normalidade do resíduo
19/04/2017
13
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Testando normalidade do resíduo
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Regressão Linear Múltipla
4º Normalidade dos resíduos
Hipótese do teste K-S e Shapiro-Wilk
H0: a distribuição dos resíduos é normal
Ha: a distribuição dos resíduos não é normal
Rejeito Ho
19/04/2017
14
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Normalidade dos Resíduos
A condição de normalidade dos resíduos não é necessária para
a obtenção dos estimadores pelo método dos mínimos
quadrados, mas sim para a definição de intervalos de confiança
e testes de significância.
Possíveis causas para a falta de normalidade dos resíduos:
omissão de variáveis explicativas; presença de outliers;
formulação matemática incorreta (forçar relação linear).
Soluções possíveis: incluir mais variáveis no modelo; retirar
outliers; alterar relação funcional.
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Verificando homocedasticidade
19/04/2017
15
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
SRE
ZPR
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Homocedasticidade
19/04/2017
16
M
arke
ti
ng
Profª Drª Rosane Rivera Torres
A presença de variâncias não homogêneas é uma violação de
um dos pressupostos da regressão, conhecida como
heterocedasticidade.
Possíveis causas: outliers; erro de especificação das variáveis;
erro na função matemática, entre outros.
Soluções possíveis: transformar variáveis ou estimação da
regressão via mínimos quadrados ponderados; retirada de
outliers.
Regressão Linear Múltipla
5º Variância constante (homocedasticidade): 
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
O diagnóstico de linearidade pode ser feito pelo diagrama de
dispersão, que dá uma boa idéia sobre sua linearidade em torno
das observações das variáveis dependentes e independentes.
Suas possíveis causas e soluções são as mesmas apresentadas
para Variância Constante (pressuposto anterior).
Regressão Linear Múltipla
6º Linearidade: 
19/04/2017
17
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Linearidade
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Regressão Linear Múltipla
7º Autocorrelação dos resíduos: 
A análise da autocorrelação dos resíduos pode ser feita através
do Teste de Durbin-Watson, cujas hipóteses são:
Quero que não exista autocorrelação, pois a violação leva a
erro na estimação dos parâmetros.
H0: não existe autocorrelação dos resíduos
Ha: existe autocorrelação dos resíduos
19/04/2017
18
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Autocorrelação dos resíduos
A idéia da chamada autocorrelação serial é que os resíduos
contém mais informação sobre a variável dependente do que
aquilo que foi “filtrado” pelas variáveis explicativas. Em termos
técnicos, o resíduo ainda pode ser sistematizado.
Exemplos de autocorrelação são normalmente encontrados em
trabalhos que utilizam séries de tempo como dados de análise.
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Autocorrelação dos resíduos
A autocorrelação dos resíduos depende do valor do teste de
Durbin-Watson, cuja interpretação é:
Valores próximos de 2, não existe autocorrelação dos
resíduos;
Valores próximos de Zero, significa autocorrelação positiva;
Valores próximos de 4, significa autocorrelação negativa.
19/04/2017
19
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Não existe autocorrelação
Autocorrelação dos resíduos
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Multicolinearidade
A multicolinearidade ocorre quando duas ou mais variáveis
independentes do modelo apresentam correlação alta
(superiores em termos absolutos a 0,9), pois significa que
contêm informações similares.
As consequências são: erros-padrão maiores, menor eficiências
dos estimadores, estimativas imprecisas, entre outras.
8º Multicolinearidade: 
19/04/2017
20
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Multicolinearidade
A maior correlação entre as variáveis independentes é
0,492, o que significa ausência de multicolinearidade
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
9º Outlier
Análise de outlier
19/04/2017
21
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Análise de outlier
9º Outlier
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
9º Outlier
Análise de outlier
Em todos os gráficos apresentados notamos a presença de outliers.
19/04/2017
22
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
10º Equação final:
V84 = 5,282 + ( 0,172 x V22) + (0,199 x V25)
Onde:
V84 - Valor da marca
V22 - Processo de comunicação entre instituição e alunos
V25 - Didática dos professores
Regressão Linear Múltipla
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
19/04/2017
23
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Utilizando o modelo Stepwise
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
19/04/2017
24
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Utilizando o modelo Stepwise
Coeficientes:
Regressão Linear Múltipla
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Utilizando o modelo Stepwise
Teste t
Regressão Linear Múltipla
19/04/2017
25
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Regressão Linear Múltipla
Utilizando o modelo Stepwise
Teste F
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Rodar a regressão novamente, fazendo as
correções necessárias até encontrar o melhor
modelo possível.
Regressão Linear Múltipla
19/04/2017
26
M
ar
ke
ti
ng
Profª Drª Rosane Rivera Torres
Com o banco de dados do Samouel’s, realizar uma análise
de regressão múltipla da Probabilidade de retorno (X18),
em função da Qualidade da comida (X1), do Sabor (X4) e
da Variedade do menu (X9).
Regressão Linear Múltipla
Exercício:

Continue navegando