Buscar

REGRESSÃO LINEAR MÚLTIPLA E RESENHA

Prévia do material em texto

Disciplina: Métodos Quantitativos II 
Professor: Dr. Ricardo Teixeira Veiga 
Alunas: Camila Alves Damásio e Deborah Leão Sousa Silva 
 
REGRESSÃO LINEAR MÚLTIPLA 
 
PRIMEIRA PARTE 
 
1- a) 
ANOVA 
Model Sum of Squares df Mean Square F p 
H₁ Regression 3709.763 2 1854.882 72.814 < .001 
 Residual 534.958 21 25.474 
 Total 4244.721 23 
Note. The intercept model is omitted, as no meaningful information can be 
shown. 
 
Se a probabilidade é inferior a 0.05, então podemos rejeitar a hipótese nula e 
concluir que as variáveis X1 e X2, quando consideradas juntas, são significativas 
na previsão da variável Y. 
 
b) 
Coefficients 
Model Unstandardized 
Standard 
Error 
Standardized t p 
H₀ (Intercept) 71.636 2.773 25.833 < .001 
H₁ (Intercept) -9.806 6.990 -1.403 0.175 
 X1 0.042 0.016 0.248 2.580 0.017 
 X2 0.014 0.002 0.766 7.960 < .001 
 
Custo = 400 x 0.042 + 4.500 x 0.014 - 9.806 = 69.994 
Assim, o custo estimado de distribuição do depósito mensal da empresa é de 
US$ 69.994. 
 
c) 
Model Summary - Y 
Model R R² Adjusted R² RMSE 
H₀ 0.000 0.000 0.000 13.585 
H₁ 0.935 0.874 0.862 5.047 
 
 
O coeficiente de determinação R² representa a correlação entre as variáveis 
independentes X1 e X2 e a variável dependente Y, medindo a proporção da 
variabilidade dos dados explicada pelo modelo. Quanto mais próximo de 1, 
melhor o ajuste do modelo. O R² obtido indica uma correlação alta. Já o R² 
ajustado leva em conta o tamanho da amostra, ajustando-se para o número de 
preditores no modelo. 
O valor obtido para R² é de 0.874, enquanto o valor ajustado para R² é de 0.862. 
 
d) 
Coefficients 
Model Unstandardized 
Standard 
Error 
Standardized t p 
H₀ (Intercept) 71.636 2.773 25.833 < .001 
H₁ (Intercept) -9.806 6.990 -1.403 0.175 
 X1 0.042 0.016 0.248 2.580 0.017 
 X2 0.014 0.002 0.766 7.960 < .001 
 
Ao considerar a hipótese que o coeficiente é zero, ou seja, nulo, ao obter a 
probabilidade abaixo de 0.05 para X1 e X2, rejeita-se a hipótese e pode-se 
concluir que ambas as variáveis contribuem significativamente para o modelo. 
 
e) 
Coefficients 
Model Unstandardized 
Standard 
Error 
Standardized t p 
H₀ (Intercept) 71.636 2.773 25.833 < .001 
H₁ (Intercept) -9.806 6.990 -1.403 0.175 
 X1 0.042 0.016 0.248 2.580 0.017 
 X2 0.014 0.002 0.766 7.960 < .001 
 
São calculados os limites superior e inferior para cada variável independente, 
criando intervalos. 
Para o intervalo de X1, embora a estimativa seja de 0.042, os resultados reais 
estão entre 0.008 e 0.075. 
Para o intervalo de X2, apesar da estimativa de 0.014, os resultados reais estão 
entre 0.010 e 0.018. 
 
f) 
Coefficients 
Model Unstandardized 
Standard 
Error 
Standardized t p 
H₀ (Intercept) 71.636 2.773 25.833 < .001 
H₁ (Intercept) -9.806 6.990 -1.403 0.175 
 X1 0.042 0.016 0.248 2.580 0.017 
 X2 0.014 0.002 0.766 7.960 < .001 
 
Custo = 0.042X1 + 0.014X2 - 9.806 
 
Interpretando os coeficientes: 
O coeficiente de 0.042 para X1 indica que, mantendo todas as outras variáveis 
constantes, um aumento de uma unidade em X1 está associado a um aumento 
de 0.042 na variável Custo. 
O coeficiente de 0.014 para X2 indica que, mantendo todas as outras variáveis 
constantes, um aumento de uma unidade em X2 está associado a um aumento 
de 0.014 na variável Custo. 
O termo constante de -9.806 representa o intercepto da linha de regressão 
quando todas as variáveis independentes são zero. Neste caso, significa que 
mesmo que X1 e X2 sejam zero, ainda há um custo fixo de -9.806. 
Esses resultados sugerem que tanto X1 quanto X2 estão contribuindo para 
explicar a variação na variável dependente Custo neste modelo de regressão 
linear múltipla. 
 
g) 
Coefficients 
Model Unstandardized 
Standard 
Error 
Standardized t p 
H₀ (Intercept) 71.636 2.773 25.833 < .001 
H₁ (Intercept) -9.806 6.990 -1.403 0.175 
 X1 0.042 0.016 0.248 2.580 0.017 
 X2 0.014 0.002 0.766 7.960 < .001 
 
Ao analisar os valores padronizados de X1 e X2, pode-se comparar as variáveis, 
eliminando as diferenças nas unidades de medida, e determinar qual delas é 
 
mais significativa para o modelo. Devido ao fato de que o valor padronizado de 
X2 é maior do que o de X1, conclui-se que X2 é mais significativo no modelo. 
k) Residuals vs. Dependent 
 
Observa-se que os resíduos não estão padronizados. Esses resíduos indicam a 
discrepância entre os valores previstos e os valores reais. 
 
 
 
Nota-se que o intervalo utilizado para criar o histograma foi definido com um nível 
de confiança de 95%. É perceptível que a distribuição tende a se aproximar da 
normalidade, uma vez que se assemelha a uma forma de sino, aproximando-se 
do resíduo zero. 
 
2 – a) 
Coefficients 
Model Unstandardized 
Standard 
Error 
Standardized t p 
H₀ (Intercept) 13.264 0.138 95.998 < .001 
H₁ (Intercept) 13.638 0.190 71.945 < .001 
 tvhours -0.034 0.016 -0.053 -2.067 0.039 
 paeduc -0.008 0.004 -0.054 -2.110 0.035 
 
Educ = - 0.008 x paedu - 0.034 x tvhours + 13.638 
 
Em que nesta equação: 
 
Educ representa o nível de escolaridade ou educação; 
paedu representa o nível de educação dos pais; 
tvhours representa o número de horas assistindo TV. 
 
Essa equação sugere que o nível de educação diminui em 0.008 para cada ano 
adicional de educação dos pais e diminui em 0.034 para cada hora adicional de 
TV assistida, com um termo constante de 13.638. 
 
b) 
Coefficients 
Model Unstandardized 
Standard 
Error 
Standardized t p 
H₀ (Intercept) 13.264 0.138 95.998 < .001 
H₁ (Intercept) 13.638 0.190 71.945 < .001 
 tvhours -0.034 0.016 -0.053 -2.067 0.039 
 paeduc -0.008 0.004 -0.054 -2.110 0.035 
 
 
Sim. A hipótese nula de que os valores dos coeficientes de regressão são zero 
pode ser rejeitada, pois a significância para ambas as variáveis independentes 
é inferior a 0.05. Isso indica que tanto o nível educacional dos pais quanto o 
tempo dedicado à TV têm um impacto estatisticamente significativo no nível de 
educação alcançado. 
 
c) 
ANOVA 
Model Sum of Squares df Mean Square F p 
H₁ Regression 264.389 2 132.194 4.639 0.010 
 Residual 42661.067 1497 28.498 
 Total 42925.456 1499 
Note. The intercept model is omitted, as no meaningful information can be 
shown. 
 
A rejeição da hipótese nula, onde a proporção de variação da variável 
dependente é considerada igual a 0.01, devido à significância inferior a 0.05, 
sugere que, em conjunto, as variáveis independentes têm um impacto 
estatisticamente significativo na previsão da variável Y. Essa conclusão implica 
que o modelo de regressão linear, incluindo as variáveis independentes 'paedu' 
e 'tvhours', é capaz de explicar de forma adequada a variação na variável 
dependente 'Educ'. 
 
d) 
Model Summary - educ 
Model R R² Adjusted R² RMSE 
H₀ 0.000 0.000 0.000 5.351 
H₁ 0.078 0.006 0.005 5.338 
 
A conclusão de que a ausência de um relacionamento linear entre as variáveis 
independentes e a variável dependente não pode ser rejeitada é sustentada 
pelos baixos valores dos coeficientes de correlação e correlação ajustada. Isso 
sugere que as variáveis independentes 'paedu' e 'tvhours' não estão fortemente 
correlacionadas com a variável dependente 'Educ' de forma linear. 
Portanto, com base na análise desses coeficientes, não é possível inferir uma 
relação linear significativa entre as variáveis. Isso indica que outras variáveis ou 
 
modelos alternativos podem ser necessários para explicar adequadamente a 
relação entre 'paedu', 'tvhours' e 'Educ'. 
 
e) 
Coefficients 
Model Unstandardized 
Standard 
Error 
Standardized t pH₀ (Intercept) 13.264 0.138 95.998 < .001 
H₁ (Intercept) 13.638 0.190 71.945 < .001 
 tvhours -0.034 0.016 -0.053 -2.067 0.039 
 paeduc -0.008 0.004 -0.054 -2.110 0.035 
 
Sim. Quando avaliada apenas a variável de educação do pai, observa-se um 
coeficiente de significância inferior a 0.05, o que indica significância estatística. 
 
f) 
Coefficients 
Model Unstandardized 
Standard 
Error 
Standardized t p 
H₀ (Intercept) 13.264 0.138 95.998 < .001 
H₁ (Intercept) 13.638 0.190 71.945 < .001 
 tvhours -0.034 0.016 -0.053 -2.067 0.039 
 paeduc -0.008 0.004 -0.054 -2.110 0.035 
 
Sim. Ao analisar apenas a variável de gasto com televisão, o coeficiente de 
significância é menor que 0.05, indicando sua significância estatística. Isso 
sugere que o tempo gasto com televisão tem um impacto estatisticamente 
significativo na variável dependente. 
 
g) 
Coefficients 
Model Unstandardized 
Standard 
Error 
Standardized t p 
H₀ (Intercept) 13.264 0.138 95.998 < .001 
H₁ (Intercept) 13.638 0.190 71.945 < .001 
 tvhours -0.034 0.016 -0.053 -2.067 0.039 
 paeduc -0.008 0.004 -0.054 -2.110 0.035 
 
 
Educ = - 0.008 x 14 - 0.034 x 3 + 13.638 
Educ = 13.424 
 
Educ= - 0.008 x paedu - 0.034 x tvhours + 13.638 
 
Com base na análise, prevê-se que uma pessoa cujo pai completou 14 anos de 
estudo e que gasta 3 horas por dia assistindo televisão teria aproximadamente 
13.424 anos de estudo. 
 
h) 
Coefficients 
Model Unstandardized 
Standard 
Error 
Standardized t p 
H₀ (Intercept) 13.264 0.138 95.998 < .001 
H₁ (Intercept) 13.638 0.190 71.945 < .001 
 tvhours -0.034 0.016 -0.053 -2.067 0.039 
 paeduc -0.008 0.004 -0.054 -2.110 0.035 
 
Ao avaliar o comportamento da variável dependente (Educ) em relação às 
mudanças nas variáveis independentes (tvhours e paedu): 
 
h1) Aumento ou diminuição do número de horas dedicado à televisão (tvhours): 
Ao analisar o impacto do aumento ou redução do número de horas dedicadas à 
televisão na variável dependente (Educ), podemos observar o coeficiente 
associado a 'tvhours', que na equação de regressão é -0.034. 
Isso significa que, se o número de horas dedicadas à televisão aumentar em 
uma unidade, a educação (Educ) diminuirá em 0.034 unidades, mantendo todas 
as outras variáveis constantes. Essa relação sugere uma associação negativa 
entre o tempo gasto assistindo TV e o nível de educação. 
Da mesma forma, se o número de horas dedicadas à televisão diminuir em uma 
unidade, a educação (Educ) aumentará em 0.034 unidades. 
 
h2) Aumento no número de anos de educação do pai (paedu): 
Ao examinar o impacto do aumento no número de anos de educação do pai na 
variável dependente (Educ), podemos observar o coeficiente associado a 
'paedu', que na equação de regressão é -0.008. 
 
Isso indica que, se o número de anos de educação do pai aumentar em uma 
unidade, a educação (Educ) diminuirá em 0.008 unidades, mantendo todas as 
outras variáveis constantes. Essa relação sugere uma associação negativa entre 
o nível de educação do pai e o nível de educação alcançado. 
Do mesmo modo, se o número de anos de educação do pai diminuir em uma 
unidade, a educação (Educ) aumentará em 0.008 unidades. 
Essas análises contribuem o entendimento sobre como as mudanças nas 
variáveis independentes influenciam a variável dependente no modelo de 
regressão. 
 
i) 
Coefficients 
Model Unstandardized 
Standard 
Error 
Standardized t p 
H₀ (Intercept) 13.264 0.138 95.998 < .001 
H₁ (Intercept) 13.638 0.190 71.945 < .001 
 tvhours -0.034 0.016 -0.053 -2.067 0.039 
 paeduc -0.008 0.004 -0.054 -2.110 0.035 
 
Para calcular a variação observada na variável dependente (Educ) quando a 
educação do pai (paedu) varia em 1 ano, pode-se utilizar o coeficiente associado 
a 'paedu' na equação de regressão e multiplicá-lo pelo tamanho da mudança em 
paedu. Isso fornecerá a mudança prevista em Educ para uma unidade de 
mudança em paedu. 
 
Na equação de regressão: 
Educ = − 0.008 × paedu − 0.034 × tvhours + 13.638 
 
O coeficiente associado a 'paedu' é -0.008, indicando que para cada aumento de 
1 ano na educação do pai, a variável dependente (Educ) diminui em 0.008 
unidades, mantendo todas as outras variáveis constantes. 
Assim, a variação observada na variável dependente (Educ) quando a educação 
do pai varia em 1 ano é de -0.008 unidades. Em outras palavras, cada ano 
adicional de educação do pai está associado a uma redução de 0.008 unidades 
no nível de educação alcançado pela pessoa. 
 
j) 
Coefficients 
Model Unstandardized 
Standard 
Error 
Standardized t p 
H₀ (Intercept) 13.264 0.138 95.998 < .001 
H₁ (Intercept) 13.638 0.190 71.945 < .001 
 tvhours -0.034 0.016 -0.053 -2.067 0.039 
 paeduc -0.008 0.004 -0.054 -2.110 0.035 
 
Se houver uma variação de 1 ano, o tempo de estudo aumentará ou diminuirá 
em 0.034 anos. 
SEGUNDA PARTE 
RESENHA CRÍTICA 
Camila Alves Damásio 
REFERÊNCIA 
 
VEIGA, Ricardo Teixeira; DE OLIVEIRA SANTOS, Deborah; LACERDA, Tales 
Sarmento. Antecedentes da intenção de consumo de cosméticos 
ecológicos. Revista Eletrônica de Ciência Administrativa, v. 5, n. 2, p. 1-15, 
2006. 
 
O texto aborda a necessidade urgente de mudança nos processos de 
produção e estilo de vida para evitar catástrofes ambientais irreversíveis, 
destacando o papel crucial dos governos, empresas e cidadãos na promoção de 
práticas sustentáveis. A Teoria do Comportamento Planejado (TCP) é 
apresentada como uma estrutura teórica para entender os antecedentes da 
intenção de consumir produtos ecologicamente corretos, com foco específico em 
cosméticos. 
A pesquisa conduzida investigou duas amostras distintas, uma de 
membros de uma associação ambientalista e outra de pessoas vinculadas a um 
programa de pós-graduação. Os resultados indicaram correlações entre atitude, 
norma subjetiva e controle percebido com a intenção comportamental, validando 
a TCP. Além disso, sugere-se que a inclusão da norma moral pode melhorar a 
capacidade explicativa da teoria. 
 
Destaca-se a relevância do estudo na área de comportamento do 
consumidor em relação à sustentabilidade ambiental, oferecendo suporte 
empírico à TCP. No entanto, há pontos que merecem atenção crítica. Por 
exemplo, a amostra limitada pode restringir a generalização dos resultados, uma 
vez que as características específicas dos participantes podem influenciar as 
conclusões. Além disso, embora a TCP forneça uma estrutura sólida para 
entender as intenções de consumo, há outras variáveis importantes, como 
fatores culturais e econômicos, que podem não ter sido totalmente exploradas 
no estudo. 
Apesar dessas limitações, o texto ressalta importantes implicações 
gerenciais, como a necessidade de educar os consumidores sobre produtos 
ecológicos e promover a conscientização ambiental. Também destaca a 
importância de estudos futuros para aprofundar a compreensão desses 
comportamentos e sua ligação com as variáveis da TCP, bem como para 
investigar a relação entre intenção e comportamento efetivo. 
Ademais, o estudo oferece uma visão abrangente sobre a aplicação da 
TCP no contexto do consumo sustentável de cosméticos, fornecendo insights 
valiosos para pesquisadores, profissionais de marketing e formuladores de 
políticas interessados em promover comportamentos mais sustentáveis.

Continue navegando