Buscar

IV) OK - Correlação e Regressão - Minitab

Prévia do material em texto

Aluno: Juliano Nunes da Silva
Exercícios do Minitab – Correlação e Regressão
IV.1) Num teste de repetitividade, queremos determinar ser há correlação entre uma primeira medição (Xi) e a medição subsequente (Yi). Em termos práticos, isso significaria que um alto valor observado na primeira medição levaria a um alto valor na próxima medição. Efetuar o teste de correlação populacional para os dados amostrais indicados, ao nível de 10% (stat/basic statistics/correlation); convém, antes, observar os dados graficamente (graph/scatterplot).
	Xi
	9,0
	7,6
	7,9
	8,4
	8,8
	9,7
	8,0
	7,6
	8,3
	8,2
	9,1
	8,6
	7,8
	7,8
	Yi
	8,5
	9,0
	7,5
	7,9
	8,4
	8,8
	9,7
	8,0
	7,6
	8,3
	8,2
	9,1
	8,6
	7,8
· Correlação: Xi; Yi
Método
	Tipo de correlação
	Pearson
	Linhas usadas
	14
ρ: correlação de Pearson pareada
Correlações
	
	Xi
	Yi
	0,133
Correlações de Pearson pareadas
	Amostra 1
	Amostra 2
	Correlação
	IC de 90%
para ρ
	Valor-p
	Yi
	Xi
	0,133
	(-0,347; 0,558)
	0,649
· Gráfico de Dispersão de Yi versus Xi
IV.2) A tabela mostra a relação entre a produção anual de tinta de uma empresa, X, em bilhões de litros, e os respectivos lucros, Y, em milhões de reais. Pede-se:
	Ano
	2001
	2002
	2003
	2004
	2005
	2006
	2007
	2008
	2009
	2010
	X
	2010
	2370
	2600
	2380
	3125
	3880
	4978
	5206
	7000
	8233
	Y
	20,51
	40,33
	51,49
	67,46
	72,11
	109,52
	114,24
	171,71
	192,06
	236,37
a) Analisar as variáveis graficamente (graph/scatter plot) e calcular o coeficiente de correlação;
· Gráfico de Dispersão de Y versus X
b) Testar se existe correlação na população, com um nível de significância de 5% (stat/basic statistics/correlation);
Método
	Tipo de correlação
	Pearson
	Linhas usadas
	10
ρ: correlação de Pearson pareada
Correlações
	
	X
	Y
	0,976
Correlações de Pearson pareadas
	Amostra 1
	Amostra 2
	Correlação
	IC de 95%
para ρ
	Valor-p
	Y
	X
	0,976
	(0,897; 0,994)
	0,000
c) Achar a equação da regressão linear que melhor se adapta aos dados e estimar o lucro em 2011, quando se espera que a produção atinja 9000 bilhões de litros (stat/regression/regression).
· Equação de Regressão
	Y
	=
	-29,0 + 0,03268 X  (Litros)
	
	
	
	
	
	
· Coeficientes
	Termo
	Coef
	EP de Coef
	Valor-T
	Valor-P
	VIF
	Constante
	-29,0
	12,1
	-2,40
	0,043
	 
	X  (Litros)
	0,03268
	0,00260
	12,56
	0,000
	1,00
	
	
	
	
	
	
· Sumário do Modelo
	S
	R2
	R2(aj)
	R2(pred)
	16,6619
	95,17%
	94,57%
	93,21%
	
	
	
	
· Análise de Variância
	Fonte
	GL
	SQ (Aj.)
	QM (Aj.)
	Valor F
	Valor-P
	Regressão
	1
	43781
	43781,1
	157,70
	0,000
	  X  (Litros)
	1
	43781
	43781,1
	157,70
	0,000
	Erro
	8
	2221
	277,6
	 
	 
	Total
	9
	46002
	 
	 
	 
IV.3) A tabela mostra a relação entre a área plantada de lavoura de café, X, em hectares, em função da renda bruta auferida, Y, em milhões de reais, para 10 propriedades agrícolas de uma mesma região do país. Pede-se, com alfa de 1%:
	X
	21,2
	12,7
	15,1
	9,7
	29
	7,3
	39,3
	45,4
	38,7
	26,6
	Y
	1406
	1429
	1628
	1484
	1937
	1291
	8322
	9783
	7461
	3163
a) Ajustar uma função linear e calcular o coeficiente de explicação; avaliar a renda, se a área for de 50 hectares (stat/regression/regression);
Equação de Regressão
	Y
	=
	-1722 + 225,0 X
Coeficientes
	Termo
	Coef
	EP de
Coef
	Valor-T
	Valor-P
	VIF
	Constante
	-1722
	1038
	-1,66
	0,136
	 
	X
	225,0
	37,6
	5,99
	0,000
	1,00
Sumário do Modelo
	S
	R2
	R2(aj)
	R2(pred)
	1519,38
	81,76%
	79,48%
	72,50%
Análise de Variância
	Fonte
	GL
	SQ (Aj.)
	QM (Aj.)
	Valor F
	Valor-P
	Regressão
	1
	82784566
	82784566
	35,86
	0,000
	  X
	1
	82784566
	82784566
	35,86
	0,000
	Erro
	8
	18468143
	2308518
	 
	 
	Total
	9
	101252708
	 
	 
	 
Ajustados e Diagnósticos para Observações Atípicas
	Obs.
	Y
	Ajuste
	Resíd
	Resíd Pad
	
	5
	1937
	4803
	-2866
	-2,00
	R
R  Resíduo grande
b) Ajustar outras funções (stat/regression/fitted line plot) como, por exemplo:
b1) Exponencial; b2) Potência; b3) Parabólica; b4) Cúbica
· Exponencial - Regressão Não Linear: X = Theta1 * exp(Theta2 * X)
* AVISO * Critério de Convergência não atingido: disposição relativa alcançada = 2,19527.
Método
	Algoritmo
	Gauss-Newton
	Máximo de iterações
	200
	Tolerância
	0,00001
Valores Iniciais para os Parâmetros
	Parâmetro
	Valor
	Theta1
	1
	Theta2
	1
Equação
X = 2,58212e-13 * exp(0,69661 * X)
Estimativas dos Parâmetros
	Parâmetro
	Estimativa
	EP da
Estimativa
	Theta1
	0,000000
	0,0000
	Theta2
	0,696610
	18,9637
X = Theta1 * exp(Theta2 * X)
Falta de Ajuste
Não há réplicas.
O Minitab não pode fazer o teste de ajuste baseado no erro puro.
Sumário
	Iterações
	200
	SQE Final
	6535,14
	GLE
	8
	QME
	816,893
	S
	28,5813
* AVISO * Algumas estimativas dos parâmetros estão altamente correlacionadas. Considere
simplificar a função de expectativa ou transformar preditores ou parâmetros para reduzir
colinearidades.
· Cubica - Análise de Regressão Polinomial: Y versus X
A equação de regressão é
Y = 3899 - 408,6 X + 16,04 X^2 - 0,0864 X^3
Sumário do Modelo
	S
	R2
	R2(aj)
	854,152
	95,68%
	93,52%
Análise de Variância
	Fonte
	GL
	SQ
	QM
	F
	P
	Regressão
	3
	96875251
	32291750
	44,26
	0,000
	Erro
	6
	4377458
	729576
	 
	 
	Total
	9
	101252708
	 
	 
	 
Análise de Variância Sequencial
	Fonte
	GL
	SQ
	F
	P
	Linear
	1
	82784566
	35,86
	0,000
	Quadrático
	1
	13971309
	21,75
	0,002
	Cúbico
	1
	119376
	0,16
	0,700
IV.4) Uma empresa anotou as involuções de devoluções de um de seus produtos principais, Y, em mil unidades, ao longo de alguns meses de um ano. Pede-se, com alfa de 5%:
	Mês
	Jan
	Fev
	Mar
	Abr
	Maio
	Jun
	Jul
	Ago
	Set
	Out
	Devolução
	213
	194
	165
	123
	95
	77
	63
	52
	42
	19
a) Ajustar uma reta aos dados, calcular R2 e avaliar a devolução para dezembro (stat/regression/regression); em que data espera-se zerar a devolução?
IV.4
Análise de Regressão Polinomial: Devolução_1 versus Mês - Num
A equação de regressão é
Devolução_1 = 256,8 - 38,36 Mês - Num + 1,519 Mês - Num^2
Sumário do Modelo
	S
	R2
	R2(aj)
	7,76499
	98,95%
	98,65%
Análise de Variância
	Fonte
	GL
	SQ
	QM
	F
	P
	Regressão
	2
	39904,0
	19952,0
	330,91
	0,000
	Erro
	7
	422,1
	60,3
	 
	 
	Total
	9
	40326,1
	 
	 
	 
Análise de Variância Sequencial
	Fonte
	GL
	SQ
	F
	P
	Linear
	1
	38685,8
	188,68
	0,000
	Quadrático
	1
	1218,2
	20,20
	0,003
b) Idem, para as funções exponencial, potência, quadrática e cúbica (stat/regression/fitted line plot).
Obs.: trata-se aqui de uma série temporal; para ela, deve-se criar uma alternativa para o tempo (X), na forma de uma progressão aritmética do tipo1, 2, 3, 4, .....10.

Continue navegando