A maior rede de estudos do Brasil

Grátis
56 pág.
Regressão II

Pré-visualização | Página 1 de 4

ANÁLISE DE REGRESSÃO 
- Regressão Linear Múltipla - 
(II) 
1 
Exemplo 4: Insulina em coelhos 
Num experimento foram aplicadas doses diferentes de insulina 
em coelhos e foram observadas quedas na quantidade de açúcar 
no sangue (variável Y) depois de um determinado tempo. Nesse 
tipo de experimento, é usual estudar a relação entre a queda de 
açúcar e o logaritmo da dose de insulina (variável X). 
2 
3 
Exemplo 4: Insulina em coelhos 
Modelo Não-Linear 
• Um modelo que pode ser adequado é 
yi = e
 xii, i=1, ..., n. 
 
 yi*=* +  xi + i* 
• Observe que podemos tomar o logaritmo: 
ln(yi ) = ln ( e
 xii) 
 = ln () + xi + ln(i) 
• Considerando 
• yi*=ln(yi) 
• *=ln() 
• i*=ln(i) 
 
4 
Dados: 
n=32 
xi=15,27 
xi
2=8,80 
yi*=59,65 
yi*
2=117,56 
 xi yi*=31,55 
 
5 
Exemplo 4: Insulina em coelhos 
04,2
5133,1
0858,3
32
27,15
3280,8
32
65,59
32
27,15
3255,31
ˆ
2
2
1
2
1
**

















xnx
yxnyx
n
i
i
n
i
ii

89,0
32
27,15
04,2
32
65,59ˆˆ **  xy 
iii xxy 04,289,0
ˆˆˆ **  
369,6
32
65,59
3256,117)(
2
*
1
*
1
2** 22 





 

ynyyySQT
n
i
i
n
i
i
298,65133,104,2)(ˆ 2
n
1i
22  

xxSQReg i
As hipóteses de interesse são: 
 H0:  = 0 
H1:  ≠ 0 
6 
Exemplo 4: Insulina em coelhos 
99,0
369,6
298,62 
SQT
RegSQ
R
Fonte de variação gl SQ MQ F Valor P 
Regressão 1 6,298 6,298 3149,000 0,000 
Resíduo 30 0,071 0,002 
Total 31 6,369 
RC = {F > 4,17}, obtido da tabela F(1;30) com  = 5%. 
Conclusão: rejeitamos H0. 
7 
Exemplo 4: Insulina em coelhos 
ANOVA 
8 
Exemplo 4: Insulina em coelhos 
 Um pesquisador deseja avaliar resistência de containeres de 
plástico. Mais precisamente, deseja verificar se a pressão 
exercida sobre o plástico no processo de produção do plástico 
tem algum efeito na resistência do container. 
 Para avaliar isso, foi feito um estudo em que containeres foram 
produzidos sob diferentes pressões (em libras por polegadas ao 
quadrado). Foram produzidos n=1650 containeres. 
 Para cada container, a resistência foi medida de alguma 
maneira apropriada. 
 
 
 
 
 
 
Exemplo 5: Containeres 
9 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Item 
Resistência 
do plástico 
Pressão 
1 30,7 16 
2 24,7 18 
3 30,6 16 
4 32,8 10 
5 20,7 20 
6 34,5 16 
7 41,9 12 
8 36,4 12 
9 22,2 12 
10 20,7 14 
: : : 
: : : 
1640 28,6 18 
1641 30,1 16 
1642 46,5 12 
1643 34,6 18 
1644 38,6 12 
1645 28,6 14 
1646 32,5 20 
1647 38,6 14 
1648 39,7 12 
1649 14,6 20 
1650 19,8 20 
 
10 12 14 16 18 20
20
30
40
50
Diagrama de dispersão
Pressão
Re
sis
tê
nc
ia
Dados (n= 1650) 
10 
Exemplo 5: Containeres 
INTERPRETAÇÃO DOS PARÂMETROS: 
 
 0: resistência média do container quando a pressão é 0. 
 1: aumento/decréscimo médio resistência média, quando a 
pressão aumenta 1 unidade. 
 ei: erro aleatório. 
11 
SUPOSIÇÕES: 
 ei ~ N (0,
2), independentes. 
 Essa suposição é equivalente a supor yi ~N(0 + 1 xi , 
2), 
independentes; 
 
 
Exemplo 5: Containeres 
MODELO UTILIZADO: 
yi =0 + 1 xi + ei, i =1, ..., n. 
 
 yi: resistência do container de plástico 
 xi:pressão sobre o plástico 
R2= 0,2137 
 
 
12 
Fonte de variação gl SQ QM F Valor P 
Regressão 1 19250 19250 448,0069593 < 0,0001 
Resíduo 1648 70811,4 42,9681 
Total 1649 90061,4 
 
Coeficientes 
estimados 
Erro 
padrão 
Stat t valor-P 
95% 
inferiores 
95% 
superiores 
Intercepto 55,00 0,7268 61,9136 0,0000 53,5744 56,4256 
Pressão ( libras) -1,00 0,0472 -21,1662 0,0000 -1,0927 -0,9073 
ANOVA 
Exemplo 5: Containeres 
Podemos construir o diagrama de dispersão com a reta 
ajustada: 
 
 
 
 
 
 
 
 
 
 
 
10 12 14 16 18 20
20
30
40
50
Diagrama de dispersão
Pressão
Re
sis
tên
cia
13 
Exemplo 5: Containeres 
 
10 12 14 16 18 20
-2
-1
0
1
2
Resíduos estudentizados
Pressão
Re
síd
uo
s
26 28 30 32 34
-2
-1
0
1
2
Resíduos estudentizados
Valores previstos
Re
síd
uo
s
14 
Exemplo 5: Containeres 
 Suponha que agora o pesquisador deseja verificar a influência 
da temperatura durante o processo de fabricação na resistência 
do container. 
 
 
 
 
 
 
 
 
 
 
200 220 240 260 280 300
20
30
40
50
Diagrama de dispersão
Temperatura
Re
sis
tê
nc
ia
15 
Exemplo 5: Containeres 
 
 
 
 
 
 
 
 
 
 
 
 
 MODELO UTILIZADO: 
yi =0 + 1 xi + ei, i =1, ..., n. 
 
 yi: resistência do container de plástico 
 xi: temperatura do processo de fabricação 
Resultados: 
 
 
 
 
 
 
 
 
 16 
Fonte de variação gl SQ QM F Valor P 
Regressão 1 66000 66000 4520,435 0,0000 
Resíduo 1648 24061,4 14,60036 
Total 1649 90061,4 
 
Coeficientes 
estimados 
Erro 
padrão 
Stat t valor-P 
95% 
inferiores 
95% 
superiores 
Intercepto -20,00 0,7496 -26,6811 0,0000 -21,4703 -18,5297 
Temperatura (0 C) 0,20 0,0030 67,2342 0,0000 0,1942 0,2058 
ANOVA 
R2= 0,7328 
 
 
Exemplo 5: Containeres 
200 220 240 260 280 300
20
30
40
50
Diagrama de dispersão
Temperatura
Re
sis
tê
nc
ia
17 
Exemplo 5: Containeres 
 
 
 
 
 
 
 
 
 
 
 
 
200 220 240 260 280 300
-2
-1
0
1
2
Resíduos estudentizados
Temperatura
Re
síd
uo
s
20 25 30 35 40
-2
-1
0
1
2
Resíduos estudentizados
Valores previstos
Re
síd
uo
s
18 
Exemplo 5: Containeres 
 Será possível considerar um modelo contendo tanto a 
pressão quanto a temperatura? 
 O modelo de regressão linear pode ser escrito na forma: 
 yi =0 + 1 x1i + 2 x2i+ ei, i = 1, ..., n. 
 Observe que, para cada indivíduo ou unidade amostral, 
observamos (yi, x1i, x2i). 
No exemplo, x1: temperatura, x2: pressão 
 PARÂMETROS 
 0: INTERCEPTO 
 1: INCLINAÇÃO ASSOCIADA A X1 
 2: INCLINAÇÃO ASSOCIADA A X2 
 ERRO: ei . 
19 
REGRESSÃO LINEAR MÚLTIPLA 
INTERPRETAÇÃO DOS PARÂMETROS: 
 
 0: valor médio da variável resposta Y quando X1= 0 e X2 = 0. 
 1: aumento/decréscimo médio no valor de Y, quando X1 
aumenta de 1 unidade, mantendo-se X2 constante. 
 2: aumento/decréscimo médio no valor de Y, quando X2 
aumenta de 1 unidade, mantendo-se X1 constante. 
20 
 Sendo os coeficientes 0, 1 e 2 desconhecidos, é 
necessário estimá-los e testar hipóteses de interesse. 
REGRESSÃO LINEAR MÚLTIPLA 
SUPOSIÇÕES 
 ei ~ N(0, 
2) independentes. 
 Essa suposição é equivalente a supor 
 yi ~ N(0 + 1 x1i+ 2 x2i; 
2 ) independentes; 
 ESTIMAÇÃO DOS PARÂMETROS 
Utiliza-se o Método de Mínimos Quadrados. 
 Método de Mínimos Quadrados: encontra estimadores 
de 0, 1 e 2 que minimizam a soma do quadrado dos erros: 



n
i
iii
n
i
i xxye
1
2
22110
1
2 )( 
21 
REGRESSÃO LINEAR MÚLTIPLA 
OBS.: R2= 0,9465 
22 
Fonte de variação gl SQ QM F Valor P 
Regressão 2 85250 42625 14591,05 0,0000 
Resíduo 1647 4811,4 2,921311 
Total 1649 90061,4 
 
Coeficientes 
estimados 
Erro 
padrão 
Stat t valor-P 
95% 
inferiores 
95% 
superiores 
Intercepto -5,00 0,3828 -13,0601

Crie agora seu perfil grátis para visualizar sem restrições.