Buscar

Correlação e Regressão Linear Simples - Professor Marcelo de Paula

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Lista 30 - Regressa˜o Linear Simples
Ajustamento de Modelos - Prof. Marcelo de Paula
Questa˜o 1. Ha´ o interesse em estabelecer uma relac¸a˜o entre a altura (X) em metros e o peso (Y ) em quilos
de indiv´ıduos do sexo masculino acima dos 21 anos. Para isso analisou-se uma amostra de 15 indiv´ıduos,
ordenando-os pela altura, conforme tabela abaixo:
Altura Peso Altura Peso
Indiv´ıduo (em metros) X (em quilos) Y Indiv´ıduo (em metros) X (em quilos) Y
1 1, 45 63 9 1, 79 77
2 1, 52 63 10 1, 80 77
3 1, 58 64 11 1, 80 81
4 1, 60 65 12 1, 81 84
5 1, 62 65 13 1, 83 85
6 1, 65 68 14 1, 83 87
7 1, 70 69 15 1, 92 90
8 1, 76 71
a. Determine o coeficiente de correlac¸a˜o de Pearson rXY .
b. Ajuste o modelo linear Ŷ = β̂0 + β̂1X.
c. Interprete o coeficiente linear β̂0 (intercepto da reta).
d. Interprete o coeficiente angular β̂1 (inclinac¸a˜o da reta).
e. Determine o coeficiente de determinac¸a˜o r2XY e fac¸a a interpretac¸a˜o.
f. Qual o peso esperado para o indiv´ıduo que tem uma altura igual a 1, 75m?
g. Qual o peso esperado para o indiv´ıduo que tem uma altura igual a 1, 85m?
h. Qual o peso esperado para o indiv´ıduo que tem uma altura igual a 1, 98m?
Exerc´ıcio 2. Seja o seguinte conjunto de dados:
X 9 9 10 11 11 12 14 15
Y 6 8 23 65 70 160 172 3274
a. Ajuste Y em func¸a˜o de X nos treˆs modelos abaixo e encontre o coeficiente de determinac¸a˜o r2XY para
cada modelo ajustado.
Modelo linear: Ŷ = β̂0 + β̂1X.
Modelo exponencial: Ŷ = β̂0β̂
X
1 .
Modelo poteˆncia: Ŷ = β̂0X
β̂1
b. Qual o modelo ajustado e´ mais eficaz para esse conjunto de dados?
c. Usando o modelo melhor ajustado, qual seria o valor esperado de Y se X = 20?
Exerc´ıcio 3. Me´dicos pesquisadores esta˜o interessados em saber se o tempo de gestac¸a˜o interfere no peso
(ao nascer) de bebeˆs. Para isso foi tomada uma amostra de 12 bebeˆs rece´m-nascidos obtendo-se os pesos (em
gramas) de cada um deles. Os resultados encontram-se na tabela abaixo onde os bebeˆs esta˜o ordenados pelo
tempo de gestac¸a˜o (em semanas).
Indiv´ıduos (bebeˆs rece´m-nascidos) 1 2 3 4 5 6
Tempo de gestac¸a˜o (em semanas) X 27 29 30 33 34 34
Peso do rece´m-nascido (em gramas) Y 1360 1590 1900 2280 2360 2490
Indiv´ıduos (bebeˆs rece´m-nascidos) 7 8 9 10 11 12
Tempo de gestac¸a˜o (em semanas) X 35 35 36 36 38 39
Peso do rece´m-nascido (em gramas) Y 2610 2960 3550 3620 3990 4400
a. Determine o coeficiente de correlac¸a˜o rXY e fac¸a a interpretac¸a˜o.
b. Ajuste o modelo linear Ŷ = β̂0 + β̂1X.
c. Interprete o coeficiente linear β̂0(intercepto da reta).
d. Interprete o coeficiente angular β̂1 (inclinac¸a˜o da reta).
e. Determine o coeficiente de determinac¸a˜o r2XY e fac¸a a interpretac¸a˜o.
1
f. Qual o peso esperado para o bebeˆ que teve 32 semanas de gestac¸a˜o?
g. Qual o peso esperado para o bebeˆ que teve 40 semanas de gestac¸a˜o?
Exerc´ıcio 4. Continuando o exerc´ıcio anterior, ajuste Y em func¸a˜o de X nos modelos exponencial e poteˆncia
conforme abaixo.
Modelo exponencial: Ŷ = β̂0β̂
X
1 .
Modelo poteˆncia: Ŷ = β̂0X
β̂1 .
a. Encontre o coeficiente de determinac¸a˜o r2XY para cada modelo ajustado.
b. Considerando o modelo linear do exerc´ıcio anterior e os modelos ajustados exponencial e poteˆncia, qual o
modelo ajustado mais eficaz para esse conjunto de dados?
c. Usando o modelo melhor ajustado, qual seria o peso esperado de um bebeˆ com 38 semanas de gestac¸a˜o?
Exerc´ıcio 5. O Instituto Brasileiro de Geografia e Estat´ıstica (IBGE) esta´ interessado em saber qual a
relac¸a˜o entre o nu´mero de filhos por famı´lia (Y ) e a renda familiar mensal (X). Para isso, coletou-se uma
amostra de 30 famı´lias onde verificou-se o nu´mero de filhos e a renda familiar mensal (em sala´rios mı´nimos)
de cada uma delas. Os resultados encontram-se na tabela abaixo.
Famı´lia 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Renda Mensal X 1 2 2 2 2 2 2 2 3 3 3 4 4 4 4
Nu´mero de filhos Y 5 4 4 4 3 3 3 3 2 2 2 2 2 2 2
Famı´lia 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Renda Mensal X 4 4 5 5 5 5 5 5 6 6 6 7 7 8 8
Nu´mero de filhos Y 2 2 2 1 1 1 1 1 1 1 0 0 0 0 0
a. Determine o coeficiente de correlac¸a˜o rXY e fac¸a a interpretac¸a˜o.
b. Ajuste o modelo linear Ŷ = β̂0 + β̂1X.
c. Interprete o coeficiente linear β̂0 (intercepto da reta).
d. Interprete o coeficiente angular β̂1 (inclinac¸a˜o da reta).
e. Determine o coeficiente de determinac¸a˜o r2XY e fac¸a a interpretac¸a˜o.
Exerc´ıcio 6. Ajuste o conjunto de dados abaixo nos treˆs modelos propostos: Linear, exponencial e poteˆncia.
Encontre o coeficiente de determinac¸a˜o de cada um deles para verificar qual o melhor modelo ajustado.
X 1 2 3 4 5 6 7 8 9 10
Y 2 5 7 19 31 48 96 164 289 515
Exerc´ıcio 7. Ajuste o conjunto de dados abaixo nos treˆs modelos propostos: Linear, exponencial e poteˆncia.
Encontre o coeficiente de determinac¸a˜o de cada um deles para verificar qual o melhor modelo ajustado.
X 10 12 14 16 18 20 22 24 26 28 30 32
Y 52 41 34 32 28 25 22 21 18 18 15 13
Exerc´ıcio 8. Os dados que se seguem referem-se a medidas de alturas de feija˜o (Y ), durante 7 semanas
(amostras aleato´rias independentes), conforme tabela abaixo:
Idade do feija˜o (em semanas) X 1 2 3 4 5 6 7
Altura do feija˜o (em cm) Y 5 13 16 23 33 38 40
Fonte: SNEDECOR, G.W & COCHRAN, W.G. (1967). Statistical Methods. The Iowa State Press Univer-
sity. pag. 139.
Ajuste o conjunto de dados abaixo nos treˆs modelos propostos: Linear, exponencial e poteˆncia. Encontre o
coeficiente de determinac¸a˜o de cada um deles para verificar qual o melhor modelo ajustado. Considerando o
melhor modelo ajustado, qual a altura esperada de um pe´ de feija˜o apo´s 8 semanas?
Exerc´ıcio 9. Os dados que se seguem referem-se a um experimento, em que 9 amostras de solos foram
preparadas, variando-se os n´ıveis de fo´sforo orgaˆnico (X). Nessas amostras foi plantado milho e, apo´s 38
dias, as plantas foram colhidas e o conteu´do de fo´sforo foi determinado. A seguir, determinou-se, por uma
expressa˜o o fo´sforo dispon´ıvel (Y ) para a planta no solo, conforme tabela abaixo:
X (ppm) 1 4 5 9 13 11 23 23 28
Y (ppm) 64 71 54 81 93 76 77 95 109
2
Fonte: SNEDECOR, G.W & COCHRAN, W.G. (1967). Statistical Methods. The Iowa State Press
University. p ag. 139.
Ajuste o conjunto de dados abaixo nos treˆs modelos propostos: Linear, exponencial e poteˆncia. Encontre o
coeficiente de determinac¸a˜o de cada um deles para verificar qual o melhor modelo ajustado. Considerando o
melhor modelo ajustado, qual o valor esperado de Y quando X = 18?
Exerc´ıcio 10. Os dados que se seguem referem-se ao peso me´dio (X) de 50 galinhas e consumo de alimentos
(Y ), para 10 linhagens White Leghorn.
Amostra 1 2 3 4 5 6 7 8 9 10
X 4, 6 5, 1 4, 8 4, 4 5, 9 4, 7 5, 1 5, 2 4, 9 5, 1
Y 87, 1 93, 1 89, 8 91, 4 99, 5 92, 1 95, 5 99, 3 93, 4 94, 4
Fonte: STEEL, R.G.D. & TORRIE, J.H. (1980). Principles and Procedures of Statistics. A Biometrical
Approach. MacGraw-Hill. p ag. 240.
Ajuste o conjunto de dados abaixo nos treˆs modelos propostos: Linear, exponencial e poteˆncia. Encontre o
coeficiente de determinac¸a˜o de cada um deles para verificar qual o melhor modelo ajustado.
Exerc´ıcio 11. Os dados que se seguem referem-se a concentrac¸o˜es de CO2 (X) aplicadas sobre folhas de
trigo a uma temperatura de 35oC e a quantidades de CO2 (Y ; cm
3/dm2/ hora) absorvido pelas folhas.
Amostra 1 2 3 4 5 6 7 8 9 10 11
X 75 100 100 120 130 130 160 190 200 240 250
Y 0, 00 0, 65 0, 50 1, 00 0, 95 1, 30 1, 80 2, 80 2, 50 4, 30 4, 50
Fonte: MEAD, R. & CURNOW, R.N. (1980). Statistical Methods in Agriculture and Experimental Biology.
Chapman & Hall. p ag. 134.
Ajuste o conjunto de dados abaixo nos treˆs modelos propostos: Linear, exponencial e poteˆncia. Encontre o
coeficiente de determinac¸a˜o de cada um deles para verificar qual o melhor modelo ajustado.
Exerc´ıcio 12. Os dados que se seguem referem-se a nu´meros de ovospostos por 14 galinhas e nu´meros de
fol´ıculos ovulados.
Nu´mero de ovos X 39 29 46 28 31 25 49 57 51 21 42 38 34 47
Nu´mero de fol´ıculos Y 37 34 52 26 32 25 55 65 44 25 45 26 29 30
Fonte: STEEL, R.G.D. & TORRIE, J.H. (1980). Principles and Procedures of Statistics. A Biometrical
Approach. MacGraw-Hill. p ag. 277.
Ajuste o conjunto de dados abaixo nos treˆs modelos propostos: Linear, exponencial e poteˆncia. Encontre o
coeficiente de determinac¸a˜o de cada um deles para verificar qual o melhor modelo ajustado.
Exerc´ıcio 13. Os dados a seguir mostram as despesas com propaganda (expressas em porcentagem das
despesas totais) e o lucro l´ıquido operacional (expresso em porcentagem do total de vendas) em uma amostra
de seis drogarias:
Drogaria 1 2 3 4 5 6
despesas com propaganda X 1, 5 1, 0 2, 8 0, 4 1, 3 2, 0
lucro l´ıquido operacional Y 3, 6 2, 8 5, 4 1, 9 2, 9 4, 3
Ajuste o conjunto de dados abaixo nos treˆs modelos propostos: Linear, exponencial e poteˆncia. Encontre o
coeficiente de determinac¸a˜o de cada um deles para verificar qual o melhor modelo ajustado.
Exerc´ıcio 14. Uma determinada pizzaria deseja saber qual a relac¸a˜o entre o prec¸o da pizza (em reais) com
a sua venda mensal (em unidades). Para isso variou-se o prec¸o da unidade e verificou-se a quantidade mensal
vendida. Os dados sa˜o os seguintes:
Prec¸o da pizza (em reais) 18, 00 22, 00 17, 50 23, 50 27, 00 25, 00 20, 50 24, 00
Quantidade mensal vendida 277 123 295 91 48 69 166 81
a. Ajuste o conjunto de dados abaixo nos treˆs modelos propostos: Linear, exponencial e poteˆncia. Encontre
o coeficiente de determinac¸a˜o de cada um deles para verificar qual o melhor modelo ajustado.
b. Suponha que o gerente da pizzaria fac¸a uma promoc¸a˜o em um certo meˆs cobrando o prec¸o u´nico de 19
reais a pizza, quantas unidades espera-se vender nesse meˆs?
c. e se o prec¸o for 16 reais?
3
RESPOSTAS DOS EXERCI´CIOS
Exerc´ıcio 1.
a. rXY = 0, 9259. Interpretac¸a˜o de rXY : 92, 59% das observac¸o˜es de Y esta˜o correlacionadas positivamente
com as observac¸o˜es de X.
b. Ŷ = −39, 15 + 66, 1X.
c. β̂0 nesse caso na˜o ha´ interpretac¸a˜o pra´tica, pois na˜o ha´ altura zero.
d. β̂1 = 66, 1 : Para cada unidade de X aumentamos 66, 1 unidades em Y .
e. r2XY = 0, 8573. Enta˜o 85, 73% das observac¸o˜es de Y sa˜o explicadas por X.
f. Se X = 1, 75m enta˜o Ŷ = 76, 5kg.
g. Se X = 1, 85m enta˜o Ŷ = 83, 1kg.
h. Se X = 1, 98m enta˜o Ŷ = 91, 7kg.
Exerc´ıcio 2.)
a.) Modelo linear: Ŷ = −3659, 4354 + 363, 2251X e r2XY = 0, 4966
Modelo exponencial: Ŷ = 0, 0036× 2, 3791X e r2XY = 0, 9006
Modelo poteˆncia: Ŷ = 2E − 09X10,1189 e r2XY = 0, 9025
b.) Logo, o modelo poteˆncia e´ o melhor modelo ajustado.
c.) Se X = 20 enta˜o Ŷ = 29251, 8.
Exerc´ıcio 3.)
a.) rXY = 0, 9499
Interpretac¸a˜o: 94, 99% das observac¸o˜es de Y esta˜o correlacionadas positivamente com as observac¸o˜es de X.
b.) Ŷ = −5847, 6 + 254, 39X.
c.) β̂0 nesse caso na˜o ha´ interpretac¸a˜o pra´tica, pois na˜o ha´ zero semanas de gestac¸a˜o.
d.) β̂1 = 254, 39 : Para cada unidade de X aumentamos 254, 39 unidades em Y .
e.) r2XY = 0, 9023. Enta˜o 90, 23% das observac¸o˜es de Y sa˜o explicadas por X.
f.) Se X = 32 semanas, enta˜o Ŷ = 2293 gramas.
g.) Se X = 40 semanas, enta˜o Ŷ = 4328 gramas.
Exerc´ıcio 4.)
a.) Modelo linear: Ŷ = −5847, 6 + 254, 39X. e r2XY = 0, 9023.
Modelo exponencial: Ŷ = 88, 87× 1, 1049X e r2XY = 0, 9592.
Modelo poteˆncia: Ŷ = 0, 0294X3,2393 e r2XY = 0, 9489.
b.) Logo, o modelo exponencial e´ o melhor modelo ajustado.
c.) Se X = 38 enta˜o Ŷ = 3936 gramas.
Exerc´ıcio 5.)
a.) rXY = −0, 9334
Interpretac¸a˜o: 93, 34% das observac¸o˜es de Y esta˜o correlacionadas negativamente com as observac¸o˜es de X.
Em outras palavras, quanto maior a renda familiar, menor o nu´mero de filhos por famı´lia.
b.) Ŷ = 4, 588− 0, 6479X.
c.) β̂0 = 4, 588. Numa hipo´tese pouco prova´vel de na˜o haver renda alguma
esperamos que a famı´lia tenha aproximadamente 5 filhos.
d.) β̂1 = 0, 6479 : Para cada unidade de X diminu´ımos 0, 6479 unidades em Y .
e.) r2XY = 0, 8712. Enta˜o 87, 12% das observac¸o˜es de Y sa˜o explicadas por X.
Exerc´ıcio 6.)
Modelo linear: Ŷ = −137 + 46, 291X. e r2XY = 0, 7064.
Modelo exponencial: Ŷ = 1, 3406× 1, 8268X e r2XY = 0, 9945.
Modelo poteˆncia: Ŷ = 0, 9760X2,4043 e r2XY = 0, 9281.
Logo, o modelo exponencial e´ o melhor modelo ajustado.
Exerc´ıcio 7.)
Modelo linear: Ŷ = 58, 487− 1, 5192X. e r2XY = 0, 9037.
Modelo exponencial: Ŷ = 81, 1906 × 0, 9446X e r2XY = 0, 9810.
Modelo poteˆncia: Ŷ = 657, 99X−1,1022 e r2XY = 0, 9852.
Logo, o modelo poteˆncia e´ o melhor modelo ajustado.
4
Exerc´ıcio 8.)
Modelo linear: Ŷ = −0, 5714 + 6, 1429X e r2XY = 0, 9783.
Modelo exponencial: Ŷ = 5, 3947 × 1, 3844X e r2XY = 0, 8925.
Modelo poteˆncia: Ŷ = 5, 3308X1,0781 e r2XY = 0, 9853.
Considerando o melhor modelo ajustado, que e´ o modelo poteˆncia, a altura esperada de um pe´ de feija˜o apo´s
X = 8 semanas e´ de Ŷ = 50, 17.
Exerc´ıcio 9.)
Modelo linear: Ŷ = 61, 5804 + 1, 4169X e r2XY = 0, 6480.
Modelo exponencial: Ŷ = 62, 3653× 1, 0178X e r2XY = 0, 6201.
Modelo poteˆncia: Ŷ = 56, 6682X0,1479 e r2XY = 0, 5397.
Considerando o melhor modelo ajustado, que e´ o modelo linear, o valor esperado para X = 18 e´ de Ŷ = 87, 08.
Exerc´ıcio 10.)
Modelo linear: Ŷ = 55, 2633 + 7, 6901X e r2XY = 0, 6699.
Modelo exponencial: Ŷ = 62, 2699× 1, 0850X e r2XY = 0, 6619.
Modelo poteˆncia: Ŷ = 47, 8427X0,4181 e r2XY = 0, 6653.
O melhor modelo ajustado e´ o modelo linear, pois possui o maior r2XY .
Exerc´ıcio 11.) A cargo do aluno.
Exerc´ıcio 12.)
Modelo linear: Ŷ = 0, 2495 + 0, 9711X e r2XY = 0, 6742.
Modelo exponencial: Ŷ = 13, 9336 × 1, 0248X e r2XY = 0, 6859.
Modelo poteˆncia: Ŷ = 1, 5715X0,8656 e r2XY = 0, 64440.
O melhor modelo ajustado e´ o modelo poteˆncia, pois possui o maior r2XY .
Exerc´ıcio 13.)
Modelo linear: Ŷ = 1, 2595 + 1, 4826X e r2XY = 0, 9860.
Modelo exponencial: Ŷ = 1, 7245× 1, 5411X e r2XY = 0, 9624.
Modelo poteˆncia: Ŷ = 2, 8948X0,5322 e r2XY = 0, 9537.
O melhor modelo ajustado e´ o modelo linear, pois possui o maior r2XY .
Exerc´ıcio 14.)
a.) Modelo linear: Ŷ = 752, 98− 27, 46X. e r2XY = 0, 9386.
Modelo exponencial: Ŷ = 9050, 42× 0, 8227X e r2XY = 0, 9990.
Modelo poteˆncia: Ŷ = 54128090X−4,2166 e r2XY = 0, 9974.
Logo, o modelo exponencial e´ o melhor modelo ajustado.
b.) Se X = 19 reais, enta˜o Ŷ = 222 pizzas.
c.) Se X = 16 reais, enta˜o Ŷ = 399 pizzas.
5

Continue navegando