Corr_Regr_2012
63 pág.

Corr_Regr_2012


DisciplinaEstatística Aplicada9.078 materiais80.506 seguidores
Pré-visualização3 páginas
tem-se:
\u3b2\u2c60 + \u3b2\u2c61
n\u2211
i=1
xi =
n\u2211
i=1
yi (3)
\u3b2\u2c60
n\u2211
i=1
xi + \u3b2\u2c61x
2
i =
n\u2211
i=1
xi yi .
As equac¸o\u2dces (3) recebem o nome de equac¸o\u2dces normais de m´\u131nimos
quadrados.
() MRLS 2012 25 / 63
Ana´lise de Regressa\u2dco
Estimac¸a\u2dco
A soluc¸a\u2dco dessas equac¸o\u2dces fornece os EMQ, \u3b2\u2c60 e \u3b2\u2c61, dados por:
\u3b2\u2c60 = y¯ \u2212 \u3b2\u2c61x¯ .
\u3b2\u2c61 =
n\u2211
i=1
xi yi \u2212
(
n\u2211
i=1
xi
)(
n\u2211
i=1
yi
)
n
n\u2211
i=1
x2i \u2212
(
n\u2211
i=1
xi
)2
n
.
onde x¯ =
n\u2211
i=1
xi
n e y¯ =
n\u2211
i=1
yi
n .
() MRLS 2012 26 / 63
Ana´lise de Regressa\u2dco
Estimac¸a\u2dco
Portanto, a linha de regressa\u2dco estimada ou ajustada e´ :
y\u2c6 = \u3b2\u2c60 + \u3b2\u2c61x
e estima a me´dia da varia´vel dependente para um valor da varia´vel
explicativa X = x , µY |x .
Note que cada par de observac¸o\u2dces satisfaz a relac¸a\u2dco:
yi = \u3b2\u2c60 + \u3b2\u2c61xi + ei , i = 1, . . . , n
onde ei = yi \u2212 y\u2c6i recebe o nome de res´\u131duo.
() MRLS 2012 27 / 63
Ana´lise de Regressa\u2dco
Estimac¸a\u2dco
Os EMQ de \u3b20 e \u3b21 em termos da notac¸a\u2dco acima sa\u2dco:
\u3b2\u2c60 = y¯ \u2212 \u3b2\u2c61x¯ , \u3b2\u2c61 = Sxy
Sxx
.
() MRLS 2012 28 / 63
Ana´lise de Regressa\u2dco
Exemplo de aplicac¸a\u2dco
Considerando os dados do exemplo
n = 20
n\u2211
i=1
xi = 907 + 926 + · · · + 621 = 14.623; x¯ = 731, 15
n\u2211
i=1
yi = 11, 20 + 11, 05 + · · · + 7, 41 = 176, 11; y¯ = 8, 8055
n\u2211
i=1
x2i = (907)
2 + (926)2 + · · · + (621)2 = 11.306.209
n\u2211
i=1
y2i = (11, 20)
2 + (11, 05)2 + · · · + (7, 41)2 = 1.602, 0971
n\u2211
i=1
xi yi = (907)(11, 20) + (11, 05)(926) · · · + (7, 41)(621) = 134.127, 90
() MRLS 2012 29 / 63
Ana´lise de Regressa\u2dco
Exemplo de aplicac¸a\u2dco
Sxx =
n\u2211
i=1
x2i \u2212 n(x¯)2 = 11.306.209\u2212 20(731, 15)2 = 614.603
Sxy =
n\u2211
i=1
xi yi \u2212 n(x¯)(y¯) = 134.127, 90\u2212 20(8, 8055)(731, 15) = 5.365, 08
Syy =
n\u2211
i=1
y2i \u2212 n(y¯)2 = 1.609, 0971\u2212 20(8, 8055) = 51, 3605.
As estimativas dos para\u2c6metros do MRLS sa\u2dco:
\u3b2\u2c61 =
Sxy
Sxx
=
5.365, 08
614.603
= 0, 00873; \u3b2\u2c60 = y¯ \u2212 \u3b2\u2c61 x¯ = 8, 8055\u2212 (0, 00873)(731, 15) = 2, 423.
Portanto, a linha de regressa\u2dco ajustada ou estimada para esses dados sa\u2dco:
y\u2c6 = 2, 423 + 0, 00873x.
() MRLS 2012 30 / 63
Ana´lise de Regressa\u2dco
Diagrama de dispersa\u2dco
l
l
l
l
l
l
l
l
l
l
l
l l
l
l
l
l
l
l
l
400 500 600 700 800 900 1000
6
7
8
9
10
11
No de Clientes
Ve
nd
a
() MRLS 2012 31 / 63
Ana´lise de Regressa\u2dco
Suponha que tem-se interesse em prever as vendas semanais para um
supermercado com 600 clientes.
No modelo de regressa\u2dco ajustado basta substituir X = 600, \u131´sto e´,
y\u2c6 = 2, 423 + (0, 00873)(600) = 7, 661.
A venda semanal de 7,661 mil do´lares pode ser interpretada com uma
estimac¸a\u2dco da venda me´dia semanal verdadeira dos supermercados com
X = 600 clientes, ou como uma estimac¸a\u2dco de uma futura venda de um
supermercado quando o nu´mero de clientes for X = 600.
() MRLS 2012 32 / 63
Ana´lise de Regressa\u2dco
Propriedades dos EMQ
Se as suposic¸o\u2dces do MRLS sejam va´lidas e´ poss´\u131vel demonstrar (
\u3b5i \u223c NID(0, \u3c32))
E (\u3b2\u2c61) = \u3b21, Var(\u3b2\u2c61) =
\u3c32
Sxx
.
E (\u3b2\u2c60) = \u3b20, Var(\u3b2\u2c60) = \u3c3
2
[
1
n +
x¯2
Sxx
]
.
Cov(\u3b2\u2c60, \u3b2\u2c61) = \u2212\u3c32x¯Sxx
\u3b2\u2c6j \u223c N(\u3b2j ,Var(\u3b2\u2c6j )), j = 0, 1.
() MRLS 2012 33 / 63
Ana´lise de Regressa\u2dco
Estimac¸a\u2dco de \u3c32
Os res´\u131duos,
ei = yi \u2212 y\u2c6i
sa\u2dco empregados na estimac¸a\u2dco de \u3c32. A soma de quadrados residuais,
denotado por SQR e´:
SQR =
n\u2211
i=1
e2i =
n\u2211
i=1
(yi \u2212 y\u2c6i )2
Pode-se demonstrar que o valor esperado da soma de quadrados dos
residuais SQR, e´ dado por:
E (SQR) = (n \u2212 2)\u3c32
() MRLS 2012 34 / 63
Ana´lise de Regressa\u2dco
Portanto,
\u3c3\u2c62 =
SQR
n \u2212 2 = QMR (Quadrado me´dio residual),
e´ um estimador na\u2dco viciado de \u3c32,
Uma fo´rmula mais conveniente para o ca´lculo da SQR e´ dada por:
SQR = Syy \u2212 \u3b2\u2c61Sxy .
() MRLS 2012 35 / 63
Ana´lise de Regressa\u2dco
Exemplo
Com os dados do exemplo, e´ feita a estimac¸a\u2dco da varia\u2c6ncia \u3c32. Nesse
caso, Syy = 51, 3605, Sxy = 5.365, 08 e \u3b2\u2c61 = 0, 00873.
Portanto, a estimativa de \u3c32 para o exemplo .
\u3c3\u2c62 =
SQR
n \u2212 2 =
Syy \u2212 \u3b2\u2c61Sxy
n \u2212 2
=
51, 3605\u2212 (0, 00873)(5.365, 08)
20\u2212 2 = 0, 2513.
() MRLS 2012 36 / 63
Ana´lise de Regressa\u2dco
Teste de hipo´teses sobre \u3b21
Suponha que se deseje testar a hipo´tese de que a inclinac¸a\u2dco e´ igual a uma
constante representada por \u3b21,0. As hipo´teses apropriadas sa\u2dco:
H0 : \u3b21 = \u3b21,0, vs H1 : \u3b21 6= \u3b21,0
A estat´\u131stica
T =
\u3b2\u2c61 \u2212 \u3b21,0\u221a
\u3c3\u2c62/Sxx
,
tem distribuic¸a\u2dco t-Student com n \u2212 2 graus de liberdade sob
H0 : \u3b21 = \u3b21,0. Rejeita-se H0 se
|Tobs | > t\u3b1/2, n\u22122.
() MRLS 2012 37 / 63
Ana´lise de Regressa\u2dco
Teste de hipo´teses sobre \u3b20
H0 : \u3b20 = \u3b20,0, vs H1 : \u3b20 6= \u3b20,0
A estat´\u131stica
T =
\u3b2\u2c60 \u2212 \u3b20,0\u221a
\u3c3\u2c62[ 1n +
x¯2
Sxx
]
que tem distribuic¸a\u2dco t-Student com n \u2212 2 graus de liberdade. Rejeitamos
a hipo´teses nula se |Tobs | > t\u3b1/2, n\u22122.
() MRLS 2012 38 / 63
Ana´lise de Regressa\u2dco
Teste de significa\u2c6ncia do MRLS
H0 : \u3b21 = 0, vs H1 : \u3b21 6= 0,
Deixar de rejeitar H0 : \u3b21 = 0 e´ equivalente a concluir que na\u2dco ha´
nenhuma relac¸a\u2dco linear entre X e Y .
() MRLS 2012 39 / 63
Ana´lise de Regressa\u2dco
Teste de significa\u2c6ncia do MRLS
Se H0 : \u3b21 = 0 e´ rejeitado, implica que X tem importa\u2c6ncia ao explicar a
variabilidade de Y
() MRLS 2012 40 / 63
Ana´lise de Regressa\u2dco
Exemplo
Teste de significa\u2c6ncia para o MRLS para os dados do exemplo 1, com
\u3b1 = 0, 05.
As hipo´teses sa\u2dco H0 : \u3b21 = 0, vs H1 : \u3b21 6= 0
Do exemplo tem-se:
\u3b2\u2c61 = 0, 00873, n = 20 Sxx = 614, 603, \u3c3\u2c6
2 = 0, 2512,
De modo que a estat´\u131stica de teste, e´:
Tobs =
\u3b2\u2c61\u221a
\u3c3\u2c62/Sxx
=
0, 00873\u221a
0, 2513/614.603
= 13, 65.
Como Tobs = 13, 65 > t0,03,18 = 2, 101, rejeita-se a hipo´tese H0 : \u3b21 = 0.
() MRLS 2012 41 / 63
Ana´lise de Regressa\u2dco
Ana´lise de varia\u2c6ncia
O me´todo consiste em decompor a variabilidade da varia´vel resposta em
componentes mais maneja´veis. Considere a seguinte identidade:
(Yi \u2212 Y¯ ) = (Yi \u2212 Y\u2c6i \u2212 Y¯ + Y\u2c6i )
Elevando ao quadrado a igualdade e somando as n observac¸o\u2dces tem-se
n\u2211
i=1
(Yi \u2212 Y¯ )2 =
\ufe37 \ufe38\ufe38 \ufe37
n\u2211
i=1
(Y\u2c6i \u2212 Y¯ )2 +
\ufe37 \ufe38\ufe38 \ufe37
n\u2211
i=1
(Yi \u2212 Y\u2c6i )2 .
() MRLS 2012 42 / 63
Ana´lise de Regressa\u2dco
Ana´lise de varia\u2c6ncia
SQR =
n\u2211
i=1
(Yi \u2212 Y\u2c6i )2 soma de quadrados dos residuais e
SQreg =
n\u2211
i=1
(Y\u2c6i \u2212 Y¯ )2, soma de quadrados da regressa\u2dco. Logo,
SYY = SQreg + SQR
onde SYY =
n\u2211
i=1
(Y\u2c6i \u2212 Y¯ )2 e´ a soma de quadrados total de Y ,
representando por SQT .
() MRLS 2012 43 / 63
Ana´lise de Regressa\u2dco
Ana´lise de varia\u2c6ncia
Se a hipo´tese nula H0 : \u3b21 = 0 e´ verdadeira, a estat´\u131stica
F =
SQreg/1
SQR/(n \u2212 2) =
QMreg
QMR
\u223c F (1, n \u2212 2),
Portanto, rejeita-se H0 se F0bs > F\u3b1, 1, n\u22122.
As quantidades QMreg = SQreg1 , (quadrado me´dio devido a` regressa\u2dco) e
QMR = SQR(n\u22122) ( quadrado me´dio residual)
() MRLS 2012 44 / 63
Ana´lise de Regressa\u2dco
Tabela de ANOVA
Fonte de Soma de Graus de Quadrado
variac¸a\u2dco Quadrados Liberdade Me´dio F
Regressa\u2dco SQreg 1 QMreg QMregQMR
Residual SQR n \u2212 2 QMR
Total SQT n \u2212 1
() MRLS 2012 45 / 63
Ana´lise de Regressa\u2dco
Exemplo
Exemplo o procedimento de ana´lise de varia\u2c6ncia para testar se de fato
existe relac¸a\u2dco linear entre o nu´mero de clientes (X) e as vendas semanais
(Y), no modelo proposto para os dados do exemplo . Relembre que
Syy = 51, 3605, \u3b2\u2c61 = 0, 00873, Sxy = 5.365, 08 e n = 20.
A soma de quadrados da regressa\u2dco e´
SQreg = \u3b2\u2c61Sxy = (0, 00873)(5.365, 08) = 46, 8371
enquanto a soma de quadrados dos residuais e´:
SQR = SQT \u2212 \u3b2\u2c61Sxy = 51, 3605\u2212 46, 8371 = 4, 5234
Nesse caso, a estat´\u131stica de teste e´
F0bs = QMreg/QMR = 46, 837148/0, 2512 = 186, 4536.
Como Fobs = 186, 4536 > F0,05,1,18 = 4, 41 rejeita-se H0, ao n´\u131vel de
significa\u2c6ncia de 5%.
() MRLS 2012 46 / 63
Ana´lise de Regressa\u2dco
Tabela de ANOVA para
Fonte de Soma de Graus de Quadrado
variac¸a\u2dco Quadrados Liberdade Me´dio F
Regressa\u2dco 46, 8371 1 46, 8371 186,45
Residual 4, 5234 18 0, 2513
Total 51, 3605 19
() MRLS 2012 47 / 63
Ana´lise de Regressa\u2dco
Ana´lise de Regressa\u2dco com o R
X = c(907, 926, 506, 741, 789, 889, 874, 510, 529, 420, 679, 872, 924, 607, 452, 729, 794, 844, 1010, 621)
Y =
c(11.20, 11.05, 6.84, 9.21, 9.42, 10.08, 9.45, 6.73, 7.24, 6.12, 7.63, 9.43, 9.46, 7.64, 6.92, 8.95, 9.33, 10.23, 11.77, 7.41)
> fit = lm(Y \u223c X )
>summary(fit)