Corr_Regr_2012
63 pág.

Corr_Regr_2012

Disciplina:Estatística Aplicada7.429 materiais64.132 seguidores
Pré-visualização3 páginas
tem-se:

βˆ0 + βˆ1

n∑
i=1

xi =
n∑

i=1

yi (3)

βˆ0

n∑
i=1

xi + βˆ1x
2
i =

n∑
i=1

xi yi .

As equac¸o˜es (3) recebem o nome de equac¸o˜es normais de m´ınimos
quadrados.

() MRLS 2012 25 / 63

Ana´lise de Regressa˜o

Estimac¸a˜o

A soluc¸a˜o dessas equac¸o˜es fornece os EMQ, βˆ0 e βˆ1, dados por:

βˆ0 = y¯ − βˆ1x¯ .

βˆ1 =

n∑
i=1

xi yi −
(

n∑
i=1

xi

)(
n∑

i=1
yi

)
n

n∑
i=1

x2i −
(

n∑
i=1

xi

)2
n

.

onde x¯ =

n∑
i=1

xi

n e y¯ =

n∑
i=1

yi

n .

() MRLS 2012 26 / 63

Ana´lise de Regressa˜o

Estimac¸a˜o

Portanto, a linha de regressa˜o estimada ou ajustada e´ :

yˆ = βˆ0 + βˆ1x

e estima a me´dia da varia´vel dependente para um valor da varia´vel
explicativa X = x , µY |x .
Note que cada par de observac¸o˜es satisfaz a relac¸a˜o:

yi = βˆ0 + βˆ1xi + ei , i = 1, . . . , n

onde ei = yi − yˆi recebe o nome de res´ıduo.

() MRLS 2012 27 / 63

Ana´lise de Regressa˜o

Estimac¸a˜o

Os EMQ de β0 e β1 em termos da notac¸a˜o acima sa˜o:

βˆ0 = y¯ − βˆ1x¯ , βˆ1 = Sxy
Sxx

.

() MRLS 2012 28 / 63

Ana´lise de Regressa˜o

Exemplo de aplicac¸a˜o

Considerando os dados do exemplo

n = 20
n∑

i=1

xi = 907 + 926 + · · · + 621 = 14.623; x¯ = 731, 15

n∑
i=1

yi = 11, 20 + 11, 05 + · · · + 7, 41 = 176, 11; y¯ = 8, 8055

n∑
i=1

x2i = (907)
2 + (926)2 + · · · + (621)2 = 11.306.209

n∑
i=1

y2i = (11, 20)
2 + (11, 05)2 + · · · + (7, 41)2 = 1.602, 0971

n∑
i=1

xi yi = (907)(11, 20) + (11, 05)(926) · · · + (7, 41)(621) = 134.127, 90

() MRLS 2012 29 / 63

Ana´lise de Regressa˜o

Exemplo de aplicac¸a˜o

Sxx =
n∑

i=1

x2i − n(x¯)2 = 11.306.209− 20(731, 15)2 = 614.603

Sxy =
n∑

i=1

xi yi − n(x¯)(y¯) = 134.127, 90− 20(8, 8055)(731, 15) = 5.365, 08

Syy =
n∑

i=1

y2i − n(y¯)2 = 1.609, 0971− 20(8, 8055) = 51, 3605.

As estimativas dos paraˆmetros do MRLS sa˜o:

βˆ1 =
Sxy

Sxx
=

5.365, 08

614.603
= 0, 00873; βˆ0 = y¯ − βˆ1 x¯ = 8, 8055− (0, 00873)(731, 15) = 2, 423.

Portanto, a linha de regressa˜o ajustada ou estimada para esses dados sa˜o:

yˆ = 2, 423 + 0, 00873x.

() MRLS 2012 30 / 63

Ana´lise de Regressa˜o

Diagrama de dispersa˜o

l
l

l

l
l

l

l

l

l

l

l

l l

l

l

l

l

l

l

l

400 500 600 700 800 900 1000

6
7

8
9

10
11

No de Clientes

Ve
nd

a

() MRLS 2012 31 / 63

Ana´lise de Regressa˜o

Suponha que tem-se interesse em prever as vendas semanais para um
supermercado com 600 clientes.
No modelo de regressa˜o ajustado basta substituir X = 600, ı´sto e´,

yˆ = 2, 423 + (0, 00873)(600) = 7, 661.

A venda semanal de 7,661 mil do´lares pode ser interpretada com uma
estimac¸a˜o da venda me´dia semanal verdadeira dos supermercados com
X = 600 clientes, ou como uma estimac¸a˜o de uma futura venda de um
supermercado quando o nu´mero de clientes for X = 600.

() MRLS 2012 32 / 63

Ana´lise de Regressa˜o

Propriedades dos EMQ

Se as suposic¸o˜es do MRLS sejam va´lidas e´ poss´ıvel demonstrar (
εi ∼ NID(0, σ2))

E (βˆ1) = β1, Var(βˆ1) =
σ2

Sxx
.

E (βˆ0) = β0, Var(βˆ0) = σ
2
[

1
n +

x¯2

Sxx

]
.

Cov(βˆ0, βˆ1) = −σ2x¯Sxx
βˆj ∼ N(βj ,Var(βˆj )), j = 0, 1.

() MRLS 2012 33 / 63

Ana´lise de Regressa˜o

Estimac¸a˜o de σ2

Os res´ıduos,
ei = yi − yˆi

sa˜o empregados na estimac¸a˜o de σ2. A soma de quadrados residuais,
denotado por SQR e´:

SQR =
n∑

i=1

e2i =
n∑

i=1

(yi − yˆi )2

Pode-se demonstrar que o valor esperado da soma de quadrados dos
residuais SQR, e´ dado por:

E (SQR) = (n − 2)σ2

() MRLS 2012 34 / 63

Ana´lise de Regressa˜o

Portanto,

σˆ2 =
SQR

n − 2 = QMR (Quadrado me´dio residual),

e´ um estimador na˜o viciado de σ2,
Uma fo´rmula mais conveniente para o ca´lculo da SQR e´ dada por:

SQR = Syy − βˆ1Sxy .

() MRLS 2012 35 / 63

Ana´lise de Regressa˜o

Exemplo

Com os dados do exemplo, e´ feita a estimac¸a˜o da variaˆncia σ2. Nesse
caso, Syy = 51, 3605, Sxy = 5.365, 08 e βˆ1 = 0, 00873.
Portanto, a estimativa de σ2 para o exemplo .

σˆ2 =
SQR

n − 2 =
Syy − βˆ1Sxy

n − 2
=

51, 3605− (0, 00873)(5.365, 08)
20− 2 = 0, 2513.

() MRLS 2012 36 / 63

Ana´lise de Regressa˜o

Teste de hipo´teses sobre β1

Suponha que se deseje testar a hipo´tese de que a inclinac¸a˜o e´ igual a uma
constante representada por β1,0. As hipo´teses apropriadas sa˜o:

H0 : β1 = β1,0, vs H1 : β1 6= β1,0
A estat´ıstica

T =
βˆ1 − β1,0√
σˆ2/Sxx

,

tem distribuic¸a˜o t-Student com n − 2 graus de liberdade sob
H0 : β1 = β1,0. Rejeita-se H0 se

|Tobs | > tα/2, n−2.

() MRLS 2012 37 / 63

Ana´lise de Regressa˜o

Teste de hipo´teses sobre β0

H0 : β0 = β0,0, vs H1 : β0 6= β0,0
A estat´ıstica

T =
βˆ0 − β0,0√
σˆ2[ 1n +

x¯2

Sxx
]

que tem distribuic¸a˜o t-Student com n − 2 graus de liberdade. Rejeitamos
a hipo´teses nula se |Tobs | > tα/2, n−2.

() MRLS 2012 38 / 63

Ana´lise de Regressa˜o

Teste de significaˆncia do MRLS

H0 : β1 = 0, vs H1 : β1 6= 0,
Deixar de rejeitar H0 : β1 = 0 e´ equivalente a concluir que na˜o ha´
nenhuma relac¸a˜o linear entre X e Y .

() MRLS 2012 39 / 63

Ana´lise de Regressa˜o

Teste de significaˆncia do MRLS

Se H0 : β1 = 0 e´ rejeitado, implica que X tem importaˆncia ao explicar a
variabilidade de Y

() MRLS 2012 40 / 63

Ana´lise de Regressa˜o

Exemplo

Teste de significaˆncia para o MRLS para os dados do exemplo 1, com
α = 0, 05.
As hipo´teses sa˜o H0 : β1 = 0, vs H1 : β1 6= 0
Do exemplo tem-se:

βˆ1 = 0, 00873, n = 20 Sxx = 614, 603, σˆ
2 = 0, 2512,

De modo que a estat´ıstica de teste, e´:

Tobs =
βˆ1√
σˆ2/Sxx

=
0, 00873√

0, 2513/614.603
= 13, 65.

Como Tobs = 13, 65 > t0,03,18 = 2, 101, rejeita-se a hipo´tese H0 : β1 = 0.

() MRLS 2012 41 / 63

Ana´lise de Regressa˜o

Ana´lise de variaˆncia

O me´todo consiste em decompor a variabilidade da varia´vel resposta em
componentes mais maneja´veis. Considere a seguinte identidade:

(Yi − Y¯ ) = (Yi − Yˆi − Y¯ + Yˆi )

Elevando ao quadrado a igualdade e somando as n observac¸o˜es tem-se

n∑
i=1

(Yi − Y¯ )2 =
︷ ︸︸ ︷

n∑
i=1

(Yˆi − Y¯ )2 +
︷ ︸︸ ︷

n∑
i=1

(Yi − Yˆi )2 .

() MRLS 2012 42 / 63

Ana´lise de Regressa˜o

Ana´lise de variaˆncia

SQR =
n∑

i=1
(Yi − Yˆi )2 soma de quadrados dos residuais e

SQreg =
n∑

i=1
(Yˆi − Y¯ )2, soma de quadrados da regressa˜o. Logo,

SYY = SQreg + SQR

onde SYY =
n∑

i=1
(Yˆi − Y¯ )2 e´ a soma de quadrados total de Y ,

representando por SQT .

() MRLS 2012 43 / 63

Ana´lise de Regressa˜o

Ana´lise de variaˆncia

Se a hipo´tese nula H0 : β1 = 0 e´ verdadeira, a estat´ıstica

F =
SQreg/1

SQR/(n − 2) =
QMreg

QMR
∼ F (1, n − 2),

Portanto, rejeita-se H0 se F0bs > Fα, 1, n−2.
As quantidades QMreg = SQreg1 , (quadrado me´dio devido a` regressa˜o) e

QMR = SQR(n−2) ( quadrado me´dio residual)

() MRLS 2012 44 / 63

Ana´lise de Regressa˜o

Tabela de ANOVA

Fonte de Soma de Graus de Quadrado
variac¸a˜o Quadrados Liberdade Me´dio F

Regressa˜o SQreg 1 QMreg QMregQMR
Residual SQR n − 2 QMR
Total SQT n − 1

() MRLS 2012 45 / 63

Ana´lise de Regressa˜o

Exemplo

Exemplo o procedimento de ana´lise de variaˆncia para testar se de fato
existe relac¸a˜o linear entre o nu´mero de clientes (X) e as vendas semanais
(Y), no modelo proposto para os dados do exemplo . Relembre que
Syy = 51, 3605, βˆ1 = 0, 00873, Sxy = 5.365, 08 e n = 20.

A soma de quadrados da regressa˜o e´

SQreg = βˆ1Sxy = (0, 00873)(5.365, 08) = 46, 8371

enquanto a soma de quadrados dos residuais e´:

SQR = SQT − βˆ1Sxy = 51, 3605− 46, 8371 = 4, 5234
Nesse caso, a estat´ıstica de teste e´

F0bs = QMreg/QMR = 46, 837148/0, 2512 = 186, 4536.

Como Fobs = 186, 4536 > F0,05,1,18 = 4, 41 rejeita-se H0, ao n´ıvel de
significaˆncia de 5%.

() MRLS 2012 46 / 63

Ana´lise de Regressa˜o

Tabela de ANOVA para

Fonte de Soma de Graus de Quadrado
variac¸a˜o Quadrados Liberdade Me´dio F

Regressa˜o 46, 8371 1 46, 8371 186,45
Residual 4, 5234 18 0, 2513
Total 51, 3605 19

() MRLS 2012 47 / 63

Ana´lise de Regressa˜o

Ana´lise de Regressa˜o com o R

X = c(907, 926, 506, 741, 789, 889, 874, 510, 529, 420, 679, 872, 924, 607, 452, 729, 794, 844, 1010, 621)
Y =
c(11.20, 11.05, 6.84, 9.21, 9.42, 10.08, 9.45, 6.73, 7.24, 6.12, 7.63, 9.43, 9.46, 7.64, 6.92, 8.95, 9.33, 10.23, 11.77, 7.41)
> fit = lm(Y ∼ X )
>summary(fit)