ARM
58 pág.

ARM

Disciplina:Estatística Aplicada7.328 materiais63.601 seguidores
Pré-visualização4 páginas
= x0tβ = µY |x0 e variaˆncia e´
µˆY |x0 e´

Var(µˆY |x0) = σ
2x0

t(XtX)−1x0
VGC (FEB-UNESP) MRLM 2012 35 / 58

Supondo que as suposic¸o˜es do MRLM sejam va´lidos pode-se mostrar que a
varia´vel aleato´ria

T =
µˆY |x0 − µY |x0√
σˆ2x0t(X

tX)−1x0
tem distribuic¸a˜o t-Student com n − p graus de liberdade.
Para um MRLM, um intervalo de 100(1− α)% de confianc¸a para a
resposta me´dia no ponto x01, x02, . . . , x0k e´ dado por:

IC (µY |x0 ; 1− α) =
[
µˆY |x0 − tα2 ,n−p

√
σˆ2x0t(X

tX)−1x0; .

µˆY |x0 + tα2 ,n−p
√
σˆ2x0t(X

tX)−1x0
]

(23)

VGC (FEB-UNESP) MRLM 2012 36 / 58

Exemplo

Suponha que temos interesse em construir um intervalo de 95% de
confianc¸a para consumo me´dio de eletricidade em dias que ar condicionado
foi usado por 8 horas e secadora de roupa foi ligada uma vez.

Temos interesse em determinar IC (µY |x0 ; 0, 95) =?. Neste caso
x0t = (1, 8, 1). O consumo me´dio de eletricidade estimada neste ponto e´:

µˆY |x0 = x0
tβˆ = (1, 8, 1)

 8, 105385, 4659
13, 2166

 = 65, 0492.

VGC (FEB-UNESP) MRLM 2012 37 / 58

A estimativa da variaˆncia de µˆY |x0 , esta dada por:

σˆ2x0
t(XtX)−1x0 = 15, 48722(1, 8, 1)

 0, 397400 −0, 035902 −0, 070721−0, 035902 0, 005090 0, 000447
−0, 070721 0, 000447 0, 047337

 18
1

 = 0, 956484
e t0,025,18 = 2, 101. Portanto,

IC (µY |x0 ; 0, 95) =
(

65, 0492− 2, 101×
√

0, 956484;

65, 0492 + 2, 101×
√

0, 956484
)

= (62, 994; 67, 104)

VGC (FEB-UNESP) MRLM 2012 38 / 58

Previsa˜o de novas observac¸o˜es

Um modelo de regressa˜o pode ser utilizado para prever observac¸o˜es
futuras da varia´vel resposta Y , correspondentes a valores particulares das
varia´veis independentes, por exemplo, x01, x02, . . . , x0k . Se
x0t = [1, x01, x02, . . . , x0k ], enta˜o uma estimac¸a˜o pontual da observac¸a˜o
futura Y0 no ponto x01, x02, . . . , x0k e´

Yˆ0 = x0
tβˆ.

Um intervalo de 100(1− α)% de confianc¸a para esta observac¸a˜o futura e´

IC (Y0; 1− α) =
[

Yˆ0 − tα
2
,n−p

√
σˆ2(1 + x0t(X

tX)−1x0) ;

Yˆ0 + tα
2
,n−p

√
σˆ2(1 + x0t(X

tX)−1x0)
] (24)

VGC (FEB-UNESP) MRLM 2012 39 / 58

Exemplo

Suponha que temos interesse em construir um intervalo de 95% de
confianc¸a, para o consumo de eletricidade num dia, quando o ar
condicionado for ligado durante 8 horas e a secadora de roupa for ligada
uma vez nesse dia.

Note que x0t = [1, 8, 1], a estimac¸a˜o pontual da quantidade de eletricidade
e´ Yˆ = x0tβˆ = 65, 0492 horas. No exemplo anterior calculou-se
σˆ2x0t(X

tX)−1x0 = 0, 956484, logo,

σˆ2(1+x0
t(XtX)−1x0) = σˆ2+σˆ2x0t(XtX)−1x0 = 15, 48722+0, 956484 = 16, 4437.

Portanto, substituindo na equac¸a˜o (24), tem-se que:

IC (Y0, 0, 95) =
(

65, 0492− 2, 101
√

16, 4437; 65, 0492 + 2, 101
√

16, 4437
)

= (56, 529; 73, 569)

VGC (FEB-UNESP) MRLM 2012 40 / 58

Teste de significaˆncia da regressa˜o

Com o objetivo de determinar se existe um relacionamento linear entre a
varia´vel resposta,Y e o conjunto de varia´veis explicativas, X1,X2, . . . ,Xk
pode ser utilizado o teste de significaˆncia da regressa˜o. Neste teste, as
hipo´teses apropriadas sa˜o:

H0 : β1 = β2 = . . . ,= βk = 0

H1 : βj 6= 0, para pelo menos um j . (25)

A rejeic¸a˜o de H0, significa que pelo menos uma das varia´veis independentes
ou regressoras X1,X2, . . . ,Xn contribuic¸a˜o significativa no modelo.

VGC (FEB-UNESP) MRLM 2012 41 / 58

O teste de significaˆncia da regressa˜o e´ uma generalizac¸a˜o do
procedimento utilizado no modelo de regressa˜o linear simples.

A soma de quadrados total Syy (SQT) se divide em uma soma de
quadrados devida a` regressa˜o e uma soma de quadrados devida ao
residual, digamos

SQT = Syy = SQreg + SQR

Se H0 : β1 = β2 = . . . ,= βk = 0 e´ verdadeira, enta˜o SQreg/σ
2 e´

uma varia´vel aleato´ria qui-quadrado com k graus de liberdade.

Observe que o nu´mero de graus de liberdade para esta varia´vel
qui-quadrado e´ igual ao nu´mero de varia´veis independentes do
modelo.

VGC (FEB-UNESP) MRLM 2012 42 / 58

Tambe´m pode-se demonstrar que SQR/σ2 tem distribuic¸a˜o
qui-quadrado com n − p graus de liberdade e que SQreg e SQR sa˜o
independentes.

Portanto a estat´ıstica de teste para testar (25) e´:

F =
SQreg/k

SQR/n − p =
QMreg

QMR
(26)

a qual sob a hipo´teses nula tem distribuic¸a˜o F com k e n − p graus
de liberdade numerador e denominador respectivamente.

Rejeita-se Ho se Fobs > Fα,k,n−p.

VGC (FEB-UNESP) MRLM 2012 43 / 58

O procedimento e´ resumido em uma tabela de ana´lise de variaˆncia.

Tabela: Ana´lise de variaˆncia para o teste de H0 : β1 = β2 = . . . ,= βk = 0

Fonte de Soma de Graus de Quadrado
variac¸a˜o Quadrados Liberdade Me´dio F

Regressa˜o SQreg k QMreg QMreg/QMR
Residual SQR n − p QMR
Total SQT n − 1

VGC (FEB-UNESP) MRLM 2012 44 / 58

Da equac¸a˜o (20) tem-se uma formula para ca´lculo de SQR, isto e´,

SQR = yty − βˆtXty
Agora pode-se determinar uma formula simples para o ca´lculo da SQR, ja´

que SQT = yty −
(

n∑
i=1

Yi

)2
n , enta˜o a equac¸a˜o anterior pode-se escrever

como

SQR = yty −

(
n∑

i=1
Yi

)2
n

−

βˆtXty −
(

n∑
i=1

Yi

)2
n


ou seja,

SQR = SQT − SQreg
Portanto, a soma de quadrados da regressa˜o e´:

SQreg = βˆ
t
Xty −

(
n∑

i=1
Yi

)2
n

. (27)

VGC (FEB-UNESP) MRLM 2012 45 / 58

Exemplo

Para avaliar se de fato existem relac¸a˜o linear entre a varia´vel quantidade
de eletricidade consumida e as varia´veis nu´mero de horas de uso do ar
condicionado e o nu´mero de vezes que secadora foi usada, decidiu-se testar
se os coeficientes de regressa˜o β1 e β2 do MRLM pederiam ser ambos
iguais a zero. Isto e´, H0 : β1 = β2 = 0 ; H1 : β1 6= 0, ou β2 6= 0.
Algumas das quantidades nume´ricas ja´ foram calculadas no exemplo 2. A
soma de quadrados total e´

SQT = yty −

(
n∑

i=1
Yi

)2
n

= 97914− (1362)
2

21
= 9578, 57143.

VGC (FEB-UNESP) MRLM 2012 46 / 58

A soma de quadrados da regressa˜o calcula-se com equac¸a˜o (27),

SQreg = βˆ
t
Xty −

(
n∑

i=1
Yi

)2
n

= 97635, 2311− (1362)
2

21
= 9299, 80154.

E por diferenc¸a

SQR = SQT − SQreg = 9578, 57143− 9299, 80154 = 278, 76989

Para testar H0 : β1 = β2 = 0, calcula-se a estat´ıstica de teste

Fobs =
QMreg

QMR
=

4649, 90077

4649, 90077
= 300, 241

Ja´ que Fobs > F0,05,2,18 = 3, 55, rejeita-se H0.

VGC (FEB-UNESP) MRLM 2012 47 / 58

Tabela: Ana´lise de variaˆncia para o teste de H0 : β1 = β2 = 0

Fonte de Soma de Graus de Quadrado
variac¸a˜o Quadrados Liberdade Me´dio F

Regressa˜o 9299, 80154 2 4649, 90077 300, 241
Residual 278, 76989 18 15, 48722
Total 9578, 57143 20

Conclu´ı-se ao n´ıvel de significaˆncia de 5% que a varia´vel quantidade de
eletricidade consumida se relaciona linearmente com as varia´veis nu´mero
de horas uso do ar condicionado e nu´mero de vezes a secadora foi ligada.

VGC (FEB-UNESP) MRLM 2012 48 / 58

Teste para avaliar se um u´nico H0 : βj = 0

Suponha que temos interesse em determinar a importaˆncia da varia´vel
explicativa xj no modelo de regressa˜o adotada.

Neste caso as hipo´teses a ser testada sa˜o:

H0 : βj = 0

H1 : βj 6= 0.
A estat´ıstica de teste e´:

T =
βˆj√
σˆ2Cjj

(28)

a qual tem distribuic¸a˜o t-Student com n − p graus de liberdade se
hipo´tese nula e´ verdadeira. Onde Cjj e´ o j-e´simo elemento da
diagonal principal da matriz (XtX)−1.
Rejeita-se H0 : βj = 0 se |Tobs | > tα/2,n−p.
VGC (FEB-UNESP) MRLM 2012 49 / 58

Esse teste se conhece como teste parcial ou marginal, ja´ que βˆj depende
de todas as demais varia´veis de regressa˜o Xi (i 6= j) que esta˜o no modelo.
Se H0 : βj = 0 na˜o for rejeitada este resultado indica que a varia´vel Xj
podera´ ser exclu´ıdo do modelo.

Exemplo

Considere os dados do exemplo, e suponha que deseja testar a hipo´teses
de que o coeficiente de regressa˜o para X2 e´ zero. As hipo´teses sa˜o:

H0 : β2 = 0

H1 : β2 6= 0.

VGC (FEB-UNESP) MRLM 2012 50 / 58

O elemento da diagonal principal da matriz (XtX)−1 que corresponde
a βˆ2 e´ C22 = 0, 047337, de modo que a estat´ıstica de teste T da
equac¸a˜o (28) e´:

Tobs =
βˆ2√
σˆ2C22

=
13, 2166√

15, 48722× 0, 047337 = 15, 436

Ja´ que, Tobs > t0,025,18 = 2, 101 rejeitamos H0 : β2 = 0.

Portanto podemos concluir ao n´ıvel de significaˆncia