ARM
58 pág.

ARM


DisciplinaEstatística Aplicada10.126 materiais85.889 seguidores
Pré-visualização4 páginas
= x0t\u3b2 = µY |x0 e varia\u2c6ncia e´
µ\u2c6Y |x0 e´
Var(µ\u2c6Y |x0) = \u3c3
2x0
t(XtX)\u22121x0
VGC (FEB-UNESP) MRLM 2012 35 / 58
Supondo que as suposic¸o\u2dces do MRLM sejam va´lidos pode-se mostrar que a
varia´vel aleato´ria
T =
µ\u2c6Y |x0 \u2212 µY |x0\u221a
\u3c3\u2c62x0t(X
tX)\u22121x0
tem distribuic¸a\u2dco t-Student com n \u2212 p graus de liberdade.
Para um MRLM, um intervalo de 100(1\u2212 \u3b1)% de confianc¸a para a
resposta me´dia no ponto x01, x02, . . . , x0k e´ dado por:
IC (µY |x0 ; 1\u2212 \u3b1) =
[
µ\u2c6Y |x0 \u2212 t\u3b12 ,n\u2212p
\u221a
\u3c3\u2c62x0t(X
tX)\u22121x0; .
µ\u2c6Y |x0 + t\u3b12 ,n\u2212p
\u221a
\u3c3\u2c62x0t(X
tX)\u22121x0
]
(23)
VGC (FEB-UNESP) MRLM 2012 36 / 58
Exemplo
Suponha que temos interesse em construir um intervalo de 95% de
confianc¸a para consumo me´dio de eletricidade em dias que ar condicionado
foi usado por 8 horas e secadora de roupa foi ligada uma vez.
Temos interesse em determinar IC (µY |x0 ; 0, 95) =?. Neste caso
x0t = (1, 8, 1). O consumo me´dio de eletricidade estimada neste ponto e´:
µ\u2c6Y |x0 = x0
t\u3b2\u2c6 = (1, 8, 1)
\uf8ee\uf8f0 8, 105385, 4659
13, 2166
\uf8f9\uf8fb = 65, 0492.
VGC (FEB-UNESP) MRLM 2012 37 / 58
A estimativa da varia\u2c6ncia de µ\u2c6Y |x0 , esta dada por:
\u3c3\u2c62x0
t(XtX)\u22121x0 = 15, 48722(1, 8, 1)
\uf8ee\uf8f0 0, 397400 \u22120, 035902 \u22120, 070721\u22120, 035902 0, 005090 0, 000447
\u22120, 070721 0, 000447 0, 047337
\uf8f9\uf8fb\uf8ee\uf8f0 18
1
\uf8f9\uf8fb = 0, 956484
e t0,025,18 = 2, 101. Portanto,
IC (µY |x0 ; 0, 95) =
(
65, 0492\u2212 2, 101×
\u221a
0, 956484;
65, 0492 + 2, 101×
\u221a
0, 956484
)
= (62, 994; 67, 104)
VGC (FEB-UNESP) MRLM 2012 38 / 58
Previsa\u2dco de novas observac¸o\u2dces
Um modelo de regressa\u2dco pode ser utilizado para prever observac¸o\u2dces
futuras da varia´vel resposta Y , correspondentes a valores particulares das
varia´veis independentes, por exemplo, x01, x02, . . . , x0k . Se
x0t = [1, x01, x02, . . . , x0k ], enta\u2dco uma estimac¸a\u2dco pontual da observac¸a\u2dco
futura Y0 no ponto x01, x02, . . . , x0k e´
Y\u2c60 = x0
t\u3b2\u2c6.
Um intervalo de 100(1\u2212 \u3b1)% de confianc¸a para esta observac¸a\u2dco futura e´
IC (Y0; 1\u2212 \u3b1) =
[
Y\u2c60 \u2212 t\u3b1
2
,n\u2212p
\u221a
\u3c3\u2c62(1 + x0t(X
tX)\u22121x0) ;
Y\u2c60 + t\u3b1
2
,n\u2212p
\u221a
\u3c3\u2c62(1 + x0t(X
tX)\u22121x0)
] (24)
VGC (FEB-UNESP) MRLM 2012 39 / 58
Exemplo
Suponha que temos interesse em construir um intervalo de 95% de
confianc¸a, para o consumo de eletricidade num dia, quando o ar
condicionado for ligado durante 8 horas e a secadora de roupa for ligada
uma vez nesse dia.
Note que x0t = [1, 8, 1], a estimac¸a\u2dco pontual da quantidade de eletricidade
e´ Y\u2c6 = x0t\u3b2\u2c6 = 65, 0492 horas. No exemplo anterior calculou-se
\u3c3\u2c62x0t(X
tX)\u22121x0 = 0, 956484, logo,
\u3c3\u2c62(1+x0
t(XtX)\u22121x0) = \u3c3\u2c62+\u3c3\u2c62x0t(XtX)\u22121x0 = 15, 48722+0, 956484 = 16, 4437.
Portanto, substituindo na equac¸a\u2dco (24), tem-se que:
IC (Y0, 0, 95) =
(
65, 0492\u2212 2, 101
\u221a
16, 4437; 65, 0492 + 2, 101
\u221a
16, 4437
)
= (56, 529; 73, 569)
VGC (FEB-UNESP) MRLM 2012 40 / 58
Teste de significa\u2c6ncia da regressa\u2dco
Com o objetivo de determinar se existe um relacionamento linear entre a
varia´vel resposta,Y e o conjunto de varia´veis explicativas, X1,X2, . . . ,Xk
pode ser utilizado o teste de significa\u2c6ncia da regressa\u2dco. Neste teste, as
hipo´teses apropriadas sa\u2dco:
H0 : \u3b21 = \u3b22 = . . . ,= \u3b2k = 0
H1 : \u3b2j 6= 0, para pelo menos um j . (25)
A rejeic¸a\u2dco de H0, significa que pelo menos uma das varia´veis independentes
ou regressoras X1,X2, . . . ,Xn contribuic¸a\u2dco significativa no modelo.
VGC (FEB-UNESP) MRLM 2012 41 / 58
O teste de significa\u2c6ncia da regressa\u2dco e´ uma generalizac¸a\u2dco do
procedimento utilizado no modelo de regressa\u2dco linear simples.
A soma de quadrados total Syy (SQT) se divide em uma soma de
quadrados devida a` regressa\u2dco e uma soma de quadrados devida ao
residual, digamos
SQT = Syy = SQreg + SQR
Se H0 : \u3b21 = \u3b22 = . . . ,= \u3b2k = 0 e´ verdadeira, enta\u2dco SQreg/\u3c3
2 e´
uma varia´vel aleato´ria qui-quadrado com k graus de liberdade.
Observe que o nu´mero de graus de liberdade para esta varia´vel
qui-quadrado e´ igual ao nu´mero de varia´veis independentes do
modelo.
VGC (FEB-UNESP) MRLM 2012 42 / 58
Tambe´m pode-se demonstrar que SQR/\u3c32 tem distribuic¸a\u2dco
qui-quadrado com n \u2212 p graus de liberdade e que SQreg e SQR sa\u2dco
independentes.
Portanto a estat´\u131stica de teste para testar (25) e´:
F =
SQreg/k
SQR/n \u2212 p =
QMreg
QMR
(26)
a qual sob a hipo´teses nula tem distribuic¸a\u2dco F com k e n \u2212 p graus
de liberdade numerador e denominador respectivamente.
Rejeita-se Ho se Fobs > F\u3b1,k,n\u2212p.
VGC (FEB-UNESP) MRLM 2012 43 / 58
O procedimento e´ resumido em uma tabela de ana´lise de varia\u2c6ncia.
Tabela: Ana´lise de varia\u2c6ncia para o teste de H0 : \u3b21 = \u3b22 = . . . ,= \u3b2k = 0
Fonte de Soma de Graus de Quadrado
variac¸a\u2dco Quadrados Liberdade Me´dio F
Regressa\u2dco SQreg k QMreg QMreg/QMR
Residual SQR n \u2212 p QMR
Total SQT n \u2212 1
VGC (FEB-UNESP) MRLM 2012 44 / 58
Da equac¸a\u2dco (20) tem-se uma formula para ca´lculo de SQR, isto e´,
SQR = yty \u2212 \u3b2\u2c6tXty
Agora pode-se determinar uma formula simples para o ca´lculo da SQR, ja´
que SQT = yty \u2212
(
n\u2211
i=1
Yi
)2
n , enta\u2dco a equac¸a\u2dco anterior pode-se escrever
como
SQR = yty \u2212
(
n\u2211
i=1
Yi
)2
n
\u2212
\uf8ee\uf8ef\uf8ef\uf8ef\uf8f0\u3b2\u2c6tXty \u2212
(
n\u2211
i=1
Yi
)2
n
\uf8f9\uf8fa\uf8fa\uf8fa\uf8fb
ou seja,
SQR = SQT \u2212 SQreg
Portanto, a soma de quadrados da regressa\u2dco e´:
SQreg = \u3b2\u2c6
t
Xty \u2212
(
n\u2211
i=1
Yi
)2
n
. (27)
VGC (FEB-UNESP) MRLM 2012 45 / 58
Exemplo
Para avaliar se de fato existem relac¸a\u2dco linear entre a varia´vel quantidade
de eletricidade consumida e as varia´veis nu´mero de horas de uso do ar
condicionado e o nu´mero de vezes que secadora foi usada, decidiu-se testar
se os coeficientes de regressa\u2dco \u3b21 e \u3b22 do MRLM pederiam ser ambos
iguais a zero. Isto e´, H0 : \u3b21 = \u3b22 = 0 ; H1 : \u3b21 6= 0, ou \u3b22 6= 0.
Algumas das quantidades nume´ricas ja´ foram calculadas no exemplo 2. A
soma de quadrados total e´
SQT = yty \u2212
(
n\u2211
i=1
Yi
)2
n
= 97914\u2212 (1362)
2
21
= 9578, 57143.
VGC (FEB-UNESP) MRLM 2012 46 / 58
A soma de quadrados da regressa\u2dco calcula-se com equac¸a\u2dco (27),
SQreg = \u3b2\u2c6
t
Xty \u2212
(
n\u2211
i=1
Yi
)2
n
= 97635, 2311\u2212 (1362)
2
21
= 9299, 80154.
E por diferenc¸a
SQR = SQT \u2212 SQreg = 9578, 57143\u2212 9299, 80154 = 278, 76989
Para testar H0 : \u3b21 = \u3b22 = 0, calcula-se a estat´\u131stica de teste
Fobs =
QMreg
QMR
=
4649, 90077
4649, 90077
= 300, 241
Ja´ que Fobs > F0,05,2,18 = 3, 55, rejeita-se H0.
VGC (FEB-UNESP) MRLM 2012 47 / 58
Tabela: Ana´lise de varia\u2c6ncia para o teste de H0 : \u3b21 = \u3b22 = 0
Fonte de Soma de Graus de Quadrado
variac¸a\u2dco Quadrados Liberdade Me´dio F
Regressa\u2dco 9299, 80154 2 4649, 90077 300, 241
Residual 278, 76989 18 15, 48722
Total 9578, 57143 20
Conclu´\u131-se ao n´\u131vel de significa\u2c6ncia de 5% que a varia´vel quantidade de
eletricidade consumida se relaciona linearmente com as varia´veis nu´mero
de horas uso do ar condicionado e nu´mero de vezes a secadora foi ligada.
VGC (FEB-UNESP) MRLM 2012 48 / 58
Teste para avaliar se um u´nico H0 : \u3b2j = 0
Suponha que temos interesse em determinar a importa\u2c6ncia da varia´vel
explicativa xj no modelo de regressa\u2dco adotada.
Neste caso as hipo´teses a ser testada sa\u2dco:
H0 : \u3b2j = 0
H1 : \u3b2j 6= 0.
A estat´\u131stica de teste e´:
T =
\u3b2\u2c6j\u221a
\u3c3\u2c62Cjj
(28)
a qual tem distribuic¸a\u2dco t-Student com n \u2212 p graus de liberdade se
hipo´tese nula e´ verdadeira. Onde Cjj e´ o j-e´simo elemento da
diagonal principal da matriz (XtX)\u22121.
Rejeita-se H0 : \u3b2j = 0 se |Tobs | > t\u3b1/2,n\u2212p.
VGC (FEB-UNESP) MRLM 2012 49 / 58
Esse teste se conhece como teste parcial ou marginal, ja´ que \u3b2\u2c6j depende
de todas as demais varia´veis de regressa\u2dco Xi (i 6= j) que esta\u2dco no modelo.
Se H0 : \u3b2j = 0 na\u2dco for rejeitada este resultado indica que a varia´vel Xj
podera´ ser exclu´\u131do do modelo.
Exemplo
Considere os dados do exemplo, e suponha que deseja testar a hipo´teses
de que o coeficiente de regressa\u2dco para X2 e´ zero. As hipo´teses sa\u2dco:
H0 : \u3b22 = 0
H1 : \u3b22 6= 0.
VGC (FEB-UNESP) MRLM 2012 50 / 58
O elemento da diagonal principal da matriz (XtX)\u22121 que corresponde
a \u3b2\u2c62 e´ C22 = 0, 047337, de modo que a estat´\u131stica de teste T da
equac¸a\u2dco (28) e´:
Tobs =
\u3b2\u2c62\u221a
\u3c3\u2c62C22
=
13, 2166\u221a
15, 48722× 0, 047337 = 15, 436
Ja´ que, Tobs > t0,025,18 = 2, 101 rejeitamos H0 : \u3b22 = 0.
Portanto podemos concluir ao n´\u131vel de significa\u2c6ncia