Livro Analise de regressão
402 pág.

Livro Analise de regressão


DisciplinaMatemática Financeira57.816 materiais1.511.334 seguidores
Pré-visualização50 páginas
s\u2212\u2032XX , 
podemos utilizar o valor 
 )( i
ii
bs
b
t
\u3b2\u2212
= , (4.24) 
associado a n \u2013 p graus de liberdade, para testar hipóteses a respeito dos valores dos 
parâmetros. 
Podemos, ainda, construir intervalos de confiança para os parâmetros. Escolhido 
o nível de confiança, e sendo 0t o correspondente valor crítico de t, o intervalo de 
confiança para i\u3b2 é 
 )()( 00 iiiii bstbbstb +<<\u2212 \u3b2 (4.25) 
Devemos ressaltar que tanto o teste t como o intervalo de confiança só são 
válidos se os erros ju tiverem distribuição normal. 
O coeficiente de determinação múltipla é definido por 
 
S.Q.Total
S.Q.Regr.2
=R 
 
 
 130 
e mostra a proporção da soma de quadrados total que é \u201cexplicada\u201d pela regressão 
múltipla. 
Temos que 
 
S.Q.Total
S.Q.Res.1 2 =\u2212 R 
O coeficiente de determinação corrigido para graus de liberdade é definido por 
 )1(1
)(S.Q.Total
1
1
S.Q.Res.)(1
1 22 R
pn
n
n
pnR \u2212
\u2212
\u2212
=
\u2212
\u2212
=\u2212 
ou 
 )1(1 222 R
pn
pRR \u2212
\u2212
\u2212
\u2212= 
4.6. Demonstração de que b é um estimador linear não-tendencioso de 
variância mínima 
Para demonstrar que os estimadores de mínimos quadrados são estimadores 
lineares não-tendenciosos de variância mínima, vamos considerar, inicialmente, a 
combinação linear \u3b2c\u2032 dos parâmetros. Um estimador de \u3b8 = \u3b2c\u2032 é yXXXcbc \u2032\u2032\u2032=\u2032 \u22121)( . 
Na seção 4.4 vimos que bc\u2032 é um estimador não-tendencioso de \u3b2c\u2032 e que, de acordo 
com (4.12), sua variância é 
 
21)()( \u3c3cXXcbc \u2212\u2032\u2032=\u2032V 
Consideremos um estimador linear qualquer yg\u2032=\u3b8\u2c6 de \u3b2c\u2032=\u3b8 . Note que bc\u2032 é 
um caso particular de \u3b8\u2c6 , com XXXcg \u2032\u2032\u2032=\u2032 \u22121)( 
Temos 
 yg\u2032=\u3b8\u2c6 ugX\u3b2guX\u3b2g \u2032+\u2032=+\u2032= )( (4.26) 
Então, para que \u3b8\u2c6 seja um estimador não-tendencioso de \u3b2c\u2032 , isto é, para que 
tenhamos E(\u3b8\u2c6 ) = \u3b2c\u2032 , devemos ter 
 cXg \u2032=\u2032 (4.27) 
 
 
 131 
De acordo com (4.12) e (4.27), obtemos 
 
21)()( \u3c3gXXXXgbc \u2032\u2032\u2032=\u2032 \u2212V (4.28) 
De (4.26), obtemos 
 ug\u2032=\u2212 )\u2c6(\u2c6 \u3b8\u3b8 E 
Donde 
 =\u2212=
2)]\u2c6(\u2c6[)\u2c6( \u3b8\u3b8\u3b8 EEV 
 )( guug \u2032\u2032= E 
Como 2)( \u3c3Iuu =\u2032E , podemos escrever 
 
2)\u2c6( \u3c3\u3b8 gg\u2032=V (4.29) 
De (4.28) e (4.29) segue-se que 
 
21 ])([)()\u2c6( \u3c3\u3b8 gXXXXgggbc \u2032\u2032\u2032\u2212\u2032=\u2032\u2212 \u2212VV = 
 
21 ])([ \u3c3gXXXXIg \u2032\u2032\u2212\u2032= \u2212 = 
 
2Mgg \u3c3\u2032= 
Vimos, em (4.21), que Muuee \u2032=\u2032 . Ora, 0\u2265\u2032ee porque é uma soma de 
quadrados. Portanto M é uma matriz semidefinida positiva e 0\u2265\u2032Mgg . Concluímos 
então que 
 )()\u2c6( bc\u2032\u2265 VV \u3b8 , (4.30) 
onde yg\u2032=\u3b8\u2c6 é qualquer estimador linear não-tendencioso de \u3b2c\u2032 . 
Consideremos o caso particular em que 
 [ ]00100 KK=\u2032c , 
isto é, o i-ésimo elemento do vetor c\u2032 é igual a um, e todos os outros são iguais a zero. 
Então a desigualdade (4.30) fica 
 )()\u2c6( ibVV \u2265\u3b8 
onde yg\u2032=\u3b8\u2c6 é qualquer estimador linear não-tendencioso de i\u3b2 . 
 
 
 132 
Esse resultado mostra que, dentre os estimadores lineares não-tendenciosos, ib é 
o que tem menor variância, isto é, os estimadores de mínimos quadrados são 
estimadores lineares não-tendenciosos de variância mínima. 
 
4.7. O uso das variáveis centradas 
Para simplificar os cálculos, muitas vezes trabalhamos com as variáveis 
centradas 
 iijij XXx \u2212= , i = 1, 2, ..., k 
onde 
 \u2211
=
=
n
j
iji X
n
X
1
1
 
Neste caso o modelo estatístico fica 
 jkjkjj uxxY ++++= \u3b2\u3b2\u3b2 K110 , j = 1, 2, ..., n 
ou em notação matricial, 
 uXy += \u3b2 
com as devidas mudanças nas definições das matrizes X e \u3b2. 
As matrizes XX\u2032 e yX\u2032 ficam 
 
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
\u2211\u2211\u2211
\u2211\u2211\u2211
\u2211\u2211\u2211
=\u2032
2
21
2
2
221
121
2
1
0
0
0
000
kjkjjkjj
kjjjjj
kjjjjj
xxxxx
xxxxx
xxxxx
n
K
MMMM
K
K
K
XX 
e 
 
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
\u2211
\u2211
\u2211
\u2211
=\u2032
jkj
jj
jj
j
Yx
Yx
Yx
Y
M
2
1
yX 
 
 
 133 
Decompondo a matriz XX\u2032 apropriadamente, o elemento igual a n pode ser 
invertido separadamente. Então a estimativa de 0\u3b2 é 
 Y
n
Y
b j =
\u2211
=0 
Verifica-se que a expressão (4.15) pode ser escrita como segue: 
 S.Q.Res. = jij
n
ji
k
i
j
n
jj
n
j
YxbYYY
111
2
1 ====
\u2211\u2211\u2212\u2211\u2212\u2211 
Como 
 =
\u2211
\u2212\u2211=\u2211\u2212\u2211
n
Y
YYYY jjjj
2
22 )( S.Q.Total, 
concluímos que 
 S.Q.Regr. = jij
n
ji
k
i
Yxb
11 ==
\u2211\u2211 (4.31) 
Determinadas as estimativas dos parâmetros do modelo simplificado, se 
quisermos escrever a equação estimada com as variáveis na forma original, basta 
calcular a estimativa de \u3b1, dada por 
 ii XbYa \u2211\u2212= (4.32) 
Às vezes, os cálculos são feitos com todas as variáveis centradas, inclusive a 
variável dependente, ou seja, utilizamos 
 YYy jj \u2212= 
Se somarmos, membro a membro, as relações (4.1), para j = 1, 2, ..., n, e 
dividirmos por n, obtemos 
 uXY ii
k
i
+\u2211+=
=
\u3b2\u3b1
1
 (4.33) 
onde 
 ju
n
u \u2211=
1
 
Subtraindo (4.33) das relações (4.1) obtemos 
 uuxy jiji
k
i
j \u2212+\u2211=
=
\u3b2
1
 
 
 
 134 
ou 
 uuX\u3b2y \u2212+= (4.34) 
onde 
 
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
=
ny
y
y
M
2
1
y 
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
=
knnn
k
k
xxx
xxx
xxx
K
MMM
K
K
21
22212
12111
X 
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
=
k\u3b2
\u3b2
\u3b2
M
2
1
\u3b2 
e u é um vetor-coluna com n elementos iguais a 
 ju
n
u \u2211=
1
 
É fácil verificar que, neste caso, a matriz XX\u2032 é igual à do modelo onde apenas 
as variáveis independentes são centradas excluindo a primeira linha e a primeira coluna, 
e a matriz yX\u2032 é igual à do mesmo modelo, excluindo apenas o primeiro elemento. Os 
termos yy\u2032 e yXb \u2032\u2032 de (4.15) correspondem, respectivamente, à soma de quadrados 
total e à soma de quadrados de regressão, de maneira que o coeficiente de determinação 
é 
 
yy
yXb
\u2032
\u2032\u2032
=
2R 
As propriedades dos estimadores não são afetadas pelo uso de variáveis 
centradas. Assim, substituindo (4.34) na expressão 
 yXXXb \u2032\u2032= \u22121)( 
obtemos 
 =\u2212+\u2032\u2032= \u2212 )()( 1 uuX\u3b2XXXb 
 uXXXuXXX\u3b2 \u2032\u2032\u2212\u2032\u2032+= \u2212\u2212 11 )()( (4.35) 
À primeira vista, o resultado obtido em (4.35) é diferente da expressão (4.10), 
obtida quando as variáveis não são centradas. Entretanto, os elementos do vetor uX\u2032 , 
com variáveis centradas, são 
 0=\u2211=\u2211 ijjijj xuux 
Então, a expressão (4.35) fica 
 uXXX\u3b2b \u2032\u2032+= \u22121)( , 
que é a relação (4.10). 
Assim, da mesma maneira que no modelo sem centrar as variáveis, temos: 
 
 
 135 
 \u3b2b =)(E 
e 
 
21)()( \u3c3\u2212\u2032= XXbV 
4.8. Exemplo de uma regressão linear múltipla com duas variáveis 
explanatórias 
Na tabela 4.1 apresentamos os valores de uma amostra de 5 observações das 
variáveis jY , jX 1 e jX 2 . 
TABELA 4.1. Valores de três variáveis em uma amostra de 5 observações. 
jY jX 1 jX 2 
16,5 1,0 2 
14,0 3,5 3 
6,0 4,0 4 
10,0 7,5 5 
3,5 9,0 6 
 
Obtemos: 
 50=\u2211 jY 251 =\u2211 jX 202 =\u2211 jX 
 10=Y 51 =X 42 =X 
 5,1162 =\u2211 jy 5,4121 =\u2211 jx 1022 =\u2211 jx 
 541 \u2212=\u2211 jjYx 302 \u2212=\u2211 jjYx 2021 =\u2211 jj xx 
Tendo em vista o modelo 
 jjjj uxxY +++= 22110 \u3b2\u3b2\u3b2 , 
construímos as matrizes 
 
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
=
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
\u2211\u2211
\u2211\u2211=\u2032
10200
205,410
005
0
0
00
2
221
21
2
1
jjj
jjj
xxx
xxx
n
XX 
 
 
 136 
 
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
\u2212
\u2212=
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
\u2211
\u2211
\u2211
=\u2032
30
54
50
2
1
jj
jj
j
Yx
Yx
Y
yX 
A seguir, determinamos as estimativas dos parâmetros 
 
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
\u2212
=
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
\u2212
\u2212
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
Annanda
Annanda fez um comentário
salvou meu TCC! obrigada!
0 aprovações
Douglas
Douglas fez um comentário
Muito obrigado por compartilhar!
0 aprovações
Carregar mais