Livro Analise de regressão
402 pág.

Livro Analise de regressão


DisciplinaMatemática Financeira57.950 materiais1.514.936 seguidores
Pré-visualização50 páginas
\uf8ef
\uf8f0
\uf8ee
\u2212
\u2212=\u2032\u2032=
\u2212
11
4
10
30
54
50
 
30
83
3
40
3
4
3
20
00
5
1
)( 1 yXXXb 
A equação estimada é, então, 
 jjj xxY 21 11410\u2c6 \u2212+= 
Como 
 511 \u2212= jj Xx 
e 
 422 \u2212= jj Xx 
obtemos 
 jjj XXY 21 11434\u2c6 \u2212+= 
De acordo com (4.31), temos 
 S.Q.Regr. = =\u2211+\u2211 jjjj YxbYxb 2211 
 114)30(11)54(4 =\u2212\u22c5\u2212\u2212\u22c5= 
Então 
 S.Q.Res. = 5,21145,1161142 =\u2212=\u2212\u2211 jy 
Poderíamos, também, ter obtido o valor da soma de quadrados residual de 
(4.15): 
 S.Q.Res. = =\u2032\u2032\u2212\u2032 yXbyy 
 = 616,5 \u2013 614 = 2,5 
 
 
 137 
Com esses resultados podemos construir a tabela de análise da variância. 
TABELA 4.2. Análise da Variância 
C.V. G.L. S.Q. Q.M. F 
Regressão 2 114,0 57 45,6 
Resíduo 2 2,5 1,25 
Total 4 116,5 
 
Para 2 e 2 graus de liberdade e ao nível de significância de 5%, o valor crítico de 
F é 19,00. Portanto, o resultado é significativo, isto é, rejeita-se, a esse nível de 
significância, a hipótese 0: 210 == \u3b2\u3b2H , Um bom programa para computador informa 
que a probabilidade caudal associada a F = 45,6, com 2 e 2 graus de liberdade, é 0,0215, 
permitindo concluir que o resultado é significativo ao nível de 5%, sem necessidade de 
obter o valor crítico de F. 
O coeficiente de determinação múltipla é 
 9785,0
5,116
1142
==R 
isto é, 97,85% da soma de quadrados total é \u201cexplicada\u201d pela regressão linear ajustada. 
Conforme a definição apresentada no final da seção 4.5, podemos verificar que o 
coeficiente de determinação corrigido para graus de liberdade é 9571,02 =R . 
Como 25,12 =s temos, de acordo com (4.23), as seguintes estimativas das 
variâncias e covariâncias das estimativas dos parâmetros: 
 25,0
5
25,1)()()(\u2c6 2020 ==== YsbsbV 
 8333,0
6
525,1
3
2)()(\u2c6 121 ==\u22c5== bsbV 
 4583,3
24
8325,1
30
83)()(\u2c6 222 ==\u22c5== bsbV 
 0),(côv),(côv 21 == bYbY 
 
3
525,1
3
4),(côv 21 \u2212=\u22c5\u2212=bb 
Temos que 
 2211 XbXbYa \u2212\u2212= 
Então 
 
 
 138 
 \u2212\u2212++= ),cov(2)()()()( 11222121 bYXbVXbVXYVaV 
 ),cov(2),cov(2 212122 bbXXbYX +\u2212 
e 
 75,9
3
5452
24
834
6
5525,0)(\u2c6 22 =\uf8f7
\uf8f8
\uf8f6
\uf8ec
\uf8ed
\uf8eb
\u2212\u22c5\u22c5\u22c5+\u22c5+\u22c5+=aV 
Se tivéssemos utilizado o modelo com as variáveis não centradas, a estimativa 
da variância de a seria dada pelo primeiro elemento da diagonal principal de 21)( s\u2212\u2032XX . 
Podemos, agora, testar hipóteses a respeito dos valores dos parâmetros. 
Adotando o nível de significância de 5%, consideremos as seguintes hipóteses: 
a) 50:0 =\u3b1H contra 50: <\u3b1AH 
Temos 
 124,5
75,9
5034
\u2212=
\u2212
=t 
O resultado é significativo, pois a região de rejeição para esse teste unilateral é 
920,2\u2212\u2264t . Portanto, ao nível de significância de 5%, rejeitamos a hipótese 
50:0 =\u3b1H , em favor da hipótese 50: <\u3b1AH . 
b) 0: 10 =\u3b2H contra 0: 1 \u2260\u3b2AH 
Calculamos 
 382,4
8333,0
04
=
\u2212
=t 
Como o valor crítico de t para 2 graus de liberdade e ao nível de significância de 
5% é 4,303, o resultado obtido é significativo, isto é, rejeitamos, a esse nível, a hipótese 
de que 01 =\u3b2 . Um bom programa de computador fornece a probabilidade caudal 
associada ao t calculado (t = 4,382), isto é, a probabilidade de, na distribuição de t com 
2 graus de liberdade, essa variável assumir valor absoluto maior do que 4,382. Essa 
probabilidade é 0,0483, permitindo concluir que o resultado é significativo ao nível de 
5%, sem necessidade de obter o valor crítico de t. 
c) 0: 20 =\u3b2H contra 0: 2 \u2260\u3b2AH 
Obtemos 
 915,5
4583,3
011
\u2212=
\u2212\u2212
=t , significativo 
 
 
 139 
Neste exemplo rejeitamos, ao nível de significância de 5%, a hipótese 
0: 210 == \u3b2\u3b2H e também rejeitamos, ao mesmo nível de significância, tanto a 
hipótese 0: 10 =\u3b2H como a hipótese 0: 20 =\u3b2H . Quando o teste F da análise de 
variância de uma regressão linear múltipla é significativo (rejeitando-se a hipótese de 
que 021 ==== k\u3b2\u3b2\u3b2 K ), é comum que pelo menos um dos valores de 
 )( i
i
bs
b
t = , i = 1, 2, ..., k 
seja significativo, considerando-se um teste bilateral com o mesmo nível de 
significância. Mas nem sempre isso acontece, podendo ocorrer que, apesar de o teste F 
da análise de variância da regressão ser significativo, nenhum dos testes t para as 
hipóteses 0:0 =iH \u3b2 , (para i = 1, 2, ..., k) seja significativo, como mostra o exemplo 
apresentado na seção 4.12, na qual esse assunto será melhor analisado. 
 
4.9. Previsão e teste de hipóteses a respeito do valor de combinações 
lineares dos parâmetros 
Consideremos o modelo de regressão linear múltipla 
 jkjkjjj uXXXY +++++= \u3b2\u3b2\u3b2\u3b1 K2211 , j = 1, ..., n 
ou 
 uX\u3b2y += 
Na seção 4.4 vimos que, dados os valores khhh XXX ,,, 21 K das variáveis 
explanatórias, a estimativa de 
 =)( hYE \u3b2xhkhkhh XXX \u2032=++++ \u3b2\u3b2\u3b2\u3b1 K2211 
é 
 bxhkhkhhh XbXbXbaY \u2032=++++= K2211\u2c6 
onde 
 [ ]khhhh XXX K211=\u2032x 
Devemos ressaltar que o vetor hx\u2032 pode ou não ser uma das linhas da matriz X. 
De acordo com (4.14), temos 
 
 
 140 
 
21)()\u2c6(\u2c6 sYV hhh xXXx \u2212\u2032\u2032= (4.36) 
Obtida a estimativa da variância de hY\u2c6 , dada por (4.36), podemos construir o 
intervalo de confiança para \u3b2xhhYE \u2032=)( . Sendo 0t o valor crítico de t com n \u2013 p graus 
de liberdade e ao nível de confiança adotado, o intervalo de confiança é 
 
21
0
21
0 )()()( stYEst hhhhhhh xXXxbxxXXxbx \u2212\u2212 \u2032\u2032+\u2032<<\u2032\u2032\u2212\u2032 (4.37) 
Consideremos, mais uma vez, o exemplo numérico da tabela 4.1. Tendo em vista 
o modelo5 
 jjjj uxxY +++= 22110 \u3b2\u3b2\u3b2 
obtivemos, anteriormente, as matrizes 
 
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
\u2212
\u2212=\u2032
\u2212
30
83
3
40
3
4
3
20
00
5
1
)( 1XX 
e 
 
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
\u2212
=
11
4
10
b 
Consideremos 71 =hX e 12 =hX . Uma vez que estamos fazendo os cálculos 
tendo em vista o modelo com as variáveis explanatórias centradas, e lembrando que 
51 =X e 42 =X , obtemos 21 =hx e 32 \u2212=hx e fazemos 
 [ ]321 \u2212=\u2032hx 
Então, 
 
5
 Se considerarmos o modelo em que todas as variáveis, incluindo a dependente, são centradas, 
obteremos, através de (4.14), a variância YYy hh \u2212= \u2c6\u2c6 . Como as covariâncias entre Y e ib (i = 1, 2, ..., k) 
são nulas, a variância de hY\u2c6 é dada por 
 
n
yVYV hh
2
)\u2c6()\u2c6( \u3c3+= 
 
 
 141 
 51\u2c6 =\u2032= bx hhY 
Lembrando que 25,1Q.M.Res.2 ==s , obtemos, de acordo com (4.36), 
 
21)()\u2c6(\u2c6 sYV hhh xXXx \u2212\u2032\u2032= = 
 = [ ] 708,5425,1 
3
2
1
 
30
83
3
40
3
4
3
20
00
5
1
 321 =
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
\u2212
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
\u2212
\u2212\u2212 
Para um nível de confiança de 95%, o valor crítico de t com 2 graus de liberdade 
é 4,303. Então, o intervalo de confiança para 217)( \u3b2\u3b2\u3b1 ++=hYE é 
 708,54303,451)(708,54303,451 +<<\u2212 hYE 
ou 
 83,82)(17,19 << hYE 
Consideremos, agora, que desejamos prever o valor da variável dependente ( hY ) 
para uma nova observação e que as variáveis independentes assumem os valores hX 1 , 
hX 2 , ..., khX . 
O estimador de hhh uY +\u2032= \u3b2x é bx hhY \u2032=\u2c6 . O erro de previsão é 
 hhhh uYY \u2212\u2212\u2032=\u2212 )(\u2c6 \u3b2bx (4.38) 
Dizemos que hY\u2c6 é uma previsão não-tendenciosa do valor de hY porque a 
esperança do erro de previsão é igual a zero. 
Para avaliar a precisão de hY\u2c6 como previsão do valor da nova observação, 
determinamos o intervalo de previsão, como mostraremos a seguir. Para isso devemos 
considerar a variância do erro de previsão, dado por (4.38). Uma vez que, de acordo 
com a pressuposição V, o erro ( hu ) da nova observação é independente dos erros ( ju , j 
= 1, ..., n) das observações da amostra utilizada para obter a estimativa (b) de \u3b2 , de 
(4.38) obtemos
Annanda
Annanda fez um comentário
salvou meu TCC! obrigada!
0 aprovações
Douglas
Douglas fez um comentário
Muito obrigado por compartilhar!
0 aprovações
Carregar mais