Livro Analise de regressão
402 pág.

Livro Analise de regressão


DisciplinaMatemática Financeira60.332 materiais1.567.451 seguidores
Pré-visualização50 páginas
qual dispomos de 9 valores de uma variável jY , observados em 9 meses 
consecutivos. Vamos admitir que há uma tendência para as quatro primeiras 
observações, e que há outra tendência para as 5 últimas observações, com mudança 
tanto no termo constante como no coeficiente angular. Para captar essas mudanças 
definimos uma variável binária jZ cujo valor é zero para as quatro primeiras 
observações e é 1 para as 5 últimas observações. Sendo jX o número de ordem dos 9 
meses, para simplificar um pouco as contas, vamos utilizar a variável centrada 
5\u2212= jj Xx . O modelo fica 
 jjjjjj uxZZxY ++++= \u3b4\u3b3\u3b2\u3b1 (5.19) 
A tabela 5.7 mostra os valores das variáveis que serão utilizadas para estimar a 
equação. 
 
 
 
 
 233 
TABELA 5.7. Valores da variável jY e das variáveis explanatórias 
utilizados para ajustar um par de retas. 
Tempo em 
meses ( jX ) jY jx jZ jj xZ 
1 1,0 \u20134 0 0 
2 4,0 \u20133 0 0 
3 6,0 \u20132 0 0 
4 7,0 \u20131 0 0 
5 9,5 0 1 0 
6 11,0 1 1 1 
7 11,5 2 1 2 
8 13,0 3 1 3 
9 13,5 4 1 4 
 
Tendo em vista o modelo (5.19), obtemos 
 
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
=\u2032
30103010
105105
3010600
10509
XX , 
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
=\u2032
127
5,58
92
5,76
yX 
e 
 
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
\u2212\u2212
\u2212\u2212
\u2212\u2212
\u2212\u2212
=\u2032
\u2212
3,03,02,05,0
3,01,25,05,1
2,05,02,05,0
5,05,15,05,1
)( 1XX 
Então 
 
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
\u2212
=\u2032\u2032=
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
=
\u2212
1
2,0
2
5,9
)( 1 yXXXb
d
c
b
a
 
e 
 jjjjj xZZxY \u2212++= 2,025,9\u2c6 (5.20) 
 
 
 234 
No primeiro período, com =jZ 0, a reta estimada é 
 jj xY 25,9\u2c6 += ou jj XY 25,0\u2c6 +\u2212= 
No segundo período, com =jZ 1, a reta estimada é 
 jj xY += 7,9\u2c6 ou jj XY += 7,4\u2c6 
A figura 5.4 mostra os pontos da amostra e o par de retas ajustado. 
 
 
 
 
 
 
 
 
 
Figura 5.4. Retas ajustadas aos dados da tabela 5.7. 
Para fazer a análise de variância da regressão, apresentada na tabela 5.8, 
devemos calcular 
 S.Q.Res. = 3,145,79575,796 =\u2212=\u2032\u2032\u2212\u2032 yXbyy 
TABELA 5.8. Análise de Variância 
C.V. G.L. S.Q. Q.M. F 
Regressão 3 145,2 48,4 186,15 
Resíduo 5 1,3 0,26 
Total 8 146,5 
 
A tabela 5.9 apresenta, além das estimativas dos quatro parâmetros, as 
estimativas dos respectivos desvios padrões, o teste t e a correspondente probabilidade 
caudal (probabilidade associada a valores absolutos de t maiores do que o calculado). 
 
 
 
 235 
TABELA 5.9.Estimativas dos parâmetros do modelo (5.19) e dos respectivos 
desvios padrões, o teste t e a correspondente probabilidade caudal. 
Parâmetro Estimativa Desvio Padrão Teste t 
Probabilidade 
caudal 
\u3b1 9,5 0,6245 15,21 < 0,01% 
\u3b2 2 0,2280 8,77 0,03% 
\u3b3 0,2 0,7389 0,27 79,75% 
\u3b4 \u20131 0,2793 \u20133,58 1,59% 
 
A estimativa de \u3b3 não é estatisticamente diferente de zero, mas, adotando um 
nível de significância de 5%, rejeitam-se as hipóteses de nulidade de \u3b1, \u3b2 ou \u3b4. 
É importante observar que o mesmo par de retas ajustado com base no modelo 
(5.19) é obtido fazendo-se duas regressões lineares simples. 
Considerando os 4 primeiros pares de valores para as variáveis jY e jX 
obtemos 
 jj XY 25,0\u2c6 +\u2212= (5.21) 
com S.Q.Res. = 1. 
Considerando os 5 últimos pares de valores para as variáveis jY e jX obtemos 
 jj XY += 7,4\u2c6 (5.22) 
com S.Q.Res. = 0,3. 
Note que a soma de quadrados de resíduos dessas duas regressões lineares 
simples é igual à soma de quadrados de resíduos da regressão múltipla ajustada 
anteriormente. 
O ajustamento dessas duas regressões lineares simples exige menos cálculo do 
que o ajustamento de um modelo como (5.19). Entretanto, um modelo como (5.19) tem 
a vantagem de tornar relativamente mais fácil testar, posteriormente, hipótese 
envolvendo os valores dos parâmetros das duas retas. 
Para fazer o teste de mudança estrutural da maneira indicada por Chow, além de 
obter as somas de quadrados de resíduos das equações (5.21) e (5.22), é necessário obter 
a soma de quadrados residual de uma regressão linear simples de jY contra jX para as 
9 observações. A equação estimada é 
 jj XY 533,18333,0\u2c6 += , (5.23) 
 
 
 236 
com S.Q.Res. = 4333,5=RS , associada a 7 graus de liberdade. De acordo com (5.17), 
obtemos 
 95,7
26,0
0667,2
5
3,01
 
2
)3,01(4333,5
 
==
+
+\u2212
=EF 
Ao nível de significância de 5%, com 2 e 5 graus de liberdade, o valor crítico de 
F é 5,79. Portanto, rejeita-se a hipótese de que não houve mudança estrutural a partir do 
5o ano, isto é, rejeita a hipótese 0:0 == \u3b4\u3b3H . Cabe assinalar que o teste dessa 
hipótese também pode ser feito usando (4.60), obtendo-se exatamente o mesmo 
resultado. 
Tendo concluído que há mudança estrutural, o ajustamento do modelo (5.19) 
permite que se especifique melhor a natureza da mudança. Nesse exemplo numérico, 
tendo em vista a tabela 5.9, verifica-se que a mudança ocorre, basicamente, no 
coeficiente angular da relação linear entre jY e jX . 
5.5. Análise de variância de dados com vários tratamentos e o teste para 
\u201cfalta de ajustamento\u201d 
Consideremos um total de n observações de uma variável, submetida a H 
diferentes tratamentos (h = 1, ..., H). Seja hiY o valor da i-ésima observação referente ao 
h-ésimo tratamento. A variável em questão pode ser o preço de um produto em 
diferentes regiões, a renda de indivíduos classificados conforme o nível de escolaridade, 
a produção de milho nas parcelas de um experimento de competição de variedades, etc. 
Seja hn o número de observações relativas ao h-ésimo tratamento, cujo total é 
 hi
i
h YT \u2211= (5.24) 
O total geral é 
 hi
ih
h
h
YTG \u2211\u2211=\u2211= (5.25) 
Para distinguir os H tratamentos vamos utilizar H variáveis binárias hZ (com 
h = 1, ..., H), fazendo hZ = 1 para as observações do h-ésimo tratamento e hZ = 0 para 
as observações dos demais tratamentos. O modelo de regressão é 
 hihHhi uZZZY ++++= \u3b3\u3b3\u3b3 ...2211 (5.26) 
 
 
 237 
As linhas da matriz X desse modelo têm todas um único elemento igual a 1, e os 
demais elementos iguais a zero. Assim, em todas as linhas temos 
 1...21 =+++ HZZZ (5.27) 
Verifica-se que a matriz XX\u2032 é uma matriz diagonal com o número de 
observações de cada tratamento na diagonal e que o vetor-coluna yX\u2032 é formado pelos 
totais dos tratamentos. No caso de H = 3 tratamentos, temos 
 XX\u2032 = 
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
3
2
1
00
00
00
n
n
n
 , yX\u2032 = 
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
3
2
1
T
T
T
 
 
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
=\u2032
\u2212
3
2
1
1
100
010
001
)(
n
n
n
XX e 
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
=\u2032\u2032=
\u2212
3
3
2
2
1
1
1)(
n
T
n
T
n
T
yXXXb 
Segue-se que 
 S.Q.Res. = =\u2211\u2212\u2211\u2211=\u2032\u2032\u2212\u2032
h
h
h
hi
ih n
T
Y
2
2yXbyy 
 \uf8f7\uf8f7
\uf8f8
\uf8f6
\uf8ec\uf8ec
\uf8ed
\uf8eb
\u2212\u2211\u2212\uf8f7\uf8f7
\uf8f8
\uf8f6
\uf8ec\uf8ec
\uf8ed
\uf8eb
\u2212\u2211\u2211=
n
G
n
T
n
GY
h
h
h
hi
ih
222
2
 (5.28) 
Na primeira expressão entre parênteses podemos reconhecer a soma de 
quadrados total: 
 S.Q.Total 
n
GY
n
GY hi
ih
hi
ih
2
2
2
\u2212\u2211\u2211=\uf8f7\uf8f7
\uf8f8
\uf8f6
\uf8ec\uf8ec
\uf8ed
\uf8eb
\u2212\u2211\u2211= (5.29) 
com n \u2013 1 graus de liberdade. 
A última expressão entre parênteses em (5.28) é a soma de quadrados de 
tratamentos: 
 S.Q.Trat. 
n
G
n
T
h
h
h
22
\u2212\u2211= , com n \u2013 H graus de liberdade (5.30) 
 
 
 238 
A soma de quadrados de tratamentos representa a parte da variação dos hiY 
devida às diferenças
Annanda
Annanda fez um comentário
salvou meu TCC! obrigada!
0 aprovações
Douglas
Douglas fez um comentário
Muito obrigado por compartilhar!
0 aprovações
Carregar mais