Livro Analise de regressão
402 pág.

Livro Analise de regressão


DisciplinaMatemática Financeira57.691 materiais1.506.298 seguidores
Pré-visualização50 páginas
devemos introduzir aqui um outro índice (h) para indicar outros valores de X. O novo 
valor, hX , pode coincidir ou não com um dos valores )( iX da amostra. Temos 
hhh bxYbXaY +=+=\u2c6 
e 
2
2
2
2 1)\u2c6()\u2c6(\u2c6 s
x
x
n
YsYV
i
h
hh \uf8f7\uf8f7
\uf8f8
\uf8f6
\uf8ec\uf8ec
\uf8ed
\uf8eb
\u2211
+== 
 
 
 73 
Extraindo a raiz quadrada desse valor obtemos a estimativa dos desvio padrão de 
hY\u2c6 . Sendo 0t o valor crítico de t com n \u2013 2 graus de liberdade e ao nível de confiança 
estabelecido, o intervalo de confiança para hh XYE \u3b2\u3b1 +=)( é 
)\u2c6(\u2c6)()\u2c6(\u2c6 00 hhhhh YstYYEYstY +<<\u2212 
Freqüentemente, temos interesse em estimar o valor de uma nova observação 
)( hY , relativa ao valor de hX da variável independente, isto é, queremos prever o valor 
da variável dependente em uma nova observação com X = hX . O estimador de 
hhh uXY ++= \u3b2\u3b1 é hh bXaY +=\u2c6 . O erro de previsão é 
hhhh uXbaYY \u2212\u2212+\u2212=\u2212 )()(\u2c6 \u3b2\u3b1 
Dizemos que hY\u2c6 é uma previsão não-tendenciosa do valor de hY porque a 
esperança do erro de previsão é igual a zero. Verifica-se, também, que )()\u2c6( hh YEYE = . 
Note, entretanto, que hhh YXYE \u2260+= \u3b2\u3b1)\u2c6( . 
Para avaliar a precisão hY\u2c6 como previsão do valor da nova observação, 
determinamos o intervalo de previsão, como mostraremos a seguir. Note, inicialmente, 
que tanto hY\u2c6 como hY são variáveis aleatórias e que, de acordo com a pressuposição V, 
suas distribuições são independentes. Uma vez que, para determinado valor )( hX da 
variável independente, os valores de Y variam em torno de sua verdadeira média, isto é, 
em torno de )( hYE , com variância 2\u3c3 , a variância que nos interessa é 
 
2
2
2
2 11)\u2c6( \u3c3\u3c3 \uf8f7\uf8f7
\uf8f8
\uf8f6
\uf8ec\uf8ec
\uf8ed
\uf8eb
\u2211
++=+
i
h
h
x
x
n
YV (2.42) 
O intervalo de previsão para a nova observação ( hY ) é 
+<<
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8f0
\uf8ee
\uf8f7\uf8f7
\uf8f8
\uf8f6
\uf8ec\uf8ec
\uf8ed
\uf8eb
\u2211
++\u2212 hh
i
h
h YYs
x
x
n
tY \u2c611\u2c6
2/1
2
2
2
0
2/1
2
2
2
0
11
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8f0
\uf8ee
\uf8f7
\uf8f7
\uf8f8
\uf8f6
\uf8ec
\uf8ec
\uf8ed
\uf8eb
\u2211
++ s
x
x
n
t
i
h
 
O conceito de intervalo de previsão é análogo ao de intervalo de confiança, com 
a diferença de que, enquanto o intervalo de confiança se refere a uma constante (o 
 
 
 74 
parâmetro \u3b2, por exemplo), o intervalo de previsão se refere a uma variável aleatória 
( hY , no caso). 
Consideremos, para exemplificar a aplicação dessas fórmulas, os pares de 
valores da tabela 2.1. Já vimos que para esses dados 5=Y e b = 1. 
Então 
 hh xY += 5\u2c6 (2.43) 
O valor crítico de t, com 8 graus de liberdade, ao nível de confiança de 95%, é 
2,306. 
Lembrando que, no exemplo numérico que estamos desenvolvendo, n = 10, 
362 =\u2211 ix e 1
2
=s , verificamos que os limites do intervalo de confiança para )( hYE , 
ao nível de confiança de 95%, são dados por 
 
3610
1306,2\u2c6
2
h
h
x
Y +± (2.44) 
Os limites do intervalo de previsão para uma nova observação )( hY são dados 
por 
 
3610
11306,2\u2c6
2
h
h
x
Y ++± (2.45) 
Utilizando as expressões (2.43), (2.44) e (2.45) obtivemos os valores de hY\u2c6 e os 
limites dos intervalos de confiança e de previsão que estão na tabela 2.4 e na figura 2.3. 
Note que consideramos alguns valores de X fora do intervalo para o qual dispúnhamos 
de dados, ou seja, estamos fazendo extrapolação. 
 
 
 
 
 
 75 
TABELA 2.4 Valores de hY\u2c6 , limites do intervalo de confiança para )( hYE , ao nível de 
confiança de 95%. 
hX hY\u2c6 
Intervalo de confiança 
para )( hYE 
Intervalo de previsão 
para hY 
 0 2 0,64 3,36 \u20130,68 4,68 
1 3 1,94 4,06 0,46 5,54 
2 4 3,18 4,82 1,55 6,45 
3 5 4,27 5,73 2,58 7,42 
4 6 5,18 6,82 3,55 8,45 
5 7 5,94 8,06 4,46 9,54 
6 8 6,64 9,36 5,32 10,68 
7 9 7,30 10,70 6,13 11,87 
8 10 7,94 12,06 6,91 13,09 
9 11 8,58 13,42 7,66 14,34 
 
A análise da expressão 
 s
x
x
n
tY
i
h
h
2/1
2
2
0
1
\u2c6
\uf8f7\uf8f7
\uf8f8
\uf8f6
\uf8ec\uf8ec
\uf8ed
\uf8eb
\u2211
+± , 
que nos dá os limites do intervalo de confiança para )( hYE , permite afirmar que a 
precisão da estimativa de Y é tanto maior quanto: 
a) menor for s, isto é, quanto menor for a dispersão dos valores observados de Y 
em torno da reta de regressão. 
b) maior for n 
c) maior for 2ix\u2211 , isto é, quanto maior for a dispersão dos valores de X em torno 
da respectiva média. 
Podemos então concluir que: 
a) O número de observações (n) deve ser o maior possível. 
b) Se possível, devemos escolher valores de X que conduzem a um elevado 
valor para 2ix\u2211 . 
Devemos notar, ainda, que o intervalo de confiança aumenta à medida que hX se 
afasta de X . 
 
 
 
 
 
 76 
 
 
Figura 2.3. A reta de regressão estimada, o intervalo de confiança para )( hYE e o 
intervalo de previsão para hY . 
Ao fazer uma extrapolação é necessário considerar, ainda, um outro problema, 
provavelmente mais sério que o crescimento da amplitude do intervalo de confiança (e 
também do intervalo de previsão) à medida que hX se afasta de X . Freqüentemente o 
modelo (linear) ajustado é razoável para o intervalo coberto pela amostra, mas é 
absolutamente inapropriado para uma extrapolação. A figura 2.4 ilustra a questão. As 
observações da amostra pertencem ao intervalo em que a relação entre )(YE e X é 
aproximadamente linear. Entretanto, se utilizarmos a reta estimada para prever valores à 
direita desse intervalo, os resultados estarão totalmente \u201cfora do alvo\u201d. 
 
 
 
 77 
 
Figura 2.4. O perigo da extrapolação 
 
2.13. O problema da especificação e as funções que se tornam lineares 
por anamorfose 
Quando aplicamos análise de regressão ao estudo da relação funcional entre duas 
variáveis, o problema da especificação consiste em determinar a forma matemática da 
função que será ajustada. Podemos escolher, por exemplo: 
I) ii XY \u3b2\u3b1 += 
II) iXiY \u3b1\u3b2= 
III) \u3b2\u3b1 ii XY = 
IV) 
i
i X
Y \u3b2\u3b1 += 
V) 2iii XXY \u3b3\u3b2\u3b1 ++= 
VI) iXiY \u3b2\u3c1\u3b1 += 
Onde \u3b1, \u3b2, \u3b3 e \u3c1são parâmetros a serem estimados. 
A determinação da forma matemática da função pode ser feita de duas formas 
diferentes, muitas vezes complementares: 
a) utilizando o conhecimento que temos a priori sobre o fenômeno. 
 
 
 78 
b) Empregando o conhecimento adquirido pela inspeção dos dados numéricos 
disponíveis. É muito útil fazer um gráfico com os pontos (Xi, Yi) e, 
eventualmente, gráficos com os pontos (ln Xi, Yi), (Xi, lnYi) ou (lnXi, lnYi). 
Freqüentemente, ajustamos mais de um modelo e escolhemos, com base nos 
resultados estatísticos obtidos (coeficientes de determinação, quadrados médios 
residuais etc.), o modelo que melhor se ajusta aos dados. 
Admitindo um erro aditivo o modelo I fica 
 iii uXY ++= \u3b2\u3b1 , 
que é o modelo estatístico estudado até aqui. 
Mostraremos agora que os modelos II, III e IV são exemplos de modelos não-
lineares que se transformam em funções lineares por anamorfose, isto é, por substituição 
dos valores de uma ou mais variáveis por funções destas variáveis. 
No caso do modelo II (função exponencial), admitindo um erro multiplicativo 
i\u3b5 , obtemos o modelo estatístico 
 i
X
i
iY \u3b5\u3b1\u3b2= 
Aplicando logaritmos, obtemos 
 iii XY \u3b5\u3b2\u3b1 loglogloglog ++= 
Fazendo 
 ii ZY =log , 
 A=\u3b1log , 
 B=\u3b2log 
e 
 ii u=\u3b5log 
temos 
 iii uBXAZ ++= 
que é o modelo estatístico de uma regressão linear simples de ii YZ log= em relação a 
iX . Caso o erro iiu \u3b5log= obedeça às pressuposições dadas na seção 2.1, podemos 
aplicar à amostra de pares de valores iX e iZ os métodos de análise de regressão já 
estudados. Obtidas as estimativas dos parâmetros A e B é fácil determinar as 
correspondentes estimativas de \u3b1 e de \u3b2. 
 
 
 79 
No caso do modelo III (função potência), conhecido entre economistas como 
função de Cobb-Douglas, o correspondente modelo estatístico é
Annanda
Annanda fez um comentário
salvou meu TCC! obrigada!
0 aprovações
Douglas
Douglas fez um comentário
Muito obrigado por compartilhar!
0 aprovações
Carregar mais