Livro Analise de regressão
402 pág.

Livro Analise de regressão


DisciplinaMatemática Financeira57.899 materiais1.513.552 seguidores
Pré-visualização50 páginas
válidos. Entretanto, tendo em vista a simplicidade das demonstrações de vários 
teoremas, essa pressuposição será adotada durante a maioria das seções do capítulo. 
Devemos observar que, se os pares de valores iX , iY (com i = 1, 2, ..., n) foram obtidos 
experimentalmente e X é uma variável controlada (fixada) pelo pesquisador, a 
pressuposição II é válida. 
A pressuposição III exclui, por exemplo, a existência de erros sistemáticos de 
medida da variável Y. 
 
 
 46 
Quando não é razoável supor que os erros são homocedásticos (pressuposição 
IV), isto é, quando existe heterocedasticia, devemos utilizar o método dos mínimos 
quadrados ponderados, que será examinado no capítulo 6. 
Na figura 2.1 está representado o modelo estatístico de uma regressão linear 
simples, considerando as pressuposições de I a IV. As pressuposições I, II e III 
permitem escrever 
ii XYE \u3b2\u3b1 +=)( , 
ou seja, as médias das distribuições de XY | estão sobre a reta X\u3b2\u3b1 + . À 
pressuposição IV corresponde, na figura 2.1, o fato de as distribuições de Y para 
diferentes valores de X apresentarem todas a mesma dispersão. 
Figura 2.1. Representação do modelo estatístico de uma regressão linear simples. 
 
Se os pares de valores iX , iY foram obtidos através de amostragem aleatória de 
uma população infinita, fica garantida a independência entre observações. Se, além 
disso, a esperança do erro é igual a zero, temos, com i \u2260 j, 
0)()()( =\u22c5= jiji uEuEuuE 
Entretanto, a pressuposição V geralmente não é obedecida quando trabalhamos 
com séries cronológicas de dados. Dizemos, então, que há autocorrelação nos resíduos. 
Temos autocorrelação positiva se 0)( 1 >+iiuuE e autocorrelação negativa se 
0)( 1 <+iiuuE . No capítulo 7 veremos os métodos que podem ser utilizados quando há 
autocorrelação nos resíduos. 
 
 
 47 
A pressuposição VI é necessária para que possamos utilizar as distribuições de t 
e de F para testar hipóteses a respeito dos valores dos parâmetros ou construir intervalos 
de confiança. Em alguns casos, é possível justificar essa pressuposição com base no 
teorema do limite central. Esse teorema, na sua versão mais geral, estabelece que a 
soma de um grande número de variáveis aleatórias independentes tem distribuição 
aproximadamente normal, desde que nenhuma delas seja dominante. Vimos que o erro 
)( iu do modelo estatístico de uma regressão linear pode ser devido à influência de 
todas as variáveis que afetam a variável dependente e que não foram incluídas no 
modelo. Uma vez que as variáveis que não foram consideradas devem ser as menos 
importantes, seus efeitos devem ser todos relativamente pequenos. Considerando que o 
número de fatores que podem afetar certa variável dependente é bastante grande, e 
desde que seus efeitos sejam aditivos e independentes, podemos concluir, com base no 
teorema do limite central, que o erro residual tem distribuição aproximadamente 
normal. 
 
2.2. Estimativa dos parâmetros 
O primeiro passo, na análise de regressão, é obter as estimativas a e b dos 
parâmetros \u3b1 e \u3b2 da regressão. Os valores dessas estimativas serão obtidos a partir de 
uma amostra de n pares de valores iX , iY (com i = 1, 2, ..., n), que correspondem a n 
pontos num gráfico. 
Obtemos, então 
ii bXaY +=\u2c6 
onde iY\u2c6 , a e b são, respectivamente estimativas de ii XYE \u3b2\u3b1 +=)( , \u3b1 e \u3b2. 
Para cada par de valores iX , iY podemos estabelecer o desvio 
)(\u2c6 iiiii bXaYYYe +\u2212=\u2212= 
O método dos mínimos quadrados consiste em adotar como estimativas dos 
parâmetros os valores que minimizam a soma dos quadrados dos desvios 
\u2211\u2211
==
+\u2212==
n
i
ii
n
i
i bXaYeZ
1
2
1
2 )]([ 
 
 
 48 
A função Z terá mínimo quando suas derivadas parciais em relação a a e b forem 
nulas: 
0)]([2 =+\u2212\u2211\u2212=
\u2202
\u2202
ii bXaY
a
Z
 (2.1) 
0)( )]([2 =\u2212+\u2212\u2211=
\u2202
\u2202
iii XbXaYb
Z
 (2.2) 
Por se tratar de uma soma de quadrados de desvios, o ponto extremo será 
necessariamente um ponto de mínimo da função. Formalmente, pode-se verificar que as 
condições de segunda ordem para mínimo são satisfeitas. 
Simplificando as equações (2.1) e (2.2), chegamos ao sistema de equações 
normais 
\uf8f3
\uf8f2
\uf8f1
\u2211=\u2211+\u2211
\u2211=\u2211+
iiii
ii
YXXbXa
YXbna
2 
Resolvendo o sistema, obtemos: 
22
2
)()(
))(())((
XXn
XYXYX
a
\u2211\u2212\u2211
\u2211\u2211\u2212\u2211\u2211
= 
22 )(
))((
XXn
YXXYnb
\u2211\u2212\u2211
\u2211\u2211\u2212\u2211
= 
Note que, por simplicidade, omitimos o índice. Para sermos explícitos 
deveríamos escrever, por exemplo, \u2211
=
n
i
iX
1
, onde escrevemos, simplesmente, X\u2211 . 
Na prática determinamos b em primeiro lugar e da equação (2.3) obtemos 
n
Xb
n
Y
a
\u2211
\u2212
\u2211
= 
ou 
XbYa \u2212= 
(2.3) 
(2.4) 
 
 
 49 
É fácil verificar que a fórmula para o cálculo de b pode ser escrita de diversos 
modos, quais sejam: 
 =
\u2211
\u2212\u2211
\u2211\u2211
\u2212\u2211
=
\u2211\u2212\u2211
\u2211\u2211\u2212\u2211
=
n
XX
n
YXXY
XXn
YXXYnb 2
2
22 )(
))((
)(
))((
 
 =
\u2212\u2211
\u2212\u2211
=
\u2212\u2211
\u2212\u2212\u2211
= 22 )(
)(
)(
))((
XX
YXX
XX
YYXX
 
 2222)(
)(
x
Xy
x
xY
x
xy
XX
YYX
\u2211
\u2211
=
\u2211
\u2211
=
\u2211
\u2211
=
\u2212\u2211
\u2212\u2211
= 
onde 
 
n
XX \u2211= , 
n
YY \u2211= , XXx \u2212= e YYy \u2212= 
Assinalemos duas relações bastante úteis que podem ser obtidas a partir das 
equações (2.1) e (2.2). Lembrando que 
iiiii eYYbXaY =\u2212=+\u2212 \u2c6)( , tais equações ficam: 
 0=\u2211 ie (2.5) 
e 
 0=\u2211 ii eX (2.6) 
Temos, também, que 
iiiiiii eXbeaebXaeY \u2211+\u2211=+\u2211=\u2211 )(\u2c6 
De acordo com (2.5) e (2.6), concluímos que 
 0\u2c6 =\u2211 ii eY (2.7) 
As relações (2.5), (2.6) e (2.7) mostram, respectivamente, que 
 
 
 50 
a) a soma dos desvios é igual a zero, 
b) a soma dos produtos dos desvios pelos correspondentes valores da variável 
independente é igual a zero, e 
c) a soma dos produtos dos desvios pelos respectivos valores estimados da 
variável dependente é igual a zero. 
Estas relações podem ser utilizadas para verificar se as estimativas dos 
parâmetros foram corretamente calculadas e para verificar o efeito dos erros de 
arredondamento. 
Como iii eYY += \u2c6 , de (2.5) concluímos que 
 Y
n
Y
n
Y ii
=
\u2211
=
\u2211 \u2c6
, (2.8) 
isto é, a média dos valores observados de Y é igual à média dos valores estimados de Y. 
 
2.3. O modelo simplificado e um exemplo numérico 
Uma simplificação conveniente dos cálculos é obtida quando usamos a variável 
centrada XXx ii \u2212= . Na representação gráfica, isso corresponde a tomar a média da 
variável iX como origem do eixo das abcissas. Nesse caso, o modelo estatístico fica 
iii uxAY ++= \u3b2 
Representando por A\u2c6 a estimativa de mínimos quadrados do parâmetro A, temos 
iii ebxAY ++= \u2c6 
Como 0=\u2211 ix , as equações normais ficam 
\uf8f3
\uf8f2
\uf8f1
\u2211=\u2211
\u2211=
iii
i
Yxxb
YAn
2
\u2c6
 
Donde 
Y
n
YA =\u2211=\u2c6 
 
 
 51 
e 
2x
xYb
\u2211
\u2211
= 
Então a reta de regressão estimada é 
ii bxYY +=\u2c6 
ou 
 ii bxy =\u2c6 (2.9) 
onde 
YYy ii \u2212= \u2c6\u2c6 
Temos 
iiiiiii eYeYeYYey \u2211\u2212\u2211=\u2212\u2211=\u2211 \u2c6)\u2c6(\u2c6 
Lembrando (2.5) e (2.7) concluímos que 
 0\u2c6 =\u2211 ii ey (2.10) 
Para exemplificar, consideremos a amostra de 10 pares de valores iX , iY da 
tabela 2.1, representados graficamente na figura 2.2. 
TABELA 2.1. Valores de iX e iY (i = 1, ..., 10) 
X Y X Y 
0 3 3 4 
1 2 4 7 
1 3 5 6 
2 5 5 7 
3 4 6 9 
 
Os números apresentados são artificiais e foram escolhidos de maneira a 
simplificar os cálculos. O estudante de economia pode imaginar, por exemplo, que Y é o 
custo total de produção correspondente à quantidade produzida X, para empresas de 
certa indústria; esse estudante poderá verificar que, neste caso, \u3b1 representa o custo 
fixo (custo existente mesmo quando X = 0) e \u3b2 representa o custo marginal. Também é 
possível imaginar que Y é a quantidade
Annanda
Annanda fez um comentário
salvou meu TCC! obrigada!
0 aprovações
Douglas
Douglas fez um comentário
Muito obrigado por compartilhar!
0 aprovações
Carregar mais