Livro Analise de regressão
402 pág.

Livro Analise de regressão


DisciplinaMatemática Financeira57.816 materiais1.511.334 seguidores
Pré-visualização50 páginas
em relação à estimativa do parâmetro \u3b1. 
Concluímos, então, que os estimadores dos parâmetros de uma regressão linear simples, 
obtidos pelo método dos mínimos quadrados, são estimadores lineares não-tendenciosos 
de variância mínima. Esse é um caso particular do teorema de Gauss-Markov. Note que 
esse resultado depende de certas pressuposições a respeito do erro do modelo 
(pressuposições III a V). 
 
 
 
 61 
2.7. Decomposição da soma de quadrados total 
Demonstraremos que 
222 )\u2c6()\u2c6()( YYYYYY iiii \u2212\u2211+\u2212\u2211=\u2212\u2211 
ou 
222
\u2c6 iii yey \u2211+\u2211=\u2211 , 
isto é, que a soma de quadrados total (S.Q.Total) é igual à soma de quadrados residual 
(S.Q.Res.), também chamada soma de quadrados dos desvios, mais a soma de 
quadrados da regressão (S.Q.Regr.). 
Partimos da identidade 
YYYYYY iiii \u2212+\u2212=\u2212 \u2c6\u2c6 
ou 
iii yey \u2c6+= 
Elevando ao quadrado e somando, obtemos 
iiiii eyyey \u2c62\u2c6
222 \u2211+\u2211+\u2211=\u2211 
Lembrando (2.10), concluímos que 
 
222
\u2c6 iii yey \u2211+\u2211=\u2211 (2.27) 
Essa relação mostra que a variação dos valores de Y em torno da sua média 
)( 2iy\u2211 pode ser dividida em duas partes: uma )\u2c6( 2iy\u2211 que é \u201cexplicada\u201d pela regressão 
e outra )( 2ie\u2211 devida ao fato de que nem todos os pontos estão sobre a reta de 
regressão, que é a parte não \u201cexplicada\u201d pela regressão. O coeficiente de determinação, 
definido por 
2
2
2 \u2c6
S.Q.Total
S.Q.Regr.
i
i
y
y
r
\u2211
\u2211
== , 
 
 
 62 
indica a proporção da variação de Y que é \u201cexplicada\u201d pela regressão. Note que 
10 2 \u2264\u2264 r . 
Se estamos interessados em estimar valores de Y a partir de valores de X, a 
regressão será tanto mais útil quanto mais próximo de um estiver o valor de 2r . 
Verificamos, facilmente, que 
 ))((
)(\u2c6
22
2
2
2
2
2
2
2
yx
xy
y
xb
y
y
r
i
i
\u2211\u2211
\u2211
=
\u2211
\u2211
=
\u2211
\u2211
= (2.28) 
e que 
2
2
222 )(
\u2c6S.Q.Regr.
x
xy
xybxby
\u2211
\u2211
=\u2211=\u2211=\u2211= 
Vamos, agora, verificar a decomposição da soma de quadrados total e calcular o 
valor do coeficiente de determinação para o exemplo apresentado anteriormente. 
Da tabela 2.1 obtemos 
 44250294)(S.Q.Total
2
22
=\u2212=
\u2211
\u2212\u2211=\u2211=
n
YYy 
 36S.Q.Regr. =\u2211= xyb 
 83644S.Q.Regr.S.Q.TotalS.Q.Res. =\u2212=\u2212= 
Esta é a maneira usual de obter os valores das várias somas de quadrados. Para 
que o aluno compreenda melhor o que está sendo feito, vamos calcular a S.Q.Regr. e a 
S.Q.Res. diretamente da sua definição; para isso precisamos obter, inicialmente, os 
valores de iY\u2c6 e iii YYe \u2c6\u2212= , apresentados na tabela 2.2. 
As relações (2.5), (2.6), (2.7) e (2.10), deduzidas anteriormente, que são 
0=\u2211 ie , 0=\u2211 iieX , 0\u2c6 =\u2211 iieY e 0\u2c6 =\u2211 iiey , são facilmente verificadas neste 
exemplo. 
Como a soma dos desvios é nula, a média aritmética de iY\u2c6 é 5=Y . Obtidos os 
valores YYy ii \u2212= \u2c6\u2c6 , calculamos 
36\u2c6S.Q.Regr. 2 =\u2211= iy , 
que é o mesmo valor obtido anteriormente, pela expressão 
xyb\u2211=S.Q.Regr. 
 
 
 63 
TABELA 2.2. Valores de iiiii eyYYX e \u2c6,\u2c6,, 
iX iY XYi += 2\u2c6 iy\u2c6 iii YYe \u2c6\u2212= 
0 3 2 \u20133 +1 
1 2 3 \u20132 \u20131 
1 3 3 \u20132 0 
2 5 4 \u20131 +1 
3 4 5 0 \u20131 
3 4 5 0 \u20131 
4 7 6 +1 +1 
5 6 7 +2 \u20131 
5 7 7 +2 0 
6 9 8 +3 +1 
 
O valor da soma de quadrados residual, obtido anteriormente por diferença, pode 
agora ser obtido diretamente: 
8S.Q.Res. 2 =\u2211= ie 
O leitor pode verificar que aplicando qualquer uma das fórmulas de (2.28) o 
valor do coeficiente de determinação obtido é 
818,0
11
92
==r ou 81,8% 
 
2.8. Esperanças das somas de quadrados 
Vejamos, inicialmente, a esperança da soma de quadrados de regressão. 
Temos 
iii uXY ++= \u3b2\u3b1 
e 
uXY ++= \u3b2\u3b1 
Subtraindo esta equação da anterior, obtemos 
 uuxy iii \u2212+= \u3b2 (2.29) 
 
 
 64 
Sabemos que 
2
2)(S.Q.Regr.
i
ii
ii
x
yx
yxb
\u2211
\u2211
=\u2211= 
Aplicando esperança temos 
 2
2)()(S.Q.Regr.
i
ii
x
yxE
E
\u2211
\u2211
= (2.30) 
De (2.29) podemos obter 
iiiiiiiii uxxxuuxxyx \u2211+\u2211=\u2211\u2212\u2211+\u2211=\u2211
22 \u3b2\u3b2 
Então 
iiiiiiii uxxuxxyx \u2211\u2211+\u2211+\u2211=\u2211
222222 2)()()( \u3b2\u3b2 
Aplicando esperança, vem 
 
222222 )()( iiii xxyxE \u2211+\u2211=\u2211 \u3c3\u3b2 (2.31) 
Substituindo esse resultado em (2.30), obtemos 
 
222)(S.Q.Regr. \u3c3\u3b2 +\u2211= ixE (2.32) 
Determinemos, a seguir, a esperança da soma de quadrados total. 
Já vimos que 
2S.Q.Total iy\u2211= 
Considerando (2.29), segue-se que 
 =\u2212+\u2211= 2)(S.Q.Total uux ii\u3b2 
 =\u2212+\u2212+\u2211= )](2)([ 222 uuxuux iiii \u3b2\u3b2 
 iiiii xuuxuux \u2211\u2212\u2211+\u2212\u2211+\u2211= \u3b2\u3b2\u3b2 22)( 222 = 
 iiii uxuux \u2211+\u2212\u2211+\u2211= \u3b2\u3b2 2)( 222 
Donde 
 ])([)(S.Q.Total 222 uuExE ii \u2212\u2211+\u2211= \u3b2 (2.33) 
Mas 
 =\u2212+\u2211=\u2212\u2211 )2()( 222 uuuuuu iii 
 
 
 65 
 =
\u2211
\u2212\uf8f7
\uf8f8
\uf8f6
\uf8ec
\uf8ed
\uf8eb \u2211
+\u2211=
n
u
n
u
nu iii
22
2 )(2 
 
n
u
u ii
2
2 )(\u2211
\u2212\u2211= 
Então 
2
2
22 )1(])([ \u3c3\u3c3\u3c3 \u2212=\u2212=\u2212\u2211 n
n
n
nuuE i 
Substituindo esse resultado em (2.33) obtemos 
 
222 )1()(S.Q.Total \u3c3\u3b2 \u2212+\u2211= nxE i (2.34) 
Resta determinar a esperança da soma de quadrados residual. 
Como 
S.Q.Res. = S.Q.Total \u2013 S.Q.Regr., 
temos 
E(S.Q.Res.) = E(S.Q.Total) \u2013 E(S.Q.Regr.) 
De acordo com (2.32) e (2.34) segue-se que 
 E(S.Q.Res.) = 2)2( \u3c3\u2212n (2.35) 
 
2.9. Análise de variância da regressão 
Os valores das esperanças das somas de quadrados, deduzidas no item anterior, 
justificam que se associe às somas de quadrados total, de regressão e residual n \u2013 1, 1 e 
2\u2212n graus de liberdade, respectivamente. 
Por definição, os quadrados médios são obtidos dividindo as somas de 
quadrados pelos respectivos graus de liberdade. 
Então, para o caso de uma regressão linear simples, temos 
SQ.Regr.Q.M.Regr. = 
e 
2
SQ.Res.Q.M.Res.
\u2212
=
n
 
Lembrando (2.32) e (2.35), obtemos 
 
 
 66 
222Q.M.Regr.)( \u3c3\u3b2 +\u2211= ixE 
e 
2Q.M.Res.)( \u3c3=E 
De posse destes resultados, podemos conduzir a análise de variância da 
regressão linear simples, conforme o esquema seguinte: 
Análise da Variância 
Causas de 
Variação 
Graus de 
Liberdade 
Somas de 
Quadrados 
Quadrados Médios 
Regressão 1 ii yxb\u2211 ii yxb\u2211 
Resíduo n \u2013 2 
iii yxby \u2211\u2212\u2211
2
 )2/()( 2 \u2212\u2211\u2212\u2211 nyxby iii 
Total n \u2013 1 2
iy\u2211 
 
Considerando as diferentes amostras aleatórias de tamanho n que poderiam ser 
obtidas a partir da população de pares de valores (X, Y), e sendo verdadeiras as 6 
pressuposições dada na seção 2.1, concluímos que: 
a) o Q.M.Res. é uma estimativa não-tendenciosa da variância do erro )( 2\u3c3 
b) o Q.M.Regr. é, em média, igual a essa mesma variância residual )( 2\u3c3 somada 
ao produto de 2ix\u2211 pelo quadrado do parâmetro \u3b2. É claro que se \u3b2 = 0, o 
Q.M.Regr. é, em média, igual a 2\u3c3 
Não faremos aqui, mas pode-se demonstrar que, se os erros têm distribuição 
normal e se \u3b2 = 0, o cociente 
Q.M.Res.
Q.M.Regr.
=F 
tem distribuição de F com 1 e n \u2013 2 graus de liberdade. 
Então, para testar a hipótese 
0:0 =\u3b2H , 
 
 
 67 
ao nível de significância adotado, podemos utilizar a estatística F. Nesse caso, o 
procedimento consiste em rejeitar 0H para todo F maior ou igual ao F crítico, com 1 e 
n \u2013 2 graus de liberdade, relativo ao nível de significância adotado. 
Note que, se essa hipótese é verdadeira, tanto o Q.M.Regr. como o Q.M.Res. 
são, em média, iguais a 2\u3c3 e o valor de F tende a 1. Para 0\u2260\u3b2 teremos 
Q.M.Res.)(Q.M.Regr.)( EE > , e o valor de F tende a ser superior a 1. 
Para ilustrar a aplicação desses conceitos, voltemos a considerar o exemplo 
numérico da tabela 2.1. Para este exemplo, obtemos a seguinte tabela de análise da 
variância: 
Análise da Variância 
C.V. G.L. S.Q. Q.M. F 
Regressão 1 36 36 36 
Resíduo 8 8 1 
Total 9 44 
 
Ao nível de significância de 5% e para 1 e 8 graus de liberdade, o valor crítico 
de F é 5,32 (ver tabela de valores críticos de F). O valor de F calculado, sendo superior 
ao valor crítico, é
Annanda
Annanda fez um comentário
salvou meu TCC! obrigada!
0 aprovações
Douglas
Douglas fez um comentário
Muito obrigado por compartilhar!
0 aprovações
Carregar mais