Livro Analise de regressão
402 pág.

Livro Analise de regressão


DisciplinaMatemática Financeira57.956 materiais1.515.113 seguidores
Pré-visualização50 páginas
significativo ao nível de 5%. Conseqüentemente, rejeitamos a 
hipótese 0:0 =\u3b2H em favor da hipótese alternativa 0: \u2260\u3b2AH , a esse nível de 
significância. 
Um bom programa de análise de regressão para computador, além de calcular o 
valor de F, apresenta, ao lado, a probabilidade de, na distribuição teórica, ocorrer um 
valor de F maior do que o calculado. Trata-se da probabilidade associada à cauda da 
distribuição, acima do valor calculado. Parece apropriado denominá-la probabilidade 
caudal do teste.4 Conhecendo essa probabilidade caudal, para saber se o resultado do 
teste é ou não significativo, basta compará-lo com o nível de significância adotado. O 
resultado é significativo sempre que a probabilidade caudal for igual ou menor do que o 
nível de significância. Torna-se desnecessário, então, obter o valor crítico da tabela 
apropriada. Para o exemplo numérico apresentado, o computador informa que a 
probabilidade caudal associada ao valor 36, na distribuição de F com 1 e 8 graus de 
 
4
 Nos textos em inglês essa probabilidade é denominada \u201cp-value\u201d, o que tem sido traduzido por \u201cvalor-
p\u201d. 
 
 
 68 
liberdade, é 0,0003. O valor calculado é, portanto, significativo ao nível de 5% (é 
significativo mesmo que tivesse sido adotado um nível de significância de 0,1%). 
 
2.10. O coeficiente de determinação corrigido para graus de liberdade e o 
coeficiente de variação 
Na seção 2.7 vimos que o coeficiente de determinação é uma medida descritiva 
da qualidade do ajustamento obtido. Entretanto, o valor do coeficiente de determinação 
depende do número de observações da amostra, tendendo a crescer quando n diminui; 
no limite, para n \u2013 2, teríamos sempre 12 =r , pois dois pontos determinam uma reta e 
os desvios são, portanto, nulos. Veremos a seguir como, numa tentativa de superar esse 
inconveniente, é definido o coeficiente de determinação corrigido para graus de 
liberdade, indicado por 2r . Sabemos que 
S.Q.Total
S.Q.Res.
S.Q.Total
S.Q.Regr.11 2 =\u2212=\u2212 r 
Considerando o número de graus de liberdade associado à S.Q.Res. e à 
S.Q.Total, o coeficiente de determinação corrigido é definido por 
 )1(
2
1
S.Q.Total)(
1
1
S.Q.Res.)(
2
1
1 22 r
n
n
n
nr \u2212
\u2212
\u2212
=
\u2212
\u2212
=\u2212 (2.36) 
ou 
 )1(
2
1 222
r
n
rr \u2212
\u2212
\u2212= (2.37) 
Excluindo o caso em que 12 =r , temos 22 rr < . Note que 2r pode ser negativo. 
Um outro indicador da qualidade do ajustamento obtido é o coeficiente de 
variação, definido por 
 
Y
sCV = , (2.38) 
onde .Re.. sMQs = . O coeficiente de variação mede a dispersão relativa das 
observações, porque, por definição, é o cociente entre a medida da dispersão dos pontos 
 
 
 69 
em torno da reta (s) e o valor médio da variável dependente )(Y . O resultado é tanto 
melhor quanto menor for o coeficiente de variação. 
Veja o exercício 2.23 para uma análise comparativa dos valores do coeficiente 
de determinação e do coeficiente de variação, em vários casos. 
 
2.11. Estimativas das variâncias das estimativas dos parâmetros, teste de 
hipóteses a respeito dos parâmetros e respectivos intervalos de 
confiança 
Na seção 2.5 deduzimos que 
2
2
)(
ix
bV
\u2211
=
\u3c3
 
e que 
2
2
21)( \u3c3\uf8f7\uf8f7
\uf8f8
\uf8f6
\uf8ec\uf8ec
\uf8ed
\uf8eb
\u2211
+=
ix
X
n
aV 
As respectivas estimativas são obtidas substituindo 2\u3c3 por Q.M.Res.2 =s , ou 
seja, 
 2
2
2 )()(\u2c6
ix
sbsbV
\u2211
== (2.39) 
e 
 
2
2
2
2 1)()(\u2c6 s
x
X
n
asaV
i
\uf8f7\uf8f7
\uf8f8
\uf8f6
\uf8ec\uf8ec
\uf8ed
\uf8eb
\u2211
+== (2.40) 
As estimativas dos desvios padrões s(a) e s(b) são obtidas extraindo a raiz 
quadrada das respectivas estimativas de variância. 
Demonstra-se que, sendo válidas as seis pressuposições apresentadas na seção 
2.1, inclusive a que estabelece a normalidade da distribuição dos erros, então os 
cocientes 
)()( bs
bbt \u3b2\u2212= e )()( as
a
at
\u3b1\u2212
= 
 
 
 70 
têm distribuição de t com n \u2013 2 graus de liberdade. 
Vamos indicar algumas das etapas da demonstração no caso de t(b). De (2.11), 
obtemos 
i
i
i u
x
xb \uf8f7\uf8f7
\uf8f8
\uf8f6
\uf8ec\uf8ec
\uf8ed
\uf8eb
\u2211
\u2211=\u2212 2\u3b2 , 
mostrando que \u3b2\u2212b é uma combinação linear dos iu . Se os erros têm distribuição 
normal com média zero, segue-se que b \u2013 \u3b2 também tem distribuição normal com média 
zero. Indicando o desvio padrão de b por )(bVb =\u3c3 , conclui-se que 
b
bZ
\u3c3
\u3b2\u2212
= , 
tem distribuição normal reduzida. 
O número de graus de liberdade associados a t(b) deve ser relacionado com o 
fato de s(b) ser obtido a partir do quadrado médio residual, que, conforme 
demonstramos, tem n \u2013 2 graus de liberdade. 
Os valores t(b) e t(a) podem ser utilizados para testar hipóteses sobre os valores 
dos parâmetros, como ilustraremos a seguir com base no exemplo numérico que 
estamos desenvolvendo. 
Calculemos, inicialmente, as estimativas das variâncias de b e de a. 
 
36
1)(\u2c6 2
2
=
\u2211
=
ix
sbV 
 35,0
36
9
10
11)(\u2c6 22
2
=+=\uf8f7\uf8f7
\uf8f8
\uf8f6
\uf8ec\uf8ec
\uf8ed
\uf8eb
\u2211
+= s
x
X
n
aV
i
 
As estimativas dos desvios padrões são 
6
1)( =bs 
e 
35,0)( =as 
Para testar a hipótese 0:0 =\u3b2H , contra a hipótese alternativa 0: \u2260\u3b2AH , ao 
nível de significância de 5%, calculamos 
 
 
 71 
6
6/1
01)( =\u2212=bt 
Para um teste bilateral, o valor crítico de t com 8 graus de liberdade, ao nível de 
significância de 5%, é 2,306 (ver tabela de valores críticos de t). Portanto, o valor 
calculado t(b) é significativo ao nível de 5%, ou seja, rejeitamos 0H em favor de AH , a 
esse nível de significância. 
Note que esse teste é perfeitamente equivalente ao teste F feito na análise de 
variância, uma vez que o valor de F calculado é igual ao quadrado do valor de t 
calculado e que o valor crítico de F é igual ao quadrado do valor crítico de t. 
No caso dos testes t, os programas de computador usualmente fornecem a 
probabilidade de o valor teórico de t ser, em valor absoluto, maior do que o valor 
calculado. Trata-se, portanto, de uma probabilidade caudal apropriada para testes 
bilaterais. Se o teste de hipóteses for unilateral, é necessário dividir por 2 a 
probabilidade caudal fornecida pelo computador. 
Consideremos, agora, que se deseja testar a hipótese 3:0 =\u3b1H contra a 
hipótese alternativa 3: <\u3b1AH , ao nível de significância de 5%. Para isso calculamos 
690,1
35,0
32)( \u2212=\u2212=at 
A região de rejeição para este teste é t < \u20131,860. Como o valor calculado não 
pertence a esse intervalo, ele não é significativo, ou seja, não rejeitamos, ao nível de 
significância de 5%, a hipótese 3:0 =\u3b1H . 
Também podem ser obtidos intervalos de confiança para os parâmetros. Sendo 
0t o valor crítico de t com n \u2013 2 graus de liberdade e ao nível de confiança estabelecido, 
os intervalos de confiança para \u3b2 e para \u3b1 são, respectivamente, 
)()( 00 bstbbstb +<<\u2212 \u3b2 
e 
)()( 00 astaasta +<<\u2212 \u3b1 
Vamos determinar, no exemplo numérico que estamos desenvolvendo, o 
intervalo de confiança para \u3b2 ao nível de confiança de 90%. O valor crítico de t para 8 
graus de liberdade é 1,860. Então o intervalo de 90% de confiança é 
 
 
 72 
6
1860,11
6
1860,11 +<<\u2212 \u3b2 
0,69 < \u3b2 < 1,31 
 
2.12. Variância de iY\u2c6 e intervalo de previsão 
Vimos na seção 2.3 que 
ii bxYY +=\u2c6 
Então 
),cov(2)()()\u2c6( 2 bYxbVxYVYV iii ++= 
Considerando (2.15), (2.19) e (2.20), segue-se que 
 
2
2
2
2
222 1)\u2c6( \u3c3\u3c3\u3c3 \uf8f7\uf8f7
\uf8f8
\uf8f6
\uf8ec\uf8ec
\uf8ed
\uf8eb
\u2211
+=
\u2211
+=
i
i
i
i
i
x
x
nx
x
n
YV (2.41) 
Donde 
 
2
2
2
2 1)\u2c6()\u2c6(\u2c6 s
x
x
n
YsYV
i
i
ii \uf8f7\uf8f7
\uf8f8
\uf8f6
\uf8ec\uf8ec
\uf8ed
\uf8eb
\u2211
+== 
Podemos estimar o valor de Y correspondente a um valor de X que não exista na 
amostra. Se reservarmos o índice i para indicar os elementos pertencentes à amostra,
Annanda
Annanda fez um comentário
salvou meu TCC! obrigada!
0 aprovações
Douglas
Douglas fez um comentário
Muito obrigado por compartilhar!
0 aprovações
Carregar mais