Baixe o app para aproveitar ainda mais
Prévia do material em texto
Aulas 13 e 14 - Avaliação dos Resultados da Análise de Regressão Para avaliar a adequação do modelo de regressão ajustado, precisamos saber se sua ‘qualidade’ de ajuste é boa o suficiente. Várias técnicas são recomendadas. Primeiro, precisamos observar se os sinais dos coeficientes βi estão de acordo com a teoria econômica. Segundo, devemos observar até que ponto as variações no Xi explicam as variações de Yi. O coeficiente de determinação (R²) nos dá essa estimativa. Terceiro, o teste F deverá mostrar que as variáveis explicativas, em conjunto, têm influência/efeito significativo sobre a variável dependente. O teste F é conclusivo para isso. Quarto, o teste t das variáveis explicativas irá avaliar se individualmente, cada variável explicativa têm influência/efeito significativo sobre a variável dependente. O teste t é conclusivo para essa análise. Quinto, precisamos verificar se a premissa de normalidade do termo de erro é observada na regressão. Caso não exista essa normalidade, os procedimentos dos testes F e t não serão válidos e a análise estará comprometida. Testes de Normalidade Existem vários testes de normalidade. Vamos abordar apenas dois. Histograma dos resíduos: trata-se de um simples dispositivo gráfico que é usado para conhecer algo da forma da função de densidade de probabilidade de uma variável aleatória. O software E-Views pode prover esse gráfico. Sobrepondo mentalmente a curva em forma de sino da distribuição normal ao histograma, teremos ideia se a aproximação normal é adequada. É uma boa prática acostumar-se a observar o histograma dos resíduos como um método rudimentar mas rápido de testar a premissa da normalidade. Teste da normalidade Jarque-Bera (JB): é um teste assintótico, ou seja, de grandes amostras. Ele calcula a assimetria e a curtose dos resíduos de MQO e emprega uma estatística JB dada por: Sendo S o coeficiente de assimetria e K o coeficiente de curtose. Para uma curva normal, S = 0 e K = 3. Portanto, o teste JB de normalidade é um teste da hipótese de que o valor de JB seja igual a 0. Sob a hipótese nula de que os resíduos são normalmente distribuídos, Jarque e Bera demonstraram que, assintoticamente, a estatística JB segue a distribuição qui-quadrado com dois graus de liberdade. Se o valor p calculado para a estatística JB for suficientemente pequeno, o que acontece se o valor da estatística JB for muito diferente de zero, podemos rejeitar a hipótese de que a distribuição dos resíduos é normal. Mas, se o valor de p for razoavelmente alto, o que acontece quando JB está próximo de zero, não rejeitamos a premissa de normalidade. Dessa forma, temos duas maneiras de testar a normalidade. Usando a estatística JB, podemos fazer um teste de hipóteses com auxílio da estatística qui-quadrado, adotando um nível de significância adequado. Alternativamente, podemos apenas nos basear no valor p associado à estatística JB. Uma regra prática é aceitar a normalidade quando p for maior que 0,5 (ou 50%) e JB menor que 1, rejeitando-a em caso contrário. Exemplo: testar a normalidade dos resíduos no modelo consumo x renda, com os dados da tabela abaixo: Despesas familiares de consumo semanal Y e renda familiar semanal X Cons Renda 70 80 65 100 90 120 95 140 110 160 115 180 120 200 140 220 155 240 150 260 Fonte: GURAJARI (2006), p. 71 Solução: CONS = 24.45454545 + 0.5090909091*R DependentVariable: CONS Method: LeastSquares Date: 04/02/13Time: 14:39 Sample: 1 10 Includedobservations: 10 Variable Coefficient Std. Error t-Statistic Prob. C 24.45455 6.413817 3.812791 0.0051 RENDA 0.509091 0.035743 14.24317 0.0000 R-squared 0.962062 Meandependent var 111.0000 Adjusted R-squared 0.957319 S.D. dependent var 31.42893 S.E. ofregression 6.493003 Akaikeinfocriterion 6.756184 Sum squaredresid 337.2727 Schwarz criterion 6.816701 Log likelihood -31.78092 F-statistic 202.8679 Durbin-Watson stat 2.680127 Prob(F-statistic) 0.000001 Salvar como EQ01 Abrir EQ01 View Residual Diagnostics Historigram – Normality Test O sinal da variável explicativa (renda) é positivo, o que está de acordo com a teoria econômica, pois é esperado que quanto maior a renda, maior será o consumo. O coeficiente de determinação (R²) mostra que 96% da variação do consumo é explicada pela variação da renda, o que mostra um alto grau de ajuste dos dados. O perfil do histograma não se assemelha muito ao de uma distribuição normal, embora as menores frequências estejam nas extremidades. Com um valor de probabilidade acima de 50% podemos aceitar a hipótese nula de que os resíduos se distribuem normalmente. Dessa forma, podemos aceitar os resultados dos testes F e t. Devemos fazer a ressalva de que o teste JB é indicado para grandes amostras. Como estamos trabalhando com uma amostra pequena (n = 10), não devemos esperar resultados conclusivos ou promissores no teste JB. Teste F: H0: 1 = 0 H1: 1 0 Adotando um nível de significância de 5%, temos: GL: num = k = 1 den = n – k – 1 = 8 Fcrit = 5,32 FCALC> FCRIT rejeita-se H0 a variável renda tem efeito significativo sobre a variável consumo Teste t: H0: 1 = 0 H1: 1> 0 unilateral Adotando um nível de significância de 5%, temos: GL= n – k – 1 = 8 tcrit = 1,860 tCALC>tCRIT rejeita-se H0 a variável renda tem efeito positivo significativo sobre a variável consumo Comentário geral: apesar da amostra ser pequena (n = 10), os resultados são bastante satisfatórios. O sinal do parâmetro da variável explicativa está de acordo com a teoria econômica. O coeficiente de determinação é alto e indica um forte ajuste dos dados. O teste F mostra que a variável explicativa tem efeito significativo sobre a variável dependente, resultado que é confirmado pelo teste t. Ademais, pela estatística JB, não podemos rejeitar a hipótese de que os resíduos têm distribuição normal. Exercício: Considere os dados sobre despesas com alimentos e despesa total dados na tabela a seguir. DESPESAS TOTAIS E COM ALIMENTAÇÃO (EM RUPIAS) Observação Despesas com Alimentação Despesa total Observação Despesas com Alimentação Despesa total 1 217 382 29 390 665 2 196 388 30 385 662 3 303 391 31 470 663 4 270 415 32 322 677 5 325 456 33 540 680 6 260 460 34 433 690 7 300 472 35 295 695 8 325 478 36 340 695 9 336 494 37 500 695 10 345 516 38 450 720 11 325 525 39 415 721 12 362 554 40 540 730 13 315 575 41 360 731 14 355 579 42 450 733 15 325 585 43 395 745 16 370 586 44 430 751 17 390 590 45 332 752 18 420 608 46 397 752 19 410 610 47 446 769 20 383 616 48 480 773 21 315 618 49 353 773 22 267 623 50 410 773 23 420 627 51 380 785 24 300 630 52 610 788 25 410 635 53 530 790 26 220 640 54 360 795 27 403 648 55 305 801 28 350 650 Pede-se: a) Obtenha a regressão linear para esses dados com base no MQO. DALIM = 93.9175483845 + 0.437193424516*DTOT Dependent Variable: DALIM Method: Least Squares Date: 04/06/18 Time: 08:50 Sample: 1 55 Included observations: 55 Variable Coefficient Std. Error t-Statistic Prob. C 93.91755 50.84338 1.847193 0.0703 DTOT 0.437193 0.078286 5.584598 0.0000 R-squared 0.370455 Mean dependent var 373.3636Adjusted R-squared 0.358576 S.D. dependent var 83.43047 S.E. of regression 66.81857 Akaike info criterion 11.27753 Sum squared resid 236630.2 Schwarz criterion 11.35052 Log likelihood -308.1319 Hannan-Quinn criter. 11.30575 F-statistic 31.18773 Durbin-Watson stat 2.083213 Prob(F-statistic) 0.000001 b) Analise os sinais dos parâmetros O sinal do parâmetro da variável explicativa (DT) é positivo, indicando que uma maior despesa total está associada a uma maior despesa com alimentação, o que está de acordo com o esperado. c) Analise o coeficiente de determinação O coeficiente de determinação (R²) indica que 37% da variação da despesa com alimentação é explicado pela variação da despesa total. Como esse valor é relativamente baixo, o poder explicativo do modelo fica limitado. Talvez existam outras variáveis explicativas importantes para o fenômeno que não estão contempladas neste modelo. d) Faça os testes F e t para um nível de significância de 5% Teste F: H0: 1 = 0 ausência de efeito H1: 1 0 presença de efeito Adotando um nível de significância de 5%, temos: GL: numerador = k = 1 denominador = n – k – 1 = 55 – 1 – 1 = 53 FCRIT = 4,00 FCALC> FCRIT rejeita-se H0 a variável despesa total tem efeito significativo sobre a variável despesa com alimentação, com probabilidade de erro de 5%. Teste t: H0: 1 = 0 ausência de efeito H1: 1> 0 unilateral presença de efeito positivo Adotando um nível de significância de 5%, temos: GL= n – k – 1 = 53 tcrit = 1,671 tCALC>tCRIT rejeita-se H0 a variável despesas totais tem efeito positivo significativo sobre a variável despesas com alimentação, com probabilidade de erro de 5%. e) Obtenha o histograma dos resíduos Visualmente, vemos no histograma que as maiores frequências estão na região central e as extremidades têm as menores frequências. Contudo, há irregularidades que tornam difícil de observar o contorno característico da distribuição normal. A estatística JB vale aproximadamente 0.26 > 1; e a probabilidade associada vale 0.88 > 0.5. Desta forma, iremos aceitar a normalidade dos resíduos, com a ressalva de que o teste JB é designado para grandes amostras, e neste caso estamos trabalhando com n = 55. f) Teste a normalidade dos resíduos usando a estatística JB Em relação à normalidade dos resíduos, vemos que a estatística JB é 0,26 e a probabilidade associada é 88%. Como essa probabilidade é maior que 50%, vamos aceitar a hipótese nula de normalidade dos resíduos. Adicionalmente, devemos observar que o exame visual do histograma não é conclusivo em relação à normalidade, apesar de ter as menores frequências nas extremidades as maiores frequências na região central. Devemos ainda pontuar que o teste JB é concebido para grandes amostras, o que não é o caso deste problema (n = 55). g) Analise os resultados Apesar de a amostra ser pequena, os resultados são satisfatórios. O sinal do parâmetro da variável explicativa está de acordo com o esperado. O coeficiente de determinação (R²) revela um ajuste dos dados deficiente, talvez indicando a falta de outras variáveis explicativas importantes, que não estão sendo consideradas neste modelo. O teste F mostrou que a variável explicativa tem efeito significativo sobre a variável dependente, no nível de significância de 5%, o que foi confirmado pelo teste t. Adicionalmente, verificamos que a normalidade dos resíduos pode ser confirmada pela estatística JB. Desilind Exegese Subjas (subjascente)
Compartilhar