Baixe o app para aproveitar ainda mais
Prévia do material em texto
O Coeficiente de Determinação (R²) Até aqui estivemos preocupados com o problema de estimar coeficientes de regressão, seus erros-padrão e algumas de suas propriedades. Agora, vamos considerar a qualidade do ajustamento da linha de regressão ajustada a um conjunto de dados, ou seja, descobriremos quão bem uma linha de regressão amostral é adequada aos dados. Se todas as observações se situassem na linha de regressão, obteríamos um ajustamento perfeito, mas isso raramente acontece. Em geral, haverá alguns ȗ positivos e outros negativos. O que esperamos é que esses resíduos em torno da linha de regressão sejam os menores possíveis. O coeficiente de determinação R² (no caso de duas variáveis) é uma medida resumida que diz o quanto a linha de regressão amostral se ajusta aos dados. O cálculo do R² pode ser feito por meio das seguintes fórmulas: ou observando-se que SQT = SQE + SQR O R² assim definido é conhecido como coeficiente de determinação (amostral) e é o indicador mais usado para medir a qualidade do ajustamento de uma linha de regressão. Ele mede a proporção ou percentual da variação total de Y explicada pelo modelo de regressão. O R² é um número não negativo, situado entre 0 e 1. Quanto mais próximo de 1 for o seu valor, melhor é a qualidade do ajustamento. Um R² igual a 1 indica um ajustamento perfeito, por outro lado, um R² igual a zero significa que não há qualquer relação entre Y e X. Algo estreitamente relacionado, mas conceitualmente diferente de R², é o coeficiente de correlação linear de Pearson, que é uma medida do grau de associação entre duas variáveis e pode ser calculado como: Ou a partir de sua definição: Esse coeficiente também pode ser calculado com o auxílio da calculadora HP 12-C. Ele pode ser positivo ou negativo, o sinal depende da covariância das variáveis. Seu valor situa-se entre -1 e 1 e ele é apenas uma medida de associação linear ou de dependência linear, não tendo sentido para descrever relações não lineares. Também devemos observar que ele não implica em relação de causa e efeito. Dessa forma, no contexto da regressão, R² é uma medida mais significativa que r. Exercício: Para os dados da tabela abaixo, pede-se: a) faça o diagrama de dispersão, usando o Excel; b) ainda usando o Excel, obtenha a equação de regressão no gráfico e usando a função de regressão; c) calcule r e R² usando as fórmulas e compare o valor com o fornecido pelo Excel; d) faça a regressão no e-Views e compare os resultados; e) analise os resultados. anos de estudo salário médio (US$/hora) 6 4,5 7 5,8 8 6,0 9 7,3 10 7,3 11 6,6 12 7,8 13 7,8 14 11,0 15 10,7 16 10,8 17 13,6 18 13,5 156 112,8 Fonte:Goldberg, A. S., Introductory Econometrics. HU Press, 1998, p. 5 Solução: No e-Views Y = 0.0318681318681 + 0.71978021978*X Dependent Variable: Y Method: Least Squares Date: 03/16/18 Time: 08:51 Sample: 1 13 Included observations: 13 Variable Coefficient Std. Error t-Statistic Prob. C 0.031868 0.876592 0.036355 0.9717 X 0.719780 0.069738 10.32122 0.0000 R-squared 0.906405 Mean dependent var 8.669231 Adjusted R-squared 0.897896 S.D. dependent var 2.944312 S.E. of regression 0.940816 Akaike info criterion 2.856500 Sum squared resid 9.736484 Schwarz criterion 2.943415 Log likelihood -16.56725 Hannan-Quinn criter. 2.838635 F-statistic 106.5275 Durbin-Watson stat 1.725567 Prob(F-statistic) 0.000001 No Excel: Analisando os dados: Salários e anos de estudos são positivamente correlacionados, ou seja, quanto mais anos de estudos, maior o salário. O parâmetro da variável “anos de estudo” é aproximadamente 0,75, o que indica que 1 ano a mais de estudo provoca aumento de 0,72 dólar no salário-hora. O coeficiente de determinação (R²) vale aproximadamente 0,91, o que indica que 91% da variação do salário é provocada pela variação dos anos de estudo, o que representa um alto grau de ajuste dos dados.
Compartilhar