Buscar

Aulas 7 e 8A O Coeficiente de Determinação

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

O Coeficiente de Determinação (R²)
Até aqui estivemos preocupados com o problema de estimar coeficientes de regressão, seus erros-padrão e algumas de suas propriedades. Agora, vamos considerar a qualidade do ajustamento da linha de regressão ajustada a um conjunto de dados, ou seja, descobriremos quão bem uma linha de regressão amostral é adequada aos dados.
Se todas as observações se situassem na linha de regressão, obteríamos um ajustamento perfeito, mas isso raramente acontece. Em geral, haverá alguns ȗ positivos e outros negativos. O que esperamos é que esses resíduos em torno da linha de regressão sejam os menores possíveis. O coeficiente de determinação R² (no caso de duas variáveis) é uma medida resumida que diz o quanto a linha de regressão amostral se ajusta aos dados.
O cálculo do R² pode ser feito por meio das seguintes fórmulas:
	ou		
observando-se que SQT = SQE + SQR 
O R² assim definido é conhecido como coeficiente de determinação (amostral) e é o indicador mais usado para medir a qualidade do ajustamento de uma linha de regressão. Ele mede a proporção ou percentual da variação total de Y explicada pelo modelo de regressão.
O R² é um número não negativo, situado entre 0 e 1. Quanto mais próximo de 1 for o seu valor, melhor é a qualidade do ajustamento. Um R² igual a 1 indica um ajustamento perfeito, por outro lado, um R² igual a zero significa que não há qualquer relação entre Y e X.
Algo estreitamente relacionado, mas conceitualmente diferente de R², é o coeficiente de correlação linear de Pearson, que é uma medida do grau de associação entre duas variáveis e pode ser calculado como:
Ou a partir de sua definição: 
Esse coeficiente também pode ser calculado com o auxílio da calculadora HP 12-C.
Ele pode ser positivo ou negativo, o sinal depende da covariância das variáveis. Seu valor situa-se entre -1 e 1 e ele é apenas uma medida de associação linear ou de dependência linear, não tendo sentido para descrever relações não lineares. Também devemos observar que ele não implica em relação de causa e efeito.
Dessa forma, no contexto da regressão, R² é uma medida mais significativa que r.
Exercício: Para os dados da tabela abaixo, pede-se:
a) faça o diagrama de dispersão, usando o Excel;
b) ainda usando o Excel, obtenha a equação de regressão no gráfico e usando a função de regressão;
c) calcule r e R² usando as fórmulas e compare o valor com o fornecido pelo Excel;
d) faça a regressão no e-Views e compare os resultados;
e) analise os resultados.
	anos de estudo
	salário médio (US$/hora)
	6
	4,5
	7
	5,8
	8
	6,0
	9
	7,3
	10
	7,3
	11
	6,6
	12
	7,8
	13
	7,8
	14
	11,0
	15
	10,7
	16
	10,8
	17
	13,6
	18
	13,5
	156
	112,8
Fonte:Goldberg, A. S., Introductory Econometrics. HU Press, 1998, p. 5
Solução:
No e-Views
Y = 0.0318681318681 + 0.71978021978*X
	Dependent Variable: Y
	
	
	Method: Least Squares
	
	
	Date: 03/16/18 Time: 08:51
	
	
	Sample: 1 13
	
	
	
	Included observations: 13
	
	
	
	
	
	
	
	
	
	
	
	
	Variable
	Coefficient
	Std. Error
	t-Statistic
	Prob.  
	
	
	
	
	
	
	
	
	
	
	C
	0.031868
	0.876592
	0.036355
	0.9717
	X
	0.719780
	0.069738
	10.32122
	0.0000
	
	
	
	
	
	
	
	
	
	
	R-squared
	0.906405
	    Mean dependent var
	8.669231
	Adjusted R-squared
	0.897896
	    S.D. dependent var
	2.944312
	S.E. of regression
	0.940816
	    Akaike info criterion
	2.856500
	Sum squared resid
	9.736484
	    Schwarz criterion
	2.943415
	Log likelihood
	-16.56725
	    Hannan-Quinn criter.
	2.838635
	F-statistic
	106.5275
	    Durbin-Watson stat
	1.725567
	Prob(F-statistic)
	0.000001
	
	
	
	
	
	
	
	
	
	
	
	
	
No Excel: 
Analisando os dados:
Salários e anos de estudos são positivamente correlacionados, ou seja, quanto mais anos de estudos, maior o salário. O parâmetro da variável “anos de estudo” é aproximadamente 0,75, o que indica que 1 ano a mais de estudo provoca aumento de 0,72 dólar no salário-hora. O coeficiente de determinação (R²) vale aproximadamente 0,91, o que indica que 91% da variação do salário é provocada pela variação dos anos de estudo, o que representa um alto grau de ajuste dos dados.

Continue navegando