Buscar

Aulas 11 e 12 Principais Estatísticas de Avaliação

Prévia do material em texto

Principais Estatísticas de Avaliação
Objetivos da avaliação
Toda construção humana é passível de avaliação mediante sua comparação com algum padrão preestabelecido. Em Econometria, isso não é diferente. Existem critérios capazes de qualificar os resultados obtidos com a formulação e estimação de um modelo.
Especificamente, a avaliação da estimativa de um modelo tem por objetivo verificar se os parâmetros estimados são ou não teoricamente significativos e estatisticamente satisfatórios ou confiáveis. Isso significa verificar se a estimação do modelo formulado gera uma equação empírica consistente ou de acordo com as hipóteses estabelecidas a priori.
Critérios de avaliação
a) Critérios Estatísticos
O objetivo desses critérios é o de verificar o grau de confiabilidade das estimativas obtidas. Isso é feito mediante a utilização do coeficiente de determinação, do erro-padrão daestimativa e de testes de hipóteses realizados com as estatísticas F e t.
b) Critérios econométricos
Tais critérios visam verificar se as estimativas dos parâmetros possuem ou não as qualidades desejáveis de não tendenciosidade, eficiência e consistência. Em outras palavras, permitem averiguar se os critérios estatísticos perdem ou não validade na determinação do nível de significância dos parâmetros estimados. Assim, esses critérios ajudam a detectar a violação aos pressupostos básicos, subjacentes ao modelo estimado.
Análise de variância simples
A decomposição da variação de Y é normalmente utilizada para a análise de variância. Essa análise tem a vantagem de mostrar as diversas relações básicas, úteis no desenvolvimento de estatísticas de avaliação de resultados obtidos com a estimação do modelo.
SQT = ΣY² - (ΣY)²/n
Soma dos Quadrados Totais (ou seja, soma das variações de Y)
SQE = β1.[ΣXY – (ΣX.ΣY/n)]
Soma dos Quadrados Explicada (pela variável X, ou seja, quanto da variação de Y é explicada pela variável X)
SQR = SQT – SQE 
Soma dos Quadrados do Resíduos (variação de Y que não é explicada pelo X, ou seja, descarregada toda nos resíduos)
Variância amostral ou residual:
s² = SQR/(n-k-1)
(k é o número de variáveis explicativas)
O denominador dessa expressão representa o número de graus de liberdade do estimador de mínimos quadrados da variância. Esse estimador é não tendencioso e mede o grau de dispersão entre os valores observados e os estimados de Y. A raiz quadrada de s² é denominada erro-padrão da estimativa.
Coeficiente de determinação:
R² = SQE/SQT
O coeficiente de determinação indica a parcela da variação de Y explicada pela variação de X. Assim, 1 – R² é a parcela de SQT não explicada por X, devido ao efeito das variáveis omitidas. R² também pode ser interpretado como o quadrado da correlação simples entre os valores de Y e X.
Estatística F
F = (SQE/k)/s²
A estatística F tem por finalidade testar o efeito conjunto das variáveis explicativas sobre a dependente. Isso equivale a verificar se pelo menos uma das variáveis explicativas do modelo exerce influência significativa sobre a variável dependente. No caso da regressão linear simples, como existe somente uma variável explicativa, a função da estatística F é a de testar a significância do efeito de X sobre Y.
Estatística t
A estatística t tem por finalidade testar a significância dos parâmetros estimados do modelo, o que equivale a testar individualmente o efeito das variáveis explicativas sobre a variável dependente. O parâmetro constante (β0) também pode ser testado pela estatística t, para verificar se o seu valor é ou não estatisticamente nulo.
				
		
Testes de hipóteses
Um teste de hipótese é um processo capaz de afirmar, com base em dados amostrais, se uma hipótese sob prova é correta ou não. Por hipótese, entende-se certa afirmação condicionada acerca de uma população.
Do ponto de vista estatístico, um teste, admitindo-se correta a hipótese sob prova, consiste em determinar certa região S0 do espaço amostral S, tal que a probabilidade de um evento E pertencer a S0 seja igual a um número positivo NS ou , denominado nível de significância, compreendido entre 0 e 1. Desse modo, 1 – NS é o nível de confiança do teste.
As hipóteses estabelecidas a respeito de determinada população são de dois tipos:
a) Hipótese nula (H0): quando se admite não haver diferença entre a informação fornecida pela realidade e a afirmação da hipótese.
b) Hipótese alternativa (H1): quando se admite haver diferença entre a informação fornecida pela realidade e a afirmação da hipótese.
Assim, o processo de teste consiste em aceitar ou rejeitar a hipótese nula com base em um nível de significância preestabelecido.
Tipos de erros em um teste de hipóteses
O critério adotado para rejeitar ou não a hipótese nula, com base nas evidências amostrais, não garante uma decisão correta, pois esta sempre envolve a possibilidade de erro. Dois tipos de erros podem ocorrer:
a) Erro tipo I: rejeição da hipótese nula quando ela for verdadeira.
b) Erro tipo II: aceitação da hipótese nula quando ela for falsa.
O nível de significância nos dá a probabilidade de ocorrer o erro tipo I. Em testes sobre parâmetros de modelos econométricos, não é usual a mensuração da probabilidade de erro tipo II. Isso significa que a probabilidade de aceitação da hipótese nula quando ela é falsa não é considerada na prática.
Regra de decisão
Quando a estatística calculada for maior do que o nível crítico calculado pelo nível de segurança dado numa tabela, deve-se rejeitar a hipótese nula.
F	H0: β1 = β2 = ... = βK = 0
	H1: β1 ou β2 ou ... ou βK =/= 0
T	H0: β1 = 0
	H1: β1 < 0 ou β1 > 0
Regra de decisão: Fcalc > Fcrit: rejeita-se H0
		 tcalc > tcrit: rejeita-se H0
Se o β1 for negativo, calcular em módulo.
O critério ou regra que permite decidir se a hipótese nula deve ser rejeitada ou não consiste em definir um limite crítico para uma determinada estatística de avaliação. Esse limite crítico divide o plano em duas regiões: uma região crítica ou de rejeição e uma região de confiança ou de aceitação.
Definido esse limite, posiciona-se a estatística de avaliação calculada em sua respectiva região. Assim, se ela estiver posicionada na região de confiança, aceita-se H0, enquanto que se ela estiver posicionada na região crítica, rejeita-se H0.
O limite crítico depende do tipo de estatística que está sendo usado para a avaliação, do nível de significância do teste e dos graus de liberdade da estatística usada.
O teste F
O teste F é bilateral. O valor de F crítico é dado em uma tabela, de acordo com os graus de liberdade do numerador (k) e do denominador (n – k – 1). É usual usar os níveis de significância de 5% ou de 1%.
Se a estatística F calculada for maior que F crítico, rejeita-se H0. Se F calculado for menor que F crítico, não se pode rejeitar H0. As hipóteses a serem testadas são:
H0: β1 = 0 (ausência de efeito)
H1: β1≠ 0 (presença de efeito)
O teste t
Esse teste envolve a distribuição t de Student. O valor de t crítico é dado em uma tabela e varia de acordo com o nível de significância adotado e com os graus de liberdade (n – k – 1).
O teste t para o parâmetro constante (β0) é bilateral. As hipóteses a serem testadas são:
H0: β0 = 0 (o parâmetro constante é estatisticamente nulo)
H1: β0≠ 0 (o parâmetro constante nãoé estatisticamente nulo)
O teste t para o parâmetro β1 é unilateral. As hipóteses a serem testadas são:
H0: β1 = 0 (ausência de efeito)
H1: β1> 0 (presença de efeito positivo)ou H1: β1< 0 (presença de efeito negativo) 
A regra de decisão é semelhante à do teste F, ou seja, se t calculado for maior que o t crítico, rejeita-se H0, caso contrário não se pode rejeitar essa hipótese. A comparação deve ser feita sempre com o valor da estatística t em módulo.
Não é usual fazermos o teste t para o parâmetro β0, por isso em nossos exemplos e exercícios, faremos apenas o teste t para o parâmetro β1. Em modelos de regressão múltipla, o teste t deve ser feito para todos os parâmetros das variáveis explicativas. No nosso caso, trabalhando com regressõessimples, os testes t e F se equivalem e um deve confirmar o resultado do outro.
Exercícios
1) Para o universo de CEO’s, seja Y o salário anual em milhares de dólares e seja X o retorno médio porcentual sobre o patrimônio (roe) para o CEO da empresa nos últimos três anos (o retorno médio sobre o patrimônio é definido em termos de renda líquida, como uma porcentagem do patrimônio comum). Para estudar a relação entre essa medida do desempenho das empresas e a remuneração dos seus CEO’s, postulamos o modelo simples:
salario = 0 + 1.roe + u
O conjunto de dados do arquivo CEOSAL.XLSX contém informações sobre 209 CEO’s para o ano de 1990, obtidos da revista Business Week (6/5/1991). Obtenha os parâmetros da regressão acima por meio do E-Views, obtenha as estatísticas de avaliação, faça os testes F e t e analise os resultados.
Solução:
Command: ls sal c roe
SAL = 963.191327473 + 18.5011868462*ROE
	DependentVariable: SAL
	
	
	Method: LeastSquares
	
	
	Date: 09/13/13Time: 21:17
	
	
	Sample: 1 209
	
	
	
	Includedobservations: 209
	
	
	
	
	
	
	
	
	
	
	
	
	Variable
	Coefficient
	Std. Error
	t-Statistic
	Prob.  
	
	
	
	
	
	
	
	
	
	
	C
	963.1913
	213.2403
	4.516930
	0.0000
	ROE
	18.50119
	11.12325
	1.663290
	0.0978
	
	
	
	
	
	
	
	
	
	
	R-squared
	0.013189
	    Meandependent var
	1281.120
	Adjusted R-squared
	0.008421
	    S.D. dependent var
	1372.345
	S.E. ofregression
	1366.555
	    Akaikeinfocriterion
	17.28750
	Sum squaredresid
	3.87E+08
	    Schwarz criterion
	17.31948
	Log likelihood
	-1804.543
	    Hannan-Quinn criter.
	17.30043
	F-statistic
	2.766532
	    Durbin-Watson stat
	2.104990
	Prob(F-statistic)
	0.097768
	
	
	
	
	
	
	
	
	
	
	
	
	
Calculadora: ROE (18.50119) / Erro padrão (11.12325) = Estatística t (1.663290)
Análise:
O sinal do parâmetro da variável roe é positivo, indicando que o aumento do retorno sobre o patrimônio da empresa está associado a um maior salário do CEO, o que está de acordo com o esperado.
O coeficiente de determinação (R²) é muito baixo, indicando que apenas 1,3% da variação do salário dos CEO’s é explicado pela variação de roe. Esse resultado deixa a desejar e indica que o ajuste dos dados não é satisfatório. Talvez fosse necessário incluir outras variáveis explicativas no modelo.
Teste F:
H0: β1 = 0 (ausência de efeito)
H1: β1≠ 0 (presença de efeito)
F = 2,766		NS = 5%
GL: num = k = 1
den = n – k – 1 = 209 – 1 – 1 = 207
Fcrit = 3,84
F <Fcrit não rejeita-se H0
A variável explicativa roe não tem efeito significativo sobre a variável salário, com probabilidade de erro de 5%.
Teste t:
H0: β1 = 0 (ausência de efeito)
H1: β1> 0 (presença de efeito positivo)
t = 1,663
GL = n – k – 1 = 207	NS = 5%	unilateral
tcrit = 1,645
t >tcrit Rejeita-se H0
A variável roe tem efeito positivo significativo sobre a variável salário, com probabilidade de erro de 5%. Ressalta-se que o valor da estatística t calculado não é alto e é apenas marginalmente superior ao valor crítico.
Vemos que o resultado do teste F não está em concordância com o resultado do teste t, o que não é usual. Tendo em vista o baixo valor do coeficiente de determinação, somos inclinados a confiar mais no teste F. Como a amostra não é pequena, possivelmente outras variáveis explicativas não incluídas no modelo sejam mais relevantes para explicar a variação dos salários dos CEO’s.
2) Com os dados da tabela abaixo, obtenha a regressão do consumo de energia elétrica (Q) em função da tarifa real (T), considerando o modelo linear simples. Faça os testes F e t e analise os resultados considerando um nível de significância de 5%.
	ano
	Q
	T
	1981
	69
	143
	1982
	76
	134
	1983
	81
	117
	1984
	90
	111
	1985
	94
	109
	1986
	100
	100
	1987
	103
	137
	1988
	108
	122
	1989
	113
	85
	1990
	115
	90
Solução:
Q = 158.805201516 - 0.556665518429*T
	Dependent Variable: Q
	
	
	Method: Least Squares
	
	
	Date: 03/23/18 Time: 08:47
	
	
	Sample: 1 10
	
	
	
	Included observations: 10
	
	
	
	
	
	
	
	
	
	
	
	
	Variable
	Coefficient
	Std. Error
	t-Statistic
	Prob.  
	
	
	
	
	
	
	
	
	
	
	C
	158.8052
	23.74333
	6.688414
	0.0002
	T
	-0.556666
	0.204143
	-2.726841
	0.0260
	
	
	
	
	
	
	
	
	
	
	R-squared
	0.481720
	    Mean dependent var
	94.90000
	Adjusted R-squared
	0.416935
	    S.D. dependent var
	15.77938
	S.E. of regression
	12.04893
	    Akaike info criterion
	7.992686
	Sum squared resid
	1161.414
	    Schwarz criterion
	8.053203
	Log likelihood
	-37.96343
	    Hannan-Quinn criter.
	7.926299
	F-statistic
	7.435664
	    Durbin-Watson stat
	0.774390
	Prob(F-statistic)
	0.025972
	
	
	
	
	
	
	
	
	
	
	
	
	
R² = 48% da variação da quantidade demandada é explicada pela variação da tarifa.
Análise:
O sinal do parâmetro da variável tarifa é negativo, indicando que tarifas maiores estão associadas à menor demanda de energia elétrica, o que está de acordo com a teoria da demanda.
O coeficiente de determinação (R²) indica que 48% da variação da demanda é explicada pela variação da tarifa, o que indica um ajuste razoável dos dados do problema.
Teste F:
H0: β1 = 0 (ausência de efeito)
H1: β1> 0 (presença de efeito positivo)
F = 7,44		NS = 5%
Deb = n – k – 1 = 10 – 1 – 1 = 8
Fcrit = 5,32
F <Fcrit não rejeita-se H0
A variável explicativa tarifa tem efeito significativo sobre a variável demanda, com probabilidade de erro de 5%.
Teste t:
H0: β1 = 0 (ausência de efeito)
H1: β1> 0 (presença de efeito positivo)
T = 2,727 em módulo
GL = n – k – 1 = 8 	NS = 5%	unilateral
tcrit = 1,860
t >tcrit Rejeita-se H0
A variável explicativa tarifa tem efeito negativo significativo sobre a variável dependente demanda, com probabilidade de erro de 5%.
Apesar de a amostra ser pequena (n=10), os resultados são satisfatórios. O coeficiente de determinação mostrou que 48% da variação da demanda é explicada pela variação da tarifa. Adicionalmente, vimos pelos testes F e t que a variável tarifa tem efeito negativo sobre a variável demanda. Talvez, se considerássemos outras variáveis explicativas no modelo, como a renda, o poder explicativo fosse melhor.

Continue navegando