Buscar

Aulas 15 e 16 Resumo e Exercícios para P1

Prévia do material em texto

Resumo para P1
O modelo de regressão linear simples define uma função matemática com o objetivo de descrever a relação entre duas variáveis, Y e X, uma dependente (Y) e outra explicativa (X).
A função linear que define essa relação pode ser escrita como: Yi = β0 + β1.Xi + ui	
O termo ui é o termo de erro ou perturbação, também chamado de termo aleatório ou resíduo e representa outros fatores, além de X, que afetam Y.
Os parâmetros β0 e β1 da equação de regressão linear podem ser obtidos por meio do Método dos Mínimos Quadrados Ordinários (MMQO). Esse método tem algumas propriedades numéricas importantes. São as propriedades que se sustentam em consequência do uso dos mínimos quadrados ordinários, quaisquer que sejam as formas pelas quais os dados foram gerados:
Os estimadores de MQO são expressos unicamente em termos de quantidades observáveis (isto é, amostras) como X e Y. Portanto, podem ser calculados com facilidade.
São estimadores pontuais, isto é, dada a amostra, cada estimador proporciona apenas um único valor do parâmetro populacional relevante.
Uma vez obtidas as estimativas de MQO para os dados amostrais, a linha de regressão amostral pode ser facilmente obtida. Essa linha de regressão tem as seguintes propriedades:
Passa pelas médias amostrais de Y e X.
O valor médio de Y estimado é igual ao valor médio do Y observado.
O valor médio dos resíduos é igual a zero.
Os resíduos não estão correlacionados ao Y previsto.
Os resíduos não estão correlacionados ao X.
O modelo de regressão linear clássico parte de dez premissas:
O modelo de regressão é linear nos parâmetros e sua expressão algébrica é: Yi = β0 + β1.Xi + ui
No qual Y é a variável dependente e X é a variável independente ou explicativa. Vale observar que nesse modelo, as variáveis Y e X podem ser não lineares.
Os valores de X são fixos em amostras repetidas, ou seja, X não é estocástico. 
O valor médio do termo de erro ui é zero. 
Homocedasticidade ou variância igual de ui. Dado o valor de Xi, a variância de ui é a mesma para todas as observações. Indicamos essa premissa assim: var (ui|Xi) = ². Isso quer dizer que a variação em torno da linha de regressão é a mesma para todos os X, ou seja, não aumenta nem diminui quando X varia. A não observância dessa premissa é chamada de heterocedasticidade.
Não há autocorrelação entre os termos de erro. Isso significa que os desvios em torno dos valores de Y não apresentam padrões. Se os termos de erro seguem padrões sistemáticos, há autocorrelação ou correlação serial. 
Ausência de covariância entre ui e Xi. O termo de erro não está correlacionado com a variável explicativa, pois, se isso não ocorrer, não seria possível avaliar os efeitos individuais de X sobre Y. 
O número de observações n deve ser maior que o número de parâmetros a serem estimados. Quanto maior for o número de observações, mais confiável será o modelo.
Deve haver variabilidade nos valores de X, ou seja, var (X) deve ser um número positivo finito. Se houver pouca variação de X, o modelo não será capaz de explicar corretamente as variações do Y.
O modelo de regressão está especificado na forma correta, ou então haverá um viés ou erro de especificação no modelo empregado na análise empírica. 
Não há multicolinearidade perfeita, isto é, não há relações lineares perfeitas entre as variáveis explicativas. É cabível imaginar que as variáveis explicativas tenham alguma correlação entre si, contudo existe um limite aceitável para esse grau de correlação. 
Para avaliar a adequação de um modelo de regressão, precisamos saber se sua ‘qualidade’ de ajuste é boa o suficiente. Várias técnicas são recomendadas. 
Precisamos observar se os sinais dos coeficientes βi estão de acordo com a teoria econômica.
Devemos observar até que ponto as variações no Xi explicam as variações de Yi. O coeficiente de determinação (R²) nos dá essa estimativa.
O teste F deverá mostrar que as variáveis explicativas, em conjunto, têm influência/efeito significativo sobre a variável dependente. O teste F é conclusivo para isso.
O teste t das variáveis explicativas irá avaliar se individualmente, cada variável explicativa tem influência/efeito significativo sobre a variável dependente. O teste t é conclusivo para essa análise. Em regressões simples, com apenas 1 variável explicativa, o teste t e o teste F são equivalentes, um deve confirmar o resultado do outro.
Os testes F e t são feitos comparando-se as respectivas estatísticas calculadas no modelo com valores críticos, fornecidos em tabelas apropriadas. Para ambos, a regra de decisão é que se a estatística calculada (F ou t) for maior que o valor crítico (da tabela), em módulo, rejeita-se a hipótese nula H0. Para os dois testes, a hipótese nula é: H0: 1 = 0. A hipótese alternativa é diferente para os dois testes: H1: 1 ≠ 0 (teste F) e H1: 1 > 0 (ou < 0 para o teste t). Os valores críticos podem ser obtidos considerando-se os seguintes graus de liberdade:
Teste F: k (numerador) e n – k – 1 (denominador)
Teste t: n – k – 1 
Observamos ainda que o teste t é unilateral e k representa o número de variáveis explicativas.
Exercícios de revisão
1) Considere a tabela abaixo, com dados de Consumo (C) e PIB (P).
	Ano
	Consumo
	PIB
	1977
	7011
	10128
	1978
	7280
	10630
	1979
	7837
	11349
	1980
	8649
	12400
	1981
	8077
	11853
	1982
	8319
	11929
	1983
	8244
	11516
	1984
	8599
	12104
	1985
	8960
	13114
	1986
	9566
	14109
	1987
	9104
	14618
Admitindo que o consumo depende do PIB, estime a equação de regressão linear dessas variáveis com o auxílio do programa E-Views e analise os resultados.
CONSUMO = 1893.39419379 + 0.529485337334*PIB
	Dependent Variable: CONSUMO
	
	
	Method: Least Squares
	
	
	Date: 04/06/18 Time: 10:05
	
	
	Sample: 1 11
	
	
	
	Included observations: 11
	
	
	
	
	
	
	
	
	
	
	
	
	Variable
	Coefficient
	Std. Error
	t-Statistic
	Prob.  
	
	
	
	
	
	
	
	
	
	
	C
	1893.394
	774.3364
	2.445183
	0.0370
	PIB
	0.529485
	0.063325
	8.361453
	0.0000
	
	
	
	
	
	
	
	
	
	
	R-squared
	0.885952
	    Mean dependent var
	8331.455
	Adjusted R-squared
	0.873280
	    S.D. dependent var
	765.1540
	S.E. of regression
	272.3781
	    Akaike info criterion
	14.21522
	Sum squared resid
	667708.2
	    Schwarz criterion
	14.28757
	Log likelihood
	-76.18374
	    Hannan-Quinn criter.
	14.16962
	F-statistic
	69.91390
	    Durbin-Watson stat
	1.214510
	Prob(F-statistic)
	0.000016
	
	
	
	
	
	
	
	
	
	
	
	
	
O sinal da variável explicativa (PIB) é positivo, o que está de acordo com a premissa do exercício, pois é esperado que quanto maior o PIB, maior será o Consumo. O coeficiente de determinação (R²) mostra que 88% da variação do consumo é explicada pela variação do PIB, o que mostra um algo grau de ajuste dos dados.
 
O perfil do histograma não se assemelha muito ao de uma distribuição normal. Observamos um valor de probabilidade acima de 50%, então podemos aceitar a hipótese nula de que os resíduos se distribuem normalmente. É importante ressaltar que o teste JB é indicado para grandes amostras, e como estamos trabalhando com uma amostra pequena (n = 11), não devemos esperar resultados conclusivos ou promissores deste teste.
Teste F:
H0: 1 = 0 ausência de efeito
H1: 1 0 presença de efeito
Adotando um nível de significância de 5%, temos:
GL: numerador = k = 1		denominador = n – k – 1 = 11 – 1 – 1 = 9
Fcrit = 5,12
FCALC> FCRIT rejeita-se H0 a variável PIB tem efeito significativo sobre a variável Consumo, com probabilidade de erro de 5%.
Teste t:
H0: 1 = 0 ausência de efeito
H1: 1> 0 unilateral presença de efeito positivo
Adotando um nível de significância de 5%, temos:
GL= n – k – 1 = 11 – 1 – 1 = 9
tcrit = 1,833
tCALC>tCRIT rejeita-se H0 a variável PIB tem efeito positivo significativo sobre a variável Consumo, com probabilidade de erro de 5%.
Comentário geral: apesar daamostra ser pequena (n = 11), os resultados são satisfatórios. O sinal do parâmetro da variável explicativa está de acordo com a teoria econômica. O coeficiente de determinação é alto e indica um forte ajuste dos dados. O teste F mostra que a variável explicativa tem efeito significativo sobre a variável dependente, resultado que é confirmado pelo teste t. Ademais, pela estatística JB, não podemos rejeitar a hipótese que os resíduos tem distribuição normal.
2) A tabela abaixo contém dados hipotéticos de um índice de custo de vida e os valores dos salários de uma categoria profissional.
	anos
	1987
	1988
	1989
	1990
	1991
	1992
	1993
	1994
	1995
	1996
	1997
	1998
	salário
	12
	18
	22
	25
	30
	34
	41
	46
	50
	58
	65
	78
	índice
	140
	148
	157
	168
	176
	182
	189
	192
	204
	215
	222
	235
Com auxílio da planilha eletrônica Excel, pede-se:
a) Construa uma nova série para o índice de custo de vida, adotando como base o ano de 1987.
b) Deflacione os salários pelo novo índice e calcule o aumento real comparando 1998 a 1987.
Calculando o novo índice: Divide-se cada valor de índice pelo valor do índice do novo ano-base e multiplicar o resultado por 100. No caso, =(C2/140)*100
Calculando o novo salário real: Divide-se cada salário médio pelo número índice correspondente e multiplica o resultado por 100. No caso, =(B2/100)*100
	anos
	1987
	1988
	1989
	1990
	1991
	1992
	1993
	1994
	1995
	1996
	1997
	1998
	salário
	12
	18
	22
	25
	30
	34
	41
	46
	50
	58
	65
	78
	índice
	140
	148
	157
	168
	176
	182
	189
	192
	204
	215
	222
	235
	índice*
	100
	106
	112
	120
	126
	130
	135
	137
	146
	154
	159
	168
	salário*
	12
	17
	20
	21
	24
	26
	30
	34
	34
	38
	41
	46
Conclui-se que o salário nominal aumentou 6,5x, enquanto o salário real aumentou menos de 4x.
3) O termo aleatório ou termo residual representa o quê em uma regressão?
O termo u é o termo de erro e representa outro fatores, além de X, que afetam Y. Uma análise de regressão simples trata, efetivamente, todos o fatores, além de X, que afetam Y como não observados. 
4) Que entidade é responsável pelo cálculo do INPC e do IPCA? Quais são as populações-objetivo desses índices? Em que pesquisa(s) se baseia(m) esses índices?
A entidade responsável pelo cálculo tanto do INPC quanto do IPCA é o IBG. Este que define para o INPC como população-objetivo, aquelas cujos chefes são assalariados e tenham rendimentos no intervalo de 1 a 8 salários mínimos. Já o IPCA é utilizado como indicador geral da inflação, devendo representar a variação de preços da totalidade dos bens e serviços disponíveis para o consumo pessoal, referindo-se a todas as classes de renda. É com base em uma Pesquisa de Orçamentos Familiares que se investigam os hábitos de consumo das famílias, segundo a distribuição de renda.
5) O que é um modelo? Um modelo econométrico é composto de quê?
Um modelo é uma representação simplificada da realidade, que mostra apenas o que é relevante para uma questão específica, negligenciando todos os demais aspectos. Um modelo econométrico contém especificações para aplicação empírica e incorpora termo residual. Na estrutura do modelo econométrico temos as variáveis (dependentes e explicativas), equações (que expressam o mecanismo que aciona as variáveis), coeficientes (que expressam a magnitude de influência de cada variável independente em relação à variável dependente no fenômeno estudado) e um termo aleatório (que são variáveis omitidas e contabilizam a imprevisibilidade e variação do comportamento humano).
6) Quais são as qualidades desejáveis de um modelo econométrico?
Plausibilidade teórica (ser compatível com a teoria econômica), capacidade explanatória (ser capaz de explicar os dados observados cuja relação ele determina), exatidão das estimativas e dos parâmetros (devem se aproximar dos verdadeiros parâmetros estruturais), capacidade de previsão (gerar previsões satisfatórias de valores futuros) e simplicidade.
7) Quais são os propósitos da Econometria?
Mensuração de variáveis, estimação de parâmetro de relações estabelecidas pela teoria econômica, formulação de teses de hipóteses sobre o comportamento da realidade e, por fim, previsão de valores das variáveis econômicas.
8) Quais são os objetivos da Econometria?
Verificação de teorias econômicas, avaliação de políticas econômicas e previsão de valores futuros de variáveis de natureza econômica.
9) Qual a diferença entre correlação e causação?
Embora a análise de regressão lide com a dependência de uma variável em relação a outras, isso não implica necessariamente em causação. Uma relação estatística nunca pode estabelecer uma conexão causal: as ideias de causação devem se originar fora da estatística, de alguma teoria.
10) Quais são as propriedades do Método dos Mínimos Quadrados Ordinários?
Os estimadores de MMQO são expressos unicamente em termos de quantidades observáveis (isto é, amostras) como X e Y.
São estimadores pontuais, isto é, dada a amostra, cada estimador proporciona apenas um único valor do parâmetro populacional relevante.
Uma vez obtidas as estimativas de MMQO para os dados amostrais, a linha de regressão amostral pode ser facilmente obtida. Essa linha de regressão tem as seguintes propriedades:
Passa pelas médias amostrais de Y e X.
O valor médio de Y estimado é igual ao valor médio do Y observado.
O valor médio dos resíduos é igual a zero.
Os resíduos não estão correlacionados ao Y previsto.
Os resíduos não estão correlacionados ao X.
11) Quais são as premissas do modelo de regressão baseado no MMQO?
Premissa 1: O modelo de regressão é linear nos parâmetros, com expressão algébrica: Yi = β0 + β1.Xi + ui
No qual Y é a variável dependente e X é a variável explicativa. As variáveis Y e X podem ser não lineares.
Premissa 2: Os valores de X são fixos em amostras repetidas, ou seja, X não é estocástico. 
Premissa 3: O valor médio do termo de erro ui é zero. 
Premissa 4: Homocedasticidade ou variância igual de ui. Isso quer dizer que a variação em torno da linha de regressão é a mesma para todos os X, ou seja, não aumenta nem diminui quando X varia. A não observância dessa premissa é chamada de heterocedasticidade.
Premissa 5: Não há autocorrelação entre os termos de erro. Isso significa que os desvios em torno dos valores de Y não apresentam padrões. Se os termos de erro seguem padrões sistemáticos, há autocorrelação ou correlação serial. 
Premissa 6: Ausência de covariância entre ui e Xi. O termo de erro não está correlacionado com a variável explicativa, pois, se isso não ocorrer, não seria possível avaliar os efeitos individuais de X sobre Y. 
Premissa 7: O número de observações n deve ser maior que o número de parâmetros a serem estimados. Quanto maior for o número de observações, mais confiável será o modelo.
Premissa 8: Deve haver variabilidade nos valores de X, ou seja, var (X) deve ser um número positivo finito. Se houver pouca variação de X, o modelo não será capaz de explicar corretamente as variações do Y.
Premissa 9: O modelo de regressão está especificado na forma correta, ou então haverá um viés ou erro de especificação no modelo empregado na análise empírica. 
Premissa 10: Não há multicolinearidade perfeita, isto é, não há relações lineares perfeitas entre as variáveis explicativas. É cabível imaginar que as variáveis explicativas tenham alguma correlação entre si, contudo existe um limite aceitável para esse grau de correlação. 
12) O que é o coeficiente de determinação e o que ele mede? Como podemos calculá-lo?
O R² é o indicador mais usado para medir a qualidade do ajustamento de uma linha de regressão. Ele mede a proporção ou percentual de variação total de Y explicada pelo modelo de regressão.
O cálculo do R² pode ser feito por meio das seguintes fórmulas:
	ou	
13) Qual a finalidade do teste F?
Testar o efeito conjunto das variáveis explicativas sobre a dependente. No caso da regressão linear simples, como existesomente uma variável explicativa, a função da estatística F é a de testar a significância do efeito de X sobre Y.
14) Qual a finalidade do teste t?
Testar a significância dos parâmetros estimados do modelo, o que equivale a testar individualmente o efeito das variáveis explicativas sobre o denominador dessa expressão representa o número de graus de liberdade do estimador de mínimos quadrados da variância.
15) Uma rede de fast-food de Moscou fez um levantamento de preços e quantidades vendidas de seu principal produto em 12 semanas e obteve os seguintes resultados:
	Semana
	Quantidade
	Preço
	1
	892
	1,23
	2
	1012
	1,15
	3
	1060
	1,10
	4
	987
	1,20
	5
	680
	1,35
	6
	739
	1,25
	7
	809
	1,28
	8
	1275
	0,99
	9
	946
	1,22
	10
	874
	1,25
	11
	720
	1,30
	12
	1096
	1,05
Obtenha uma expressão para a função demanda desse produto. Analise os resultados, e calcule a elasticidade preço da demanda.
E = β1 * P-
 Q-
QUANTIDADE = 2813.31991682 - 1577.58100221*PRECO
	Dependent Variable: QUANTIDADE
	
	Method: Least Squares
	
	
	Date: 04/06/18 Time: 10:38
	
	
	Sample: 1 12
	
	
	
	Included observations: 12
	
	
	
	
	
	
	
	
	
	
	
	
	Variable
	Coefficient
	Std. Error
	t-Statistic
	Prob.  
	
	
	
	
	
	
	
	
	
	
	C
	2813.320
	175.3238
	16.04642
	0.0000
	PRECO
	-1577.581
	145.8826
	-10.81405
	0.0000
	
	
	
	
	
	
	
	
	
	
	R-squared
	0.921225
	    Mean dependent var
	924.1667
	Adjusted R-squared
	0.913347
	    S.D. dependent var
	174.6695
	S.E. of regression
	51.41715
	    Akaike info criterion
	10.86883
	Sum squared resid
	26437.23
	    Schwarz criterion
	10.94965
	Log likelihood
	-63.21299
	    Hannan-Quinn criter.
	10.83891
	F-statistic
	116.9436
	    Durbin-Watson stat
	1.681482
	Prob(F-statistic)
	0.000001
	
	
	
	
	
	
	
	
	
	
	
	
	
O sinal da variável explicativa (preço) é negativo, o que está de acordo com a teoria econômica, pois é esperado que quanto maior o preço, menor será a quantidade vendida. O coeficiente de determinação (R²) mostra que 92% da variação da quantidade vendida é explicada pela variação da renda, o que mostra um alto grau de ajuste dos dados.
O perfil do histograma não se assemelha muito ao de uma distribuição normal. Mas observamos um valor de probabilidade de 62%, então podemos aceitar a hipótese nula de que os resíduos se distribuem normalmente. É importante ressaltar que o teste JB é indicado para grandes amostras, e como estamos trabalhando com uma amostra pequena (n = 12), não devemos esperar resultados conclusivos ou promissores deste teste.
Teste F:
H0: 1 = 0 ausência de efeito
H1: 1 0 presença de efeito
Adotando um nível de significância de 5%, temos:
GL: numerador = k = 1		denominador = n – k – 1 = 12 – 1 – 1 = 10
Fcrit = 4,96
FCALC> FCRIT rejeita-se H0 a variável PIB tem efeito significativo sobre a variável Consumo, com probabilidade de erro de 5%.
Teste t:
H0: 1 = 0 ausência de efeito
H1: 1> 0 unilateral presença de efeito positivo
Adotando um nível de significância de 5%, temos:
GL= n – k – 1 = 12 – 1 – 1 = 10
tcrit = 1,812
tCALC>tCRIT rejeita-se H0 a variável PIB tem efeito positivo significativo sobre a variável Consumo, com probabilidade de erro de 5%.
Comentário: apesar da amostra ser pequena (n = 12), os resultados são satisfatórios. O sinal do parâmetro da variável explicativa está de acordo com a teoria econômica. O coeficiente de determinação é alto e indica um forte ajuste dos dados. O teste F mostra que a variável explicativa tem efeito significativo sobre a variável dependente, resultado que é confirmado pelo teste t. Ademais, pela estatística JB, não podemos rejeitar a hipótese que os resíduos têm distribuição normal.
• Cálculo da elasticidade: 
Q médio = 924,17	P médio = 1,1975
Elástico. O valor da elasticidade é maior que 1 (em módulo), portanto a elasticidade preço da demanda é -2,04, que é elástico, ou seja, um aumento de 1% do preço provoca queda de 2,04% na quantidade demandada do produto.
16) Calcule as variações de preços pelos índices de Laspeyres, Paasche, Fisher e Marshall-Edgeworth para os dados abaixo:
	
	2011
	2012
	
	preços
	quantidades
	preços
	quantidades
	Bem 1
	10
	1000
	12
	800
	Bem 2
	3
	2000
	5
	1500
	Bem 3
	2
	3000
	3
	2500
	Bem 4
	5
	500
	4
	700
Laspeyres
Paasche
Marshall-Edgeworth
Fisher

Continue navegando