Baixe o app para aproveitar ainda mais
Prévia do material em texto
Resumo para P1 O modelo de regressão linear simples define uma função matemática com o objetivo de descrever a relação entre duas variáveis, Y e X, uma dependente (Y) e outra explicativa (X). A função linear que define essa relação pode ser escrita como: Yi = β0 + β1.Xi + ui O termo ui é o termo de erro ou perturbação, também chamado de termo aleatório ou resíduo e representa outros fatores, além de X, que afetam Y. Os parâmetros β0 e β1 da equação de regressão linear podem ser obtidos por meio do Método dos Mínimos Quadrados Ordinários (MMQO). Esse método tem algumas propriedades numéricas importantes. São as propriedades que se sustentam em consequência do uso dos mínimos quadrados ordinários, quaisquer que sejam as formas pelas quais os dados foram gerados: Os estimadores de MQO são expressos unicamente em termos de quantidades observáveis (isto é, amostras) como X e Y. Portanto, podem ser calculados com facilidade. São estimadores pontuais, isto é, dada a amostra, cada estimador proporciona apenas um único valor do parâmetro populacional relevante. Uma vez obtidas as estimativas de MQO para os dados amostrais, a linha de regressão amostral pode ser facilmente obtida. Essa linha de regressão tem as seguintes propriedades: Passa pelas médias amostrais de Y e X. O valor médio de Y estimado é igual ao valor médio do Y observado. O valor médio dos resíduos é igual a zero. Os resíduos não estão correlacionados ao Y previsto. Os resíduos não estão correlacionados ao X. O modelo de regressão linear clássico parte de dez premissas: O modelo de regressão é linear nos parâmetros e sua expressão algébrica é: Yi = β0 + β1.Xi + ui No qual Y é a variável dependente e X é a variável independente ou explicativa. Vale observar que nesse modelo, as variáveis Y e X podem ser não lineares. Os valores de X são fixos em amostras repetidas, ou seja, X não é estocástico. O valor médio do termo de erro ui é zero. Homocedasticidade ou variância igual de ui. Dado o valor de Xi, a variância de ui é a mesma para todas as observações. Indicamos essa premissa assim: var (ui|Xi) = ². Isso quer dizer que a variação em torno da linha de regressão é a mesma para todos os X, ou seja, não aumenta nem diminui quando X varia. A não observância dessa premissa é chamada de heterocedasticidade. Não há autocorrelação entre os termos de erro. Isso significa que os desvios em torno dos valores de Y não apresentam padrões. Se os termos de erro seguem padrões sistemáticos, há autocorrelação ou correlação serial. Ausência de covariância entre ui e Xi. O termo de erro não está correlacionado com a variável explicativa, pois, se isso não ocorrer, não seria possível avaliar os efeitos individuais de X sobre Y. O número de observações n deve ser maior que o número de parâmetros a serem estimados. Quanto maior for o número de observações, mais confiável será o modelo. Deve haver variabilidade nos valores de X, ou seja, var (X) deve ser um número positivo finito. Se houver pouca variação de X, o modelo não será capaz de explicar corretamente as variações do Y. O modelo de regressão está especificado na forma correta, ou então haverá um viés ou erro de especificação no modelo empregado na análise empírica. Não há multicolinearidade perfeita, isto é, não há relações lineares perfeitas entre as variáveis explicativas. É cabível imaginar que as variáveis explicativas tenham alguma correlação entre si, contudo existe um limite aceitável para esse grau de correlação. Para avaliar a adequação de um modelo de regressão, precisamos saber se sua ‘qualidade’ de ajuste é boa o suficiente. Várias técnicas são recomendadas. Precisamos observar se os sinais dos coeficientes βi estão de acordo com a teoria econômica. Devemos observar até que ponto as variações no Xi explicam as variações de Yi. O coeficiente de determinação (R²) nos dá essa estimativa. O teste F deverá mostrar que as variáveis explicativas, em conjunto, têm influência/efeito significativo sobre a variável dependente. O teste F é conclusivo para isso. O teste t das variáveis explicativas irá avaliar se individualmente, cada variável explicativa tem influência/efeito significativo sobre a variável dependente. O teste t é conclusivo para essa análise. Em regressões simples, com apenas 1 variável explicativa, o teste t e o teste F são equivalentes, um deve confirmar o resultado do outro. Os testes F e t são feitos comparando-se as respectivas estatísticas calculadas no modelo com valores críticos, fornecidos em tabelas apropriadas. Para ambos, a regra de decisão é que se a estatística calculada (F ou t) for maior que o valor crítico (da tabela), em módulo, rejeita-se a hipótese nula H0. Para os dois testes, a hipótese nula é: H0: 1 = 0. A hipótese alternativa é diferente para os dois testes: H1: 1 ≠ 0 (teste F) e H1: 1 > 0 (ou < 0 para o teste t). Os valores críticos podem ser obtidos considerando-se os seguintes graus de liberdade: Teste F: k (numerador) e n – k – 1 (denominador) Teste t: n – k – 1 Observamos ainda que o teste t é unilateral e k representa o número de variáveis explicativas. Exercícios de revisão 1) Considere a tabela abaixo, com dados de Consumo (C) e PIB (P). Ano Consumo PIB 1977 7011 10128 1978 7280 10630 1979 7837 11349 1980 8649 12400 1981 8077 11853 1982 8319 11929 1983 8244 11516 1984 8599 12104 1985 8960 13114 1986 9566 14109 1987 9104 14618 Admitindo que o consumo depende do PIB, estime a equação de regressão linear dessas variáveis com o auxílio do programa E-Views e analise os resultados. CONSUMO = 1893.39419379 + 0.529485337334*PIB Dependent Variable: CONSUMO Method: Least Squares Date: 04/06/18 Time: 10:05 Sample: 1 11 Included observations: 11 Variable Coefficient Std. Error t-Statistic Prob. C 1893.394 774.3364 2.445183 0.0370 PIB 0.529485 0.063325 8.361453 0.0000 R-squared 0.885952 Mean dependent var 8331.455 Adjusted R-squared 0.873280 S.D. dependent var 765.1540 S.E. of regression 272.3781 Akaike info criterion 14.21522 Sum squared resid 667708.2 Schwarz criterion 14.28757 Log likelihood -76.18374 Hannan-Quinn criter. 14.16962 F-statistic 69.91390 Durbin-Watson stat 1.214510 Prob(F-statistic) 0.000016 O sinal da variável explicativa (PIB) é positivo, o que está de acordo com a premissa do exercício, pois é esperado que quanto maior o PIB, maior será o Consumo. O coeficiente de determinação (R²) mostra que 88% da variação do consumo é explicada pela variação do PIB, o que mostra um algo grau de ajuste dos dados. O perfil do histograma não se assemelha muito ao de uma distribuição normal. Observamos um valor de probabilidade acima de 50%, então podemos aceitar a hipótese nula de que os resíduos se distribuem normalmente. É importante ressaltar que o teste JB é indicado para grandes amostras, e como estamos trabalhando com uma amostra pequena (n = 11), não devemos esperar resultados conclusivos ou promissores deste teste. Teste F: H0: 1 = 0 ausência de efeito H1: 1 0 presença de efeito Adotando um nível de significância de 5%, temos: GL: numerador = k = 1 denominador = n – k – 1 = 11 – 1 – 1 = 9 Fcrit = 5,12 FCALC> FCRIT rejeita-se H0 a variável PIB tem efeito significativo sobre a variável Consumo, com probabilidade de erro de 5%. Teste t: H0: 1 = 0 ausência de efeito H1: 1> 0 unilateral presença de efeito positivo Adotando um nível de significância de 5%, temos: GL= n – k – 1 = 11 – 1 – 1 = 9 tcrit = 1,833 tCALC>tCRIT rejeita-se H0 a variável PIB tem efeito positivo significativo sobre a variável Consumo, com probabilidade de erro de 5%. Comentário geral: apesar daamostra ser pequena (n = 11), os resultados são satisfatórios. O sinal do parâmetro da variável explicativa está de acordo com a teoria econômica. O coeficiente de determinação é alto e indica um forte ajuste dos dados. O teste F mostra que a variável explicativa tem efeito significativo sobre a variável dependente, resultado que é confirmado pelo teste t. Ademais, pela estatística JB, não podemos rejeitar a hipótese que os resíduos tem distribuição normal. 2) A tabela abaixo contém dados hipotéticos de um índice de custo de vida e os valores dos salários de uma categoria profissional. anos 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 salário 12 18 22 25 30 34 41 46 50 58 65 78 índice 140 148 157 168 176 182 189 192 204 215 222 235 Com auxílio da planilha eletrônica Excel, pede-se: a) Construa uma nova série para o índice de custo de vida, adotando como base o ano de 1987. b) Deflacione os salários pelo novo índice e calcule o aumento real comparando 1998 a 1987. Calculando o novo índice: Divide-se cada valor de índice pelo valor do índice do novo ano-base e multiplicar o resultado por 100. No caso, =(C2/140)*100 Calculando o novo salário real: Divide-se cada salário médio pelo número índice correspondente e multiplica o resultado por 100. No caso, =(B2/100)*100 anos 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 salário 12 18 22 25 30 34 41 46 50 58 65 78 índice 140 148 157 168 176 182 189 192 204 215 222 235 índice* 100 106 112 120 126 130 135 137 146 154 159 168 salário* 12 17 20 21 24 26 30 34 34 38 41 46 Conclui-se que o salário nominal aumentou 6,5x, enquanto o salário real aumentou menos de 4x. 3) O termo aleatório ou termo residual representa o quê em uma regressão? O termo u é o termo de erro e representa outro fatores, além de X, que afetam Y. Uma análise de regressão simples trata, efetivamente, todos o fatores, além de X, que afetam Y como não observados. 4) Que entidade é responsável pelo cálculo do INPC e do IPCA? Quais são as populações-objetivo desses índices? Em que pesquisa(s) se baseia(m) esses índices? A entidade responsável pelo cálculo tanto do INPC quanto do IPCA é o IBG. Este que define para o INPC como população-objetivo, aquelas cujos chefes são assalariados e tenham rendimentos no intervalo de 1 a 8 salários mínimos. Já o IPCA é utilizado como indicador geral da inflação, devendo representar a variação de preços da totalidade dos bens e serviços disponíveis para o consumo pessoal, referindo-se a todas as classes de renda. É com base em uma Pesquisa de Orçamentos Familiares que se investigam os hábitos de consumo das famílias, segundo a distribuição de renda. 5) O que é um modelo? Um modelo econométrico é composto de quê? Um modelo é uma representação simplificada da realidade, que mostra apenas o que é relevante para uma questão específica, negligenciando todos os demais aspectos. Um modelo econométrico contém especificações para aplicação empírica e incorpora termo residual. Na estrutura do modelo econométrico temos as variáveis (dependentes e explicativas), equações (que expressam o mecanismo que aciona as variáveis), coeficientes (que expressam a magnitude de influência de cada variável independente em relação à variável dependente no fenômeno estudado) e um termo aleatório (que são variáveis omitidas e contabilizam a imprevisibilidade e variação do comportamento humano). 6) Quais são as qualidades desejáveis de um modelo econométrico? Plausibilidade teórica (ser compatível com a teoria econômica), capacidade explanatória (ser capaz de explicar os dados observados cuja relação ele determina), exatidão das estimativas e dos parâmetros (devem se aproximar dos verdadeiros parâmetros estruturais), capacidade de previsão (gerar previsões satisfatórias de valores futuros) e simplicidade. 7) Quais são os propósitos da Econometria? Mensuração de variáveis, estimação de parâmetro de relações estabelecidas pela teoria econômica, formulação de teses de hipóteses sobre o comportamento da realidade e, por fim, previsão de valores das variáveis econômicas. 8) Quais são os objetivos da Econometria? Verificação de teorias econômicas, avaliação de políticas econômicas e previsão de valores futuros de variáveis de natureza econômica. 9) Qual a diferença entre correlação e causação? Embora a análise de regressão lide com a dependência de uma variável em relação a outras, isso não implica necessariamente em causação. Uma relação estatística nunca pode estabelecer uma conexão causal: as ideias de causação devem se originar fora da estatística, de alguma teoria. 10) Quais são as propriedades do Método dos Mínimos Quadrados Ordinários? Os estimadores de MMQO são expressos unicamente em termos de quantidades observáveis (isto é, amostras) como X e Y. São estimadores pontuais, isto é, dada a amostra, cada estimador proporciona apenas um único valor do parâmetro populacional relevante. Uma vez obtidas as estimativas de MMQO para os dados amostrais, a linha de regressão amostral pode ser facilmente obtida. Essa linha de regressão tem as seguintes propriedades: Passa pelas médias amostrais de Y e X. O valor médio de Y estimado é igual ao valor médio do Y observado. O valor médio dos resíduos é igual a zero. Os resíduos não estão correlacionados ao Y previsto. Os resíduos não estão correlacionados ao X. 11) Quais são as premissas do modelo de regressão baseado no MMQO? Premissa 1: O modelo de regressão é linear nos parâmetros, com expressão algébrica: Yi = β0 + β1.Xi + ui No qual Y é a variável dependente e X é a variável explicativa. As variáveis Y e X podem ser não lineares. Premissa 2: Os valores de X são fixos em amostras repetidas, ou seja, X não é estocástico. Premissa 3: O valor médio do termo de erro ui é zero. Premissa 4: Homocedasticidade ou variância igual de ui. Isso quer dizer que a variação em torno da linha de regressão é a mesma para todos os X, ou seja, não aumenta nem diminui quando X varia. A não observância dessa premissa é chamada de heterocedasticidade. Premissa 5: Não há autocorrelação entre os termos de erro. Isso significa que os desvios em torno dos valores de Y não apresentam padrões. Se os termos de erro seguem padrões sistemáticos, há autocorrelação ou correlação serial. Premissa 6: Ausência de covariância entre ui e Xi. O termo de erro não está correlacionado com a variável explicativa, pois, se isso não ocorrer, não seria possível avaliar os efeitos individuais de X sobre Y. Premissa 7: O número de observações n deve ser maior que o número de parâmetros a serem estimados. Quanto maior for o número de observações, mais confiável será o modelo. Premissa 8: Deve haver variabilidade nos valores de X, ou seja, var (X) deve ser um número positivo finito. Se houver pouca variação de X, o modelo não será capaz de explicar corretamente as variações do Y. Premissa 9: O modelo de regressão está especificado na forma correta, ou então haverá um viés ou erro de especificação no modelo empregado na análise empírica. Premissa 10: Não há multicolinearidade perfeita, isto é, não há relações lineares perfeitas entre as variáveis explicativas. É cabível imaginar que as variáveis explicativas tenham alguma correlação entre si, contudo existe um limite aceitável para esse grau de correlação. 12) O que é o coeficiente de determinação e o que ele mede? Como podemos calculá-lo? O R² é o indicador mais usado para medir a qualidade do ajustamento de uma linha de regressão. Ele mede a proporção ou percentual de variação total de Y explicada pelo modelo de regressão. O cálculo do R² pode ser feito por meio das seguintes fórmulas: ou 13) Qual a finalidade do teste F? Testar o efeito conjunto das variáveis explicativas sobre a dependente. No caso da regressão linear simples, como existesomente uma variável explicativa, a função da estatística F é a de testar a significância do efeito de X sobre Y. 14) Qual a finalidade do teste t? Testar a significância dos parâmetros estimados do modelo, o que equivale a testar individualmente o efeito das variáveis explicativas sobre o denominador dessa expressão representa o número de graus de liberdade do estimador de mínimos quadrados da variância. 15) Uma rede de fast-food de Moscou fez um levantamento de preços e quantidades vendidas de seu principal produto em 12 semanas e obteve os seguintes resultados: Semana Quantidade Preço 1 892 1,23 2 1012 1,15 3 1060 1,10 4 987 1,20 5 680 1,35 6 739 1,25 7 809 1,28 8 1275 0,99 9 946 1,22 10 874 1,25 11 720 1,30 12 1096 1,05 Obtenha uma expressão para a função demanda desse produto. Analise os resultados, e calcule a elasticidade preço da demanda. E = β1 * P- Q- QUANTIDADE = 2813.31991682 - 1577.58100221*PRECO Dependent Variable: QUANTIDADE Method: Least Squares Date: 04/06/18 Time: 10:38 Sample: 1 12 Included observations: 12 Variable Coefficient Std. Error t-Statistic Prob. C 2813.320 175.3238 16.04642 0.0000 PRECO -1577.581 145.8826 -10.81405 0.0000 R-squared 0.921225 Mean dependent var 924.1667 Adjusted R-squared 0.913347 S.D. dependent var 174.6695 S.E. of regression 51.41715 Akaike info criterion 10.86883 Sum squared resid 26437.23 Schwarz criterion 10.94965 Log likelihood -63.21299 Hannan-Quinn criter. 10.83891 F-statistic 116.9436 Durbin-Watson stat 1.681482 Prob(F-statistic) 0.000001 O sinal da variável explicativa (preço) é negativo, o que está de acordo com a teoria econômica, pois é esperado que quanto maior o preço, menor será a quantidade vendida. O coeficiente de determinação (R²) mostra que 92% da variação da quantidade vendida é explicada pela variação da renda, o que mostra um alto grau de ajuste dos dados. O perfil do histograma não se assemelha muito ao de uma distribuição normal. Mas observamos um valor de probabilidade de 62%, então podemos aceitar a hipótese nula de que os resíduos se distribuem normalmente. É importante ressaltar que o teste JB é indicado para grandes amostras, e como estamos trabalhando com uma amostra pequena (n = 12), não devemos esperar resultados conclusivos ou promissores deste teste. Teste F: H0: 1 = 0 ausência de efeito H1: 1 0 presença de efeito Adotando um nível de significância de 5%, temos: GL: numerador = k = 1 denominador = n – k – 1 = 12 – 1 – 1 = 10 Fcrit = 4,96 FCALC> FCRIT rejeita-se H0 a variável PIB tem efeito significativo sobre a variável Consumo, com probabilidade de erro de 5%. Teste t: H0: 1 = 0 ausência de efeito H1: 1> 0 unilateral presença de efeito positivo Adotando um nível de significância de 5%, temos: GL= n – k – 1 = 12 – 1 – 1 = 10 tcrit = 1,812 tCALC>tCRIT rejeita-se H0 a variável PIB tem efeito positivo significativo sobre a variável Consumo, com probabilidade de erro de 5%. Comentário: apesar da amostra ser pequena (n = 12), os resultados são satisfatórios. O sinal do parâmetro da variável explicativa está de acordo com a teoria econômica. O coeficiente de determinação é alto e indica um forte ajuste dos dados. O teste F mostra que a variável explicativa tem efeito significativo sobre a variável dependente, resultado que é confirmado pelo teste t. Ademais, pela estatística JB, não podemos rejeitar a hipótese que os resíduos têm distribuição normal. • Cálculo da elasticidade: Q médio = 924,17 P médio = 1,1975 Elástico. O valor da elasticidade é maior que 1 (em módulo), portanto a elasticidade preço da demanda é -2,04, que é elástico, ou seja, um aumento de 1% do preço provoca queda de 2,04% na quantidade demandada do produto. 16) Calcule as variações de preços pelos índices de Laspeyres, Paasche, Fisher e Marshall-Edgeworth para os dados abaixo: 2011 2012 preços quantidades preços quantidades Bem 1 10 1000 12 800 Bem 2 3 2000 5 1500 Bem 3 2 3000 3 2500 Bem 4 5 500 4 700 Laspeyres Paasche Marshall-Edgeworth Fisher
Compartilhar