Baixe o app para aproveitar ainda mais
Prévia do material em texto
Autor: Prof. Rubens Toledo Arakaki Colaborador: Prof. Maurício Felippe Manzalli Econometria Professor conteudista: Rubens Toledo Arakaki Doutor em História Econômica pela Universidade de São Paulo – USP, bacharel em Ciências Econômicas pela Pontifícia Universidade Católica de Campinas (PUC-Campinas) e bacharel em Estatística pela Universidade Estadual de Campinas – Unicamp. É professor universitário desde 2000 e membro do Conselho Editorial da Revista de Economia Política e História Econômica – REPHE. Tem atuado como analista nas áreas de Pesquisa de Mercado, Custos, Viabilidade de Projetos, Planejamento e Gestão Empresarial, Análise Ambiental e Conjuntura Econômica. Trabalhou por 19 anos no apoio de Planejamento Energético e tem cooperado em grupos especializados com publicações em revistas do ramo. Na UNIP, desde 2010, ministra aulas nos cursos de graduação em Economia, Administração, Relações Internacionais, Contabilidade, Turismo e Serviço Social. © Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou quaisquer meios (eletrônico, incluindo fotocópia e gravação) ou arquivada em qualquer sistema ou banco de dados sem permissão escrita da Universidade Paulista. Dados Internacionais de Catalogação na Publicação (CIP) A659e Arakaki, Rubens Toledo. Econometria. / Rubens Toledo Arakaki. – São Paulo: Editora Sol, 2020. 192 p., il. Nota: este volume está publicado nos Cadernos de Estudos e Pesquisas da UNIP, ISSN 1517-9230. 1. Econometria. 2. Variáveis instrumentais. 3. Variáveis defasadas. II. Título. CDU 330.115 U505.43 – 20 Prof. Dr. João Carlos Di Genio Reitor Prof. Fábio Romeu de Carvalho Vice-Reitor de Planejamento, Administração e Finanças Profa. Melânia Dalla Torre Vice-Reitora de Unidades Universitárias Prof. Dr. Yugo Okida Vice-Reitor de Pós-Graduação e Pesquisa Profa. Dra. Marília Ancona-Lopez Vice-Reitora de Graduação Unip Interativa – EaD Profa. Elisabete Brihy Prof. Marcello Vannini Prof. Dr. Luiz Felipe Scabar Prof. Ivan Daliberto Frugoli Material Didático – EaD Comissão editorial: Dra. Angélica L. Carlini (UNIP) Dr. Ivan Dias da Motta (CESUMAR) Dra. Kátia Mosorov Alonso (UFMT) Apoio: Profa. Cláudia Regina Baptista – EaD Profa. Betisa Malaman – Comissão de Qualificação e Avaliação de Cursos Projeto gráfico: Prof. Alexandre Ponzetto Revisão: Lucas Ricardi Juliana Mendes Sumário Econometria APRESENTAÇÃO ......................................................................................................................................................7 INTRODUÇÃO ...........................................................................................................................................................8 Unidade I 1 A NATUREZA DA ECONOMETRIA E DOS DADOS ECONÔMICOS ................................................... 11 1.1 Fases da investigação econômica .................................................................................................. 12 1.2 Formulação da teoria ou hipótese ................................................................................................ 14 1.3 Especificação do modelo matemático do consumo .............................................................. 16 1.4 Especificação do modelo econométrico do consumo ........................................................... 19 1.5 Obtenção e preparação de dados .................................................................................................. 21 2 O MODELO DE REGRESSÃO LINEAR SIMPLES (MRLS) ...................................................................... 23 2.1 Estimativa do modelo econométrico ........................................................................................... 26 2.2 Método de estimação ......................................................................................................................... 29 2.3 Conceito de função de regressão populacional (FRP) e função de regressão amostral (FRA) .......................................................................................................................... 33 3 TESTE DE HIPÓTESES ...................................................................................................................................... 35 4 O GRAU DE AJUSTAMENTO DO MODELO: ANOVA (ANÁLISE DE VARIÂNCIA) ........................ 37 4.1 O coeficiente de determinação (r2) .............................................................................................. 39 4.2 Análise de resíduos .............................................................................................................................. 41 4.3 Previsão ou predição (utilização do modelo) ............................................................................ 46 4.4 Multiplicador keynesiano da renda .............................................................................................. 47 4.5 Uso do modelo para fins de elaboração de política econômica ....................................... 48 Unidade II 5 MODELO DE REGRESSÃO LINEAR MÚLTIPLA (MRLM) ...................................................................... 55 5.1 Hipóteses ................................................................................................................................................. 55 5.2 Covariância e coeficiente de correlação .................................................................................... 64 5.3 Teste de hipótese para um coeficiente de correlação populacional ............................... 66 5.4 Coeficiente de determinação (r2) ................................................................................................... 68 5.5 Erro-padrão do coeficiente linear (ou do intercepto) ........................................................... 73 5.6 Erro-padrão do coeficiente angular ............................................................................................. 74 5.7 Inferências sobre o coeficiente angular ...................................................................................... 74 5.8 Teste de hipótese .................................................................................................................................. 78 5.9 Intervalos de previsão ......................................................................................................................... 80 5.10 Anova (análise de variância) .......................................................................................................... 82 6 AVALIAÇÃO DO CONTEÚDO INFORMACIONAL DOS RESÍDUOS ................................................... 84 6.1 Avaliando a homocedasticidade ................................................................................................... 92 6.2 Avaliando a normalidade .................................................................................................................. 95 6.3 Intervalo de confiança para a regressão: duas alternativas ............................................... 99 6.4 Variação em torno de uma reta de regressão.........................................................................101 Unidade III 7 ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO E INFERÊNCIA .............................................107 7.1 Testes para identificação de multicolinearidade ...................................................................111 7.1.1 Teste de Farrar e Glauber ....................................................................................................................111 7.1.2 Teste da VIF (Variance Inflation Factor) ....................................................................................... 112 7.1.3 Teste da Tolerance (TLk) .......................................................................................................................113 8 DEMAIS ANÁLISES EM ECONOMETRIA .................................................................................................1148.1 Quebras Estruturais e Variáveis Dummies ................................................................................114 8.2 Variáveis defasadas ............................................................................................................................136 8.3 Variáveis instrumentais ....................................................................................................................144 8.4 O básico da análise de regressão com dados de séries temporais ou previsão de séries temporais .................................................................................................................155 7 APRESENTAÇÃO Esta disciplina desenvolve o instrumental padrão para a estimação de modelos econométricos, enfocando a aplicação de modelos de regressão linear múltipla e seus pressupostos básicos. Nesse sentido, derivam-se os estimadores por mínimos quadrados ordinários e discutem-se todas as propriedades inferenciais de tais modelos. A construção de modelos é comumente utilizada em Econometria, e a sua correta interpretação é fundamental para o bom entendimento da disciplina e da formação profissional do economista. Como existem muitos modelos utilizados na ciência econômica, é necessário saber fazer, também, a distinção entre os diversos modelos. Apresentaremos conceitos básicos para o entendimento da abordagem teórico-prática e das técnicas envolvidas na construção de modelos, sua especificação, estimação, verificação e previsão, pois o trabalho econométrico necessita da Teoria Econômica como guia para determinar a direção mais relevante e proveitosa na elaboração do modelo. Serão apresentados métodos de estimação que permitam expressar a Teoria Econômica a partir de dados estatísticos e de uma metodologia que aponte como aplicar os métodos de estimação aos dados estatísticos, permitindo ao aluno definir um bom modelo e como encontrá-lo. Interpretar modelos estruturados será um dos nossos objetivos. Iremos compreender de forma completa ou parcial um determinado fenômeno; perceber como os processos operam para gerar padrões observáveis; e desenvolver simulações que examinem mudanças ao longo do tempo sobre conjecturas específicas. Nesse enfoque, estamos interessados em discutir sobre a natureza e as fontes de dados disponíveis para análise econométrica a fim de que o aluno obtenha dos dados a maior quantidade possível de informação e seja capaz de indicar possíveis modelos a serem utilizados. Realizaremos uma discussão mais extensa sobre as hipóteses do modelo-base da Econometria (modelo clássico de regressão linear), enfatizando não só a utilização de dados da economia brasileira em estudos e pesquisa, como também a interpretação de resultados obtidos a partir dos métodos e das técnicas expostos, estimulando a aplicação teórica e prática, com o objetivo de complementar a base teórica adquirida nas demais disciplinas do curso. Em um segundo momento, estudaremos como detectar a presença e estimar tais modelos com multicolinearidade, heterocedasticidade, autocorrelação serial e erros de especificação. Os exercícios resolvidos irão procurar mostrar, em detalhes, como os cálculos são desenvolvidos. Isso será feito envolvendo a discussão dos pressupostos básicos que dão validade aos parâmetros estimados dos modelos e os testes mais comuns usados para verificar a violação de cada um desses pressupostos. Por fim, destacaremos algumas outras técnicas de estimação que possibilitem, em contextos específicos, melhorar a significância do modelo básico. 8 Apresentaremos a regressão com as variáveis dependentes binárias (ou dummies). Serão expostas a possibilidade de explorar modelos com variáveis qualitativas e as tratativas dos problemas de formulação, estimação e testes de modelos com variáveis defasadas e instrumentais. A ideia geral é a de apresentar as ferramentas de regressão aos alunos e, através de análises teórico-empíricas, aprender a utilizá-las como uma importante técnica de análise econômica para estimar relações entre variáveis que possibilitem o equacionamento do comportamento em período passado da relação entre as variáveis estudadas. O objetivo é fornecer previsões com alto nível de rigor e sistematização na tentativa de antecipação do futuro, a partir de construção e análise de cenários, gestão de políticas públicas e ações sociais que mudem resultados. INTRODUÇÃO A Teoria Econômica se preocupa com relações entre variáveis, e a Econometria é um tipo especial de análise econômica na qual a abordagem teórica é combinada com formulações matemáticas, procedimentos estatísticos e mensuração empírica dos fenômenos econômicos por meio de análise de uma base de dados. Podemos dizer que a Econometria é aquele ramo da ciência econômica que trata de quantificar, isto é, de representar numericamente as relações econômicas, o que se realiza mediante uma combinação adequada da Teoria Econômica, da Matemática e da Estatística. Nas últimas décadas, o levantamento de dados, a lógica e o raciocínio subjacentes à análise de dados firmaram-se como um instrumental da pesquisa sociológica, em especial econômica – o raciocínio que empresta apoio à operação analítica. Inflação, desemprego, consumo, narcotráfico, violência, imigração etc.; vivemos em cidades de cifras, solicitados a diagnosticar, a mensurar a verdadeira dimensão, o quantum de tudo isso, e a garantir suas decisões. Muitas vezes deparamos com decisões no mundo profissional difíceis de serem tomadas e das quais as consequências são importantes, e os resultados, incertos. Conforme escreve o Dr. Morris Rosenberg (1976, p. 13), “importa que os dados sejam bons, mas igualmente importante é o que se irá fazer com eles”. O que vamos tratar nesta disciplina envolve o estudo e a aplicação de métodos e técnicas econométricas e sua metodologia e aplicações: mostrar a viabilidade prática e teórica de construção de modelos de previsão, com base em técnicas econométricas. Vamos tratar de modelos como estrutura analítica construída de forma simplificada, já que são apenas representações esquemáticas e aproximadas da economia real. Analisaremos, de forma integrada, como cada abordagem trata a questão do antes (relação teoria-modelo, escolha de especificações, análise exploratória dos dados e temas correlatos), do durante (técnicas econométricas, data mining e outros tópicos) e do depois da aplicação das técnicas econométricas (interpretação dos modelos, apresentação e implicações para a formulação de políticas buscando o menor erro possível e permitindo o julgamento da necessidade ou não de medidas corretivas). 9 Regressão é uma importante técnica para medir ou estimar relações entre variáveis econômicas. Ela se ocupa do estudo da dependência de uma variável em relação a uma ou mais variáveis explicativas utilizadas pelos economistas para fins de análise estrutural (verificação de teorias econômicas), avaliação de políticas econômicas e previsão de valores futuros de variáveis de natureza econômica. Este estudo consiste na construção e análise de uma relação matemática entre as variáveis, no geral, uma variável em função das outras. Vamos elaborar análise de variáveis de natureza macroeconômica (consumo, produto, taxa de emprego) e de natureza financeira (retorno de ações, taxas de câmbio), porém com características diferentes. As observações das séries temporais de natureza macroeconômica são geralmente mensais, trimestrais ou anuais, e as de natureza financeira são dotadas de uma frequência muito superior: normalmente, trabalha-se com dados diários ou mesmo intervalos de horas ou minutos entre duas observações consecutivas – os chamados dados de alta frequência, voláteis (por exemplo: índices diários da Bolsa de Valores de São Paulo – Ibovespa). Os dados macroeconômicos estão sujeitos a erros de medição, apurados de acordo com certa metodologia e decorrentes de investigações preliminares; já os dados financeiros resultam de valores efetivamenteobservados no mercado. Ao contrário das séries macroeconômicas, as séries financeiras exibem habitualmente fortes efeitos não lineares e distribuições não normais. Os modelos utilizados para descrever séries temporais (conjunto de observações ordenadas no tempo) são processos estocásticos, isto é, processos controlados por leis probabilísticas. Então, imagine você, economista, ampliando seu potencial e suas habilidades, aprendendo a expandir seus limites, sendo capaz de testar as proposições teóricas, de explicar o comportamento de variáveis já observadas e/ou prever comportamentos ainda não observados. Isto é: • medir variáveis e agregados econômicos; • estimar parâmetros de relações econômicas; • formular testes de hipóteses sobre situações reais; • prever valores de variáveis econômicas. Portanto, o instrumental econométrico pode ser utilizado no estudo de qualquer fenômeno, desde que se consiga expressar as formulações teóricas em bases matemáticas e existam dados amostrais suficientes para a criação de um modelo. Observação Enfatizamos que as ferramentas e seu nível de aplicação são relevantes para solucionar muitos problemas práticos do mundo atual. 11 ECONOMETRIA Unidade I 1 A NATUREZA DA ECONOMETRIA E DOS DADOS ECONÔMICOS A investigação econométrica se iniciou com a análise da demanda – Teoria de Cournot (1838) – e os famosos Princípios de Marshall (1890). Mas também a Tinbergen (1939) se deve o desenvolvimento dos modelos macroeconômicos multiequacionais inspirados na contabilidade nacional. Em 1930, funda-se a Econometric Society, cuja necessidade já vinha sendo notada desde 1912. O apogeu do método é atingido em 1950, quando a Cowles Comission publica a Statistical Inference in Dynamic Economic Models. A hipótese básica desse trabalho é a de que os dados econômicos se geram por sistemas de relações que são, em geral, estocásticos, dinâmicos e simultâneos. Portanto, dois fatos favoreceram aquelas primeiras análises empíricas: de um lado, a existência de uma teoria bem-estruturada; de outro, a possibilidade de obter facilmente dados estatísticos sobre preços e quantidades. Tão importante quanto estudar métodos e técnicas econométricas é estudar sua metodologia e aplicações de acordo com cinco paradigmas diferentes: • a chamada abordagem “clássica” ou da Comissão Cowles, nos anos 1950-60; • a abordagem “inglesa” ou da London School of Economics, nos anos 1970-80; • a abordagem VAR, nos anos 1980; • a abordagem da calibragem, nos anos 1990; • a microeconometria e os experimentos quase naturais, que ganharam crescente notoriedade, sobretudo na avaliação de políticas públicas e nos estudos do mercado de trabalho. A Matemática ensina a maneira de deduzir proposições de outros dados (coincide com a lógica dedutiva); já a Estatística instrui o modo de obter proposições dos fatos observados (coincide com a lógica indutiva). A missão do econômetra é exprimir as teorias econômicas em termos matemáticos para verificá-las por métodos estatísticos e para medir o impacto de uma variável sobre outra, assim como para poder prever os sucessos futuros ou aconselhar a política econômica que se deve seguir quando se deseja um resultado determinado. 12 Unidade I 1.1 Fases da investigação econômica As fases da investigação econômica são: • formulação de hipótese e teorias; • verificação dessas hipóteses e teorias. A primeira fase corresponde à Teoria Econômica e a segunda constitui a Econometria (construção de modelos, sua especificação, estimação, verificação e previsão). A Teoria Econômica não fornece qualquer medida numérica da relação entre variáveis. Desse modo, a análise de regressão é a técnica básica para medir ou estimar relações entre variáveis. O objetivo é testar proposições teóricas nessas relações, procurando isolar, desagregar efeitos de relações de causalidades e estimar parâmetros envolvidos na construção de modelos econométricos. De acordo com Hoover (2006), a Econometria tem quatro funções: • Testar implicações de uma teoria através da correta tradução desta em proposições testáveis a partir de modelagem econométrica. • Calibrar parâmetros de um modelo para mensurar parâmetros de um modelo já definido de uma relação proposta pela Teoria Econômica (por exemplo, calcular a elasticidade-renda de uma função consumo). • Prever, já que a Econometria pode ser usada para prever uma relação ou mesmo os valores de uma variável de interesse – lembrando que a Teoria Econômica é que permite qualificar e explicar uma previsão. • Caracterizar relações e fenômenos, pois a Econometria possibilita permitir uma visualização dos dados de forma a revelar relações e fenômenos que às vezes não estão previstos nas teorias, pois elas são continuamente testadas e se desenvolvem por meio da observação. Esta técnica de modelagem utilizada para analisar a relação entre uma variável dependente (Y) e uma ou mais variáveis independentes (X 1, X2, X3, ..., Xn) tem como objetivo estimar uma função que descreve, o mais próximo possível, a relação entre essas variáveis. É assim que poderemos predizer o valor que a variável dependente (Y) irá assumir para um determinado valor da variável independente X. O modelo estimado deve satisfazer os objetivos de explicar e/ou prever o comportamento das variáveis envolvidas nessa análise. As propriedades desejáveis de um modelo estimado são: • relevância; • simplicidade; 13 ECONOMETRIA • plausibilidade teórica; • precisão dos coeficientes; • capacidade explicativa; • capacidade preditiva. Antes de pensar em um modelo de previsão caracterizado por regressão linear, é conveniente chamar a atenção para o seu processo de concepção (procedimento prévio a ser seguido). Uma sugestão encontra-se ilustrada a seguir: Teoria econômica Modelo matemático Modelo econométrico Tabulação dos dados Estimação dos parâmetros do modelo Avaliação do modelo (Critério: estatístico, econométrico e econômico) Avaliação da teoria (se compátivel com os dados) Compatível: aceita o modelo/Não compatível: rejeita o modelo Figura 1 – Metodologia de pesquisa econométrica Os passos para a elaboração de um modelo econométrico são (GUJARATI, 2000): • formulação ou teoria da hipótese; • especificação do modelo matemático da teoria; 14 Unidade I • especificação do modelo econométrico da teoria; • obtenção e preparação de dados; • estimativa dos parâmetros do modelo econométrico; • teste de hipótese; • previsão ou predição; • utilização do modelo para fins de controle ou política. No exemplo a seguir, faremos um passo a passo utilizando o modelo de regressão linear simples (MRLS) tendo como suporte a Teoria Keynesiana de Consumo. 1.2 Formulação da teoria ou hipótese O consumo das famílias é o componente mais importante do Produto Interno Bruto (PIB) de uma economia, e sua dinâmica é fundamental para entender as alterações tanto em períodos de boom como de crises. De acordo com a Penn World Table Version 7.0 (KNOEMA, [s.d.]), o consumo representa 70% do PIB de todos os 190 países pesquisados. Com o intuito de verificar o nível de dependência entre elas, coletamos os dados da economia brasileira, a preços constantes de 1995, no período de 1996 a 2014 (veja a tabela mais adiante) e estimamos o modelo de regressão linear simples (MRLS), relacionando os resultados com a função keynesiana e de Milton Friedman. De acordo com a Teoria Keynesiana (modelo simples de dois setores: economia fechada e sem governo), numa economia muito simples, sem governo e sem setor externo, isto é, sem transações com o exterior, a renda nacional (Y) será destinada apenas ao consumo das famílias (C) e à poupança (S), já que, não havendo governo, não há impostos. Já a respeito da função consumo, seguindo o raciocínio de Keynes, parece razoável afirmar que o principal determinante do consumo é a renda disponível (Yd), isto é, o montante de que as pessoas dispõem para gastar. Como não existe governo nesta economia, não há impostosnem transferências governamentais e, portanto, a renda disponível (Yd) é igual, por definição, à renda nacional (Y). Assim, se a renda crescer ou se reduzir, o mesmo ocorrerá com o consumo, mas não necessariamente no mesmo montante (o aumento da renda eleva o consumo, mas não em proporção igual ao aumento dessa renda). A função consumo mostra a relação existente entre o nível das despesas de consumo e o nível da renda disponível. Empiricamente, descobriu-se que o consumo corresponde a uma proporção estável da renda (veja a figura a seguir, criada a partir de dados do IBGE). 15 ECONOMETRIA 1996 0 50 100 150 200 250 300 350 Renda Consumo R$ b ilh õe s 19981997 1999 2000 2002 2004 2006 2008 2010 20122001 2003 2005 2007 2009 2011 2013 2014 Ano Figura 2 – Renda e consumo no Brasil (período entre 1996 e 2014) Será que podemos afirmar que o valor total do consumo é determinado somente pela renda disponível corrente? Como explicar que pessoas desempregadas, que não dispõem de renda, consomem um mínimo que seja? Olhando no agregado, percebe-se que uma parte do consumo total independe do nível de renda (ou pelo menos do nível de renda corrente). Nesse contexto, podemos definir a função consumo como: C = α + βYd Onde: α = parte autônoma do consumo, isto é, a parcela que não depende da renda (são os que não são relacionados ao nível de renda, como, no modelo keynesiano, o investimento, os gastos do governo e a exportação); β = fração da renda que é gasta, isto é, consumo induzido (questão de padrão de vida). Essa parcela de renda que é gasta (β), denominada de propensão marginal a comsumir (PMgC), foi um dos mais importantes conceitos introduzidos por Keynes. O termo “marginal” em economia, que neste caso representa o adicional de consumo em função de um aumento na renda, expressa a ideia de um “extra” qualquer decorrente de um acréscimo qualquer ocorrido em uma variável. Analisando tecnicamente, a propensão marginal a consumir (PMgC) representa a razão entre a variação no consumo (∆C) decorrente de uma variação na renda disponível (∆Yd) e essa variação na renda. Assim: d C PMgC Y ∆ = β = ∆ A propensão marginal a consumir (PMgC) ou taxa de variação do consumo é maior que zero e menor que um ⇔ 0 < PMgC < 1, que expressa o comportamento dos agentes de uma determinada economia em relação à renda obtida – quanto mais propensos estes forem a consumir, maior será o valor da PMgC. 16 Unidade I Por exemplo, numa economia em que seus agentes estão dispostos a comprometer 75% da sua renda com o consumo, a PMgC é igual a 0,75. Em decorrência, a propensão marginal a poupar (PMgS) representa a parcela da renda dos agentes econômicos de uma determinada economia no qual estes se comprometem a poupar, isto é, a não gastar (PMgC é 0,75 + PMgS é 0,25 = 100% da renda). O coeficiente β é denominado propensão marginal a consumir (PMgC). Vem a ser o aumento do consumo a cada aumento unitário da renda. A propensão média a consumir (PMeC) é dada pela relação PMeC = C/Yd para diferentes níveis de renda. A PMeC decresce continuamente à medida que aumenta a renda, com o detalhe de que C aumenta menos do que proporcionalmente aos aumentos de Yd, pelo fato de β estar entre 0 e 1. Temos que: PMeC = C/Yd e PMgC = ∆C/∆Yd. Logo, C/ Yd = α / Yd + β Yd / Yd. Daí, vem que: PMeC = α / Yd + PMgC, e conclui-se que PMe > PMg. Essa simples demonstração já foi solução para questões aparentemente complexas do modelo keynesiano simplificado. Observação Não devemos confundir o conceito de PMgC com um outro conceito semelhante, que é a propensão média de consumo (PMeC), considerada como a razão entre o consumo total e a renda disponível (PMeC = C/ Yd ou PMeC = (α + β Yd) / Yd). 1.3 Especificação do modelo matemático do consumo De modo simplificado, a seguinte expressão matemática representa a função de consumo keynesiana: Y = α + βX, 0 < β < 1 Onde: Y = despesa de consumo; X = renda. 17 ECONOMETRIA Aqui, α e β são conhecidos como parâmetros do modelo. São o intercepto (que representa o ponto em que a reta regressora corta o eixo dos ys, quando x = 0) e a declividade (que representa a inclinação da reta regressora e é chamada de coeficiente de regressão ou coeficiente angular). Além disso, temos que, para um aumento de uma unidade na variável x, o valor E(Y|x) aumenta unidades. O β mede a declividade e a PMgC. Geometricamente, a equação da função consumo com as três propriedades propostas por Keynes é mostrada na figura a seguir: • Primeira: a propensão marginal a consumir se situa entre 0 e 1. • Segunda: a propensão média a consumir cai quando a renda aumenta (PMeC declinante). • Terceira: o consumo é determinado pela renda corrente. Y = α + β X 0 < β < 1 Dispêndio em consumo Y Renda α X RendaConsumo 1 Inclinação = PMgC β = PMgC Figura 3 – Função consumo keynesiana Observação Simulação é o método de solução de problemas que se utiliza de modelos matemáticos numéricos/algorítmicos. Os modelos podem ser contínuos ou discretos: • Contínuos: as variáveis têm valores que variam continuamente ao longo do tempo de simulação. Equações fornecem o valor das variáveis em todos os instantes de tempo. Exemplos de modelos contínuos: reações químicas, circuitos eletrônicos, modelos econométricos. • Discretos: as variáveis são alteradas apenas em certos instantes de tempo. O comportamento do modelo é dado por um conjunto de regras que determinam o tempo do próximo evento e as alterações nos valores das variáveis. Exemplos de modelos discretos: controle de tráfego, sistemas de produção, sistemas telefônicos, sistemas operacionais etc. 18 Unidade I Diferença entre modelos determinísticos e estocásticos: • Determinísticos (matemáticos): são totalmente previsíveis, predeterminados em função dos dados de entrada. Cada elemento do domínio (x) se associa apenas com um elemento da imagem (Y). Ou seja, em uma função Y = f(x) se para cada valor de x houver um valor de y. Conhecidos como modelos estritamente matemáticos. Exemplo: espaço percorrido por um automóvel a uma determinada velocidade constante num determinado espaço de tempo: E = V x T Onde: E = espaço (variável de saída); V = velocidade constante (variável de entrada); T = tempo decorrido do deslocamento do automóvel (variável de entrada). X1 X2 X3 Y X Figura 4 – Modelo determinístico (matemático) • Estocásticos (econométricos): contingenciais, não dependem somente dos dados de entrada, mas também de outros fatores, normalmente aleatórios. Há uma indeterminação quanto à predição de eventos futuros descrita por distribuições de probabilidade. Para cada valor do domínio (x) existe uma distribuição de probabilidade total dos valores da imagem (Y). Assim, para cada valor de X a variável Y pode assumir um intervalo específico. A análise estocástica começa pela identificação da função de distribuição de probabilística que melhor se ajusta ao elemento-base em estudo. Exemplos: uma lâmpada nova é ligada, e conta-se o tempo gasto até queimar; em uma linha de produção, peças são fabricadas em série, e conta-se o número de peças defeituosas produzidas num período contínuo de 24 horas; reação das pessoas em situação de emergência. O modelo probabilístico tenta descrever o comportamento “aleatório” das entidades. 19 ECONOMETRIA X1 X2 X3 Y X Figura 5 – Modelo estocástico (econométrico) 1.4 Especificação do modelo econométrico do consumo Espera-se que o modelo estabeleça relações entre variáveis. Trataremos de dados exclusivamente com relações estocásticas. Portanto, o modelo econométrico de interesse da função consumo não pode ser puramente matemático, pressupondo que a relação entre as variáveis (consumo e renda) seja determinística ou exata. As relações sociais e de conteúdo econômico no contexto geral não são exatas; elas absorvem um conceito complexo que trata de um conjunto de interações que se ligam com relacionamentos de conteúdo jurídico, político,ético e ideológico, eminentemente sociais. Algumas dessas variáveis que influenciam a compra (consumo) podem ser retratadas através de quatro fatores: culturais, sociais, pessoais e psicológicos. Partimos da ideia de que as relações entre duas variáveis podem ser afetadas pela introdução de uma ou mais variáveis. Espera-se, com isso, que a compreensão dessa relação possa ser enriquecida e aprofundada. Assim, ao se examinar o alcance das significações possíveis dessas relações e estudar os fatores do porquê da existência dessas relações, as condições em que se manifestam as relações e os problemas que advêm das influências conjuntas, o propósito é o de explicar, especificar a relação, tornando-a mais significativa e/ou mais precisa. Caso se obtenha a amostra de 700 famílias, espera-se que o comportamento dos consumidores não seja linear, pois é caracterizado pelas atividades mentais e emocionais que ocorrem no momento da compra e do uso – ou seja, não se comportarão de forma exatamente linear e podem até seguir uma tendência, ditada pelos empresários, por meio de práticas de publicidade, sistemas de crédito, programas de expansão e constituição de monopólios e oligopólios, resultando, muitas vezes, em concentração do poder econômico. Em geral, definem-se para o modelo variáveis de entrada e variáveis de saída, que espelham as interações do sistema com o Universo (veja a figura a seguir). O que se necessita ao elaborar um modelo é descobrir princípios gerais que proporcione conhecimentos úteis da realidade econômica. 20 Unidade I Sistema econômicoEntradas Saídas Figura 6 – Sistema econômico Espera-se que o modelo estabeleça relações entre essas variáveis. Para essa classe de sistema (função de consumo keynesiana), é conveniente o seguinte modelo: YiVariáveis de entrada Xi Variáveis de saída Modelo econométrico Figura 7 – Modelo econométrico Estamos criando um modelo toda vez que tentamos explicar um conjunto complexo de comportamentos, fenômenos e resultados empregando algumas variáveis explicativas e estabelecendo relações entre elas. Os modelos não visam captar toda a complexidade dos comportamentos, eles são criados para retirar os fatores do acaso e da idiossincrasia (característica comportamental peculiar), de tal forma que o foco recaia sobre os princípios gerais desenvolvidos. Assim, um modelo econômico pode ser definido como uma expressão matemática de uma determinada teoria econômica. Para transformar relações inexatas (socioeconômicas), o econometrista modifica a função consumo. Veja o modelo: Y = α + βX + e, 0 < β < 1 Onde: Y = despesa de consumo; X = renda. Aqui, α e β são conhecidos como parâmetros do modelo; são o intercepto e a declividade. 21 ECONOMETRIA Por sua vez, e é o termo de perturbação e pode representar todos os fatores que afetam o consumo, mas que não são considerados explicitamente (podem assumir valores positivos ou negativos, também conhecidos como termo de erro estocástico ou perturbação estocástica). A equação anterior é um exemplo de modelo econométrico (de regressão linear simples). O modelo é representado na figura a seguir: Desvios positivos (+) Desvios negativos (-) Modelo: Y = α + βX + e (reta ajustada) + + + + – – – – e Renda X Consumo Y Desvios Figura 8 – Modelo econométrico da função consumo keynesiana Em resumo, o modelo aceita que o consumo se relaciona linearmente com a renda, mas a relação entre ambos não é exata, estando sujeita a variação individual. Observação É essa teoria (keynesiana) que, em geral, nos diz qual variável é causa e qual variável é efeito. 1.5 Obtenção e preparação de dados A Econometria enfoca problemas inerentes à coleta e à análise de dados econômicos não experimentais, também chamados de dados observacionais, os quais não são acumulados por meio de experimentos controlados de indivíduos, firmas ou segmentos da economia. Para obter os valores numéricos, precisamos de dados. Os dados se referem a vários indivíduos? Ou eles se referem a um mesmo país, mas em diversos espaços de tempo? As respostas a essas questões são de extrema importância para a nossa análise econométrica. A estrutura dos dados econômicos utilizada em Econometria é basicamente de três tipos: • Séries temporais: conjunto de observações e valores que uma variável assume em diferentes momentos. É o conjunto de dados sequenciais observados de uma mesma variável ao longo do 22 Unidade I tempo (em intervalos de tempo). Exemplo: o consumo agregado no Brasil em diversos anos, os retornos diários da Bovespa ou a taxa de desemprego mensal. Os dados são assumidos como estacionários, a variância e a média não se alteram sistematicamente. • Dados de corte transversal (cross-section): dados de variáveis coletadas num mesmo instante de tempo (num único momento). Estudos transversais são apropriados para descrever características das populações no que diz respeito a determinadas variáveis, e os seus padrões de distribuição podem, também, ser utilizados para descrever associações entre variáveis. Exemplos: peso de indivíduos selecionados aleatoriamente e num determinado instante de tempo ou PIB dos países emergentes no primeiro trimestre de 2016. No exemplo dado, poderíamos observar o consumo e a renda de diversas famílias num mesmo mês ou também o consumo agregado e a renda agregada de diversos países num mesmo ano. Os dados apresentam problemas da heterogeneidade (alguns são grandes demais e outros são pequenos demais). • Dados em painel: consiste na observação de n entidades para dois ou mais períodos de tempo. Combina características de séries temporais com dados em corte transversal permitindo o controle da heterogeneidade presente nos elementos e são amplamente utilizados em estudos econométricos e nas ciências sociais aplicadas. Há dados combinados, tanto de séries temporais como de corte, em que temos uma série de tempo para cada unidade de corte transversal. Exemplos: consumo agregado dos diversos estados brasileiros ao longo de vários anos, taxa de desemprego semestral dos países da América Latina ou PIB trimestral dos municípios do estado de São Paulo nos últimos 15 anos. Observação É importante observar que dados que tomamos como certo serem de “corte transversal” podem apresentar uma interessante dependência entre si quando observados com mais cuidado. Um exemplo são as notas de prova de uma turma. Se os dados forem apresentados em ordem alfabética ou por ordem dos assentos na sala, este último fará sugerir autocorrelação positiva (notas altas estavam próximas de notas altas, e notas baixas, de notas baixas, evidenciando que houve muita cola durante a prova). Na análise de regressão, as ideias de causação na relação entre variáveis (X e Y) devem se originar fora da Estatística, em última análise, em alguma teoria. Por exemplo, no nosso caso em estudo, a Teoria Econômica aponta que o consumo depende da renda, e não o contrário. Portanto, devemos estar atentos que correlação não implica relação causal entre variáveis, e simplesmente lembre que correlação é diferente de causação (correlação não implica causação). Nesta fase inicial, que permite conhecer as caraterísticas das informações, devemos selecionar os principais indicadores para mostrar as principais medidas estatísticas dessa amostra. Além de utilizar esses dados, é necessário elaborar um box plot, gráfico que permite a visualização de como esses dados estão distribuídos na amostra. Isso torna possível perceber se há a presença de outliers, o que gera uma maior segurança para a construção dos modelos de regressão. 23 ECONOMETRIA Observação O sucesso de qualquer análise econométrica depende basicamente da disponibilidade de dados apropriados. Dando início ao trabalho de criação do modelo, a primeira etapa consiste em analisar a matriz de correlação das variáveis. Nessa matriz, observa-se entre todas as variáveis independentes selecionadas a que possui a maior correlação coma variável dependente. Essa variável de maior correlação com a variável a ser explicada (Y) é que deverá ser selecionada para a construção da equação de regressão usando apenas uma variável independente. Saiba mais Sobre um instrumento fundamental da pesquisa econômica relacionada ao planejamento e à coleta de dados de uma lógica – o raciocínio que empresta apoio ao processo analítico –, leia a obra: ROSENBERG, M. A lógica da análise do levantamento de dados. São Paulo: Cultrix/Edusp, 1976. 2 O MODELO DE REGRESSÃO LINEAR SIMPLES (MRLS) No exemplo a seguir, vamos utilizar dados mensurados no tempo (séries de tempo ou time series). A ideia é construir um modelo de regressão para o período anual de 1996 a 2014 do Brasil relacionando duas variáveis: renda (X) e consumo (Y). Com base na tabela a seguir, elaborada a partir de diversos dados apresentados pela Coordenação de Contas Nacionais da Diretoria de Pesquisas do IBGE, construímos um diagrama de dispersão entre as variáveis renda (X) e despesa de consumo (Y): Tabela 1 – Despesas de consumo pessoal (Y) e produto interno bruto (X) de 1996 a 2014 (em bilhões de reais de 1995) Abrangência: Brasil | Unidade: R$ bilhões Valores constantes de 1995 X Y Ano Renda Consumo 1 1996 180,4 116,1 2 1997 186,5 119,6 3 1998 187,2 118,7 24 Unidade I Abrangência: Brasil | Unidade: R$ bilhões Valores constantes de 1995 X Y Ano Renda Consumo 4 1999 188,0 119,2 5 2000 196,3 124,0 6 2001 199,0 125,0 7 2002 205,1 126,6 8 2003 207,4 125,9 9 2004 219,4 130,8 10 2005 226,4 136,6 11 2006 235,4 143,9 12 2007 249,6 153,0 13 2008 262,4 162,9 14 2009 262,0 170,2 15 2010 281,8 180,8 16 2011 292,8 189,4 17 2012 298,4 196,0 18 2013 307,4 202,8 19 2014 307,7 205,5 4.493,20 2.847,00 A variável Y corresponde às despesas de consumo das famílias agregado (isto é, para a economia em geral), e a variável X, ao produto interno bruto (PIB) (um indicador de renda agregada), ambos medidos em bilhões de reais a preços constantes de 1995. 150 200 250 300 350 100 120 140 160 180 200 220 De sp es a de c on su m o - R$ (b ilh õe s) Renda - R$ (bilhões) Figura 9 – Renda e despesa de consumo no Brasil de 1996 a 2014 O que se espera é que os gastos de consumo estejam diretamente relacionados com seus rendimentos. Os dados estão apresentados no gráfico anterior, o que supõe, de modo razoável, a existência de uma “relação linear” entre essas duas variáveis. 25 ECONOMETRIA Com base no diagrama de dispersão, temos uma interpretação subjetiva da existência de correlação entre duas variáveis, mas, pelo cálculo do coeficiente de correlação (r), temos uma maneira mais precisa de mensuração, conforme fórmula a seguir: ( ) ( )2 22 2 n xy x y r 1 r 1 n x x n y y − = − ≤ ≤ + − − ∑ ∑ ∑ ∑ ∑ ∑ ∑ O intervalo de variação do coeficiente de correlação varia de -1 a 1. Se x e y tiverem forte correlação positiva, r estará próxima de 1. Se x e y tiverem forte correlação negativa, r estará próximo de -1. Se não existir correlação linear ou, ainda, se a correlação linear for fraca, r estará próximo de zero. Observação Uma distribuição de probabilidades dá uma descrição formal (matemática) dos valores possíveis da população que podem ser observados para a variável. Quando temos duas variáveis, a distribuição é denominada bivariada. A fx,y (x,y) descreve como os valores de X e Y se comportam conjuntamente. A distribuição normal bivariada é uma distribuição de probabilidades com uma função densidade de probabilidade f(x,y) para X e Y, tal que: • X e Y apresentam, cada uma, distribuição normal com médias µX e µY e variâncias σ 2 X e σ 2 Y, respectivamente; • o relacionamento entre X e Y é medido pela quantidade ρXY tal que -1 ≤ ρXY ≤ 1; • ρXY é o coeficiente de correlação entre as variáveis aleatórias X e Y e mede a associação linear entre elas. Onde: ρXY = 1 correlação positiva perfeita; ρXY = 0 correlação nula; ρXY = -1 correlação negativa perfeita. Com os dados observados (xi, yi), desejamos quantificar o grau de associação. Para isso estimamos ρXY. Para facilitar o cálculo do coeficiente de correlação estimado (r), podemos utilizar uma tabela, com base em dados do IBGE: 26 Unidade I Tabela 2 – Renda (X) e consumo (Y) Abrangência: Brasil | Unidade: R$ bilhões Valores constantes de 1995 X Y X2 Y2 XY Ano Renda Consumo Renda2 1 1996 180,4 116,1 32.544 13.479 20.944 2 1997 186,5 119,6 34.782 14.304 22.305 3 1998 187,2 118,7 35.044 14.090 22.221 4 1999 188,0 119,2 35.344 14.209 22.410 5 2000 196,3 124,0 38.534 15.376 24.341 6 2001 199,0 125,0 39.601 15.625 24.875 7 2002 205,1 126,6 42.066 16.028 25.966 8 2003 207,4 125,9 43.015 15.851 26.112 9 2004 219,4 130,8 48.136 17.109 28.698 10 2005 226,4 136,6 51.257 18.660 30.926 11 2006 235,4 143,9 55.413 20.707 33.874 12 2007 249,6 153,0 62.300 23.409 38.189 13 2008 262,4 162,9 68.854 26.536 42.754 14 2009 262,0 170,2 68.644 28.968 44.592 15 2010 281,8 180,8 79.411 32.689 50.949 16 2011 292,8 189,4 85.732 35.872 55.456 17 2012 298,4 196,0 89.043 38.416 58.486 18 2013 307,4 202,8 94.495 41.128 62.341 19 2014 307,7 205,5 94.679 42.230 63.232 ∑ 4.493,20 2.847,00 1.098.893,00 444.685,02 698.662,81 ( ) ( )2 22 2 n xy x y r n x x n y y − = − − ∑ ∑ ∑ ∑ ∑ ∑ ∑ ( ) ( )2 2 19 698.662,81 4.493,20 2.847,00 r 0,9907 19 1.098.893,80 4.493,20 19 444.685,02 2.847,00 × − × = ≅ × − × × − Existe uma forte correlação positiva entre renda (X) e consumo (Y). À medida que aumenta a renda, crescem também as despesas de consumo. 2.1 Estimativa do modelo econométrico A análise de regressão possibilita o desenvolvimento de um modelo para prever os valores de uma variável numérica com base no valor de outras variáveis. A variável que desejamos prever é chamada 27 ECONOMETRIA de variável dependente. As variáveis utilizadas para elaborar a previsão são chamadas de variáveis independentes. A análise de regressão também permite: identificar o tipo de relação matemática que existe entre uma variável dependente e uma variável independente; quantificar o efeito que alterações na variável independente exercem sobre a variável dependente; definir um valor adequado para os parâmetros do nosso modelo; avaliar as propriedades estatísticas dessas estimativas, bem como identificar observações incomuns. Como proposta da estimativa do modelo econométrico com base na função consumo, vamos discorrer sobre o modelo clássico, que é o da regressão linear simples. Com os dados da tabela, utilizamos o modelo de regressão linear simples (MRLS), na qual uma única variável independente numérica (X: renda) é utilizada para prever a variável dependente numérica (Y: consumo). O modelo geralmente é escrito da seguinte forma: Yi = α + βXi + ei A variável dependente é Y (causada ou explicada) e a variável independente é X (explicativa), no sentido de que esperamos que x explique y. Os parâmetros do modelo são α e β. Esses parâmetros são desconhecidos e teremos que estimá-los. O subíndice i é utilizado para denotar as várias observações que temos (para uma amostra de tamanho N, os valores de i variam de 1 a N observações) a fim de definir os parâmetros do modelo, que são os mesmos para estimar e/ou prever todas as observações. Para estimarmos os parâmetros desconhecidos do nosso modelo em questão, precisamos elaborar algumas hipóteses. São elas: • Linearidade: Yi = α + βXi + ei Significa dizer que não podemos utilizar modelos da forma Yi = α + Xi β + ei. • Exogeneidade: E[ei | xi] = 0 É a exigência de que o erro e a variável explicativa sejam não correlacionados. • Homocedasticidade: Var[ei | xi] = E[ei 2 | xi] = σ 2 A variância do erro é constante. 28 Unidade I • Não autocorrelação dos erros: Cov[ei, xj | xi, xj] = E[ei, xj | xi, xj] = 0. O erro de uma observação não pode estar correlacionado com o erro de outra observação. Portanto, a covariância é igual a zero (o resultado em qualquer experimento não tem efeito no termo do erro de qualquer outroexperimento). Eles devem ser independentes. Os dados são usados para estimar α e β, isto é, ajustar o modelo aos dados, para: • quantificar a relação entre Y e X; • usar a relação para predizer uma nova resposta Y0 para um dado valor de X0 (não incluído no estudo); • calibração: — capacidade de predição de novas observações; pode ser feita usando uma nova amostra e comparando os valores estimados com os observados. — dado um valor de Y0, para o qual o correspondente valor de X0 é desconhecido, estimar o valor de X0. Lembrete Quando falamos na hipótese de linearidade, estamos falando de linearidade dos parâmetros. Não importa se temos como variável X, ex ou log (X). O fundamental é que o parâmetro β esteja multiplicando qualquer uma dessas variáveis. Outra questão envolvendo as variáveis observadas são as unidades de medida. Quando multiplicamos os valores observados por uma constante k (exemplo: se a renda for medida em reais e depois quisermos medi-la em milhares de reais, bastará dividir os valores por 1.000. Neste caso, k = 1/1.000), temos que adotar as seguintes regras: Quadro 1 – Unidade de medidas das variáveis observadas Somente X multiplicado por k Somente Y multiplicado por k X e Y multiplicado por k α Não se altera Multiplique por k Multiplique por k β Divida por k Multiplique por k Não se altera r2 Não se altera 29 ECONOMETRIA Existem alguns fenômenos que podem ser representados por um modelo linear depois de sofrer alguma transformação de variáveis. A utilização do diagrama de dispersão pode nos auxiliar a decidir qual a melhor transformação indicada para cada fenômeno em estudo – portanto, estamos optando por regressão com variáveis transformadas. Exemplo: função exponencial ou semilogarítmica I: Y = a . bx (forma original, não linear) aplicando a transformação indicada ln Y = Ina + blnX (forma linearizada por transformação), tendo como restrições das variáveis na forma transformada Y>0 e X>0. 2.2 Método de estimação Seria desejável a existência de um método que levasse sempre a bons estimadores. Infelizmente, não existe esse método geral aplicável a todas as situações. Entre os principais métodos de estimação (o dos momentos, o da máxima verossimilhança e o dos mínimos quadrados), o mais utilizado é o estimador de mínimos quadrados ordinários (MMQO), que tem como objetivo minimizar a soma do quadrado dos erros. O critério dos mínimos quadrados é o seguinte: a “linha que melhor se ajusta” é aquela que minimiza a soma dos desvios quadrados dos pontos do diagrama dos pontos da linha reta (desvios estes que são medidos verticalmente). N 2 i i i 1 Minimizar (Y )Ŷ = −∑ Valores ajustados Linha dos mínimos quadrados Xi X Y Yi Ŷi Desvio: Yi - Ŷi Ŷ = a + bX Figura 10 – Linha dos mínimos quadrados: desvios Entre alguns métodos que existem para estimar os parâmetros a e b, o mais refinado é o método dos mínimos quadrados (MMQ), que consiste em tornar mínima a soma dos desvios em torno da reta estimada. Esse método encontra a reta que minimiza a distância vertical entre cada observação (ponto) e a própria reta. Designando-se por ei o desvio entre um valor observado yi e um valor ajustado ŷi, isto é, ei = (yi - ŷi), a e b são os valores que minimizam a soma de quadrados: 30 Unidade I ( ) [ ] n n2 2 i i i i i 1 i 1 Minimizar Y Y Y (aˆ bx ) = = − = − +∑ ∑ Com base nas fórmulas, podemos calcular, então, os coeficientes de regressão: xy xx S b S = y x a y bx b n n = − = −∑ ∑ em que calculamos: ∑xi = 4.493,20 ∑yi = 2.847,00 ∑xiyi = 698.662,81 ∑xi 2 = 1.098.893,80 ∑yi 2 = 444.685,02 ( ) ( )i i xy i i x y S x y n = − ∑ ∑∑ ( ) xy 4.493,20 2.847,00 S 698.662,81 25.392,26 19 × = − = ( )2i2 xx i x S x n = − ∑∑ ( )2 xx 4.493,20 S 1.098.893,80 36.322,95 19 = − = ( )2i2 yy i y S y n = − ∑∑ ( )2 yy 2.847,00 S 444.685,02 18.084,55 19 = − = 31 ECONOMETRIA ( )2 22 n xy x y 19 698.662,81 4.493,20 2.847,00 482.452,99 b 0,6991 690.135,9619 1.098.893,80 (4.493,20)n x x − × − × = = = ≅ × −− ∑ ∑ ∑ ∑ ∑ y x 2.847,00 4.493,20 a y bx b 0,6991 15,48 n n 19 19 = − = − = − × ≅ −∑ ∑ Portanto, a equação da reta de regressão é: ŷ = - 15,48 + 0,6991x Respeitando as hipóteses do modelo de regressão linear, o Teorema de Gauss-Markov aponta que os estimadores de mínimos quadrados são os melhores estimadores lineares não viesados (não viciados ou imparciais). Isso quer dizer o seguinte: • Os estimadores de MQO são não viesados, isto é, o valor esperado de cada estimador é igual ao parâmetro que se deseja estimar: E(b0) = β0 e E(b1) = β1. Não viciado ou imparcial é uma propriedade que assegura que, em média, o estimador é correto. • Estimadores que são funções lineares e não são viesados – ou seja, os estimadores MQO – são mais precisos (isto é, as suas distribuições amostrais têm a menor variância possível) do que quaisquer outros estimadores pertencentes à classe dos estimadores não tendenciosos. Porém, o teorema nada nos diz se o estimador de MQO é melhor do que um estimador não linear. Um caso especial em que o intercepto da reta é 0 (zero) passa pela origem, isto é, α = 0. A equação da reta se reduz a: Yi = βXi + ei O estimador para β (coeficiente angular da reta ou inclinação) expressa a taxa de mudança em Y, isto é, a mudança em Y quando ocorre a mudança de uma unidade em X. Ele indica a mudança na média da distribuição de probabilidade de Y por unidade de acréscimo em X: N i ii 1 N 2 ii 1 x y x = = β = ∑ ∑ Neste caso específico, devemos considerar: • O coeficiente de determinação (R2) não necessariamente é um valor entre 0 e 1, podendo ser negativo. 32 Unidade I • Não se confirma a conclusão de que R2 = Corr (X e Y)2. • Não se garante que a reta ajustada passe pelo ponto médio (X, Y). • O estimador de β será não viesado somente se α = 0. Veja as fórmulas a seguir: ( ) 2 N 2 ii 1 Var x = σ β = ∑ N 2 i2 i 1̂ˆ u N 1 =σ = − ∑ Podemos ter N i i 1 u 0 = ≠∑ . Portanto, estamos interessados na relação entre as duas variáveis (Y: consumo e X: renda). Observamos pares de valores X e Y em cada amostra e vamos usá-los para dizer alguma coisa sobre a relação: ŷ = - 15,48 + 0,6991x Nota-se que as estimativas dos parâmetros dão um conteúdo empírico para a função consumo. Dados observacionais: geralmente X e Y são variáveis aleatórias, e o acento circunflexo indica uma estimativa. Observação Estimador, também conhecido como uma estatística destinada a estimar um parâmetro da população, é simplesmente uma regra, fórmula ou método que nos diz como estimá-lo a partir de uma amostra. Dada uma amostra, o valor assumido pelo estimador é chamado de estimativa ou valor estimado do parâmetro. As estimativas obtidas por meio da estatística variam de acordo com a amostra selecionada. A diferença entre estatística e estimativa é que a estatística é uma variável aleatória, enquanto a estimativa é um particular valor dessa variável aleatória. 33 ECONOMETRIA 2.3 Conceito de função de regressão populacional (FRP) e função de regressão amostral (FRA) A função de regressão populacional (FRP) é a seguinte: E(Y/Xi) = f(Xi) A média condicional é uma função de Xi em que f(Xi) indica alguma função da variável explicativa Xi. Essa equação é conhecida como função de regressão populacional (FRP) (ou equação de regressão linear) de duas variáveis. Como uma primeira aproximação ou uma hipótese de trabalho, podemos supor que FRP E(Y/Xi) seja uma função linear de Xi, do tipo: E(Y/Xi) = β1 + β2Xi Onde: β1: intercepto; β2: coeficiente de inclinação. Especificação estocástica: Yi = β1 + β2Xi + ui Onde: ui é uma variável aleatória não observável que pode assumir valores positivos ou negativos, também conhecida como termo de erro estocástico ou perturbação estocástica. Já a função de regressão amostral (FRA), na maioria das situações práticas, é somente uma amostra de valores Y correspondentes e alguns Xs fixos. A nossa tarefa é estimar a FRP com base nas informaçõesda amostra. Analogamente à FRP, que fundamenta a reta de regressão da população, podemos desenvolver o conceito de função de regressão amostral (FRA) para representar a reta de regressão amostral. A amostra contrapartida da equação que acabamos de apresentar pode ser escrita como: Y Xi Ŷi = β̂1 + β̂2Xi Onde: Ŷi: estimador de E(Y/Xi); 34 Unidade I β̂1: estimador de β1; β̂2: estimador de β2. Podemos expressar a FRA por sua fórmula estocástica: Ŷi = β̂1 + β̂2Xi + ui Nosso objetivo na análise de regressão é estimar a função de regressão populacional (FRP): População (universo de análise) Yi = α + βXi + ei (FRP) Parâmetros: α, β Amostra (dados observados) Ŷi = α̂ + β̂Xi + ei (FRA) Estimados: α̂, β̂ Estimação de parâmetros Figura 11 – Estimadores e parâmetros Por essa estimativa, podemos ver que o coeficiente de declividade é de aproximadamente 0,70, o que sugere que um aumento de um real na renda real provocará em média um aumento de 0,70 centavos na despesa real de consumo. Dissemos em média porque a relação entre o consumo e renda é inexata, como mostra a reta de regressão. Veja a figura a seguir, conforme dados do IBGE: 150 200 250 300 350 100 120 140 160 180 200 220 De sp es a de c on su m o - R$ (b ilh õe s) Renda - R$ (bilhões) y = 0,6991x - 15,477 R2 = 0,9816 Figura 12 – Ajuste da reta: renda e despesa de consumo no Brasil de 1996 a 2014 35 ECONOMETRIA 3 TESTE DE HIPÓTESES É importante também aplicarmos o teste de hipóteses ao nosso modelo de regressão. Na hipótese nula, os valores de x não têm qualquer relacionamento com os valores de y. Veja: H0 : β = 0 H0 : β ≠ 0 (teste bilateral) A hipótese nula é confirmada pela equação Ŷi = a +bXi + ei quando se constata que não haverá qualquer relação entre x e y se o verdadeiro valor do coeficiente angular for zero. Como ( ) ( ) 2 i 2 i b t y y / (n 2) x x ˆ − β = − − − ∑ ∑ a equação tem distribuição t com n - 2 graus de liberdade. Decorre que, se β = 0, então a estatística será: ( ) ( ) 2 i 2 i b t y y / (n 2) x x ˆ = − − − ∑ ∑ Podemos calcular o valor dessa estatística. Portanto, a equação da reta de regressão é: ŷ = - 15,48 + 0,6991x Testamos a existência do efeito de regressão entre duas variáveis em estudo. A hipótese nula é de não existência de regressão, enquanto a hipótese alternativa é aquela que contempla a regressão. Assim, o teste de hipótese será delineado: 36 Unidade I Tabela 3 – Teste de hipótese (H0 : β = 0) Hipótese nula H0 : β = 0 Valor da estatística de teste ( ) ( ) obs 2 i 2 i b t y y / (n 2) x ˆ x = − − − ∑ ∑ Hipótese alternativa Intervalo de rejeição (nível α) H0 : β ≠ 0 tobs > tn - 2; α No teste para β, calculamos a região crítica (RC) ao nível de significância de 5%. Podemos calcular o valor dessa estatística conforme a tabela a seguir, baseada em números do IBGE: Tabela 4 – Renda, consumo e resíduo Renda Consumo Ano xi Yi Ŷi ei (Yi - Ŷi) 2 (Xi - X)2 1996 180,4 116,1 111 5,46 29,86 3145,44 1997 186,5 119,6 115 4,70 22,09 2498,42 1998 187,2 118,7 115 3,31 10,96 2428,93 1999 188,0 119,2 116 3,25 10,57 2350,72 2000 196,3 124,0 122 2,25 5,06 1614,77 2001 199,0 125,0 124 1,36 1,85 1405,07 2002 205,1 126,6 128 -1,30 1,70 984,97 2003 207,4 125,9 130 -3,61 13,03 845,89 2004 219,4 130,8 138 -7,10 50,40 291,87 2005 226,4 136,6 143 -6,19 38,35 101,69 2006 235,4 143,9 149 -5,18 26,88 1,18 2007 249,6 153,0 159 -6,01 36,13 172,02 2008 262,4 162,9 168 -5,06 25,59 671,63 2009 262,0 170,2 168 2,52 6,35 651,06 2010 281,8 180,8 182 -0,72 0,52 2053,52 2011 292,8 189,4 189 0,19 0,04 3171,47 2012 298,4 196,0 193 2,87 8,26 3833,56 2013 307,4 202,8 199 3,38 11,44 5029,05 2014 307,7 205,5 200 5,87 34,49 5071,69 ∑ 4.493,20 2.847,00 2.847,00 0,00 333,5904 36,322,9453 37 ECONOMETRIA ( ) ( ) 2 i 2 i b 0,6991 t 30,08 333,59 /17y y / (n 2) 36.322,95 x x ˆ = = ≅ − − − ∑ ∑ Para um teste bilateral no nível de significância de 5%, o valor crítico de uma distribuição t com 17 graus de liberdade é 2,11. Como 30 está na região de rejeição, bem acima do valor crítico, podemos rejeitar com segurança a hipótese nula de que o coeficiente angular seja zero. -2,11 0 Região de não rejeição ou aceitação Região de rejeição α 2 α 2 Valor crítico Valor crítico Região de rejeição +2,11 t Figura 13 – Região crítica para o teste t 4 O GRAU DE AJUSTAMENTO DO MODELO: ANOVA (ANÁLISE DE VARIÂNCIA) Vamos compreender os três tipos de variação em torno de uma reta de regressão. São eles: Tabela 5 – Tipos de variação em torno da reta Variação total = Variação explicada + Variação inexplicada ∑(yi - y) 2 = ∑(ŷi - y) 2 + ∑(yi - ŷi) 2 Soma do quadrado total = Soma do quadrado da regressão + Soma do quadrado do resíduo SQTot = SQReg + SQRes Syy = bSxy = b 2Sxx + Syy - bSxy = Syy - b 2Sxx • Variação total: é a soma dos quadrados das diferenças entre o valor y de cada par ordenado e a média de y. 38 Unidade I • Variação explicada: é a soma dos quadrados das diferenças entre cada valor previsto de y e a média de y (explicada pela relação X e Y). • Variação inexplicada: é a soma dos quadrados das diferenças entre cada valor de y de cada par ordenado e cada valor de y previsto correspondente (não pode ser explicada pela relação x e y, e isso ocorre devido ao acaso ou a outras variáveis). { {{Desvio totalyi - y y x (xi; y) (xi; yi) (xi; ŷi) y Desvio explicado ŷi - y x Desvio inexplicado yi - ŷi Figura 14 – Desvios para cada par de ponto (xi, yi) Uma propriedade importante é a de que a variabilidade total poderá ser decomposta em duas partes: • uma, devida aos possíveis efeitos aleatórios (não controlados) que recaiam sobre cada experimento, que será definida como variabilidade residual; • outra, a variabilidade atribuída ao efeito da regressão, se este realmente existir. Podemos conduzir a análise de variância da regressão linear simples conforme a tabela a seguir: Tabela 6 – Análise da variância Causas de variação Graus de liberdade Soma de quadrados Quadrados médios Regressão 1 b . Sxy = b 2 . Sxx b . Sxy = b 2 . Sxx Resíduo n - 2 Syy - b . Sxy = Syy - b 2 . Sxx 2 yy xy yy xxS b.S S b .S n 2 n 2 − − = − − Total n - 1 Syy Considerando o exemplo anterior, obtemos a seguinte tabela de análise de variância: 39 ECONOMETRIA Tabela 7 – Análise de variância Causas de variação Graus de liberdade Soma de quadrados Quadrados médios F Regressão 1 17.750,96 17.750,96 904,60 Resíduo 17 333,59 19,62 Total 18 18.084,55 Ao nível de significância de 5% e para 1 e 17 graus de liberdade, o valor crítico de F é 4,45 (veja a tabela da distribuição F de Fisher-Snedecor no AVA). O valor de F calculado, sendo superior ao valor crítico, é significativo ao nível de 5%. Consequentemente, rejeitamos a hipótese H0 : β = 0 em favor da hipótese alternativa H0 : β ≠ 0 a esse nível de significância. Saiba mais Um bom programa de análise de regressão para computador, além de calcular o valor de F, apresenta outros parâmetros de avaliação do modelo por meio do Microsoft Excel: em Opções do Excel, na barra Suplementos, instalar Ferramentas de Análise e consultar opções Dados, Análise de Dados e Regressão. Para saber mais sobre o uso de suas ferramentas, indicamos o livro: LEVINE, D. M. et al. Estatística: teoria e aplicações – usando Microsoft Excel em português. Tradução: Teresa Cristina Padilha de Souza. Rio de Janeiro: LTC, 2013. 4.1 O coeficiente de determinação (r2) O coeficiente de determinação r2 é a razão entre a variação explicada e a variação total. Portanto, r2 é uma medida descritiva da qualidade do ajustamento do modelo: ( ) ( ) ( )2 22egi2 xx 2 ot yyi SQRy y 0,6991 36.322,95b S r 0,9816 SQRT S 18.084,55 ˆ y y − × = = = = ≅ − ∑ ∑ Teremos uma relação de quanto o modelo de regressão está sendo útil para explicar toda a variabilidade que aparece em cada uma das observações (é a porcentagem da variância total de y que é explicada pela variávelx). Anteriormente calculamos o coeficiente de correlação (r). O quadrado desse coeficiente é o coeficiente de determinação (r2). Para um número fixo n de observações, quanto melhor for o ajuste dos dados, tanto maior será o valor de r2. Portanto, r2 pode ser visto como uma medida descritiva da qualidade do ajuste obtido. 40 Unidade I Observação Se o coeficiente de correlação é r = 0,9907, então o coeficiente de determinação r2 = (0,9907)2 ≅ 0,9815. Isso significa que 98,15% da variação de y podem ser explicados pela relação entre x e y. Os 1,85% (1 - 0,9815) restantes da variação são inexplicados e se devem ao acaso, a erros amostrais ou a outros fatores. Características do modelo de regressão linear simples (MRLS): • Yi é uma variável aleatória (Yi = α + β1 X1 + ei); • E(Yi) = E(α + β1 X1 + ei) = µi = α + β1 X1; • σ2(Yi) = σ 2 (α + β1 X1 + ei) = σ 2(ei) = σ 2 (variância constante); • Yi e Yj não são correlacionados. O modelo de regressão linear simples mostra que as respostas Yi são oriundas de uma distribuição de probabilidades com média E(Yi) = α + βXi e cujas variâncias são σ 2, a mesma para todos os valores de X. Além disso, quaisquer duas respostas Yi e Yj não são correlacionadas. Os parâmetros α e β não são variáveis aleatórias, são constantes desconhecidas. Entretanto, α̂ e β̂ são consideradas variáveis aleatórias, pois dependem da amostra considerada (em várias amostras populacionais poderemos ter diferentes valores para as estimativas dos parâmetros). Saber como esses estimadores se comportam (são ou não viesados) é importante, bem como saber as suas variâncias: ( ) 2 2 N 2 ii 1 Var N . Var(x)(x x) = σ σ β = = −∑ Observação A variância de β̂ diminui conforme aumenta a variância de X. ( ) ( ) 2 2Var x Var 82,08 18.715.790,1 0,000473 8.935 N σ α = + β ≅ + × ≅ 41 ECONOMETRIA As variações de α̂ e β̂ diminuem com o aumento do tamanho da amostra (se N tende ao infinito, as duas variâncias tendem a zero). Para procedermos aos cálculos das variâncias de α̂ e β̂ (estimadores de MQO), necessitamos de σ2 parâmetro, que nem sempre é conhecido. Mas, para estimá-lo, utilizaremos a seguinte fórmula: N 2 i2 i 1 (e ) 333,59 19,6229 N 2 17 =σ = = ≅ − ∑ O estimador é considerado não viesado de σ2 ao utilizarmos σ2 para calcular as variâncias de α̂ e β̂. Assim, teremos também estimadores não viesados. Var xi x N Var x xi N ( ) . ( ) , , ,b s s = -( ) = = @ =å 2 1 2 2 19 6229 19 191173 0 000544 ( ) ( ) 2 2Var x Var 1,03263 55.922,78 0,00054 31,24 N σ α = + β ≅ + × ≅ 4.2 Análise de resíduos Existem várias técnicas para analisarmos os resíduos, mas, nesta fase introdutória, iremos ressaltar uma representação gráfica que é obtida plotando os pares (xi, ei). Obtido o gráfico dos resíduos, precisamos saber como identificar possíveis causas que comprometem a confiabilidade do modelo. A situação ideal para os resíduos é estarem distribuídos aleatoriamente em torno do zero, sem nenhuma observação muito discrepante. A análise de resíduos nos permite: • descobrir se as hipóteses do modelo de regressão linear são válidas para o caso em questão; • analisar se a correlação entre as duas variáveis é ou não forte, na qual utilizamos a relação egSQR SQT ou es(1 SQR ) SQT − . Veja os dados a seguir, conforme apresentados pelo IBGE: 42 Unidade I Tabela 8 – Resíduos Ano xi Yi Ŷi ei 1996 180,4 116,1 111 5,46 1997 186,5 119,6 115 4,70 1998 187,2 118,7 115 3,31 1999 188,0 119,2 116 3,25 2000 196,3 124,0 122 2,25 2001 199,0 125,0 124 1,36 2002 205,1 126,6 128 -1,30 2003 207,4 125,9 130 -3,61 2004 219,4 130,8 138 -7,10 2005 226,4 136,6 143 -6,19 2006 235,4 143,9 149 -5,18 2007 249,6 153,0 159 -6,01 2008 262,4 162,9 168 -5,06 2009 262,0 170,2 168 2,52 2010 281,8 180,8 182 -0,72 2011 292,8 189,4 189 0,19 2012 298,4 196,0 193 2,87 2013 307,4 202,8 199 3,38 2014 307,7 205,5 200 5,87 ∑ 4.493,20 2.847,00 2.847,00 0,00 8,00 0,00 100 150 200 250 2009 y = 0,0026 x2 - 1,28x + 151,09 R2 = 0,76 2004 Renda Re sí du os 300 350 6,00 -2,00 4,00 -4,00 2,00 -6,00 -8,00 Figura 15 – Renda: plotagem de resíduos 43 ECONOMETRIA Analisando as hipóteses citadas anteriormente a serem cumpridas pelo modelo, destacamos, com base no comportamento dos resíduos (conforme o gráfico anterior), o pressuposto da homocedasticidade (variância do erro ser constante), que não está sendo cumprido. Tal procedimento é importante para se realizar inferências em relação aos parâmetros α e β. Havendo problemas na não confirmação da hipótese de homocedasticidade, podemos utilizar, por exemplo, as transformações de dados, isto é, utilizar uma segunda variável independente X2 no modelo assumindo os valores de X1 elevado ao quadrado. Ficaríamos, portanto, com um modelo Y = α + β1X1 + β2X2, onde X2 = (X1) 2, o que corresponde a uma função polinomial de ordem 2 representada pela equação Y = α + β1X1 + β2X1 2, conforme apresentado a seguir: α β1 β2 1996 - 2014 Yi = 135,61 - 0,5815.X1 + 0,0026.X1 2 R2=0,9957 Se = 2,21 (6,24) (-3,27) (7,22) R2ajustado=0,9951 (estatística t entre parênteses) F= 1.837,28 Apresentamos a seguir os gráficos dos resíduos do modelo atendendo o pressuposto da homocedesticidade (variância constante dos resíduos), conforme dados do IBGE. 100 20.000 0 0 -5 -5Renda Renda2 Renda plotagem de resíduos Renda2 plotagem de resíduos Re sí du os Re sí du os5 5 10 10 200 40.000300 60.000 80.000400 100.000 Figura 16 – Plotagem de resíduos Nota-se também, através do comportamento dos resíduos, que podemos desmembrar a base de dados em dois ciclos distintos (contração e expansão do consumo em relação à renda), conforme indicado nos gráficos a seguir. Através do gráfico superior, de período completo (1996 a 2014), conseguimos distinguir os dois ciclos apresentados nos demais: • I ciclo: contração do consumo em relação à renda (1996 a 2003), apresentando uma PMgC de 0,40, isto é, para esse período, a cada acréscimo de um real na renda, tem-se um acréscimo de 37 centavos na despesa de consumo. • II ciclo: expansão do consumo em relação à renda (2004 a 2014), apresentando uma PMgC de 0,83, isto é, para esse período, a cada acréscimo de um real na renda, tem-se um acréscimo de 83 centavos na despesa de consumo. 44 Unidade I A) 170 180175 185 195 205190 200 210 114 116 118 120 122 124 126 128 Co ns um o Renda y = 0,3966x - 45,048 R2 = 0,9504 B) 210 230 250 310270 290 330 115 135 155 175 195 215 Co ns um o Renda y = 0,8275x - 51,231 R2 = 0,9937 C) 170 210190 230 270 310250 290 330 100 120 140 160 180 200 220 Co ns um o Renda y = 0,6991x - 15,477 R2 = 0,9816 Figura 17 – Ciclos de consumo em relação à renda. A) 1º ciclo – contração (1996 a 2003); B) 2º ciclo - expansão (2004 a 2014); C) Ciclo completo (1996 a 2014) A partir de 2004, a cada um real de acréscimo na renda tivemos 43 centavos a mais no consumo, em relação ao período de 1996 a 2004, ou seja, saímos de uma PMgC de 0,40 para uma PMgC igual a 0,83. Nota-se que a partir de 2004, no período em análise (1996-2014), o consumo no Brasil cresceu muito. Uma das teorias que a economia nos oferece é a da propensão marginal a consumir (PMgC), que analisa o que acontece com o consumo quando há um acréscimo na renda. Segundo essa teoria, 45 ECONOMETRIA as duas coisas não crescem na mesma proporção. A partir de certo ponto, a renda pode até continuar aumentando que o consumo tende a desacelerar. A propensão marginal a consumir da chamada classe média brasileira, a maioria da nossa população, é muito alta. Quando as condições de renda melhoram, naturalmente ela vai saciar a sua demanda reprimida – aparenta estarmos no limite em que o aumento de consumo ainda é proporcional ao aumento da renda. O consumo consciente, pelo modo de ser dos brasileiros, extremamente imediatista, voltado ao desfrute do momento, foi deixado de lado. As pessoas não aprenderam a transformar aumento de salário em poupança, em investimentopara o futuro. Nessa análise da variável residual da economia brasileira, no período de 1996 a 2014, além do conhecimento teórico, é importante uma análise das especificidades em que as variáveis envolvidas (Y: endógena e X: exógena) se relacionam. Devemos explicar se: • valores (-) representam contração do consumo em relação à renda; • valores (+) representam expansão do consumo em relação à renda. Por exemplo: os dados econométricos (no caso, o comportamento da variável residual) sugerem a resposta de algumas questões (isto é, os dados perguntam): • O aumento do consumo em relação à renda significa o quê? E a retração? • A crise de consumo, descrita dessa forma, é uma crise econômica ou se trataria de um período de priorização do investimento em relação ao consumo? No caso em questão, o que se observou foi a tendência de poupar ou de consumir, e sua variação no tempo. “Crises” no consumo na verdade indicariam maior tendência a poupar no período em questão. Lembrete É necessário ter conhecimento teórico do que uma variável significa para outra. Friedman (1953, p. 7), ao esclarecer o significado do material empírico para as teorias, afirma que “[...] a evidência empírica é vital em duas fases diversas, embora intimamente associadas: na fase de elaboração das hipóteses e na do teste de sua validade” – portanto, para descobrir se nossas estimativas obtidas satisfazem as expectativas da teoria que estamos testando. Segundo Hill, Griffithis e Judge (2003), uma teoria ou hipótese que não seja verificável por meio de evidência empírica não pode ser admitida como parte da investigação científica. A economia positiva independe, em tese, de qualquer posição ética especial ou de juízos normativos. Ela trata “do que é”, e não “do que deveria ser”. A tarefa dessa economia positiva é a de provar um sistema 46 Unidade I de generalizações passível de ser utilizado para fazer previsões corretas acerca das consequências de qualquer alteração das circunstâncias. O desempenho de uma tal economia será ajuizado em termos da precisão e da experiência (FRIEDMAN, 1953, p. 2). Verifica-se que o coeficiente β é menor do que um, sendo portanto concordante com a teoria. Temos que verificar se o parâmetro β = 0,6991 é estatisticamente abaixo de um e diferente de zero (β ≠ 0), pois se β for zero, os valores de x (renda) não têm relação com os valores de Y (consumo). Para tal, utilizamos inferência estatística (teste de hipóteses). 4.3 Previsão ou predição (utilização do modelo) Por exemplo, suponha uma expectativa de um PIB de 297 bilhões de reais para o ano seguinte. Qual a previsão de consumo em um ano a ser projetado? Se acreditarmos que a função consumo irá se manter, teremos: ŷ = - 15,48 + 0,6991x ŷ = - 15,48 + 0,6991 x 297 = 192,15, ou cerca de 192 bilhões de reais. Para o próximo ano, o governo pretende anunciar um plano de aumento dos tributos para pessoa física, a retomada do imposto sobre operação financeira (IOF). Qual será o efeito disso na economia? Um modelo econométrico pode se propor a estimar tais mudanças. Observação Geralmente é necessário restringir a abrangência do modelo para alguns valores ou região da(s) variável(is) preditora(s). Ao utilizarmos um modelo de regressão para fins de previsão, precisamos considerar somente o intervalo relevante da variável X: renda (inclui todos os valores, desde o menor até o maior valor de X que foram utilizados no desenvolvimento do modelo de regressão). Há duas situações ao prever Y: consumo para um determinado valor de X: renda, pois podemos interpolar dentro dos limites desse intervalo relevante de valores de X, mas podemos extrapolar além do intervalo dos valores de X. Ao utilizarmos a variável X: renda (em bilhões de reais), ela varia desde 180 até 308 (vide tabela de resíduos anteriormente apresentada). Por conseguinte, devemos prever os consumos anuais somente para as rendas entre 180 e 308 bilhões de reais. É necessária muita atenção na utilização da análise de regressão ao extrapolar (ir além do intervalo relevante), pois quanto maior for a diferença (distância) entre x e x, maior será o intervalo de previsão. Em geral, um modelo de regressão pode ser usado com alguma confiança dentro da gama de valores X que participou para o cálculo dos parâmetros de regressão. Se sairmos um pouco do intervalo de X, estaremos extrapolando o modelo. Uma extrapolação para valores de X pouco afastados do intervalo normalmente não apresenta problemas, mas para valores longe do intervalo de X raramente são satisfatórias. 47 ECONOMETRIA Podemos calcular previsões para novas observações mediante a construção de intervalos de previsão. Para um novo valor da variável independente x, podemos prever em que intervalo de valores esperamos encontrar y. Um intervalo de previsão para uma observação futura, com (1 – α) × 100% de confiança, é dado por: ( ) 2 n 2; xx2 1 (x x) IP 95% : Y t . S 1 n S ˆ α − − ± + + ( ) 21 (297 236,48) IP 95% : 1 92,15 2,11. 4,43 1 19 36.322,95 − ± × + + IP(95%) : 192,15 ± 10,04 Interpretação: para um dado x, prevê-se que y pertença ao intervalo indicado (1 – α) × 100%, isto é, 95% das vezes – chamamos intervalo de previsão ou intervalo de confiança [182,11; 202,19]. 4.4 Multiplicador keynesiano da renda O conceito de propensão marginal ao consumo é de grande valia quando se observa o multiplicador keynesiano M = 1 / (1 - PMgC), do qual este é uma das variáveis. No caso mais simples de uma economia fechada e sem governo, definindo I para o investimento, Y para a renda e β para a propensão marginal a consumir, tal multiplicador da renda, encontrado em qualquer manual de Macroeconomia, pode ser dado por 1 / (1 - β). Quanto maior for o seu valor, maior será a renda final da economia em análise – o consumo (demanda) estimula a produção, que emprega cada vez mais os meios de produção disponíveis, empregando mais pessoas, que consumirão mais, formando um ciclo virtuoso. Nasceu da necessidade de Keynes medir o que acontece com a renda quando há uma variação no investimento e diz que o efeito da variação na renda decorrente da variação no investimento de uma unidade monetária é dado pelo multiplicador: M = 1 /( 1 - β) = 1 / (1 - PMgC) = 1 / (1 - 0,6991) = 1 / 0,3009 = 3,32 Nessa mesma fórmula, observa-se também que o multiplicador é determinado pelo inverso da propensão marginal à poupança (1 - β) = S M = 1/S. Logo, quanto menor for o seu valor, considerando ser este um número compreendido entre 0 e 1, maior será o multiplicador. Que uma demanda por um paletó implica uma demanda por tecido; que uma demanda por tecido implica uma demanda por fios e linhas, e também por lã; que os serviços de fazendeiros, comerciantes, engenheiros, mineiros, trabalhadores no transporte, secretários, estão todos envolvidos – esse é o ABC da ciência econômica (KEYNES, 1929, p. 105-106). 48 Unidade I Com base na PMgC de 0,6991, obtemos 3,32, como multiplicador. Ou seja, com um acréscimo de um real no investimento, obtemos um aumento de quase 3,5 vezes na renda. É frequentemente dito que na Grã-Bretanha um gasto de capital em obras públicas custa £500 para que um homem seja empregado por um ano. Isso é baseado no montante de trabalho diretamente empregado no local. Mas é fácil perceber que os materiais usados e o transporte requerido também geram emprego. Se nós consideramos isso, como deveríamos, o gasto de capital por homem-ano de emprego adicional é usualmente estimado, no caso da construção, por exemplo, em £200 (KEYNES, 1933, p. 339). 4.5 Uso do modelo para fins de elaboração de política econômica Suponha que o governo acredite que um nível de gastos de 225 bilhões de reais manterá o desemprego em 7,5%: ŷ = - 15,48 + 0,6991x 225 = - 15,48 + 0,6991x X = 344 (aproximadamente) Ou seja, um nível de renda de R$ 344 bilhões, com uma PMgC = 0,6961, produzirá um gasto de R$ 240,5 bilhões. Assim, o governo pode, por meio de políticas monetária e fiscal, manipular
Compartilhar