ECONOMETRIA - LIVRO TEXTO

•
UNIP

HANA
27/03/2024
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 194 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 194 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 194 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
E aí, curtiu este material?
Ajude a incentivar outros estudantes a melhorar o conteúdo
Gostou desse material? Compartilhe! 🧡
Econometria

6.233 Materiais compartilhados
Baixe o app para aproveitar ainda mais
Leia os materiais offline, sem usar a internet. Além de vários outros recursos!
Prévia do material em texto
Autor: Prof. Rubens Toledo Arakaki
Colaborador: Prof. Maurício Felippe Manzalli
 
Econometria
Professor conteudista: Rubens Toledo Arakaki
Doutor em História Econômica pela Universidade de São Paulo – USP, bacharel em Ciências Econômicas pela 
Pontifícia Universidade Católica de Campinas (PUC-Campinas) e bacharel em Estatística pela Universidade Estadual de 
Campinas – Unicamp. É professor universitário desde 2000 e membro do Conselho Editorial da Revista de Economia 
Política e História Econômica – REPHE. Tem atuado como analista nas áreas de Pesquisa de Mercado, Custos, Viabilidade 
de Projetos, Planejamento e Gestão Empresarial, Análise Ambiental e Conjuntura Econômica. Trabalhou por 19 anos no 
apoio de Planejamento Energético e tem cooperado em grupos especializados com publicações em revistas do ramo. 
Na UNIP, desde 2010, ministra aulas nos cursos de graduação em Economia, Administração, Relações Internacionais, 
Contabilidade, Turismo e Serviço Social.
© Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou 
quaisquer meios (eletrônico, incluindo fotocópia e gravação) ou arquivada em qualquer sistema ou banco de dados sem 
permissão escrita da Universidade Paulista.
Dados Internacionais de Catalogação na Publicação (CIP)
A659e Arakaki, Rubens Toledo.
Econometria. / Rubens Toledo Arakaki. – São Paulo: Editora 
Sol, 2020.
192 p., il.
Nota: este volume está publicado nos Cadernos de Estudos e 
Pesquisas da UNIP, ISSN 1517-9230.
1. Econometria. 2. Variáveis instrumentais. 3. Variáveis 
defasadas. II. Título.
CDU 330.115
U505.43 – 20
Prof. Dr. João Carlos Di Genio
Reitor
Prof. Fábio Romeu de Carvalho
Vice-Reitor de Planejamento, Administração e Finanças
Profa. Melânia Dalla Torre
Vice-Reitora de Unidades Universitárias
Prof. Dr. Yugo Okida
Vice-Reitor de Pós-Graduação e Pesquisa
Profa. Dra. Marília Ancona-Lopez
Vice-Reitora de Graduação
Unip Interativa – EaD
Profa. Elisabete Brihy 
Prof. Marcello Vannini
Prof. Dr. Luiz Felipe Scabar
Prof. Ivan Daliberto Frugoli
 Material Didático – EaD
 Comissão editorial: 
 Dra. Angélica L. Carlini (UNIP)
 Dr. Ivan Dias da Motta (CESUMAR)
 Dra. Kátia Mosorov Alonso (UFMT)
 Apoio:
 Profa. Cláudia Regina Baptista – EaD
 Profa. Betisa Malaman – Comissão de Qualificação e Avaliação de Cursos
 Projeto gráfico:
 Prof. Alexandre Ponzetto
 Revisão:
 Lucas Ricardi
 Juliana Mendes
Sumário
Econometria
APRESENTAÇÃO ......................................................................................................................................................7
INTRODUÇÃO ...........................................................................................................................................................8
Unidade I
1 A NATUREZA DA ECONOMETRIA E DOS DADOS ECONÔMICOS ................................................... 11
1.1 Fases da investigação econômica .................................................................................................. 12
1.2 Formulação da teoria ou hipótese ................................................................................................ 14
1.3 Especificação do modelo matemático do consumo .............................................................. 16
1.4 Especificação do modelo econométrico do consumo ........................................................... 19
1.5 Obtenção e preparação de dados .................................................................................................. 21
2 O MODELO DE REGRESSÃO LINEAR SIMPLES (MRLS) ...................................................................... 23
2.1 Estimativa do modelo econométrico ........................................................................................... 26
2.2 Método de estimação ......................................................................................................................... 29
2.3 Conceito de função de regressão populacional (FRP) e função de 
regressão amostral (FRA) .......................................................................................................................... 33
3 TESTE DE HIPÓTESES ...................................................................................................................................... 35
4 O GRAU DE AJUSTAMENTO DO MODELO: ANOVA (ANÁLISE DE VARIÂNCIA) ........................ 37
4.1 O coeficiente de determinação (r2) .............................................................................................. 39
4.2 Análise de resíduos .............................................................................................................................. 41
4.3 Previsão ou predição (utilização do modelo) ............................................................................ 46
4.4 Multiplicador keynesiano da renda .............................................................................................. 47
4.5 Uso do modelo para fins de elaboração de política econômica ....................................... 48
Unidade II
5 MODELO DE REGRESSÃO LINEAR MÚLTIPLA (MRLM) ...................................................................... 55
5.1 Hipóteses ................................................................................................................................................. 55
5.2 Covariância e coeficiente de correlação .................................................................................... 64
5.3 Teste de hipótese para um coeficiente de correlação populacional ............................... 66
5.4 Coeficiente de determinação (r2) ................................................................................................... 68
5.5 Erro-padrão do coeficiente linear (ou do intercepto) ........................................................... 73
5.6 Erro-padrão do coeficiente angular ............................................................................................. 74
5.7 Inferências sobre o coeficiente angular ...................................................................................... 74
5.8 Teste de hipótese .................................................................................................................................. 78
5.9 Intervalos de previsão ......................................................................................................................... 80
5.10 Anova (análise de variância) .......................................................................................................... 82
6 AVALIAÇÃO DO CONTEÚDO INFORMACIONAL DOS RESÍDUOS ................................................... 84
6.1 Avaliando a homocedasticidade ................................................................................................... 92
6.2 Avaliando a normalidade .................................................................................................................. 95
6.3 Intervalo de confiança para a regressão: duas alternativas ............................................... 99
6.4 Variação em torno de uma reta de regressão.........................................................................101
Unidade III
7 ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO E INFERÊNCIA .............................................107
7.1 Testes para identificação de multicolinearidade ...................................................................111
7.1.1 Teste de Farrar e Glauber ....................................................................................................................111
7.1.2 Teste da VIF (Variance Inflation Factor) ....................................................................................... 112
7.1.3 Teste da Tolerance (TLk) .......................................................................................................................113
8 DEMAIS ANÁLISES EM ECONOMETRIA .................................................................................................1148.1 Quebras Estruturais e Variáveis Dummies ................................................................................114
8.2 Variáveis defasadas ............................................................................................................................136
8.3 Variáveis instrumentais ....................................................................................................................144
8.4 O básico da análise de regressão com dados de séries temporais ou 
previsão de séries temporais .................................................................................................................155
7
APRESENTAÇÃO
Esta disciplina desenvolve o instrumental padrão para a estimação de modelos econométricos, 
enfocando a aplicação de modelos de regressão linear múltipla e seus pressupostos básicos. Nesse sentido, 
derivam-se os estimadores por mínimos quadrados ordinários e discutem-se todas as propriedades 
inferenciais de tais modelos.
A construção de modelos é comumente utilizada em Econometria, e a sua correta interpretação é 
fundamental para o bom entendimento da disciplina e da formação profissional do economista. Como 
existem muitos modelos utilizados na ciência econômica, é necessário saber fazer, também, a distinção 
entre os diversos modelos.
Apresentaremos conceitos básicos para o entendimento da abordagem teórico-prática e das 
técnicas envolvidas na construção de modelos, sua especificação, estimação, verificação e previsão, 
pois o trabalho econométrico necessita da Teoria Econômica como guia para determinar a direção 
mais relevante e proveitosa na elaboração do modelo. Serão apresentados métodos de estimação que 
permitam expressar a Teoria Econômica a partir de dados estatísticos e de uma metodologia que aponte 
como aplicar os métodos de estimação aos dados estatísticos, permitindo ao aluno definir um bom 
modelo e como encontrá-lo.
Interpretar modelos estruturados será um dos nossos objetivos. Iremos compreender de forma 
completa ou parcial um determinado fenômeno; perceber como os processos operam para gerar 
padrões observáveis; e desenvolver simulações que examinem mudanças ao longo do tempo sobre 
conjecturas específicas.
Nesse enfoque, estamos interessados em discutir sobre a natureza e as fontes de dados disponíveis 
para análise econométrica a fim de que o aluno obtenha dos dados a maior quantidade possível de 
informação e seja capaz de indicar possíveis modelos a serem utilizados.
Realizaremos uma discussão mais extensa sobre as hipóteses do modelo-base da Econometria 
(modelo clássico de regressão linear), enfatizando não só a utilização de dados da economia brasileira 
em estudos e pesquisa, como também a interpretação de resultados obtidos a partir dos métodos e das 
técnicas expostos, estimulando a aplicação teórica e prática, com o objetivo de complementar a base 
teórica adquirida nas demais disciplinas do curso.
Em um segundo momento, estudaremos como detectar a presença e estimar tais modelos com 
multicolinearidade, heterocedasticidade, autocorrelação serial e erros de especificação.
Os exercícios resolvidos irão procurar mostrar, em detalhes, como os cálculos são desenvolvidos. Isso 
será feito envolvendo a discussão dos pressupostos básicos que dão validade aos parâmetros estimados 
dos modelos e os testes mais comuns usados para verificar a violação de cada um desses pressupostos.
Por fim, destacaremos algumas outras técnicas de estimação que possibilitem, em contextos 
específicos, melhorar a significância do modelo básico.
8
Apresentaremos a regressão com as variáveis dependentes binárias (ou dummies). Serão expostas a 
possibilidade de explorar modelos com variáveis qualitativas e as tratativas dos problemas de formulação, 
estimação e testes de modelos com variáveis defasadas e instrumentais.
A ideia geral é a de apresentar as ferramentas de regressão aos alunos e, através de análises 
teórico-empíricas, aprender a utilizá-las como uma importante técnica de análise econômica para 
estimar relações entre variáveis que possibilitem o equacionamento do comportamento em período 
passado da relação entre as variáveis estudadas. O objetivo é fornecer previsões com alto nível de rigor 
e sistematização na tentativa de antecipação do futuro, a partir de construção e análise de cenários, 
gestão de políticas públicas e ações sociais que mudem resultados.
INTRODUÇÃO
A Teoria Econômica se preocupa com relações entre variáveis, e a Econometria é um tipo especial 
de análise econômica na qual a abordagem teórica é combinada com formulações matemáticas, 
procedimentos estatísticos e mensuração empírica dos fenômenos econômicos por meio de análise de 
uma base de dados. Podemos dizer que a Econometria é aquele ramo da ciência econômica que trata 
de quantificar, isto é, de representar numericamente as relações econômicas, o que se realiza mediante 
uma combinação adequada da Teoria Econômica, da Matemática e da Estatística.
Nas últimas décadas, o levantamento de dados, a lógica e o raciocínio subjacentes à análise de dados 
firmaram-se como um instrumental da pesquisa sociológica, em especial econômica – o raciocínio que 
empresta apoio à operação analítica.
Inflação, desemprego, consumo, narcotráfico, violência, imigração etc.; vivemos em cidades de cifras, 
solicitados a diagnosticar, a mensurar a verdadeira dimensão, o quantum de tudo isso, e a garantir suas decisões.
Muitas vezes deparamos com decisões no mundo profissional difíceis de serem tomadas e das quais 
as consequências são importantes, e os resultados, incertos.
Conforme escreve o Dr. Morris Rosenberg (1976, p. 13), “importa que os dados sejam bons, mas 
igualmente importante é o que se irá fazer com eles”.
O que vamos tratar nesta disciplina envolve o estudo e a aplicação de métodos e técnicas 
econométricas e sua metodologia e aplicações: mostrar a viabilidade prática e teórica de construção 
de modelos de previsão, com base em técnicas econométricas. Vamos tratar de modelos como 
estrutura analítica construída de forma simplificada, já que são apenas representações esquemáticas 
e aproximadas da economia real.
Analisaremos, de forma integrada, como cada abordagem trata a questão do antes (relação 
teoria-modelo, escolha de especificações, análise exploratória dos dados e temas correlatos), do 
durante (técnicas econométricas, data mining e outros tópicos) e do depois da aplicação das técnicas 
econométricas (interpretação dos modelos, apresentação e implicações para a formulação de políticas 
buscando o menor erro possível e permitindo o julgamento da necessidade ou não de medidas corretivas).
9
Regressão é uma importante técnica para medir ou estimar relações entre variáveis econômicas. Ela 
se ocupa do estudo da dependência de uma variável em relação a uma ou mais variáveis explicativas 
utilizadas pelos economistas para fins de análise estrutural (verificação de teorias econômicas), avaliação 
de políticas econômicas e previsão de valores futuros de variáveis de natureza econômica. Este estudo 
consiste na construção e análise de uma relação matemática entre as variáveis, no geral, uma variável 
em função das outras.
Vamos elaborar análise de variáveis de natureza macroeconômica (consumo, produto, taxa de 
emprego) e de natureza financeira (retorno de ações, taxas de câmbio), porém com características 
diferentes. As observações das séries temporais de natureza macroeconômica são geralmente mensais, 
trimestrais ou anuais, e as de natureza financeira são dotadas de uma frequência muito superior: 
normalmente, trabalha-se com dados diários ou mesmo intervalos de horas ou minutos entre duas 
observações consecutivas – os chamados dados de alta frequência, voláteis (por exemplo: índices diários 
da Bolsa de Valores de São Paulo – Ibovespa). Os dados macroeconômicos estão sujeitos a erros de 
medição, apurados de acordo com certa metodologia e decorrentes de investigações preliminares; já 
os dados financeiros resultam de valores efetivamenteobservados no mercado. Ao contrário das séries 
macroeconômicas, as séries financeiras exibem habitualmente fortes efeitos não lineares e distribuições 
não normais. Os modelos utilizados para descrever séries temporais (conjunto de observações ordenadas 
no tempo) são processos estocásticos, isto é, processos controlados por leis probabilísticas.
Então, imagine você, economista, ampliando seu potencial e suas habilidades, aprendendo a expandir 
seus limites, sendo capaz de testar as proposições teóricas, de explicar o comportamento de variáveis já 
observadas e/ou prever comportamentos ainda não observados. Isto é:
• medir variáveis e agregados econômicos;
• estimar parâmetros de relações econômicas;
• formular testes de hipóteses sobre situações reais;
• prever valores de variáveis econômicas.
Portanto, o instrumental econométrico pode ser utilizado no estudo de qualquer fenômeno, desde 
que se consiga expressar as formulações teóricas em bases matemáticas e existam dados amostrais 
suficientes para a criação de um modelo.
 Observação
Enfatizamos que as ferramentas e seu nível de aplicação são relevantes 
para solucionar muitos problemas práticos do mundo atual.
11
ECONOMETRIA
Unidade I
1 A NATUREZA DA ECONOMETRIA E DOS DADOS ECONÔMICOS
A investigação econométrica se iniciou com a análise da demanda – Teoria de Cournot (1838) – e os 
famosos Princípios de Marshall (1890). Mas também a Tinbergen (1939) se deve o desenvolvimento dos 
modelos macroeconômicos multiequacionais inspirados na contabilidade nacional. Em 1930, funda-se 
a Econometric Society, cuja necessidade já vinha sendo notada desde 1912. O apogeu do método é 
atingido em 1950, quando a Cowles Comission publica a Statistical Inference in Dynamic Economic 
Models. A hipótese básica desse trabalho é a de que os dados econômicos se geram por sistemas de 
relações que são, em geral, estocásticos, dinâmicos e simultâneos. Portanto, dois fatos favoreceram 
aquelas primeiras análises empíricas: de um lado, a existência de uma teoria bem-estruturada; de 
outro, a possibilidade de obter facilmente dados estatísticos sobre preços e quantidades.
Tão importante quanto estudar métodos e técnicas econométricas é estudar sua metodologia e 
aplicações de acordo com cinco paradigmas diferentes:
• a chamada abordagem “clássica” ou da Comissão Cowles, nos anos 1950-60;
• a abordagem “inglesa” ou da London School of Economics, nos anos 1970-80;
• a abordagem VAR, nos anos 1980;
• a abordagem da calibragem, nos anos 1990;
• a microeconometria e os experimentos quase naturais, que ganharam crescente notoriedade, 
sobretudo na avaliação de políticas públicas e nos estudos do mercado de trabalho.
A Matemática ensina a maneira de deduzir proposições de outros dados (coincide com a lógica 
dedutiva); já a Estatística instrui o modo de obter proposições dos fatos observados (coincide com a 
lógica indutiva).
A missão do econômetra é exprimir as teorias econômicas em termos matemáticos para verificá-las 
por métodos estatísticos e para medir o impacto de uma variável sobre outra, assim como para poder 
prever os sucessos futuros ou aconselhar a política econômica que se deve seguir quando se deseja um 
resultado determinado.
12
Unidade I
1.1 Fases da investigação econômica
As fases da investigação econômica são:
• formulação de hipótese e teorias;
• verificação dessas hipóteses e teorias.
A primeira fase corresponde à Teoria Econômica e a segunda constitui a Econometria (construção 
de modelos, sua especificação, estimação, verificação e previsão).
A Teoria Econômica não fornece qualquer medida numérica da relação entre variáveis. Desse modo, a 
análise de regressão é a técnica básica para medir ou estimar relações entre variáveis. O objetivo é testar 
proposições teóricas nessas relações, procurando isolar, desagregar efeitos de relações de causalidades 
e estimar parâmetros envolvidos na construção de modelos econométricos.
De acordo com Hoover (2006), a Econometria tem quatro funções:
• Testar implicações de uma teoria através da correta tradução desta em proposições testáveis a 
partir de modelagem econométrica.
• Calibrar parâmetros de um modelo para mensurar parâmetros de um modelo já definido de uma 
relação proposta pela Teoria Econômica (por exemplo, calcular a elasticidade-renda de uma 
função consumo).
• Prever, já que a Econometria pode ser usada para prever uma relação ou mesmo os valores de uma variável 
de interesse – lembrando que a Teoria Econômica é que permite qualificar e explicar uma previsão.
• Caracterizar relações e fenômenos, pois a Econometria possibilita permitir uma visualização dos 
dados de forma a revelar relações e fenômenos que às vezes não estão previstos nas teorias, pois 
elas são continuamente testadas e se desenvolvem por meio da observação.
Esta técnica de modelagem utilizada para analisar a relação entre uma variável dependente (Y) e 
uma ou mais variáveis independentes (X
1, X2, X3, ..., Xn) tem como objetivo estimar uma função que 
descreve, o mais próximo possível, a relação entre essas variáveis. É assim que poderemos predizer o 
valor que a variável dependente (Y) irá assumir para um determinado valor da variável independente X. 
O modelo estimado deve satisfazer os objetivos de explicar e/ou prever o comportamento das variáveis 
envolvidas nessa análise.
As propriedades desejáveis de um modelo estimado são:
• relevância;
• simplicidade;
13
ECONOMETRIA
• plausibilidade teórica;
• precisão dos coeficientes;
• capacidade explicativa;
• capacidade preditiva.
Antes de pensar em um modelo de previsão caracterizado por regressão linear, é conveniente 
chamar a atenção para o seu processo de concepção (procedimento prévio a ser seguido). Uma sugestão 
encontra-se ilustrada a seguir:
 
Teoria econômica
Modelo matemático
Modelo econométrico
Tabulação dos dados
Estimação dos parâmetros do modelo
Avaliação do modelo
(Critério: estatístico, econométrico e econômico)
Avaliação da teoria (se compátivel com os dados)
Compatível: aceita o modelo/Não compatível: rejeita o modelo
Figura 1 – Metodologia de pesquisa econométrica
Os passos para a elaboração de um modelo econométrico são (GUJARATI, 2000):
• formulação ou teoria da hipótese;
• especificação do modelo matemático da teoria;
14
Unidade I
• especificação do modelo econométrico da teoria;
• obtenção e preparação de dados;
• estimativa dos parâmetros do modelo econométrico;
• teste de hipótese;
• previsão ou predição;
• utilização do modelo para fins de controle ou política.
No exemplo a seguir, faremos um passo a passo utilizando o modelo de regressão linear simples 
(MRLS) tendo como suporte a Teoria Keynesiana de Consumo.
1.2 Formulação da teoria ou hipótese
O consumo das famílias é o componente mais importante do Produto Interno Bruto (PIB) de uma 
economia, e sua dinâmica é fundamental para entender as alterações tanto em períodos de boom como 
de crises. De acordo com a Penn World Table Version 7.0 (KNOEMA, [s.d.]), o consumo representa 70% 
do PIB de todos os 190 países pesquisados. Com o intuito de verificar o nível de dependência entre elas, 
coletamos os dados da economia brasileira, a preços constantes de 1995, no período de 1996 a 2014 
(veja a tabela mais adiante) e estimamos o modelo de regressão linear simples (MRLS), relacionando os 
resultados com a função keynesiana e de Milton Friedman.
De acordo com a Teoria Keynesiana (modelo simples de dois setores: economia fechada e sem 
governo), numa economia muito simples, sem governo e sem setor externo, isto é, sem transações com 
o exterior, a renda nacional (Y) será destinada apenas ao consumo das famílias (C) e à poupança (S), já 
que, não havendo governo, não há impostos.
Já a respeito da função consumo, seguindo o raciocínio de Keynes, parece razoável afirmar 
que o principal determinante do consumo é a renda disponível (Yd), isto é, o montante de que as 
pessoas dispõem para gastar. Como não existe governo nesta economia, não há impostosnem 
transferências governamentais e, portanto, a renda disponível (Yd) é igual, por definição, à renda 
nacional (Y). Assim, se a renda crescer ou se reduzir, o mesmo ocorrerá com o consumo, mas 
não necessariamente no mesmo montante (o aumento da renda eleva o consumo, mas não em 
proporção igual ao aumento dessa renda).
A função consumo mostra a relação existente entre o nível das despesas de consumo e o nível da 
renda disponível.
Empiricamente, descobriu-se que o consumo corresponde a uma proporção estável da renda (veja a 
figura a seguir, criada a partir de dados do IBGE).
15
ECONOMETRIA
1996
0
50
100
150
200
250
300
350
Renda
Consumo
R$
 b
ilh
õe
s
19981997 1999 2000 2002 2004 2006 2008 2010 20122001 2003 2005 2007 2009 2011 2013 2014 Ano
Figura 2 – Renda e consumo no Brasil (período entre 1996 e 2014)
Será que podemos afirmar que o valor total do consumo é determinado somente pela renda 
disponível corrente? Como explicar que pessoas desempregadas, que não dispõem de renda, consomem 
um mínimo que seja? Olhando no agregado, percebe-se que uma parte do consumo total independe do 
nível de renda (ou pelo menos do nível de renda corrente). Nesse contexto, podemos definir a função 
consumo como:
C = α + βYd
Onde:
α = parte autônoma do consumo, isto é, a parcela que não depende da renda (são os que não são 
relacionados ao nível de renda, como, no modelo keynesiano, o investimento, os gastos do governo 
e a exportação);
β = fração da renda que é gasta, isto é, consumo induzido (questão de padrão de vida).
Essa parcela de renda que é gasta (β), denominada de propensão marginal a comsumir (PMgC), foi 
um dos mais importantes conceitos introduzidos por Keynes. O termo “marginal” em economia, que 
neste caso representa o adicional de consumo em função de um aumento na renda, expressa a ideia 
de um “extra” qualquer decorrente de um acréscimo qualquer ocorrido em uma variável. Analisando 
tecnicamente, a propensão marginal a consumir (PMgC) representa a razão entre a variação no consumo 
(∆C) decorrente de uma variação na renda disponível (∆Yd) e essa variação na renda. Assim:
d
C
PMgC
Y
∆
= β =
∆
A propensão marginal a consumir (PMgC) ou taxa de variação do consumo é maior que zero e menor 
que um ⇔ 0 < PMgC < 1, que expressa o comportamento dos agentes de uma determinada economia 
em relação à renda obtida – quanto mais propensos estes forem a consumir, maior será o valor da PMgC. 
16
Unidade I
Por exemplo, numa economia em que seus agentes estão dispostos a comprometer 75% da sua renda 
com o consumo, a PMgC é igual a 0,75. Em decorrência, a propensão marginal a poupar (PMgS) 
representa a parcela da renda dos agentes econômicos de uma determinada economia no qual estes se 
comprometem a poupar, isto é, a não gastar (PMgC é 0,75 + PMgS é 0,25 = 100% da renda).
O coeficiente β é denominado propensão marginal a consumir (PMgC). Vem a ser o aumento do 
consumo a cada aumento unitário da renda.
A propensão média a consumir (PMeC) é dada pela relação PMeC = C/Yd para diferentes níveis 
de renda. A PMeC decresce continuamente à medida que aumenta a renda, com o detalhe de que C 
aumenta menos do que proporcionalmente aos aumentos de Yd, pelo fato de β estar entre 0 e 1.
Temos que:
PMeC = C/Yd e PMgC = ∆C/∆Yd.
Logo, C/ Yd = α / Yd + β Yd / Yd.
Daí, vem que:
PMeC = α / Yd + PMgC, e conclui-se que PMe > PMg. Essa simples demonstração já foi solução para 
questões aparentemente complexas do modelo keynesiano simplificado.
 Observação
Não devemos confundir o conceito de PMgC com um outro conceito 
semelhante, que é a propensão média de consumo (PMeC), considerada 
como a razão entre o consumo total e a renda disponível (PMeC = C/ Yd ou 
PMeC = (α + β Yd) / Yd).
1.3 Especificação do modelo matemático do consumo
De modo simplificado, a seguinte expressão matemática representa a função de consumo keynesiana:
Y = α + βX, 0 < β < 1
Onde:
Y = despesa de consumo;
X = renda.
17
ECONOMETRIA
Aqui, α e β são conhecidos como parâmetros do modelo. São o intercepto (que representa o ponto 
em que a reta regressora corta o eixo dos ys, quando x = 0) e a declividade (que representa a inclinação 
da reta regressora e é chamada de coeficiente de regressão ou coeficiente angular). Além disso, temos 
que, para um aumento de uma unidade na variável x, o valor E(Y|x) aumenta unidades.
O β mede a declividade e a PMgC. Geometricamente, a equação da função consumo com as três 
propriedades propostas por Keynes é mostrada na figura a seguir:
• Primeira: a propensão marginal a consumir se situa entre 0 e 1.
• Segunda: a propensão média a consumir cai quando a renda aumenta (PMeC declinante). 
• Terceira: o consumo é determinado pela renda corrente.
Y = α + β X 0 < β < 1
Dispêndio em 
consumo
Y
Renda
α
X
RendaConsumo
1
Inclinação = PMgC
β = PMgC
Figura 3 – Função consumo keynesiana
 Observação
Simulação é o método de solução de problemas que se utiliza de 
modelos matemáticos numéricos/algorítmicos.
Os modelos podem ser contínuos ou discretos:
• Contínuos: as variáveis têm valores que variam continuamente ao longo do tempo de simulação. 
Equações fornecem o valor das variáveis em todos os instantes de tempo. Exemplos de modelos 
contínuos: reações químicas, circuitos eletrônicos, modelos econométricos.
• Discretos: as variáveis são alteradas apenas em certos instantes de tempo. O comportamento 
do modelo é dado por um conjunto de regras que determinam o tempo do próximo evento e as 
alterações nos valores das variáveis. Exemplos de modelos discretos: controle de tráfego, sistemas 
de produção, sistemas telefônicos, sistemas operacionais etc.
18
Unidade I
Diferença entre modelos determinísticos e estocásticos:
• Determinísticos (matemáticos): são totalmente previsíveis, predeterminados em função dos 
dados de entrada. Cada elemento do domínio (x) se associa apenas com um elemento da imagem 
(Y). Ou seja, em uma função Y = f(x) se para cada valor de x houver um valor de y. Conhecidos 
como modelos estritamente matemáticos. Exemplo: espaço percorrido por um automóvel a uma 
determinada velocidade constante num determinado espaço de tempo:
E = V x T
Onde:
E = espaço (variável de saída);
V = velocidade constante (variável de entrada);
T = tempo decorrido do deslocamento do automóvel (variável de entrada).
X1 X2 X3
Y
X
Figura 4 – Modelo determinístico (matemático)
• Estocásticos (econométricos): contingenciais, não dependem somente dos dados de entrada, 
mas também de outros fatores, normalmente aleatórios. Há uma indeterminação quanto 
à predição de eventos futuros descrita por distribuições de probabilidade. Para cada valor do 
domínio (x) existe uma distribuição de probabilidade total dos valores da imagem (Y). Assim, 
para cada valor de X a variável Y pode assumir um intervalo específico. A análise estocástica 
começa pela identificação da função de distribuição de probabilística que melhor se ajusta ao 
elemento-base em estudo. Exemplos: uma lâmpada nova é ligada, e conta-se o tempo gasto até 
queimar; em uma linha de produção, peças são fabricadas em série, e conta-se o número de peças 
defeituosas produzidas num período contínuo de 24 horas; reação das pessoas em situação de 
emergência. O modelo probabilístico tenta descrever o comportamento “aleatório” das entidades.
19
ECONOMETRIA
X1 X2 X3
Y
X
Figura 5 – Modelo estocástico (econométrico)
1.4 Especificação do modelo econométrico do consumo
Espera-se que o modelo estabeleça relações entre variáveis. Trataremos de dados exclusivamente 
com relações estocásticas. Portanto, o modelo econométrico de interesse da função consumo não 
pode ser puramente matemático, pressupondo que a relação entre as variáveis (consumo e renda) seja 
determinística ou exata.
As relações sociais e de conteúdo econômico no contexto geral não são exatas; elas absorvem 
um conceito complexo que trata de um conjunto de interações que se ligam com relacionamentos 
de conteúdo jurídico, político,ético e ideológico, eminentemente sociais. Algumas dessas variáveis 
que influenciam a compra (consumo) podem ser retratadas através de quatro fatores: culturais, 
sociais, pessoais e psicológicos.
Partimos da ideia de que as relações entre duas variáveis podem ser afetadas pela introdução de 
uma ou mais variáveis. Espera-se, com isso, que a compreensão dessa relação possa ser enriquecida 
e aprofundada. Assim, ao se examinar o alcance das significações possíveis dessas relações e estudar 
os fatores do porquê da existência dessas relações, as condições em que se manifestam as relações 
e os problemas que advêm das influências conjuntas, o propósito é o de explicar, especificar a 
relação, tornando-a mais significativa e/ou mais precisa.
Caso se obtenha a amostra de 700 famílias, espera-se que o comportamento dos consumidores não 
seja linear, pois é caracterizado pelas atividades mentais e emocionais que ocorrem no momento da compra 
e do uso – ou seja, não se comportarão de forma exatamente linear e podem até seguir uma tendência, 
ditada pelos empresários, por meio de práticas de publicidade, sistemas de crédito, programas de expansão e 
constituição de monopólios e oligopólios, resultando, muitas vezes, em concentração do poder econômico.
Em geral, definem-se para o modelo variáveis de entrada e variáveis de saída, que espelham as 
interações do sistema com o Universo (veja a figura a seguir). O que se necessita ao elaborar um modelo 
é descobrir princípios gerais que proporcione conhecimentos úteis da realidade econômica.
20
Unidade I
Sistema econômicoEntradas Saídas
Figura 6 – Sistema econômico
Espera-se que o modelo estabeleça relações entre essas variáveis. Para essa classe de sistema (função 
de consumo keynesiana), é conveniente o seguinte modelo:
YiVariáveis 
de entrada
Xi Variáveis 
de saída
Modelo econométrico
Figura 7 – Modelo econométrico
Estamos criando um modelo toda vez que tentamos explicar um conjunto complexo de 
comportamentos, fenômenos e resultados empregando algumas variáveis explicativas e estabelecendo 
relações entre elas.
Os modelos não visam captar toda a complexidade dos comportamentos, eles são criados para 
retirar os fatores do acaso e da idiossincrasia (característica comportamental peculiar), de tal forma que 
o foco recaia sobre os princípios gerais desenvolvidos.
Assim, um modelo econômico pode ser definido como uma expressão matemática de uma 
determinada teoria econômica.
Para transformar relações inexatas (socioeconômicas), o econometrista modifica a função consumo. 
Veja o modelo:
Y = α + βX + e, 0 < β < 1 
Onde:
Y = despesa de consumo;
X = renda.
Aqui, α e β são conhecidos como parâmetros do modelo; são o intercepto e a declividade.
21
ECONOMETRIA
Por sua vez, e é o termo de perturbação e pode representar todos os fatores que afetam o consumo, 
mas que não são considerados explicitamente (podem assumir valores positivos ou negativos, também 
conhecidos como termo de erro estocástico ou perturbação estocástica). A equação anterior é um exemplo 
de modelo econométrico (de regressão linear simples). O modelo é representado na figura a seguir:
Desvios positivos (+)
Desvios negativos (-)
Modelo: Y = α + βX + e
(reta ajustada)
+
+
+
+
–
–
–
–
e
Renda
X
Consumo
Y Desvios
Figura 8 – Modelo econométrico da função consumo keynesiana
Em resumo, o modelo aceita que o consumo se relaciona linearmente com a renda, mas a relação 
entre ambos não é exata, estando sujeita a variação individual.
 Observação
É essa teoria (keynesiana) que, em geral, nos diz qual variável é causa e 
qual variável é efeito.
1.5 Obtenção e preparação de dados
A Econometria enfoca problemas inerentes à coleta e à análise de dados econômicos não 
experimentais, também chamados de dados observacionais, os quais não são acumulados por meio 
de experimentos controlados de indivíduos, firmas ou segmentos da economia.
Para obter os valores numéricos, precisamos de dados. Os dados se referem a vários indivíduos? Ou 
eles se referem a um mesmo país, mas em diversos espaços de tempo? As respostas a essas questões são 
de extrema importância para a nossa análise econométrica. A estrutura dos dados econômicos utilizada 
em Econometria é basicamente de três tipos:
• Séries temporais: conjunto de observações e valores que uma variável assume em diferentes 
momentos. É o conjunto de dados sequenciais observados de uma mesma variável ao longo do 
22
Unidade I
tempo (em intervalos de tempo). Exemplo: o consumo agregado no Brasil em diversos anos, os 
retornos diários da Bovespa ou a taxa de desemprego mensal. Os dados são assumidos como 
estacionários, a variância e a média não se alteram sistematicamente.
• Dados de corte transversal (cross-section): dados de variáveis coletadas num mesmo instante de 
tempo (num único momento). Estudos transversais são apropriados para descrever características 
das populações no que diz respeito a determinadas variáveis, e os seus padrões de distribuição 
podem, também, ser utilizados para descrever associações entre variáveis. Exemplos: peso de 
indivíduos selecionados aleatoriamente e num determinado instante de tempo ou PIB dos países 
emergentes no primeiro trimestre de 2016. No exemplo dado, poderíamos observar o consumo e a 
renda de diversas famílias num mesmo mês ou também o consumo agregado e a renda agregada 
de diversos países num mesmo ano. Os dados apresentam problemas da heterogeneidade (alguns 
são grandes demais e outros são pequenos demais).
• Dados em painel: consiste na observação de n entidades para dois ou mais períodos de tempo. 
Combina características de séries temporais com dados em corte transversal permitindo o controle 
da heterogeneidade presente nos elementos e são amplamente utilizados em estudos econométricos 
e nas ciências sociais aplicadas. Há dados combinados, tanto de séries temporais como de corte, em 
que temos uma série de tempo para cada unidade de corte transversal. Exemplos: consumo agregado 
dos diversos estados brasileiros ao longo de vários anos, taxa de desemprego semestral dos países da 
América Latina ou PIB trimestral dos municípios do estado de São Paulo nos últimos 15 anos.
 Observação
É importante observar que dados que tomamos como certo serem de 
“corte transversal” podem apresentar uma interessante dependência entre 
si quando observados com mais cuidado. Um exemplo são as notas de 
prova de uma turma. Se os dados forem apresentados em ordem alfabética 
ou por ordem dos assentos na sala, este último fará sugerir autocorrelação 
positiva (notas altas estavam próximas de notas altas, e notas baixas, de 
notas baixas, evidenciando que houve muita cola durante a prova).
Na análise de regressão, as ideias de causação na relação entre variáveis (X e Y) devem se originar 
fora da Estatística, em última análise, em alguma teoria. Por exemplo, no nosso caso em estudo, a 
Teoria Econômica aponta que o consumo depende da renda, e não o contrário. Portanto, devemos estar 
atentos que correlação não implica relação causal entre variáveis, e simplesmente lembre que correlação 
é diferente de causação (correlação não implica causação).
Nesta fase inicial, que permite conhecer as caraterísticas das informações, devemos selecionar os 
principais indicadores para mostrar as principais medidas estatísticas dessa amostra. Além de utilizar 
esses dados, é necessário elaborar um box plot, gráfico que permite a visualização de como esses dados 
estão distribuídos na amostra. Isso torna possível perceber se há a presença de outliers, o que gera uma 
maior segurança para a construção dos modelos de regressão.
23
ECONOMETRIA
 Observação
O sucesso de qualquer análise econométrica depende basicamente da 
disponibilidade de dados apropriados.
Dando início ao trabalho de criação do modelo, a primeira etapa consiste em analisar a matriz de 
correlação das variáveis. Nessa matriz, observa-se entre todas as variáveis independentes selecionadas 
a que possui a maior correlação coma variável dependente. Essa variável de maior correlação com a 
variável a ser explicada (Y) é que deverá ser selecionada para a construção da equação de regressão 
usando apenas uma variável independente.
 Saiba mais
Sobre um instrumento fundamental da pesquisa econômica relacionada 
ao planejamento e à coleta de dados de uma lógica – o raciocínio que 
empresta apoio ao processo analítico –, leia a obra:
ROSENBERG, M. A lógica da análise do levantamento de dados. São 
Paulo: Cultrix/Edusp, 1976.
2 O MODELO DE REGRESSÃO LINEAR SIMPLES (MRLS)
No exemplo a seguir, vamos utilizar dados mensurados no tempo (séries de tempo ou time series). A 
ideia é construir um modelo de regressão para o período anual de 1996 a 2014 do Brasil relacionando 
duas variáveis: renda (X) e consumo (Y).
Com base na tabela a seguir, elaborada a partir de diversos dados apresentados pela Coordenação 
de Contas Nacionais da Diretoria de Pesquisas do IBGE, construímos um diagrama de dispersão entre as 
variáveis renda (X) e despesa de consumo (Y):
Tabela 1 – Despesas de consumo pessoal (Y) e produto interno bruto (X) 
de 1996 a 2014 (em bilhões de reais de 1995)
Abrangência: Brasil | Unidade: R$ bilhões
Valores constantes de 1995
X Y
Ano Renda Consumo
1 1996 180,4 116,1
2 1997 186,5 119,6
3 1998 187,2 118,7
24
Unidade I
Abrangência: Brasil | Unidade: R$ bilhões
Valores constantes de 1995
X Y
Ano Renda Consumo
4 1999 188,0 119,2
5 2000 196,3 124,0
6 2001 199,0 125,0
7 2002 205,1 126,6
8 2003 207,4 125,9
9 2004 219,4 130,8
10 2005 226,4 136,6
11 2006 235,4 143,9
12 2007 249,6 153,0
13 2008 262,4 162,9
14 2009 262,0 170,2
15 2010 281,8 180,8
16 2011 292,8 189,4
17 2012 298,4 196,0
18 2013 307,4 202,8
19 2014 307,7 205,5
4.493,20 2.847,00
A variável Y corresponde às despesas de consumo das famílias agregado (isto é, para a economia em 
geral), e a variável X, ao produto interno bruto (PIB) (um indicador de renda agregada), ambos medidos 
em bilhões de reais a preços constantes de 1995.
150 200 250 300 350
100
120
140
160
180
200
220
De
sp
es
a 
de
 c
on
su
m
o 
- 
R$
 (b
ilh
õe
s)
Renda - R$ (bilhões)
Figura 9 – Renda e despesa de consumo no Brasil de 1996 a 2014
O que se espera é que os gastos de consumo estejam diretamente relacionados com seus rendimentos. 
Os dados estão apresentados no gráfico anterior, o que supõe, de modo razoável, a existência de uma 
“relação linear” entre essas duas variáveis.
25
ECONOMETRIA
Com base no diagrama de dispersão, temos uma interpretação subjetiva da existência de correlação 
entre duas variáveis, mas, pelo cálculo do coeficiente de correlação (r), temos uma maneira mais precisa 
de mensuração, conforme fórmula a seguir:
( ) ( )2 22 2
n xy x y
r 1 r 1
n x x n y y
−
= − ≤ ≤ +
− −
∑ ∑ ∑
∑ ∑ ∑ ∑
O intervalo de variação do coeficiente de correlação varia de -1 a 1. Se x e y tiverem forte correlação 
positiva, r estará próxima de 1. Se x e y tiverem forte correlação negativa, r estará próximo de -1. Se não 
existir correlação linear ou, ainda, se a correlação linear for fraca, r estará próximo de zero.
 Observação
Uma distribuição de probabilidades dá uma descrição formal 
(matemática) dos valores possíveis da população que podem ser observados 
para a variável. Quando temos duas variáveis, a distribuição é denominada 
bivariada. A fx,y (x,y) descreve como os valores de X e Y se comportam 
conjuntamente.
A distribuição normal bivariada é uma distribuição de probabilidades com uma função densidade de 
probabilidade f(x,y) para X e Y, tal que:
• X e Y apresentam, cada uma, distribuição normal com médias µX e µY e variâncias σ
2
X e σ
2
Y, 
respectivamente;
• o relacionamento entre X e Y é medido pela quantidade ρXY tal que -1 ≤ ρXY ≤ 1;
• ρXY é o coeficiente de correlação entre as variáveis aleatórias X e Y e mede a associação linear 
entre elas.
Onde:
ρXY = 1 correlação positiva perfeita;
ρXY = 0 correlação nula;
ρXY = -1 correlação negativa perfeita.
Com os dados observados (xi, yi), desejamos quantificar o grau de associação. Para isso estimamos ρXY.
Para facilitar o cálculo do coeficiente de correlação estimado (r), podemos utilizar uma tabela, com 
base em dados do IBGE:
26
Unidade I
Tabela 2 – Renda (X) e consumo (Y)
Abrangência: Brasil | Unidade: R$ bilhões
Valores constantes de 1995
X Y X2 Y2 XY
Ano Renda Consumo Renda2
1 1996 180,4 116,1 32.544 13.479 20.944
2 1997 186,5 119,6 34.782 14.304 22.305
3 1998 187,2 118,7 35.044 14.090 22.221
4 1999 188,0 119,2 35.344 14.209 22.410
5 2000 196,3 124,0 38.534 15.376 24.341
6 2001 199,0 125,0 39.601 15.625 24.875
7 2002 205,1 126,6 42.066 16.028 25.966
8 2003 207,4 125,9 43.015 15.851 26.112
9 2004 219,4 130,8 48.136 17.109 28.698
10 2005 226,4 136,6 51.257 18.660 30.926
11 2006 235,4 143,9 55.413 20.707 33.874
12 2007 249,6 153,0 62.300 23.409 38.189
13 2008 262,4 162,9 68.854 26.536 42.754
14 2009 262,0 170,2 68.644 28.968 44.592
15 2010 281,8 180,8 79.411 32.689 50.949
16 2011 292,8 189,4 85.732 35.872 55.456
17 2012 298,4 196,0 89.043 38.416 58.486
18 2013 307,4 202,8 94.495 41.128 62.341
19 2014 307,7 205,5 94.679 42.230 63.232
∑ 4.493,20 2.847,00 1.098.893,00 444.685,02 698.662,81
( ) ( )2 22 2
n xy x y
r
n x x n y y
−
=
− −
∑ ∑ ∑
∑ ∑ ∑ ∑
( ) ( )2 2
19 698.662,81 4.493,20 2.847,00
r 0,9907
19 1.098.893,80 4.493,20 19 444.685,02 2.847,00
× − ×
= ≅
× − × × −
Existe uma forte correlação positiva entre renda (X) e consumo (Y). À medida que aumenta a renda, 
crescem também as despesas de consumo.
2.1 Estimativa do modelo econométrico
A análise de regressão possibilita o desenvolvimento de um modelo para prever os valores de uma 
variável numérica com base no valor de outras variáveis. A variável que desejamos prever é chamada 
27
ECONOMETRIA
de variável dependente. As variáveis utilizadas para elaborar a previsão são chamadas de variáveis 
independentes. A análise de regressão também permite: identificar o tipo de relação matemática 
que existe entre uma variável dependente e uma variável independente; quantificar o efeito que 
alterações na variável independente exercem sobre a variável dependente; definir um valor adequado 
para os parâmetros do nosso modelo; avaliar as propriedades estatísticas dessas estimativas, bem como 
identificar observações incomuns.
Como proposta da estimativa do modelo econométrico com base na função consumo, vamos 
discorrer sobre o modelo clássico, que é o da regressão linear simples. Com os dados da tabela, utilizamos 
o modelo de regressão linear simples (MRLS), na qual uma única variável independente numérica (X: 
renda) é utilizada para prever a variável dependente numérica (Y: consumo).
O modelo geralmente é escrito da seguinte forma:
Yi = α + βXi + ei
A variável dependente é Y (causada ou explicada) e a variável independente é X (explicativa), no 
sentido de que esperamos que x explique y. Os parâmetros do modelo são α e β. Esses parâmetros são 
desconhecidos e teremos que estimá-los. O subíndice i é utilizado para denotar as várias observações 
que temos (para uma amostra de tamanho N, os valores de i variam de 1 a N observações) a fim de 
definir os parâmetros do modelo, que são os mesmos para estimar e/ou prever todas as observações.
Para estimarmos os parâmetros desconhecidos do nosso modelo em questão, precisamos elaborar 
algumas hipóteses. São elas:
• Linearidade:
Yi = α + βXi + ei
Significa dizer que não podemos utilizar modelos da forma Yi = α + Xi
β + ei.
• Exogeneidade:
E[ei | xi] = 0
É a exigência de que o erro e a variável explicativa sejam não correlacionados.
• Homocedasticidade:
Var[ei | xi] = E[ei
2 | xi] = σ
2
A variância do erro é constante.
28
Unidade I
• Não autocorrelação dos erros:
Cov[ei, xj | xi, xj] = E[ei, xj | xi, xj] = 0.
O erro de uma observação não pode estar correlacionado com o erro de outra observação. Portanto, 
a covariância é igual a zero (o resultado em qualquer experimento não tem efeito no termo do erro de 
qualquer outroexperimento). Eles devem ser independentes.
Os dados são usados para estimar α e β, isto é, ajustar o modelo aos dados, para:
• quantificar a relação entre Y e X;
• usar a relação para predizer uma nova resposta Y0 para um dado valor de X0 (não incluído 
no estudo);
• calibração:
— capacidade de predição de novas observações; pode ser feita usando uma nova amostra e 
comparando os valores estimados com os observados.
— dado um valor de Y0, para o qual o correspondente valor de X0 é desconhecido, estimar o valor 
de X0.
 Lembrete
Quando falamos na hipótese de linearidade, estamos falando de 
linearidade dos parâmetros. Não importa se temos como variável X, ex ou 
log (X). O fundamental é que o parâmetro β esteja multiplicando qualquer 
uma dessas variáveis.
Outra questão envolvendo as variáveis observadas são as unidades de medida. Quando multiplicamos 
os valores observados por uma constante k (exemplo: se a renda for medida em reais e depois quisermos 
medi-la em milhares de reais, bastará dividir os valores por 1.000. Neste caso, k = 1/1.000), temos que 
adotar as seguintes regras:
Quadro 1 – Unidade de medidas das variáveis observadas
Somente X multiplicado por k Somente Y multiplicado por k X e Y multiplicado por k
α Não se altera Multiplique por k Multiplique por k
β Divida por k Multiplique por k Não se altera
r2 Não se altera
29
ECONOMETRIA
Existem alguns fenômenos que podem ser representados por um modelo linear depois de sofrer alguma 
transformação de variáveis. A utilização do diagrama de dispersão pode nos auxiliar a decidir qual a melhor 
transformação indicada para cada fenômeno em estudo – portanto, estamos optando por regressão com 
variáveis transformadas. Exemplo: função exponencial ou semilogarítmica I: Y = a . bx (forma original, não 
linear) aplicando a transformação indicada ln Y = Ina + blnX (forma linearizada por transformação), 
tendo como restrições das variáveis na forma transformada Y>0 e X>0.
2.2 Método de estimação
Seria desejável a existência de um método que levasse sempre a bons estimadores. Infelizmente, não 
existe esse método geral aplicável a todas as situações. Entre os principais métodos de estimação (o dos 
momentos, o da máxima verossimilhança e o dos mínimos quadrados), o mais utilizado é o estimador de 
mínimos quadrados ordinários (MMQO), que tem como objetivo minimizar a soma do quadrado dos erros.
O critério dos mínimos quadrados é o seguinte: a “linha que melhor se ajusta” é aquela que minimiza 
a soma dos desvios quadrados dos pontos do diagrama dos pontos da linha reta (desvios estes que são 
medidos verticalmente).
N
2
i i
i 1
Minimizar (Y )Ŷ
=
−∑
Valores ajustados
Linha dos mínimos quadrados
Xi
X
Y
Yi
Ŷi
Desvio: Yi - Ŷi
Ŷ = a + bX
Figura 10 – Linha dos mínimos quadrados: desvios
Entre alguns métodos que existem para estimar os parâmetros a e b, o mais refinado é o método dos 
mínimos quadrados (MMQ), que consiste em tornar mínima a soma dos desvios em torno da reta estimada. 
Esse método encontra a reta que minimiza a distância vertical entre cada observação (ponto) e a própria reta.
Designando-se por ei o desvio entre um valor observado yi e um valor ajustado ŷi, isto é, ei = (yi - ŷi), 
a e b são os valores que minimizam a soma de quadrados:
30
Unidade I
( ) [ ]
n n2 2
i i i i
i 1 i 1
Minimizar Y Y Y (aˆ bx )
= =
− = − +∑ ∑
Com base nas fórmulas, podemos calcular, então, os coeficientes de regressão:
xy
xx
S
b 
S
=
y x
a y bx b
n n
= − = −∑ ∑
em que calculamos:
∑xi = 4.493,20 ∑yi = 2.847,00 ∑xiyi = 698.662,81
∑xi
2 = 1.098.893,80 ∑yi
2 = 444.685,02
( ) ( )i i
xy i i
x y
S x y
n
= −
∑ ∑∑
( )
xy
4.493,20 2.847,00
S 698.662,81 25.392,26
19
×
= − =
( )2i2
xx i
x
S x 
n
= −
∑∑
( )2
xx
4.493,20
S 1.098.893,80 36.322,95
19
= − =
( )2i2
yy i
y
S y
n
= −
∑∑
( )2
yy
2.847,00
S 444.685,02 18.084,55
19
= − =
31
ECONOMETRIA
( )2 22
n xy x y 19 698.662,81 4.493,20 2.847,00 482.452,99
b 0,6991
690.135,9619 1.098.893,80 (4.493,20)n x x
− × − ×
= = = ≅
× −−
∑ ∑ ∑
∑ ∑
y x 2.847,00 4.493,20
a y bx b 0,6991 15,48
n n 19 19
= − = − = − × ≅ −∑ ∑
Portanto, a equação da reta de regressão é:
ŷ = - 15,48 + 0,6991x
Respeitando as hipóteses do modelo de regressão linear, o Teorema de Gauss-Markov aponta que 
os estimadores de mínimos quadrados são os melhores estimadores lineares não viesados (não viciados 
ou imparciais). Isso quer dizer o seguinte:
• Os estimadores de MQO são não viesados, isto é, o valor esperado de cada estimador é igual 
ao parâmetro que se deseja estimar: E(b0) = β0 e E(b1) = β1. Não viciado ou imparcial é uma 
propriedade que assegura que, em média, o estimador é correto.
• Estimadores que são funções lineares e não são viesados – ou seja, os estimadores MQO – são 
mais precisos (isto é, as suas distribuições amostrais têm a menor variância possível) do que 
quaisquer outros estimadores pertencentes à classe dos estimadores não tendenciosos. Porém, o 
teorema nada nos diz se o estimador de MQO é melhor do que um estimador não linear.
Um caso especial em que o intercepto da reta é 0 (zero) passa pela origem, isto é, α = 0. A equação 
da reta se reduz a:
Yi = βXi + ei
O estimador para β (coeficiente angular da reta ou inclinação) expressa a taxa de mudança em Y, isto 
é, a mudança em Y quando ocorre a mudança de uma unidade em X. Ele indica a mudança na média da 
distribuição de probabilidade de Y por unidade de acréscimo em X:

N
i ii 1
N 2
ii 1
x y
 
x
=
=
β =
∑
∑
Neste caso específico, devemos considerar:
• O coeficiente de determinação (R2) não necessariamente é um valor entre 0 e 1, podendo 
ser negativo.
32
Unidade I
• Não se confirma a conclusão de que R2 = Corr (X e Y)2.
• Não se garante que a reta ajustada passe pelo ponto médio (X, Y).
• O estimador de β será não viesado somente se α = 0.
Veja as fórmulas a seguir:
( )
2
N 2
ii 1
Var 
x
=
σ
β =
∑
N 2
i2 i 1̂ˆ
u
N 1
=σ =
−
∑
Podemos ter 
N
i
i 1
u 0
=
≠∑ .
Portanto, estamos interessados na relação entre as duas variáveis (Y: consumo e X: renda). Observamos 
pares de valores X e Y em cada amostra e vamos usá-los para dizer alguma coisa sobre a relação:
ŷ = - 15,48 + 0,6991x
Nota-se que as estimativas dos parâmetros dão um conteúdo empírico para a função consumo. 
Dados observacionais: geralmente X e Y são variáveis aleatórias, e o acento circunflexo indica 
uma estimativa.
 Observação
Estimador, também conhecido como uma estatística destinada a 
estimar um parâmetro da população, é simplesmente uma regra, fórmula 
ou método que nos diz como estimá-lo a partir de uma amostra. Dada uma 
amostra, o valor assumido pelo estimador é chamado de estimativa ou 
valor estimado do parâmetro. As estimativas obtidas por meio da estatística 
variam de acordo com a amostra selecionada.
A diferença entre estatística e estimativa é que a estatística é uma variável aleatória, enquanto a 
estimativa é um particular valor dessa variável aleatória.
33
ECONOMETRIA
2.3 Conceito de função de regressão populacional (FRP) e função de 
regressão amostral (FRA)
A função de regressão populacional (FRP) é a seguinte:
E(Y/Xi) = f(Xi)
A média condicional é uma função de Xi em que f(Xi) indica alguma função da variável explicativa Xi.
Essa equação é conhecida como função de regressão populacional (FRP) (ou equação de regressão 
linear) de duas variáveis. Como uma primeira aproximação ou uma hipótese de trabalho, podemos supor 
que FRP E(Y/Xi) seja uma função linear de Xi, do tipo:
E(Y/Xi) = β1 + β2Xi
Onde:
β1: intercepto;
β2: coeficiente de inclinação.
Especificação estocástica:
Yi = β1 + β2Xi + ui
Onde:
ui é uma variável aleatória não observável que pode assumir valores positivos ou negativos, também 
conhecida como termo de erro estocástico ou perturbação estocástica.
Já a função de regressão amostral (FRA), na maioria das situações práticas, é somente uma amostra 
de valores Y correspondentes e alguns Xs fixos. A nossa tarefa é estimar a FRP com base nas informaçõesda amostra.
Analogamente à FRP, que fundamenta a reta de regressão da população, podemos desenvolver o 
conceito de função de regressão amostral (FRA) para representar a reta de regressão amostral. A amostra 
contrapartida da equação que acabamos de apresentar pode ser escrita como:
Y
Xi
 Ŷi = β̂1 + β̂2Xi
Onde:
Ŷi: estimador de E(Y/Xi);
34
Unidade I
β̂1: estimador de β1;
β̂2: estimador de β2.
Podemos expressar a FRA por sua fórmula estocástica:
Ŷi = β̂1 + β̂2Xi + ui
Nosso objetivo na análise de regressão é estimar a função de regressão populacional (FRP):
População
(universo de análise)
Yi = α + βXi + ei (FRP)
Parâmetros: α, β
Amostra
(dados observados)
Ŷi = α̂ + β̂Xi + ei (FRA)
Estimados: α̂, β̂
Estimação de 
parâmetros
Figura 11 – Estimadores e parâmetros
Por essa estimativa, podemos ver que o coeficiente de declividade é de aproximadamente 0,70, o que 
sugere que um aumento de um real na renda real provocará em média um aumento de 0,70 centavos 
na despesa real de consumo. Dissemos em média porque a relação entre o consumo e renda é inexata, 
como mostra a reta de regressão. Veja a figura a seguir, conforme dados do IBGE:
150 200 250 300 350
100
120
140
160
180
200
220
De
sp
es
a 
de
 c
on
su
m
o 
- 
R$
 (b
ilh
õe
s)
Renda - R$ (bilhões)
y = 0,6991x - 15,477
R2 = 0,9816
Figura 12 – Ajuste da reta: renda e despesa de consumo no Brasil de 1996 a 2014
35
ECONOMETRIA
3 TESTE DE HIPÓTESES
É importante também aplicarmos o teste de hipóteses ao nosso modelo de regressão.
Na hipótese nula, os valores de x não têm qualquer relacionamento com os valores de y. Veja:
H0 : β = 0
H0 : β ≠ 0 (teste bilateral)
A hipótese nula é confirmada pela equação Ŷi = a +bXi + ei quando se constata que não haverá 
qualquer relação entre x e y se o verdadeiro valor do coeficiente angular for zero.
Como
( )
( )
2
i
2
i
b
t 
y y / (n 2)
x x
ˆ
− β
=
− −
−
∑
∑
a equação tem distribuição t com n - 2 graus de liberdade. Decorre que, se β = 0, então a estatística será:
( )
( )
2
i
2
i
b
t
y y / (n 2)
x x
ˆ
=
− −
−
∑
∑
Podemos calcular o valor dessa estatística. Portanto, a equação da reta de regressão é:
ŷ = - 15,48 + 0,6991x
Testamos a existência do efeito de regressão entre duas variáveis em estudo. A hipótese nula é de 
não existência de regressão, enquanto a hipótese alternativa é aquela que contempla a regressão. Assim, 
o teste de hipótese será delineado:
36
Unidade I
Tabela 3 – Teste de hipótese (H0 : β = 0)
Hipótese nula H0 : β = 0
Valor da estatística de teste ( )
( )
obs 2
i
2
i
b
t
y y / (n 2)
x
ˆ
x
=
− −
−
∑
∑
Hipótese alternativa Intervalo de rejeição (nível α)
 H0 : β ≠ 0 tobs > tn - 2; α
No teste para β, calculamos a região crítica (RC) ao nível de significância de 5%. Podemos calcular o 
valor dessa estatística conforme a tabela a seguir, baseada em números do IBGE:
Tabela 4 – Renda, consumo e resíduo
Renda Consumo
Ano xi Yi Ŷi ei (Yi - Ŷi)
2 (Xi - X)2
1996 180,4 116,1 111 5,46 29,86 3145,44
1997 186,5 119,6 115 4,70 22,09 2498,42
1998 187,2 118,7 115 3,31 10,96 2428,93
1999 188,0 119,2 116 3,25 10,57 2350,72
2000 196,3 124,0 122 2,25 5,06 1614,77
2001 199,0 125,0 124 1,36 1,85 1405,07
2002 205,1 126,6 128 -1,30 1,70 984,97
2003 207,4 125,9 130 -3,61 13,03 845,89
2004 219,4 130,8 138 -7,10 50,40 291,87
2005 226,4 136,6 143 -6,19 38,35 101,69
2006 235,4 143,9 149 -5,18 26,88 1,18
2007 249,6 153,0 159 -6,01 36,13 172,02
2008 262,4 162,9 168 -5,06 25,59 671,63
2009 262,0 170,2 168 2,52 6,35 651,06
2010 281,8 180,8 182 -0,72 0,52 2053,52
2011 292,8 189,4 189 0,19 0,04 3171,47
2012 298,4 196,0 193 2,87 8,26 3833,56
2013 307,4 202,8 199 3,38 11,44 5029,05
2014 307,7 205,5 200 5,87 34,49 5071,69
∑ 4.493,20 2.847,00 2.847,00 0,00 333,5904 36,322,9453
37
ECONOMETRIA
( )
( )
2
i
2
i
b 0,6991
t 30,08
333,59 /17y y / (n 2)
36.322,95
x x
ˆ
= = ≅
− −
−
∑
∑
Para um teste bilateral no nível de significância de 5%, o valor crítico de uma distribuição t com 
17 graus de liberdade é 2,11. Como 30 está na região de rejeição, bem acima do valor crítico, podemos 
rejeitar com segurança a hipótese nula de que o coeficiente angular seja zero.
-2,11 0
Região de não 
rejeição ou 
aceitação
Região de 
rejeição
α
2
α
2
Valor crítico Valor crítico
Região de 
rejeição
+2,11 t
Figura 13 – Região crítica para o teste t
4 O GRAU DE AJUSTAMENTO DO MODELO: ANOVA (ANÁLISE DE VARIÂNCIA)
Vamos compreender os três tipos de variação em torno de uma reta de regressão. São eles:
Tabela 5 – Tipos de variação em torno da reta
Variação total = Variação explicada + Variação inexplicada
∑(yi - y)
2 = ∑(ŷi - y)
2 + ∑(yi - ŷi)
2
Soma do quadrado total = Soma do quadrado da regressão + Soma do quadrado do resíduo
SQTot = SQReg + SQRes
Syy = bSxy = b
2Sxx + Syy - bSxy = Syy - b
2Sxx
• Variação total: é a soma dos quadrados das diferenças entre o valor y de cada par ordenado e a 
média de y.
38
Unidade I
• Variação explicada: é a soma dos quadrados das diferenças entre cada valor previsto de y e a 
média de y (explicada pela relação X e Y).
• Variação inexplicada: é a soma dos quadrados das diferenças entre cada valor de y de cada par 
ordenado e cada valor de y previsto correspondente (não pode ser explicada pela relação x e y, e 
isso ocorre devido ao acaso ou a outras variáveis).
{ {{Desvio totalyi - y
y
x
(xi; y)
(xi; yi)
(xi; ŷi)
y
Desvio 
explicado
ŷi - y
x
Desvio 
inexplicado
yi - ŷi
Figura 14 – Desvios para cada par de ponto (xi, yi)
Uma propriedade importante é a de que a variabilidade total poderá ser decomposta em duas partes:
• uma, devida aos possíveis efeitos aleatórios (não controlados) que recaiam sobre cada experimento, 
que será definida como variabilidade residual;
• outra, a variabilidade atribuída ao efeito da regressão, se este realmente existir.
Podemos conduzir a análise de variância da regressão linear simples conforme a tabela a seguir:
Tabela 6 – Análise da variância
Causas de variação Graus de liberdade Soma de quadrados Quadrados médios
Regressão 1 b . Sxy = b
2 . Sxx b . Sxy = b
2 . Sxx
Resíduo n - 2 Syy - b . Sxy = Syy - b
2 . Sxx
2
yy xy yy xxS b.S S b .S
n 2 n 2
− −
=
− −
Total n - 1 Syy
Considerando o exemplo anterior, obtemos a seguinte tabela de análise de variância:
39
ECONOMETRIA
Tabela 7 – Análise de variância
Causas de variação Graus de liberdade Soma de quadrados Quadrados médios F
Regressão 1 17.750,96 17.750,96 904,60
Resíduo 17 333,59 19,62
Total 18 18.084,55 
Ao nível de significância de 5% e para 1 e 17 graus de liberdade, o valor crítico de F é 4,45 (veja 
a tabela da distribuição F de Fisher-Snedecor no AVA). O valor de F calculado, sendo superior ao valor 
crítico, é significativo ao nível de 5%. Consequentemente, rejeitamos a hipótese H0 : β = 0 em favor da 
hipótese alternativa H0 : β ≠ 0 a esse nível de significância.
 Saiba mais
Um bom programa de análise de regressão para computador, além de 
calcular o valor de F, apresenta outros parâmetros de avaliação do modelo por 
meio do Microsoft Excel: em Opções do Excel, na barra Suplementos, instalar 
Ferramentas de Análise e consultar opções Dados, Análise de Dados e 
Regressão. Para saber mais sobre o uso de suas ferramentas, indicamos o livro:
LEVINE, D. M. et al. Estatística: teoria e aplicações – usando Microsoft 
Excel em português. Tradução: Teresa Cristina Padilha de Souza. Rio de 
Janeiro: LTC, 2013.
4.1 O coeficiente de determinação (r2) 
O coeficiente de determinação r2 é a razão entre a variação explicada e a variação total. Portanto, r2 
é uma medida descritiva da qualidade do ajustamento do modelo:
( )
( )
( )2 22egi2 xx
2
ot yyi
SQRy y 0,6991 36.322,95b S
r 0,9816
SQRT S 18.084,55
ˆ
y y
− ×
= = = = ≅
−
∑
∑
Teremos uma relação de quanto o modelo de regressão está sendo útil para explicar toda a 
variabilidade que aparece em cada uma das observações (é a porcentagem da variância total de y que 
é explicada pela variávelx).
Anteriormente calculamos o coeficiente de correlação (r). O quadrado desse coeficiente é o coeficiente 
de determinação (r2). Para um número fixo n de observações, quanto melhor for o ajuste dos dados, 
tanto maior será o valor de r2. Portanto, r2 pode ser visto como uma medida descritiva da qualidade do 
ajuste obtido.
40
Unidade I
 Observação
Se o coeficiente de correlação é r = 0,9907, então o coeficiente de 
determinação r2 = (0,9907)2 ≅ 0,9815.
Isso significa que 98,15% da variação de y podem ser explicados 
pela relação entre x e y. Os 1,85% (1 - 0,9815) restantes da variação são 
inexplicados e se devem ao acaso, a erros amostrais ou a outros fatores.
Características do modelo de regressão linear simples (MRLS):
• Yi é uma variável aleatória (Yi = α + β1 X1 + ei);
• E(Yi) = E(α + β1 X1 + ei) = µi = α + β1 X1;
• σ2(Yi) = σ
2 (α + β1 X1 + ei) = σ
2(ei) = σ
2 (variância constante);
• Yi e Yj não são correlacionados.
O modelo de regressão linear simples mostra que as respostas Yi são oriundas de uma distribuição de 
probabilidades com média E(Yi) = α + βXi e cujas variâncias são σ
2, a mesma para todos os valores de X. 
Além disso, quaisquer duas respostas Yi e Yj não são correlacionadas.
Os parâmetros α e β não são variáveis aleatórias, são constantes desconhecidas. Entretanto, 
α̂ e β̂ são consideradas variáveis aleatórias, pois dependem da amostra considerada (em várias 
amostras populacionais poderemos ter diferentes valores para as estimativas dos parâmetros). 
Saber como esses estimadores se comportam (são ou não viesados) é importante, bem como saber 
as suas variâncias:
( )
2 2
N 2
ii 1
Var 
N . Var(x)(x x)
=
σ σ
β = =
−∑
 Observação
A variância de β̂ diminui conforme aumenta a variância de X.
( ) ( )
2
2Var x Var 82,08 18.715.790,1 0,000473 8.935
N
σ
α = + β ≅ + × ≅
41
ECONOMETRIA
As variações de α̂ e β̂ diminuem com o aumento do tamanho da amostra (se N tende ao infinito, as 
duas variâncias tendem a zero).
Para procedermos aos cálculos das variâncias de α̂ e β̂ (estimadores de MQO), necessitamos de σ2 
parâmetro, que nem sempre é conhecido. Mas, para estimá-lo, utilizaremos a seguinte fórmula:
N 2
i2 i 1
(e ) 333,59
19,6229
N 2 17
=σ = = ≅
−
∑
O estimador é considerado não viesado de σ2 ao utilizarmos σ2 para calcular as variâncias de α̂ e β̂. 
Assim, teremos também estimadores não viesados.
Var
xi x N Var x xi
N
( )
. ( )
,
,
,b
s s
 =
-( )
= = @
=å
2
1
2
2 19 6229
19 191173
0 000544
( ) ( )
2
2Var x Var 1,03263 55.922,78 0,00054 31,24
N
σ
α = + β ≅ + × ≅
4.2 Análise de resíduos
Existem várias técnicas para analisarmos os resíduos, mas, nesta fase introdutória, iremos ressaltar 
uma representação gráfica que é obtida plotando os pares (xi, ei). Obtido o gráfico dos resíduos, 
precisamos saber como identificar possíveis causas que comprometem a confiabilidade do modelo. A 
situação ideal para os resíduos é estarem distribuídos aleatoriamente em torno do zero, sem nenhuma 
observação muito discrepante.
A análise de resíduos nos permite:
• descobrir se as hipóteses do modelo de regressão linear são válidas para o caso em questão;
• analisar se a correlação entre as duas variáveis é ou não forte, na qual utilizamos a relação 
egSQR
SQT
 ou es(1 SQR )
SQT
− .
Veja os dados a seguir, conforme apresentados pelo IBGE:
42
Unidade I
Tabela 8 – Resíduos
Ano xi Yi Ŷi ei
1996 180,4 116,1 111 5,46
1997 186,5 119,6 115 4,70
1998 187,2 118,7 115 3,31
1999 188,0 119,2 116 3,25
2000 196,3 124,0 122 2,25
2001 199,0 125,0 124 1,36
2002 205,1 126,6 128 -1,30
2003 207,4 125,9 130 -3,61
2004 219,4 130,8 138 -7,10
2005 226,4 136,6 143 -6,19
2006 235,4 143,9 149 -5,18
2007 249,6 153,0 159 -6,01
2008 262,4 162,9 168 -5,06
2009 262,0 170,2 168 2,52
2010 281,8 180,8 182 -0,72
2011 292,8 189,4 189 0,19
2012 298,4 196,0 193 2,87
2013 307,4 202,8 199 3,38
2014 307,7 205,5 200 5,87
∑ 4.493,20 2.847,00 2.847,00 0,00
8,00
0,00
100 150 200 250
2009
y = 0,0026 x2 - 1,28x + 151,09
R2 = 0,76
2004
Renda
Re
sí
du
os
300 350
6,00
-2,00
4,00
-4,00
2,00
-6,00
-8,00
Figura 15 – Renda: plotagem de resíduos
43
ECONOMETRIA
Analisando as hipóteses citadas anteriormente a serem cumpridas pelo modelo, destacamos, com 
base no comportamento dos resíduos (conforme o gráfico anterior), o pressuposto da homocedasticidade 
(variância do erro ser constante), que não está sendo cumprido. Tal procedimento é importante para se 
realizar inferências em relação aos parâmetros α e β. Havendo problemas na não confirmação da hipótese 
de homocedasticidade, podemos utilizar, por exemplo, as transformações de dados, isto é, utilizar uma 
segunda variável independente X2 no modelo assumindo os valores de X1 elevado ao quadrado. Ficaríamos, 
portanto, com um modelo Y = α + β1X1 + β2X2, onde X2 = (X1)
2, o que corresponde a uma função polinomial 
de ordem 2 representada pela equação Y = α + β1X1 + β2X1
2, conforme apresentado a seguir:
α β1 β2
1996 - 2014 Yi = 135,61 - 0,5815.X1 + 0,0026.X1
2 R2=0,9957
Se = 2,21 (6,24) (-3,27) (7,22) R2ajustado=0,9951
(estatística t entre parênteses) F= 1.837,28
Apresentamos a seguir os gráficos dos resíduos do modelo atendendo o pressuposto da 
homocedesticidade (variância constante dos resíduos), conforme dados do IBGE.
100 20.000
0 0
-5 -5Renda Renda2
Renda plotagem de resíduos Renda2 plotagem de resíduos
Re
sí
du
os
Re
sí
du
os5 5
10 10
200 40.000300 60.000 80.000400 100.000
Figura 16 – Plotagem de resíduos
Nota-se também, através do comportamento dos resíduos, que podemos desmembrar a base de 
dados em dois ciclos distintos (contração e expansão do consumo em relação à renda), conforme 
indicado nos gráficos a seguir.
Através do gráfico superior, de período completo (1996 a 2014), conseguimos distinguir os dois 
ciclos apresentados nos demais:
• I ciclo: contração do consumo em relação à renda (1996 a 2003), apresentando uma PMgC 
de 0,40, isto é, para esse período, a cada acréscimo de um real na renda, tem-se um acréscimo de 
37 centavos na despesa de consumo.
• II ciclo: expansão do consumo em relação à renda (2004 a 2014), apresentando uma PMgC 
de 0,83, isto é, para esse período, a cada acréscimo de um real na renda, tem-se um acréscimo de 
83 centavos na despesa de consumo.
44
Unidade I
A) 
170 180175 185 195 205190 200 210
114
116
118
120
122
124
126
128
Co
ns
um
o
Renda
y = 0,3966x - 45,048
R2 = 0,9504
B) 
210 230 250 310270 290 330
115
135
155
175
195
215
Co
ns
um
o
Renda
y = 0,8275x - 51,231
R2 = 0,9937
C) 170 210190 230 270 310250 290 330
100
120
140
160
180
200
220
Co
ns
um
o
Renda
y = 0,6991x - 15,477
R2 = 0,9816
Figura 17 – Ciclos de consumo em relação à renda. 
A) 1º ciclo – contração (1996 a 2003); B) 2º ciclo - expansão (2004 a 2014); C) Ciclo completo (1996 a 2014)
A partir de 2004, a cada um real de acréscimo na renda tivemos 43 centavos a mais no 
consumo, em relação ao período de 1996 a 2004, ou seja, saímos de uma PMgC de 0,40 para uma 
PMgC igual a 0,83.
Nota-se que a partir de 2004, no período em análise (1996-2014), o consumo no Brasil cresceu 
muito. Uma das teorias que a economia nos oferece é a da propensão marginal a consumir (PMgC), 
que analisa o que acontece com o consumo quando há um acréscimo na renda. Segundo essa teoria, 
45
ECONOMETRIA
as duas coisas não crescem na mesma proporção. A partir de certo ponto, a renda pode até continuar 
aumentando que o consumo tende a desacelerar.
A propensão marginal a consumir da chamada classe média brasileira, a maioria da nossa população, 
é muito alta. Quando as condições de renda melhoram, naturalmente ela vai saciar a sua demanda 
reprimida – aparenta estarmos no limite em que o aumento de consumo ainda é proporcional ao aumento 
da renda. O consumo consciente, pelo modo de ser dos brasileiros, extremamente imediatista, voltado 
ao desfrute do momento, foi deixado de lado. As pessoas não aprenderam a transformar aumento de 
salário em poupança, em investimentopara o futuro.
Nessa análise da variável residual da economia brasileira, no período de 1996 a 2014, além do 
conhecimento teórico, é importante uma análise das especificidades em que as variáveis envolvidas 
(Y: endógena e X: exógena) se relacionam. Devemos explicar se:
• valores (-) representam contração do consumo em relação à renda;
• valores (+) representam expansão do consumo em relação à renda.
Por exemplo: os dados econométricos (no caso, o comportamento da variável residual) sugerem a 
resposta de algumas questões (isto é, os dados perguntam):
• O aumento do consumo em relação à renda significa o quê? E a retração?
• A crise de consumo, descrita dessa forma, é uma crise econômica ou se trataria de um período de 
priorização do investimento em relação ao consumo?
No caso em questão, o que se observou foi a tendência de poupar ou de consumir, e sua variação no 
tempo. “Crises” no consumo na verdade indicariam maior tendência a poupar no período em questão.
 Lembrete
É necessário ter conhecimento teórico do que uma variável significa 
para outra.
Friedman (1953, p. 7), ao esclarecer o significado do material empírico para as teorias, afirma que 
“[...] a evidência empírica é vital em duas fases diversas, embora intimamente associadas: na fase de 
elaboração das hipóteses e na do teste de sua validade” – portanto, para descobrir se nossas estimativas 
obtidas satisfazem as expectativas da teoria que estamos testando. Segundo Hill, Griffithis e Judge 
(2003), uma teoria ou hipótese que não seja verificável por meio de evidência empírica não pode ser 
admitida como parte da investigação científica.
A economia positiva independe, em tese, de qualquer posição ética especial ou de juízos normativos. 
Ela trata “do que é”, e não “do que deveria ser”. A tarefa dessa economia positiva é a de provar um sistema 
46
Unidade I
de generalizações passível de ser utilizado para fazer previsões corretas acerca das consequências de 
qualquer alteração das circunstâncias. O desempenho de uma tal economia será ajuizado em termos da 
precisão e da experiência (FRIEDMAN, 1953, p. 2).
Verifica-se que o coeficiente β é menor do que um, sendo portanto concordante com a teoria. Temos 
que verificar se o parâmetro β = 0,6991 é estatisticamente abaixo de um e diferente de zero (β ≠ 0), pois 
se β for zero, os valores de x (renda) não têm relação com os valores de Y (consumo). Para tal, utilizamos 
inferência estatística (teste de hipóteses).
4.3 Previsão ou predição (utilização do modelo)
Por exemplo, suponha uma expectativa de um PIB de 297 bilhões de reais para o ano seguinte. 
Qual a previsão de consumo em um ano a ser projetado? Se acreditarmos que a função consumo irá se 
manter, teremos:
ŷ = - 15,48 + 0,6991x
ŷ = - 15,48 + 0,6991 x 297 = 192,15, ou cerca de 192 bilhões de reais.
Para o próximo ano, o governo pretende anunciar um plano de aumento dos tributos para pessoa 
física, a retomada do imposto sobre operação financeira (IOF). Qual será o efeito disso na economia? Um 
modelo econométrico pode se propor a estimar tais mudanças.
 Observação
Geralmente é necessário restringir a abrangência do modelo para alguns 
valores ou região da(s) variável(is) preditora(s).
Ao utilizarmos um modelo de regressão para fins de previsão, precisamos considerar somente o intervalo 
relevante da variável X: renda (inclui todos os valores, desde o menor até o maior valor de X que foram 
utilizados no desenvolvimento do modelo de regressão). Há duas situações ao prever Y: consumo para um 
determinado valor de X: renda, pois podemos interpolar dentro dos limites desse intervalo relevante de 
valores de X, mas podemos extrapolar além do intervalo dos valores de X. Ao utilizarmos a variável X: renda 
(em bilhões de reais), ela varia desde 180 até 308 (vide tabela de resíduos anteriormente apresentada). Por 
conseguinte, devemos prever os consumos anuais somente para as rendas entre 180 e 308 bilhões de reais. É 
necessária muita atenção na utilização da análise de regressão ao extrapolar (ir além do intervalo relevante), 
pois quanto maior for a diferença (distância) entre x e x, maior será o intervalo de previsão.
Em geral, um modelo de regressão pode ser usado com alguma confiança dentro da gama de valores X 
que participou para o cálculo dos parâmetros de regressão. Se sairmos um pouco do intervalo de X, estaremos 
extrapolando o modelo. Uma extrapolação para valores de X pouco afastados do intervalo normalmente 
não apresenta problemas, mas para valores longe do intervalo de X raramente são satisfatórias.
47
ECONOMETRIA
Podemos calcular previsões para novas observações mediante a construção de intervalos de previsão.
Para um novo valor da variável independente x, podemos prever em que intervalo de valores 
esperamos encontrar y. Um intervalo de previsão para uma observação futura, com (1 – α) × 100% de 
confiança, é dado por:
( )
2
n 2; xx2
1 (x x)
IP 95% : Y t . S 1
n S
ˆ
α −   
−
± + +
( )
21 (297 236,48)
IP 95% : 1 92,15 2,11. 4,43 1
19 36.322,95
−
± × + +
IP(95%) : 192,15 ± 10,04
Interpretação: para um dado x, prevê-se que y pertença ao intervalo indicado (1 – α) × 100%, isto é, 
95% das vezes – chamamos intervalo de previsão ou intervalo de confiança [182,11; 202,19].
4.4 Multiplicador keynesiano da renda
O conceito de propensão marginal ao consumo é de grande valia quando se observa o multiplicador 
keynesiano M = 1 / (1 - PMgC), do qual este é uma das variáveis. No caso mais simples de uma economia 
fechada e sem governo, definindo I para o investimento, Y para a renda e β para a propensão marginal 
a consumir, tal multiplicador da renda, encontrado em qualquer manual de Macroeconomia, pode ser 
dado por 1 / (1 - β). Quanto maior for o seu valor, maior será a renda final da economia em análise – o 
consumo (demanda) estimula a produção, que emprega cada vez mais os meios de produção disponíveis, 
empregando mais pessoas, que consumirão mais, formando um ciclo virtuoso. Nasceu da necessidade 
de Keynes medir o que acontece com a renda quando há uma variação no investimento e diz que o 
efeito da variação na renda decorrente da variação no investimento de uma unidade monetária é dado 
pelo multiplicador:
M = 1 /( 1 - β) = 1 / (1 - PMgC) = 1 / (1 - 0,6991) = 1 / 0,3009 = 3,32
Nessa mesma fórmula, observa-se também que o multiplicador é determinado pelo inverso da 
propensão marginal à poupança (1 - β) = S M = 1/S. Logo, quanto menor for o seu valor, considerando 
ser este um número compreendido entre 0 e 1, maior será o multiplicador.
Que uma demanda por um paletó implica uma demanda por tecido; que 
uma demanda por tecido implica uma demanda por fios e linhas, e também 
por lã; que os serviços de fazendeiros, comerciantes, engenheiros, mineiros, 
trabalhadores no transporte, secretários, estão todos envolvidos – esse é o 
ABC da ciência econômica (KEYNES, 1929, p. 105-106).
48
Unidade I
Com base na PMgC de 0,6991, obtemos 3,32, como multiplicador. Ou seja, com um acréscimo de um 
real no investimento, obtemos um aumento de quase 3,5 vezes na renda.
É frequentemente dito que na Grã-Bretanha um gasto de capital em obras 
públicas custa £500 para que um homem seja empregado por um ano. Isso 
é baseado no montante de trabalho diretamente empregado no local. Mas 
é fácil perceber que os materiais usados e o transporte requerido também 
geram emprego. Se nós consideramos isso, como deveríamos, o gasto de 
capital por homem-ano de emprego adicional é usualmente estimado, no 
caso da construção, por exemplo, em £200 (KEYNES, 1933, p. 339).
4.5 Uso do modelo para fins de elaboração de política econômica
Suponha que o governo acredite que um nível de gastos de 225 bilhões de reais manterá o 
desemprego em 7,5%:
ŷ = - 15,48 + 0,6991x
225 = - 15,48 + 0,6991x
X = 344 (aproximadamente)
Ou seja, um nível de renda de R$ 344 bilhões, com uma PMgC = 0,6961, produzirá um gasto de 
R$ 240,5 bilhões.
Assim, o governo pode, por meio de políticas monetária e fiscal, manipular